山西证券：头部模型推理性能进一步提升重点关注AI应用相关标的

智通财经APP获悉，山西证券发布研究报告称，Grok 3(Beta版)正式发布，得益于思维链推理能力的引入，Grok 3在解决复杂任务方面的表现较为突出。虽然Grok 3的发布预示着预训练阶段的Scaling Law仍在推动大模型的持续进步，但相较于DeepSeek，可以明显看出大模型在算法层面具备更大的进步空间。该行认为，其推理能力大幅提升将加速AI应用落地，重点关注AI应用相关标的。

事件：2月18日，Grok 3(Beta版)正式发布，并面向X的Premium Plus订阅用户率先开放，同时推出了每月30美元或每年300美元的Super Grok单独订阅服务，订阅用户可解锁深度搜索等先进功能，而语音交互功能将在约一周后上线。

山西证券主要观点如下：

Grok 3和Grok 3 mini在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT等对手。

根据官方公布的测试数据，Grok 3和Grok 3 mini在数学推理(AIME)、科学逻辑推理(GPQA)和代码写作(LCB)的基准测试上性能表现优于DeepSeek V3、GPT-4o、Gemini 2 Pro及Claude 3.5 Sonnet，其中，Grok 3性能较DeepSeek V3提升了27%-43%。而在推理能力测试中，Grok 3和Grok 3 mini推理模型的性能再次刷新了sota，其中，相较于DeepSeek R1，Grok 3的性能表现提升了16%-22%。

得益于思维链推理能力的引入，Grok 3在解决复杂任务方面的表现较为突出。

Grok 3在发布会的演示上完成了多个复杂任务，包括正确编码并实现飞船从地球发射、登陆火星、到在下一个发射窗口返回地球的3D动画，其中Grok 3经过114秒的思考成功求解了开普勒定律，以及Grok 3融合俄罗斯方块和宝石迷阵的规则成功创作出新游戏。可以预计，未来Grok 3有望在医疗诊断、法律分析等复杂推理场景中得到深度应用。

Grok 3总训练成本预计高达DeepSeek V3模型的数倍乃至数百倍。

xAI公司为Grok 3配备了拥有20万个H100 GPU的Colossus超级计算机进行训练，Grok 3累计训练时长达2亿GPU小时，根据vast ai最新数据，H100租赁价格大约在1-3美元每GPU小时，因此估算Grok 3的训练成本预计可达数亿美元，而DeepSeek V3论文中披露的模型正式训练阶段的成本仅557.6万美元。虽然Grok 3的发布预示着预训练阶段的Scaling Law仍在推动大模型的持续进步，但相较于DeepSeek，可以明显看出大模型在算法层面具备更大的进步空间。

风险提示：AI产品落地不及预期，行业竞争加剧风险，技术研发进展不及预期。

山西证券：头部模型推理性能进一步提升重点关注AI应用相关标的

相关阅读

AI救场阿里(09988)死而复生？

高盛：未来十年AI的广泛普及有望推动中国股票整体盈利每年提高2.5%

贝莱德：电力需求激增引发市场波动关注发电、电网基础设施等产业链相关投资机遇

深入融合“AI+BT+IT”！华大智造(688114.SH)将生成式AI技术融入生命科技工具

网易(09999)2024年研发投入175亿元旗下多业务宣布接入DeepSeek

山西证券：头部模型推理性能进一步提升 重点关注AI应用相关标的

相关阅读

AI救场 阿里(09988)死而复生？

高盛：未来十年AI的广泛普及有望推动中国股票整体盈利每年提高2.5%

贝莱德：电力需求激增引发市场波动 关注发电、电网基础设施等产业链相关投资机遇

深入融合“AI+BT+IT”！华大智造(688114.SH)将生成式AI技术融入生命科技工具

网易(09999)2024年研发投入175亿元 旗下多业务宣布接入DeepSeek

山西证券：头部模型推理性能进一步提升重点关注AI应用相关标的

AI救场阿里(09988)死而复生？

贝莱德：电力需求激增引发市场波动关注发电、电网基础设施等产业链相关投资机遇

网易(09999)2024年研发投入175亿元旗下多业务宣布接入DeepSeek