自DeepSeek-R1大模型发布以来,已过去大约一周的时间。在2025年1月24日,国外大模型评测平台Arena上,DeepSeek-R1的基准测试成绩跃升至全类别第三,且在风格控制类模型(StyleCtrl)中与OpenAI o1并驾齐驱,共同占据榜首。其竞技场得分更是达到了1357分,略高于OpenAI o1的1352分。这标志着DeepSeek-R1在继DeepSeek-V3夺得开源模型类第一后,再次向全球顶尖AI大模型的地位发起冲击。
DeepSeek在全球范围内引发了AI界的广泛关注与热议,其预训练成本之低成为了一大亮点。相较于行业主流,DeepSeek-V3在同等性能下的大模型训练成本仅为十分之一左右。然而,其性能却足以与顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet相媲美,甚至更胜一筹。DeepSeek官方表示,这得益于MLA(Multi-head Latent Attention)和DeepSeek MoE架构的应用,以及辅助损失自由负载平衡策略和多token预测训练目标的引入,使得算力利用效率大幅提升,实现了性能与成本的双重优化。
在DeepSeek-R1的优化与提升下,全球优秀大模型的效率得到了进一步提升。接下来,让我们对DeepSeek的相关概念股进行分类梳理:
一、股权关联企业
浙江东方(600120):通过杭州东方嘉富基金参与了DeepSeek的天使轮融资,持股路径清晰。其创投业务利润贡献逐年提升,有望随着DeepSeek的蓬勃发展而进一步受益。
华金资本(000532):作为珠海国资的投资平台,通过华金领越基金间接参与了DeepSeek的Pre-A轮融资,积极布局AI大模型赛道。
二、算力基础设施提供商
浪潮信息(000977):为DeepSeek的北京亦庄智算中心提供了AI服务器集群及配套设备,是国内AI算力的领军企业。
中科曙光(603019):承建了DeepSeek杭州训练中心的液冷系统,双方在技术研发方面形成了互补。
润泽科技(300442):为DeepSeek提供了廊坊数据中心的机柜资源,运营成本具有显著优势。
三、垂直领域合作伙伴
拓尔思(300229):与DeepSeek联合开发了金融舆情大模型,并在中信证券等机构部署了智能研报生成系统。
科大讯飞(002230):在教育场景接入了DeepSeek-Math模型,推出了AI数学辅导应用。
金山办公(688111):WPS智能写作功能集成了DeepSeek-Writer API,显著提升了公文生成效率。
四、技术合作潜力企业
飞利信(300287):是市场上少数采用MLA技术的上市公司之一,与DeepSeek存在技术合作的可能性。
南威软件(603636):开发生物认证技术,与DeepSeek的技术方向高度契合。
并行科技(839493):为DeepSeek提供了多种并行计算技术手段,提升了其计算能力。
五、数据与生态合作伙伴
每日互动(300766):作为幻方量化的二股东,为DeepSeek提供了算力支持和海量用户行为语料数据。
卓创资讯(301299):与幻方量化在金融语料库方面存在合作,其数据资源可能被用于DeepSeek模型的训练和优化。
六、其他潜在受益方向
AI芯片与硬件制造商如寒武纪、景嘉微等,可能因DeepSeek技术推动的算力需求增长而受益。
- 合作微信
- 商务合作联系微信
-
- 官方公众号
- 我的微信公众号扫一扫
-
评论