中国证监会认证证券投资咨询机构(证书编号:ZX0118) | 客服电话:400-636-8688 | 投诉电话:0755-33189899

业内引发巨震!龙头7连板!AI新模型推动算力走强!

摘要:Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

深度求索DeepSeek-V3横空出世,在AI行业内引发巨震,关键原因之一就是预训练成本之低——这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。

 

受DeepSeek-V3备受关注影响,今日算力板块涨势凶猛!截至午间收盘,其中群兴玩具,数据港,云赛智联涨停。其中电光科技更是7连板!

业内引发巨震!龙头7连板!AI新模型推动算力走强! 1

DeepSeek-V3相比其他前沿大模型,性能却足以比肩乃至更优。

 

一、算力能力上表现优异,使用成本更加低廉。

 

参考官方论文,DeepSeek v3为6710亿参数MoE架构模型,激活37B,在14.8T token上进行了预训练。

 

能力上,模型暂不支持多模态输入,但在通识和专业知识测试集上表现优秀,MMLU pro正确率75.9%,GPQA-Diamond正确率59.1%,达到国内第一梯队,接近Claude 3.5 Sonnet的水平;并且在数学和代码领域测试表现突出,MATH 500正确率90.2%,SWE-bench正确率42.0%,Codeforces得分51.6,超越所有非o系列模型。模型生成速度达到60TPS,是前代模型的三倍。

 

定价上,API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比较高。使得应用公司在使用该模型时的成本更加低廉。

业内引发巨震!龙头7连板!AI新模型推动算力走强! 2

 

二、模型性价比持续提升下,国内AI应用加速各领域落地。

 

随着豆包pro、DeepSeek v3等国产模型连续发布,以及混元大模型,通义千问等模型的迭代升级。模型能力上,国产模型在文本和知识能力上接近GPT-4、Claude、Llama等海外前沿模型水平,多模态能力逐步完备,逻辑和代码能力在非o1技术路线下达到可用水平。

 

价格上,国产模型API百万tokens输出普遍定价10元以内,是GPT-4o的1/3甚至更低。

 

其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

 

中信证券表示,看好2025年以Agent模式为方向,各领域AI应用加速落地,中长期有望带动数倍算力新需求,建议关注AI全产业链相关投资机会。

 

具体来看有三条投资主线:

第一,AI算力,AI应用加速落地带动推理端算力新需求。

第二,AIInfra,模型场景化与行业化发展催生数据服务和模型平台需求,产业发展确定性高。

第三,AI应用,伴随模型能力升级,Agent等应用形式有望加速落地,带动办公、教育、管理、端侧、具身智能等应用领域公司加速兑现业绩弹性。

 

业内引发巨震!龙头7连板!AI新模型推动算力走强! 3

三、DeepSeek-V3的低训练成本,助力算力需求高增。

 

随着使用大型模型的成本降低,下游应用领域在创新开发方面的积极性将得到提升,这可能会导致对算力的需求不减反增。

 

1、GPT4的训练成本约为DeepSeek V3的6.2倍。

 

根据DeepSeek V3的官方技术文档,本次DeepSeek的训练仅使用了2048个H800 GPU,总训练GPU卡时为2788千小时(其中预训练为2664千小时),平均到每个GPU上,仅为1361小时,约合56.7天。与之相对比,根据英伟达CEO黄仁勋在GTC2024上的演讲内容,GPT-4 MoE使用8000个H100训练了90天,合计约为17280千卡时,相当于DeepSeek V3的6.2倍。

 

2、算力服务领域的大额订单持续涌现,反映出市场对算力资源的需求正日益增长。

 

群兴玩具12月29日公告,公司此前与中国移动浙江公司签订的《算力服务合同书》及《图灵小镇智能算力服务二期项目补充合同》取得重大进展。截至本公告披露日,本项目已交付完成并验收合格,杭州图灵引擎已于12月26日按约定向中国移动浙江公司支付了1.54亿元。

 

莲花控股12月27日晚间公告,公司控股孙公司莲花紫星拟于近期与上海X国企签署《高性能算力服务合同》。双方确认,本合同项下,乙方向甲方提供1545 PFLOPS(BFLOAT 16)高性能算力服务及算力运维服务,服务期限为五年,合同总价为5.55亿元。

 

中青宝12月12日晚间公告,公司于2024年12月11日与中国联通深圳分公司签署了《算力资源服务合同》,公司向中国联通深圳分公司提供算力服务,合同服务期为五年。

 

天亿马12月6日晚间公告,公司与中国移动通信集团广东有限公司深圳分公司签订了《深圳分公司与某客户算力网络集群服务项目算力服务实施合同》和《深圳分公司与某客户算力网络集群服务项目算力维保服务实施合同》,合同金额分别为3.31亿元(含税)、5169.76万元(含税),约占公司2023年度经审计营业收入的93.30%。

 

 

中信证券表示,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。我们认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。

业内引发巨震!龙头7连板!AI新模型推动算力走强! 4

未经允许不得转载:德讯证顾 » 业内引发巨震!龙头7连板!AI新模型推动算力走强!

赞 (0)

评论 0

评论前必须登录!

登陆 注册