2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理!NSA的核心组件包括:动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择。
DeepSeek称,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。
另外,埃隆·马斯克旗下的人工智能公司xAI也在昨日正式发布了最新的大模型Grok-3。 马斯克称其为“地球上最聪明的人工智能”,Grok-3在多项技术和性能上实现了重大突破。
马斯克在直播中称,在数学、科学和编程等基准测试中,Grok-3超越了Alphabet旗下Google Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o,Grok-3的计算能力比前代版本提升了10倍以上,并已于今年1月初完成预训练。
此外,近期,微信宣布接入DeepSeek-R1模型,目前为灰度测试阶段,部分用户在微信搜索框选择AI搜索,可使用DeepSeek-R1的深度思考功能。微信AI搜索功能为什么要接入大模型?
微信派对此表示,大模型可以提升搜索的智能化和精准度,如更好的理解大家的搜索意图,分析和处理复杂的查询内容等。结合大家的需求,微信在搜索场景中接入了包括混元、DeepSeek在内的大模型,进一步丰富用户的搜索体验。对于微信AI搜索是否会用到大家微信内的朋友圈、聊天等个人信息的问题,微信方面则表示:不会。
AI应用近期利好频频,微信接入DeepSeek-R1模型为搜索功能带来智能化升级,不仅提升了搜索的精准度,还进一步丰富了用户的搜索体验,而DeepSeek与马斯克的xAI发布的Grok-3等大模型的突破,也预示着人工智能领域将迎来更多创新与发展。
文章内容仅供参考,不构成投资建议!(25)
未经允许不得转载:德讯证顾 » AI应用利好不断,DeepSeek与xAI引领行业前行!
评论前必须登录!
登陆 注册