2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理!NSA的核心组件包括:动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择。
DeepSeek称,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。

另外,埃隆·马斯克旗下的人工智能公司xAI也在昨日正式发布了最新的大模型Grok-3。 马斯克称其为“地球上最聪明的人工智能”,Grok-3在多项技术和性能上实现了重大突破。
马斯克在直播中称,在数学、科学和编程等基准测试中,Grok-3超越了Alphabet旗下Google Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o,Grok-3的计算能力比前代版本提升了10倍以上,并已于今年1月初完成预训练。

此外,近期,微信宣布接入DeepSeek-R1模型,目前为灰度测试阶段,部分用户在微信搜索框选择AI搜索,可使用DeepSeek-R1的深度思考功能。微信AI搜索功能为什么要接入大模型?
微信派对此表示,大模型可以提升搜索的智能化和精准度,如更好的理解大家的搜索意图,分析和处理复杂的查询内容等。结合大家的需求,微信在搜索场景中接入了包括混元、DeepSeek在内的大模型,进一步丰富用户的搜索体验。对于微信AI搜索是否会用到大家微信内的朋友圈、聊天等个人信息的问题,微信方面则表示:不会。
AI应用近期利好频频,微信接入DeepSeek-R1模型为搜索功能带来智能化升级,不仅提升了搜索的精准度,还进一步丰富了用户的搜索体验,而DeepSeek与马斯克的xAI发布的Grok-3等大模型的突破,也预示着人工智能领域将迎来更多创新与发展。
文章内容仅供参考,不构成投资建议!(25)
未经允许不得转载:财富在线 » AI应用利好不断,DeepSeek与xAI引领行业前行!

财富在线
【财富在线热点聚焦】多重利好共振,医疗服务板块逆势领涨
财富在线:核心干货!新型电力系统这4大需求+这8只
财富在线午评:短期底部或渐行渐近
【财富在线热点聚焦】超4200家上涨,新型电力板块全线狂飙
财富在线:商业航天表现活跃!这4只涨停!
财富在线:回暖!电力相关板块“燃”起来了!涉及绿电、光伏等
财富在线:午后大利好,新型电力集体爆发,一季报行情打响
财富在线收评:市场回暖,三大指数收涨,超5100只个股上涨!

评论前必须登录!
登陆 注册