来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 ...
最近几天,一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动,甚至被认为是大模型行业的最大“黑马”。DeepSeek被不少外国人称为“神秘的东方力量”。
北京时间 1 月 28 日,美股收盘,英伟达下跌 16.86%,市值蒸发 5888.62 亿美元(约合人民币 4.27 万亿元),创下美股纪录。业界分析这与 DeepSeek 带来的冲击直接相关,该公司在训练明星产品 DeepSeek-V3 ...
Former Google CEO Eric Schmidt described DeepSeek's rise as "a turning point" in the global artificial intelligence (AI) race ...
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己的需求把 132 个流式多处理器(SMs)中的 20 个修改成负责服务器间的通信,而不是计算任务 。
正如刚才分析的,DeepSeek所发现且开源的性能优化思路,同样可以为拥有更强算力的美国AI巨头所采用。而DeepSeek ...
本文来自微信公众号:太阳照常升起 (ID:The_sun_also_rise),作者:慕峰,题图来自:AI生成 ...
DeepSeek和OpenAI是截然不同的两家公司,R1和o1也是两种不一样的技术。本文总结了这两种技术在五个方面的异同点。 很难不拿中国AI初创公司DeepSeek的新AI模型与占据龙头地位的美国竞争对手OpenAI相比较。 DeepSeek声称其最新的AI模型R1尤其擅长解决问题,在性能上与 ...
图灵奖得主、主导Meta AI研究的首席科学家杨立昆(Yann LeCun)认为, DeepSeek成功的最大收获并非中国竞争对其他国家带来更大威胁,而是AI开源的价值使任何人都能受益。
【新智元导读】 DeepSeek模型开发竟绕过了CUDA?最新爆料称,DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示,CUDA护城河不存在了?
三张图无可争辩的说明 DeepSeek R1的强大: DeepSeek R1在大模型竞技场 Chatbot Arena,以及其他两个无法提前被黑客入侵的独立基准(Artificial-Analysis ...
路透社报道,DeepSeek周一表示,由于其AI助手突然获得极大人气,公司将暂时限制海外用户注册。当天早些时候,该公司网站也因AI助手成为苹果美国App Store中评分最高的免费应用而遭遇停机。