距离国产大模型做考研数学题“过线”刚过两个月,月之暗面在春节前一周,又扔出了一个分量十足的“王炸”——这一次,他们拿出了能媲美Open AI 满血版 o1(Full Version,而非 ...
2025年伊始,国内AI行业迎来了激动人心的时刻,国产o1类推理模型开始密集更新,值得关注的是多个最新发布的模型如 ...
不到两个月,两家中国企业推出的推理模型都实现了对OpenAI o1正式版的对标甚至超越,而与OpenAI不同,两家中国公司都公开了他们的原理及技术报告:Kimi ...
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年第一个月,国产o1类模型开始密集更新,发布者包括“六小虎”中的月之暗面、阶跃星辰,以及独立于创业公司格局外的DeepSeek。
每经记者:岳楚鹏 每经编辑:兰素英OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。Kimi ...
与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源,模型就可以更充分地利用其推理能力表现出更强的鲁棒性。
元景思维链大模型作为中国联通推出的业界 首款 央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考,还显著降低了资源消耗,展现出卓越的性能表现。
大洋彼岸的 OpenAI 迟迟没有发布 GPT-5,一度让业界怀疑 Scaling Law 是否已经失效。然而,国内多个团队却接连推出重磅 AI 大模型,用事实证明 Scaling 依然有效,只不过并不是无脑堆硬件、堆算力。Kimi ...
国产AI大模型,提前过年了。来源|证券时报1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。值得注意的是,在DeepSeek发 ...
但是DeepSeek-R1-Zero这个孩子一直做试错练习的话,就会有可读性差和语言混合问题。于是团队研发推出了 DeepSeek-R1,这个模型在训练过程中引入了少量的冷启动数据,即cold-start data,并通过多阶段 RL ...
英伟达高级研究科学家 Jim Fan 对 DeepSeek-R1 给予了高度评价。他指出这代表着非美国公司正在践行 OpenAI 最初的开放使命,通过公开原始算法和学习曲线等方式实现影响力,顺便还内涵了一波 OpenAI。
1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将 应用程序编程接口(API,Application Programming ...