距离国产大模型做考研数学题“过线”刚过两个月,月之暗面在春节前一周,又扔出了一个分量十足的“王炸”——这一次,他们拿出了能媲美Open AI 满血版 o1(Full Version,而非 ...
2025年伊始,国内AI行业迎来了激动人心的时刻,国产o1类推理模型开始密集更新,值得关注的是多个最新发布的模型如 ...
不到两个月,两家中国企业推出的推理模型都实现了对OpenAI o1正式版的对标甚至超越,而与OpenAI不同,两家中国公司都公开了他们的原理及技术报告:Kimi ...
与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源,模型就可以更充分地利用其推理能力表现出更强的鲁棒性。
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年第一个月,国产o1类模型开始密集更新,发布者包括“六小虎”中的月之暗面、阶跃星辰,以及独立于创业公司格局外的DeepSeek。
每经记者:岳楚鹏 每经编辑:兰素英OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。其中,Kimi ...
1 月 20 日晚,深度求索发布了 DeepSeek-R1 推理模型正式版 这一发布,瞬间在 AI 领域投下了一颗重磅炸弹,与其他模型不同,DeepSeek-R1 展现出了极高的开放性,在发布的同时,毅然选择开源模型权重。同时,还允许用户利用模型输出 ...
元景思维链大模型作为中国联通推出的业界 首款 央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考,还显著降低了资源消耗,展现出卓越的性能表现。
国产AI大模型,提前过年了。来源|证券时报1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。值得注意的是,在DeepSeek发 ...
例如 DeepSeek - R1 在 AIME 2024 数学竞赛中,取得了79.8%的成绩,略高于 OpenAI 的 o1-1217。在 MATH-500 测试中,DeepSeek-R1 更是达到了 97.3% 的高分,与 ...
1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将 应用程序编程接口(API,Application Programming ...
近日,OpenAI 的 CEO 山姆・奥特曼在社交媒体上透露,备受期待的 o3-mini 将在几周内正式发布。这一消息让众多关注人工智能发展的用户感到兴奋。o3-mini 作为大模型的蒸馏版,将同时推出 API 和网页端,进一步满足用户的需求。