Openai O1 Preview - 搜索 News

3 天

斯坦福大学最近的一项研究发现，尽管 o1-preview 在数学、代码等领域能力逆天，但只要对数学竞赛的题目稍修改，模型解答的准确率竟会立刻下降 30%。在数学竞赛的领域里，普特南数学竞赛的威名可谓如雷贯耳。它由 William Lowell Putnam 家族发起，自 1938 年首届举办以来，历经 66 年的岁月沉淀，已然成为全球大学生数学精英们一较高下的顶级赛场。

13 小时

OpenAI具推理能力的模型o3-mini正式推出

OpenAI指出，o3-mini保有OpenAI ...

腾讯网3 天

刚刚，OpenAI发布o3-mini，可免费使用、3大推理模式

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今天凌晨3点，OpenAI正式发布了新模型o3-mini，可在ChatGPT和API ...

腾讯网2 天

OpenAI CEO承认DeepSeek削弱其地位称站在了历史错误一边

雷递网乐天 2月1日AI企业OpenAI今日宣布将发布OpenAI o3-mini，称这是OpenAI推理系列中最新、最具成本效益的模型，目前可在ChatGPT和API中使用。OpenAI ...

11 天

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

与传统的对抗训练样本方法不同的是，OpenAI提出的新方法不需要对大模型进行专门的对抗训练，也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源，模型就可以更充分地利用其推理能力表现出更强的鲁棒性。

3 天

OpenAI 深夜反击 DeepSeek！紧急上线 o3-mini 免费用，体验后发现差距在这

一面是 OpenAI、Anthropic 等厂商的游说打压，一面却又见证了其盟友口嫌体直的态度，短短一夜之间，微软、英伟达、亚马逊等美国云计算平台纷纷向 DeepSeek R1 伸出橄榄枝。

腾讯网1 个月

新研究发现 OpenAI 的o1-preview在诊断棘手医疗案例方面优于医生

IT之家 12 月 25 日消息，由哈佛医学院和斯坦福大学组成的科研团队，在医学诊断领域深入评估 OpenAI 的 o1-preview 模型，发现其比人类医生更擅长诊断棘手的医疗案例。根据研究报告，o1-preview 正确诊断了 78.3% 的测试案例，在 70 个特定案例的对比测试中，准确率 ...

9 天

中国电信发布“复杂推理大模型”达竞赛级数学表现，评分超o1-preview

近日，中国电信人工智能研究院（TeleAI） “复杂推理大模型”TeleAI-t1-preview正式发布。TeleAI-t1-preview使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理 ...

15 天

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

鉴于 DeepSeek 此前已宣布 R1 模型将开源，有网友表示，与 OpenAI o1 编程能力相当的开源模型即将发布，2025 年的编程就只剩下按 Tab 键了。两个月前，DeepSeek 在官网上线 DeepSeek-R1-Lite-Preview 时曾透露： ...

钛媒体APP on MSN10 天

K1.5多模态模型追平满血OpenAI o1，这次硅谷也坐不住了

距离国产大模型做考研数学题“过线”刚过两个月，月之暗面在春节前一周，又扔出了一个分量十足的“王炸”——这一次，他们拿出了能媲美Open AI 满血版 o1（Full Version，而非 ...

11 天

中国AI双子星，在硅谷教OpenAI做事？

中国“双子星”打开了OpenAI的黑箱。此前，OpenAI定义了大模型训练的四个阶段：预训练、监督微调、奖励建模、强化学习。现在，这个范式被打破了，Kimi 和DeepSeek都证明了可以跳过和简化某些环节来提升模型的训练效率和性能。

虎嗅网3 天

OpenAI深夜反击DeepSeek，紧急上线o3-mini免费用

一面是OpenAI、Anthropic等厂商的游说打压，一面却又见证了其盟友口嫌体直的态度，短短一夜之间，微软、英伟达、亚马逊等美国云计算平台纷纷向DeepSeek R1伸出橄榄枝。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果