Openai Training - 搜索 News

腾讯网2 天

ChatGPT正式开放“成人模式”：突破安全底线的AI，反人类倾向已频繁 ...

来源 | 环球科学科研圈（ID：keyanquan）AI 监管放宽，步子是否迈得太大？图片来源：pixabay撰文黄雨佳当地时间 2 月 12 日，OpenAI 更新了其模型规范（Model ...

3 天

另类视角解读DeepSeek

DeepSeek引入了Multi-Head Latent Attention（MLA），一种配置了低秩键值联合压缩（low-rank key-value joint ...

腾讯网16 天

Deep Research 团队：Agent 的终极形态是所有任务 All-in-one

编译：haozhen编辑：siqi三周前，OpenAI 推出了 Deep Research，这是 OpenAI 的第二个 Agent，可以通过搜索多个网站，在 5-30 分钟内完成全面的 online ...

IT之家 on MSN14 天

OpenAI GPT-6 训练规模将创历史新高：预估 10 万张 H100 GPU，AI 训练成本 ...

内部代号为“Orion”的 GPT 4.5 在自然度和减少“幻觉”方面取得了重大进展，其参数量可能超过 3 到 4 万亿。据推测，GPT 4.5 的训练使用了 3 万到 5 万块 NVIDIA H100 GPU，训练成本约 7.5 亿到 15 亿美元（IT之家备注：当前约 54.69 亿到 109.37 亿元人民币）。

爱范儿15 天

GPT-4.5 重磅发布！OpenAI 最大最贵模型，没把 DeepSeek 当对手

SimpleQA 用于评估大语言模型（LLM）在简单但具有挑战性的知识问答中的事实性。而 GPT-4.5 在 SimpleQA 准确率（数值越高越好）达到 62.5%，遥遥领先于 OpenAI 其它模型。

腾讯网7 天

GPT-5 的雏形；OpenAI如何研发Agent；中国大厂投更多算力｜AI月报

去年 12 月，Google 就发布基于 Gemini 1.5 模型的 Deep Research 功能；OpenAI 刚推出一天，开源社区 HuggingFace 就提供了开源复现版本；之后不久，大模型搜索应用 Perplexity 推出类似的功能 ...

搜狐14 天

OpenAI GPT-6 训练规模将创历史新高：预估 10 万张 H100 GPU

IT之家注：在 GPT-4.5 模型介绍视频的 2 分 26 秒处，OpenAI 展示 GPT 4.5 功能的聊天记录中，出现了“Num GPUs for GPT 6 Training”（训练 GPT-6 所需的 GPU 数量）的字样。虽然视频中未对此进行任何解释，但“Num”可能暗示了一个前所未有的数字，该媒体推测高达 10 万块 GPU。

知乎 on MSN19 天

DeepSeek 思维链展示的是真实思考过程吗？还是为了更像人类思维而 ...

DeepSeek R1 展示的是真实思考过程，只不过为了为了让人类能看懂这些思考过程而专门做了训练；OpenAI o1/o3 展示的思考过程，是为了提高人类交互友好度而专门模拟的「假思维链」，并非模型真实的思考过程。在 OpenAI 提出 o ...

钛媒体APP on MSN15 天

GPT-4.5震撼发布，智商高情商高，价格更高

OpenAI仍然死守缩放定律。

腾讯网3 天

揭示显式CoT训练机制：思维链如何增强推理泛化能力

基于逐步生成解决方案的大语言模型（LLMs）训练范式在人工智能领域获得了广泛关注，并已发展成为行业内的主流方法之一。例如，OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出了针对 O1 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果