在国际象棋的虚拟战场上,最新一代 AI 推理模型正在上演令人不安的进化: 作弊 ,它们一旦面临输棋的局面可能会在没有外界指令的情况下主动作弊。而且,AI 的作弊行为竟然与其智能水平正相关: 越聪明的模型越倾向于用作弊手段来达成目标 ...
3月4日,在2025年世界移动通信大会期间,世界互联网大会国际组织在西班牙巴塞罗那举办“AI算力发展”专题论坛上,科大讯飞联合创始人、高级副总裁江涛发言。
阿里巴巴旗下的 Qwen 团队推出了 QwQ-32B,这是一款拥有 320 亿参数的推理模型,旨在通过强化学习提升复杂问题解决任务的表现。该模型在 Hugging Face 和 ModelScope ...
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。
09. AI玩具分析师表示,DeepSeek的1.5b参数模型经强化学习后接近OpenAI O1 preview模型。端侧部署难度低、消耗低,可低价部署在低性能手机、玩具等终端,优化后内存消耗降低,一些AI玩具厂商销量爆表,Q1销量达几百万套,后续类似情况会更多,值得持续关注。
2025年伊始,多家顶尖大模型企业如DeepSeek、xAI、OpenAI和Anthropic相继推出了革新性产品。其中,DeepSeek-R1、Grok3、OpenAI的o1、o3和GPT-4.5-preview、Claude-3.7-sonnet ...
2月28日消息,OpenAI今日宣布推出其最新旗舰产品GPT-4.5语言模型。 这款被称为“迄今为止知识储备最丰富”的AI系统将率先面向Pro用户和开发者开放研究预览(research preview)。官方特别说明,该模型并非前沿架构版本 ...
一位AI初创CEO更是直言:在自己心目中最实用评估基准Aider Polyglot上, OpenAI的「镇国之宝」GPT-4.5,比DeepSeek-V3贵了500倍,但表现反而更差。
当地时间2月27日,OpenAI正式发布了其最后一个非思维链模型——GPT-4.5。 OpenAI表示,GPT-4.5是其迄今为止最大、最好的聊天模型,用户与它的交互感觉会更自然。 据21世纪经济报道记者了解,GPT-4.5目前可以访问最新的信息,支持搜索、文件和图像上传,并能通过 ...
在 DeepSeek R1 开源发布引爆全球关注后,更多大模型公司加速推出了深度思考模型,并计划或已经开源。 阿里通义团队日前就 ...