搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
15 天
阿里云通义Qwen2.5-Math-PRM:7B模型超越GPT-4o,数学推理新突破
1月16日消息,阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸,其在推理过程中的表现显著优于现有的开源模型,尤其在推理错误识别方面,7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性,也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...
15 天
阿里云Qwen2.5-Math-PRM模型:小尺寸也能超越GPT-4o的推理荒谬探测能力
在数字化的时代,推理能力的较量正如同科技界的竞技场。最近,阿里云推出了其最新的数学推理过程奖励模型:Qwen2.5-Math-PRM。这款模型以仅有7B的微小参数量,颠覆了大型人工智能模型的传统认知,再次证明了更小也能更聪明的真理!
来自MSN
5 个月
通义千问开源数学模型Qwen2-Math,数学能力超越GPT-4o
Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1 ...
15 天
阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准
在科技快速发展的今天,阿里云再一次为人工智能领域推陈出新。1月16日,钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出,标志着在72B与7B尺寸下,其性能远超同类开源过程奖励模型。
腾讯网
14 天
芯报丨阿里云通义开源首个推理步骤评估标准
聚焦:人工智能、芯片等行业欢迎各位客官关注、转发每日芯报0117期阿里云通义开源首个推理步骤评估标准1月16日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推 ...
腾讯网
14 天
阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM
多知1月17日消息,通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,包括72B和7B两个版本,将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度,自动识别推理过程中的错误,如计算或逻辑错误,这些错误可能导致不正确的结论,即使最终答案正确,也可能削弱模型推理过程的可信度。在识别推理错误步 ...
腾讯网
15 天
阿里云通义开源首个推理步骤评估标准
钛媒体App 1月16日消息,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队还开源首个步骤级的评估标准 ...
爱范儿
3 天
阿里云通义开源最强视觉理解模型Qwen2.5-VL,AI智能体能力大幅增强
1 月 28日凌晨,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解 ...
华尔街日报中文版
2 天
阿里巴巴发布升级版AI模型Qwen2.5 Max,称其超越对手DeepSeek-V3
阿里巴巴旗下的阿里云介绍了“通义千问”大语言模型的最新版本Qwen2.5 Max,称其在各项基准测试中均超越了OpenAI的GPT-4o、DeepSeek-V3和Meta的Llama-3.1-405B模型。 中国电商巨头阿里巴巴(Alibaba)发布了该公司人工智能(AI)模型的一个新版本,声称该模型在各项基准测试中 ...
Lianhe Zaobao
5 天
阿里云初一发布通义千问旗舰版模型Qwen2.5-Max
中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。 阿里云星期三(1月29日)凌晨在微信公众号宣布,Qwen2.5-Max全新升级发布,并说新模型展现出极强劲的综合性能,在多项公开 ...
新浪网
3 天
阿里云通义开源Qwen2.5-VL,视觉理解能力全面超越GP..
01月28日 10:24 1月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,夺得十余项权威评测中的视觉理解冠军,超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈