Chat GPT 4O - 搜索 News

9 小时

Qwen-Max是阿里云通义团队对MoE模型的最新探索成果，新模型展现出极强劲的综合性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中，Qwen2.5-Max比肩C ...

14 小时on MSN

阿里Qwen2.5-Max大模型竞技场夺魁，中国AI实力获赞快速赶超

在近日的大模型竞技场中，一款来自中国的AI模型引起了广泛关注。这款名为Qwen2.5-Max的模型，由阿里巴巴公司推出，成功超越了多个国际知名模型，包括DeepSeek-V3、Claude 3.5 Sonnet以及Llama 3.1 ...

21 小时

中国模型崛起！阿里Qwen2.5-Max数学及编程能力全球第一

2月4日凌晨，三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单，一周前刚发布的Qwen2.5-Max超越DeepSeek ...

6 小时

又一国产大模型海外出圈！超越DeepSeek V3

作为国内较早开源自研大模型的科技大厂，阿里云旗下的通义千问已实现全尺寸、全模态的开源，推出了包括语言大模型、多模态大模型等多种类型的开源模型。在全球范围内，Qwen的衍生模型数量超9万个，已超越Llama成为全球更大的开源模型群。此次Qwen2.5 ...

腾讯网20 小时

阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

在逻辑性较强的数学和代码任务当中，Qwen2.5-Max的成绩都超过了o1-mini，和满血o1以及DeepSeek-R1并列第一。如果仔细观察具体的对战记录，还可以发现，Qwen2.5-Max在代码能力上和满血o1进行PK的胜率达到了69%。

东方财富网16 小时

超DeepSeek V3！阿里云Qwen2.5-Max闯入全球盲测榜单前十

【超DeepSeek V3！阿里云Qwen2.5-Max闯入全球盲测榜单前十】2月4日凌晨，三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单，一周前刚发布的Qwen2.5-Max超越DeepSeek ...

每经网21 小时

中国模型崛起！阿里Qwen2.5-Max数学及编程能力赶超OpenAI

Qwen2.5-Max是阿里云通义团队约一周前发布的最新MoE模型，展现出极强劲的性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果