qwen - 搜索 News

近期，名为DeepSeek（深度求索）的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型，火爆全网。DeepSeek推出的低成本AI模型可与全球一些最先进的模型相媲美，而且据称训练过程中使用的英伟达芯片要少得多。这一技术进步引发了华尔街的巨大反响，受事件影响，美股的AI明星股一度暴跌。原因是DeepSeek的成功，令市场认为人工智能大模型对高端芯 ...

东方财富网2 小时

大年初三，富时中国A50指数期货大涨

大家好啊。春节放假期间，海外市场的中国资产就在大涨。大年初三，富时中国A50指数期货盘中一度涨超2%，截至发稿涨超1.6%。近期，名为DeepSeek（深度求索）的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型，火爆全网。DeepSeek推出的低成本AI模型可与全球一些最先进的模型相媲美，而且据称训练过程中使用的英伟达 ...

凤凰网4 小时

微软宣布为Win11用户优化DeepSeek-R1模型，让Copilot+PC实现本地化AI推理

微软今日发文，宣布推出针对 NPU 优化的 DeepSeek-R1（IT之家注：已在 Azure AI Foundry 和 GitHub 上提供），首批将面向搭载高通骁龙 X 芯片的 Copilot+ PC 推出，随后是英特尔酷睿 Ultra 200V 等平台。

Asia News5 小时

百模大战：北京DeepSeek背后的秘密

相反，DeepSeek的漏洞似乎表明我们将继续沿着“百模”的道路前进。也因为中国人工智能初创企业可以依赖一系列重要的优势。杨引用了经济合作与发展组织（OECD）的数据，称中国目前对人工智能研究的贡献超过20%，超过了欧盟和印度的总和。中国还在全球生成性人工智能专利竞赛中占据主导地位，过去 10 年里其专利数量“是排名第二的美国的6倍”。

星島網8 小时

阿里新AI模型成DeepSeek翻版中概股全线升大行料引发中国AI资产新一 ...

继DeepSeek之后，阿里巴巴（9988）最新推出AI大模型，据报亦成功做到低成本、高性能的技术突破，令海外投资者对中国科技股的兴趣回升，在美股上市的中概股周四普遍上升，其中阿里巴巴（BABA）大升6.22%至102.74美元，较本港周二收市价急升逾13%，折合报100.1港元。而中国海外互联网ETF-KraneShares （KWEB）周三单日有1.05亿美元资金流入，创自去年10月以来的新 ...

美国之音12 小时

阿里巴巴发布AI模型声称超越DeepSeek

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...

来自MSN23 小时

Alibaba 发布 Qwen 2.5-Max AI 模型，称性能超越 DeepSeek-V3

阿里云发布最新大语言模型 Qwen 2.5-Max，声称性能超越当前最强 AI 模型。该模型采用专家混合架构，经过 20 万亿 token 预训练和后续强化学习，在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max ...

2 天on MSN

通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3

IT之家 1 月 29 日消息，新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，大家可以通过 API 的方式进行访问，也可以登录 Qwen Chat 进行体验，例如直接与模型对话，或者使用 artifacts ...

中文科技资讯15 天

阿里巴巴Qwen 团队发布新型过程奖励模型，数学推理再进化

阿里巴巴 Qwen 团队近日发布了题为《数学推理中过程奖励模型的开发经验教训》的论文，并推出了 Qwen2.5-Math-PRM 系列中的两个新模型，分别具有7B 和72B 参数。这些模型在数学推理中突破了现有 PRM 框架的限制，通过创新技术显著提高了推理模型的准确性和泛化 ...

17173游戏网26 天

阿里发布 Qwen-Agent 框架，赋能开发者构建复杂 AI 智能体

阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent，基于现有 Qwen 语言模型，支持智能体执行复杂任务，并提供多种高级功能，赋能开发者构建更强大的 AI ...

IB资讯26 天

阿里Qwen-Agent框架上新，助力开发者打造强大AI智能体

阿里巴巴旗下的AI平台通义千问近期宣布了一项重要更新，推出了名为Qwen-Agent的全新AI开发框架。这一框架旨在进一步拓展Qwen语言模型的能力，使智能体能够执行更为复杂的任务，并为开发者提供了更为丰富的高级功能。 Qwen-Agent框架的核心在于其强大的底层 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果