1月30日
1月30日,阿里巴巴发布Qwen 2.5-Max模型,Qwen2.5-Max模型代表阿里云团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,在多项基准测试中几乎全面超越了DeepSeek-V3、GPT-4o和Llama-3.1-405B。阿里过去在云业务总体capex投入长期位居互联网大厂前列,Qwen2.5-Max模型表现优越,本轮中概AI资产重估,以阿里为代表的低估值、主业企 ...
近期,名为DeepSeek(深度求索)的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型,火爆全网。DeepSeek推出的低成本AI模型可与全球一些最先进的模型相媲美,而且据称训练过程中使用的英伟达芯片要少得多。这一技术进步引发了华尔街的巨大反响,受事件影响,美股的AI明星股一度暴跌。原因是DeepSeek的成功,令市场认为人工智能大模型对高端芯 ...
欧洲领先的人工智能公司之一 Mistral AI 推出了一款名为 Mistral Small 3 的新模型。 这是一个包含 240 亿参数的模型,但与 Llama 3.3 70B 和 Qwen 32B 等大型模型相当(至少在 MMLU-Pro ...
大家好啊。春节放假期间,海外市场的中国资产就在大涨。大年初三,富时中国A50指数期货盘中一度涨超2%,截至发稿涨超1.6%。 近期,名为DeepSeek(深度求索)的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型,火爆全网。DeepSeek推出的低成本AI模型可与全球一些最先进的模型相媲美,而且据称训练过程中使用的 英伟达 ...
微软今日发文,宣布推出针对 NPU 优化的 DeepSeek-R1(IT之家注:已在 Azure AI Foundry 和 GitHub 上提供),首批将面向搭载高通骁龙 X 芯片的 Copilot+ PC 推出,随后是英特尔酷睿 Ultra 200V 等平台。
相反,DeepSeek的漏洞似乎表明我们将继续沿着“百模”的道路前进。也因为中国人工智能初创企业可以依赖一系列重要的优势。杨引用了经济合作与发展组织(OECD)的数据,称中国目前对人工智能研究的贡献超过20%,超过了欧盟和印度的总和。中国还在全球生成性人工智能专利竞赛中占据主导地位,过去 10 年里其专利数量“是排名第二的美国的6倍”。
继DeepSeek之后,阿里巴巴(9988)最新推出AI大模型,据报亦成功做到低成本、高性能的技术突破,令海外投资者对中国科技股的兴趣回升,在美股上市的中概股周四普遍上升,其中阿里巴巴 (BABA)大升6.22%至102.74美元,较本港周二收市价急升逾13%,折合报100.1港元。而中国海外互联网ETF-KraneShares (KWEB)周三单日有1.05亿美元资金流入,创自去年10月以来的新 ...
中概股大涨,中国互联网ETF流入也创四个月新高,DeepSeek或重估中国AI资产?周四,中概股迎来普涨,其中纳斯达克中国金龙指数(HXC)收高4.33%。特别是阿里巴巴,以6.22%的涨幅领涨,表现尤为亮眼。其他中国科技巨头如百度、京东和网易也分别 ...
鞭牛士报道,1月29日消息,据路透社报道,中国科技公司阿里巴巴周三发布了其Qwen 2.5 人工智能模型的新版本,据称该模型超越了备受赞誉的 DeepSeek-V3。 Qwen 2.5-Max 的发布时间比较特殊,正值农历新年的第一天,大多数中国人都下班回家与家人团聚。这意味着中国人工智能初创公司DeepSeek 在过去三周的迅速崛起不仅给海外竞争对手带来了压力,也给国内竞争对手带来了压力。
阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...
在新春佳节来临之际,阿里巴巴集团旗下的阿里云宣布推出其最新的人工智能大语言模型——Qwen 2.5-Max。此次发布引起了业界的广泛关注,阿里云声称这一模型在性能上超越了目前被广泛认可的DeepSeek-V3,进一步巩固了中国在全球AI技术领域的竞争力。
在科技发展日新月异的今天,人工智能大语言模型成为了各大科技公司争相角逐的焦点。就在农历新年之际,阿里巴巴集团旗下的云计算部门——阿里云揭开了其最新的人工智能大语言模型Qwen 2.5-Max的神奇面纱,宣称其性能已超越市场上其他顶尖的AI模型。这一消息无疑令业界为之一振,尤其是在继DeepSeek的R1推理模型发声不久后,Qwen 2.5-Max的发布标志着中国在人工智能领域的又一次重要突破。