Qwen GitHub - 搜索 News

微软宣布为Win11用户优化DeepSeek-R1模型，让Copilot+PC实现本地化AI推理

微软今日发文，宣布推出针对 NPU 优化的 DeepSeek-R1（IT之家注：已在 Azure AI Foundry 和 GitHub 上提供），首批将面向搭载高通骁龙 X 芯片的 Copilot+ PC 推出，随后是英特尔酷睿 Ultra 200V 等平台。

1 天on MSN

微软意外为 Azure AI Foundry 和 GitHub 带来 DeepSeek R1

DeepSeek-R1 是一个 671B 参数模型，其深度学习能力与 OpenAI 的 GPT-3 模型类似。尽管围绕 DeepSeek-R1 的影响的讨论尚未尘埃落定，微软今天还是宣布 DeepSeek-R1 模型在 Azure AI Foundry 和 GitHub 上可用，这出乎所有人的意料。微软声称，企业现在可以从一个可信、可扩展和企业就绪的平台访问 DeepSeek-R1，该平台可保证 ...

1 天

微软DeepSeek-R1模型优化：Copilot+PC人工智能推理能力的飞跃提升

DeepSeek-R1模型的推出不仅仅是一次技术升级，它代表了微软在生成式AI领域的战术调整。通过NPU，生成式AI的运算能力得以大幅提升，实现了按需执行和半连续服务的落地，极大地增强了用户体验。相较于传统的云处理，这种在本地设备上进行AI推理的全新 ...

1 天

原来，这些顶级大模型都是蒸馏的

具体来说，研究者测试了 Claude、豆包、Gemini、llama 3.1、Phi 4、DPSK-V3、Qwen-Max、GLM4-Plus 等多个模型，发现这些模型大多存在很高程度的蒸馏（Claude、豆包和 Gemini ...

腾讯网2 天

阿里巴巴发布升级版AI模型Qwen 2.5-Max，与DeepSeek等竞争

PANews 1月30日消息，阿里巴巴在春节期间紧急推出升级版AI模型Qwen 2.5-Max，以应对快速变化的行业竞争。公司声称，该模型在性能上“几乎全面超越”ChatGPT、DeepSeek和Meta的Llama。根据阿里巴巴的测试，Qwen ...

腾讯网4 天

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

在上下文长度高达 100万Tokens的 “大海捞针” 式任务 ——Passkey Retrieval（密钥检索）中，Qwen2.5-1M系列模型展现出卓越性能，能够精准地从长度为1M的文档里检索出隐藏信息。

红板报 on MSN5 天

阿里云通义开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

1月27日凌晨，阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型，推出7B及14B两个尺寸，均在处理长文本任务中稳定超越GPT-4o-mini；同时开源推理框架，在处理百万级别长文本输入时可实现近7倍的提速。

虎嗅网5 天

全球掀起DeepSeek复现狂潮，硅谷巨头神话崩塌

本文来自微信公众号：新智元，作者：新智元，原文标题：《全球掀起DeepSeek复现狂潮，硅谷巨头神话崩塌，30刀见证啊哈时刻》，题图来自：视觉中国诚如LeCun所言：“这一次，正是开源对闭源的胜利！” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果