在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
原文作者:Jacob Dreyer通过押注AI,中国希望能开发面向全球市场,尤其是低收入国家的成本效益高的实用商业工具。中国巨大的消费市场或推动“具身人工智能”(embodied ...
3 天
知乎 on MSN拥有Deepseek、可灵AI等现象级国产大模型,中国AI资产是否被低估?2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
DeepSeek今年1月底推出AI模型R1,其以极低成本达到与OpenAI o1模型一样的表现,让外界相当惊艷,如今DeepSeek又有大动作,日前宣布举行「开源周」,共开源5个代码库(repository),以完全透明的方式分享公司新进展 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
Alibaba and DeepSeek, according to the report. It said Apple didn’t select DeepSeek model for the upstart lacked the manpower and experience to serve a large customer like Apple. Apple was ...
不等了,就是现在! 百度搜索已正式全量接入DeepSeek-R1满血版,在宣布“将接入”仅过了24小时后。 基于百度搜索的国民级用户覆盖,满血版DeepSeek ...
使用微信扫码将网页分享到微信 腾讯元宝不语,只是一味地更新。 当 DeepSeek 在春节期间爆火,所有人都在猜测国内 AI 厂商将会如何跟进时 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果