在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
原文作者:Jacob Dreyer通过押注AI,中国希望能开发面向全球市场,尤其是低收入国家的成本效益高的实用商业工具。中国巨大的消费市场或推动“具身人工智能”(embodied ...
3 天
知乎 on MSN拥有Deepseek、可灵AI等现象级国产大模型,中国AI资产是否被低估?2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
DeepSeek今年1月底推出AI模型R1,其以极低成本达到与OpenAI o1模型一样的表现,让外界相当惊艷,如今DeepSeek又有大动作,日前宣布举行「开源周」,共开源5个代码库(repository),以完全透明的方式分享公司新进展 ...
没人在乎车机能不能写出一篇满分作文。 DeepSeek 成为了蛇年开年最火的事物,连家里的爸妈甚至爷爷奶奶,都在过年的饭桌上叫我给他们讲讲 AI 是 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
不等了,就是现在! 百度搜索已正式全量接入DeepSeek-R1满血版,在宣布“将接入”仅过了24小时后。 基于百度搜索的国民级用户覆盖,满血版DeepSeek ...
使用微信扫码将网页分享到微信 腾讯元宝不语,只是一味地更新。 当 DeepSeek 在春节期间爆火,所有人都在猜测国内 AI 厂商将会如何跟进时 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果