Llama - 搜索 News

2 天on MSN

该模型基于 Apache 2.0 许可证发布，允许开发者自由修改、部署和集成到各种应用程序中，对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型，官方声称在相同硬件上，提供超过三倍的性能。

来自MSN3 天

Meta总裁Mark Zuckerberg在第四季财报会议上回应DeepSeek模型带来的市场震荡，表示这“强化了我们专注AI开发的信念”。他指出公司正在消化DeepSeek的创新技术，并计划将其进展集成到Llama模型中。

7 小时

在中国AI产业的深海巨兽生态中，还蕴含着一种独特的法则——既善于“单兵作战”，又能“鲸群狩猎”。这意味着中国的AI企业不仅能够在特定领域取得突破性的成就，还能够与其他企业协同作战，共同应对复杂多变的市场挑战。这种生态法则使得中国AI产业在面对全球竞争 ...

7 小时

从 DeepSeek 让训练成本大幅降低的 MLA 模式，R1 和 o1 等模型的性能对比，人均年薪千万的顶尖人才，还指出目前 DeepSeek 的成本估算是错误的，推测其拥有大约 5 万块Hopper GPU…… ...

8 小时

面对中国公司DeepSeek的AI模型R1大杀四方，硅谷大佬们集体破防：马斯克质疑显卡用量，微软调查数据来源，美国政客甚至搬出“盗取技术”的帽子——素有“硅谷鲁迅”之称的LeCun反手在X上开启了反讽模式。

1 天

Meta 此举意在不让 OpenAI 的 Stargate 计划独占风头。上周 OpenAI、甲骨文与软银宣布合资，计划在未来四年内投入 5000 亿美元（当前约 3.64 万亿元人民币）在美国得州阿比林市启动建设 10 座 AI 数据中心。

春节期间，中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线，预训练数据超过20万亿tokens，在多个基准测试中表现优于DeepSeek ...

作者｜Jessica邮箱｜[email protected]科技巨头Meta和微软相继公布了各自截至12月31日的最新季度财报。尽管两份成绩单均超预期，但市场反应却大相径庭：Meta在AI广告业务的带动下收入创历史新高，股价随即上扬； ...

6 天

受此影响，在美国当地时间1月27日的美股交易当中，Marvell大跌19.1%、博通大跌17.4%、英伟达大跌16.97%，台积电大跌13.33%、美光大跌11.71%、AMD大跌6.37%、ASML大跌5.75%。

来自MSN6 天

据最新消息，尽管中国人工智能（AI）初创企业DeepSeek推出了极具成本效益的模型，引发业界对AI技术巨额投入的质疑声浪，但meta Platforms, Inc.仍计划在2025年维持其烧钱速度。

这几天，中国人工智能初创公司DeepSeek火了，不仅在美区下载榜上超越了ChatGPT，还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。为何DeepSeek的出现会让美国如此关注，甚至有些紧张？谭 ...

一位Meta的工程师在美国科技公司员工社区Blind中这样写道，“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek，它使得 Llama 4在基准测试中已经落后。” ...

一些您可能无法访问的结果已被隐去。