Llama - 搜索 News

2 天

开源新秀 Mistral Small 3：低延迟、高性能、Apache 2.0 许可

该模型基于 Apache 2.0 许可证发布，允许开发者自由修改、部署和集成到各种应用程序中，对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型，官方声称在相同硬件上，提供超过三倍的性能。

来自MSN3 天

Meta并不担心DeepSeek竞争将参考DeepSeek提升Llama性能

Meta总裁Mark Zuckerberg在第四季财报会议上回应DeepSeek模型带来的市场震荡，表示这“强化了我们专注AI开发的信念”。他指出公司正在消化DeepSeek的创新技术，并计划将其进展集成到Llama模型中。

4 天

无需监管！马斯克宣布在美推出全新FSD付费服务版本

据报道，马斯克旗下人工智能公司xAI推出首款面向消费者的独立应用。这款应用名为Grok，这也是xAI开发的人工智能语言模型的名称。该描述称：隆重推出适用于iOS的Grok测试版：免费访问xAI的最新模型Grok2。

中华网5 天

春节档AI唱主角国产大模型密集更新开源模型展现强劲势头

春节期间，中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线，预训练数据超过20万亿tokens，在多个基准测试中表现优于DeepSeek ...

来自MSN6 天

Meta豪掷600亿布局AI，DeepSeek低成本高效能模型引质疑

据最新消息，尽管中国人工智能（AI）初创企业DeepSeek推出了极具成本效益的模型，引发业界对AI技术巨额投入的质疑声浪，但meta Platforms, Inc.仍计划在2025年维持其烧钱速度。

6 天

DeepSeek掀起AI算力革命：英伟达暴跌17%！台积电暴跌13%

受此影响，在美国当地时间1月27日的美股交易当中，Marvell大跌19.1%、博通大跌17.4%、英伟达大跌16.97%，台积电大跌13.33%、美光大跌11.71%、AMD大跌6.37%、ASML大跌5.75%。

昆明广播电视台官方网站7 天

中国DeepSeek仅用550万美元就超越Meta Llama 4，硅谷为何陷入恐慌？

科技界常常带来意外，今年一月份，一条新闻如同炸雷一般在中美AI界引起了轰动。短短一周内，我国科技企业深入探索，全球范围内备受瞩目，他们推出的R1大模型让美国硅谷感受到了震动和恐慌。现在，让我们来详细探究这一科技界大事件的始末。

8 天

曝DeepSeek让Llama4未发布已落后！小扎坐不住了：2025预算4000亿起步 ...

这个数据中心在上个月已经官宣，预计整个建设工程会持续到2030年，当时美国一家能源公司还提议，在Meta这个数据中心附近建立一座1.5GW的天然气发电厂。

10 天

突破性进展：AI2发布OLMo2，开源大语言模型全新格局

在人工智能技术迅速发展的背景下，大语言模型（LLM）作为核心技术之一，一直吸引着业内外的关注。最近，非营利研究机构AI2发布了一个全新的开源模型OLMo2，该模型不仅在同类产品中表现出色，还将训练过程和数据结构完全公开。OLMo2的出现，标志着开源LLM领域的一次重大飞跃，设立了新的性能标准。以这款模型为切入点，本文将深入探讨其技术创新、设计理念及其在未来研究与应用中的潜力。

10 天

罕见！Meta签约100亿美元投资Databricks，Databricks创始人：一年之后上市 ...

众所周知，Meta 在人工智能领域扮演着重要角色，Llama 作为大模型界的 Linux，许多商业公司都建立在其之上，数据分析软件公司 Databricks 也不例外，也是基于此模型构建的。Databricks 联合创始人兼首席执行官 Ali Ghodsi 在本周的一次采访中表示，Databricks 与 Meta 的 Llama 团队合作密切。

IT之家16 天

研究公司公布 SwiftKV 技术：优化大模型提示词处理过程、降低 50% AI ...

IT之家1 月 17 日消息，研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术，并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型（点此访问）。 IT之家获悉，SwiftKV 技术的核心在于优化模型提示词处理过程。研究人员指出，通常情况下 ...

IT之家18 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

IT之家1 月 15 日消息，周二，在一场涉及 Meta 的人工智能版权案件（Kadrey 诉 Meta 案）中，法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示，Meta 在开发其最新 AI 模型 Llama 3 的过程中，高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标，并在内部 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果