该模型基于 Apache 2.0 许可证发布,允许开发者自由修改、部署和集成到各种应用程序中,对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型,官方声称在相同硬件上,提供超过三倍的性能。
Meta总裁Mark Zuckerberg在第四季财报会议上回应DeepSeek模型带来的市场震荡,表示这“强化了我们专注AI开发的信念”。他指出公司正在消化DeepSeek的创新技术,并计划将其进展集成到Llama模型中。
据报道,马斯克旗下人工智能公司xAI推出首款面向消费者的独立应用。这款应用名为Grok,这也是xAI开发的人工智能语言模型的名称。该描述称:隆重推出适用于iOS的Grok测试版:免费访问xAI的最新模型Grok2。
春节期间,中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,预训练数据超过20万亿tokens,在多个基准测试中表现优于DeepSeek ...
据最新消息,尽管中国人工智能(AI)初创企业DeepSeek推出了极具成本效益的模型,引发业界对AI技术巨额投入的质疑声浪,但meta Platforms, Inc.仍计划在2025年维持其烧钱速度。
受此影响,在美国当地时间1月27日的美股交易当中,Marvell大跌19.1%、博通大跌17.4%、英伟达大跌16.97%,台积电大跌13.33%、美光大跌11.71%、AMD大跌6.37%、ASML大跌5.75%。