Online LLM - 搜索 News

此前，《太空杀》已成功研发出多智能体大模型（Multi-Agent LLM）打造的AI原生游戏玩法“AI残局挑战”，吸引了超300万玩家参与，并且与名侦探柯南IP合作推出由大模型驱动的“AI侦探剧场”玩法。

大模型运行框架的采用是项目独特需求和约束最密切相关的选择。在某些情况下，甚至可以同时使用：用于快速成型和初始开发的Ollama ，以及用于扩展和优化生产环境的 vLLM。开源的LLM已经成为程序员、爱好者和希望在日常工作中使用生成式AI并保持隐私的用户 ...

4 天

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。为应对这一难题，“hybrid model” ...

太平洋科技资讯中心9 小时

用户激增日均数万！DeepSeek用"中国速度"改写AI应用生态位

日前，国产AI模型DeepSeek以日活跃用户数持续突破，该模型在推出智能助手后的三个月内，已实现DAU（日活跃用户）从50万到180万的指数级增长，累计使用人数突破3000万大关，成为史上最快达成这一里程碑的应用。作为时下最热门的大语言模型之一，DeepSeek不仅能够高效处理海量文本数据，支持图像、语音等多模态数据的理解与生成，还能在多场景中提供智能化解决方案；所以在终端领域，多数手机、PC ...

15 小时

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

开源框架：我们基于 OpenRLHF 开发了一个高效可扩展的多模态大规模强化学习框架，支持 InternVL 等多种模型和 RL 算法。相比 R1-V 等已有框架，我们的方案成功训练了 InternVL 2.5-38B 等大型模型。稳定训练： ...

中国民用航空网10 小时

智洋创新：工业大模型接入DeepSeek 发力工业智能化

2025年初，国产大模型DeepSeek凭借开放性、更低训练成本、端侧部署等优势，迅速成为增速最快的AI应用之一，推动AI普惠化。其基于Transformer-XL架构和稀疏激活技术的突破，重构了AI全产业链的算力分配与算法优化路径。智洋创新依托自研的“电语”系列工业大模型技术平台，将DeepSeek系列大模型无缝接入AI智能体系统，构建了端侧智能体（On-device Agent）生态，为电力 ...

4 天

PC鲜辣报：苹果带来多款Mac新品 RTX 50系游戏本或延期

上周，苹果带来了新款MacBook Air以及Mac Stuidio新品，以及全新M3 Ultra芯片；消息称额外测试导致RTX 50系列游戏本上市延期；英特尔确认Panther Lake将如期发布，18A制程进展正常。苹果推新款M4 ...

腾讯网2 天

朋友圈试金石：这六类看待Manus们的，Low了

Manus自3月6日亮相以来，以哪吒般的扮相和气味，由内及外，持续发酵。紧紧跟随的开源的OpenManus和多代理协作框架OWL横空出世，短短几天内，GitHub星星数飙升，社区热议不断。

腾讯网4 天

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的 ... 解决方案：为避免重复计算，我们借鉴了 online softmax 的思路，利用 Flash Attention 在计算过程中生成的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果