LLM - 搜索 News

7 小时

颠覆LLM格局！AI2新模型OLMo2，训练过程全公开，数据架构双升级

在预训练阶段，OLMo 2通过多种技术改进了训练稳定性，例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增，从而提高了最终模型的性能。

十轮网科技资讯 on MSN8 小时

DeepMind公开Mind Evolution研究，结合LLM提升自然语言问题求解性能

DeepMind发布了一项名为Mind ...

腾讯网11 小时

某交易员抛售去年4月花费2500美元建仓的ALON头寸，获利340万美元

BlockBeats 消息，1 月 24 日，据 Lookonchain 监测，2024 年 4 月，某交易员花费 2500 枚 USDC 买 4486 万枚 ALON，并一直持有至今。在过去的 4 小时内，其卖出 2800 万枚 ALON，换得 13,534 SOL（价值 341 万美元），获利 340 ...

12 小时

Meta首席AI科学家预测五年内将出现新的AI架构范式，开启 “机器人十 ...

在日前的达沃斯 “技术辩论” 会上，Meta 的首席 AI 科学家 Yann LeCun 对未来五年的人工智能发展做出了激动人心的预测。他认为，现有的人工智能系统将在未来3到5年内面临巨大的变革，将出现一种 “新的 AI 架构范式”，超越当今普遍使用的生成式 AI 和大型语言模型（LLM）的能力。

14 小时

Anthropic创始人眼中的AI智能体进化：工具、上下文、代码与安全

AI 智能体目前是科技领域的热门话题。从 Google DeepMind、OpenAI 到 Anthropic，各大顶尖公司正竞相为 LLM 赋予自主完成任务的能力。这类系统在行业内被称为 Agentic AI（代理式人工智能），是硅谷新的热议焦点。从英伟达到 Salesforce，各家公司都在探讨如何利用这项技术颠覆行业格局。

腾讯网16 小时

“大美香港”摄影巡展活动在香港观塘启动

羊城晚报讯 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果