LLM - 搜索 News

1 小时

在预训练阶段，OLMo 2通过多种技术改进了训练稳定性，例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增，从而提高了最终模型的性能。

22 小时

总体来看，FlashInfer不仅是高效Attention引擎的代表，更是当前LLM推理领域的一次革命性进步。未来，该技术的广泛应用有望推动更为复杂但高效的AI模型的实现，进而为各类自然语言处理任务（如对话系统、文本生成和信息检索等）注入新的活力与可能性。正如陈天奇团队所言，FlashInfer的发布不仅仅是一次学术成果，更是对未来AI技术进步的展望。借助这些创新，我们期待在各行各业的AI应用中， ...

十轮网科技资讯 on MSN2 小时

DeepMind公开Mind Evolution研究，结合LLM提升自然语言问题求解性能

DeepMind发布了一项名为Mind ...

腾讯网5 小时

某交易员抛售去年4月花费2500美元建仓的ALON头寸，获利340万美元

BlockBeats 消息，1 月 24 日，据 Lookonchain 监测，2024 年 4 月，某交易员花费 2500 枚 USDC 买 4486 万枚 ALON，并一直持有至今。在过去的 4 小时内，其卖出 2800 万枚 ALON，换得 13,534 SOL（价值 341 万美元），获利 340 ...

22 小时

高效Attention引擎是怎样炼成的？陈天奇团队FlashInfer打响新年第一枪！

Prefill阶段拿到最开始的Prompt，填充kv cache；Decode阶段则是一个query计算出一个输出；存在多轮对话或者使用投机推理（Speculative Decoding）时，又可以有多个query向量并行计算。

7 小时

Meta首席AI科学家预测五年内将出现新的AI架构范式，开启 “机器人十 ...

在日前的达沃斯 “技术辩论” 会上，Meta 的首席 AI 科学家 Yann LeCun 对未来五年的人工智能发展做出了激动人心的预测。他认为，现有的人工智能系统将在未来3到5年内面临巨大的变革，将出现一种 “新的 AI 架构范式”，超越当今普遍使用的生成式 AI 和大型语言模型（LLM）的能力。

潇湘晨报 on MSN39 分钟

企业服务O2O平台天天百应完成数千万元融资

北京商报讯（记者 ...

8 小时

Anthropic创始人眼中的AI智能体进化：工具、上下文、代码与安全

AI 智能体目前是科技领域的热门话题。从 Google DeepMind、OpenAI 到 Anthropic，各大顶尖公司正竞相为 LLM 赋予自主完成任务的能力。这类系统在行业内被称为 Agentic AI（代理式人工智能），是硅谷新的热议焦点。从英伟达到 Salesforce，各家公司都在探讨如何利用这项技术颠覆行业格局。

3 小时

罕见！Meta签约100亿美元投资Databricks，Databricks创始人：一年之后上市 ...

众所周知，Meta 在人工智能领域扮演着重要角色，Llama 作为大模型界的 Linux，许多商业公司都建立在其之上，数据分析软件公司 Databricks 也不例外，也是基于此模型构建的。Databricks 联合创始人兼首席执行官 Ali Ghodsi 在本周的一次采访中表示，Databricks 与 Meta 的 Llama 团队合作密切。

7 小时on MSN

「天天百应」已完成数千万元Pre-A轮融资，加速门店维修服务数字化 ...

36氪获悉，企业服务O2O平台「天天百应」近期已完成Pre-A轮融资，金额数千万元，本轮融资由红点创投独投。本轮资金将用于系统及公司运营、市场拓展和配套服务及供应链升级。「天天百应」2016年成立于上海，致力于通过建立基于LLM的对话式AI商业空间现场服务平台，改造传统店铺维修保养服务，提升传统店铺维修保养服务的响应效率并降低企业费用成本，整合全国各地区店铺报修的需求，将传统的上门安装维修服务与 ...

5 小时

ICLR 2025超万篇论文厮杀，录用率32.08%，首个满分论文或预定best paper？

刚刚，一年一度的AI顶会ICLR和CVPR开始公布录用和审稿结果了！中稿的网友们纷纷晒出了自己的成绩单。今年，ICLR 2025共接收11,565份投稿，录用率为32.08%。Oral和Poster的具体结果，会在接下来公布。

7 小时

刚刚，OpenAI首个智能体提前曝光！高级编码AI剑指400万年薪L6级工程师

去年10月，Anthropic联合创始人Daniela Amodei在接受采访时表示，虽然当前AI编程还不能完全取代工程师，仍需人为给予一定引导，但Claude 3.5 Sonnet显著提升了开发者的工作效率，Anthropic甚至会据此调整招聘计划。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果