搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
搜索
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
2 天
o1开启LLM新范式,Ai2科学家解析背后秘籍:推理和强化学习是关键
在NeurIPS的Latent Space非官方Industry Track上,Ai2研究科学家Nathan Lambert发表相关演讲,直接回答语言模型能否推理,以及o1和强化微调 (RFT) API给大家的启发。 Nathan ...
10 天
在问题生成领域,LLM首次正面挑战人类的六大维度评估
近日,来自加州大学伯克利分校、阿卜杜勒阿齐兹国王科技城及华盛顿大学的研究小组发布了一项针对大型语言模型(LLM)在问题生成(Question ...
腾讯网
10 天
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级
新智元报道 编辑:peter东 乔杨【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo ...
腾讯网
13 天
选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化
机器之心报道编辑:Panda今天是个好日子,DeepSeek 与 Kimi 都更新了最新版的推理模型,吸引了广泛关注。与此同时,谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球,并直接冲上了 Hugging ...
7 天
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
测试时训练等价于原强化学习,这个视角提供了多方面的有价值见解:(1)优化测试时计算资源时,与信息增益相关的中间过程奖励的作用;(2)模型崩溃和预训练初始化在学习meta策略中的作用;以及(3)缺乏外部反馈的情况下,不对称性如何成为测试时改进的驱动力。
中時新聞網
12 小时
《半导体》外资点名联发科AI布局 法说5大关键议题曝光
美系外资最新研究报告指出,近期中国大型语言模型(LLM)DeepSeek发展迅速,预计将对中国AI产业带来深远影响,并进一步巩固联发科(2454)在边缘AI领域的战略地位。此外,针对联发科即将于2月7日举行的法说会,外资 ...
14 天
扩散模型也能推理时Scaling,谢赛宁团队重磅研究可能带来文生图新范式
与 LLM 相比,扩散模型处理的是作为初始样本注入的噪声或在采样过程中注入的噪声的显式随机性。已有研究表明这些噪声并非等价,即某些噪声会带来更好的生成结果。这一观察为 scaling NFE 提供了除增加去噪步骤之外的另一个维度 —— 在采样中搜索更好的噪声。
36氪
19 天
微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」
微软推出LAM,AI可自主执行任务。 AI大模型正从仅会聊天的LLM进化为能够执行任务的大型行动模型LAM。它不仅能理解用户的指令,还能在软件环境中 ...
17 天
Apple中国NLP团队招聘实习生:开启AI语言处理新机会
随着人工智能技术的迅猛发展,自然语言处理(NLP)领域正迎来前所未有的机遇。近日,Apple中国宣布正在招聘NLP和大模型方向的算法实习生,旨在加强其在大型语言模型(LLM)应用和后端系统开发方面的能力。这一招聘消息不仅引发了在校学生和求职者的广泛关 ...
来自MSN
1 个月
LLM很难变成AGI?科学家:创造AGI理论上可行
极客网·极客观察12月10日 今年9月份OpenAI对外宣称,AI能力达到新等级,相比之前的LLM,新AI更接近人类的思考能力。OpenAI的断言引起争论:到底还要 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈