搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
1 小时
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级
在预训练阶段,OLMo 2通过多种技术改进了训练稳定性,例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增,从而提高了最终模型的性能。
腾讯网
14 天
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
2 小时
罕见!Meta签约100亿美元投资Databricks,Databricks创始人:一年之后上市 ...
众所周知,Meta 在人工智能领域扮演着重要角色,Llama 作为大模型界的 Linux,许多商业公司都建立在其之上, 数据分析软件公司 Databricks 也不例外,也是基于此模型构建的。Databricks 联合创始人兼首席执行官 Ali Ghodsi 在本周的一次采访中表示,Databricks 与 Meta 的 Llama 团队合作密切。
9 天
Meta动力十足,Llama 3力争超越GPT-4!
为了提升Llama ...
来自MSN
2 小时
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。 最先陷入恐慌的,似乎是同样推崇开源的 Meta。 最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 ...
17 天
英伟达Llama Nemotron语言模型发布,重塑AI应用潜力
近日,英伟达正式推出了其最新的Llama Nemotron语言基础模型,此次发布的模型分为Nano、Super和Ultra三个版本,旨在满足不同层次用户的需求。作为当前人工智能技术的一个重要进展,Llama Nemotron将带来更强大的自然语言处理能力,推动各行业的智能化发展。新模型的引入,预计将重塑AI应用的潜力,吸引了众多开发者和企业的关注。
腾讯网
8 天
为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 ...
8 天
on MSN
Meta争锋AI领域,为超越GPT-4,Llama 3训练数据引争议
近日,一场围绕meta人工智能版权问题的法律纠纷,意外揭露了这家科技巨头在AI领域的雄心壮志与内部竞争态势。在Kadrey诉meta一案中,法庭公开的meta高管及研究人员的通信记录,为人们提供了一个窥视其AI研发内部运作的窗口。 据这些文件显示,meta在打造其最新AI模型Llama ...
17 天
黄仁勋宣布全新NVIDIA Llama系列模型:AI技术又一飞跃
随着人工智能的迅猛发展,NVIDIA在其中扮演着越发重要的角色。黄仁勋的这一声明再一次证实了公司在AI模型创新方面的非凡能力。此次推出的完整系列模型,不仅提升了AI在自然语言处理领域的性能,也为开发者提供了更强大的工具,以应对不断增加的智能应用需求。
15 天
微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。
17 天
英伟达推出Llama Nemotron:三款语言模型满足不同需求
在人工智能的浪潮中,英伟达再次迈出了重要的一步,推出了全新的Llama Nemotron语言基础模型。这个模型分为三大类别:Nano、Super和Ultra,旨在满足不同用户的需求,从初学者到专家,无论是语言翻译、文本生成,还是互动问答,这个模型都能游刃有余。
9 天
Meta陷盗版数据风波,LLama模型遭作家指控,内部文件保密请求被拒
在加利福尼亚联邦法院近期公开的庭审文件中,一起涉及me ta Platforms的版权纠纷案再次引发了广泛关注。该案源于一群作家对me ta在训练其Llama AI模型时,涉嫌未经授权使用盗版电子书和文章数据集的指控。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈