Llama - 搜索 News

2 小时

罕见！Meta签约100亿美元投资Databricks，Databricks创始人：一年之后上市 ...

众所周知，Meta 在人工智能领域扮演着重要角色，Llama 作为大模型界的 Linux，许多商业公司都建立在其之上，数据分析软件公司 Databricks 也不例外，也是基于此模型构建的。Databricks 联合创始人兼首席执行官 Ali Ghodsi 在本周的一次采访中表示，Databricks 与 Meta 的 Llama 团队合作密切。

1 小时

颠覆LLM格局！AI2新模型OLMo2，训练过程全公开，数据架构双升级

在预训练阶段，OLMo 2通过多种技术改进了训练稳定性，例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增，从而提高了最终模型的性能。

9 天

Meta动力十足，Llama 3力争超越GPT-4！

为了提升Llama ...

9 天on MSN

Meta陷盗版数据风波，LLama模型遭作家指控，内部文件保密请求被拒

在加利福尼亚联邦法院近期公开的庭审文件中，一起涉及meta Platforms的版权纠纷案再次引发了广泛关注。该案源于一群作家对meta在训练其Llama AI模型时，涉嫌未经授权使用盗版电子书和文章数据集的指控。

14 天

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

360 智脑早在 2023 年就开始了长文本大模型的研发，到目前为止已经成功应用于开源并更新了两个版本的 360Zhinao-7B-Chat-360k 模型，以及近日发布的长思维链推理模型 360gpt2-o1。在 360-LLaMA-Factory ...

来自MSN2 小时

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

DeepSeek 开源大模型的阳谋，切切实实震撼着美国 AI 公司。最先陷入恐慌的，似乎是同样推崇开源的 Meta。最近，有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到，国内 AI 创业公司 ...

头部财经9 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

2024 年 4 月，me ta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下，并超越了 Mistral 的开源模型。然而，me ta 用于训练模型的数据 —— ...

8 天

Meta AI争夺战：Llama 3的版权风波与野心

在这一过程中，Meta的AI高管们显露的竞争意识十分明显，在获取Llama模型的训练数据时表现得“相当激进”。一名高管甚至在邮件中坦白：“Llama 3几乎是我唯一关心的项目。”这种激进策略推动了Meta在AI领域的快速前进，但也给它带来了法律上的麻烦。检方指控Meta高管在追求AI模型快速推出的过程中，可能侵犯了多本书籍的版权。Touvron在一封邮件中回顾了用于训练Llama ...

腾讯网4 小时

Databricks 完成 100 亿美元融资轮并筹集 52.5 亿美元债务融资

Databricks 融资的消息最早在 11 月传出。当时预计公司将筹集"至少"50 亿美元。路透社在 12 月中旬报道称这个数字可能超过 95 亿美元，几天后，Databricks 确认正在进行 100 亿美元的 J 轮融资。

GitHub10 天

ProjectD-AI/llama_inference

本项目主要支持基于TencentPretrain的LLaMa模型量化推理以及简单的微服务部署。也可以扩展至其他模型，持续更新中。特性 Int8推理支持bitsandbytes库的int8推理，相比tencentpretrain中的LM推理脚本，加入了Batch推理。优化推理逻辑在Multi-head Attention中加入了key和value的 ...

来自MSN8 天

Meta 破釜沉舟：不惜使用争议数据，Llama 3誓要超越OpenAI GPT-4

Meta破釜沉舟，不惜争议数据，Llama 3誓要超越OpenAI GPT-4。面临法律风险，Meta仍决心破釜沉舟，但需负责任透明数据使用，参与争议解决和沟通。

腾讯网3 小时

雁默：中国技术神出鬼没，美国陷入越战式恐慌

科技战要赢，关键字是“普及”，普及的基础在于“低价”与“开放”。由此看中美科技战，中方基本没有输的理由，因为提升性价比是中国制造的强项。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果