研究结果于上月在知名 AI 会议 NeurIPS 上公布,结果显示, 即使是表现最佳的 GPT-4 Turbo 模型,其准确率也仅为 46%,并不比随机猜测高多少。 论文合著者、伦敦大学学院计算机科学副教授 Maria del ...
在人工智能的快速发展中,近日迎来了一个震撼行业的大新闻——名为DeepSeek-R1-Distill-Qwen-1.5B的开源模型,以其出色的表现战胜了重量级对手GPT-4和Claude 3.5。这场胜利不仅是在数学挑战赛AIME测试中的高分,更是在技术创新上引发的广泛关注。让我们深入了解这个小模型的潜力以及背后的技术秘密。 首先,什么是DeepSeek-R1-Distill-Qwen-1.5B?
SHANGHAI, CHINA - MARCH 15, 2023 - A young man visits and tries out OpenAi's new GPT-4 in Shanghai, China, March 15, 2023. On March 14 Eastern time, OpenAI officially announced the launch of the ...
三言科技 1月20日消息,日前,小红书上线了翻译功能,点击笔记或评论旁边的“翻译”按钮,即查看翻译内容。 不过,有网友发现,小红书的翻译功能疑似是用GPT-4完成的,在评论区输入指令,点击翻译就会出来答案。
随着Meta在开发Llama3的过程中遭遇的激烈竞争,其使用的训练数据也开始引发法律争议。检察官指控,Meta的高管在激烈追赶AI开发进度时,可能偷工减料并使用了受版权保护的书籍作为训练数据。
未来AI技术的进步可能会越来越不透明,真正的突破可能发生在公众视线之外。通过“蒸馏”技术,用强大、昂贵模型生成数据来提升略弱但更便宜的模型,或许正成为AI公司的普遍运作模式。
微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-In ...
号称最强端侧GPT-4o,面壁李大海的野心是给每个设备装上“端侧大脑”,李大海,gpt-4,面壁,翻译,端侧,模态 ...
2024 年 4 月,Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下,并超越了 Mistral 的开源模型。然而,Meta 用于训练模型的数据 —— ...
2024年,我们居然进步这么大。 刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内 ...
科大讯飞在人工智能领域迈出了重要一步,其最新发布的讯飞星火4.0 Turbo版本,在七大核心功能上实现了全面突破,甚至在某些方面超越了备受瞩目的GPT-4 Turbo。 讯飞星火4.0 ...