研究结果于上月在知名 AI 会议 NeurIPS 上公布,结果显示, 即使是表现最佳的 GPT-4 Turbo 模型,其准确率也仅为 46%,并不比随机猜测高多少。 论文合著者、伦敦大学学院计算机科学副教授 Maria del ...
在2024年的NeurIPS会议上,北京大学的研究团队提出了一种创新的对齐技术,被称为Aligner。这种新方法不再依赖复杂的人类反馈强化学习(RLHF)流程,能够显著提高包括GPT-4在内的大型语言模型(LLM)的表现。Aligner的核心在于学习对齐答案与未对齐答案之间的修正残差,使得对齐过程更加高效和简便。这一技术的出现为AI道德和安全性问题提供了一种潜在的解决方案,标志着大语言模型对齐领域 ...
引言:2024年,人工智能(AI)领域迎来了令人瞩目的技术突破和市场变化。一年之内,GPT-4这个曾经高高在上的大语言模型(LLM)壁垒被彻底打破,市面上涌现出 dozens of models performance exceedingly surpassing GPT-4. 本文将详细探讨这一现象背后的原因,包括大模型训练成本的显著降低,多模态模型的崛起,以及新的交互方式如何推动整个行业的发展 ...
SHANGHAI, CHINA - MARCH 15, 2023 - A young man visits and tries out OpenAi's new GPT-4 in Shanghai, China, March 15, 2023. On March 14 Eastern time, OpenAI officially announced the launch of the ...
元景思维链大模型作为中国联通推出的业界 首款 央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考,还显著降低了资源消耗,展现出卓越的性能表现。
三言科技 1月20日消息,日前,小红书上线了翻译功能,点击笔记或评论旁边的“翻译”按钮,即查看翻译内容。 不过,有网友发现,小红书的翻译功能疑似是用GPT-4完成的,在评论区输入指令,点击翻译就会出来答案。
号称最强端侧GPT-4o,面壁李大海的野心是给每个设备装上“端侧大脑”,李大海,gpt-4,面壁,翻译,端侧,模态 ...
1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。
2024 年 4 月,Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下,并超越了 Mistral 的开源模型。然而,Meta 用于训练模型的数据 —— ...
微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-In ...
他们成功地设计了一个黑客智能体框架,并在该框架内测试了包括GPT-4在内的10个模型。令人惊讶的是,只有GPT-4能够在阅读CVE漏洞描述后,有效地 ...
品玩1月26日讯,据百川智能官方消息,Baichuan-Omni-1.5 开源全模态模型正式上线。该模型不仅支持文本、图像、音频和视频的全模态理解,还具备文本和音频的双模态生成能力。