搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
18 小时
突破性技术:DeepSeek训练成本仅为GPT-4的二十分之一
深度求索的创始人梁文锋在金融领域已享有盛誉,他与团队的实力使得DeepSeek能够在短时间内实现如此成本低廉的训练。根据数据显示,全球领先的AI公司通常需要超过1.6万张GPU才能完成类似规模的模型训练。这一差异不仅在计算资源上有着明显的标签,更在经济成本上展现了深度求索的创新能力与前瞻性。这对于其他科技创业企业及投资者来说,意味着进入AI市场的门槛大幅降低,也为初创企业带来了实现AI技术商业化的 ...
6 天
on MSN
AI“短板”暴露:研究发现 GPT-4 Turbo 回答高级历史题准确率仅 46%
研究结果于上月在知名 AI 会议 NeurIPS 上公布,结果显示, 即使是表现最佳的 GPT-4 Turbo 模型,其准确率也仅为 46%,并不比随机猜测高多少。 论文合著者、伦敦大学学院计算机科学副教授 Maria del ...
3 天
北京大学推出Aligner:无需RLHF即可提升GPT-4性能的革命性技术
在2024年的NeurIPS会议上,北京大学的研究团队提出了一种创新的对齐技术,被称为Aligner。这种新方法不再依赖复杂的人类反馈强化学习(RLHF)流程,能够显著提高包括GPT-4在内的大型语言模型(LLM)的表现。Aligner的核心在于学习对齐答案与未对齐答案之间的修正残差,使得对齐过程更加高效和简便。这一技术的出现为AI道德和安全性问题提供了一种潜在的解决方案,标志着大语言模型对齐领域 ...
SBS
1 年
简单听懂:升级到GPT-4的Chat GPT到底哪里变了?为何震撼许多人?
SHANGHAI, CHINA - MARCH 15, 2023 - A young man visits and tries out OpenAi's new GPT-4 in Shanghai, China, March 15, 2023. On March 14 Eastern time, OpenAI officially announced the launch of the ...
3 天
中国联通发布元景思维链大模型:性能超越GPT-4o 比肩OpenAI o1
元景思维链大模型作为中国联通推出的业界 首款 央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考,还显著降低了资源消耗,展现出卓越的性能表现。
7 天
小红书翻译功能用了GPT-4?评论区输入指令,点翻译出答案
三言科技 1月20日消息,日前,小红书上线了翻译功能,点击笔记或评论旁边的“翻译”按钮,即查看翻译内容。 不过,有网友发现,小红书的翻译功能疑似是用GPT-4完成的,在评论区输入指令,点击翻译就会出来答案。
12 天
为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
2024 年 4 月,Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下,并超越了 Mistral 的开源模型。然而,Meta 用于训练模型的数据 —— ...
腾讯网
25 天
全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘
2024年,我们居然进步这么大。 刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内 ...
12 天
Meta 高层痴迷于超越 GPT-4,训练数据面临版权风波!
微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-In ...
来自MSN
9 个月
GPT-4化身黑客,网络安全新威胁?
他们成功地设计了一个黑客智能体框架,并在该框架内测试了包括GPT-4在内的10个模型。令人惊讶的是,只有GPT-4能够在阅读CVE漏洞描述后,有效地 ...
12 天
on MSN
讯飞星火4.0 Turbo全面升级,数学与代码能力能否真的超越GPT-4?
科大讯飞在人工智能领域迈出了重要一步,其最新发布的讯飞星火4.0 Turbo版本,在七大核心功能上实现了全面突破,甚至在某些方面超越了备受瞩目的GPT-4 Turbo。 讯飞星火4.0 ...
11 小时
on MSN
阿里云通义开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈