Gpt 4 - 搜索 News

18 小时

深度求索的创始人梁文锋在金融领域已享有盛誉，他与团队的实力使得DeepSeek能够在短时间内实现如此成本低廉的训练。根据数据显示，全球领先的AI公司通常需要超过1.6万张GPU才能完成类似规模的模型训练。这一差异不仅在计算资源上有着明显的标签，更在经济成本上展现了深度求索的创新能力与前瞻性。这对于其他科技创业企业及投资者来说，意味着进入AI市场的门槛大幅降低，也为初创企业带来了实现AI技术商业化的 ...

6 天on MSN

AI“短板”暴露：研究发现 GPT-4 Turbo 回答高级历史题准确率仅 46%

研究结果于上月在知名 AI 会议 NeurIPS 上公布，结果显示，即使是表现最佳的 GPT-4 Turbo 模型，其准确率也仅为 46%，并不比随机猜测高多少。论文合著者、伦敦大学学院计算机科学副教授 Maria del ...

3 天

北京大学推出Aligner：无需RLHF即可提升GPT-4性能的革命性技术

在2024年的NeurIPS会议上，北京大学的研究团队提出了一种创新的对齐技术，被称为Aligner。这种新方法不再依赖复杂的人类反馈强化学习（RLHF）流程，能够显著提高包括GPT-4在内的大型语言模型（LLM）的表现。Aligner的核心在于学习对齐答案与未对齐答案之间的修正残差，使得对齐过程更加高效和简便。这一技术的出现为AI道德和安全性问题提供了一种潜在的解决方案，标志着大语言模型对齐领域 ...

SBS1 年

简单听懂：升级到GPT-4的Chat GPT到底哪里变了？为何震撼许多人？

SHANGHAI, CHINA - MARCH 15, 2023 - A young man visits and tries out OpenAi's new GPT-4 in Shanghai, China, March 15, 2023. On March 14 Eastern time, OpenAI officially announced the launch of the ...

3 天

中国联通发布元景思维链大模型：性能超越GPT-4o 比肩OpenAI o1

元景思维链大模型作为中国联通推出的业界首款央企开源通用思维链大模型，展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考，还显著降低了资源消耗，展现出卓越的性能表现。

7 天

小红书翻译功能用了GPT-4？评论区输入指令，点翻译出答案

三言科技 1月20日消息，日前，小红书上线了翻译功能，点击笔记或评论旁边的“翻译”按钮，即查看翻译内容。不过，有网友发现，小红书的翻译功能疑似是用GPT-4完成的，在评论区输入指令，点击翻译就会出来答案。

12 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

2024 年 4 月，Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下，并超越了 Mistral 的开源模型。然而，Meta 用于训练模型的数据 —— ...

腾讯网25 天

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

2024年，我们居然进步这么大。刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内 ...

12 天

Meta 高层痴迷于超越 GPT-4，训练数据面临版权风波！

微软研究院开源了目前最强小参数模型——phi-4。去年12月12日，微软首次展示了phi-4，参数只有140亿性能却极强，在GPQA研究生水平、MATH数学基准测试中，超过了OpenAI的GPT-4o，也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中，phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-In ...

来自MSN9 个月

GPT-4化身黑客，网络安全新威胁？

他们成功地设计了一个黑客智能体框架，并在该框架内测试了包括GPT-4在内的10个模型。令人惊讶的是，只有GPT-4能够在阅读CVE漏洞描述后，有效地 ...

12 天on MSN

讯飞星火4.0 Turbo全面升级，数学与代码能力能否真的超越GPT-4？

科大讯飞在人工智能领域迈出了重要一步，其最新发布的讯飞星火4.0 Turbo版本，在七大核心功能上实现了全面突破，甚至在某些方面超越了备受瞩目的GPT-4 Turbo。讯飞星火4.0 ...

11 小时on MSN

阿里云通义开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

1月27日凌晨，阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型，推出7B及14B两个尺寸，均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架，在处理百万级别长文本输入时可实现近7倍的提速。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果