欧洲领先的人工智能公司之一 Mistral AI 推出了一款名为 Mistral Small 3 的新模型。 这是一个包含 240 亿参数的模型,但与 Llama 3.3 70B 和 Qwen 32B 等大型模型相当(至少在 MMLU-Pro ...
在人工智能行业迅速发展的今天,DeepSeek的技术升级从V3到R1被视为一项重要里程碑,这不仅在AI界掀起波澜,也为汽车行业的智能化进程打下了坚实基础。华福证券的分析师杨晓峰指出,DeepSeek的这次进化将帮助更快地追赶GPT-4o和GPT-o1,巩固AI模型在市场中的竞争力。
鞭牛士报道,1月29日消息,据路透社报道,中国科技公司阿里巴巴周三发布了其Qwen 2.5 人工智能模型的新版本,据称该模型超越了备受赞誉的 DeepSeek-V3。 Qwen 2.5-Max 的发布时间比较特殊,正值农历新年的第一天,大多数中国人都下班回家与家人团聚。这意味着中国人工智能初创公司DeepSeek 在过去三周的迅速崛起不仅给海外竞争对手带来了压力,也给国内竞争对手带来了压力。
外媒报道指出,29日正值农历新年期间,大多数中国人仍在休假,阿里云发表Qwen2.5-Max的不寻常时机,显示出中国人工智能(AI)新创公司DeepSeek在过去3周急速崛起,不仅对海外竞争对手造成压力,也使其国内对手压力大增。
春节期间,中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,预训练数据超过20万亿tokens,在多个基准测试中表现优于DeepSeek ...
1月28日凌晨,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能 ...
1 月 27 日凌晨,阿里云通义重磅开源支持 100 万 Tokens 上下文的 Qwen2.5-1M 模型,推出 7B 及 14B 两个尺寸,均在处理长文本任务中稳定超越 GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。
IT之家 1 月 26 日消息,百川智能今日宣布,Baichuan-Omni-1.5 开源全模态模型正式上线。该模型不仅支持文本、图像、音频和视频的全模态理解,还具备 文本和音频的双模态生成能力 。
【财新网】 国内大模型公司 DeepSeek 再次引发美国AI产业界热议。1月20日,国内私募机构 幻方量化 ...
近日,字节跳动正式发布了其最新的豆包大模型1.5Pro,成为业界关注的焦点。这款大模型的推出不仅标志着字节跳动在人工智能领域的进一步突破,更在多个测试基准上表现出色,甚至超越了当前最先进的模型,如GPT-4o和DeepSeek-V3。分析人士指出,豆 ...
特朗普给予TikTok禁令75天宽限期 美国总统特朗普当地时间20日签署行政令,要求短视频社交媒体平台TikTok“不卖就禁用”法律在未来75天内暂不执行。TikTok在美国的部分服务已恢复,但字节跳动旗下的其他热门应用,如数字卡牌游戏《Marvel Snap》、视频编辑应用CapCut以及社交平台Lemon8,在美仍处于封禁状态。
1.面壁智能发布 首个“端侧GPT-40”模型MiniCPM-o 2.6。该模型参数量仅8B,具备类似GPT-40的全模态实时流式视频理解与高级语音对话能力,并支持语音克隆。