36氪获悉,1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。
人工智能在教育领域的应用正在迅速发展。一项针对尼日利亚学生的研究表明,使用 AI 辅导仅 6 周就能带来相当于 2 年的学习进步。AI ...
那么,DeepSeek为何会一夜之间吸引如此多的关注呢?据天眼查信息,该应用由成立于2023年的杭州深度求索人工智能基础技术研究有限公司开发。公司掌门人梁文锋在金融界颇有名气,其创办的幻方量化为国内量化私募的顶尖企业之一。
目前,DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型,下载量达10.9万次,这意味着全球的开发人员正在试图了解这一模型以辅助他们自己的AI开发。DeepSeek的服务器也于26日出现了局部服务波动。这一问题在数分钟内得到解决,或与新模型发布后的访问量激增有关。
最近,有博主心血来潮,让新时代AI大拿豆包和chatGPT进行了一场,以两者中谁才是人工智障为主题的辩论赛。 两位AI大拿互怼的画面实在太搞笑了。GPT一上来就是脱口秀演员般的神奇输出。 面对GPT的一顿输出,豆包琢磨了半天,只崩出三句话不到二十个字 ...
在参加总理会议的同一天,DeepSeek在官微上,发布了DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
上海人工智能科技公司MiniMax日前发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架 ...
周末疯狂刷屏,来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈!