5 天
小熊财经 on MSN字节豆包大模型团队官宣:MoE架构优化技术,训练效率翻倍,成本大 ...近日,字节跳动旗下的豆包大模型团队宣布了一项针对混合专家(MoE)架构的重要技术突破,并宣布将此关键技术优化方案开源。据官方介绍,这项技术能显著提升大模型的训练效率,最高可达1.7倍,同时降低训练成本40%。
5 天on MSN
对于此次开源的决定,豆包大模型团队希望通过分享这一技术,推动整个AI社区在模型训练效率方面的共同进步。 开源不仅有助于加速行业技术发展,还能为更多研究者和开发者提供宝贵的资源,进一步推动人工智能技术的创新与应用。
字节跳动对DeepSeek的态度并不完全服气,尽管同行都在积极接入DeepSeek以获取流量,但字节跳动却表现得十分克制。它只将旗下非核心产品如悟空浏览器、即梦等To ...
综合IT之家和快科技星期一(3月10日)报道,上述团队宣布开源混合专家模型(MoE)架构的关键优化技术。此技术通过一系列创新方法,将大模型的训练效率提升约1.7倍,同时也将训练成本降低40%。
字节之所以能在两年间跻身大模型企业顶流,关键还是张一鸣所信奉的“大力出奇迹”,确定目标后就凶猛砸钱,大手笔投流。有数据统计,仅2024年,豆包在投流上的花费就超过10亿元,其成果就是斩获当年国内用户规模最大的AI应用头衔。其他字节系主要AI应用,也基 ...
5 天on MSN
在AI助手市场的激烈竞争中,腾讯元宝与字节豆包两大产品近期的动向备受瞩目。腾讯元宝,这款在2024年5月才正式亮相的产品,近期凭借接入DeepSeek-R1满血版,迅速攀升至中国区App Store免费榜榜首,其迅猛的崛起势头令人瞩目。
值得注意的是,在这五个榜单中,字节跳动成为中国唯一一家上榜的公司。 字节跳动豆包大模型团队于近日提出超连接(HyperConnections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重 ...
5 天
小熊财经 on MSN腾讯元宝借DeepSeek登顶,字节豆包为何坚守自研路?在AI助手市场的激烈竞争中,腾讯元宝与字节豆包两大产品近期成为了焦点。腾讯元宝,这款在2024年5月才正式亮相的AI助手,在接入DeepSeek-R1满血版后,迅速攀升至中国区App Store免费榜榜首,其崛起速度令人瞩目。
IT之家 3 月 12 日消息,今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、后训练 RLHF 全流程,针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。
3月10日,字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。 据悉,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。 入选顶级会议MLSys 2025 据了解,MoE是当前大模型的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果