Stock MOE Latest - 搜索 News

3 天

3月10日，字节跳动豆包大模型团队发布针对MoE架构的通信优化系统COMET，旨在通过细粒度计算-通信重叠技术优化大模型训练。COMET已应用于万卡级生产集群，累计节省数百万GPU小时资源。随着DeepSeek等公司开源热潮兴起，更多大模型玩家也纷纷跟进，以扩大市场份额、构建生态系统并提升品牌形象。

证券之星3 天

科大讯飞联合华为率先实现国产算力大规模跨节点专家并行集群推理

人民财讯3月11日电，记者获悉，近日，科大讯飞携手华为在国产算力领域取得重大进展，双方联合团队率先突破国产算力集群上MoE模型的大规模跨节点专家并行集群推理，这是继DeepSeek公布其MoE模型训练推理方案后，业界首个基于国产算力的全新解决方案。

财联社 on MSN3 天

【明日主题前瞻】字节攻克MoE关键瓶颈，训练成本节省40%

据媒体报道，字节豆包大模型团队官宣开源一项针对MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万GPU小时训练算力。

4 天

字节攻克MoE关键瓶颈，训练成本节省40%

3月10日，字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万GPU小时训练算力。(e公司) ...

Regina Leader Post on MSN8 天

Saskatchewan Premier Scott Moe announces provincial response to Trump's tariffs

Saskatchewan Premier Scott Moe announced a raft of responses to U.S. President Donald Trump’s tariffs on Wednesday — a day ...

4 天

字节攻克MoE架构关键瓶颈训练成本节省40%

格隆汇3月10日｜字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万GPU小时训练算力。

证券之星1 个月

豆包提出全新稀疏架构推理成本较MoE最高可降83%

近期，字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2—6倍 ...

Prince Albert Daily Herald7 天

Moe announces Saskatchewan tariff response

Premier says province asking contractors to cut all American content used in government builds, will stop SLGA from buys and ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果