搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
搜索
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
知乎 on MSN
2 小时
如何理解 Transformers 中 FFNs 的作用?
FFN在Transformer里面主要是对多头注意力矩阵升维,非线性过滤,然后再降回原来的维度。这个通常的比喻是:FFN就像个人的思考空间—— Attention Layer帮助模型正确的分配注意力,然后FFN 帮助模型仔细的思考,提取更加抽象的特征。 这个比喻很好很形象,听到这儿往往会感觉恍然大悟,然后感慨模型设计精妙,唯一的问题是什么实质都没有解释。
3 天
ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础 ...
在这项工作中,作者提出了一种极性感知线性注意力(PolaFormer)机制,旨在通过纳入被忽略的负交互作用来解决先前线性注意力模型的局限性。与此同时,为了解决线性注意力中常见的注意力权重分布信息熵过高的问题,他们提供了数学理论基础,表明如果一个逐元素 ...
20 天
MiniMax发布并开源新一代01系列模型,助推Agent时代来临
在全球人工智能技术快速发展的背景下,今天,MiniMax公司宣布发布并开源其全新系列模型——MiniMax-01,涵盖两个重大模型,分别是基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。这一系列模型的推出,不 ...
21 天
山西云时代发布农业土地覆盖时空语义分割专利,开启智慧城市新篇章
2025年1月15日,金融界报道,令人瞩目的消息传来:山西云时代智慧城市技术发展有限公司成功获得了一项名为"一种基于Transformers-MulMLA的农业土地覆盖时空语义分割方法"的专利,授权公告号为CN114998361B,申请日期追溯至2022年6月。这项技术的出现,标志着在农业领域土壤资源管理和监测发挥着革命性作用。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈