搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
知乎 on MSN
4 小时
如何理解 Transformers 中 FFNs 的作用?
FFN在Transformer里面主要是对多头注意力矩阵升维,非线性过滤,然后再降回原来的维度。这个通常的比喻是:FFN就像个人的思考空间—— Attention Layer帮助模型正确的分配注意力,然后FFN 帮助模型仔细的思考,提取更加抽象的特征。 这个比喻很好很形象,听到这儿往往会感觉恍然大悟,然后感慨模型设计精妙,唯一的问题是什么实质都没有解释。
11 小时
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
「性能优化是一个无止境的过程,」翟季冬教授表示,在中国面临算力资源挑战的背景下,通过系统软件创新提升算力效能,是产业突围的关键。这不仅需要在编程语言、编译器、通信库、编程框架等多个技术层面发力,更需要建立起完整的基础软件体系。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
今日热点
Suspends parcels from China
Senate confirms Bondi as AG
Wins Senate committee vote
Plans to take over Gaza
RFK Jr. clears Senate panel
Arrested on multiple charges
Offers to jail US criminals
Sued by former nanny
Announces death of mother
EPA warns employees
Neo-Nazi leader convicted
Spiritual leader dies
Atmospheric river slams CA
Microplastics found in brains
Sweden school shooting
Baby elephant at OR Zoo
Confirmed as VA secretary
US begins migrant flights
‘Squid Game' actress dies
US, Philippines joint patrol
Sued for discrimination
Key Bridge design unveiled
Inks deal with SK’s Kakao
To launch streaming service
Mimics moon’s gravity
Accused attacker faces trial
FBI agents sue DOJ
Adds surcharge to eggs
FSU coach stepping down
To cut up to 7,000 jobs
US job openings fall
反馈