transformers - 搜索 News

知乎 on MSN3 小时

FFN在Transformer里面主要是对多头注意力矩阵升维，非线性过滤，然后再降回原来的维度。这个通常的比喻是：FFN就像个人的思考空间—— Attention Layer帮助模型正确的分配注意力，然后FFN 帮助模型仔细的思考，提取更加抽象的特征。这个比喻很好很形象，听到这儿往往会感觉恍然大悟，然后感慨模型设计精妙，唯一的问题是什么实质都没有解释。

腾讯网15 天

具身智能新突破！Physical Intelligence推出机器人动作tokenizer，训练提速5倍

具身智能，是人工智能（AI）行业的下一个浪潮。如何有效训练 Transformers 模型来控制具身机器人，是当前亟需要解决的难题，尤其是对于更复杂、需要精确和高频控制的精巧技能，现有的视觉-语言-动作（VLA）模型几乎失效。尽管扩散或流匹配通常表现得更好，但扩散需要更长的训练时间。那么，如何在保持灵巧性和精确性的同时，快速训练 Transformers 进行机器人控制呢？使用一个好的 toke ...

21 天

山西云时代发布农业土地覆盖时空语义分割专利，开启智慧城市新篇章

2025年1月15日,金融界报道，令人瞩目的消息传来：山西云时代智慧城市技术发展有限公司成功获得了一项名为"一种基于Transformers-MulMLA的农业土地覆盖时空语义分割方法"的专利，授权公告号为CN114998361B，申请日期追溯至2022年6月。这项技术的出现，标志着在农业领域土壤资源管理和监测发挥着革命性作用。

GitHub3 年

一个基于transformers的自定义命名实体识别模型示例

该项目是一个基于transformers的命名实体识别模型。主要目标是提供一个代码示例，展示如果基于transformers提供的功能进行快速的模型开发。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果