transformers - 搜索 News

基于视觉 Transformer 与 Grad-CAM 可解释 AI 的胸部 X 光片肺结核检测新突破

为解决肺结核精准诊断难题，研究人员开展基于视觉 Transformer（ViT）和 Grad-CAM 的研究，结果显示诊断准确率高，有助于临床应用。为了攻克这些难题，来自印度和埃塞俄比亚等多个机构的研究人员展开了深入研究。他们将研究成果发表在《BMC Medical Imaging》上。这项研究旨在利用视觉 Transformer（Vision ...

2 天

腾讯混元、英伟达都发混合架构模型，Mamba-Transformer要崛起吗？

上周五，腾讯宣布推出自研深度思考模型「混元 T1」正式版，这是一个能秒回、吐字快、擅长超长文处理的强推理模型。而之所以具备这些优势，很大程度上是因为腾讯采用了 Hybrid-Mamba-Transformer 融合架构。这一架构有效降低了传统 ...

腾讯网2 天

RWKV-7 引入广义 Delta Rule，表达力超越 Transformer

RWKV-7 通过一系列创新（例如广义 Delta Rule），在计算效率、任务表现和模型表达力全面超越 Transformer 和过去的 RWKV-6 架构。在训练数据远低于 Qwen2.5、Llama3.2 ...

3 天

「注意力实际上是对数的」？七年前的Transformer还有新发现，Karpathy点赞

事实上，由于注意力至少需要将 QK^T 部分实体化（通常是非常大的整数，非常大的整数），这几乎肯定会溢出二级缓存（这要么迫使你在内存中计算的速度慢于 OOM，要么迫使你通过将 QK^T 矩阵分片为部分关联块并传入 softmax 来将其转化为顺序问题）。

7 天

探索彼得库伦：揭示擎天柱灵魂配音背后的故事

探索彼得库伦：揭示擎天柱灵魂配音背后的故事引言在变形金刚的世界里，有一个名字如雷贯耳，那就是彼得库伦（Peter Cullen）。他的声音为擎天柱这一角色赋予了灵魂和深度，使其成为无数观众心目中的英雄。近年来，随着相关作品的重制和新作的推出，彼得库伦的经典配音再度引起了广泛的讨论和热议。那么，是什么让彼得库伦的配音如此经典？本文将探讨这个问题，揭示其背后鲜为人知的故事和影响。彼得库伦的职业生 ...

知乎专栏 on MSN10 天

添加各种trick训练出来的SigLIP2

这个论文有很多干货，整合了前几年各领域的经典trick，做了很多实验。为了得到一个更好的backbone，把能用到的loss、能添加的辅助任务都用上了： CLIP的图文对比lossLocCa的caption loss类MAE的重建loss ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果