Torch - 搜索 News

PyTorch Profiler 性能优化示例：定位 TorchMetrics 指标收集瓶颈，优化代码 ...

在本文中，我们探讨了 TorchMetrics 的简单用法如何引入 CPU-GPU 同步事件，并显著降低 PyTorch 训练性能。通过使用 PyTorch Profiler，我们识别了导致这些同步事件的代码行，并应用了有针对性的优化来消除它们： ...

西部网6 天

China's Olympic champions carry torch for Asian Winter Games

HARBIN, Feb. 3 (Xinhua) -- China's Olympic champions, including Sheng Lihao, Wu Dajing, and Sui Wenjing, participated in the ...

SHINE6 天

Torch relay of 9th Asian Winter Games held in Harbin

With 120 torchbearers participating, the torch relay for the 9th Asian Winter Games was held Monday in Harbin. The ...

14 小时

Yann LeCun的激进观点遭遇AI界集体反击：深度学习的未来在哪？

近日，Meta首席AI科学家Yann LeCun发表了一场颇具争议的演讲，他在演讲PPT上写下让AI行业震惊的话语："放弃生成模型、放弃对比学习、放弃强化学习"。这一激进的主张引发了AI圈的广泛讨论，甚至遭遇到来自行业同仁的群嘲。曾经对深度学习革命做出杰出贡献的LeCun，如今却似乎处于风口浪尖，面对着来自不同阵营的质疑和讽刺。

腾讯网7 天

PyTorch生态系统中的连续深度学习：使用Torchdyn实现连续时间神经网络

点击上方“Deephub Imba”,关注公众号,好文章不错过 !神经常微分方程（Neural ODEs）是深度学习领域的创新性模型架构，它将神经网络的离散变换扩展为连续时间动力系统。与传统神经网络将层表示为离散变换不同，Neural ...

SHINE7 天

9th Asian Winter Games torch relay set to begin on Monday

The ninth Asian Winter Games will take place in Harbin from February 7 to 14. Over 1,270 athletes from 34 countries and ...

亿欧数据 on MSN14 小时

医疗健康领域投融资周报（2月3日-2月9日）：世之源获得6000万人民币 ...

据亿欧数据统计，上周（2025年2月3日-2025年2月9日）共披露99起投融资事件，涉及33家国内企业，66家国外企业，融资总额约929.14亿元。数量TOP1为消费领域，金额TOP1为企业服务领域。

美国之音3 天

孟加拉国抗议者纵火焚烧遭罢免总理谢赫·哈西娜父亲的故居

数千名抗议者于星期三(2月5日)纵火焚烧了孟加拉国开国领袖谢赫·穆吉布·拉赫曼(Sheikh Mujibur Rahman)的故居，他的女儿、遭罢免的前总理谢赫·哈西娜(Sheikh ...

西部网2 天

AADTHU design team reveals story behind Asian Winter Games' lilac-shaped cauldron and more

The torch tower was designed by teachers and students from the Academy of Arts & Design, Tsinghua University (AADTHU). The ...

14 小时

Yann LeCun「炸锅」言论背后的AI路线之争：反向指标还是先见之明？

近日，Meta首席AI科学家Yann LeCun在一场公开演讲中提出的激进观点引发了AI圈的轩然大波。这位深度学习领域的先驱，在PPT上写下「放弃生成模型、放弃对比学习、放弃强化学习」时，整个AI界仿佛按下了暂停键，陷入了集体思考。

BBRTV北部湾在线2 天

Asian Winter Games opens in China's "Ice City"

Torch bearer Zhang Hong lights the cauldron at the Harbin Ice and Snow World Park during the opening ceremony, Feb. 7, 2025. ...

3 天

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1） ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果