DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
好消息啊,兄弟们!来自东方的神秘力量的 DeepSeek继续轰动世界,韩国分析师撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。” ...
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),其最多只能实现以算法的方式来高效利用硬件层面的加速。
“AMD偷袭英伟达!价格屠夫VS生态霸主,AI芯片大战谁赢?”朋友们,最近AMD发布了Deepseek在7900XTX ...
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬体整合技术「统一计算架构」(CUDA)这道AI技术护城河,这种用新的演算法高效利用硬体层面加速,能提高模型效果。只要有足够擅长写PTX语言的内部开发者 ...
该行业正在从以训练为主的重点转向推理阶段,在这个阶段,现实世界的应用和货币化都会发生。如果 GPU 训练需求趋于平稳,那么多元化的半导体生态系统仍然存在重大机会。 尽管,超大规模企业和企业可以将重点转移到利用现有的 AI ...
快科技2月2日消息,DeepSeek横空出世,让美国硅谷感受到了前所未有的压力。甚至那些平时对AI毫不关心的人,也感受到了来自中国AI的震撼。
北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。同一时段内,亚马逊和微软也接入了DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
最新的爆料显示,英伟达预计将会在3月发布RTX 5060 Ti和RTX 5060两款显卡。 英伟达在CES 2025上已经发布新一代基于Blackwell架构的GeForce RTX 50系列游戏显卡。首批产品包括了RTX 5090、RTX 5090 ...
分别问了ds,豆包,夸克同一个问题,ai的护城河是什么?夸克竟然给了我最大的惊喜。简明扼要不说,竟然是惟一有批判性思维的回答,惟一关联出英伟达和其CUDA生态的回答。