据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬体整合技术「统一计算架构」(CUDA)这道AI技术护城河,这种用新的演算法高效利用硬体层面加速,能提高模型效果。只要有足够擅长写PTX语言的内部开发者 ...
没有西方的禁令与铺天盖地的报道、分析、解读,南生根本都不知道我国还有个DeepSeek大模型,而且很厉害 。据说这个AI软件的成本只有美国同类型软件的数十分之一,甚至是百分之一,在成本差距极大的背景下,居然性能很接近。
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),其最多只能实现以算法的方式来高效利用硬件层面的加速。
“AMD偷袭英伟达!价格屠夫VS生态霸主,AI芯片大战谁赢?”朋友们,最近AMD发布了Deepseek在7900XTX ...
黄仁勋盛赞中国程序员:“CUDA难得要死,中国区却有150万人会用!”#英伟达回应DeepSeek横空出世##英伟达大赞deepseek# ...
好消息啊,兄弟们!来自东方的神秘力量的 DeepSeek继续轰动世界,韩国分析师撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。” ...
北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。同一时段内,亚马逊和微软也接入了DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
韩国媒体 Quasarzone 制作了 RTX 20 / 30 / 40 / 50 系列的 CUDA Core 对比表格,发现 RTX 50 系列的 90 与 80 型号之间差距实在太大了,RTX 5080 只拥有完整 Blackwell GB202 ...
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI 英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力? 硬件媒体Tom‘s Hardware带来开年最新热议: ...