在美国方面对deepseek不断质疑之时,美国芯片巨头Intel表态支持deepseek,指出它开发的AI芯片/GPU芯片可以支持deepseek,这意味着Intel有意与中国芯片合作打破AI芯片龙头NVIDIA打造的生态垄断,这对中国芯片来说无疑相 ...
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬体整合技术「统一计算架构」(CUDA)这道AI技术护城河,这种用新的演算法高效利用硬体层面加速,能提高模型效果。只要有足够擅长写PTX语言的内部开发者 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),其最多只能实现以算法的方式来高效利用硬件层面的加速。
“AMD偷袭英伟达!价格屠夫VS生态霸主,AI芯片大战谁赢?”朋友们,最近AMD发布了Deepseek在7900XTX ...
黄仁勋盛赞中国程序员:“CUDA难得要死,中国区却有150万人会用!”#英伟达回应DeepSeek横空出世##英伟达大赞deepseek# ...
好消息啊,兄弟们!来自东方的神秘力量的 DeepSeek继续轰动世界,韩国分析师撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。” ...
北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。同一时段内,亚马逊和微软也接入了DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
英伟达最新发布的 Blackwell GPU 架构白皮书,揭示了 GeForce RTX 50 系列显卡的先进技术细节。其中最值得注意的是,Blackwell 架构中的所有单精度 CUDA 核心同时支持 FP32 / INT32 数据类型,这一设计回到了九年前的 Pascal 架构时代。
韩国媒体 Quasarzone 制作了 RTX 20 / 30 / 40 / 50 系列的 CUDA Core 对比表格,发现 RTX 50 系列的 90 与 80 型号之间差距实在太大了,RTX 5080 只拥有完整 Blackwell GB202 ...
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI 英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力? 硬件媒体Tom‘s Hardware带来开年最新热议: ...