最近一短时间以来,被国内一家AI大模型初创公司DeepSeek刷屏了。短短几个月内,DeepSeek推出的两款开源大语言模型——DeepSeek-V3和DeepSeek-R1,不仅在多个关键性能指标上与世界*大模型,如Meta的Llama ...
芯东西(公众号:aichip001) 作者 | ZeR0 编辑 | 漠影 芯东西2月10日报道,中国证监局官网显示,上海GPU企业格兰菲智能科技股份有限公司(简称“格兰菲”)已在上海证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为海通证券。
在GPU加速国产替代的浪潮下,风华创智公司推出的国产算力之星“风华GPU”已完成与DeepSeek-R1-Distill-Qwen系列大模型完成深度适配,实现了从芯片硬件、驱动层软件到应用框架层的垂直系统性优化,推理流畅,为行业提供安全可控、高性价比 ...
随着DeepSeek-V3的发布,AMD 将继续借助ROCm开源生态与 DeepSeek推动创新。AMD AI开源策略将确保开发者能够从 Day-0 开始使用基于 AMD数据中心GPU 的 DeepSeek模型,通过更广泛的 GPU 硬件选择和开放的 ROCm™软件栈, 以同时实现优化性能及可扩展性。AMD 将继续借助 CK-tile 内核优化等方式实现 ...
在本文中,我们探讨了 TorchMetrics 的简单用法如何引入 CPU-GPU 同步事件,并显著降低 PyTorch 训练性能。通过使用 PyTorch Profiler,我们识别了导致这些同步事件的代码行,并应用了有针对性的优化来消除它们: ...
在科技的浪潮中,深圳北理莫斯科大学最近的一项突破性研究引起了广泛关注。该科研团队开发了一种新的基于图形处理器(GPU)并行的快速近场动力学算法,让普通家用GPU的计算效率大幅提升,竟然实现了高达800倍的计算速度。这一创新不仅为科研人员提供了更为高效的工具,也为国产工业软件的自主研发增添了新的动力。
总之,江苏电信与DeepSeek的合作,不仅仅是一场技术展示,更是一场关于未来智能科技的探索。邀请所有科技爱好者、创业者和在校学生积极参与这次活动,共同探讨AI的潜在机遇和前景,开启智能时代的新篇章。在AI应用迅速普及的今天,让我们一起在深度融合中, ...
近日,美国半导体巨头AMD的股价遭遇了显著下滑,特别是在2月7日,其股价下跌了2.36%,并触及了自2023年11月以来的最低价位。这一表现与半导体行业的整体趋势形成了鲜明对比。
近日,想必诸多用户都怀揣着这样的疑惑:我的手机为何频频推送关于DeepSeek的资讯?这 DeepSeek 究竟是什么?它又为何能在问世之际,就引发如此热烈的关注与轰动?
2月4日,国产全功能GPU创新企业摩尔线程宣布,实现了对 DeepSeek 蒸馏模型推理服务的部署。通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理。
据报道,知名板卡大厂华擎(ASRock)近日透露,为应对美国最近对中国大陆进口商品征收10%关税的措施,他们计划将位于中国深圳的部分显卡及其他产品产能迁出中国大陆。 新关税包括电子产品和计算机硬件在内的必需品,这些产品价格预计将大幅上涨。
板卡大厂华擎披露,迫于美国特朗普政府的压力,他们将不得不把部分产能从中国搬出。华擎表示,由于美国政府加征10%关税的影响,他们需要花一些时间将原本位于中国深圳的部分显卡和其他产品的产能转移到其他国家。