近日,中国工程院院士 / 清华大学教授 / 博士生导师郑纬民确认出席 QCon 北京大会发表题为《 关于人工智能大模型的几点思考 》的主题演讲,并将分享 Kimi 幕后的大模型推理架构 Mooncake。
在人工智能技术迅猛发展的今天,如何提升大模型的推理能力已成为行业面临的重要挑战。2025年QCon北京大会上,中国工程院院士郑纬民将围绕人工智能大模型的前沿发展,发表主题演讲,并分享其背后的创新推理架构——Mooncake。该架构不仅凭借其独特的设计理念荣获第23届USENIX文件与存储技术会议的最佳论文奖,更对当前多模态人工智能发展起到了关键性的推动作用。
在人工智能飞速发展的当下,算力资源成为推动各行各业数字化转型的关键动力。依托DeepSeek大模型技术和本地化的算力资源池,重庆移动完成了 DeepSeek全参数版本预置部署,正以全新姿态迎接智算时代。 双中心协同布局 算力性能卓越 ...
在人工智能飞速发展的当下,算力资源成为推动各行各业数字化转型的关键动力。记者3月24日从重庆移动获悉,该公司依托DeepSeek大模型技术和本地化的算力资源池,已完成了DeepSeek全参数版本预置部署,本地算力服务得到全面升级。得益于此,重庆算力资 ...
1、2024年9月23日互动易:公司2024年半年度算力网络业务收入2.25亿,同比增长32.82%。公司持续加大对算力业务的投入,打造国内领先的“算力集群技术服务专家”能力和国内规模领先的智算云服务。
其中,水土算力中心采用了支持400G nvlink直连NVIDIA A800高性能异构加速卡,可支撑深度学习训练及推理等复杂任务需求。永川算力资源池则配置了NVIDIA ...
润建股份智能算力中心 NVIDIA NVLINK H800/NVIDIA NVLINK A800算力服务器近期已正式完成批量上架并交付用户使用 3、根据公司官微介绍:公司专注于涉密及 ...