2023年,OpenAI的ChatGPT像一阵旋风,短短时间内用户突破1亿,比Web 2.0时代的任何产品都跑得快。从那以后,智能模型层出不穷,Anthropic、Cohere、IBM、Google、Amazon、Meta AI、DeepSeek、HuggingFace等名字纷纷冒头,还有无数初创公司挤进这场AI盛宴。如今真是学习新技能的 ...
近期,国产AI大模型的显著进步引发全球关注。大模型会怎样改变我们的生活?微观层面,我们可以向大模型提问获取答案 ...
IT之家3 月 3 日消息,今日,国家网络安全通报中心发布关于大模型工具 Ollama 存在安全风险的情况通报,IT之家附内容如下: 据清华大学网络空间测绘联合研究中心分析,开源跨平台大模型工具 Ollama 默认配置存在未授权访问与模型窃取等安全隐患。鉴于目前 ...
IT之家3 月 11 日消息,随着 DeepSeek R1 的推出,强化学习在大模型领域的潜力被进一步挖掘。Reinforcement Learning with Verifiable Reward(RLVR)方法的出现,为多模态任务提供了全新的优化思路,无论是几何推理、视觉计数,还是经典图像分类和物体检测任务,RLVR 都展现 ...
上一篇文章我们主要讲了为什么选择以及选什么本地大模型。但是选择什么模型其实受到设备的制约,如果你还没有入手一台合适的设备,那么反过来还可以通过需求出发帮助选购合适的产品。 首先需要声明的是: 本文创作于 2024 年底,由于相关生态在 ...
随着大模型在行业的落地,大模型逐步成为数智化系统的关键基础设施,其潜在的主体地位和应用广度,也带来了新的安全 ...
在优质医疗资源稀缺的背景下,AI大模型的介入无疑正在改变传统的行业竞争格局和医患关系。 本月以来,多地公立和私立医院纷纷官宣接入DeepSeek并开启本地化部署,瑞金、中山、协和等头部大三甲医院接踵发布医疗垂直领域的大模型。而DeepSeek的开源路径 ...
自2025年年初中国深度求索公司(DeepSeek)的开源模型引起全球关注后,阿里巴巴、百度、字节跳动等多家中国公司的人工智能(AI)模型也纷纷加入 ...
一、国内大模型发展趋势|2月份解读国内大模型步入“开源盛世”? DeepSeek在2月24日至28日密集开源FlashMLA、DeepEP、DeepGEMM等核心模块,覆盖模型训练 ...
在生成式AI进入全球视野的第四年,大模型竞赛在2025年正式进入下半场,下半场考验的能力从模型训练转向工程能力。 或者说,工程实践能力推动的大模型应用落地,在这时成了继模型训练后的第二战场。 在这一新战场,模型推理的重要性开始凸显,“模型 ...
今天,“好东西”来了。智元机器人刚刚发布了首个通用具身基座模型——智元启元大模型(Genie Operator-1),该模型框架由VLM(多模态大模型 ...