DeepSeek 的创始人梁文峰出生于 1985 年,17 岁考入浙江大学,拥有信息与电子工程学硕士学位。2023 年,梁文锋宣布进军通用人工智能(AGI)领域,创办了 DeepSeek,致力于开发真正人类级别的人工智能。 DeepSeek ...
字节跳动旗下豆包大模型 1.5 Pro 正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。 1 月 22 日消息,字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型 ...
全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。 目前,Doubao-1.5-pro 已在豆包 App 灰度上线,同时开发者也可在火山引擎直接调用 API 。 据字节跳动官方介绍,豆包大模型 1.5 Pro ...
参数从小到大分别为 1.5B、7B、8B、14B、32B 以及 70B。其中蒸馏过的 R1 32B 和 70B 模型在性能方面不仅超过了 GPT-4o、Claude 3.5 Sonnet 和 QwQ-32B,甚至比肩 o1 ...
品玩1月21日讯,据月之暗面消息,月之暗面正式发布 Kimi 全新 SOTA 模型:k1.5 多模态思考模型;同时 Kimi 首次公开模型训练技术报告。 据官方介绍,从基准测试成绩看,k1.5 多模态思考模型实现了 SOTA(state-of-the-art)级别的多模态推理和通用推理能力。在 short-CoT 模式下,Kimi k1.5 的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内 ...