3月17日消息,@小米技术官微今日发文称,小米大模型团队在音频推理领域取得突破性进展。受DeepSeek-R1启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以64.5%的SOTA准确率登顶国际权威的MMAU音频理解评测榜首,现同 ...
令人惊喜的是,在仅使用AVQA的3.8万条训练样本的情况下,强化学习微调后的模型在MMAU评测集上实现了64.5%的准确率,这一成绩比目前榜单上第一名的商业闭源模型GPT-4o有近10个百分点的优势。
在 NeurIPS 2024 大会上,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向,其中包括了 Inference Time Compute ...