eNewsTree.com

标题: 小米大模型突然登顶一项测试,用了DeepSeek的方法 [打印本页]

作者: pengngychita    时间: 2025-3-17 04:32
标题: 小米大模型突然登顶一项测试,用了DeepSeek的方法
来源:观察者网

3月17日,小米官方透露,其大模型团队在音频推理测试集MMAU榜单登顶,并强调“DeepSeek-R1的发布为我们在该项任务上的研究带来了启发”。

MMAU是一个侧重考察音频大模型理解和复杂推理能力的测试集,包含27种不同的任务,一万条涵盖语音、环境声和音乐的音频样本。

例如,其中一个任务是要求从一段10多秒的语音中,数出包含至少一个重读音素的单词数量;另一个任务是根据一段美剧《生活大爆炸》中的对话,解释其中一句话为什么是讽刺。

这是一个难度较高的测试集,人类专家的测试准确率为82.23%。而目前榜单上最强的大模型是谷歌Gemini 2.0 Flash,准确率55.6%。

小米大模型则达到了64.5%的准确率,较其它大模型有显著提升。其参数量更是只有7B,是一个非常轻量化的模型。

https://www.guancha.cn/economy/2025_03_17_768727.shtml




欢迎光临 eNewsTree.com (https://www.enewstree.com/discuz/) Powered by Discuz! X3.2