近日,小米的最新语言模型MiLM-6B在C-Eval和CMMLU两大AI模型评测榜单上崭露头角。MiLM-6B不仅在C-Eval总榜单中荣登第10,同样在同参数量级排名中名列前茅。在中文语言模型CMMLU排行榜上更是高居榜首。根据C-Eval披露的数据,MiLM-6B在多个测试科目中表现出色:
【测试科目成绩】
MiLM-6B在STEM(科学、技术、工程和数学教育)领域的20个科目中表现优异,计量学、物理、化学、生物等多个项目准确率高显著。
在10个社会科学科目中,该模型在教育学和地理学以外的所有科目均取得了令人满意的准确率。
在人文科学的11个科目中,MiLM-6B在历史和法律领域表现突出。
综上所述,MiLM-6B已在多数科目中展现出相对优异的准确度,然而在法学、数学、编程、概率论、离散数学等领域仍有进一步提升的空间。想要了解更多详情,请访问:
【详细信息】
小米有品
通过MiLM-6B在不同领域的出色表现,我们可以看出这一新一代语言模型的潜力和前景。它的准确率和多领域适应性为其在人工智能领域的应用打下了坚实的基础。无论是STEM领域还是社会科学和人文领域,MiLM-6B都展现出了引人瞩目的能力。然而,在未来的发展中,我们可以期待看到它在法学、数学等领域进一步发挥优势,为人工智能的进步贡献更多可能性。
作品采用:
《
署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)
》许可协议授权