CMMLU

1年前发布 13 00

一个综合性的大模型中文评估基准

收录时间：

2025-03-19

打开网站手机查看

AI模型评测

CMMLU

打开网站

CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题。它包括：需要计算和推理的自然科学，需要知识的人文科学和社会科学，以及需要生活常识的中国驾驶规则等。此外，CMMLU中的许多任务具有中国特定的答案，可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。

数据统计

数据评估

CMMLU浏览人数已经达到13，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：CMMLU的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找CMMLU的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站AFT导航提供的CMMLU都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由AFT导航实际控制，在2025年3月19日下午2:13收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，AFT导航不承担任何责任。

AFT导航致力于优质、实用的网络站点资源收集与分享！本文地址https://aftss.net/sites/2905.html转载请注明

暂无评论

暂无评论...

CMMLU

数据统计

数据评估

相关导航

MMLU

Chatbot Arena

Open LLM Leaderboard

OpenCompass

HELM

SuperCLUE

PubMedQA

AGI-Eval

暂无评论