
MMLU
大规模多任务语言理解基准
LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科,共计约20W道标准生成式问答题目。
本站AFT导航提供的LLMEval3都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AFT导航实际控制,在2025年3月19日 下午2:14收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AFT导航不承担任何责任。