
CMMLU
一个综合性的大模型中文评估基准
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K个未标注和211.3K个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
本站AFT导航提供的PubMedQA都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AFT导航实际控制,在2025年3月19日 下午2:14收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AFT导航不承担任何责任。