HealthBench 开源医疗大模型测试评估集

授权协议:None操作系统:None 开发语言:None
HealthBench 是专门面向医疗大模型的测试评估集,该测试集的 5000 段核心测试对话全部由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真...