NewtonBench 评估大模型科学发现能力

授权协议:None操作系统:None 开发语言:None
来自香港科技大学和英伟达的研究者提出了 NewtonBench—— 一个具备强泛化能力、旨在模拟真实实验探索环境的科学定律发现基准(Scientific Law Discovery Benchm...