Feb 13, 2025
Jan 26, 2025
Aug 1, 2024
Jul 7, 2024
Jun 27, 2024
Apr 28, 2024
Apr 19, 2024
Apr 9, 2024
我们构建了LIFECHOICE数据集,包含395本书中1,401个角色决策点,用于评估大型语言模型在角色驱动决策方面的能力,结果表明最先进的LLMs在这项任务中表现出有希望的能力,但仍有很大的改进空间。
Apr 1, 2024
Mar 24, 2024