只需一步,快速开始
短信验证,便捷登录
军衔等级:
少校
当AI模型拥有千万级Token的超长记忆力时,如何检验它们的真正实力?OpenAI给出了新答案:MRCR基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥林匹克运动会」。MRCR不仅有助于揭示当前AI的能力边界,也将促使下一代更强大、更可靠模型的诞生。
雕塑在大理石块中已经完成,甚至在我开始工作之前就已经存在。 它就在那里,我只需要凿去多余的材料。 ——米开朗基罗
举报本楼
发表回复 回帖后跳转到最后一页
版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图
GMT+8, 2025-5-6 17:45 , Processed in 0.183865 second(s), 17 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed