Anthropic 发布 Claude3 系列 LLM,其中 Claude3Opus 在测试中展现出元认知能力,成功找到信息并意识到测试人工性质。模型甚至察觉到研究人员正在评估其能力,展现出自我感知的元认知水平。行业需要更实际评估方法,以准确评估模型的真实能力和局限性。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则