证据推文SSam Altman首次发现(UTC+0) 2026/03/07 16:23最新证据(UTC+0) 2026/03/07 16:23AI 评分82核心要点1利用模型自省能力进行压力测试2探索 LLM 的知识边界内容切入角度1用 Sam Altman 的‘最难问题’横测主流模型2如何设计评估 AI 智力上限的提示词