证据推文OOpenAI首次发现(UTC+0) 2026/03/05 20:07最新证据(UTC+0) 2026/03/05 20:07AI 评分95核心要点1GPT-5.4 难以伪装或隐藏其内部推理逻辑2CoT 监控是当前确保 AI 安全的可行手段3发布了专门的 CoT 可控性评估套件内容切入角度1深度解读 OpenAI CoT 安全研究论文2为什么我们能通过监控思维链来确保 AI 安全3模型透明度:我们离理解 AI 的‘思考’还有多远?