模型发布2025年8月

你可以开始信任 AI 说的话了

变革

默认假设 AI 是错的，除非经过验证核实关键声明，其余可以信任→ 核实关键声明，其余可以信任

事件经过

1月

DeepSeek R1 证明推理能减少错误

思维链推理大幅减少了编造答案的情况

3月

Claude 加入引用功能

Anthropic 推出来源标注——模型将声明与文档关联

6月

GPT-4o 内置网络搜索

生成时实时事实核查，而不是事后才做

8月

GPT-5 发布，幻觉减少 80%

内部基准测试显示事实准确性实现了质的飞跃

关键玩家

OpenAI

GPT-5 实现了最大幅度的单次准确性提升

Anthropic

在来源引用和诚实表达不确定性方面领先

DeepSeek

证明了推理链能减少幻觉

你之前以为的

「AI 就是在胡编乱造——我不能依赖它」
「我必须逐句核实每一个说法」
「我绝不会在重要事情上使用 AI」

现在的真相

✓GPT-5 将幻觉减少了 80%——大部分输出现在是准确的
✓模型可以自主搜索网络并引用来源
✓人们已经在用 AI 起草法律文书、医疗摘要、金融分析

你该怎么做

用 AI 来写重要工作的初稿。抽查关键事实和数字，但别再从头重写所有内容了。基线质量已经变了。

AI 不仅能回答问题，还能完成任务了不用摄像机也能拍视频了