模型发布2025年8月
你可以开始信任 AI 说的话了
变革
默认假设 AI 是错的,除非经过验证→ 核实关键声明,其余可以信任
事件经过
1月
DeepSeek R1 证明推理能减少错误
思维链推理大幅减少了编造答案的情况
3月
Claude 加入引用功能
Anthropic 推出来源标注——模型将声明与文档关联
6月
GPT-4o 内置网络搜索
生成时实时事实核查,而不是事后才做
8月
GPT-5 发布,幻觉减少 80%
内部基准测试显示事实准确性实现了质的飞跃
关键玩家
OpenAI
GPT-5 实现了最大幅度的单次准确性提升
Anthropic
在来源引用和诚实表达不确定性方面领先
DeepSeek
证明了推理链能减少幻觉
你之前以为的
- 「AI 就是在胡编乱造——我不能依赖它」
- 「我必须逐句核实每一个说法」
- 「我绝不会在重要事情上使用 AI」
现在的真相
- ✓GPT-5 将幻觉减少了 80%——大部分输出现在是准确的
- ✓模型可以自主搜索网络并引用来源
- ✓人们已经在用 AI 起草法律文书、医疗摘要、金融分析
你该怎么做
用 AI 来写重要工作的初稿。抽查关键事实和数字,但别再从头重写所有内容了。基线质量已经变了。