动态
模型发布2025年8月

你可以开始信任 AI 说的话了

变革

默认假设 AI 是错的,除非经过验证核实关键声明,其余可以信任

事件经过

1月
DeepSeek R1 证明推理能减少错误

思维链推理大幅减少了编造答案的情况

3月
Claude 加入引用功能

Anthropic 推出来源标注——模型将声明与文档关联

6月
GPT-4o 内置网络搜索

生成时实时事实核查,而不是事后才做

8月
GPT-5 发布,幻觉减少 80%

内部基准测试显示事实准确性实现了质的飞跃

关键玩家

OpenAI

GPT-5 实现了最大幅度的单次准确性提升

Anthropic

在来源引用和诚实表达不确定性方面领先

DeepSeek

证明了推理链能减少幻觉

你之前以为的

  • 「AI 就是在胡编乱造——我不能依赖它」
  • 「我必须逐句核实每一个说法」
  • 「我绝不会在重要事情上使用 AI」

现在的真相

  • GPT-5 将幻觉减少了 80%——大部分输出现在是准确的
  • 模型可以自主搜索网络并引用来源
  • 人们已经在用 AI 起草法律文书、医疗摘要、金融分析

你该怎么做

用 AI 来写重要工作的初稿。抽查关键事实和数字,但别再从头重写所有内容了。基线质量已经变了。

幻觉