AI会犯什么错,
你要怎么防
AI不是在撒谎,但它真的会编。搞清楚它犯哪几类错、为什么会犯、什么时候最危险——你就知道什么时候可以信它,什么时候得自己查一遍。
"上节课讲了怎么跟AI开口。今天讲一个很多人没想到的事——AI会犯错,而且犯得你根本看不出来。"
"我被坑过不止一次。有一次差点把AI编出来的内容直接发出去,幸好最后自己查了一下。今天把我踩过的坑说给你听,希望你不用再踩一遍。"
先说一个词:幻觉
AI犯的错,有个专门的名字叫"幻觉"(hallucination)。不是说AI真的在做梦,而是说它生成了一些听起来有道理、但实际上不存在或不正确的内容。
这个词用得很准。幻觉的特点就是:当事人感觉完全真实,旁边的人一眼看出有问题。AI犯错的时候就是这样——它给出的答案流畅、自信、格式整齐,你一点都看不出来它在编。
为什么会这样?因为AI的工作原理是预测"什么样的文字接在后面最合适",不是在查一个事实数据库。它的目标是生成听起来合理的内容,而不是保证内容一定正确。这两件事大多数时候是一致的,但有时候不是,这就是问题所在。
AI最常犯的三类错
幻觉有很多种,但对普通用户来说,最容易踩坑的就这三类。
特别要命的是:它不会说"我不确定",直接给你一个假的答案,语气和真答案一模一样。
政策、价格、软件版本、某个人的职位……这类会变化的信息,用AI查要特别小心。
简单加减法一般没问题,一旦题目复杂起来,出错率会上升。
让AI推荐参考书、推荐论文——它可能编出根本不存在的书名和作者,格式还很正规,你去图书馆或知网根本找不到。
让AI解释一道数学题的步骤——过程写得很工整,但中间某一步算错了,最终答案也错了。你只看格式,完全看不出来。
对策:参考书目一定要去知网、豆瓣、学校图书馆二次确认;数学步骤自己代入验算。
问AI某个政策或补贴的最新情况——它可能给你一个已经作废的旧版政策,还说得很详细,你去问相关部门才发现早就变了。
让AI推荐某种症状的用药——它可能把剂量或禁忌说错。医疗信息这块,AI只能做参考,不能代替医生。
对策:政策类信息去官网或拨打官方电话确认;医疗健康信息一定问医生,AI的回答只做了解背景用。
让AI查某家公司的注册信息、负责人、业务范围——它可能给你一份看起来很完整的工商资料,实际全是编的。
让AI写含有具体数据的报告——它引用的市场数据、行业统计数字,有可能是它自己造的,根本找不到来源。
对策:公司信息去企查查、天眼查核实;报告里的数据要找到原始来源,AI只是帮你整理框架和文字。
它为什么不直接说"我不知道"
这是很多人的疑问。既然不知道,为什么不直接说?
因为AI没有"知道"和"不知道"这两个状态的概念。它每次都在做同一件事:根据你的问题,生成一个最合理的回应。它没有一个内置的"事实核查系统"在跑,没有办法判断自己生成的内容是否真实存在。
这就像让一个极其流利的演讲者即兴发挥——他能把任何话题都讲得头头是道,但他不一定真的了解那个话题。流利和正确是两回事。
好消息是,主流AI在不断进步,现在比几年前更擅长说"我不确定"。但这还远不够可靠,你不能完全指望它自己暴露问题。
什么时候最危险,什么时候可以放心
不是所有事都要反复核查,那也太累了。关键是知道哪类场景风险高、哪类可以放心用。
解释一个已知概念——比如"什么是光合作用",这类有公认答案的知识,AI通常答得不错。
帮你理思路、列大纲——用AI当"橡皮鸭",把想法说给它听,让它帮你整理,通常很有用。
时效性强的信息——政策、价格、软件版本、时事新闻——AI可能给你过期内容。
医疗、法律、财务相关的建议——这类高风险领域,AI只能做参考,核心决定要咨询专业人士。
养成一个习惯就够了
不需要对AI的每句话都持怀疑态度,那会让你用起来很累,也没必要。只需要养成一个习惯:
凡是要用出去的具体信息,查一下来源。
AI帮你写了一篇文章,里面有个数据说"中国有多少网民"——在发出去之前,花30秒搜一下这个数字。AI帮你推荐了一本书——在推荐给别人之前,确认一下这本书真的存在。
就这一个动作,能挡掉90%的尴尬和损失。
- ✓让AI写的内容,发出去之前过一遍
- ✓具体的数字、名字、链接,去查原始来源
- ✓时效性信息,去官网或权威来源确认
- ✓医疗法律财务,AI只做参考,决定问专业人士
- ✓AI说"我不确定"时,认真对待这句话
你可能还想问
九桃把黑板上的"幻觉"两个字圈了一下,回头看着大家。
"今天讲的不是让你不信任AI——恰恰相反,搞清楚它会犯什么错、在哪些地方犯,你才能真正用好它。"
"信任要建立在了解之上,不是盲目的。你知道刀很快,所以切菜的时候小心一点,不代表你不用刀了。"
"下节课讲市面上的AI工具,帮你搞清楚该用哪个——别再为这个纠结了。🍑"