当AI一本正经地胡说八道……

3个月前 来源:光明日报 观看:36

【科学随笔·我见AI】KUq即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。KUq即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。KUq即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。KUq即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。KUq即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。KUq即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。KUq即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。KUq即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。KUq即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。KUq即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。KUq即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)KUq即热新闻——关注每天科技社会生活新变化gihot.com

【科学随笔·我见AI】KUq即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。KUq即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。KUq即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。KUq即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。KUq即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。KUq即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。KUq即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。KUq即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。KUq即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。KUq即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。KUq即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)KUq即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1922-0.html当AI一本正经地胡说八道……

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京:揭秘“神二十”搭载火箭元器件总装车间

下一篇:人形机器人进厂“打工”记

为你推荐
记者从中国载人航天工程办公室获悉,我国2025年计划发射神舟二十号、神舟二十一号两艘载人飞船和天舟九号货运飞船。1月20日,三次飞行任务的任务标识...
01-21
北京时间1月17日6时38分,美国太空探索技术公司(SpaceX)新一代重型运载火箭“星舰”从美国得克萨斯州起飞,完成第七次试飞发射。该火箭第一级助推器又一...
01-21
  辽宁省统计局今天发布2024年全省经济运行情况。数据显示,攻坚之年,辽宁生产需求持续改善,居民收入稳步...
01-21
  1月26日起,我省迎来强降雪寒潮大风天气。省住房城乡建设厅根据气象部门预报信息,提前印发通知,要求各...
01-28
  目前,我国大部正在经历一场大回暖,晴暖当道。但很快天气格局将发生明显转折,预计23日至27日,今年首场寒潮过程将影响我国,带来剧烈降温和大风雨雪天气。  雨雪范围或波...
01-22
  中新经纬1月21日电 “中国铁路”微信号21日发文提示称,一些“抢票软件”推出“加速包”服务是营销噱头,实际上旅客加钱并不会提高购票速度。  国铁集团表示,1月21日开始...
01-21
1 月 26 日消息,吉利汽车集团甲醇汽车业务中心总经理陆玉凯透露,吉利今年推出两款醇电混动车型,即吉利全新一代“醇氢电混”轿车和 SUV 车型,相关车型顾名思义,就是能够...
01-27
1 月 30 日消息,在今天召开的财报电话会议上,特斯拉公司宣布解锁新里程碑,车辆平均制造成本首次降至 3.5 万美元(当前约 25.4 万元人民币)以下。特斯拉公司还计划在 2025...
01-31
  胡建礼  近年来,国产系列电影如雨后春笋般涌现,如《熊出没》系列、《唐人街探案》系列、《...
01-22
随着电视剧《狂医魔徒》的热播,该剧逐渐吸引了广大粉丝的关注。一经播出,就以精彩的剧情、精良的制作和精心的演绎赢得了观众的一致好评,并且拿下了收视第一的...
02-22
21世纪经济报道记者季媛媛 上海报道 继2023年出现上市以来首次亏损,科创板首家CRO(医药合同研发服务)企业美迪西(688202.SH)2024年的业绩继续...
01-22
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
她师从图灵奖获得者 博士毕业于麻省理工学院 是国际知名企业的首席科学家 回...
01-21
作者:郁建兴(浙江工商大学党委书记)习近平总书记在2024年9月召开的全国教育大会上指出,建设教育强国是一项...
01-22
  中央经济工作会议提出,要稳妥处置地方中小金融机构风险。近期金融监管总局召开的年度监管工...
01-23
  “我行推出了一款春节专享理财产品,业绩比较基准会比同期限、同类型的理财产品高出5到10个基...
02-07
天秤男是一个追求平衡和和谐的星座,他们善于处理人际关系,注重公正和公平。然而,在与天秤...
01-22
水瓶座的男生一向以理性和独立著称,他们对于感情的态度也显得冷漠和难以捉摸。然而,当一...
01-22
户外直播文案? 怎么户外直播?户外直播文案?跟随我们的户外直播,探索大自然的奇妙之处!无论是远足、攀岩还是划船,我们将带您亲身体验刺激和冒险。与我们的专业导游一起,您将发现隐...
02-17
蓝百万潮流服饰:引领时尚的潮流先锋选择一件衣服,不仅是为了保暖或遮羞;更多的时候,它是一种身份的象征,一种自我表达的方式。当我第一次听说蓝百万潮流服饰这个品牌时,我立刻被它...
02-17
2月16日消息,春风送暖,甘蔗种植迎来关键时刻。中农网依托产业链优势,推动旗下广西易农通深入甘蔗种植环节,在南宁市武鸣区罗波镇板欧蔗区率先启动2025年5万亩甘蔗种植计划,通过数...
02-17
京东也要分一杯羹。京东app近日上线了“国内打车服务”。打开京东app进入首页,搜索“打车”,便出现“国内打车服务”的选项,点击该选项后,页面跳入”易企出行“小程序,用京东账号...
02-18
2月20日消息,智联招聘发布《2024中国海归就业调查报告》。智联招聘数据显示,2024年,在国内求职的海归人数较2023年增长7%,达到2018年的1.44倍;其中,回国求职的应届留学生人数较202...
02-21
3月2日消息,京东健康旗下“京医千询”医疗大模型近日启动开源,成为国内医疗行业首个全面开源的垂类大模型。同时,在2月24日更新的MedBench评测榜单上,“京医千询”医疗大模型以...
03-03
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
近日,朴烯晶新能源材料(上海)有限公司(以下简称“朴烯晶”)完成数亿元B轮融资。本轮融资由国科东方领投,大零号湾策源基金、尚研莘工基金、民银国际跟投...
02-07
随着《龙腾世纪:影幛守护者》的变性制作人Corinne Busche从BioWare“跑路”,EA将关闭BioWare埃德蒙顿工作室的传闻就甚嚣尘上。 虽然EA方面暂未对关闭工作室的...
01-22
《文明7》将于2月11日发售,近日Firaxis Games公布了游戏新领袖“卑弥呼”。卑弥呼将作为“倭的女王”登场,其特点是擅长科学和外交。官方还发布卑弥呼宣传片,一起...
02-03
问:美国东部时间2月1日,美方宣布对中国输美产品加征10%关税。中方对此有何评论?答:美方以芬太尼问题为由,对中国输美产品加征10%关税,中方对此强烈不满,坚决反对,将采取必要反制措施...
02-02
极目新闻记者 余渊 近日,有网友发视频称,湖南岳阳市平江县一辆警车连撞三辆车后,驾驶员逃离现场,此事引发关注。上述视频中,有人员声称:“一辆警车连撞三辆车后发生爆胎,随后驾驶员...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮