生成式AI“幻觉”困境如何破解

5个月前来源：中国科技网观看：82

人工智能（AI）技术正以前所未有的速度发展，生成式AI凭借其惊人的创造力，不断刷新人们的认知。然而，即便是看似“聪明绝顶”的AI，也难逃“幻觉”的困扰。这里的“幻觉”，指的是AI生成看似合理但实际不准确或虚假的信息。

英国《自然》杂志网站在1月22日的报道中指出，AI“幻觉”可能会引发严重后果，科学家正各出奇招，力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等，以促进AI的健康、高效发展。

主因是数据模糊

各种生成式AI，包括由大语言模型驱动的聊天机器人，常常会编造信息。它们有时会模糊事实与虚构，在看似真实的陈述中夹杂错误信息。这既是其创造力的体现，也是其不足之处。

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称，大语言模型的设计原理并非输出准确事实，而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”，人们难以洞悉其推理过程。

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示，在训练过程中，这些模型会压缩数万亿个单词间的关系，随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容，但剩下2%的内容却会让其“误入歧途”，生成不准确或虚假信息。

导致AI出现“幻觉”的原因多种多样，其中训练数据中的模糊性和错误是常见因素。也有人认为，即使训练数据准确无误，AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此，即使经过人类反馈调整过的聊天机器人，也无法完全避免出错。

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

在新闻领域，大语言模型可能生成虚假新闻事件，扰乱信息传播秩序，误导公众认知。Vectara公司针对文档内容开展的研究表明，一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示，错误和虚假信息是2025年全球面临的五大风险之一。

在法律领域，它可能引用虚构的法律条文和案例。比如，2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT，在法庭文件中引用了并不存在的法律案例。而在医学领域，它可能提供错误的诊断和治疗建议，危及患者生命。

《自然》在报道中指出，AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现，各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签，提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑，可能会引发一系列问题。

多举措减少“幻觉”

为进一步提升AI的精确度，科学家正想方设法降低其“幻觉”。

例如，增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本，并可能削弱聊天机器人的其他能力，如机器学习算法对未知数据的预测和处理能力。

此外，使用更大、更干净的数据集进行训练，也是降低AI模型“幻觉”出现的有效途径。然而，当前可用数据的有限性限制了这一方法的应用。

检索增强生成（RAG）技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本，从而确保回复内容的真实性，以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域，RAG技术备受青睐。

不过，美国斯坦福大学计算机科学家米拉柯·苏兹根表示，尽管RAG能提升内容真实性，但其能力有限。苏兹根团队的研究表明，一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进，但仍存在不足。

开发者也可以使用一个与AI训练方式不同的独立系统，通过网络搜索对聊天机器人的回复进行事实核查，谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能：内容如果突出显示为绿色，表示其已通过网络搜索验证；内容如果突出显示为棕色，则表示其为有争议或不确定的内容。但是，这种方法计算成本高昂且耗时，而且系统仍会产生“幻觉”，因为互联网上错误信息泛滥。

在去年6月出版的《自然》杂志上，英国牛津大学科学家刊发论文称，他们利用“语义熵”，通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种，被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性，来计算模型的困惑程度，从而为用户或模型提供警示，提醒其采取必要的循证措施，确保更准确的答案输出。

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时，绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式，可以告诉我们AI模型是在“说真话”，还是在“胡说八道”。

主因是数据模糊

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

多举措减少“幻觉”

为进一步提升AI的精确度，科学家正想方设法降低其“幻觉”。

此外，使用更大、更干净的数据集进行训练，也是降低AI模型“幻觉”出现的有效途径。然而，当前可用数据的有限性限制了这一方法的应用。

点击展开全文

本文链接：http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：标记速度、均匀性和多功能性超出以往，新技术可高效标记细胞蛋白质

下一篇：顶夸克遵循狭义相对论通过最强测验

为你推荐

我科学家开发出面向低功耗芯片的绝缘材料

...

01-21

行走速度可达每秒10米四足机器人“黑豹2.0”发布

1月13日，由浙江大学杭州国际科创中心（以下简称“科创中心”）人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...

01-21

今年春节假期海南游还会遭遇“出入岛难”吗？

　　每到春节，海南都是热门旅游目的地之一。近年来，过年进出岛难问题屡屡引发关注。　　今年游客...

01-24

“网红城市”迎春节，“泼天富贵”如何再突围？

　　前有“尔滨你让我感到陌生”“天水热辣滚烫”“开封王婆难以复刻”，后有“跟着悟空游山西”...

01-27

冲上热搜！5位博主折腾投资一个月，收益不如余额宝？

　　1月20日，B站五位博主比拼理财收益的视频火了。　　每位博主的初始本金为8万，最近一个月各自分头理财，通过最后的收益角逐出 “理财王”。　　一个月下来，五位up主投资均...

01-21

警惕电诈新手段！骗子如何通过NFC实施盗刷？

　　NFC是近场通信的简称，它是一种短距离的无线通信技术，能让电子设备在靠得很近的时候进行数据交换，这个距离一般在几厘米之内。　　刷公交卡、移动支付、电子门禁……日常...

01-21

卷入两起致命事故，美监管机构对福特 BlueCruise 驾驶辅助系统展开深度调查

1 月 23 日消息，2024 年 4 月 25 日，美国国家公路交通安全管理局（NHTSA）下属的缺陷调查办公室（ODI）对福特的 BlueCruise 自动驾驶系统展开了初步评估（PE24012），原因是该机构...

01-24

定名“天工 05”，一汽红旗全新电动中型车官图发布

1 月 24 日消息，据“一汽红旗”官方公众号，一汽红旗宣布旗下天工系列全新电动中型车定名为天工 05，该车是红旗天工系列的首款轿车，官图称该车将于“新岁登场”，结合该车...

01-25

《惊雀》剧情介绍

随着电视剧《惊雀》的热播，其剧情介绍也逐渐引起了广大粉丝的关注。该剧播出后，凭借精彩的剧情、精良的制作和精心的演绎，受到了观众的一致好评，并拿下了收视第...

02-21

《余烬之上》谁是主谋谁是幕后大佬

《余烬之上》谁是主谋？谁是幕后大佬？‌《余烬之上》的主谋是纳威‌。尽管最初怀疑是廖知白，但最终被排除，纳威的嫌疑逐渐加重。纳威是一个既富有又神秘的人物，出...

02-21

《冬春季呼吸道传染病防治健康提示》来啦

　　进入冬季，全国多地甲流病例数量明显增加。网络相关词条搜索量不断上升，不少网友表示已不幸“中招”。近日，山东省相关部门联合发布《冬春季呼吸道传染病防治健康提示...

01-21

药品采购“急刹车”：涉9家药企8款产品，原因几何？

21世纪经济报道记者韩利明上海报道日前，上海阳光医药采购网披露信息显示，根据国家医保局有关工作要求，2025年2月15日起，暂停杭州国光药业股...

02-18

持续探寻职业教育高质量发展路径

作者：郭天平（重庆工业职业技术学院党委书记）党的二十届三中全会通过的《中共中央关于进一步全面深化改革、...

01-22

温诗铸：开拓中国摩擦学，铸就“诗意”人生

　　　　温诗铸（1932—2023）　　清华大学机械工程系教授，摩擦学专家，中国科学院院士。　　1955年毕...

01-23

骤增近30% 纯碱库存创历史新高！供需失衡态势加剧？

　　摘要　　【骤增近30%纯碱库存创历史新高！供需失衡态势加剧？】本周，纯碱市场呈现双弱状态。纯碱...

02-07

一年期存款利率反超两年期部分中小银行中短期存款利率“倒挂”

　　本报记者彭妍　　近期，广东南澳农商银行、山西怀仁农商银行等部分中小银行的1年期、2年期存...

02-13

摩羯男金牛女配对指数，摩羯男爱上金牛女表现

摩羯男和金牛女的配对指数非常高，他们在很多方面都能够互补，形成一个稳定而和谐的关系。...

01-22

天蝎座男生喜欢一个人的表现，天蝎男偏爱哪类型女生

天蝎座男生是十二星座中最神秘、深沉的一种类型，他们对感情非常认真，一旦喜欢上一个人，会...

01-22

花色衬衫如何搭配？橘色衬衫怎么搭配？

花色衬衫如何搭配？橘色衬衫怎么搭配？一、花色衬衫如何搭配？1、搭配一：深绿色花衬衫+灰蓝色九分雪纺裤深绿色是比较显气质的颜色，这件深绿色花衬衫事复古的风格，下身搭配一条灰蓝...

02-07

儿童口号大全？

儿童口号大全？　　1、宝贝向前冲，这里属于你。　　2、精彩艺术，尽放未来。　　3、宝贝可爱，我们相伴。　　4、来鹿优优，做全能宝宝。　　5、希望，由此开始；未来，由此腾飞。　　6、关...

02-12

董宇辉退出与辉同行股东行列改为间接持股

2月10日消息，天眼查显示，2月8日，与辉同行（北京）科技有限公司发生工商变更，原全资股东董宇辉退出股东行列，新增子三省（北京）科技有限公司为股东并全资持股，董宇辉由直接持股变更为间接...

02-11

淘宝：2月以来中式香订单量环比增长280%

2月16日消息，2月以来，淘宝平台上中式香订单量环比增长280%，香薰炉、香插等工具订单量环比大涨480%。从地域来看，广东、江苏、浙江、山东和上海的消费者更爱买中式香。在成交金额...

02-17

美团闪购：情人节新中式花束订单量同比增长1709%

2月19日消息，美团闪购发布2025年情人节鲜花消费报告。2月14日情人节当天，美团鲜花品类销售额年同比增长120%。其中，新中式花束订单量年同比增长1709%，美团闪购所推出的颐和园、...

02-20

京东外卖推出餐补优惠首批覆盖大学生及PLUS会员

2月27日消息，京东外卖宣布推出“10元/20元餐补随机领”优惠活动，用户每晚8点即可随机领取“满15元减10元”“满40元减20元”两种大额餐补优惠券，首批覆盖通过京东认证的大学生...

03-01

金价攀升或非短期，多重利好年内或将黄金推升至3000

自去年底开始，黄金多头优势逐渐退却，国际现货黄金价格经历几次大跌后一度跌下2700关口，多空进入漫长的震荡周期，多头始终无法找到再度冲高的时机。　　北京时间1月21日，国际现货...

01-24

晓商圈获三千万融资

2024年12月14日消息，杭州晓商圈网络科技有限公司（简称“晓商圈”），今日获得深圳市冠峰永越投资有限公司（简称“冠峰资本”）三千万人民币的战略投资。晓...

02-07

《哪吒之魔童闹海》票房破50亿：杀入中国影史第五

快科技2月5日消息，据灯塔专业版实时数据，截至2月5日1时3分，影片《哪吒之魔童闹海》票房突破50亿。《哪吒之魔童闹海》也正式杀入中国影史票房榜第五，而第四就是《...

02-05

《刺客信条：影》推出联名啤酒买啤酒送史诗级武器

近日Sprecher啤酒公司宣布与育碧合作，推出一款限量版的啤酒以庆祝《刺客信条：影》的发行，并将在游戏内提供免费的奖励。视频欣赏：据悉，玩家购买这款特别版啤酒...

02-15

新春走基层|古刹换新妆，青云塔下灯火明，黄州安国寺变网红打卡地

极目新闻记者张扬实习生许诺2月2日大年初五，湖北省黄冈市黄州区的安国禅寺前的广场热闹非凡。遛鸟的大爷提着竹笼在花坛边切磋鸟鸣，举着相机的游客围着青云塔转圈找角度，穿汉...

02-02

被余华英拐卖30年的小伙回乡认亲，全村放鞭炮欢迎，当年一同被拐的哥哥仍未回家

极目新闻记者肖名远2月3日（正月初六），贵州省清镇市，余华英拐卖案受害者王能能终于回到老家与亲人们团聚，全村放鞭炮迎接。这一天，王能能的母亲张荣仙等待了30年，但对她来说，这次团...

02-04

全部导航

生成式AI“幻觉”困境如何破解

又损一将！荣耀中国区CMO姜海荣被传辞职，又一华为猛将接任？

超导直线等离子体装置“赤霄” 建成投运

创客匠人老蒋、原爱多VCD创始人胡志标畅谈企业之道

小红书迎来“泼天流量”，TikTok还有转机吗？

全国首家AI医院将面向公众开放，AI会取代医生吗？

新发现或能预警早产风险

搭建元宇宙空间创造阅读新场景

亚马逊宣布退出加拿大魁北克业务，并裁员约 1700 人