构建大模型幻觉及其价值风险的预防治理体系

4个月前来源：新华网观看：90

当前，大模型正以日新月异的速度变革人类社会，其以强大的文字、图像与视频生成能力，带给人们学习工作的效率革命与范式创新。越来越多人将大模型应用于日常实践活动，然而在此过程中，部分用户由于缺乏必要的媒介素养和信息验证习惯，很容易被表面严丝合缝的人工智能幻觉蒙蔽欺骗，无条件信任大模型输出的所有答案，进而对生活、学习或工作产生不良影响，引发决策误导、认知偏差等风险。在推动大模型广泛应用过程中，必须警惕与治理大模型幻觉问题及其价值风险，加快构建集技术优化、法律规制与伦理调适于一体的预防治理体系。

大模型幻觉的生成原因

在人工智能领域，幻觉特指大模型生成的内容看似语法正确、逻辑严谨，但实际上存在着事实错误或无法验证事实的现象，具有“一本正经胡说八道”、无法确认现实依据等特征。大模型的幻觉包括事实性幻觉与忠实性幻觉两种类型，前者指的是与事实不一致或存在事实捏造，后者指的是生成内容与用户指令不一致、上下文不一致或逻辑不一致。

在本质上，大模型的幻觉问题是其技术架构、训练和生成模式共同作用的产物，具有一般性、偶然性、随机性、难以避免或克服等特征。在生成机制上，大模型幻觉的核心成因来自概率驱动的技术架构、训练数据局限性以及人机互动生成逻辑的多重耦合。

首先是技术架构的能力短板。目前大模型主要采取基于转换器结构的GPT范式，这种技术架构确能大幅度提高自然语言处理的精度与效率，但在预训练、监督微调、推理等环节都可能存在能力短板，产生与事实、指令或上下文不一致的幻觉问题。例如在预训练阶段，大模型通过自回归生成方式，基于历史标记的概率分布逐词预测输出。这种机制天然缺乏对上下文语义一致性的把控能力，容易优先选择概率更高但与事实、逻辑不一致的词汇组合，输出形成“语法正确但内容失真”的幻觉。

其次是训练数据的天然缺陷。大模型基于互联网海量数据进行深度学习，但由于互联网语料并未经过严格检验处理，或者由于错误标注，不可避免存在事实错误或逻辑矛盾，大模型缺乏对数据真实性的鉴别能力，容易抓取或根据错误数据生成回答。例如，当要求GPT4大模型讲述“林黛玉倒拔垂杨柳”的故事时，大模型并不能辨析其中的陷阱，而是未经事实验证直接从海量文本数据中进行内容拼接，编造出一段荒谬情节。

最后是人机互动的刻板误伤。大模型采取的人类反馈强化学习，容易导致大模型在刻意逢迎人类需求过程中出现信口开河、事实伪造等问题。如加拿大航空聊天机器人在错误理解“特殊退款”概念后，连续生成虚构的退款条件与时限，最终酿成法律纠纷。大模型特有的技术架构和生成逻辑，导致幻觉具有自我强化的危险性。

大模型幻觉的价值风险

大模型幻觉的随机出现和难以避免，还存在着削弱人机信任、导向信息极化、冲击社会秩序甚至引发意识形态安全危机等价值风险，亟待加强预防与治理。

大模型幻觉最直接的危害就是对用户决策的误导，特别是在医疗、健康、金融等领域。大模型的权威性表达风格与流畅的叙事逻辑，使得错误信息具有极强的迷惑性。如果用户过于依赖大模型生成信息辅助决策，很有可能被误导进而产生严重后果。例如，相信大模型提供的错误治疗方案，可能导致疾病无法控制甚至进一步恶化。长此以往，恐将削弱人机信任关系。

更令人担忧的是，大模型幻觉引发的价值风险呈现出从个人决策误导向群体认知偏差、社会秩序冲击的扩散路径。在公共决策领域，幻觉可能扭曲政策认知，如果不加强对大模型输出信息的甄别与把关，很有可能出现误读政策、发表歧视言论等幻觉问题，不仅会削弱政府公信力，甚至会危及社会公共安全。

在意识形态安全领域，相关威胁更加隐蔽。例如，相关研究监测到，某些境外大模型带着意识形态的有色眼镜看待中国特色社会主义发展成就与制度优势，刻意混入虚假事实或错误评价，形成与主流话语不同的输出。这种经过意识形态包装的幻觉内容，通过知识问答形式进行价值渗透，其误导性远超传统虚假信息。

大模型幻觉的治理对策

预防与治理大模型幻觉，应构建技术纠偏、法律规制与伦理调适的三维治理体系，通过技术优化消除幻觉问题，借助法律规制明确责任边界，依托伦理调适培育价值理性，使大模型成为人类更可靠的合作伙伴。

构建多层次防治体系。“以技治技”是解决大模型幻觉问题的首选路径。人工智能伦理的“价值敏感设计”或价值对齐策略，也有赖于技术层面创新与突破。这不仅需要人工智能企业与专家通过提高训练数据质量、加强外部验证与事实检查、改进模型推理能力、增强透明度与可解释性等途径提升大模型性能，而且鼓励哲学社会科学专家与人工智能专家携手合作，通过知识库优化、训练语料纠错、价值对齐监测等途径，帮助大模型提高问答正确率，消除潜在的幻觉问题与价值风险。

建立适应性治理框架。面对大模型的普及化应用，敏捷、柔性、规范的立法治理势在必行。国家网信办等七部门颁布实施《生成式人工智能服务管理暂行办法》，对训练数据选择、模型生成与优化、服务提供等提出明确的法律规制与风险防范要求，有利于推动“智能向善”，促进大模型的合规应用。欧盟《人工智能法案》要求大模型履行告知义务、确保技术方案的稳健性和可靠性等规范要求，对大模型的应用形成有效的制度约束和问责框架，值得参考借鉴。

提高技术开发应用的价值基准。对大模型幻觉更有意义的治理创新在于建立技术价值观，将负责任创新、可控创造性等伦理价值融入工程师的头脑、植入大模型的代码。例如，倡导存在争议结论不生成、无法溯源的信息不生成、超出模型认知边界的内容不生成等原则，推动大模型从追求生成流畅度向确保内容可靠性转型；又如，建立大模型回答事实性问题分级置信提示制度，按照高可信、需核实、推测性结论等进行分类标注，加强输出内容的透明度与可解释性。

对用户而言，应进一步提高科学正确应用大模型的信息素养，进而成为引导内容生成的指挥官、幻觉问题的甄别者。研究表明，经过人工智能交叉验证等使用习惯培训，能够显著降低用户被幻觉误导的概率。人们需要与时俱进地提升自身辨析幻觉、掌握常识、批判思考的综合能力，在利用大模型检索信息、生成内容的过程中遵守履行事实核查、逻辑验证、专业甄别、最小必要、场景控制等价值原则，最大限度消除幻觉问题和价值风险。

人工智能的可靠性建设往往滞后于其能力扩展。治理大模型幻觉的终极目标不是完全消灭技术的不确定性，而是要建立风险可控的人机协同机制。在这场人机协同的赛博进化中，始终保持技术的谦逊与伦理的清醒，是破除大模型幻觉迷雾的应有之义。

（作者：李凌，系复旦大学马克思主义研究院副研究员）

大模型幻觉的生成原因

大模型幻觉的价值风险

大模型幻觉的治理对策

（作者：李凌，系复旦大学马克思主义研究院副研究员）

点击展开全文

本文链接：http://www.gihot.com/news-2-1699-0.html构建大模型幻觉及其价值风险的预防治理体系

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：嫦娥六号采回样品又有新发现——月背月幔水含量小于2微克/克

下一篇：我国科学家研发出新型合成孔径雷达三维成像技术

为你推荐

第一家被美国列入实体清单的大模型企业出现了！企业回应：强烈反对

被誉为“AI六小虎”之一北京智谱华章科技有限公司（以下简称智谱）被拉入实体清单了。当地时间1月15日，美国商务部工业和安全局（BIS）修订...

01-21

一批互联网3.0“黑科技”在京亮相

比二维码更加安全可控的“三维码”、追赶国际暗网情报前沿的中国技术、具有“断代”竞争力的AR/VR光学方案……第八届中关村国际前沿...

01-21

新春走基层丨除雪保畅温暖回家路

　　1月27日夜间，纷纷扬扬的大雪已下了一整天，白雪覆红灯让年味愈发浓厚。在沈阳街头，环卫工人们挥舞铁锹...

01-28

强降雪丨辽宁这些高速公路收费站已开通，但有限型！

　　至1月27日10时40分，经与交警部门协商，沈阳、葫芦岛、铁岭、锦州、大连、抚顺、盘锦、阜新、营口部分...

01-28

特朗普就职典礼上，这些细节耐人寻味 | 京酿馆

▲1月20日，特朗普在美国第47任总统就职典礼上宣誓。图/新华社华盛顿权力中心最重要的位置终于换岗了。据新华社报道，美国东部时间1月20日中午，特朗普在国会大厦圆形大厅宣誓就...

01-21

新春文旅消费图谱：出入境游“双向奔赴” 特色游持续“上新”

　　新春文旅消费图谱：出入境游“双向奔赴” 特色游持续“上新”　　本报记者谢岚　　见习记者梁傲男　　春节临近，大众出游热情高涨。综合各平台预订数据来看，新春旅游市...

01-21

猛士917蛟龙战甲现身春节大片猛士科技与博纳影业双向奔赴

1月19日，由博纳影业打造的军事战争巨制《蛟龙行动》正式开启预售，并将于1月29日大年初一全国上映。同时，电影《蛟龙行动》联名款车型——猛士917蛟龙战甲也将迎来银幕首秀。回...

01-25

搅动电动车市场：特斯拉 2025 上半年将推平价车型，预估约 3 万美元

1 月 30 日消息，在今天召开的财报电话会议上，特斯拉公司宣布解锁新里程碑，车辆平均制造成本首次降至 3.5 万美元（当前约 25.4 万元人民币）以下。特斯拉公司还计划在 2025...

01-31

《重症外伤中心》韩宥林为什么改变了对白江赫的看法

近期，《重症外伤中心》备受关注，播出后引发了广泛讨论。这部剧中的一个关键情节是韩宥林对白江赫医生态度的转变。在剧中，白江赫医生凭借精湛的技术和冷静的态...

02-19

韩国制造第一季什么时候上映

《韩国制造》第一季近期成为追剧党热议的话题，该剧在各大短视频平台上的热度持续攀升。这部备受期待的韩剧计划于2025年下半年与观众见面，因其强大的演员阵容...

02-22

基本医保将放开在常住地、就业地参保户籍限制

　　新华社北京1月7日电（记者徐鹏航）针对近期有群众反映用人单位拖欠职工工资和“五险一金”缴费，影响其医保权益保障的情况，国家医保局7日公开发布通知，进一步加强劳动者...

01-21

元宵汤圆怎么选？牢记这些要点

　　春节后第一个重要节日元宵节到来。除了看花灯、猜灯谜，品尝元宵（汤圆）也是千家万户过节的重要...

02-13

济南高新区玺悦幼教集团（空港园）《藏在指纹上的秘密》

　　大众网记者王一刚报道　　进入大班后，孩子们对探索自己身体秘密的情感越来越强烈。在一次手掌拓印活动中，孩子们对手上的指纹产生了浓厚的兴趣，在好奇心的推动下，孩子...

01-21

心向远方不可阻“篮” 我在东北过大年——沈阳市珠江五校教育集团“学校放假社区开学”系列活动

当学校的铃声渐渐沉寂，社区的活力却悄然绽放。沈阳市珠江五校教育集团与社区携手，共同编织了一场别开生面...

01-21

2024年12月资产管理信托发行、成立端两旺季节性“翘尾行情”推动市场

　　原标题：2024年12月资产管理信托发行、成立端两旺季节性“翘尾行情”推动市场上行　　中国网...

01-22

新“万亿银行”接连涌现，江西农商联合银行获批筹建总资产超1.3万亿

　　进入2025年以来，省联社改革驶向“快车道”。　　1月20日，国家金融监督管理总局披露的批复显示...

01-23

射手男主动跟你有肢体接触是喜欢吗

射手座的男生通常充满活力和热情，他们喜欢与人交流并表达自己的感受。在亲密关系中，射手...

01-22

双子男开始烦你的表现，双子男能撑几天不联系

双子座的男生善于交际，聪明机智，喜欢追求新鲜刺激的感觉。然而，有时候他们也会变得烦躁不...

01-22

剑南春销量排行榜？比亚迪销量排行榜？

剑南春销量排行榜？比亚迪销量排行榜？剑南春销量排行榜？剑南春销量第五名：剑南春全国名酒销量排名前十名：冠军：茅台亚军：五粮液第三名：泸州老窖第四名：洋河第五名：剑南春第六名：郎酒第...

02-07

揭示女明星穿衣风格的秘密：如何借鉴她们的时尚灵感

揭示女明星穿衣风格的秘密：如何借鉴她们的时尚灵感当我们翻看杂志或者社交媒体时，常常会被一位位女明星的穿衣风格所吸引。她们的时尚选择不仅体现了个人魅力，更在无形中影响了...

02-17

阿里引入全球顶尖科学家，我看到了马云的野心

阿里AI，蓄势待发。阿里巴巴再添AI猛将2025开年，阿里巴巴迎来一位AI牛人。据界面新闻，全球顶尖人工智能科学家许主洪（Steven Hoi）正式加入阿里巴巴，出任阿里集团副总裁，负责AI To C...

02-07

京东“潮品家”频道升级上线打造家居体验空间

2月9日消息，为满足消费者对品质家居好物的需求，京东“潮品家”频道升级上线，汇聚百大国际、原创家具品牌，精选时下流行的家具精品、宝藏店铺、风格趋势及热门榜单，为消费者打造一...

02-09

马蜂窝AI智能应用接入DeepSeek大模型

2月12日消息，马蜂窝宣布其自研的AI智能应用正式接入DeepSeek大模型，首阶段将优先应用于已上线发布的“AI游贵州”、“AI游黔西南”、“AI游西江” 省市景区三级AI应用生态，进一...

02-13

途牛：情人节周末超75%用户选择短途周边游

2月14日消息，今年情人节正值周五，途牛截至目前最新预订数据显示，北京、上海、成都、沈阳、南京、广州、重庆、天津、深圳、杭州等地用户出游热情更旺。从年龄来看，85后、90后的...

02-15

浙大天才，震惊全球

2024年末，一位科技创业者火了。作者 | 王思琪来源 | 投资家（ID：touzijias）2024年末，一位科技创业者火了。2025年初，这位创业者再度爆火。近日，中国科技行业因一位85后年轻人现身《...

01-24

财税科技获得5000万元融资

近日，珠海市合心财税科技有限公司（简称“财税科技”）迎来了重要的发展里程碑。公司宣布，已完成5000万元人民币的融资，由中经金控投资有限公司（以下简称...

02-07

《天国：拯救2》主角太臭易被NPC发现洗澡可解决

《天国：拯救2》已正式发售，首发24小时销量就突破100万份。许多玩家对这款中世纪RPG表现出浓厚兴趣。游戏中有许多细节非常真实，比如玩家会因为偷窃被捕，越狱时被守...

02-06

《刺客信条：影》推出联名啤酒买啤酒送史诗级武器

近日Sprecher啤酒公司宣布与育碧合作，推出一款限量版的啤酒以庆祝《刺客信条：影》的发行，并将在游戏内提供免费的奖励。视频欣赏：据悉，玩家购买这款特别版啤酒...

02-15

春节期间单日客流量最高达5万人，湖北云梦祥云湾上演非遗中国年

极目新闻记者涂梦蝶非遗三节龙、傩仪舞蹈、广场烟花秀……走进湖北省云梦县祥云湾文旅度假区，仿佛参加一场战国游园会。近日，极目新闻记者了解到，春节期间，云梦县祥云湾文旅度...

02-04

中方欢迎文方决定给予持普通护照的中国公民14天免签入境政策

2月6日，中文双方发表《中华人民共和国和文莱达鲁萨兰国关于深化战略合作伙伴关系、推进中文命运共同体建设的联合声明》。《声明》中提到，文方感谢中方对持普通护照的文莱公民...

02-06

全部导航

构建大模型幻觉及其价值风险的预防治理体系

弘扬科学家精神·大家小事丨匡廷云：一生只为“追光”

去年我国油气产量当量首超4亿吨

今日视点丨2025年这些创新技术有望大放异彩

仿昆虫眼相机每秒能拍9120帧图像

星空有约丨我国新发现一颗彗星

AI智能体火爆用户担心个人数据被用于模型训练大模型隐私安全亟待行业监管

我国科学家在空间站完成铟硒半导体晶体生长实验

基因编辑猪心移植患者分析报告发布