ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

4天前 来源: 观看:13

qtM即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。qtM即热新闻——关注每天科技社会生活新变化gihot.com


qtM即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)qtM即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖qtM即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利qtM即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  【文化评析】  作者:刘诚(中国社会科学院财经战略研究院研究员)  近年来,微短剧在我国迅猛...
01-24
最近风靡的电视剧《小锦鲤之我给全家送福气》凭借其演员的颜值、演技以及精彩的剧情吸引了大量观众。这部剧不仅情节吸引人,人物塑造也十分到位,还有许多精彩...
02-19
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向最高检披露2024医药行业反腐相关数据2月12日...
02-14
  大众网记者 司心鹏 通讯员 刘振 盛凤娟 报道  近日,2024年职业院校技能大赛各赛项圆满收官,山东水利职业学院在本年度赛事中表现卓越,成绩斐然。在世界职业院校技能大...
01-21
近日,教育部办公厅印发通知,探索中小学人工智能教育实施途径,加强中小学人工智能教育。通知明确加强中小学...
01-21
  近日,金融监管总局发布《保险公司监管评级办法》(简称《评级办法》),自2025年3月1日起施行。监...
01-21
  险资在全国的收租版图有加速拓展的势头。近日,新华保险携手万科集团旗下住房租赁平台等,成立...
02-14
天蝎男和摩羯女,是一个充满神秘感的组合。他们都属于土相星座,因此在很多方面有着共同的...
01-22
天蝎座男生通常被认为是神秘、深沉而又充满魅力的存在。他们对爱情有着极高的要求,很难...
01-22
女款小立领衬衫怎样搭配外套?立领西服与立领服饰搭配技巧1、 不同场合下正式场合:成熟儒雅――进退有度的气节推荐搭配:深色立领西服套装(立领白衬衫+深色立领西装)黑色为主的...
02-17
揭示女明星穿着背后的故事与时尚心理在这个充满光鲜亮丽和无数品牌纷争的娱乐圈里,女明星们的穿着往往能引起公众的广泛关注。而当谈及“穿着最暴露的女明星”时,我们不妨深入...
02-17
1月20日消息,猎芯近日与深圳市矽睿半导体有限公司(以下简称:矽睿半导体)达成授权代理合作。矽睿半导体全系列产品已上线至猎芯网平台商城,含磁传感器、电源管理、锂电池保护芯片...
02-07
2月8日消息,京东工业近日与永冠新材签署战略合作协议。双方将依托京东工业自营供应链合作模式,共同拓展市场、提升品牌影响力,携手为广大工业企业用户带来更便捷、更专业的胶粘...
02-09
2月17日消息,第九届亚洲冬季运动会(以下简称“亚冬会”)近日在哈尔滨收官。作为国家中小企业公共服务示范平台,小熊U租为亚冬会提供了超2000台IT设备的定制化短期租赁解决方案,全...
02-18
2月20日消息,美团日前宣布将为全职及稳定兼职骑手缴纳社保,预计2025年第二季度起实施。对此,美团核心本地商业CEO王莆中在公司内网发文称,“履行好社会责任,不必用竞争思维来思考...
02-20
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
近日,苏州尚柔新能源有限公司完成超四千万元Pre-A轮融资,由广州凯得粤豪私募基金管理有限公司独家投资。融资将主要用于技术研发、量产线建设以及市...
02-07
快科技今日(1月23日)消息,前几天中国台湾嘉义大埔地区发生里氏6.4级浅层地震,此次地震对台南科学园区的部分半导体工厂造成了影响。 据媒体报道,台积电位于台南的...
01-24
《原子之心》DLC3“深海迷情(Enchantment Under the Sea)”现已上线,售价10美元,国区售价40元,自带简体中文和中文配音。截止发稿时,该DLC已收录55篇评价,好评率94%,为...
01-31
极目新闻记者 潘锡珩通讯员 王琪 豆常翠 陈龙2月2日是春运第20天,40天的春运已过半。来自交通运输部的数据显示,从1月14日春运首日至2月2日,全社会跨区域人员流动量预计达到48...
02-03
据参考消息网援引俄新社2月5日报道,世界黄金协会发布的数据显示,去年俄罗斯居民的黄金购买量创下2013年以来最高纪录,并且首次跻身全球黄金消费量前五名。而中国人连续第12年在...
02-08
随着人类探索太空的脚步迈得越来越大,在月球上,甚至在火星上驻留并建设基地成为可能。想在月球上居住和旅行,水、氧气等生存资源和交通工具就不可或缺...
01-21
中国第41次南极考察队 完成“环”国际合作计划航空调查当地时间1月19日,由自然资源部组织的中国第41次南极考察队顺利完成南极研究科学委员会(SCAR)南...
01-24
  央视网消息:1月22日,文化和旅游部发布2024年度国内旅游数据。2024年,国内出游人次56.15亿,比上...
01-24
  先农坛庆成宫,北京中轴线上的一颗明珠。这是去年中轴线申遗成功后首个焕新亮相的古建筑群。...
02-05
新闻记者 潘锡珩通讯员 苏杭 徐媛媛1月21日凌晨0时55分,1168名旅客从广州白云站搭乘G4554次“夜行高铁”踏上返回武汉的归程,虽已是深夜,但旅客们回家的热情满满。这是中国铁路...
01-22
  作为新春的“氛围担当”之一,年宵花深受人们的喜爱。春节将至,年味渐浓,各地不同品种、五彩斑斓的年宵花已大量上市,满足消费者需求。  在山东济宁兖州区兴隆庄街道一...
01-22
1 月 21 日消息,奇瑞捷途纵横今日连续发布旗下首款车型预告视频,全新序列将于明日(1 月 22 日)19:00 举行新品发布会。从官方视频可以看到,这款新车采用了硬派 SUV 设计,...
01-21
1 月 23 日消息,从国家市场监督管理总局获悉,我国联合德国、日本、韩国、英国等国共同研制的多项智能网联汽车国际标准提案在国际标准化组织(ISO)成功立项,包括 4 项驾驶...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮