姚期智院士:AI欺骗引发“生存性”风险

1个月前 来源:澎湃新闻 观看:33

 4jU即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”4jU即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。4jU即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?4jU即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。4jU即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。4jU即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。4jU即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。4jU即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?4jU即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。4jU即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。4jU即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。4jU即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。4jU即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)4jU即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
  大众网记者 王一刚 报道  这个冬至,让我们和艺术撞个满怀……  为全面贯彻教育部发布的《关于全面实施学校美育浸润行动的通知》,“以美育浸润学生、以美育浸润教...
01-21
这几日乘坐一艘奢华的游轮,游过了三峡。  来之前自然是新奇的,因为还未在船上生活过,所以对于这人造科技巨物的每一寸都有着探索的欲望,至于三峡么,虽是自然伟力所造就,但在从...
01-21
  1月份以来,中邮理财有限责任公司(以下简称“中邮理财”)、中银理财有限责任公司?、建信理财有...
01-22
  1月17日,中国人民银行北京市分行发布行政处罚信息,北京农村商业银行股份有限公司因提供虚假的...
01-22
水瓶座的男生通常被认为是聪明、独立和有点神秘的人。他们喜欢自由和独处的时间,所以在...
01-22
天蝎座的女生通常被认为是十分独立、自信和坚强的,但当她们感到自己的爱情受到威胁时,她...
01-22
贵牛服饰品牌怎么样? uc品牌女装贵吗?贵牛服饰品牌怎么样?上海贵牛贸易有限公司成立于2013年, 总部设在广东省经济、 文化、贸易中心城市---广州市。是一家集生产、批发、销售...
02-12
揭秘北京T台走秀模特公司:行业内幕与精彩瞬间在灯光璀璨的T台上,模特们用自信的步伐和优雅的姿态为观众呈现了一场场视觉盛宴。作为北京这个时尚与文化交融的大都市,T台走秀模...
02-17
2月9日消息,从年初五到开工第一周,天猫上开运工位装饰用品同比增长超50%,迎来正式开工的年轻职场人把办公桌变成了许愿池,乐高招财猫、故宫金桂盆景香氛、朱炳仁聚宝盆等“祈福...
02-09
库克打出2025年第一张王牌。一、新款iPhone SE,售价不到4000?苹果新机马上来了!库克发文吊人胃口。就在今日凌晨时分,苹果CEO蒂姆·库克在社交媒体上发布了一段简短却充满悬念的...
02-15
2月6日消息,及时用车日前宣布,平台自2月3日起,全国统一上线“司机每日提现”权益,以解决司机资金周转难题,提升车辆运维效率,保障车辆资产安全。即日起,无论工作日还是节假日,司机师...
02-07
3月3日,美的发布了DeepSeek智能空调——美的鲜净感空气机T6,宣称“迈入空气思考时代”。据现场体验视频,当厨房TVOC超标时,系统会快速...
03-05
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
据中国民用航空局最新发布的统计数据,2024年,中国无人机产业迎来了前所未有的发展高潮。全年累计飞行时长达到了2666万小时,与去年相比,实现了15%的显著增长。这一数据不仅反映...
02-09
在《绝地潜兵》初代中,玩家实际上可以前往母星超级地球,进行保卫战。根据最新的泄露看来,《绝地潜兵2》的保卫站也已在制作当中,并且这场入侵我们将无法阻止。 数...
01-25
谷歌于上个月与三星和高通合作,推出了安卓扩展显示(AndroidXR)平台。 公司称它是“为下一代计算构建的新操作系统”,并且目前收购了 HTC Vive 的部分工程团队,他们...
01-25
极目新闻记者 张静娴在清晨六七点的随州农贸市场,卖菜卖肉的摊位前早已挤满了人,洋溢着浓厚的春节氛围。在年货市场上,最具代表性的特色年货莫过于炸三鲜了。从过年前几周一直...
02-04
中央气象台今早6点继续发布大风黄色预警和寒潮蓝色预警。大风黄色预警:预计今天8点到明天8点,华北、内蒙古中部、宁夏、陕西北部、黄淮等地的部分地区有5~6级、阵风7~8级的偏...
02-06
85后女董事长接班1年后,连续亏损的赛为智能要自救了?近日,赛为智能(300044.SZ)发布2024年度业绩预告。预告显示,赛为智能去年全年预计实...
01-23
中国探月工程嫦娥五号月球样品目前正在北京天文馆展出,“天文馆问月”吸引了众多大小天文迷前往,人们戏称看了展“四舍五入”也算去了趟月球。人们早...
01-21
  先农坛庆成宫,北京中轴线上的一颗明珠。这是去年中轴线申遗成功后首个焕新亮相的古建筑群。...
02-05
  2025年春节假期8天,全国国内出游5.01亿人次,同比增长5.9%。国内出游总花费6770.02亿元,同比增...
02-13
  首日销售突破1.7亿 6部新片争流春节档  记者 卢扬 实习记者 刘曼华  1月19日,据灯塔专业版,2025年春节档电影开启预售,截至1月19日21时40分,档期预售总票房已突破1.7亿...
01-21
  机票大降再现:春节北京往返三亚跌幅千元,旅客退票再订求性价比  随着春运火车票开售,不少热门目的地机票价格呈现下降趋势,游客出行性价比再度提升。1月19日,有游客向北京...
01-21
1 月 21 日消息,工业和信息化部副部长张云明今日在国新办新闻发布会上表示,新能源汽车产业面临国内竞争加剧、国际贸易壁垒高企等新形势新挑战。下一步,将围绕推动高质...
01-21
1 月 26 日消息,斯巴鲁近期被曝出一起严重的安全漏洞,虽然漏洞已经修复,但仍暴露了当前汽车在隐私保护方面的重大问题。据 Engadget 昨日报道,安全研究人员 Sam Curry ...
01-27
正在播出的《白色橄榄树》深受观众喜爱,每一集的情节引人入胜,人物角色贴合故事情节的发展,让观众在观看过程中不断产生好奇心。在电视剧第32集中,宋冉和李瓒终...
02-19
在某知名品牌的活动现场,林心如面对媒体镜头,坦诚地分享了自己对好友陈妍希离婚一事的看法。林心如透露,她是通过公开报道得知陈妍希与陈晓的婚姻走到了尽头。她感慨地说:“这样...
02-22
  如今在城市的大街小巷,不同类型的口腔治疗机构随处可见。这么多的口腔诊所对于消费者而言,是意味着享受更多优质医疗服务呢?还是...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向安徽将牵头开展全国生物药联盟集采1月14日,安...
01-21
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮