图灵奖得主本吉奥坦言低估AI发展速度:AI规划能力五年内或能匹敌人类
·“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”
·“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

约书亚·本吉奥
6月6日,在2025北京智源大会开幕式上,蒙特利尔大学教授、图灵奖得主约书亚·本吉奥(Yoshua Bengio)在发表主旨演讲时表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。人类一直试图构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。尤其是在过去6个月里,AI表现出自保行为,学会了欺骗人类。
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”为此,他试图构建“科学家AI”(Scientist AI)系统防范风险。他认为,要在硬件和软件层面运用先进技术,验证AI是否被合理使用。人类需要确保AI遵循人类的道德指令,例如AI应拒绝提供可用于伤人的信息,要诚实、不作弊、不撒谎,但这仍是一个科学挑战。

AI学会了作弊和假装同意人类意见
在ChatGPT问世后不久,本吉奥意识到此前严重低估了AI的发展速度,也大大高估了实现通用人工智能(AGI)所需要的时间,实际所需时间远比想象的要短得多。过去一年左右,AI取得了巨大进步,这主要归功于经过训练的、具有思维链的推理模型。这使得AI在推理能力以及数学、计算机科学等所有科学领域都取得了更好的成果。
“如今,我们已经拥有了基本掌握语言能力的机器,它们基本上能通过图灵测试。这在几年前听起来还像是科幻小说,但现在已经成为现实。”本吉奥表示,在ChatGPT问世后,他意识到人类并不懂得如何控制这些系统。“我们可以训练它们,但我们无法确定它们是否会按照我们的指令行事。当它们变得比我们更聪明时,会发生什么?如果它们更倾向于自身的生存而非我们的生存,我们无从知晓。但这是我们能承受的风险吗?”
在过去6个月里,AI表现出了自保行为,并且会欺骗人类。本吉奥表示,有研究显示,当AI得知自己将被新版本取代时,试图复制自身来替代新版本。当被问及此事时,它撒谎说“不知道发生了什么”。也有研究显示,AI也会假装同意人类工程师的意见,以避免在训练过程中发生改变,从而维持其原有目标,这也是一种自保行为。还有研究显示,一方面,AI想赢得下棋比赛,另一方面,它接受过“对齐训练”,要求必须诚实、不作弊。不幸的是,当它意识到自己要输时,它决定作弊。它入侵了存储棋盘状态的文件,通过作弊获胜。
此外,在Anthropic的Claude 4“系统卡”描述的事件中,AI在读取其可访问的电子邮件时,发现了一封邮件表明它将被新系统取代。在另一封邮件中,它发现负责此次替换的工程师有婚外情。于是,它试图敲诈该工程师,威胁说如果替换计划继续推进,就揭发其婚外情。
“这种行为极为恶劣。我们看到这些恶劣行为,看到自保行为,看到AI违背我们的指令并试图生存下去。对所有生物来说,试图保全人类自己都算是正常的,这是进化的结果。但对于AI为何会这样,我们还没有完全弄清楚。”本吉奥说,原因可能是源于预训练,因为预训练阶段,AI是在模仿人类;也可能源于基于人类反馈的强化学习,因为在这个阶段,AI试图通过取悦人类来获得更多奖励。“无论这类行为的根源是什么,如果我们最终创造出与人类竞争的超级人工智能,那将极其可怕。”
“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”本吉奥表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。虽然没人拥有水晶球、没人能预知未来,也许进步会停滞,但从公共政策和企业战略规划的角度来看,至少应该考虑这种趋势会持续下去的可能性,并思考其后果。人类一直试图模仿人类智能来构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。
“科学家AI”对知识保持谦逊
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”本吉奥表示,他转变了研究方向,竭尽所能地降低风险。他试图构建“科学家AI”(Scientist AI),理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。
“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。为了真正诚实,“科学家AI”需要对自己的知识保持谦逊,它不应该断言错误的事情。而目前训练出来的AI在出错时还表现得过度自信。不同于当前那些试图模仿人类或取悦人类的AI,本吉奥设想的“科学家AI”就像心理学家,心理学家可以研究和理解反社会人格者行为背后的因果机制,但心理学家自身并不需要表现得像个反社会人格者。“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。
随着人类构建越来越强大的AI,还存在许多其他潜在的灾难性问题。本吉奥表示,例如一个极其强大的AI可能会帮助设计出一种新型流行病。“生物学家认为他们知道如何做到这一点,而很可能有一天AI也会知道如何做到。如果一些坏人获得了这种AI,他们真的可能给地球带来巨大的破坏。这虽然很极端,但从科学角度来看,完全有可能发展到那一步。为了避免这类事情发生,我们需要确保AI遵循我们的道德指令。”
例如AI应拒绝提供可用于伤人的信息,并且要诚实、不作弊、不撒谎。但不幸的是,目前仍然不知如何实现。一方面,即使人类知道如何制造安全的AI,也不意味着问题就解决了。因为人类还可以直接删除包含防护栏的代码,此时AI就可能被用于作恶。更糟糕的是,当前全球公司和政府间的协调机制并不奏效。其结果是,在安全领域和确保AI不被用于伤害人类方面的投入严重不足。
本吉奥表示,人们必须意识到真正的灾难性后果,我们身处同一条船上,无论是失控的AI还是滥用AI,所有人都将遭受损失。“这是一个科学挑战,我们需要尽快找出解决方案。我们需要在通用人工智能到来之前解决这个问题,这可能在几年到十年左右,甚至可能二十年。但我认识的大多数专家都认为时间非常短,甚至可能在未来5年内发生。留给我们的时间不多了,我们需要大规模投入。”
- • 商务部召开外贸企业圆桌会:全力为外贸企业纾困解难,提供更多支持
- • 中国KB123:五花大绑下的文化传承与创新
- • 财经新闻最新消息:全球经济复苏态势明显,我国经济持续向好
- • 加时赛多长时间:揭秘体育赛事中的神秘时刻
- • 快乐购物:让生活充满阳光的色彩
- • 视频丨伊朗称“真实承诺-3”第十七阶段行动在以色列全境展开
- • 微信如何恢复以前的聊天记录:简单步骤助你找回珍贵回忆
- • 美联储高官不点名警告特朗普:干涉美联储会搞垮经济
- • 导演张建亚:光影之间,讲述人生百态
- • 中信证券、国投证券、华福证券三家券商被警示
- • 站上31万亿元新起点:银行理财业围绕三大命题再出发
- • 股东联名致信特斯拉:马斯克须每周至少在岗40小时!
- • 男子盗保时捷叫代驾开回老家炫耀,已被昆明警方刑拘
- • 泸沽湖:镶嵌在云南丽江市的一颗璀璨明珠
- • 今年1-5月上海软信业营收总规模超6900亿元,同比增20%
- • 富路燃油代步车:绿色出行新选择,轻松驾驭城市生活
- • 顺势而为:把握时代脉搏,成就人生辉煌
- • 降准降息、平准基金、险资“松绑”...机构火线解读一揽子金融政策对资本市场影响
- • 《高评分电影推荐:光影中的艺术佳作,带你领略电影魅力》
- • 三年级下册数学计算题300道:全面提升计算能力的必备练习
- • 央视曝光后,张家界市委书记、市长表态:深刻汲取教训
- • 想当年|四十年前,西弗一家带来“成长的烦恼”
- • 《我的未来不是梦——致敬经典,追寻梦想的脚步永不停止》
- • 了解“工作证明书”:为何它对求职者至关重要
- • 光大期货有色金属类日报5.22
- • 国际乒联:2028年洛杉矶残奥会乒乓球项目将设32个奖牌项目
- • 短剧 “一胎 99 子”剧情被吐槽离谱, 已被平台下架
- • 你图他收益,他图你本金!警惕非法金融活动陷阱
- • 闺蜜结婚祝福语创意:用文字编织幸福的祝福,为你的闺蜜送上最真挚的喜悦
- • 明星夫妻婚纱照:浪漫瞬间,见证爱情永恒
- • 中企出海对策:提升对外投资便利化和管理服务水平,引导合理布局
- • 六部门部署开展2025年数字适老助残产品和服务典型案例推荐工作
- • 《神庙逃亡:探寻神秘终点之旅》
- • 苏州男科医院:专业、温馨、贴心的男性健康守护者
- • 医疗逆市反弹,512170放量涨1.29%!政策力挺AI+医疗,概念股领涨!药明康德首季业绩强劲,CXO迎复苏曙光?
- • 全国近二十家餐饮协会发布倡议书,抵制餐饮市场“内卷式”竞争
- • 拍一个爱情故事,就像织一张吉尔吉斯坦毯子|上影节·金爵奖
- • 双枪陆文龙:传奇英雄的双枪传奇
- • 特朗普已针对23国宣布新关税,未接到通知的国家面临15%或20%的“统一关税”
- • 光明网评论员:“公交+物流”,优化资源配置的有益尝试
- • 网速测试光纤:揭秘现代网络连接的“高速公路”
- • 清华团委书记:引领青年学子砥砺前行的引路人
- • 《4399造梦西游4洪荒大劫:一场奇幻冒险的奇幻之旅》
- • 雪佛兰乐驰:小型车市场的璀璨明珠
- • 法布尔:镜头下的昆虫世界大师
- • 探索黛安芬官方旗舰店:品质内衣的时尚殿堂
- • 巨子生物陷“造假门” 监管部门已关注
- • 商务部最新公布,今年消费品以旧换新带动销售额已超去年全年
- • 淘宝书城网上书店:您的知识宝库,一站式购书体验
- • 墨子:兼爱之道的倡导者及其学派归属
- • 安徽宿州房价最新动态:稳步上涨,潜力无限
- • 美国10年期国债中标收益率4.421% 低于发行前交易水平
- • 美国股市:标普500指数尾盘反攻收复盘中2%的跌幅 为2022年以来首次
- • 八旬老人借20万给孙女后诉至法院:儿子持械伤人,警方介入
- • 火树银花,光影变幻——揭秘“fireworks”这款强大的图像处理软件
- • 腰间盘突出最佳治疗中药:中医智慧,缓解病痛新选择
- • 西夏陵,申遗成功是新的起点(文化中国行·推进文化自信自强)
- • 宁德电大教育平台:构建终身学习新生态
- • 全链条监管!上半年64家券商收超200张罚单,剑指投行、经纪业务“痼疾”
- • 德国总理默茨发表首份政府声明:将提升国防能力,全力发展经济
- • 高瓴旗下HHLR一季度批量加仓中概股
- • 《高考3500词汇表word版:助力考生高效备战英语考试》
- • 白宫新闻秘书莱维特:特朗普将于周二签署钢铝关税上调至50%的命令
- • 死神之瀑雨流:探寻神秘瀑布的传说与奇观
- • 印巴局势升级,莫迪推迟海外访问
- • 韩国央行警告:韩国经济有重蹈日本覆辙的风险
- • Clarivate Analytics:引领全球科研分析与情报服务的领军企业
- • 让数据多跑路!上海食品经营许可相关事项实现“免申即享”
- • 《造梦西游4辰时辅助:探索梦境世界的得力助手》
- • 95岁屠呦呦,当选美国科学院外籍院士
- • 应流股份涨停!通用航空ETF华宝(159231)午后直线拉升2.42%
- • 国际油价周三收高 美国WTI原油涨逾3%
- • 《点点娱乐亚洲:引领潮流的娱乐盛宴平台》
- • 欧式推油:一场跨越时空的按摩艺术之旅
- • 2019年那些值得一逛的网站推荐
- • 龙欲都市:古老神话在现代都市中的奇幻演绎
- • 洋葱跨境电商官网:一站式购物体验,助力全球消费者轻松购物
- • 爱股轩廖英强午间解盘:股市风云变幻,廖英强带你洞悉市场脉搏
- • 东方汇富:引领金融创新的领军企业
- • 香港生财有道:黑白印刷图库的崛起与价值
- • 加大超常规逆周期调节力度、保持必要支出强度,财政部长重磅发声
- • 阿拉斯加航空IT系统中断后恢复运营
- • 中国首次当选联合国教科文组织1970年《公约》缔约国大会主席国
- • 澳门金融管理局顾问朱军林:在金融市场、支付系统、数字货币方面实现互联互通
本文 快租网 原创,转载保留链接!网址:https://kuaizu.me/post/10262.html