《国际AI安全报告》第二版关键更新发布
蒙特利尔2025年11月26日 /汽车产业互联快讯/ -- 现已发布,及时更新了通用AI的风险管理与技术缓和措施。
该报告由图灵奖得主、计算机科学家Yoshua Bengio主持,汇集了百余位国际专家的参与,并获得包括欧盟、经合组织和联合国在内的30多个国家和国际组织的支持。
鉴于该领域发展速度过快,单一年度报告已无法及时反映进展,因此推出“关键更新”系列,以更短、更聚焦的形式呈现关键动态。 本次更新延续了首版关键更新,首版已于2025年10月15日发布。 这些更新确保决策者能够获得最新的文献综述,为循证决策提供依据。
第二版关键更新涵盖了提升可靠性与防范滥用的技术方法概述,以及风险管理领域新兴的制度化方法。 其核心重点包括:
- 在训练模型抵御恶意攻击方面虽有所进展,但仍存在不足。 尽管AI模型及系统抵御攻击的能力有所提升,但技术娴熟的黑客仍能在约50%的案例中仅用10次尝试即可突破防护,并通过向训练数据中注入少至250条恶意文档来投毒并破坏模型。
- 开源鸿沟正在缩小。 开放权重模型如今与行业领先产品的差距已不足一年,虽然这有助于提升技术普及度,但同时也使预防故障和滥用的难度加大。
- 行业在安全方面的承诺有所增加,但其成效仍不明确。 尽管2025年采用风险管理框架的AI企业数量增加一倍有余,但其实际效果仍存在不确定性。
《报告》主编、蒙特利尔大学(Université de Montréal)终身教授、LawZero科学总监兼Mila - Quebec AI Institute科学顾问Yoshua Bengio表示:
“在持续关注AI能力与风险动态的同时,我们必须同步规划清晰的风险管理路径,确保采取恰当有效的风险管控措施与技术缓和方案。 本次关键更新概述了这些领域的最新进展,同时指出了仍然存在的不足之处与尚待把握的机遇。 我们的目标是持续向全球决策者提供有关AI发展的及时更新,而第二份《国际AI安全报告》计划于2026年初发布,并将在印度举办的AI影响力峰会之前推出。”
关于
《国际AI安全报告》是对先进AI系统能力及相关风险证据的综合性汇编分析。 该报告旨在为全球决策者提供证据基础,从而为知情决策提供支持。 该报告由100多名独立专家组成的多元团队撰写,并获得专家咨询委员会的支持。该委员会由来自30多个国家及国际组织(包括欧盟、经合组织和联合国)的提名代表组成。 该报告认可AI所具备的巨大潜在效益,但其重点在于识别风险并评估缓和策略,以确保AI能够安全地开发和使用,进而造福全人类。 该报告由英国政府委托编写,其秘书处设于英国AI安全研究所。
联系方式:Mila Medias(medias@mila.quebec);DSIT媒体垂询(press@dsit.gov.uk)
- 麦田能源举办2026全球客户峰会,超300位国际合作伙伴齐聚温州
- 招商信诺两项数字化项目获评"2025年中国保险业数字化转型优秀案例"
- VivaTech 2026信心晴雨表:一个悖论
- 隆基精控连续第七次荣登BNEF Tier 1榜单,以确定性储能解决方案护航全球客户
- 广东精神与东风龙擎动力——快递物流行业的时代力量
- 东风商用车携手湖北交投和宜化集团——宜昌新能源绿色矿山战略合作暨首批车辆交付
- Checkout.com 与 Spotify 达成全球战略支付合作伙伴关系,助力其全区业务版图
- 三十而力,聚势共赢:软通华方2026全国数智伙伴领航峰会盛大开幕
- 韩智敏:软通华方开启"一个新品牌的第30年",与伙伴共赴智算星辰大海
- tesa、ZEISS、Saint-Gobain Sekurit与Hyundai Mobis携手创新

