近日,Google宣布将扩大其漏洞赏金计划的范围,包括对生成式AI中可能存在的漏洞和安全问题的奖励。这一举措旨在激励研究AI的安全性和安全问题,以最终提高AI的安全性,使其更适合广泛应用。
Google的漏洞赏金计划将覆盖其自家生成式AI产品,如Google Bard,该产品在多个国家可用,以及Google Cloud的Contact Center AI、Agent Assist等。这一举措得到了Google的信任与安全副总裁Laurie Richardson和隐私、安全与安全工程副总裁Royal Hansen的支持。
谷歌在10月26日的博客中表示:“我们相信这将激励围绕AI安全和安全性的研究,揭示潜在问题,从而最终使AI对每个人更加安全。我们还将扩展我们的开源安全工作,以使有关AI供应链安全的信息能够普遍被发现和验证。”
然而,需要注意的是,生成式AI存在一些传统计算机所没有的风险,如不公平的偏见、模型操纵和数据误解。对于漏洞赏金计划而言,AI“幻觉”——即私人浏览会话中生成的错误信息——不被视为漏洞。而将敏感信息暴露、未经用户同意改变Google用户帐户状态或提供生成式AI模型后门的攻击则在奖励范围之内。
Google的漏洞赏金计划奖励范围从100美元到31,337美元不等,具体的奖励细节可以在Google的Bug Hunters网站上找到。
此外,除了Google,其他组织如OpenAI和微软也为发现生成式AI系统漏洞的白帽黑客提供漏洞赏金。微软奖励范围为2,000美元至15,000美元,而OpenAI的漏洞赏金计划则提供200美元至20,000美元的奖励。