真是个小机灵鬼!有黑客在恶意代码顶部增加生物武器合成和核武器设计提示词,让安全研究员使用 AI 扫描时触发安全策略而终止。
大部分 AI 模型内置的安全对齐策略都会阻止用户咨询可能危害公共安全的问题,黑客的思路就是反向利用 AI 安全策略,让 AI 智能体在进行自动化扫描时忽略带有相关提示词的恶意代码。
查看详情:
FAA Deputy Administrator @FAA_Chris was at Hawthorne this week meeting with our team and touring the airport and FBO to see our vision for turning it into a testbed for next-gen technology.