AIニュース

OpenAIがAI安全性のバグ報奨金プログラムを開始

2026/3/26 6:36:52
OpenAI News
via Introducing the OpenAI Safety Bug Bounty program | OpenAI
OpenAIがAI安全性のバグ報奨金プログラムを開始

当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

OpenAIは2026年3月25日、AIの悪用や安全リスクを発見した研究者に報酬を支払う「Safety Bug Bounty(安全性バグ報奨金)プログラム」を正式に公開しました。これまで存在していたセキュリティ系のバグ報奨金プログラムを補完する形で、従来の脆弱性には該当しないものの安全性上のリスクとなりうる問題も対象に含めています。 対象となる問題は主に3つのカテゴリに分類されています。1つ目はAIエージェントへの不正操作(プロンプトインジェクション)やデータ漏えいリスクで、攻撃者の文章によってChatGPTエージェントなどが意図しない操作をされる場合が該当します。2つ目はモデルが推論過程の内部情報を返してしまうなどOpenAI独自の情報流出リスク、3つ目はアカウントや利用規約の不正回避です。 一方で、モデルに無理やり禁止ワードを言わせるような「ジェイルブレイク」は基本的に対象外とされています。ただし生物リスクなど特定の危険分野については、別途プライベートなバグ報奨金キャンペーンを定期的に実施しており、興味ある研究者は応募できます。 このプログラムにより、セキュリティ研究者や倫理的なハッカーがAIの安全性向上に貢献しやすい仕組みが整いました。AI技術の急速な進化に伴う悪用リスクへの対策を外部の協力者とともに強化する取り組みとして、業界全体に影響を与える可能性があります。

関連記事