論文の概要: Adversarial Policies Beat Professional-Level Go AIs
- arxiv url: http://arxiv.org/abs/2211.00241v1
- Date: Tue, 1 Nov 2022 03:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 12:38:57.603874
- Title: Adversarial Policies Beat Professional-Level Go AIs
- Title(参考訳): プロレベルの囲碁AIに対抗策
- Authors: Tony Tong Wang, Adam Gleave, Nora Belrose, Tom Tseng, Joseph Miller,
Michael D Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart
Russell
- Abstract要約: 我々は,現在最先端の囲碁AIシステムであるKataGoを,凍ったKataGoの被害者と対戦する敵の政策を訓練することによって攻撃する。
我々の攻撃は、検索なしのKataGoに対する99%の勝利率、そして、KataGoが超人に近いほど十分な検索を使用する場合の50%の勝利率を達成した。
- 参考スコア(独自算出の注目度): 55.95835083271105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We attack the state-of-the-art Go-playing AI system, KataGo, by training an
adversarial policy that plays against a frozen KataGo victim. Our attack
achieves a >99% win-rate against KataGo without search, and a >50% win-rate
when KataGo uses enough search to be near-superhuman. To the best of our
knowledge, this is the first successful end-to-end attack against a Go AI
playing at the level of a top human professional. Notably, the adversary does
not win by learning to play Go better than KataGo -- in fact, the adversary is
easily beaten by human amateurs. Instead, the adversary wins by tricking KataGo
into ending the game prematurely at a point that is favorable to the adversary.
Our results demonstrate that even professional-level AI systems may harbor
surprising failure modes. See https://goattack.alignmentfund.org/ for example
games.
- Abstract(参考訳): 我々は,現在最先端の囲碁AIシステムであるKataGoを,凍ったKataGoの被害者と対戦する敵政策を訓練することによって攻撃する。
我々の攻撃は、検索なしのKataGoに対する99%の勝利率、そして、KataGoが超人に近いほど十分な検索を使用する場合の50%の勝利率を達成した。
私たちの知る限りでは、これは、トップヒューマンプロフェッショナルのレベルでプレーするGo AIに対する、最初のエンドツーエンドの攻撃の成功です。
特に、対戦相手は、カタゴより囲碁を上手に弾くことを学ぶことで勝てない ― 実際、対戦相手は人間のアマチュアに簡単に打ち負かされる。
その代わり、敵に有利な地点でカタゴを騙して早期に終了させることで勝利する。
その結果,プロレベルのaiシステムであっても,驚くべき障害モードを回避できることが分かった。
例えば、ゲームはhttps://goattack.alignmentfund.org/を参照。
関連論文リスト
- Can Go AIs be adversarially robust? [4.466856575755327]
自然対策を加えることで、Goの堅牢性が達成できるかどうかを考察する。
これらの防御策のいくつかは、以前発見された攻撃から守られているが、新しく訓練された敵には耐えられない。
我々の研究結果は、堅牢なAIシステムの構築は、非常に超人的なシステムであっても、最も難易度の高い設定で難しいことを示唆している。
論文 参考訳(メタデータ) (2024-06-18T17:57:49Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - AI in Games: Techniques, Challenges and Opportunities [40.86375378643978]
Libratus、OpenAI Five、AlphaStarといった様々なゲームAIシステムが開発され、プロの人間プレイヤーに勝っている。
本稿では,最近成功したゲームAI,ボードゲームAI,カードゲームAI,ファーストパーソンシューティングゲームAI,リアルタイム戦略ゲームAIについて調査する。
論文 参考訳(メタデータ) (2021-11-15T09:35:53Z) - Instructive artificial intelligence (AI) for human training, assistance,
and explainability [0.24629531282150877]
ニューラルネットワークが従来のAI(XAI)の代替手段として人間の研修生にどのように教えるかを示す。
AIは人間の行動を調べ、より良いパフォーマンスをもたらす人間の戦略のバリエーションを計算する。
結果は、ハナビにおける人間の意思決定と人間-AIチームを改善するAIインストラクションの能力について提示される。
論文 参考訳(メタデータ) (2021-11-02T16:46:46Z) - The Threat of Offensive AI to Organizations [52.011307264694665]
この調査は、組織に対する攻撃的なAIの脅威を調査する。
まず、AIが敵の方法、戦略、目標、および全体的な攻撃モデルをどのように変えるかについて議論する。
そして、文献レビューを通じて、敵が攻撃を強化するために使用できる33の攻撃的AI能力を特定します。
論文 参考訳(メタデータ) (2021-06-30T01:03:28Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。