論文の概要: Policy-Adaptable Methods For Resolving Normative Conflicts Through Argumentation and Graph Colouring
- arxiv url: http://arxiv.org/abs/2501.11799v1
- Date: Tue, 21 Jan 2025 00:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:20:23.590207
- Title: Policy-Adaptable Methods For Resolving Normative Conflicts Through Argumentation and Graph Colouring
- Title(参考訳): argumentation と Graph Colouring による規範的矛盾を解決するためのポリシー適応型手法
- Authors: Johnny Joyce,
- Abstract要約: マルチエージェントシステムでは、標準を課すことでエージェントの振る舞いを制御できる。
しかし、1つ以上のエージェントに複数の規範を課すことは、エージェントの振る舞いに関してこれらの規範が矛盾する状況を引き起こす可能性がある。
本稿では,議論とグラフカラー化による規範的対立を解決する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In a multi-agent system, one may choose to govern the behaviour of an agent by imposing norms, which act as guidelines for how agents should act either all of the time or in given situations. However, imposing multiple norms on one or more agents may result in situations where these norms conflict over how the agent should behave. In any system with normative conflicts (such as safe reinforcement models or systems which monitor safety protocols), one must decide which norms should be followed such that the most important and most relevant norms are maintained. We introduce a new method for resolving normative conflicts through argumentation and graph colouring which is compatible with a variety of normative conflict resolution policies. We prove that this method always creates an admissible set of arguments under argumentation semantics, meaning that it produces coherent outputs. We also introduce more robust variants of this method, each building upon their predecessor to create a superior output, and we include further mathematical proof of their coherence. Our most advanced variant uses the existing concept of curtailment, where one norm may supersede another without fully eliminating it. The methods we introduce are all compatible with various pre-existing policies for resolving normative conflicts. Empirical evaluations are also performed to compare our algorithms to each other and to others in existing literature.
- Abstract(参考訳): マルチエージェントシステムでは、エージェントが常に、あるいは特定の状況においてどのように振る舞うかのガイドラインとして行動する規範を課すことによって、エージェントの行動を管理することができる。
しかし、1つ以上のエージェントに複数の規範を課すことは、エージェントの振る舞いに関してこれらの規範が矛盾する状況を引き起こす可能性がある。
基準的競合(安全強化モデルや安全プロトコルを監視するシステムなど)を持つシステムでは、最も重要かつ最も関連する基準が維持されるように、どの基準に従うべきかを決定する必要がある。
本稿では,様々な規範的対立解決ポリシーと互換性のある議論やグラフカラー化を通じて,規範的対立を解決する新しい手法を提案する。
我々は、この手法が常に議論のセマンティクスの下で許容可能な引数集合を生成することを証明し、コヒーレントな出力を生成する。
また、この手法のより堅牢な変種を導入し、それぞれが先行して優れた出力を生み出すように構築し、それらの一貫性のさらなる数学的証明を含む。
我々の最も先進的な変種は、あるノルムがそれを完全に排除せずに別のノルムに取って代わる、既存の補正の概念を使っている。
私たちが導入した手法はすべて、規範的対立を解決するための様々な既存のポリシーと互換性がある。
また、既存の文献において、我々のアルゴリズムと他者とを比較して経験的評価を行う。
関連論文リスト
- Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.81324245896717]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。
制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文 参考訳(メタデータ) (2024-07-15T14:54:57Z) - A Defeasible Deontic Calculus for Resolving Norm Conflicts [7.455546102930911]
我々は、標準の矛盾を解決することを証明するためにデオン計算を使用する。
また、レッドハーリングとして共通の解決戦略を明らかにします。
そこで本論文は,標準衝突検出と分解の理論的に正当化された公理化に寄与する。
論文 参考訳(メタデータ) (2024-07-05T21:16:16Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - SoFA: Shielded On-the-fly Alignment via Priority Rule Following [90.32819418613407]
本稿では,各ダイアログにおけるルールを主制御機構として定義する,新たなアライメントパラダイムである優先ルールを提案する。
そこで本研究では,厳密な規則統合と固着性を確保するために,シミュレーションから優先信号に従う半自動蒸留手法であるプライオリティディスティルを提案する。
論文 参考訳(メタデータ) (2024-02-27T09:52:27Z) - Bridging the Global Divide in AI Regulation: A Proposal for a Contextual, Coherent, and Commensurable Framework [0.9622882291833615]
本稿では、人工知能(AI)を制御するための文脈的・一貫性的・包括的枠組み(3C)を提案する。
コンテキスト性を確保するため、このフレームワークはAIライフサイクルを、基礎や汎用モデルを定義するのではなく、特定のタスクの学習とデプロイという2つのフェーズに分岐させる。
コンメンサビリティを確保するため、この枠組みはリスクの測定と緩和のための国際標準の採用を促進する。
論文 参考訳(メタデータ) (2023-03-20T15:23:40Z) - Policy Dispersion in Non-Markovian Environment [53.05904889617441]
本稿では,非マルコフ環境下での国家行動ペアの歴史から,多様な政策の学習を試みる。
まず、ポリシー埋め込みを学習するために、トランスフォーマーベースの手法を採用する。
次に,政策埋め込みを積み重ねて分散行列を構築し,多様な政策の集合を誘導する。
論文 参考訳(メタデータ) (2023-02-28T11:58:39Z) - Normative Disagreement as a Challenge for Cooperative AI [56.34005280792013]
典型的な協調誘導学習アルゴリズムは、問題の解決に協力することができないと論じる。
我々は,ノルム適応政策のクラスを開発し,これらが協調性を著しく向上させることを示す実験を行った。
論文 参考訳(メタデータ) (2021-11-27T11:37:42Z) - Dealing with Non-Stationarity in Multi-Agent Reinforcement Learning via
Trust Region Decomposition [52.06086375833474]
非定常性は多エージェント強化学習における厄介な問題である。
ポリシーシーケンスの定常性を明示的にモデル化するための$delta$-stationarity測定を導入する。
共同政策の分岐を推定するために,メッセージパッシングに基づく信頼領域分解ネットワークを提案する。
論文 参考訳(メタデータ) (2021-02-21T14:46:50Z) - Diverse Rule Sets [20.170305081348328]
ルールベースのシステムは、直感的なif-then表現のためにルネッサンスを経験しています。
本稿では,ルール間の重なり合いを最適化することで,多様なルールセットを推定する新しい手法を提案する。
次に、高い差別性を持ち、重複が少ない規則をサンプリングする効率的なランダム化アルゴリズムを考案する。
論文 参考訳(メタデータ) (2020-06-17T14:15:25Z) - A Norm Emergence Framework for Normative MAS -- Position Paper [0.90238471756546]
本稿では,規範的マルチエージェントシステムにおける規範の出現のための枠組みを提案する。
同様に、エージェントのパーセンテージがノルムを採用すると、ノルムがノルムMASに出現する。
我々は、規範的MAS内での規範の出現のための枠組みを提唱し、特殊目的シンセサイザーエージェントは、これらの要求に応じて新しい規範や修正を定式化する。
論文 参考訳(メタデータ) (2020-04-06T11:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。