論文の概要: HCMD-zero: Learning Value Aligned Mechanisms from Data
- arxiv url: http://arxiv.org/abs/2202.10122v1
- Date: Mon, 21 Feb 2022 11:13:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 10:26:07.154947
- Title: HCMD-zero: Learning Value Aligned Mechanisms from Data
- Title(参考訳): HCMD-zero:データからバリューアラインメントメカニズムを学習する
- Authors: Jan Balaguer, Raphael Koster, Ari Weinstein, Lucy Campbell-Gillingham,
Christopher Summerfield, Matthew Botvinick, Andrea Tacchetti
- Abstract要約: HCMD-zeroは、メカニズムエージェントを構築するための汎用的な方法である。
参加者間の交流を仲介しながら学習し、自作の選挙コンテストに引き続き参加する。
HCMD-zero はヒトの被験者に常に好まれる競合機構因子を産生することを示した。
- 参考スコア(独自算出の注目度): 11.146694178077565
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial learning agents are mediating a larger and larger number of
interactions among humans, firms, and organizations, and the intersection
between mechanism design and machine learning has been heavily investigated in
recent years. However, mechanism design methods make strong assumptions on how
participants behave (e.g. rationality), or on the kind of knowledge designers
have access to a priori (e.g. access to strong baseline mechanisms). Here we
introduce HCMD-zero, a general purpose method to construct mechanism agents.
HCMD-zero learns by mediating interactions among participants, while remaining
engaged in an electoral contest with copies of itself, thereby accessing direct
feedback from participants. Our results on the Public Investment Game, a
stylized resource allocation game that highlights the tension between
productivity, equality and the temptation to free-ride, show that HCMD-zero
produces competitive mechanism agents that are consistently preferred by human
participants over baseline alternatives, and does so automatically, without
requiring human knowledge, and by using human data sparingly and effectively
Our detailed analysis shows HCMD-zero elicits consistent improvements over the
course of training, and that it results in a mechanism with an interpretable
and intuitive policy.
- Abstract(参考訳): 機械学習エージェントは、人間、企業、組織間の相互作用がますます多くなり、近年、メカニズム設計と機械学習の交わりが深く研究されている。
しかし、メカニズム設計手法は、参加者の振る舞い(合理性など)や、設計者が優先順位(例えば、強いベースライン機構へのアクセス)にアクセスできる知識の種類について強い仮定をする。
本稿では,機構エージェント構築のための汎用手法である hcmd-zero を紹介する。
HCMD-ゼロは、参加者間の相互作用を仲介しながら学習し、自作の選挙コンテストに引き続き参加し、参加者から直接フィードバックを得る。
Our results on the Public Investment Game, a stylized resource allocation game that highlights the tension between productivity, equality and the temptation to free-ride, show that HCMD-zero produces competitive mechanism agents that are consistently preferred by human participants over baseline alternatives, and does so automatically, without requiring human knowledge, and by using human data sparingly and effectively Our detailed analysis shows HCMD-zero elicits consistent improvements over the course of training, and that it results in a mechanism with an interpretable and intuitive policy.
関連論文リスト
- Competition of Mechanisms: Tracing How Language Models Handle Facts and Counterfactuals [82.68757839524677]
解釈可能性研究は、経験的成功と大規模言語モデル(LLM)の科学的理解のギャップを埋めることを目的としている。
本稿では,個々のメカニズムではなく,複数のメカニズムの相互作用に着目した,メカニズムの競合の定式化を提案する。
本研究は, 種々のモデル成分間の機構とその競合の痕跡を示し, 特定の機構の強度を効果的に制御する注意位置を明らかにした。
論文 参考訳(メタデータ) (2024-02-18T17:26:51Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Learning Multimodal Latent Dynamics for Human-Robot Interaction [19.803547418450236]
本稿では,ヒト-ヒトインタラクション(HHI)から協調型人間-ロボットインタラクション(HRI)を学習する方法を提案する。
本研究では,隠れマルコフモデル(HMM)を変分オートエンコーダの潜在空間として用いて,相互作用するエージェントの結合分布をモデル化するハイブリッドアプローチを考案する。
ユーザが私たちのメソッドを,より人間らしく,タイムリーで,正確なものと認識し,他のベースラインよりも高い優先度でメソッドをランク付けすることが分かりました。
論文 参考訳(メタデータ) (2023-11-27T23:56:59Z) - A Human-Machine Joint Learning Framework to Boost Endogenous BCI
Training [20.2015819836196]
内因性脳-コンピュータインターフェース(BCI)は、脳から外部デバイスへの直接的な経路を提供する。
自発的なBCI制御をマスターするには、画像によって識別的で安定した脳信号パターンを生成する必要がある。
そこで本研究では,内因性BCIにおける学習の促進を目的とした人間機械共同学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-25T01:24:18Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z) - Distributed Reinforcement Learning for Robot Teams: A Review [10.92709534981466]
近年のセンサ,アクティベーション,計算の進歩により,マルチロボットシステムへの扉が開きつつある。
コミュニティはモデルフリーのマルチエージェント強化学習を活用して、マルチロボットシステムのための効率的でスケーラブルなコントローラを開発した。
最近の知見:分散MSSは、非定常性や部分観測可能性などの根本的な課題に直面している。
論文 参考訳(メタデータ) (2022-04-07T15:34:19Z) - The Good Shepherd: An Oracle Agent for Mechanism Design [6.226991885861965]
本研究では,適応型コプレーヤの学習軌道上での評価を行うエージェント構築アルゴリズムを提案する。
以上の結果から,我々のメカニズムは参加者の望ましい成果への戦略をシェパードできることが示唆された。
論文 参考訳(メタデータ) (2022-02-21T11:28:09Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。