論文の概要: Balancing utility and cognitive cost in social representation
- arxiv url: http://arxiv.org/abs/2310.04852v1
- Date: Sat, 7 Oct 2023 15:27:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 15:07:55.823565
- Title: Balancing utility and cognitive cost in social representation
- Title(参考訳): 社会的表現における実用性と認知コストのバランス
- Authors: Max Taylor-Davies and Christopher G. Lucas
- Abstract要約: 我々は、下流のユーティリティと情報コストのトレードオフを最適に行うエージェント表現を見つけることの問題を動機付けている。
資源制約付き社会表現の2つの例を示す。
- 参考スコア(独自算出の注目度): 3.4447129363520337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To successfully navigate its environment, an agent must construct and
maintain representations of the other agents that it encounters. Such
representations are useful for many tasks, but they are not without cost. As a
result, agents must make decisions regarding how much information they choose
to represent about the agents in their environment. Using selective imitation
as an example task, we motivate the problem of finding agent representations
that optimally trade off between downstream utility and information cost, and
illustrate two example approaches to resource-constrained social
representation.
- Abstract(参考訳): その環境をうまくナビゲートするには、エージェントが遭遇する他のエージェントの表現を構築し維持する必要がある。
このような表現は多くのタスクで役に立ちますが、コストはかかりません。
結果として、エージェントは、環境内のエージェントについて、どれだけ情報を表現すべきかを決定する必要がある。
提案手法を例示タスクとして,下流ユーティリティと情報コストを最適に切り離すエージェント表現の探索を動機付け,資源制約付き社会表現の2つの例を示す。
関連論文リスト
- Exploration and Persuasion [58.87314871998078]
我々は、自己関心のあるエージェントが利用したいときの探索にインセンティブを与える方法を示す。
不確実性の下で決定を下す利己的なエージェントの集団を考える。
彼らは新しい情報を取得し、良い決定を下すためにこの情報を「発見」する。
これは、探査が費用がかかるためであるが、将来多くのエージェントにその利点が広がるためである。
論文 参考訳(メタデータ) (2024-10-22T15:13:13Z) - State Representations as Incentives for Reinforcement Learning Agents: A Sim2Real Analysis on Robotic Grasping [3.4777703321218225]
本研究は、特定のロボットタスクを解くためのエージェントのインセンティブ化における様々な表現の効果について検討する。
手作りの数値状態から符号化された画像ベース表現に至るまで、状態表現の連続体が定義される。
シミュレーションにおけるエージェントの課題解決能力に対する各表現の影響と実ロボットへの学習方針の伝達可能性について検討した。
論文 参考訳(メタデータ) (2023-09-21T11:41:22Z) - Decongestion by Representation: Learning to Improve Economic Welfare in Marketplaces [14.105727639288316]
現代のオンラインマーケットプレースでは、価格は通常、売り手によって分散された方法で設定され、アイテムに関する情報は必然的に部分的である。
プラットフォームのパワーは、デフォルトでユーザに提示されるアイテムに関する情報のサブセットである表現を制御することに限定されます。
このことは、プラットフォームが混雑を減らし、社会的福祉を改善する表現を学習しようとする、代理表現による混雑の現在の研究を動機付けている。
論文 参考訳(メタデータ) (2023-06-18T17:44:53Z) - Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。
計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文 参考訳(メタデータ) (2023-05-08T07:52:15Z) - Modeling Bounded Rationality in Multi-Agent Simulations Using Rationally
Inattentive Reinforcement Learning [85.86440477005523]
我々は、人間不合理性の確立されたモデルであるRational Inattention(RI)モデルを含む、より人間的なRLエージェントについて検討する。
RIRLは、相互情報を用いた認知情報処理のコストをモデル化する。
我々は、RIRLを用いることで、合理的な仮定の下で発見されたものと異なる、新しい平衡挙動の豊富なスペクトルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-18T20:54:00Z) - Statistical discrimination in learning agents [64.78141757063142]
統計的差別は、訓練人口のバイアスとエージェントアーキテクチャの両方の関数としてエージェントポリシーに現れる。
我々は、リカレントニューラルネットワークを使用するエージェントによる差別の低減と、トレーニング環境のバイアスの低減が示される。
論文 参考訳(メタデータ) (2021-10-21T18:28:57Z) - Towards Socially Intelligent Agents with Mental State Transition and
Human Utility [97.01430011496576]
対話エージェントに精神状態と実用性モデルを取り入れることを提案する。
ハイブリッド精神状態は、対話とイベント観察の両方から情報を抽出する。
ユーティリティモデルは、クラウドソースのソーシャルコモンセンスデータセットから人間の好みを学習するランキングモデルである。
論文 参考訳(メタデータ) (2021-03-12T00:06:51Z) - "I Don't Think So": Disagreement-Based Policy Summaries for Comparing
Agents [2.6270468656705765]
本稿では,エージェントのポリシーの違いを強調するコントラスト的な要約を生成する手法を提案する。
本結果から, 新規な不一致に基づく要約は, HighLIGHTS を用いた要約に比べてユーザパフォーマンスの向上につながることが示された。
論文 参考訳(メタデータ) (2021-02-05T09:09:00Z) - Improving Welfare in One-sided Matching using Simple Threshold Queries [9.270928705464193]
我々は、$n$エージェントが$m$オブジェクトよりも好みを持つ一方的なマッチング問題を研究する。
簡単なしきい値クエリを使って、彼らの基準的嗜好についてもっと学ぶことに集中する。
論文 参考訳(メタデータ) (2020-11-27T20:02:57Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。