論文の概要: Balancing utility and cognitive cost in social representation
- arxiv url: http://arxiv.org/abs/2310.04852v2
- Date: Thu, 7 Dec 2023 22:19:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 18:15:55.583701
- Title: Balancing utility and cognitive cost in social representation
- Title(参考訳): 社会的表現における実用性と認知コストのバランス
- Authors: Max Taylor-Davies and Christopher G. Lucas
- Abstract要約: 我々は、下流のユーティリティと情報コストのトレードオフを最適に行うエージェント表現を見つけることの問題を動機付けている。
資源制約付き社会表現の2つの例を示す。
- 参考スコア(独自算出の注目度): 3.4447129363520337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To successfully navigate its environment, an agent must construct and
maintain representations of the other agents that it encounters. Such
representations are useful for many tasks, but they are not without cost. As a
result, agents must make decisions regarding how much information they choose
to store about the agents in their environment. Using selective social learning
as an example task, we motivate the problem of finding agent representations
that optimally trade off between downstream utility and information cost, and
illustrate two example approaches to resource-constrained social
representation.
- Abstract(参考訳): その環境をうまくナビゲートするには、エージェントが遭遇する他のエージェントの表現を構築し維持する必要がある。
このような表現は多くのタスクで役に立ちますが、コストはかかりません。
結果として、エージェントは、エージェントの環境にどれだけの情報を格納するかを決定する必要がある。
選択型ソーシャルラーニングを例題として,下流ユーティリティと情報コストのトレードオフを最適に行うエージェント表現を見つけることの課題を提起し,資源制約型ソーシャル表現の2つの例を示した。
関連論文リスト
- Representation Abstractions as Incentives for Reinforcement Learning
Agents: A Robotic Grasping Case Study [3.4777703321218225]
本研究は、特定のロボットタスクを解くためのエージェントのインセンティブ化における様々な状態表現の効果について検討する。
状態表現の抽象化の連続体は、完全なシステム知識を持つモデルベースのアプローチから始まる。
シミュレーションにおける課題の解決と実際のロボットへの学習方針の伝達性に対する各表現の効果について検討する。
論文 参考訳(メタデータ) (2023-09-21T11:41:22Z) - Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。
計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文 参考訳(メタデータ) (2023-05-08T07:52:15Z) - Strategic Resource Selection with Homophilic Agents [68.19497461624208]
類似エージェントとの共同資源利用を目指す異種エージェントを用いたリソース選択ゲームを提案する。
モデルでは,異なるタイプのエージェントを考慮し,その決定的特徴はユーザ間の同一型エージェントの割合である。
このような有界な有理性はゲーム理論上有利な性質を持つことを示す。
論文 参考訳(メタデータ) (2023-05-01T14:14:58Z) - Decentralized scheduling through an adaptive, trading-based multi-agent
system [1.7403133838762448]
多エージェント強化学習システムでは、あるエージェントの動作が他のエージェントの報酬に悪影響を及ぼす可能性がある。
この作業は、エージェントが入ってくるジョブをコアに割り当てる責任を負うシミュレーションスケジューリング環境に、トレーディングアプローチを適用します。
エージェントは計算コアの使用権を交換して、低優先度で低報酬のジョブよりも高速に、高利益のジョブを処理できる。
論文 参考訳(メタデータ) (2022-07-05T13:50:18Z) - Modeling Bounded Rationality in Multi-Agent Simulations Using Rationally
Inattentive Reinforcement Learning [85.86440477005523]
我々は、人間不合理性の確立されたモデルであるRational Inattention(RI)モデルを含む、より人間的なRLエージェントについて検討する。
RIRLは、相互情報を用いた認知情報処理のコストをモデル化する。
我々は、RIRLを用いることで、合理的な仮定の下で発見されたものと異なる、新しい平衡挙動の豊富なスペクトルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-18T20:54:00Z) - Statistical discrimination in learning agents [64.78141757063142]
統計的差別は、訓練人口のバイアスとエージェントアーキテクチャの両方の関数としてエージェントポリシーに現れる。
我々は、リカレントニューラルネットワークを使用するエージェントによる差別の低減と、トレーニング環境のバイアスの低減が示される。
論文 参考訳(メタデータ) (2021-10-21T18:28:57Z) - Towards Socially Intelligent Agents with Mental State Transition and
Human Utility [97.01430011496576]
対話エージェントに精神状態と実用性モデルを取り入れることを提案する。
ハイブリッド精神状態は、対話とイベント観察の両方から情報を抽出する。
ユーティリティモデルは、クラウドソースのソーシャルコモンセンスデータセットから人間の好みを学習するランキングモデルである。
論文 参考訳(メタデータ) (2021-03-12T00:06:51Z) - "I Don't Think So": Disagreement-Based Policy Summaries for Comparing
Agents [2.6270468656705765]
本稿では,エージェントのポリシーの違いを強調するコントラスト的な要約を生成する手法を提案する。
本結果から, 新規な不一致に基づく要約は, HighLIGHTS を用いた要約に比べてユーザパフォーマンスの向上につながることが示された。
論文 参考訳(メタデータ) (2021-02-05T09:09:00Z) - Improving Welfare in One-sided Matching using Simple Threshold Queries [9.270928705464193]
我々は、$n$エージェントが$m$オブジェクトよりも好みを持つ一方的なマッチング問題を研究する。
簡単なしきい値クエリを使って、彼らの基準的嗜好についてもっと学ぶことに集中する。
論文 参考訳(メタデータ) (2020-11-27T20:02:57Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。