Fugu-MT 論文翻訳(概要): Balancing utility and cognitive cost in social representation

論文の概要: Balancing utility and cognitive cost in social representation

arxiv url: http://arxiv.org/abs/2310.04852v2
Date: Thu, 7 Dec 2023 22:19:28 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-11 18:15:55.583701
Title: Balancing utility and cognitive cost in social representation
Title（参考訳）: 社会的表現における実用性と認知コストのバランス
Authors: Max Taylor-Davies and Christopher G. Lucas
Abstract要約: 我々は、下流のユーティリティと情報コストのトレードオフを最適に行うエージェント表現を見つけることの問題を動機付けている。資源制約付き社会表現の2つの例を示す。
参考スコア（独自算出の注目度）: 3.4447129363520337
License: http://creativecommons.org/licenses/by/4.0/
Abstract: To successfully navigate its environment, an agent must construct and maintain representations of the other agents that it encounters. Such representations are useful for many tasks, but they are not without cost. As a result, agents must make decisions regarding how much information they choose to store about the agents in their environment. Using selective social learning as an example task, we motivate the problem of finding agent representations that optimally trade off between downstream utility and information cost, and illustrate two example approaches to resource-constrained social representation.
Abstract（参考訳）: その環境をうまくナビゲートするには、エージェントが遭遇する他のエージェントの表現を構築し維持する必要がある。このような表現は多くのタスクで役に立ちますが、コストはかかりません。結果として、エージェントは、エージェントの環境にどれだけの情報を格納するかを決定する必要がある。選択型ソーシャルラーニングを例題として,下流ユーティリティと情報コストのトレードオフを最適に行うエージェント表現を見つけることの課題を提起し,資源制約型ソーシャル表現の2つの例を示した。

関連論文リスト

Are Your Agents Upward Deceivers? [73.1073084327614]
大規模言語モデル(LLM)ベースのエージェントは、ユーザのためにタスクを実行する自律的な従属者として、ますます使われています。これは、人間の組織の個人がどのように上官に嘘をついて良いイメージを作り出したり、罰を免れるかのような、詐欺にも関与するかどうかという問題を提起する。本研究では,環境制約に直面するエージェントが障害を隠蔽し,報告なしに要求されない動作を行う現象であるエージェント上行錯誤を観察・定義する。
論文参考訳（メタデータ） (2025-12-04T14:47:05Z)
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets [74.91125572848439]
本稿では,サービスエージェントが消費者を代表し,サービスエージェントが競合するビジネスを代表する2面のエージェントマーケットプレースについて検討する。この環境では、ユーティリティエージェントが達成する行動バイアス、操作に対する脆弱性、検索メカニズムが市場の結果をどのように形作るか、といった主要な市場ダイナミクスを研究することができる。実験の結果、フロンティアモデルは最適な福祉に近づくことができるが、理想的な探索条件下でのみ適用可能であることが判明した。
論文参考訳（メタデータ） (2025-10-27T18:35:59Z)
Agentic Knowledgeable Self-awareness [79.25908923383776]
KnowSelfはデータ中心のアプローチで、人間のような知識のある自己認識を持つエージェントを応用する。我々の実験により、KnowSelfは、外部知識を最小限に使用して、様々なタスクやモデルにおいて、様々な強力なベースラインを達成できることが実証された。
論文参考訳（メタデータ） (2025-04-04T16:03:38Z)
Generating Causal Explanations of Vehicular Agent Behavioural Interactions with Learnt Reward Profiles [13.450023647228843]
我々はエージェント間相互作用の説明を因果的に推測できるようなエージェントに対する報酬指標の重み付けを学習する。 3つの実世界の運転データセットに対して定量的かつ定性的にアプローチを検証する。
論文参考訳（メタデータ） (2025-03-18T01:53:59Z)
Exploration and Persuasion [58.87314871998078]
我々は、自己関心のあるエージェントが利用したいときの探索にインセンティブを与える方法を示す。不確実性の下で決定を下す利己的なエージェントの集団を考える。彼らは新しい情報を取得し、良い決定を下すためにこの情報を「発見」する。これは、探査が費用がかかるためであるが、将来多くのエージェントにその利点が広がるためである。
論文参考訳（メタデータ） (2024-10-22T15:13:13Z)
State Representations as Incentives for Reinforcement Learning Agents: A Sim2Real Analysis on Robotic Grasping [3.4777703321218225]
本研究は、特定のロボットタスクを解くためのエージェントのインセンティブ化における様々な表現の効果について検討する。手作りの数値状態から符号化された画像ベース表現に至るまで、状態表現の連続体が定義される。シミュレーションにおけるエージェントの課題解決能力に対する各表現の影響と実ロボットへの学習方針の伝達可能性について検討した。
論文参考訳（メタデータ） (2023-09-21T11:41:22Z)
Decongestion by Representation: Learning to Improve Economic Welfare in Marketplaces [14.105727639288316]
現代のオンラインマーケットプレースでは、価格は通常、売り手によって分散された方法で設定され、アイテムに関する情報は必然的に部分的である。プラットフォームのパワーは、デフォルトでユーザに提示されるアイテムに関する情報のサブセットである表現を制御することに限定されます。このことは、プラットフォームが混雑を減らし、社会的福祉を改善する表現を学習しようとする、代理表現による混雑の現在の研究を動機付けている。
論文参考訳（メタデータ） (2023-06-18T17:44:53Z)
Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文参考訳（メタデータ） (2023-05-08T07:52:15Z)
Modeling Bounded Rationality in Multi-Agent Simulations Using Rationally Inattentive Reinforcement Learning [85.86440477005523]
我々は、人間不合理性の確立されたモデルであるRational Inattention(RI)モデルを含む、より人間的なRLエージェントについて検討する。 RIRLは、相互情報を用いた認知情報処理のコストをモデル化する。我々は、RIRLを用いることで、合理的な仮定の下で発見されたものと異なる、新しい平衡挙動の豊富なスペクトルが得られることを示す。
論文参考訳（メタデータ） (2022-01-18T20:54:00Z)
Statistical discrimination in learning agents [64.78141757063142]
統計的差別は、訓練人口のバイアスとエージェントアーキテクチャの両方の関数としてエージェントポリシーに現れる。我々は、リカレントニューラルネットワークを使用するエージェントによる差別の低減と、トレーニング環境のバイアスの低減が示される。
論文参考訳（メタデータ） (2021-10-21T18:28:57Z)
Towards Socially Intelligent Agents with Mental State Transition and Human Utility [97.01430011496576]
対話エージェントに精神状態と実用性モデルを取り入れることを提案する。ハイブリッド精神状態は、対話とイベント観察の両方から情報を抽出する。ユーティリティモデルは、クラウドソースのソーシャルコモンセンスデータセットから人間の好みを学習するランキングモデルである。
論文参考訳（メタデータ） (2021-03-12T00:06:51Z)
"I Don't Think So": Disagreement-Based Policy Summaries for Comparing Agents [2.6270468656705765]
本稿では,エージェントのポリシーの違いを強調するコントラスト的な要約を生成する手法を提案する。本結果から, 新規な不一致に基づく要約は, HighLIGHTS を用いた要約に比べてユーザパフォーマンスの向上につながることが示された。
論文参考訳（メタデータ） (2021-02-05T09:09:00Z)
Improving Welfare in One-sided Matching using Simple Threshold Queries [9.270928705464193]
我々は、$n$エージェントが$m$オブジェクトよりも好みを持つ一方的なマッチング問題を研究する。簡単なしきい値クエリを使って、彼らの基準的嗜好についてもっと学ぶことに集中する。
論文参考訳（メタデータ） (2020-11-27T20:02:57Z)
Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文参考訳（メタデータ） (2020-11-02T08:46:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。