論文の概要: Individual vs. Joint Perception: a Pragmatic Model of Pointing as
Communicative Smithian Helping
- arxiv url: http://arxiv.org/abs/2106.02003v1
- Date: Thu, 3 Jun 2021 17:21:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 16:12:08.858834
- Title: Individual vs. Joint Perception: a Pragmatic Model of Pointing as
Communicative Smithian Helping
- Title(参考訳): 個人対関節知覚:コミュニケーション・スミソニアン支援としてのポインティングの実用的モデル
- Authors: Kaiwen Jiang, Stephanie Stacy, Chuyu Wei, Adelpha Chan, Federico
Rossano, Yixin Zhu, Tao Gao
- Abstract要約: 単純なポインティングのジェスチャーは、観察に基づいて世界の状態を理解できる能力を大幅に増強することができる。
我々は、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて、個々の観察に基づいて世界に対する信念を更新するエージェントをモデル化する。
それに加えて、我々は、指摘された観察が関連し、解釈可能であるべきであるという相互理解を持つエージェント間のコミュニケーション行為であることを示すモデルを構築している。
- 参考スコア(独自算出の注目度): 16.671443846399836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The simple gesture of pointing can greatly augment ones ability to comprehend
states of the world based on observations. It triggers additional inferences
relevant to ones task at hand. We model an agents update to its belief of the
world based on individual observations using a partially observable Markov
decision process (POMDP), a mainstream artificial intelligence (AI) model of
how to act rationally according to beliefs formed through observation. On top
of that, we model pointing as a communicative act between agents who have a
mutual understanding that the pointed observation must be relevant and
interpretable. Our model measures relevance by defining a Smithian Value of
Information (SVI) as the utility improvement of the POMDP agent before and
after receiving the pointing. We model that agents calculate SVI by using the
cognitive theory of Smithian helping as a principle of coordinating separate
beliefs for action prediction and action evaluation. We then import SVI into
rational speech act (RSA) as the utility function of an utterance. These lead
us to a pragmatic model of pointing allowing for contextually flexible
interpretations. We demonstrate the power of our Smithian pointing model by
extending the Wumpus world, a classic AI task where a hunter hunts a monster
with only partial observability of the world. We add another agent as a guide
who can only help by marking an observation already perceived by the hunter
with a pointing or not, without providing new observations or offering any
instrumental help. Our results show that this severely limited and overloaded
communication nevertheless significantly improves the hunters performance. The
advantage of pointing is indeed due to a computation of relevance based on
Smithian helping, as it disappears completely when the task is too difficult or
too easy for the guide to help.
- Abstract(参考訳): ポインティングの単純なジェスチャーは、観察に基づいて世界の状態を理解する能力を大きく増やすことができる。
開発中のタスクに関連する追加の推論をトリガーする。
我々は、観察によって形成された信念に従って合理的に行動する方法を主流の人工知能(AI)モデルである、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて、個々の観察に基づいて世界に対する信念を更新するエージェントをモデル化する。
その上で,注意深い観察が適切かつ解釈可能であることを相互に理解しているエージェント間のコミュニケーション行為として,指し示すことをモデルとした。
本モデルは,ポジショニングの前後におけるpomdpエージェントの効用改善として,情報スミソニアン値(svi)を定義して妥当性を測定する。
エージェントがSmithianの認知理論を用いてSVIを計算し、行動予測と行動評価のための別々の信念を協調する原理をモデル化する。
次に、音声の効用関数としてSVIを有理音声行為(RSA)にインポートする。
これらは、文脈的に柔軟な解釈を可能にする、ポインティングの実用的モデルへとつながります。
ハンターが世界の部分的可観測性だけを持つモンスターを狩る古典的なaiタスクであるwunpus worldを拡張して、スミソニアンポインティングモデルの力を実証する。
我々は,他のエージェントをガイドとして追加し,ハンターが認識している観察を,新たな観察を提供したり,道具的助けを提供することなく,指さすかしないかでマークする。
以上の結果から,この過負荷通信はハンターの性能を著しく向上させることが明らかとなった。
指さすことの利点は、スミソニアン支援に基づく関連性の計算であり、タスクが難しすぎるか、ガイドが助けるには難しすぎると完全に消えてしまうからである。
関連論文リスト
- Improving Zero-Shot ObjectNav with Generative Communication [60.84730028539513]
ゼロショットObjectNavの改良手法を提案する。
私たちのアプローチは、接地エージェントが制限され、時には障害のあるビューを持つ可能性があることを考慮に入れています。
論文 参考訳(メタデータ) (2024-08-03T22:55:26Z) - Understanding Probe Behaviors through Variational Bounds of Mutual
Information [53.520525292756005]
情報理論を利用した新しい数学的枠組みを構築することで線形探索のガイドラインを提供する。
まず、プローブ設計を緩和するために、相互情報の変動境界(MI)と探索を結合し、線形探索と微調整を同一視する。
中間表現は、分離性の向上とMIの減少のトレードオフのため、最大のMI推定値を持つことが示される。
論文 参考訳(メタデータ) (2023-12-15T18:38:18Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Sum-of-Parts: Faithful Attributions for Groups of Features [8.68707471649733]
Sum-of-Parts(SOP)は、任意の差別化可能なモデルを、機能群に起因する予測を持つ自己説明モデルに変換するフレームワークである。
SOPは、ImageNetとCosmoGridの忠実度指標に関して高いスコアを得ながら、最高のパフォーマンスを達成する。
我々は,SOPが学習したグループの有用性を,高い純度,強い人間区別能力,科学的発見における実用性を通じて検証した。
論文 参考訳(メタデータ) (2023-10-25T02:50:10Z) - Post Hoc Explanations of Language Models Can Improve Language Models [43.2109029463221]
AMPLIFY(Post Hoc Explanations)を用いたインコンテキスト学習の活用によるモデル性能向上のための新しいフレームワークを提案する。
我々は,各入力特徴がモデル予測に与える影響を抽出し,帰属スコア(説明)を出力するポストホック説明手法を活用する。
AMPLIFYは,幅広いタスクに対して約10~25%の精度向上を実現している。
論文 参考訳(メタデータ) (2023-05-19T04:46:04Z) - Imitation from Observation With Bootstrapped Contrastive Learning [12.048166025000976]
IfO(IfO)は、マルコフ決定プロセスにおいて自律エージェントを訓練する学習パラダイムである。
本稿では,OfOアルゴリズムであるBootIfOLについて紹介する。
我々は,限られた数の実証軌道を用いて効果的な政策を訓練できることを示す,様々な制御タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-02-13T17:32:17Z) - H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding
Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。
提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。
我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文 参考訳(メタデータ) (2022-10-22T18:39:33Z) - Beyond Tracking: Using Deep Learning to Discover Novel Interactions in
Biological Swarms [3.441021278275805]
本稿では,システムレベルの状態を全体像から直接予測するディープ・ネットワーク・モデルを提案する。
結果の予測モデルは、人間の理解した予測モデルに基づいていないため、説明モジュールを使用する。
これは、行動生態学における人工知能の例である。
論文 参考訳(メタデータ) (2021-08-20T22:50:41Z) - Adversarial Intrinsic Motivation for Reinforcement Learning [60.322878138199364]
政策状態の訪問分布と目標分布とのワッサースタイン-1距離が強化学習タスクに有効に活用できるかどうかを検討する。
我々のアプローチは、AIM (Adversarial Intrinsic Motivation) と呼ばれ、このワッサーシュタイン-1距離をその双対目的を通して推定し、補足報酬関数を計算する。
論文 参考訳(メタデータ) (2021-05-27T17:51:34Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z) - Understanding Global Feature Contributions With Additive Importance
Measures [14.50261153230204]
我々は,各特徴に関連付けられた予測力を通じて,特徴の重要性を定義する視点について検討する。
予測力(モデルベースと普遍性)の2つの概念を導入し、付加的重要度尺度の枠組みを用いてこのアプローチを定式化する。
次に,機能的相互作用を考慮に入れながら予測力を定量化するモデルに依存しないSAGEを提案する。
論文 参考訳(メタデータ) (2020-04-01T19:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。