論文の概要: Scalable pragmatic communication via self-supervision
- arxiv url: http://arxiv.org/abs/2108.05799v1
- Date: Thu, 12 Aug 2021 15:28:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 19:10:55.985328
- Title: Scalable pragmatic communication via self-supervision
- Title(参考訳): 自己超越によるスケーラブルな実用的コミュニケーション
- Authors: Jennifer Hu, Roger Levy, Noga Zaslavsky
- Abstract要約: エージェントが人間のデータを模倣するのではなく,自己監督を通じて実践的な政策を習得するアーキテクチャと学習プロセスを提案する。
本研究は, 自己超越による実用的スキルを持つ人工エージェントを装備するための, 新たな原理的アプローチを提案する。
- 参考スコア(独自算出の注目度): 14.01704261285015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Models of context-sensitive communication often use the Rational Speech Act
framework (RSA; Frank & Goodman, 2012), which formulates listeners and speakers
in a cooperative reasoning process. However, the standard RSA formulation can
only be applied to small domains, and large-scale applications have relied on
imitating human behavior. Here, we propose a new approach to scalable
pragmatics, building upon recent theoretical results (Zaslavsky et al., 2020)
that characterize pragmatic reasoning in terms of general information-theoretic
principles. Specifically, we propose an architecture and learning process in
which agents acquire pragmatic policies via self-supervision instead of
imitating human data. This work suggests a new principled approach for
equipping artificial agents with pragmatic skills via self-supervision, which
is grounded both in pragmatic theory and in information theory.
- Abstract(参考訳): 文脈に敏感なコミュニケーションのモデルは、しばしばRational Speech Act framework(RSA; Frank & Goodman, 2012)を使用し、協調推論プロセスにおいてリスナーと話者を定式化する。
しかし、標準的なRSAの定式化は小さなドメインにのみ適用でき、大規模アプリケーションは人間の振る舞いを模倣することに頼っている。
本稿では,最近の理論的結果(Zaslavsky et al., 2020)に基づいて,汎用情報理論の原理から実用的推論を特徴付ける,スケーラブルなプラグマティクスの新しいアプローチを提案する。
具体的には,エージェントが人間のデータを模倣するのではなく,自己スーパービジョンによって実践的なポリシーを取得するアーキテクチャと学習プロセスを提案する。
本研究は, 実用的理論と情報理論の両方に基礎を置き, 自己スーパービジョンによる実践的スキルを人工エージェントに応用するための新しい原理的アプローチを提案する。
関連論文リスト
- Advancing Interactive Explainable AI via Belief Change Theory [5.842480645870251]
この種の形式化は、対話的な説明を開発するためのフレームワークと方法論を提供する、と我々は主張する。
まず,人間と機械の間で共有される説明情報を表現するために,論理に基づく新しい形式を定義した。
次に、対話型XAIの現実シナリオについて検討し、新しい知識と既存の知識の優先順位が異なり、フォーマリズムがインスタンス化される可能性がある。
論文 参考訳(メタデータ) (2024-08-13T13:11:56Z) - Regularized Conventions: Equilibrium Computation as a Model of Pragmatic
Reasoning [72.21876989058858]
本稿では,信号ゲームの正規化平衡を探索することにより,発話を生成・理解する実用的な言語理解のモデルを提案する。
このモデルでは、話者とリスナーは文脈的に適切な発話を探索し、ゲーム理論の最適規則に近づき、共有された'デフォルト'セマンティクスに近い意味のマッピングを意味づける。
論文 参考訳(メタデータ) (2023-11-16T09:42:36Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Learning Action-Effect Dynamics for Hypothetical Vision-Language
Reasoning Task [50.72283841720014]
本研究では,行動の効果に関する推論を改善する新しい学習戦略を提案する。
本稿では,提案手法の有効性を実証し,性能,データ効率,一般化能力の観点から,従来のベースラインに対する優位性を論じる。
論文 参考訳(メタデータ) (2022-12-07T05:41:58Z) - Exhaustivity and anti-exhaustivity in the RSA framework: Testing the
effect of prior beliefs [68.8204255655161]
我々は,先行に対する感受性が合理的音声法(RSA)フレームワークの直感的予測に繋がる事例に着目した。
本研究では, ベースラインRSAモデルにおいて, 一定の条件下では, 反排他的読解が予測されることを示す。
RSAフレームワーク全体で予測されるように、メッセージ選択は事前に敏感である。
論文 参考訳(メタデータ) (2022-02-14T20:35:03Z) - A practical introduction to the Rational Speech Act modeling framework [2.1485350418225244]
計算認知科学の最近の進歩は、形式的で実装可能なプラグマティクスのモデルにおいて、大きな進歩の道を開いた。
本稿では,ベイズ合理音声法モデリングフレームワークの実践的紹介と批判的評価を行う。
論文 参考訳(メタデータ) (2021-05-20T16:08:04Z) - Learning to refer informatively by amortizing pragmatic reasoning [35.71540493379324]
我々は、話者が時間とともに合理的な音声行為のコストを減らそうとするアイデアを探求する。
我々のアモータライズされたモデルは、様々な文脈で効果的かつ簡潔な言語を迅速に生成できることがわかりました。
論文 参考訳(メタデータ) (2020-05-31T02:52:22Z) - A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。
このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文 参考訳(メタデータ) (2020-03-02T10:32:21Z) - Emergence of Pragmatics from Referential Game between Theory of Mind
Agents [64.25696237463397]
エージェントが手書きのルールを指定せずに「行間を読む」能力を自発的に学習するアルゴリズムを提案する。
協調型マルチエージェント教育状況における心の理論(ToM)を統合し,適応型強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T19:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。