論文の概要: Pragmatic Reasoning in Structured Signaling Games
- arxiv url: http://arxiv.org/abs/2305.10167v1
- Date: Wed, 17 May 2023 12:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 16:08:36.443254
- Title: Pragmatic Reasoning in Structured Signaling Games
- Title(参考訳): 構造化信号ゲームにおける実用的推論
- Authors: Emil Carlsson and Devdatt Dubhashi
- Abstract要約: 本稿では,従来のシグナリングゲームの拡張である構造化シグナリングゲームを紹介する。
意味表現の上にsRSAを用いた実用的エージェントが情報理論の限界に非常に近い効率が得られることを示す。
また,多エージェント強化学習フレームワークにおける実践的推論と学習の相互作用についても検討する。
- 参考スコア(独自算出の注目度): 2.28438857884398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we introduce a structured signaling game, an extension of the
classical signaling game with a similarity structure between meanings in the
context, along with a variant of the Rational Speech Act (RSA) framework which
we call structured-RSA (sRSA) for pragmatic reasoning in structured domains. We
explore the behavior of the sRSA in the domain of color and show that pragmatic
agents using sRSA on top of semantic representations, derived from the World
Color Survey, attain efficiency very close to the information theoretic limit
after only 1 or 2 levels of recursion. We also explore the interaction between
pragmatic reasoning and learning in multi-agent reinforcement learning
framework. Our results illustrate that artificial agents using sRSA develop
communication closer to the information theoretic frontier compared to agents
using RSA and just reinforcement learning. We also find that the ambiguity of
the semantic representation increases as the pragmatic agents are allowed to
perform deeper reasoning about each other during learning.
- Abstract(参考訳): 本研究では,構造化領域における現実的推論のための構造化RSA(Structured-RSA)フレームワークの変種とともに,文脈における意味間の類似構造を持つ古典的シグナリングゲームの拡張である構造化シグナリングゲームを紹介する。
色領域におけるsRSAの挙動を調査し,ワールドカラーサーベイから派生した意味表現の上にsRSAを用いた実用的エージェントが,1~2段階の再帰の後に情報理論の限界に非常に近い効率を得ることを示す。
また,多エージェント強化学習フレームワークにおける実践的推論と学習の相互作用についても検討する。
以上の結果から,SRSAを用いた人工エージェントは,RSAを用いたエージェントや単に強化学習よりも情報理論フロンティアに近いコミュニケーションを発達させることが示唆された。
また,実践的エージェントが学習中に相互に深い推論を行うことで,意味表現のあいまいさが増大することがわかった。
関連論文リスト
- Prompt-based Logical Semantics Enhancement for Implicit Discourse
Relation Recognition [4.7938839332508945]
Inlicit Discourse Relation Recognition (IDRR) のための Prompt-based Logical Semantics Enhancement (PLSE) 法を提案する。
提案手法は,事前学習した言語モデルに対する対話関係に関する知識を,素早い接続予測によってシームレスに注入する。
PDTB 2.0 と CoNLL16 データセットによる実験結果から,本手法は現状の最先端モデルに対して優れた一貫した性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-11-01T08:38:08Z) - Learning Symbolic Rules over Abstract Meaning Representations for
Textual Reinforcement Learning [63.148199057487226]
本稿では,汎用的な意味一般化とルール誘導システムを組み合わせて,解釈可能なルールをポリシーとして学習するモジュール型 NEuroSymbolic Textual Agent (NESTA) を提案する。
実験の結果,NESTA法は,未確認テストゲームや少ないトレーニングインタラクションから学習することで,深層強化学習技術よりも優れることがわかった。
論文 参考訳(メタデータ) (2023-07-05T23:21:05Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Color Overmodification Emerges from Data-Driven Learning and Pragmatic
Reasoning [53.088796874029974]
話者の指示表現は、実践的な言語使用の性質を照らし出すのに役立つ方法で、コミュニケーションイデアルから逸脱していることを示す。
ニューラルネットワークを学習エージェントとして採用することにより、過度な修正は、頻度の低い、あるいは正常な環境特性に結びつく可能性が高いことを示す。
論文 参考訳(メタデータ) (2022-05-18T18:42:43Z) - Referring Expressions with Rational Speech Act Framework: A
Probabilistic Approach [2.1425861443122383]
本稿では,複雑な視覚シーンにおけるオブジェクトの抽出を目的とした参照表現生成(REG)タスクについて述べる。
最近のREGシステムは、話者/リスナーエージェントを表現するためにディープラーニングアプローチを使用している。
本稿では、確率的RSAフレームワークとディープラーニングアプローチを組み合わせて、複雑な視覚シーンを含む大規模データセットに適用する。
論文 参考訳(メタデータ) (2022-05-16T16:37:50Z) - elBERto: Self-supervised Commonsense Learning for Question Answering [131.51059870970616]
本稿では、市販QAモデルアーキテクチャと互換性のあるコモンセンスフレームワークの自己教師型双方向表現学習を提案する。
このフレームワークは5つの自己教師型タスクから構成されており、リッチコモンセンスを含むコンテキストから追加のトレーニング信号を完全に活用するようモデルに強制する。
elBERtoは、単純な語彙的類似性比較が役に立たないような、アウト・オブ・パラグラフや非エフェクトな問題に対して、大幅に改善されている。
論文 参考訳(メタデータ) (2022-03-17T16:23:45Z) - Exhaustivity and anti-exhaustivity in the RSA framework: Testing the
effect of prior beliefs [68.8204255655161]
我々は,先行に対する感受性が合理的音声法(RSA)フレームワークの直感的予測に繋がる事例に着目した。
本研究では, ベースラインRSAモデルにおいて, 一定の条件下では, 反排他的読解が予測されることを示す。
RSAフレームワーク全体で予測されるように、メッセージ選択は事前に敏感である。
論文 参考訳(メタデータ) (2022-02-14T20:35:03Z) - Scalable pragmatic communication via self-supervision [14.01704261285015]
エージェントが人間のデータを模倣するのではなく,自己監督を通じて実践的な政策を習得するアーキテクチャと学習プロセスを提案する。
本研究は, 自己超越による実用的スキルを持つ人工エージェントを装備するための, 新たな原理的アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:28:30Z) - Learning to refer informatively by amortizing pragmatic reasoning [35.71540493379324]
我々は、話者が時間とともに合理的な音声行為のコストを減らそうとするアイデアを探求する。
我々のアモータライズされたモデルは、様々な文脈で効果的かつ簡潔な言語を迅速に生成できることがわかりました。
論文 参考訳(メタデータ) (2020-05-31T02:52:22Z) - A Rate-Distortion view of human pragmatic reasoning [3.9425618017443322]
本稿では,Rational Speech Act (RSA) フレームワークの新たな分析法を提案する。
我々は,RSAが期待されるユーティリティとコミュニケーションのトレードオフを最適化するために,交互に実施していることを示す。
この研究はRSAモデルの数学的理解をさらに深め、一般的な情報理論の原理が人間の実践的推論を引き起こす可能性があることを示唆している。
論文 参考訳(メタデータ) (2020-05-13T22:04:27Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。