論文の概要: Learning Approximate and Exact Numeral Systems via Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2105.13857v1
- Date: Fri, 28 May 2021 14:12:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 15:48:38.445018
- Title: Learning Approximate and Exact Numeral Systems via Reinforcement
Learning
- Title(参考訳): 強化学習による数理系の近似とエクササイズ学習
- Authors: Emil Carlsson, Devdatt Dubhashi, Fredrik D. Johansson
- Abstract要約: 近年の研究では、異なる言語における数体系は、情報理論的な意味で効率的なコミュニケーションを必要とする機能的要求によって形成されていることが示唆されている。
ここでは、学習理論のアプローチを採用し、強化学習によるコミュニケーションの効率性を示す。
- 参考スコア(独自算出の注目度): 7.237493755167875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work (Xu et al., 2020) has suggested that numeral systems in different
languages are shaped by a functional need for efficient communication in an
information-theoretic sense. Here we take a learning-theoretic approach and
show how efficient communication emerges via reinforcement learning. In our
framework, two artificial agents play a Lewis signaling game where the goal is
to convey a numeral concept. The agents gradually learn to communicate using
reinforcement learning and the resulting numeral systems are shown to be
efficient in the information-theoretic framework of Regier et al. (2015);
Gibson et al. (2017). They are also shown to be similar to human numeral
systems of same type. Our results thus provide a mechanistic explanation via
reinforcement learning of the recent results in Xu et al. (2020) and can
potentially be generalized to other semantic domains.
- Abstract(参考訳): 最近の研究 (xu et al., 2020) では、異なる言語における数値系は、情報理論的な意味での効率的なコミュニケーションの必要性によって形成されると示唆されている。
ここでは学習理論的なアプローチを採用し,強化学習によるコミュニケーションの効率性を示す。
我々の枠組みでは、2人の人工エージェントがルイスシグナリングゲームをプレイし、その目的は数字の概念を伝えることである。
エージェントは徐々に強化学習を用いてコミュニケーションを学び、その結果得られる数字システムはregierらの情報理論の枠組みにおいて効率的であることが示される。
(2015年)、ギブソンら。
(2017).
また、同じタイプの人間の数字体系に似ていることも示されている。
その結果,xu等における最近の結果の強化学習を通じて,機械的な説明が得られた。
(2020)で、他のセマンティックドメインに一般化できる可能性がある。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Learning Efficient Recursive Numeral Systems via Reinforcement Learning [1.7126708168238125]
数体系のような数学的概念の出現は、数学と推論のためのAIの未研究領域である。
強化学習のような単純な学習メカニズムが、RLのような単純な学習メカニズムによってどのように生じるかを示す。
論文 参考訳(メタデータ) (2024-09-11T10:33:30Z) - Bridging the Communication Gap: Artificial Agents Learning Sign Language through Imitation [6.1400257928108575]
本研究は,実証から学ぶことによる非言語コミュニケーションスキルの獲得について考察する。
特に,人工エージェントの模倣学習に着目し,擬似ヒューマノイドアメリカン手話を教えることで実演した。
我々はコンピュータビジョンと深層学習を用いてビデオから情報を取り出すとともに、エージェントが観察された動作を再現できるように強化学習を行う。
論文 参考訳(メタデータ) (2024-06-14T13:50:29Z) - Progressively Efficient Learning [58.6490456517954]
我々はCEIL(Communication-Efficient Interactive Learning)という新しい学習フレームワークを開発した。
CEILは、学習者と教師がより抽象的な意図を交換することで効率的にコミュニケーションする人間のようなパターンの出現につながる。
CEILで訓練されたエージェントは、新しいタスクを素早く習得し、非階層的で階層的な模倣学習を、絶対的な成功率で最大50%、20%上回った。
論文 参考訳(メタデータ) (2023-10-13T07:52:04Z) - Improving Systematic Generalization Through Modularity and Augmentation [1.2183405753834562]
モジュラリティとデータ拡張という、よく知られた2つのモデリング原則が、ニューラルネットワークの体系的な一般化にどのように影響するかを検討する。
合成ベンチマークの制御された設定においても、体系的な一般化を実現することは依然として困難である。
論文 参考訳(メタデータ) (2022-02-22T09:04:35Z) - This is not the Texture you are looking for! Introducing Novel
Counterfactual Explanations for Non-Experts using Generative Adversarial
Learning [59.17685450892182]
反実用説明システムは、入力画像を変更して反実用推論を可能にする。
本稿では, 対向画像から画像への変換技術に基づく, 対向画像の説明を新たに生成する手法を提案する。
その結果,我々のアプローチは,2つの最先端技術システムよりも,メンタルモデル,説明満足度,信頼度,感情,自己効力に関して有意に優れた結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-12-22T10:08:05Z) - Neuro-Symbolic Representations for Video Captioning: A Case for
Leveraging Inductive Biases for Vision and Language [148.0843278195794]
ビデオキャプションのためのマルチモーダルなニューラルシンボリック表現を学習するための新しいモデルアーキテクチャを提案する。
本手法では,ビデオ間の関係を学習する辞書学習手法と,そのペアによるテキスト記述を用いる。
論文 参考訳(メタデータ) (2020-11-18T20:21:19Z) - Offline Learning of Counterfactual Predictions for Real-World Robotic
Reinforcement Learning [9.86154691244963]
我々はマニピュレータの関節速度にマルチモーダル感覚観測(ビジョンと力)をマッピングする政策を訓練する。
オンライン政策学習におけるオフライン学習の反事実予測と強制フィードバックを組み合わせることで,効果的な強化学習が可能になることを示す。
論文 参考訳(メタデータ) (2020-11-11T15:45:17Z) - ALICE: Active Learning with Contrastive Natural Language Explanations [69.03658685761538]
本研究では,学習におけるデータ効率を向上させるために,AlICEを用いたアクティブラーニングを提案する。
ALICEは、まずアクティブラーニングを使用して、最も情報に富んだラベルクラスを選択し、対照的な自然言語の説明を引き出す。
意味的に抽出された知識を用いて、これらの説明から知識を抽出する。
論文 参考訳(メタデータ) (2020-09-22T01:02:07Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。