論文の概要: Shaking the foundations: delusions in sequence models for interaction
and control
- arxiv url: http://arxiv.org/abs/2110.10819v1
- Date: Wed, 20 Oct 2021 23:31:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 14:34:41.835225
- Title: Shaking the foundations: delusions in sequence models for interaction
and control
- Title(参考訳): 基礎:相互作用と制御のためのシーケンスモデルにおける妄想
- Authors: Pedro A. Ortega, Markus Kunesch, Gr\'egoire Del\'etang, Tim Genewein,
Jordi Grau-Moya, Joel Veness, Jonas Buchli, Jonas Degrave, Bilal Piot, Julien
Perolat, Tom Everitt, Corentin Tallec, Emilio Parisotto, Tom Erez, Yutian
Chen, Scott Reed, Marcus Hutter, Nando de Freitas, Shane Legg
- Abstract要約: 我々は、シーケンスモデルが「行動の原因と効果の理解を欠く」ことを示し、それらが自己提案的妄想によって誤った推論を引き出す結果となった。
教師付き学習では,実ミス信号と反実エラー信号とをそれぞれ学習することで,データに対する条件付けや介入をシステムに教えることができることを示す。
- 参考スコア(独自算出の注目度): 45.34593341136043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent phenomenal success of language models has reinvigorated machine
learning research, and large sequence models such as transformers are being
applied to a variety of domains. One important problem class that has remained
relatively elusive however is purposeful adaptive behavior. Currently there is
a common perception that sequence models "lack the understanding of the cause
and effect of their actions" leading them to draw incorrect inferences due to
auto-suggestive delusions. In this report we explain where this mismatch
originates, and show that it can be resolved by treating actions as causal
interventions. Finally, we show that in supervised learning, one can teach a
system to condition or intervene on data by training with factual and
counterfactual error signals respectively.
- Abstract(参考訳): 最近の言語モデルの成功は機械学習の研究を復活させ、トランスフォーマーのような大規模なシーケンスモデルが様々な領域に応用されている。
しかし、比較的難解な問題クラスの一つは、意図的な適応行動である。
現在、シーケンスモデルが「行動の原因と効果の理解を欠く」ため、自己提案的妄想による誤った推論が引き起こされるという共通の認識がある。
本報告では, このミスマッチの発端を解説し, 因果的介入として対処することで解決可能であることを示す。
最後に,教師付き学習では,事実信号と反事実誤り信号の訓練により,システムの条件付けや介入を指導できることを示す。
関連論文リスト
- Counterfactual Generation from Language Models [64.55296662926919]
対実的推論が介入と概念的に異なることを示す。
そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。
我々の実験は、このアプローチが有意義な反事実を生み出すことを示した。
論文 参考訳(メタデータ) (2024-11-11T17:57:30Z) - Counterfactual Generative Modeling with Variational Causal Inference [1.9287470458589586]
本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。
実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文 参考訳(メタデータ) (2024-10-16T16:44:12Z) - Implicit Causal Representation Learning via Switchable Mechanisms [11.870185425476429]
因果的メカニズムの暗黙的な学習は通常、ハードとソフトの介入という2つの介入データを含む。
本稿では,ソフト介入を用いた因果モデル学習の課題に対処し,暗黙的モデリングを継続する。
ICLR-SMは,異なる因果メカニズム間を切り替えるように設計された因果メカニズムスイッチ変数を用いて,ソフト介入の効果をモデル化する。
論文 参考訳(メタデータ) (2024-02-16T23:17:00Z) - Limitations of Agents Simulated by Predictive Models [1.6649383443094403]
エージェントとなると予測モデルが失敗する2つの構造的理由を概説する。
いずれの障害も環境からのフィードバックループを組み込むことで修正可能であることを示す。
我々の治療は、これらの障害モードの統一的なビューを提供し、オンライン学習でオフライン学習ポリシーを微調整することで、より効果的になる理由を疑問視する。
論文 参考訳(メタデータ) (2024-02-08T17:08:08Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Sequential Causal Imitation Learning with Unobserved Confounders [82.22545916247269]
猿が猿を見なさい」とは、制度の根底にある仕組みを深く理解せずに「生」の模倣を指して、昔ながらの格言である。
本稿では、エピソード毎に複数の意思決定をしなければならないシーケンシャルセッティングにおける因果模倣学習の問題について検討する。
論文 参考訳(メタデータ) (2022-08-12T13:53:23Z) - Beyond Trivial Counterfactual Explanations with Diverse Valuable
Explanations [64.85696493596821]
コンピュータビジョンの応用において、生成的対実法はモデルの入力を摂動させて予測を変更する方法を示す。
本稿では,多様性強化損失を用いて制約される不連続潜在空間における摂動を学習する反事実法を提案する。
このモデルは, 従来の最先端手法と比較して, 高品質な説明を生産する成功率を向上させる。
論文 参考訳(メタデータ) (2021-03-18T12:57:34Z) - Feedback in Imitation Learning: Confusion on Causality and Covariate
Shift [12.93527098342393]
我々は,過去の行動に対する条件付けが,学習者の「実行」エラーと性能の劇的な相違につながることを論じる。
我々は、模倣学習アプローチをテストするために使用される既存のベンチマークを分析する。
従来の文献とは驚くほど対照的に,行動的クローン化は優れた結果をもたらすことが判明した。
論文 参考訳(メタデータ) (2021-02-04T20:18:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。