論文の概要: Ignorance is Bliss: Robust Control via Information Gating
- arxiv url: http://arxiv.org/abs/2303.06121v1
- Date: Fri, 10 Mar 2023 18:31:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-13 14:08:23.151772
- Title: Ignorance is Bliss: Robust Control via Information Gating
- Title(参考訳): 曖昧さ - 情報ゲーティングによるロバスト制御
- Authors: Manan Tomar, Riashat Islam, Sergey Levine, Philip Bachman
- Abstract要約: 情報パシモニー(英: Informational parsimony、つまり、タスクに必要な最小限の情報を利用すること)は、学習表現に有用な帰納的バイアスを与える。
より類似した表現を学習する手段として,画素空間における情報ゲーティングを提案する。
- 参考スコア(独自算出の注目度): 80.28913100846789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Informational parsimony -- i.e., using the minimal information required for a
task, -- provides a useful inductive bias for learning representations that
achieve better generalization by being robust to noise and spurious
correlations. We propose information gating in the pixel space as a way to
learn more parsimonious representations. Information gating works by learning
masks that capture only the minimal information required to solve a given task.
Intuitively, our models learn to identify which visual cues actually matter for
a given task. We gate information using a differentiable parameterization of
the signal-to-noise ratio, which can be applied to arbitrary values in a
network, e.g.~masking out pixels at the input layer. We apply our approach,
which we call InfoGating, to various objectives such as: multi-step forward and
inverse dynamics, Q-learning, behavior cloning, and standard self-supervised
tasks. Our experiments show that learning to identify and use minimal
information can improve generalization in downstream tasks -- e.g., policies
based on info-gated images are considerably more robust to
distracting/irrelevant visual features.
- Abstract(参考訳): 情報的パーシモニー(すなわち、タスクに必要な最小限の情報を使用する)は、雑音やスプリアス相関に頑健であり、より良い一般化を達成する学習表現のための有用な帰納的バイアスを提供する。
より類似した表現を学習する手段として,画素空間における情報ゲーティングを提案する。
情報ゲーティングは、与えられたタスクを解決するのに必要な最小限の情報のみをキャプチャする学習マスクによって機能する。
直感的には、我々のモデルは与えられたタスクに対して実際にどの視覚的手がかりが重要であるかを識別する。
信号対雑音比の微分可能なパラメータ化を用いて情報をゲートし,入力層で画素をマスキングするなど,ネットワーク内の任意の値に適用することができる。
我々は、InfoGatingと呼ばれるアプローチを、多段階の前進と逆ダイナミクス、Q-ラーニング、行動クローニング、標準自己監督タスクなど、様々な目的に応用する。
私たちの実験では、最小限の情報を識別し使用する学習は、下流タスクの一般化を改善できることが示されています。
関連論文リスト
- Meta-Learning Online Adaptation of Language Models [88.8947656843812]
大規模言語モデルは、そのパラメータにおける驚くほど広い世界の知識を符号化する。
しかし、静的言語モデルの知識は時代遅れになり、モデルの効果的な「シェルフライフ」が制限される。
論文 参考訳(メタデータ) (2023-05-24T11:56:20Z) - FUNCK: Information Funnels and Bottlenecks for Invariant Representation
Learning [7.804994311050265]
データから不変表現を学習すると主張する一連の関連する情報漏えいとボトルネック問題について検討する。
本稿では,この情報理論の目的である「側情報付き条件付きプライバシ・ファンネル」の新たな要素を提案する。
一般に難解な目的を考慮し、ニューラルネットワークによってパラメータ化された補正変分推論を用いて、抽出可能な近似を導出する。
論文 参考訳(メタデータ) (2022-11-02T19:37:55Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - Reasoning-Modulated Representations [85.08205744191078]
タスクが純粋に不透明でないような共通的な環境について研究する。
我々のアプローチは、新しいデータ効率表現学習の道を開く。
論文 参考訳(メタデータ) (2021-07-19T13:57:13Z) - Conditional Contrastive Learning: Removing Undesirable Information in
Self-Supervised Representations [108.29288034509305]
我々は,自己指導型表現において望ましくない情報を除去するために,条件付きコントラスト学習を開発する。
提案手法は,下流タスクの自己教師付き表現をうまく学習できることを実証的に実証する。
論文 参考訳(メタデータ) (2021-06-05T10:51:26Z) - Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。
RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-11-19T18:47:40Z) - Looking back to lower-level information in few-shot learning [4.873362301533825]
本稿では,隠れたニューラルネットワーク層の特徴埋め込みを低レベル支援情報として活用し,分類精度を向上させることを提案する。
筆者らは,MiniImageNet と tieredImageNet という2つの人気の数点学習データセットを用いた実験を行い,この手法がネットワークの低レベル情報を利用して最先端の分類性能を向上できることを示した。
論文 参考訳(メタデータ) (2020-05-27T20:32:13Z) - Vector-Quantized Autoregressive Predictive Coding [31.4011465698136]
本稿では,Vector-Quantized Autoregressive Predictive Coding (VQ-APC)を提案する。
制限されたモデルの列を研究することで、学習された表現の構成要素を明らかにする。
音声情報や話者情報を増幅して、自己監督対象を最大化する点が存在することがわかった。
論文 参考訳(メタデータ) (2020-05-17T23:06:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。