論文の概要: MaxMI: A Maximal Mutual Information Criterion for Manipulation Concept Discovery
- arxiv url: http://arxiv.org/abs/2407.15086v1
- Date: Sun, 21 Jul 2024 07:56:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 19:18:45.733190
- Title: MaxMI: A Maximal Mutual Information Criterion for Manipulation Concept Discovery
- Title(参考訳): MaxMI: 操作概念発見のための最大相互情報基準
- Authors: Pei Zhou, Yanchao Yang,
- Abstract要約: 物理状態の集合を表す正規性を特徴付けるための情報理論的基準を導入する。
この基準を用いて概念発見ネットワークを訓練するフレームワークを開発する。
- 参考スコア(独自算出の注目度): 8.98306885751389
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We aim to discover manipulation concepts embedded in the unannotated demonstrations, which are recognized as key physical states. The discovered concepts can facilitate training manipulation policies and promote generalization. Current methods relying on multimodal foundation models for deriving key states usually lack accuracy and semantic consistency due to limited multimodal robot data. In contrast, we introduce an information-theoretic criterion to characterize the regularities that signify a set of physical states. We also develop a framework that trains a concept discovery network using this criterion, thus bypassing the dependence on human semantics and alleviating costly human labeling. The proposed criterion is based on the observation that key states, which deserve to be conceptualized, often admit more physical constraints than non-key states. This phenomenon can be formalized as maximizing the mutual information between the putative key state and its preceding state, i.e., Maximal Mutual Information (MaxMI). By employing MaxMI, the trained key state localization network can accurately identify states of sufficient physical significance, exhibiting reasonable semantic compatibility with human perception. Furthermore, the proposed framework produces key states that lead to concept-guided manipulation policies with higher success rates and better generalization in various robotic tasks compared to the baselines, verifying the effectiveness of the proposed criterion.
- Abstract(参考訳): 本研究の目的は,キーとなる物理状態として認識される無意味な実演に埋め込まれた操作概念の発見である。
発見された概念は、訓練操作ポリシーの促進と一般化の促進を可能にする。
鍵状態の導出のためのマルチモーダル基礎モデルに基づく現在の手法では、限られたマルチモーダルロボットデータによる精度とセマンティック一貫性が欠如している。
対照的に、物理状態の集合を表す正規性を特徴付ける情報理論的基準を導入する。
また、この基準を用いて概念発見ネットワークを訓練するフレームワークを開発し、人間の意味論への依存を回避し、コストのかかる人間のラベリングを緩和する。
提案された基準は、キー状態は概念化に値するが、非キー状態よりも物理的に制限されることが多いという観察に基づいている。
この現象は、入力キー状態とその前の状態、すなわち最大相互情報(MaxMI)間の相互情報の最大化として定式化することができる。
MaxMIを利用することで、トレーニングされたキー状態ローカライゼーションネットワークは、十分な物理的重要性の状態を正確に識別し、人間の知覚と合理的なセマンティックな互換性を示す。
さらに,提案手法は,提案基準の有効性を検証し,より高い成功率と各種ロボットタスクの汎用性を有する概念誘導型操作ポリシーの鍵となる状態を生成する。
関連論文リスト
- Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Evaluating Readability and Faithfulness of Concept-based Explanations [35.48852504832633]
概念に基づく説明は、大規模言語モデルによって学習された高レベルのパターンを説明するための有望な道として現れます。
現在の手法は、統一的な形式化を欠いた異なる視点から概念にアプローチする。
これにより、概念の中核となる尺度、すなわち忠実さや可読性を評価するのが難しくなります。
論文 参考訳(メタデータ) (2024-04-29T09:20:25Z) - InfoCon: Concept Discovery with Generative and Discriminative Informativeness [7.160037417413006]
我々は、様々なロボットタスクに適応し、再組み立て可能な操作概念の自己監督的な発見に焦点を当てる。
我々は、操作の概念を生成的かつ差別的な目標としてモデル化し、それらを意味のあるサブトラジェクトリに自律的にリンクできるメトリクスを導出する。
論文 参考訳(メタデータ) (2024-03-14T14:14:04Z) - Enhancing Actionable Formal Concept Identification with Base-Equivalent
Conceptual-Relevance [0.0]
動作可能な概念の識別を改善するための新しい概念的関連性度尺度である,Base-Equivalent Conceptual Relevance (BECR) スコアを導入する。
BECRの基本的な考え方は、より基本的で等価な属性とコンセプトの意図する最小限のジェネレータが持つほど、より関連性が高いということである。
合成および実世界のデータセットに関する予備実験は、よく知られた安定性指標と比較してBECRの効率を示す。
論文 参考訳(メタデータ) (2023-12-22T03:57:40Z) - Reasoning with the Theory of Mind for Pragmatic Semantic Communication [62.87895431431273]
本稿では,実用的な意味コミュニケーションフレームワークを提案する。
2つの知性エージェント間の効果的な目標指向情報共有を可能にする。
数値的な評価は、少ないビット量で効率的な通信を実現するためのフレームワークの能力を示している。
論文 参考訳(メタデータ) (2023-11-30T03:36:19Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Understanding Masked Autoencoders via Hierarchical Latent Variable
Models [109.35382136147349]
Masked Autoencoder (MAE) は近年,様々な視覚タスクにおいて顕著な成功を収めている。
MAEに関する興味深い経験的観察の出現にもかかわらず、理論的に原理化された理解はいまだに欠如している。
論文 参考訳(メタデータ) (2023-06-08T03:00:10Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - The Geometry of Robust Value Functions [119.94715309072983]
非ロバストな値空間とロバストな値空間の両方を特徴付ける新しい視点を導入する。
我々は、ロバストな値空間が、一つの状態に一致するすべてのポリシーのロバストな値を含む集合の円錐超曲面によって決定されることを示す。
論文 参考訳(メタデータ) (2022-01-30T22:12:17Z) - Detecting Important Patterns Using Conceptual Relevance Interestingness
Measure [0.0]
本稿では,概念関連性(CR)スコア(Conceptual Relevance)について紹介する。
概念的な観点から、最小限のジェネレータは、関連する概念意図に関する重要な情報を提供する。
そのため、CRインデックスは概念的に関係のある属性の量と概念意図ごとに最小のジェネレータの数の両方を定量化する。
論文 参考訳(メタデータ) (2021-10-21T16:45:01Z) - Metrics and continuity in reinforcement learning [34.10996560464196]
メトリクスのレンズを通してトポロジを定義するために統一的な定式化を導入する。
我々はこれらの指標の階層を確立し、マルコフ決定過程にその理論的意味を実証する。
考察した指標間の差異を示す実証的な評価で理論結果を補完する。
論文 参考訳(メタデータ) (2021-02-02T14:30:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。