論文の概要: ROPES: Robotic Pose Estimation via Score-Based Causal Representation Learning
- arxiv url: http://arxiv.org/abs/2510.20884v1
- Date: Thu, 23 Oct 2025 17:42:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.285328
- Title: ROPES: Robotic Pose Estimation via Score-Based Causal Representation Learning
- Title(参考訳): ROPES:スコアベース因果表現学習によるロボット視点推定
- Authors: Pranamya Kulkarni, Puranjay Datta, Burak Varıcı, Emre Acartürk, Karthikeyan Shanmugam, Ali Tajer,
- Abstract要約: 因果表現学習(CRL)は、高次元データに基づく潜在的生成因子を分散させる強力な教師なしフレームワークとして登場した。
本稿では,CRLをロボット工学に導入することにより,理論と実世界の実践のギャップを埋める。
具体的には,Score-based CRLによるロボットのポーズ推定を導入することで,ロボットのポーズ推定について述べる。
- 参考スコア(独自算出の注目度): 28.88442456907043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal representation learning (CRL) has emerged as a powerful unsupervised framework that (i) disentangles the latent generative factors underlying high-dimensional data, and (ii) learns the cause-and-effect interactions among the disentangled variables. Despite extensive recent advances in identifiability and some practical progress, a substantial gap remains between theory and real-world practice. This paper takes a step toward closing that gap by bringing CRL to robotics, a domain that has motivated CRL. Specifically, this paper addresses the well-defined robot pose estimation -- the recovery of position and orientation from raw images -- by introducing Robotic Pose Estimation via Score-Based CRL (ROPES). Being an unsupervised framework, ROPES embodies the essence of interventional CRL by identifying those generative factors that are actuated: images are generated by intrinsic and extrinsic latent factors (e.g., joint angles, arm/limb geometry, lighting, background, and camera configuration) and the objective is to disentangle and recover the controllable latent variables, i.e., those that can be directly manipulated (intervened upon) through actuation. Interventional CRL theory shows that variables that undergo variations via interventions can be identified. In robotics, such interventions arise naturally by commanding actuators of various joints and recording images under varied controls. Empirical evaluations in semi-synthetic manipulator experiments demonstrate that ROPES successfully disentangles latent generative factors with high fidelity with respect to the ground truth. Crucially, this is achieved by leveraging only distributional changes, without using any labeled data. The paper also includes a comparison with a baseline based on a recently proposed semi-supervised framework. This paper concludes by positioning robot pose estimation as a near-practical testbed for CRL.
- Abstract(参考訳): 因果表現学習(CRL)は、強力な教師なしフレームワークとして登場した。
(i)高次元データの根底にある潜伏生成因子を乱し、
(ii)不整合変数間の因果相互作用を学習する。
近年の識別可能性といくつかの実践的な進歩にもかかわらず、理論と現実の実践の間には大きなギャップが残っている。
本稿では、CRLを動機づけた分野であるロボティクスにCRLを導入することにより、そのギャップを埋める方向への一歩を踏み出した。
具体的には,Score-based CRL (ROPES) によるロボットの姿勢推定(生画像の位置と方向の復元)について述べる。
画像は、内在的および外在的潜伏因子(例えば、関節角、アーム/リム幾何学、照明、背景、カメラ構成)によって生成され、その目的は、制御可能な潜伏変数(すなわち、アクティベーションを介して直接操作できるもの)を解離し、回復することである。
インターベンショナルCRL理論は、介入によって変動する変数を特定することができることを示している。
ロボット工学において、このような介入は様々な関節のアクチュエータを指令し、様々な制御下で画像を記録することによって自然に発生する。
半合成マニピュレータ実験における実験的な評価は、ROPESが基底真理に対して高い忠実度で潜伏する生成因子を分解することに成功していることを示している。
重要なことに、これはラベル付きデータを使わずに、分散的な変更のみを活用することで達成される。
この論文は、最近提案された半教師付きフレームワークに基づくベースラインとの比較も含んでいる。
本稿では,ロボットの姿勢推定をCRLのほぼ実践的なテストベッドとして位置づける。
関連論文リスト
- CausalVerse: Benchmarking Causal Representation Learning with Configurable High-Fidelity Simulations [14.751682308668391]
因果表現学習は、データ生成プロセスを明らかにし、基礎となる因果変数と関係を特定することを目的としている。
データセットは4つのドメインで24のサブシーンにわたる約2万の画像と300万のビデオフレームで構成されている。
論文 参考訳(メタデータ) (2025-10-15T19:39:22Z) - Better Decisions through the Right Causal World Model [17.623937562865617]
因果的対象中心モデル抽出ツール(COMET)は、正確に解釈可能な因果的世界モデル(CWM)を学習するために設計された新しいアルゴリズムである。
Pong や Freeway などの Atari 環境で検証した結果,COMET の精度とロバスト性を実証した。
論文 参考訳(メタデータ) (2025-04-09T20:29:13Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Generative Principal Component Regression via Variational Inference [2.4415762506639944]
適切な操作を設計するための1つのアプローチは、予測モデルの重要な特徴をターゲットとすることである。
我々は,そのような情報を潜在空間で表現する,教師付き変分オートエンコーダ(SVAE)に基づく新しい目的を開発する。
シミュレーションでは,gPCRは通常のPCRやSVAEと比較して,操作時のターゲット選択を劇的に改善することを示した。
論文 参考訳(メタデータ) (2024-09-03T22:38:55Z) - Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.51307552703685]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。
大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-29T02:21:11Z) - Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - RAT: Retrieval-Augmented Transformer for Click-Through Rate Prediction [68.34355552090103]
本稿では, 試料内および試料間における微細な特徴相互作用の獲得を目的とした検索-拡張変換器(RAT)を開発した。
次に、トランスフォーマー層をカスケードされた注意で構築し、イントラサンプルとクロスサンプルの両方の機能インタラクションをキャプチャします。
実世界のデータセットの実験は、RATの有効性を裏付け、ロングテールシナリオにおいてその利点を示唆している。
論文 参考訳(メタデータ) (2024-04-02T19:14:23Z) - Reinforcement Learning for SAR View Angle Inversion with Differentiable
SAR Renderer [7.112962861847319]
本研究の目的は,合成開口レーダ(SAR)画像における目標モデルによるレーダー視角の反転である。
エージェントと環境との相互作用を容易にするために、微分可能SARレンダリング(DSR)という電磁シミュレータが組み込まれている。
論文 参考訳(メタデータ) (2024-01-02T11:47:58Z) - Discovering Latent Causal Variables via Mechanism Sparsity: A New
Principle for Nonlinear ICA [81.4991350761909]
ICA(Independent component analysis)は、この目的を定式化し、実用的な応用のための推定手順を提供する手法の集合を指す。
潜伏変数は、潜伏機構をスパースに正則化すれば、置換まで復元可能であることを示す。
論文 参考訳(メタデータ) (2021-07-21T14:22:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。