論文の概要: Affordance Transfer Across Object Instances via Semantically Anchored Functional Map
- arxiv url: http://arxiv.org/abs/2602.14874v1
- Date: Mon, 16 Feb 2026 16:04:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.489296
- Title: Affordance Transfer Across Object Instances via Semantically Anchored Functional Map
- Title(参考訳): 意味的アンカレート関数写像によるオブジェクトインスタンス間のアフォーマンス転送
- Authors: Xiaoxiang Dong, Weiming Zhi,
- Abstract要約: 本研究では,1つの視覚的実演からオブジェクト間でアベイランスを伝達するフレームワークであるemphSemantic Anchored Functional Maps (SemFM)を提案する。
本手法は,オブジェクト間のセマンティックな機能領域を特定し,相互に排他的なセマンティックアンカーを選択し,それらの制約を表面上で伝達する。
合成対象カテゴリーと実世界のロボット操作タスクの実験により,本手法が計算コストを抑えながら精度の高い移動を可能にすることを示す。
- 参考スコア(独自算出の注目度): 4.786936073180585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional learning from demonstration (LfD) generally demands a cumbersome collection of physical demonstrations, which can be time-consuming and challenging to scale. Recent advances show that robots can instead learn from human videos by extracting interaction cues without direct robot involvement. However, a fundamental challenge remains: how to generalize demonstrated interactions across different object instances that share similar functionality but vary significantly in geometry. In this work, we propose \emph{Semantic Anchored Functional Maps} (SemFM), a framework for transferring affordances across objects from a single visual demonstration. Starting from a coarse mesh reconstructed from an image, our method identifies semantically corresponding functional regions between objects, selects mutually exclusive semantic anchors, and propagates these constraints over the surface using a functional map to obtain a dense, semantically consistent correspondence. This enables demonstrated interaction regions to be transferred across geometrically diverse objects in a lightweight and interpretable manner. Experiments on synthetic object categories and real-world robotic manipulation tasks show that our approach enables accurate affordance transfer with modest computational cost, making it well-suited for practical robotic perception-to-action pipelines.
- Abstract(参考訳): 従来の実演からの学習(LfD)は、通常、面倒な物理的な実演のコレクションを必要とします。
近年の進歩は、ロボットが直接ロボットを介さずに対話の手がかりを抽出することで、人間のビデオから学ぶことができることを示している。
しかし、基本的な課題は、類似の機能を共有しながら幾何学的に大きく異なる異なるオブジェクトインスタンス間での相互作用をいかに一般化するかである。
本研究では,1つの視覚的実演からオブジェクト間での割当を伝達するフレームワークである,emph{Semantic Anchored Functional Maps} (SemFM)を提案する。
画像から再構成された粗いメッシュから、オブジェクト間の意味的に対応する機能領域を特定し、相互に排他的なセマンティックアンカーを選択し、これらの制約を関数マップを用いて表面上で伝達し、密でセマンティックに整合した対応を得る。
これにより、証明された相互作用領域は、軽量で解釈可能な方法で幾何学的に多様な物体を移動することができる。
合成対象カテゴリーと実世界のロボット操作タスクの実験から,本手法は計算コストの少ない精度で正確な移動を可能にすることが示され,実用的なロボット認識・行動パイプラインに適している。
関連論文リスト
- Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.00655365269]
本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文 参考訳(メタデータ) (2025-06-02T17:57:06Z) - IAAO: Interactive Affordance Learning for Articulated Objects in 3D Environments [56.85804719947]
IAAOは知的エージェントのための明示的な3Dモデルを構築するフレームワークで,対話を通して環境内の明瞭な物体の理解を得る。
マスク特徴とビュー一貫性ラベルを多視点画像から抽出し,まず3次元ガウススティング(3DGS)を用いて各オブジェクト状態の階層的特徴とラベルフィールドを構築する。
次に、3Dガウスプリミティブ上でオブジェクトと部分レベルのクエリを実行し、静的および明瞭な要素を識別し、大域的な変換と局所的な調音パラメータをアベイランスとともに推定する。
論文 参考訳(メタデータ) (2025-04-09T12:36:48Z) - SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories [124.24041272390954]
手動物体の相互作用をモデル化することは、ロボットと具体化されたAIシステムを前進させる大きな可能性を秘めている。
SIGHTは、1つの画像から現実的で物理的に妥当な3Dハンドオブジェクトインタラクショントラジェクトリを生成することに焦点を当てた,新しいタスクである。
SIGHT-Fusionは,データベースから最もよく似た3Dオブジェクトメッシュを抽出し,この課題に対処する,新しい拡散型画像文条件付き生成モデルを提案する。
論文 参考訳(メタデータ) (2025-03-28T20:53:20Z) - Geometrically-Aware One-Shot Skill Transfer of Category-Level Objects [18.978751760636563]
本研究では,ロボットが複雑な物体操作のスキルと制約を1人の人間の実演から伝達することのできる,新しいスキル伝達フレームワークを提案する。
提案手法は,オブジェクト中心のインタラクションに着目したデモンストレーションから幾何学的表現を導出することで,スキル獲得とタスク実行の課題に対処する。
本手法の有効性と適応性を広範囲な実験により検証し,追加の訓練を必要とせず,多様な実環境における技術移転とタスク実行を実証した。
論文 参考訳(メタデータ) (2025-03-19T16:10:17Z) - Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - GEARS: Local Geometry-aware Hand-object Interaction Synthesis [38.75942505771009]
本研究では, 相互作用領域近傍の局所物体形状を推定するための, 結合中心型センサを提案する。
学習の複雑さを軽減するための重要なステップとして、グローバルフレームからテンプレートハンドフレームにポイントを変換し、共有モジュールを使用して各関節のセンサ特徴を処理する。
これに続いて、異なる次元の関節間の相関を捉えることを目的とした知覚時間変換ネットワークが提供される。
論文 参考訳(メタデータ) (2024-04-02T09:18:52Z) - Grasp Transfer based on Self-Aligning Implicit Representations of Local
Surfaces [10.602143478315861]
本研究は,ロボットがこれまで遭遇した物体と形状の類似性を共有する新しい物体に,把握経験や実演を移す問題に対処する。
我々は、オブジェクトメッシュの小さなデータセットから暗黙の局所的な表面表現モデルを学ぶために、単一の専門家のグリーグデモを使用します。
推測時において、このモデルは、専門家の把握が示される表面と最も幾何学的に類似した表面を識別することにより、新しい物体に把握を伝達するために使用される。
論文 参考訳(メタデータ) (2023-08-15T14:33:17Z) - Detection and Physical Interaction with Deformable Linear Objects [10.707804359932604]
変形可能な線形オブジェクト(例えば、ケーブル、ロープ、スレッド)は、私たちの日常生活に一般的に現れます。
変形可能な線形オブジェクトをモデル化し追跡する手法はすでに成功している。
本研究では,地上および空中ロボットによるルーティングや操作などのタスクに本手法を用いることについて述べる。
論文 参考訳(メタデータ) (2022-05-17T01:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。