論文の概要: Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
- arxiv url: http://arxiv.org/abs/2410.16571v1
- Date: Mon, 21 Oct 2024 23:07:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:29:30.549328
- Title: Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
- Title(参考訳): インプシットコンタクトディフューザ:潜在点雲拡散による連続接触推論
- Authors: Zixuan Huang, Yinong He, Yating Lin, Dmitry Berenson,
- Abstract要約: 長距離接触リッチな操作は、離散接触モードと連続物体運動の両方の推論を必要とするため、長い間難しい問題であった。
本稿では,オブジェクトと環境間の一連の接触関係を規定する神経記述子のシーケンスを生成する拡散モデルであるImplicit Contact diffuser(ICD)を紹介する。
ICDは、ケーブルルーティングやノートブックの折り畳みといった、複雑で長い水平なコンタクトリッチな操作タスクにおいて、ベースラインよりも優れています。
- 参考スコア(独自算出の注目度): 11.93045105087373
- License:
- Abstract: Long-horizon contact-rich manipulation has long been a challenging problem, as it requires reasoning over both discrete contact modes and continuous object motion. We introduce Implicit Contact Diffuser (ICD), a diffusion-based model that generates a sequence of neural descriptors that specify a series of contact relationships between the object and the environment. This sequence is then used as guidance for an MPC method to accomplish a given task. The key advantage of this approach is that the latent descriptors provide more task-relevant guidance to MPC, helping to avoid local minima for contact-rich manipulation tasks. Our experiments demonstrate that ICD outperforms baselines on complex, long-horizon, contact-rich manipulation tasks, such as cable routing and notebook folding. Additionally, our experiments also indicate that \methodshort can generalize a target contact relationship to a different environment. More visualizations can be found on our website $\href{https://implicit-contact-diffuser.github.io/}{https://implicit-contact-diffuser.github.io}$
- Abstract(参考訳): 長距離接触リッチな操作は、離散接触モードと連続物体運動の両方の推論を必要とするため、長い間難しい問題であった。
本稿では,オブジェクトと環境間の一連の接触関係を規定する神経記述子のシーケンスを生成する拡散モデルであるImplicit Contact Diffuser(ICD)を紹介する。
このシーケンスは、与えられたタスクを達成するためのMPCメソッドのガイダンスとして使用される。
このアプローチの主な利点は、潜在ディスクリプタがMPCにもっとタスク関連ガイダンスを提供し、コンタクトリッチな操作タスクのローカルなミニマを避けるのに役立つことである。
我々の実験では、ICDは、ケーブルルーティングやノートブックの折り畳みといった、複雑な、長い水平、コンタクトリッチな操作タスクにおいて、ベースラインよりも優れていることを示した。
さらに,<methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methodshort</methort</methodshort</methort</methort</methot</methort</methort</methort</methort</methort</methort</methort</methort</
さらなる視覚化は、我々のWebサイト $\href{https://implicit-contact-diffuser.github.io/}{https://implicit-contact-diffuser.github.io}$で見ることができる。
関連論文リスト
- ClickDiff: Click to Induce Semantic Contact Map for Controllable Grasp Generation with Diffusion Models [17.438429495623755]
ClickDiffは、きめ細かいセマンティックコンタクトマップを利用する制御可能な条件生成モデルである。
このフレームワーク内では、セマンティック条件付きモジュールは、きめ細かい接触情報に基づいて適切な接触マップを生成する。
提案手法の有効性を検証し,ClickDiffの有効性とロバスト性を実証した。
論文 参考訳(メタデータ) (2024-07-28T02:42:29Z) - Frontend Diffusion: Exploring Intent-Based User Interfaces through Abstract-to-Detailed Task Transitions [1.845645938093348]
ユーザスケッチから高品質なWebサイトを生成するエンドツーエンドツールであるFrontend Diffusionを紹介した。
複雑なタスクにおける人的介入やコミュニケーションコストを低減するために,タスク遷移の可能性を示す。
論文 参考訳(メタデータ) (2024-07-16T20:24:35Z) - LTLDoG: Satisfying Temporally-Extended Symbolic Constraints for Safe Diffusion-based Planning [12.839846486863308]
本研究では,新しい静的かつ時間的に拡張された制約/命令に準拠する長い水平軌道を生成することに焦点を当てる。
本稿では、線形時間論理を用いて指定された命令を与えられた逆プロセスの推論ステップを変更する、データ駆動拡散に基づくフレームワーク、 finiteDoGを提案する。
ロボットナビゲーションと操作の実験では、障害物回避と訪問シーケンスを指定する公式を満たす軌道を生成することができる。
論文 参考訳(メタデータ) (2024-05-07T11:54:22Z) - Multiple Object Tracking as ID Prediction [14.890192237433771]
マルチプルオブジェクトトラッキング(MOT)では、トラッキング・バイ・検出の手法が長い間テストされてきた。
シングルフレーム検出器を活用し、手作りのアルゴリズムとサロゲートタスクを通じてオブジェクト関連を後処理のステップとして扱う。
しかし、テクニックの性質は、トレーニングデータのエンドツーエンドの活用を妨げるため、ますます面倒で困難な手作業の修正につながる。
論文 参考訳(メタデータ) (2024-03-25T15:09:54Z) - Joint Entity and Relation Extraction with Span Pruning and Hypergraph
Neural Networks [58.43972540643903]
PLマーカ(最先端マーカーベースピプレリンモデル)上に構築されたEREのためのHyperGraphニューラルネットワーク(hgnn$)を提案する。
エラーの伝播を軽減するため,NERモジュールからのエンティティ識別とラベル付けの負担をモデルのジョイントモジュールに転送するために,ハイリコールプルーナー機構を用いる。
EREタスクに広く使用されている3つのベンチマークの実験は、以前の最先端のPLマーカーよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-10-26T08:36:39Z) - SparseTrack: Multi-Object Tracking by Performing Scene Decomposition
based on Pseudo-Depth [84.64121608109087]
2次元画像から目標の相対的な深さを求めるための擬似深度推定法を提案する。
次に,得られた深度情報を用いて,高密度なターゲットセットを複数のスパースなターゲットサブセットに変換するディープカスケードマッチング(DCM)アルゴリズムを設計する。
擬似深度法とDCM戦略をデータアソシエーションプロセスに統合することにより、SparseTrackと呼ばれる新しいトラッカーを提案する。
論文 参考訳(メタデータ) (2023-06-08T14:36:10Z) - Learning Explicit Contact for Implicit Reconstruction of Hand-held
Objects from Monocular Images [59.49985837246644]
我々は,手持ちの物体を暗黙的に再構築する上で,明示的な方法で接触をモデル化する方法を示す。
まず,1つの画像から3次元手オブジェクトの接触を直接推定するサブタスクを提案する。
第2部では,ハンドメッシュ面から近傍の3次元空間へ推定された接触状態を拡散する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:59:26Z) - HyRSM++: Hybrid Relation Guided Temporal Set Matching for Few-shot
Action Recognition [51.2715005161475]
そこで本研究では,数発のアクション認識のための時間的マッチング手法として,ハイブリッドリレーションド・テンポラル・セット・マッチングを提案する。
HyRSM++の中核となる考え方は、すべてのビデオをタスクに統合して差別的な表現を学ぶことである。
提案手法は,様々な撮影条件下での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-01-09T13:32:50Z) - GEN-VLKT: Simplify Association and Enhance Interaction Understanding for
HOI Detection [17.92210977820113]
本稿では,2分岐パイプラインをポストマッチングなしで実現するためのガイド埋め込みネットワーク(GEN)を提案する。
協会にとって、以前の2枝の手法は複雑でコストのかかるポストマッチングに悩まされる。
相互作用理解のために、従来の手法は長い尾の分布とゼロショット発見に悩まされていた。
論文 参考訳(メタデータ) (2022-03-26T01:04:13Z) - Disentangling Online Chats with DAG-Structured LSTMs [55.33014148383343]
DAG-LSTMはTree-LSTMの一般化であり、間接的な非循環的依存関係を処理できる。
提案する新モデルでは,リプライ・トゥ・リレーション(Repend-to-Relation)を回復する作業において,アート・ステータスの状態を達成できることが示される。
論文 参考訳(メタデータ) (2021-06-16T18:00:00Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。