Fugu-MT 論文翻訳(概要): SI-Diff: A Framework for Learning Search and High-Precision Insertion with a Force-Domain Diffusion Policy

論文の概要: SI-Diff: A Framework for Learning Search and High-Precision Insertion with a Force-Domain Diffusion Policy

arxiv url: http://arxiv.org/abs/2605.12247v1
Date: Tue, 12 May 2026 15:14:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 21:48:56.9568
Title: SI-Diff: A Framework for Learning Search and High-Precision Insertion with a Force-Domain Diffusion Policy
Title（参考訳）: SI-Diff:フォースドメイン拡散政策による検索と高精度挿入の学習フレームワーク
Authors: Yibo Liu, Stanko Oparnica, Simon Shewchun-Jakaitis, Guoyi Fu, Jie Wang, Jun Yang, Anand Jagannathan, Tony Hong-Yau Lo,
Abstract要約: 本稿では,SI-Diffを提案する。SI-Diffは,力領域拡散ポリシーを用いて,探索と高精度挿入の両方を学習するフレームワークである。 SI-Diffは,最先端のベースラインであるTacDiffusionと比較して,2mmから5mmのミスアライメントに対する耐性を2mmまで拡張することを示すための徹底的な実験を行った。
参考スコア（独自算出の注目度）: 5.439341986309672
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Contact-rich assembly is fundamental in robotics but poses significant challenges due to uncertainties in relative poses, such as misalignments and small clearances in peg-in-hole tasks. Existing approaches typically address search and high-precision insertion separately, because these tasks involve distinct action patterns. However, supporting both tasks within a single model, without switching models or weights, is desirable for intelligent assembly systems. In this work, we propose SI-Diff, a framework that learns both search and high-precision insertion through a force-domain diffusion policy. To this end, we introduce a new mode-conditioning mechanism that enables the policy to capture distinct action behaviors under a single framework. Moreover, we develop a new search teacher policy that can generate diverse trajectories. By training on successful and efficient demonstrations provided by the teacher policy, the model learns the mapping from tactile and end-effector velocity observations to effective action behaviors. We conduct thorough experiments to show that SI-Diff extends the tolerance to x-y misalignments from 2 mm to 5 mm compared to the state-of-the-art baseline, TacDiffusion, while also demonstrating strong zero-shot transferability to unseen shapes.
Abstract（参考訳）: 接触に富んだ組立はロボティクスにおいて基本的なものであるが、ペグ・イン・ホール・タスクのミスアライメントや小さなクリアランスなど、相対的なポーズの不確実性のために重大な課題を提起する。既存のアプローチでは、これらのタスクは異なるアクションパターンを含むため、検索と高精度挿入を別々に扱うのが一般的である。しかし、モデルや重みを切り替えることなく、単一のモデル内で両方のタスクをサポートすることは、インテリジェントなアセンブリシステムには望ましい。本研究では,SI-Diffを提案する。SI-Diffは,力領域拡散ポリシーを用いて,探索と高精度挿入の両方を学習するフレームワークである。そこで本研究では,単一フレームワーク下での異なる行動行動の把握を可能にする,新しいモード条件機構を提案する。さらに,多様なトラジェクトリを生成できる新しい検索教師ポリシーを開発した。教師の方針によって提供される成功的で効率的な実演の訓練により、モデルは触覚と終末エフェクターの速度観察から効果的な行動行動へのマッピングを学習する。 SI-Diffは, 最先端のベースラインであるTacDiffusionと比較して2mmから5mmのミスアライメントに耐性を示すとともに, 見えない形状に対して強いゼロショット転送性を示す。

関連論文リスト

Primary-Fine Decoupling for Action Generation in Robotic Imitation [91.2899765310853]
ロボット操作動作シーケンスにおけるマルチモーダル分布は、模倣学習にとって重要な課題である。 PF-DAG(プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、PF-DAG)を提案する。 PF-DAGは、Adroit、DexArt、MetaWorldベンチマークの56タスクで最先端のベースラインを上回っている。
論文参考訳（メタデータ） (2026-02-25T08:36:45Z)
Reasoning and Tool-use Compete in Agentic RL:From Quantifying Interference to Disentangled Tuning [26.401906729658688]
Agentic Reinforcement Learning (ARL) は、複雑なタスクを解決するために、推論と外部ツールの実行をインターリーブするために、大きな言語モデルをトレーニングすることに焦点を当てている。ほとんどの既存のARLメソッドは、推論とツールの使用行動の両方をサポートするために単一の共有モデルパラメータをトレーニングしている。これらの2つの能力は、しばしば不整合勾配方向を誘導し、共同最適化の有効性を損なう訓練の干渉を引き起こす。 DART(Disentangled Action Reasoning Tuning)は、推論のためのパラメータ更新とツール使用を分離したローランクで明示的に分離する、シンプルで効率的なフレームワークである。
論文参考訳（メタデータ） (2026-02-01T03:19:22Z)
From Sparse Decisions to Dense Reasoning: A Multi-attribute Trajectory Paradigm for Multimodal Moderation [59.27094165576015]
疎度な意思決定から高密度な推論トレースへ移行する新しい学習パラダイム(UniMod)を提案する。モノリシックな意思決定タスクを多次元境界学習プロセスに再構成し,エビデンス,モダリティ評価,リスクマッピング,政策決定,応答生成を含む構造化軌道を構築する。タスク固有のパラメータを分離し、トレーニングダイナミクスを再バランスさせ、マルチタスク学習における多様な目的間の干渉を効果的に解消する、特別な最適化戦略を導入する。
論文参考訳（メタデータ） (2026-01-28T09:29:40Z)
DIS2: Disentanglement Meets Distillation with Classwise Attention for Robust Remote Sensing Segmentation under Missing Modalities [28.992992584085787]
DIS2は、モダリティ共有機能依存からアクティブでガイド付き機能不足補償へ移行した新しいパラダイムである。補償的特徴は、利用可能なモダリティの特徴と融合すると、フルモダリティの場合の理想的フューズド表現に近似する。提案手法はベンチマーク間で最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (2026-01-20T01:33:54Z)
Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文参考訳（メタデータ） (2025-09-27T19:43:04Z)
CKAA: Cross-subspace Knowledge Alignment and Aggregation for Robust Continual Learning [80.18781219542016]
継続的学習(CL)は、シーケンシャルなタスクストリームから継続的に学習するAIモデルに権限を与える。近年,パラメータ効率のよい微調整(PEFT)によるCL法が注目されている。ミスリード型タスクIDに対するロバスト性を高めるために,クロスサブスペース・ナレッジアライメント・アグリゲーション(CKAA)を提案する。
論文参考訳（メタデータ） (2025-07-13T03:11:35Z)
La-SoftMoE CLIP for Unified Physical-Digital Face Attack Detection [27.020392407198948]
顔認識システムは、物理的攻撃とデジタル攻撃の両方に影響を受けやすい。スパースモデルを用いてスパースデータを処理する新しい手法を提案する。フレキシブルな自己適応型重み付け機構を導入し、モデルに適合し、適応できるようにします。
論文参考訳（メタデータ） (2024-08-23T02:12:13Z)
Reprogramming Distillation for Medical Foundation Models [37.52464627899668]
我々はリプログラミング蒸留(RD)と呼ばれる新しいフレームワークを提案する。 RDはファンデーションモデルの本来の機能空間を再プログラミングし、下流のシナリオとより関係があるようにします。 RDは従来のPEFT法やKD法よりも優れた性能を実現している。
論文参考訳（メタデータ） (2024-07-09T02:17:51Z)
Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learning [62.05713042908654]
本稿では,これらの課題を克服するために,高品質な実演データを活用する新しいアプローチであるAlignment from Demonstrations (AfD)を紹介する。 AfDをシーケンシャルな意思決定フレームワークで形式化し、報酬信号の欠如というユニークな課題を強調します。そこで本研究では,AfD に適した報酬モデル上で補間を行う計算効率のよいアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-24T15:13:53Z)
Learning from demonstration using products of experts: applications to manipulation and task prioritization [12.378784643460474]
異なるタスク空間におけるモデルの融合は、専門家(PoE)の積として表現できることを示す。複数の実験を行い、PoEフレームワークで異なるモデルを共同で学習することで、モデルの品質が大幅に向上することを示した。
論文参考訳（メタデータ） (2020-10-07T16:24:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。