Fugu-MT 論文翻訳(概要): Grasp Synthesis Matching From Rigid To Soft Robot Grippers Using Conditional Flow Matching

論文の概要: Grasp Synthesis Matching From Rigid To Soft Robot Grippers Using Conditional Flow Matching

arxiv url: http://arxiv.org/abs/2602.17110v1
Date: Thu, 19 Feb 2026 06:12:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.561383
Title: Grasp Synthesis Matching From Rigid To Soft Robot Grippers Using Conditional Flow Matching
Title（参考訳）: 条件付きフローマッチングを用いた剛体からソフトロボットグリップへのグラフ合成マッチング
Authors: Tanisha Parulekar, Ge Shi, Josh Pinskier, David Howard, Jen Jen Chung,
Abstract要約: 本稿では,剛性グリップパモデルから軟質フィン線グリップパへのグリップポーズをマッピングするための新しいフレームワークを提案する。生成モデルである条件付きフローマッチング(CFM)を用いて,この複雑な変換を学習する。 U-Netオートエンコーダは、深度画像からオブジェクトの幾何学上のCFMモデルを条件付け、安定なFin-rayグッパーポーズに対する初期Anygraspのポーズから連続的なマッピングを学習することができる。
参考スコア（独自算出の注目度）: 5.89165586721424
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A representation gap exists between grasp synthesis for rigid and soft grippers. Anygrasp [1] and many other grasp synthesis methods are designed for rigid parallel grippers, and adapting them to soft grippers often fails to capture their unique compliant behaviors, resulting in data-intensive and inaccurate models. To bridge this gap, this paper proposes a novel framework to map grasp poses from a rigid gripper model to a soft Fin-ray gripper. We utilize Conditional Flow Matching (CFM), a generative model, to learn this complex transformation. Our methodology includes a data collection pipeline to generate paired rigid-soft grasp poses. A U-Net autoencoder conditions the CFM model on the object's geometry from a depth image, allowing it to learn a continuous mapping from an initial Anygrasp pose to a stable Fin-ray gripper pose. We validate our approach on a 7-DOF robot, demonstrating that our CFM-generated poses achieve a higher overall success rate for seen and unseen objects (34% and 46% respectively) compared to the baseline rigid poses (6% and 25% respectively) when executed by the soft gripper. The model shows significant improvements, particularly for cylindrical (50% and 100% success for seen and unseen objects) and spherical objects (25% and 31% success for seen and unseen objects), and successfully generalizes to unseen objects. This work presents CFM as a data-efficient and effective method for transferring grasp strategies, offering a scalable methodology for other soft robotic systems.
Abstract（参考訳）: 剛性グリップと軟質グリップのグリップ合成の間には, 表現ギャップが存在する。 Anygrasp [1] や他の多くのグリップ合成法は、厳密な並列グリップパーのために設計されており、それらをソフトグリップパーに適合させると、その固有の従順な振る舞いを捉えることができず、結果としてデータ集約的かつ不正確なモデルが生じる。このギャップを埋めるために,剛性グリップパーモデルから軟質フィン線グリップパーへのグリップポーズをマッピングする新しいフレームワークを提案する。生成モデルである条件付きフローマッチング(CFM)を用いて,この複雑な変換を学習する。我々の手法は、ペア化された硬質軟質グリップポーズを生成するデータ収集パイプラインを含む。 U-Netオートエンコーダは、深度画像からオブジェクトの幾何学上のCFMモデルを条件付け、安定なFin-rayグッパーポーズに対する初期Anygraspのポーズから連続的なマッピングを学習する。 7-DOFロボットに対する我々のアプローチを検証し, ソフトグリップで行う場合の基準剛性ポーズ(6%, 25%)と比較して, CFM生成したポーズは, 目に見えるオブジェクトと見えないオブジェクトの総合的な成功率(34%, 46%)が高いことを示した。このモデルでは、特に円筒形(観察対象と見えない対象に対して50%から100%の成功)と球状物体(観察対象と見えない対象に対して25%と31%の成功)において顕著な改善が見られ、未確認対象への一般化に成功している。本研究は,CFMを把握戦略を伝達するためのデータ効率と効果的な方法として提示し,他のソフトロボットシステムにスケーラブルな方法論を提供する。

関連論文リスト

Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文参考訳（メタデータ） (2026-03-04T11:38:12Z)
Visual Autoregressive Modelling for Monocular Depth Estimation [69.01449528371916]
本稿では,視覚的自己回帰(VAR)に基づく単眼深度推定手法を提案する。提案手法は,大規模テキスト・画像VARモデルに適応し,スケールワイド・コンディショナル・アップサンプリング機構を導入する。本研究では,屋内ベンチマークにおける制約付きトレーニング条件下での最先端性能と,屋外データセットに適用した場合の強い性能について報告する。
論文参考訳（メタデータ） (2025-12-27T17:08:03Z)
DAFM: Dynamic Adaptive Fusion for Multi-Model Collaboration in Composed Image Retrieval [2.330678113289435]
合成画像検索(CIR)におけるマルチモデル協調のための動的適応融合(DAFM)を提案する。提案手法は,CIRR上のRecall@10,CIRR上のRmean84.43,FashionIQ上のRmean67.48を実現し,最近の強いベースラインを最大4.5%超えた。
論文参考訳（メタデータ） (2025-11-07T06:51:10Z)
URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model [76.08429266631823]
3次元マルチモーダル大言語モデル(MLLM)に基づくエンドツーエンドの自動再構築フレームワークを提案する。 URDF-Anythingは、ポイントクラウドとテキストマルチモーダル入力に基づく自己回帰予測フレームワークを使用して、幾何学的セグメンテーションと運動論的パラメータ予測を協調的に最適化する。シミュレーションと実世界の両方のデータセットの実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文参考訳（メタデータ） (2025-11-02T13:45:51Z)
PoseDiff: A Unified Diffusion Model Bridging Robot Pose Estimation and Video-to-Action Control [67.17998939712326]
本稿では,ロボットの状態推定と制御を単一のフレームワーク内で統一する条件拡散モデルPoseDiffを提案する。中心となるPoseDiffは、生の視覚を3Dキーポイントや関節角などの構造化されたロボットの状態にマッピングする。この基盤の上に構築されたPoseDiffは、ビデオからアクションへの逆ダイナミクスに自然に拡張する。
論文参考訳（メタデータ） (2025-09-29T10:55:48Z)
RoFt-Mol: Benchmarking Robust Fine-Tuning with Molecular Graph Foundation Models [15.62650736139546]
本研究では,8つのファインチューニング手法を,ウェイトベース,表現ベース,部分的なファインチューニングの3つのメカニズムに分類する。各種ラベル設定における教師付きおよび自己教師付き事前学習モデルの下流回帰および分類タスクについて,これらの手法をベンチマークした。この評価は有用な洞察を与え、洗練された頑健な微調整法であるROFT-MOLの設計を通知する。
論文参考訳（メタデータ） (2025-08-30T21:35:57Z)
Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。 Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文参考訳（メタデータ） (2025-06-24T17:58:02Z)
Reconstructing Humans with a Biomechanically Accurate Skeleton [55.06027148976482]
本研究では,生体力学的に正確な骨格モデルを用いて,単一の画像から3次元人体を再構築する手法を提案する。 3次元メッシュ回復のための最先端の手法と比較して,我々のモデルは標準ベンチマーク上での競合性能を実現している。
論文参考訳（メタデータ） (2025-03-27T17:56:24Z)
ARMO: Autoregressive Rigging for Multi-Category Objects [8.030479370619458]
我々はOmniRigを紹介した。OmniRigは79,499個のメッシュで構成され、詳細なスケルトンとスキン情報を含んでいる。定義済みの標準ポーズに依存する従来のベンチマークとは異なり、データセットにはさまざまな形状カテゴリ、スタイル、ポーズが採用されています。本稿では、自己回帰モデルを用いて、関節位置と接続関係を統一的に予測する新しいリギングフレームワークARMOを提案する。
論文参考訳（メタデータ） (2025-03-26T15:56:48Z)
RigAnything: Template-Free Autoregressive Rigging for Diverse 3D Assets [44.655049022141384]
本稿では,新しい自己回帰変換モデルであるRigAnythingを紹介する。関節と骨格のトポロジを確率的に生成し、スキンの重量をテンプレートのない方法で割り当てることで、3Dアセットをリグレディにする。これは、ヒューマノイド、四足動物、海洋生物、昆虫など、さまざまな種類の物体にまたがる最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2025-02-13T18:59:13Z)
Monocular 3D Hand Mesh Recovery via Dual Noise Estimation [47.82179706128616]
画像によく整合したメッシュを生成するための二重雑音推定手法を提案する。提案手法は,大規模なInterhand2.6Mデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-12-26T07:21:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。