論文の概要: Tactile-Sensitive NewtonianVAE for High-Accuracy Industrial
Connector-Socket Insertion
- arxiv url: http://arxiv.org/abs/2203.05955v1
- Date: Thu, 10 Mar 2022 09:53:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 13:54:24.674607
- Title: Tactile-Sensitive NewtonianVAE for High-Accuracy Industrial
Connector-Socket Insertion
- Title(参考訳): 高精度産業用コネクタ-ソケットインサーション用触覚ニュートニアVAE
- Authors: Ryo Okumura, Nobuki Nishio and Tadahiro Taniguchi
- Abstract要約: 本研究は,USBコネクタの挿入にNewtonianVAEを適用し,物理的環境におけるポーズの変化を把握した。
我々は、GelSight型触覚センサを採用し、コネクタのグリップポーズによって補正された挿入位置を推定する。
実験結果から,提案手法は回帰型グリップポーズ推定器と座標変換器の簡単な組み合わせよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 7.0471949371778795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An industrial connector-socket insertion task requires sub-millimeter
positioning and compensation of grasp pose of a connector. Thus high accurate
estimation of relative pose between socket and connector is a key factor to
achieve the task. World models are promising technology for visuo-motor
control. They obtain appropriate state representation for control to jointly
optimize feature extraction and latent dynamics model. Recent study shows
NewtonianVAE, which is a kind of the world models, acquires latent space which
is equivalent to mapping from images to physical coordinate. Proportional
control can be achieved in the latent space of NewtonianVAE. However,
application of NewtonianVAE to high accuracy industrial tasks in physical
environments is open problem. Moreover, there is no general frameworks to
compensate goal position in the obtained latent space considering the grasp
pose. In this work, we apply NewtonianVAE to USB connector insertion with grasp
pose variation in the physical environments. We adopt a GelSight type tactile
sensor and estimate insertion position compensated by the grasp pose of the
connector. Our method trains the latent space in an end-to-end manner, and
simple proportional control is available. Therefore, it requires no additional
engineering and annotation. Experimental results show that the proposed method,
Tactile-Sensitive NewtonianVAE, outperforms naive combination of
regression-based grasp pose estimator and coordinate transformation. Moreover,
we reveal the original NewtonianVAE does not work in some situation, and
demonstrate that domain knowledge induction improves model accuracy. This
domain knowledge is easy to be known from specification of robots or
measurement.
- Abstract(参考訳): 工業用コネクタソケット挿入タスクは、コネクタのグリップポーズのサブミリ位置決めと補償を必要とする。
したがって、ソケットとコネクタ間の相対的なポーズの高精度な推定は、タスクを実現する上で重要な要素である。
世界モデルはバイスオモーター制御に有望な技術である。
彼らは特徴抽出と潜在力学モデルを協調的に最適化する制御のための適切な状態表現を得る。
近年の研究では、世界モデルの一種であるNewtonianVAEが、画像から物理座標へのマッピングに相当する潜在空間を取得している。
比例制御はニュートンVAEの潜在空間で達成できる。
しかし,newtonianvaeの物理環境における高精度産業タスクへの応用は未解決の問題である。
さらに、把握ポーズを考慮した潜在空間における目標位置を補償する一般的な枠組みは存在しない。
本研究では,usbコネクタの挿入にnewtonianvaeを応用し,物理的環境におけるポーズ変化を把握した。
ゲルアイ型触覚センサを採用し,コネクタの把持姿勢によって補償される挿入位置を推定する。
本手法では, 潜在空間をエンドツーエンドに訓練し, 単純な比例制御が可能となる。
そのため、追加のエンジニアリングやアノテーションは不要である。
実験の結果, 触覚に敏感なnewtonianvae法は, 回帰型把持姿勢推定器と座標変換のナイーブな組み合わせよりも優れていることがわかった。
さらに、元のnewtonianvaeは何らかの状況では機能せず、ドメイン知識誘導によってモデルの精度が向上することを示す。
このドメイン知識は、ロボットの仕様や測定から容易に知ることができる。
関連論文リスト
- Learning Force Distribution Estimation for the GelSight Mini Optical Tactile Sensor Based on Finite Element Analysis [14.519026897678081]
センサの原画像から直接力分布を予測するために,U-netアーキテクチャを用いた機械学習手法を提案する。
有限要素解析(FEA)から推定される力分布をトレーニングした本モデルでは,通常の力分布とせん断力分布の予測に有望な精度を示す。
また、同じタイプのセンサーをまたいで一般化し、リアルタイムアプリケーションを可能にする可能性も示している。
論文 参考訳(メタデータ) (2024-10-08T11:01:12Z) - A Versatile and Differentiable Hand-Object Interaction Representation [2.184775414778289]
CHOIR(Coarse Hand-Object Interaction Representation)は、HOIモデリングにおいて汎用的で微分可能である。
ChoIRは、パラメータがほとんどない密接な接触マップを表す。
Joint Diffusionは、雑音のある手-物体の相互作用を条件としたグリップ分布を学習するための拡散モデルである。
論文 参考訳(メタデータ) (2024-09-25T12:06:30Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Smooth, exact rotational symmetrization for deep learning on point
clouds [0.0]
汎用のポイントクラウドモデルはより多様であるが、しばしば回転対称性を無視する。
本稿では,他のすべての要件を保ちながら任意のモデルに回転同値を付加する一般対称性化法を提案する。
このアイデアは,本質的同変ではないが,分子や固体のベンチマークデータセット上での最先端性能を実現するPoint Edge Transformer (PET) アーキテクチャを導入することで実証する。
論文 参考訳(メタデータ) (2023-05-30T15:26:43Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Vision-driven Compliant Manipulation for Reliable, High-Precision
Assembly Tasks [26.445959214209505]
本稿では,最先端の物体追跡と受動適応型機械ハードウェアを組み合わせることで,高精度な操作作業を実現することを実証する。
提案手法は,作業空間内の物体の相対的な6次元ポーズを追跡することにより,視覚を通してループを閉じる。
論文 参考訳(メタデータ) (2021-06-26T17:54:16Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z) - Assistive Relative Pose Estimation for On-orbit Assembly using
Convolutional Neural Networks [0.0]
本稿では、畳み込みニューラルネットワークを利用して、カメラに対して関心のある物体の翻訳と回転を決定する。
アセンブリタスク用に設計されたシミュレーションフレームワークを使用して、修正CNNモデルをトレーニングするためのデータセットを生成する。
モデルが現在の特徴選択法に匹敵する性能を示し、従ってそれらと組み合わせてより信頼性の高い推定値を提供することができる。
論文 参考訳(メタデータ) (2020-01-29T02:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。