論文の概要: CNSv2: Probabilistic Correspondence Encoded Neural Image Servo
- arxiv url: http://arxiv.org/abs/2503.00132v1
- Date: Fri, 28 Feb 2025 19:22:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:15:40.341638
- Title: CNSv2: Probabilistic Correspondence Encoded Neural Image Servo
- Title(参考訳): CNSv2:確率的対応符号化ニューラルイメージサーボ
- Authors: Anzhe Chen, Hongxiang Yu, Shuxin Li, Yuxi Chen, Zhongxiang Zhou, Wentao Sun, Rong Xiong, Yue Wang,
- Abstract要約: キーポイント検出やマッチングは、一貫性のない照明やテクスチャのないオブジェクトで難しいシナリオで失敗する傾向がある。
提案したCor correspondingence encoded Neural image Servo Policyを含む従来のアプローチは、これらの問題を緩和しようと試みた。
確率対応型ニューラルイメージサーボ(CNSv2)を提案する。
- 参考スコア(独自算出の注目度): 18.07315370906157
- License:
- Abstract: Visual servo based on traditional image matching methods often requires accurate keypoint correspondence for high precision control. However, keypoint detection or matching tends to fail in challenging scenarios with inconsistent illuminations or textureless objects, resulting significant performance degradation. Previous approaches, including our proposed Correspondence encoded Neural image Servo policy (CNS), attempted to alleviate these issues by integrating neural control strategies. While CNS shows certain improvement against error correspondence over conventional image-based controllers, it could not fully resolve the limitations arising from poor keypoint detection and matching. In this paper, we continue to address this problem and propose a new solution: Probabilistic Correspondence Encoded Neural Image Servo (CNSv2). CNSv2 leverages probabilistic feature matching to improve robustness in challenging scenarios. By redesigning the architecture to condition on multimodal feature matching, CNSv2 achieves high precision, improved robustness across diverse scenes and runs in real-time. We validate CNSv2 with simulations and real-world experiments, demonstrating its effectiveness in overcoming the limitations of detector-based methods in visual servo tasks.
- Abstract(参考訳): 従来の画像マッチング手法に基づくビジュアルサーボは、高精度な制御のために正確なキーポイント対応を必要とすることが多い。
しかし、キーポイント検出やマッチングは、一貫性のない照明やテクスチャのないオブジェクトで難しいシナリオで失敗する傾向があり、結果としてパフォーマンスが大幅に低下する。
提案した対応型ニューラルイメージサーボポリシー(CNS)を含む従来のアプローチは、ニューラルコントロール戦略を統合することでこれらの問題を緩和しようとした。
CNSは、従来の画像ベースコントローラよりもある程度のエラー対応を示すが、キーポイント検出とマッチングの貧弱さに起因する制限を完全に解決することはできなかった。
本稿では,この問題に引き続き対処し,確率対応型ニューラルイメージサーボ(CNSv2)を提案する。
CNSv2は確率的特徴マッチングを活用して、困難なシナリオの堅牢性を改善する。
アーキテクチャをマルチモーダルな特徴マッチングの条件に再設計することで、CNSv2は高い精度を実現し、多様なシーンにまたがる堅牢性を向上し、リアルタイムで実行することができる。
我々は,CNSv2をシミュレーションと実世界の実験で検証し,視覚サーボタスクにおける検出器ベースの手法の限界を克服する効果を実証した。
関連論文リスト
- Scalable and Explainable Verification of Image-based Neural Network Controllers for Autonomous Vehicles [3.2540854278211864]
自動運転車における画像ベースニューラルネットワークコントローラの既存の形式的検証手法は、高次元入力、計算の非効率性、説明可能性の欠如に悩むことが多い。
変動オートエンコーダ(VAE)を利用して高次元画像を低次元で説明可能な潜在空間に符号化するフレームワークである textbfSEVIN を提案する。
提案手法では, 実世界の摂動下でのロバスト性検証を, データセットを増強し, 環境変動を捉えるためにVAEを再訓練することで実現している。
論文 参考訳(メタデータ) (2025-01-23T16:46:45Z) - Unified Batch Normalization: Identifying and Alleviating the Feature
Condensation in Batch Normalization and a Unified Framework [55.22949690864962]
バッチ正規化(BN)は、現代のニューラルネットワーク設計において欠かせない技術となっている。
UBN(Unified Batch Normalization)と呼ばれる2段階統合フレームワークを提案する。
UBNは異なる視覚バックボーンと異なる視覚タスクのパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-27T16:41:31Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Transformer Compressed Sensing via Global Image Tokens [4.722333456749269]
低解像度入力に自然に画像を埋め込む新しい画像分解法を提案する。
我々は、よく知られたCS-MRIニューラルネットワークのCNNコンポーネントをTNNブロックに置き換え、KDによる改善を実証する。
論文 参考訳(メタデータ) (2022-03-24T05:56:30Z) - MisConv: Convolutional Neural Networks for Missing Data [8.913337498441724]
不完全な画像処理に様々なCNNアーキテクチャを適用するためのメカニズムであるMisConvを提案する。
因子分析器の混合による欠落値の分布をモデル化することにより、畳み込み演算子の期待値の解析式を求める。
フレームワーク全体がマトリックス操作によって実現されているため、実際にはMisConvは非常に効率的である。
論文 参考訳(メタデータ) (2021-10-26T20:39:36Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - A Singular Value Perspective on Model Robustness [14.591622269748974]
我々は、自然に訓練され、逆向きに堅牢なCNNが、同じデータセットに対して非常に異なる特徴を利用することを示す。
画像ランクに対するCNNの依存性を理解するために,最初のランクベース特徴属性法であるランク統合勾配(RIG)を提案する。
論文 参考訳(メタデータ) (2020-12-07T08:09:07Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Event-based Asynchronous Sparse Convolutional Networks [54.094244806123235]
イベントカメラはバイオインスパイアされたセンサーで、非同期でスパースな「イベント」の形で画素ごとの明るさ変化に反応する。
同期画像のようなイベント表現で訓練されたモデルを、同じ出力を持つ非同期モデルに変換するための一般的なフレームワークを提案する。
理論的および実験的に、これは高容量同期ニューラルネットワークの計算複雑性と遅延を大幅に減少させることを示す。
論文 参考訳(メタデータ) (2020-03-20T08:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。