Fugu-MT 論文翻訳(概要): iMatching: Imperative Correspondence Learning

論文の概要: iMatching: Imperative Correspondence Learning

arxiv url: http://arxiv.org/abs/2312.02141v2
Date: Wed, 31 Jul 2024 17:41:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-01 20:35:03.597985
Title: iMatching: Imperative Correspondence Learning
Title（参考訳）: iMatching: 命令対応学習
Authors: Zitong Zhan, Dasong Gao, Yun-Jou Lin, Youjie Xia, Chen Wang,
Abstract要約: 特徴対応学習のための自己指導型命令型学習(IL)を導入する。カメラのポーズやディープラベルを使わずに、任意の未中断ビデオの対応学習を可能にする。特徴マッチングやポーズ推定などのタスクにおいて,優れた性能を示す。
参考スコア（独自算出の注目度）: 5.568520539073218
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Learning feature correspondence is a foundational task in computer vision, holding immense importance for downstream applications such as visual odometry and 3D reconstruction. Despite recent progress in data-driven models, feature correspondence learning is still limited by the lack of accurate per-pixel correspondence labels. To overcome this difficulty, we introduce a new self-supervised scheme, imperative learning (IL), for training feature correspondence. It enables correspondence learning on arbitrary uninterrupted videos without any camera pose or depth labels, heralding a new era for self-supervised correspondence learning. Specifically, we formulated the problem of correspondence learning as a bilevel optimization, which takes the reprojection error from bundle adjustment as a supervisory signal for the model. To avoid large memory and computation overhead, we leverage the stationary point to effectively back-propagate the implicit gradients through bundle adjustment. Through extensive experiments, we demonstrate superior performance on tasks including feature matching and pose estimation, in which we obtained an average of 30% accuracy gain over the state-of-the-art matching models. This preprint corresponds to the Accepted Manuscript in European Conference on Computer Vision (ECCV) 2024.
Abstract（参考訳）: 学習特徴対応はコンピュータビジョンの基本課題であり、視覚計測や3次元再構成といった下流の応用において極めて重要である。データ駆動型モデルの最近の進歩にもかかわらず、画素ごとの正確な対応ラベルが欠如しているため、特徴対応学習は依然として限られている。この難しさを克服するため、我々は、特徴対応の訓練を行うための新しい自己教師型スキーム、命令学習(IL)を導入する。カメラのポーズやディープラベルを使わずに、任意の未中断ビデオの対応学習を可能にし、自己教師型対応学習の新しい時代を告げる。具体的には、対応学習の問題を二段階最適化として定式化し、バンドル調整から再射誤差をモデルのための監視信号として取り込む。メモリと計算のオーバーヘッドが大きくなるのを避けるため、我々は固定点を利用して、バンドル調整によって暗黙の勾配を効果的にバックプロパゲートする。実験により,特徴マッチングやポーズ推定などのタスクにおいて,最先端のマッチングモデルよりも平均30%の精度向上が得られることを示す。このプレプリントは、European Conference on Computer Vision (ECCV) 2024で承認されたマニュアルに対応している。

関連論文リスト

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning [31.54643729002375]
フェデレートされたアンラーニングにより、トレーニングされたモデルから特定のデータの影響を取り除くことができる。原始双対アルゴリズムによるデータ除去のためのフェデレーション最適化法の提案新しい未学習損失関数は、誤分類よりも分類の不確実性を促進する。
論文参考訳（メタデータ） (2025-12-29T03:25:52Z)
Learn 3D VQA Better with Active Selection and Reannotation [46.687613392366174]
3D VQAでは、回答の自由な形式の性質は、データセット全体をトレーニングする際にモデルを混乱させたり誤解させたりする不適切なアノテーションにつながることが多い。本稿では,モデルのセマンティックな不確実性に基づいてデータを選択する多ターン対話型能動学習戦略を提案する。実験ではモデルの性能が向上し、トレーニングコストが大幅に削減され、比較的高い精度を達成するためのトレーニングコストが半減する。
論文参考訳（メタデータ） (2025-07-07T03:18:54Z)
Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels [69.58063088519852]
本稿では,3D対応の擬似ラベルを用いた意味対応推定法を提案する。具体的には, 3D-aware chaining を用いて得られた擬似ラベルを用いて, 既製の特徴を洗練するためのアダプタを訓練する。データセット固有のアノテーションの必要性を減らしながら、SPair-71kに新たな最先端を4%以上の絶対的なゲインに設定しました。
論文参考訳（メタデータ） (2025-06-05T17:54:33Z)
Learning Affine Correspondences by Integrating Geometric Constraints [30.695253062973784]
本稿では, 密マッチングと幾何制約を統合することで, 正確なアフィン対応を抽出するパイプラインを提案する。具体的には、密マッチングと新しいキーポイントスケールと向き推定器の助けを借りて、新しい抽出フレームワークを導入する。実験により,提案手法の精度とロバスト性は,画像マッチングタスクにおいて既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2025-04-07T08:44:50Z)
Gradient Boosting Mapping for Dimensionality Reduction and Feature Extraction [2.778647101651566]
教師あり学習における根本的な問題は、優れた特徴や距離尺度を見つけることである。本稿では,弱い学習者の出力が埋め込みを定義する,教師付き次元削減手法を提案する。組込み座標は教師付き学習タスクにより良い機能を提供することを示す。
論文参考訳（メタデータ） (2024-05-14T10:23:57Z)
Improving Semantic Correspondence with Viewpoint-Guided Spherical Maps [39.00415825387414]
そこで本研究では, 識別的特徴を3次元的理解で補う意味対応推定手法を提案する。より複雑な3Dパイプラインと比較して、我々のモデルは弱い視点情報しか必要とせず、球面表現の単純さにより、トレーニング中に情報的幾何学的先行情報をモデルに注入することができる。本研究では,SPair-71kデータセットを用いて,複数のオブジェクトカテゴリにまたがる対称なビューと繰り返し部分の区別が可能であることを実証した。
論文参考訳（メタデータ） (2023-12-20T17:35:24Z)
Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images [76.47980643420375]
本稿では,意味的対応の学習に固有のデータ・ハングリー・マターが存在するという仮説に基づく。我々は,機械の監督を通じて,ペア化されたキーポイントを確実に強化する単純な機械注釈器を実証する。我々のモデルは,SPair-71k,PF-PASCAL,PF-WILLOWといった意味対応学習ベンチマークの最先端モデルを上回る。
論文参考訳（メタデータ） (2023-11-30T13:22:15Z)
Q-REG: End-to-End Trainable Point Cloud Registration with Surface Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。 Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文参考訳（メタデータ） (2023-09-27T20:58:53Z)
To Copy Rather Than Memorize: A Vertical Learning Paradigm for Knowledge Graph Completion [35.05965140700747]
我々は、より正確な予測のために、埋め込みモデルを拡張し、関連する事実のトリプルからターゲット情報を明示的にコピーできるようにする。また、より効率的な最適化のための新しい相対距離ベース負サンプリング手法(ReD)を提案する。
論文参考訳（メタデータ） (2023-05-23T14:53:20Z)
Adaptive Cross Batch Normalization for Metric Learning [75.91093210956116]
メトリクス学習はコンピュータビジョンの基本的な問題である。蓄積した埋め込みが最新であることを保証することは、同様に重要であることを示す。特に、蓄積した埋め込みと現在のトレーニングイテレーションにおける特徴埋め込みとの間の表現的ドリフトを回避する必要がある。
論文参考訳（メタデータ） (2023-03-30T03:22:52Z)
S$^2$Contact: Graph-based Network for 3D Hand-Object Contact Estimation with Semi-Supervised Learning [70.72037296392642]
モノクロ画像から接触を学習できる新しい半教師付きフレームワークを提案する。具体的には、大規模データセットにおける視覚的および幾何学的整合性制約を利用して擬似ラベルを生成する。より正確な再構築を行うために手動インタラクションを規定するコンタクトマップを使用することの利点を示す。
論文参考訳（メタデータ） (2022-08-01T14:05:23Z)
Self-Supervised 3D Hand Pose Estimation from monocular RGB via Contrastive Learning [50.007445752513625]
本稿では,3次元ポーズ推定における構造化回帰タスクに対する自己教師付き手法を提案する。我々は、不変および同変のコントラスト目的の影響を実験的に検討した。追加のラベル付きデータに基づいてトレーニングされた標準のResNet-152が、FreiHAND上のPA-EPEで7.6%の改善を実現していることを示す。
論文参考訳（メタデータ） (2021-06-10T17:48:57Z)
Warp Consistency for Unsupervised Learning of Dense Correspondences [116.56251250853488]
密接な対応を学習する上で重要な課題は、実画像対に対する地道整合の欠如である。密な対応回帰のための教師なし学習目標であるWarp Consistencyを提案する。私たちのアプローチは、MegaDepth、RobotCar、TSSなど、いくつかの挑戦的なベンチマークに新しい最先端を設定します。
論文参考訳（メタデータ） (2021-04-07T17:58:22Z)
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文参考訳（メタデータ） (2020-04-20T02:47:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。