論文の概要: Rigidity Preserving Image Transformations and Equivariance in
Perspective
- arxiv url: http://arxiv.org/abs/2201.13065v1
- Date: Mon, 31 Jan 2022 08:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 15:40:46.972167
- Title: Rigidity Preserving Image Transformations and Equivariance in
Perspective
- Title(参考訳): 視点における画像変換と等価性を保存する剛性
- Authors: Lucas Brynte, Georg B\"okman, Axel Flinth, Fredrik Kahl
- Abstract要約: 我々は、剛性カメラ運動を実現する画像平面変換のクラスを特徴付け、これらの変換を剛性保存と呼ぶ。
特に、ピンホール画像の2次元翻訳は剛性保存ではない。
- 参考スコア(独自算出の注目度): 15.261790674845562
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We characterize the class of image plane transformations which realize rigid
camera motions and call these transformations `rigidity preserving'. In
particular, 2D translations of pinhole images are not rigidity preserving.
Hence, when using CNNs for 3D inference tasks, it can be beneficial to modify
the inductive bias from equivariance towards translations to equivariance
towards rigidity preserving transformations. We investigate how equivariance
with respect to rigidity preserving transformations can be approximated in
CNNs, and test our ideas on both 6D object pose estimation and visual
localization. Experimentally, we improve on several competitive baselines.
- Abstract(参考訳): 剛性カメラ動作を実現する画像平面変換のクラスを特徴付け,これらの変換を「剛性保存」と呼ぶ。
特に、ピンホール画像の2次元翻訳は剛性保存ではない。
したがって、cnnを3次元推論タスクに使用する場合、帰納的バイアスを等分散から変換へ、等分散から剛性保存変換へ変更することが有益である。
剛性保存変換に対する等式がCNNでどのように近似できるかを考察し、6次元オブジェクトのポーズ推定と視覚的ローカライゼーションの両面での考え方を検証する。
実験的に、いくつかの競合ベースラインを改善した。
関連論文リスト
- Equivariant Spatio-Temporal Self-Supervision for LiDAR Object Detection [37.142470149311904]
本研究では,空間的および時間的拡張を両立させることにより,時間的同変学習の枠組みを提案する。
既存の等変および不変のアプローチを多くの設定で上回る3次元物体検出のための事前学習法を示す。
論文 参考訳(メタデータ) (2024-04-17T20:41:49Z) - Equivariant Similarity for Vision-Language Foundation Models [134.77524524140168]
本研究は、主要な訓練目的だけでなく、下流タスクをサポートするためのコアデリバリであるマルチモーダル類似性関数に焦点を当てる。
一致した2組のトレーニングペアから効率よく計算できる正規化損失であるEqSimを提案する。
既存の評価セットと比較すると、EqBenは"視覚的最小限の変化"に最初に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-25T13:22:56Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Learning Transformations To Reduce the Geometric Shift in Object
Detection [60.20931827772482]
画像キャプチャプロセスの変動から生じる幾何シフトに対処する。
我々は、これらのシフトを最小限に抑えるために幾何変換の集合を学習する自己学習アプローチを導入する。
我々は,カメラの視野変化(FoV)と視点変化(視点変化)の2つの異なるシフトについて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:55:30Z) - The Lie Derivative for Measuring Learned Equivariance [84.29366874540217]
我々は、CNN、トランスフォーマー、ミキサーアーキテクチャにまたがる数百の事前訓練されたモデルの同値性について検討する。
その結果,不等式違反の多くは,不等式などのユビキタスネットワーク層における空間エイリアスに関連付けられることがわかった。
例えば、トランスはトレーニング後の畳み込みニューラルネットワークよりも同種である。
論文 参考訳(メタデータ) (2022-10-06T15:20:55Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - Quantised Transforming Auto-Encoders: Achieving Equivariance to
Arbitrary Transformations in Deep Networks [23.673155102696338]
畳み込みニューラルネットワーク(CNN)は画像翻訳と等価である。
埋め込みは任意の等式関係を同時に従うオートエンコーダアーキテクチャを提案する。
いくつかのデータセット上で入力画像の変換版の再レンダリングに成功した結果を示す。
論文 参考訳(メタデータ) (2021-11-25T02:26:38Z) - Self-Supervised 3D Hand Pose Estimation from monocular RGB via
Contrastive Learning [50.007445752513625]
本稿では,3次元ポーズ推定における構造化回帰タスクに対する自己教師付き手法を提案する。
我々は、不変および同変のコントラスト目的の影響を実験的に検討した。
追加のラベル付きデータに基づいてトレーニングされた標準のResNet-152が、FreiHAND上のPA-EPEで7.6%の改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T17:48:57Z) - Grounding inductive biases in natural images:invariance stems from
variations in data [20.432568247732206]
本研究では,実際のデータセットであるImageNetの変動要因について検討する。
標準的な拡張は、翻訳とスケールの正確な組み合わせに依存していることを示す。
ImageNetの変動の主な要因は外見に大きく関係していることがわかりました。
論文 参考訳(メタデータ) (2021-06-09T14:58:57Z) - Learning Equivariant Representations [10.745691354609738]
畳み込みニューラルネットワーク(CNN)はこの原理の成功例である。
対称性の群で定義される異なる変換に対する同変モデルを提案する。
これらのモデルはデータの対称性を利用して、サンプルとモデルの複雑さを減らし、一般化性能を向上させる。
論文 参考訳(メタデータ) (2020-12-04T18:46:17Z) - Certified Defense to Image Transformations via Randomized Smoothing [13.482057387436342]
ランダム化スムーシングを拡張して変換(例えば、回転、翻訳)をカバーし、パラメータ空間の証明を行う。
乱れや丸みを帯びた効果は、画像変換が構成されないことを意味するため、これは特に困難である。
本稿では,統計的誤差境界や画像変換の効率的な逆計算によって,個々の証明がどのように得られるかを示す。
論文 参考訳(メタデータ) (2020-02-27T22:02:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。