論文の概要: Learning Continuous Rotation Canonicalization with Radial Beam Sampling
- arxiv url: http://arxiv.org/abs/2206.10690v1
- Date: Tue, 21 Jun 2022 19:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-25 05:17:00.719989
- Title: Learning Continuous Rotation Canonicalization with Radial Beam Sampling
- Title(参考訳): ラジアルビームサンプリングによる連続回転正準化の学習
- Authors: Johann Schmidt and Sebastian Stober
- Abstract要約: 放射光を用いた画像標準化モデルであるショートBICを提案する。
我々のモデルは、最大連続角度回帰を可能にし、任意の中心回転入力画像の正準化を可能にする。
事前処理モデルとして、モデルに依存しない回転に敏感な下流予測を備えた回転不変ビジョンパイプラインを実現する。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nearly all state of the art vision models are sensitive to image rotations.
Existing methods often compensate for missing inductive biases by using
augmented training data to learn pseudo-invariances. Alongside the resource
demanding data inflation process, predictions often poorly generalize. The
inductive biases inherent to convolutional neural networks allow for
translation equivariance through kernels acting parallely to the horizontal and
vertical axes of the pixel grid. This inductive bias, however, does not allow
for rotation equivariance. We propose a radial beam sampling strategy along
with radial kernels operating on these beams to inherently incorporate
center-rotation covariance. Together with an angle distance loss, we present a
radial beam-based image canonicalization model, short BIC. Our model allows for
maximal continuous angle regression and canonicalizes arbitrary center-rotated
input images. As a pre-processing model, this enables rotation-invariant vision
pipelines with model-agnostic rotation-sensitive downstream predictions. We
show that our end-to-end trained angle regressor is able to predict continuous
rotation angles on several vision datasets, i.e. FashionMNIST, CIFAR10,
COIL100, and LFW.
- Abstract(参考訳): 視覚モデルのほぼ全ての状態は、画像の回転に敏感である。
既存の方法は、擬似不変性を学ぶために強化トレーニングデータを使用することで、欠落した帰納バイアスを補うことが多い。
資源要求データインフレーションプロセスと並行して、予測はしばしばあまり一般化しない。
畳み込みニューラルネットワークに固有の帰納バイアスは、ピクセルグリッドの水平軸と垂直軸に平行に作用するカーネルを通しての変換等価性を可能にする。
しかし、この帰納的バイアスは回転同分散を許さない。
中心回転共分散を本質的に組み込むために,これらのビーム上で動作する放射状核と共に放射状ビームサンプリング戦略を提案する。
角度距離損失とともに、放射状ビームによる画像標準化モデルである short bic を提案する。
我々のモデルは最大連続角度回帰を可能にし、任意の中心回転入力画像の正準化を可能にする。
事前処理モデルとして、モデルに依存しない回転に敏感な下流予測を備えた回転不変ビジョンパイプラインを実現する。
本研究では,FashionMNIST,CIFAR10,COIL100,LFWなど,複数の視覚データセット上での連続的な回転角の予測が可能であることを示す。
関連論文リスト
- von Mises Quasi-Processes for Bayesian Circular Regression [57.88921637944379]
円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
結果の確率モデルは、統計物理学における連続スピンモデルと関係を持つ。
後続推論のために、高速マルコフ連鎖モンテカルロサンプリングに寄与するストラトノビッチのような拡張を導入する。
論文 参考訳(メタデータ) (2024-06-19T01:57:21Z) - FRED: Towards a Full Rotation-Equivariance in Aerial Image Object
Detection [28.47314201641291]
FRED(Fully Rotation-Equivariant Oriented Object Detector)を導入する。
提案手法は,DOTA-v1.0では同等の性能を示し,DOTA-v1.5では1.5mAP,モデルパラメータでは16%と大幅に低下する。
論文 参考訳(メタデータ) (2023-12-22T09:31:43Z) - DiffusionPCR: Diffusion Models for Robust Multi-Step Point Cloud
Registration [73.37538551605712]
ポイントクラウド登録(PCR)は、2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では, PCR を拡散確率過程として定式化し, ノイズ変換を基礎的真理にマッピングする。
実験ではDiffusionPCRの有効性を示し,3Dおよび3DLoMatchに対する最先端の登録リコール率(95.3%/81.6%)を得た。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Towards Flexible Inductive Bias via Progressive Reparameterization
Scheduling [25.76814731638375]
コンピュータビジョンには、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)の2つのデファクト標準アーキテクチャがある。
これらのアプローチの見落としとして、最適な帰納バイアスも、対象データスケールの変化に応じて変化することを示す。
畳み込みのような帰納バイアスがモデルに含まれるほど、ViTのようなモデルがResNetのパフォーマンスを上回っている場合、データスケールが小さくなります。
論文 参考訳(メタデータ) (2022-10-04T04:20:20Z) - SPIN: Simplifying Polar Invariance for Neural networks Application to
vision-based irradiance forecasting [2.624902795082451]
画像の極座標への展開は、畳み込みアーキテクチャを訓練するためのより明示的な表現を提供する。
この前処理ステップはシーン表現の標準化によって予測結果を大幅に改善することを示す。
この変換は回転の中心を取り巻く領域を拡大し、より正確な短期照射予測をもたらす。
論文 参考訳(メタデータ) (2021-11-29T12:58:57Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Rotated Ring, Radial and Depth Wise Separable Radial Convolutions [13.481518628796692]
本研究では、トレーニング可能な回転不変畳み込みとネットの構築について述べる。
一方、我々のアプローチは異なるモデルと異なる公開データセットに対して回転不変であることを示す。
提示される回転適応畳み込みモデルは、通常の畳み込みモデルよりも計算集約的である。
論文 参考訳(メタデータ) (2020-10-02T09:01:51Z) - Generalizing Convolutional Neural Networks for Equivariance to Lie
Groups on Arbitrary Continuous Data [52.78581260260455]
任意の特定のリー群からの変換に同値な畳み込み層を構築するための一般的な方法を提案する。
同じモデルアーキテクチャを画像、ボール・アンド・スティック分子データ、ハミルトン力学系に適用する。
論文 参考訳(メタデータ) (2020-02-25T17:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。