論文の概要: Computing a Characteristic Orientation for Rotation-Independent Image Analysis
- arxiv url: http://arxiv.org/abs/2602.20930v1
- Date: Tue, 24 Feb 2026 14:08:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.778422
- Title: Computing a Characteristic Orientation for Rotation-Independent Image Analysis
- Title(参考訳): 回転に依存しない画像解析のための特性指向の計算
- Authors: Cristian Valero-Abundio, Emilio Sansano-Sansano, Raúl Montoliu, Marina Martínez García,
- Abstract要約: General Intensity Direction (GID) はネットワークアーキテクチャを変更することなく回転ロバスト性を改善する前処理方式である。
空間構造を維持しながら画像を変換し、畳み込みネットワークと互換性を持つ。
回転MNISTデータセットの実験的評価により,提案手法は最先端の回転不変アーキテクチャよりも高い精度を達成できることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Handling geometric transformations, particularly rotations, remains a challenge in deep learning for computer vision. Standard neural networks lack inherent rotation invariance and typically rely on data augmentation or architectural modifications to improve robustness. Although effective, these approaches increase computational demands, require specialised implementations, or alter network structures, limiting their applicability. This paper introduces General Intensity Direction (GID), a preprocessing method that improves rotation robustness without modifying the network architecture. The method estimates a global orientation for each image and aligns it to a canonical reference frame, allowing standard models to process inputs more consistently across different rotations. Unlike moment-based approaches that extract invariant descriptors, this method directly transforms the image while preserving spatial structure, making it compatible with convolutional networks. Experimental evaluation on the rotated MNIST dataset shows that the proposed method achieves higher accuracy than state-of-the-art rotation-invariant architectures. Additional experiments on the CIFAR-10 dataset, confirm that the method remains effective under more complex conditions.
- Abstract(参考訳): 幾何学変換、特に回転を扱うことは、コンピュータビジョンの深層学習における課題である。
標準のニューラルネットワークには固有の回転不変性がなく、ロバスト性を改善するためにデータ拡張やアーキテクチャの変更に依存するのが一般的である。
有効ではあるが、これらのアプローチは計算要求を増大させ、特別な実装を必要としたり、ネットワーク構造を変更して適用性を制限する。
本稿では,ネットワークアーキテクチャを変更することなく回転ロバスト性を改善する前処理手法であるGeneral Intensity Direction (GID)を紹介する。
この手法は各画像に対する大域的な向きを推定し、それを標準参照フレームに整列し、標準モデルが異なる回転に対してより一貫した入力を処理できるようにする。
不変記述子を抽出するモーメントベースのアプローチとは異なり、この手法は空間構造を保持しながら画像を直接変換し、畳み込みネットワークと互換性を持つ。
回転MNISTデータセットの実験的評価により,提案手法は最先端の回転不変アーキテクチャよりも高い精度を達成できることが示された。
CIFAR-10データセットに関するさらなる実験により、この手法はより複雑な条件下で有効であることが確認された。
関連論文リスト
- Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - Rotation-Equivariant Self-Supervised Method in Image Denoising [46.44312175792672]
本稿では,高精度な回転同変畳み込みを自己教師付き画像復調に導入する。
我々の知る限りでは、回転同変画像が自己監督画像に導入されたのはこれが初めてである。
そこで我々は,回転同変ネットワークとバニラCNNベースのネットワークの出力を融合させるマスク機構を設計した。
論文 参考訳(メタデータ) (2025-05-26T07:32:52Z) - PreCM: The Padding-based Rotation Equivariant Convolution Mode for Semantic Segmentation [10.748412559871621]
本稿では、指向情報をより完全に活用することを目的とした、普遍的な畳み込みグループフレームワークを提案する。
次に、数学的にパディングベースの回転同変畳み込みモード(PreCM)を設計する。
意味的セグメンテーションタスクにおける画像回転の影響を定量的に評価するために,新たな評価指標である回転差(RD)を提案する。
論文 参考訳(メタデータ) (2024-11-03T16:26:55Z) - Rotation Equivariant Proximal Operator for Deep Unfolding Methods in Image Restoration [62.41329042683779]
本稿では, 回転対称性を組み込んだ高精度な回転同変近位ネットワークを提案する。
本研究は, 回転対称性の先行を深く展開する枠組みに効果的に組み込む, 高精度な回転同変近位ネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-25T11:53:06Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - ReF -- Rotation Equivariant Features for Local Feature Matching [30.459559206664427]
本稿では,モデルアーキテクチャ自体に偏りを生じさせ,回転特異な特徴を生じさせる代替的補完的手法を提案する。
我々は, ステアブルCNNの高性能, 回転特異的カバレッジを全回転角に拡張できることを実証した。
本稿では,アンサンブル,ロバストな推定,ネットワークアーキテクチャのバリエーション,回転前処理の効果について詳細に分析する。
論文 参考訳(メタデータ) (2022-03-10T07:36:09Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - SPIN: Simplifying Polar Invariance for Neural networks Application to
vision-based irradiance forecasting [2.624902795082451]
画像の極座標への展開は、畳み込みアーキテクチャを訓練するためのより明示的な表現を提供する。
この前処理ステップはシーン表現の標準化によって予測結果を大幅に改善することを示す。
この変換は回転の中心を取り巻く領域を拡大し、より正確な短期照射予測をもたらす。
論文 参考訳(メタデータ) (2021-11-29T12:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。