論文の概要: SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance
- arxiv url: http://arxiv.org/abs/2408.11760v1
- Date: Wed, 21 Aug 2024 16:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-08-22 16:18:16.526111
- Title: SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance
- Title(参考訳): SBDet:リラクシド・ローテーション・等価性を用いたシンメトリブレーキング対象検出器
- Authors: Zhiqiang Wu, Yingjie Liu, Hanlin Dong, Xuan Tang, Jian Yang, Bo Jin, Mingsong Chen, Xian Wei,
- Abstract要約: Group Equivariant Convolution(GConv)は、モデルに視覚データに隠された対称性を探索させ、パフォーマンスを向上させる。
従来のGConv法は群空間の厳密な操作規則によって制限されており、対称性・ブレーキングや非剛体変換への適応が困難である。
本稿では,Relaxed Rotation-Equivariant Network(R2Net)をバックボーンとして提案し,その上に構築された2次元オブジェクト検出のためのSBDet(Symmetry-Breaking Object Detector)を開発した。
- 参考スコア(独自算出の注目度): 26.05910177212846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Introducing Group Equivariant Convolution (GConv) empowers models to explore symmetries hidden in visual data, improving their performance. However, in real-world scenarios, objects or scenes often exhibit perturbations of a symmetric system, specifically a deviation from a symmetric architecture, which can be characterized by a non-trivial action of a symmetry group, known as Symmetry-Breaking. Traditional GConv methods are limited by the strict operation rules in the group space, only ensuring features remain strictly equivariant under limited group transformations, making it difficult to adapt to Symmetry-Breaking or non-rigid transformations. Motivated by this, we introduce a novel Relaxed Rotation GConv (R2GConv) with our defined Relaxed Rotation-Equivariant group $\mathbf{R}_4$. Furthermore, we propose a Relaxed Rotation-Equivariant Network (R2Net) as the backbone and further develop the Symmetry-Breaking Object Detector (SBDet) for 2D object detection built upon it. Experiments demonstrate the effectiveness of our proposed R2GConv in natural image classification tasks, and SBDet achieves excellent performance in object detection tasks with improved generalization capabilities and robustness.
- Abstract(参考訳): GConv(Group Equivariant Convolution)の導入は、モデルに視覚データに隠された対称性を探索する権限を与え、パフォーマンスを向上させる。
しかし、現実のシナリオでは、オブジェクトやシーンは対称系の摂動、特に対称構造からの逸脱を示すことが多く、対称性群(シンメトリーブレーキング)と呼ばれる非自明な作用によって特徴づけられる。
従来のGConv法は群空間の厳密な操作規則によって制限されており、有限群変換の下では特徴が厳密に同変であることを保証するだけであり、シンメトリー・ブレーキングや非剛体変換に適応することが困難である。
これに触発されて、我々は定義した緩和回転-同変群 $\mathbf{R}_4$ を持つ新しい緩和回転 GConv (R2GConv) を導入する。
さらに,Relaxed Rotation-Equivariant Network (R2Net) をバックボーンとして提案し,その上に構築された2次元オブジェクト検出のためのSBDet(Symmetry-Breaking Object Detector)を開発した。
自然画像分類タスクにおいて提案したR2GConvの有効性を実証し、SBDetは一般化能力とロバスト性を改善したオブジェクト検出タスクにおいて優れた性能を実現する。
関連論文リスト
- GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings [4.365790707793824]
ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。
8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
論文 参考訳(メタデータ) (2025-04-03T17:58:18Z) - Relative Representations: Topological and Geometric Perspectives [53.88896255693922]
相対表現はゼロショットモデルの縫合に対する確立されたアプローチである。
相対変換において正規化手順を導入し、非等方的再スケーリングや置換に不変となる。
第二に、クラス内のクラスタリングを促進するトポロジカル正規化損失である、微調整された相対表現におけるトポロジカルデシフィケーションの展開を提案する。
論文 参考訳(メタデータ) (2024-09-17T08:09:22Z) - Relaxed Rotational Equivariance via $G$-Biases in Vision [19.814324876189772]
群同変畳み込み(GConv)は回転対称性データを効果的に扱うことができる。
実世界のデータは、回転対称性(Rotational Symmetry-Breaking)と呼ばれる厳密な回転対称性にほとんど準拠しない。
本稿では,G$-Biasesと呼ばれる学習可能なバイアスの集合を利用して,この問題に対処する,単純かつ高効率な手法を提案する。
論文 参考訳(メタデータ) (2024-08-22T14:52:53Z) - EqNIO: Subequivariant Neural Inertial Odometry [33.96552018734359]
重力ベクトルの周りで回転すると、IMUデータは等変的に変形し、重力に平行な任意の平面に対して反射することを示す。
そして、IMUデータをこのフレームにマッピングし、既製の慣性オドメトリーネットワークで直接使用できる不変な正準化を実現する。
論文 参考訳(メタデータ) (2024-08-12T17:42:46Z) - Accelerated Discovery of Machine-Learned Symmetries: Deriving the
Exceptional Lie Groups G2, F4 and E6 [55.41644538483948]
このレターでは、対称性変換の発見を著しく高速化する2つの改良されたアルゴリズムを紹介している。
例外的リー群の複雑性を考えると,この機械学習手法は完全に汎用的であり,多種多様なラベル付きデータセットに適用可能であることを示す。
論文 参考訳(メタデータ) (2023-07-10T20:25:44Z) - Deep Neural Networks with Efficient Guaranteed Invariances [77.99182201815763]
我々は、性能改善の問題、特にディープニューラルネットワークのサンプル複雑性に対処する。
群同変畳み込みは同変表現を得るための一般的なアプローチである。
本稿では,各ストリームが異なる変換に不変なマルチストリームアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-03-02T20:44:45Z) - Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。
対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。
この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文 参考訳(メタデータ) (2023-02-02T00:13:32Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization [64.44661342486434]
本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
論文 参考訳(メタデータ) (2022-06-08T12:56:34Z) - Integrating Symmetry into Differentiable Planning with Steerable
Convolutions [5.916280909373456]
等変畳み込みネットワークによって動機付けられた経路計画問題を,グリッド上のテキスト信号として扱う。
この場合の値反復は線型同変作用素であり、これは(ステアブルな)畳み込みであることを示す。
我々の実装はVINに基づいており、対称性を取り入れるためにステアブル畳み込みネットワークを使用している。
論文 参考訳(メタデータ) (2022-06-08T04:58:48Z) - Reflection and Rotation Symmetry Detection via Equivariant Learning [40.61825212385055]
我々は、EquiSymと呼ばれる対称性検出のためのグループ同変畳み込みネットワークを導入する。
DENse と Diverse symmetric (DENDI) という新しいデータセットを提案し、既存の反射・回転対称性検出のためのベンチマークの制限を緩和する。
実験により,LDRSおよびDENDIデータセットの対称性検出において,本手法が芸術の状態を達成できることが確認された。
論文 参考訳(メタデータ) (2022-03-31T04:18:33Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Deformation Robust Roto-Scale-Translation Equivariant CNNs [10.44236628142169]
グループ同変畳み込みニューラルネットワーク(G-CNN)は,固有対称性を持つ一般化性能を著しく向上させる。
G-CNNの一般的な理論と実践的実装は、回転またはスケーリング変換の下での平面画像に対して研究されている。
論文 参考訳(メタデータ) (2021-11-22T03:58:24Z) - Frame Averaging for Invariant and Equivariant Network Design [50.87023773850824]
フレーム平均化(FA)は、既知の(バックボーン)アーキテクチャを新しい対称性タイプに不変あるいは同変に適応するためのフレームワークである。
FAモデルが最大表現力を持つことを示す。
我々は,新しいユニバーサルグラフニューラルネット(GNN),ユニバーサルユークリッド運動不変点クラウドネットワーク,およびユークリッド運動不変メッセージパッシング(MP)GNNを提案する。
論文 参考訳(メタデータ) (2021-10-07T11:05:23Z) - Exploiting Learned Symmetries in Group Equivariant Convolutions [20.63056707649319]
群同変畳み込み(GConvs)は、畳み込みニューラルネットワークを様々な変換群に同変させることができる。
我々は,GConvsを深層的に分離可能な畳み込みに効率的に分解できることを示す。
論文 参考訳(メタデータ) (2021-06-09T08:50:22Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Asymmetric GANs for Image-to-Image Translation [62.49892218126542]
GAN(Generative Adversarial Networks)の既存のモデルは、サイクル一貫性損失を使用して、ソースドメインからターゲットドメインへのマッピングを学習する。
非対称GANモデルを提案し、不等サイズと異なるパラメータ共有戦略の変換と再構成の両方を行う。
8つのデータセットを用いた教師付きおよび教師なし生成タスクの実験は、非対称GANが優れたモデルキャパシティとより良い生成性能を達成することを示す。
論文 参考訳(メタデータ) (2019-12-14T21:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。