論文の概要: Image-to-Image Translation Framework Embedded with Rotation Symmetry Priors
- arxiv url: http://arxiv.org/abs/2604.12805v1
- Date: Tue, 14 Apr 2026 14:35:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.50086
- Title: Image-to-Image Translation Framework Embedded with Rotation Symmetry Priors
- Title(参考訳): 回転対称性プリミティブを組み込んだ画像間翻訳フレームワーク
- Authors: Feiyu Tan, Heran Yang, Qihong Duan, Kai Ye, Qi Xie, Deyu Meng,
- Abstract要約: 画像から画像への変換(I2I)はコンピュータビジョンの基本課題である。
回転群同変畳み込みを導入し、回転同変I2Iフレームワークを実現する。
実際のデータセット上で画像対称性の先行を体系的に研究する。
- 参考スコア(独自算出の注目度): 48.17405932206745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-to-image translation (I2I) is a fundamental task in computer vision, focused on mapping an input image from a source domain to a corresponding image in a target domain while preserving domain-invariant features and adapting domain-specific attributes. Despite the remarkable success of deep learning-based I2I approaches, the lack of paired data and unsupervised learning framework still hinder their effectiveness. In this work, we address the challenge by incorporating transformation symmetry priors into image-to-image translation networks. Specifically, we introduce rotation group equivariant convolutions to achieve rotation equivariant I2I framework, a novel contribution, to the best of our knowledge, along this research direction. This design ensures the preservation of rotation symmetry, one of the most intrinsic and domain-invariant properties of natural and scientific images, throughout the network. Furthermore, we conduct a systematic study on image symmetry priors on real dataset and propose a novel transformation learnable equivariant convolutions (TL-Conv) that adaptively learns transformation groups, enhancing symmetry preservation across diverse datasets. We also provide a theoretical analysis of the equivariance error of TL-Conv, proving that it maintains exact equivariance in continuous domains and provide a bound for the error in discrete cases. Through extensive experiments across a range of I2I tasks, we validate the effectiveness and superior performance of our approach, highlighting the potential of equivariant networks in enhancing generation quality and its broad applicability. Our code is available at https://github.com/tanfy929/Equivariant-I2I
- Abstract(参考訳): 画像から画像への変換(I2I)はコンピュータビジョンの基本課題であり、ドメイン不変の特徴を保存し、ドメイン固有の属性を適応させながら、ソースドメインからの入力画像をターゲットドメインの対応する画像にマッピングすることに焦点を当てている。
ディープラーニングベースのI2Iアプローチの顕著な成功にもかかわらず、ペアデータと教師なし学習フレームワークの欠如は、その効果を妨げている。
本研究では、画像間翻訳ネットワークに変換対称性を組み込むことにより、この課題に対処する。
具体的には、回転群同変畳み込みを導入し、この研究方向に沿って、我々の知識のベストに新しい貢献である回転群同変I2Iフレームワークを実現する。
この設計により、ネットワーク全体を通して、自然および科学画像の最も固有の領域不変特性の1つである回転対称性の保存が保証される。
さらに、実データセット上での画像対称性の先行性に関する体系的研究を行い、適応的に変換群を学習し、多様なデータセット間で対称性の保存を向上させる新しい変換可学習同変畳み込み(TL-Conv)を提案する。
また、TL-Convの等値誤差の理論解析を行い、連続領域における正確な等値性を維持し、離散の場合の誤差の有界性を証明した。
I2Iタスクの幅広い実験を通じて,本手法の有効性と性能を検証し,生成品質の向上と適用性の向上における同変ネットワークの可能性を強調した。
私たちのコードはhttps://github.com/tanfy929/Equivariant-I2Iで利用可能です。
関連論文リスト
- Self-Supervised Learning based on Transformed Image Reconstruction for Equivariance-Coherent Feature Representation [3.7622885602373626]
コンピュータビジョンの特徴を学習するための自己教師付き学習手法を提案する。
このシステムは、これまで見つからなかった変換を行ったイメージを再構成することで、変換を独立に学習する。
私たちのアプローチは、リッチな現実的なコンピュータビジョンの下流タスクで強く機能し、ほぼ常にすべてのベースラインを改善しています。
論文 参考訳(メタデータ) (2025-03-24T15:01:50Z) - Approximate Equivariance in Reinforcement Learning [35.04248486334824]
我々は、強化学習におけるほぼ同変のアルゴリズムを開発した。
その結果, ほぼ同変ネットワークは, 正確な対称性が存在する場合に, 正確に同変ネットワークと同等に動作することがわかった。
論文 参考訳(メタデータ) (2024-11-06T19:44:46Z) - R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection [26.05910177212846]
Group Equivariant Convolution (GConv) は、データにおける基礎となる対称性を探索し、パフォーマンスを向上させるためにモデルに権限を与える。
我々は、GConvと比較して4n$のパラメータが最小限に増大する新しいRelaxed Rotation-Equivariant GConv(R2GConv)を導入する。
R2GConvをベースとして,Relaxed Rotation-Equivariant Network (R2Net) をバックボーンとして提案し,2次元物体検出のためのRelaxed Rotation-Equivariant Object Detector (R2Det) を開発した。
論文 参考訳(メタデータ) (2024-08-21T16:32:03Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers [48.74331852418905]
直接画像からグラフへの変換は、1つのモデルで物体の検出と関係予測を解くことを伴う課題である。
このタスクの複雑さのため、多くのドメインで大規模なトレーニングデータセットはまれであり、ディープラーニングメソッドのトレーニングを困難にしている。
画像-グラフ変換器のクロスドメインおよびクロス次元学習を可能にする一連の手法を提案する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - SO(2) and O(2) Equivariance in Image Recognition with
Bessel-Convolutional Neural Networks [63.24965775030674]
この研究はベッセル畳み込みニューラルネットワーク(B-CNN)の開発を示す
B-CNNは、ベッセル関数に基づく特定の分解を利用して、画像とフィルタの間のキー操作を変更する。
他の手法と比較して,B-CNNの性能を評価するために検討を行った。
論文 参考訳(メタデータ) (2023-04-18T18:06:35Z) - Imaging with Equivariant Deep Learning [9.333799633608345]
我々は、同変イメージングの出現する分野を概観し、それが一般化と新たなイメージングの機会をいかに向上させるかを示す。
獲得物理と集団行動の相互作用と、反復的再構成、ブラインド圧縮センシング、自己教師型学習との関連を示す。
論文 参考訳(メタデータ) (2022-09-05T02:13:57Z) - Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2
Network [73.5062435623908]
本稿では,一連のモデル変換によって対象領域に新たなモデルを生成する新しいI2I翻訳手法を提案する。
潜在ベクトルを生成されたモデルに入力することで、ソースドメインとターゲットドメインの間でI2I翻訳を行うことができる。
論文 参考訳(メタデータ) (2020-10-12T13:51:40Z) - Asymmetric GANs for Image-to-Image Translation [62.49892218126542]
GAN(Generative Adversarial Networks)の既存のモデルは、サイクル一貫性損失を使用して、ソースドメインからターゲットドメインへのマッピングを学習する。
非対称GANモデルを提案し、不等サイズと異なるパラメータ共有戦略の変換と再構成の両方を行う。
8つのデータセットを用いた教師付きおよび教師なし生成タスクの実験は、非対称GANが優れたモデルキャパシティとより良い生成性能を達成することを示す。
論文 参考訳(メタデータ) (2019-12-14T21:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。