論文の概要: Multi-Objective Optimization for Synthetic-to-Real Style Transfer
- arxiv url: http://arxiv.org/abs/2602.03625v1
- Date: Tue, 03 Feb 2026 15:14:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.532653
- Title: Multi-Objective Optimization for Synthetic-to-Real Style Transfer
- Title(参考訳): 合成-実-実スタイル変換のための多目的最適化
- Authors: Estelle Chigot, Thomas Oberlin, Manon Huguenin, Dennis Wilson,
- Abstract要約: 本研究では, パイプライン評価の迅速化を図るため, 個々の画像サンプルに対するペア画像メトリクスの利用について検討する。
本手法は,合成-実領域適応における標準データセットに適用する。
その結果、進化的アルゴリズムは様々な目的に適応した多様な拡張パイプラインを提案できることを示した。
- 参考スコア(独自算出の注目度): 4.405170201880593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation networks require large amounts of pixel-level annotated data, which are costly to obtain for real-world images. Computer graphics engines can generate synthetic images alongside their ground-truth annotations. However, models trained on such images can perform poorly on real images due to the domain gap between real and synthetic images. Style transfer methods can reduce this difference by applying a realistic style to synthetic images. Choosing effective data transformations and their sequence is difficult due to the large combinatorial search space of style transfer operators. Using multi-objective genetic algorithms, we optimize pipelines to balance structural coherence and style similarity to target domains. We study the use of paired-image metrics on individual image samples during evolution to enable rapid pipeline evaluation, as opposed to standard distributional metrics that require the generation of many images. After optimization, we evaluate the resulting Pareto front using distributional metrics and segmentation performance. We apply this approach to standard datasets in synthetic-to-real domain adaptation: from the video game GTA5 to real image datasets Cityscapes and ACDC, focusing on adverse conditions. Results demonstrate that evolutionary algorithms can propose diverse augmentation pipelines adapted to different objectives. The contribution of this work is the formulation of style transfer as a sequencing problem suitable for evolutionary optimization and the study of efficient metrics that enable feasible search in this space. The source code is available at: https://github.com/echigot/MOOSS.
- Abstract(参考訳): セマンティックセグメンテーションネットワークは大量のピクセルレベルのアノテートデータを必要とする。
コンピュータグラフィックスエンジンは、地平線アノテーションとともに合成画像を生成することができる。
しかし、そのような画像上で訓練されたモデルは、実画像と合成画像の領域ギャップのため、実際の画像では不十分に動作することができる。
スタイル伝達法は、合成画像に現実的なスタイルを適用することで、この差を小さくすることができる。
スタイル転送演算子の組合せ探索空間が大きいため、効率的なデータ変換とそのシーケンスの選択は困難である。
多目的遺伝的アルゴリズムを用いて、パイプラインを最適化し、構造的コヒーレンスとスタイル的類似性のバランスをとる。
多くの画像の生成を必要とする標準的な分布指標とは対照的に、進化中の個々の画像サンプルに対するペア画像メトリクスを用いて、パイプライン評価を迅速に行えるようにすることを検討した。
最適化後,分布指標とセグメンテーション性能を用いて,結果のパレートフロントを評価する。
本稿では,ゲームGTA5から実画像データセットCityscapes,ACDCに至るまで,合成ドメイン適応における標準データセットに適用する。
その結果、進化的アルゴリズムは様々な目的に適応した多様な拡張パイプラインを提案できることを示した。
この研究の貢献は、進化的最適化に適したシーケンシング問題としてのスタイル転送の定式化と、この空間で実現可能な探索を可能にする効率的なメトリクスの研究である。
ソースコードは、https://github.com/echigot/MOOSS.comで入手できる。
関連論文リスト
- Dataset Distillation with Probabilistic Latent Features [9.318549327568695]
合成データのコンパクトなセットは、下流の分類タスクにおける元のデータセットを効果的に置き換えることができる。
本稿では,潜在特徴の共分散をモデル化する新しい手法を提案する。
提案手法は,バックボーンアーキテクチャにまたがる最先端のクロスアーキテクチャ性能を実現する。
論文 参考訳(メタデータ) (2025-05-10T13:53:49Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Domain Adaptation with Morphologic Segmentation [8.0698976170854]
本稿では,任意の入力領域(実領域と合成領域)の画像を一様出力領域に変換するために,形態的セグメンテーションを用いた新しいドメイン適応フレームワークを提案する。
私たちのゴールは、複数のソースからのデータを共通の表現に統一する前処理のステップを確立することです。
都市景観のシミュレートと実データの4つのデータ集合上で, 定性的に定量的に評価し, 提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-06-16T17:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。