論文の概要: PASTA: Proportional Amplitude Spectrum Training Augmentation for
Syn-to-Real Domain Generalization
- arxiv url: http://arxiv.org/abs/2212.00979v3
- Date: Fri, 16 Jun 2023 00:21:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 18:05:12.337929
- Title: PASTA: Proportional Amplitude Spectrum Training Augmentation for
Syn-to-Real Domain Generalization
- Title(参考訳): PASTA:Syn-to-Real領域一般化のための比例振幅スペクトルトレーニング強化
- Authors: Prithvijit Chattopadhyay, Kartik Sarangmath, Vivek Vijaykumar, Judy
Hoffman
- Abstract要約: そこで我々は,PASTA(Proportional Amplitude Spectrum Training Augmentation)を提案し,合成-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
PASTAは相補的でありながら、より複雑な最先端の一般化手法よりも優れている。
- 参考スコア(独自算出の注目度): 12.314486625397825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic data offers the promise of cheap and bountiful training data for
settings where labeled real-world data is scarce. However, models trained on
synthetic data significantly underperform when evaluated on real-world data. In
this paper, we propose Proportional Amplitude Spectrum Training Augmentation
(PASTA), a simple and effective augmentation strategy to improve out-of-the-box
synthetic-to-real (syn-to-real) generalization performance. PASTA perturbs the
amplitude spectra of synthetic images in the Fourier domain to generate
augmented views. Specifically, with PASTA we propose a structured perturbation
strategy where high-frequency components are perturbed relatively more than the
low-frequency ones. For the tasks of semantic segmentation (GTAV-to-Real),
object detection (Sim10K-to-Real), and object recognition (VisDA-C
Syn-to-Real), across a total of 5 syn-to-real shifts, we find that PASTA
outperforms more complex state-of-the-art generalization methods while being
complementary to the same.
- Abstract(参考訳): 合成データは、ラベル付き現実世界のデータが不足している設定のために、安価で価値あるトレーニングデータを約束する。
しかし、実世界のデータで評価すると、合成データに基づいて訓練されたモデルの性能は著しく低下する。
本稿では,本論文で提案する比例振幅スペクトルトレーニング強化法(pasta)により,合成から実への(syn-to-real)一般化性能を向上させるための簡易かつ効果的な拡張戦略を提案する。
PASTAはフーリエ領域の合成画像の振幅スペクトルを摂動させ、拡張ビューを生成する。
具体的には,低周波成分よりも比較的高周波成分が摂動する構造的摂動戦略を提案する。
セマンティックセグメンテーション(GTAV-to-Real)、オブジェクト検出(Sim10K-to-Real)、オブジェクト認識(VisDA-C Syn-to-Real)のタスクは、合計5つのシンセグメンテーション・トゥ・リアルシフトにまたがって、PASTAがより複雑なステート・オブ・ザ・アートの一般化手法より優れており、相補的であることがわかった。
関連論文リスト
- Syn2Real Domain Generalization for Underwater Mine-like Object Detection Using Side-Scan Sonar [1.7851018240619703]
本稿では,拡散モデルを用いたSyn2Real(Synthetic to Real)領域一般化手法を提案する。
DDPMモデルとDDIMモデルによるノイズによって生成された合成データは、完全に現実的でないとしても、トレーニングのための実世界のサンプルを効果的に増強できることを実証する。
論文 参考訳(メタデータ) (2024-10-16T18:42:08Z) - Soft Segmented Randomization: Enhancing Domain Generalization in SAR-ATR for Synthetic-to-Measured [4.089756319249042]
ドメインの差を小さくし、自動目標認識モデルを一般化する能力を向上させるために設計された,新しいフレームワークであるソフトセグメントランダム化を導入する。
実験により,提案したソフトセグメントランダム化フレームワークは,測定された合成開口レーダデータに対するモデル性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-09-21T08:24:51Z) - UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception [62.71374902455154]
ニューラルレンダリングの最近の進歩を利用して、静的および動的ノベルビューUAVベースの画像レンダリングを改善する。
本研究では,主に実データと合成データのハイブリッドセットに基づいて最先端検出モデルが最適化された場合,性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-10-25T00:20:37Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z) - Adversarial Audio Synthesis with Complex-valued Polynomial Networks [60.231877895663956]
音声における時間周波数(TF)表現は、実数値ネットワークとしてますますモデル化されている。
我々は,このような複雑な数値表現を自然な方法で統合するAPOLLOと呼ばれる複雑な数値ネットワークを導入する。
APOLLOは、音声生成におけるSC09の最先端拡散モデルよりも17.5%$改善され、8.2%ドルとなる。
論文 参考訳(メタデータ) (2022-06-14T12:58:59Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure
Synthetic Data [17.529045507657944]
我々は、強力なESRGANを実用的修復アプリケーション(Real-ESRGAN)に拡張する。
複雑な実世界の劣化をシミュレートするために、高次劣化モデリングプロセスを導入する。
また、合成プロセスにおける共通リングやオーバーシュートアーティファクトについても検討する。
論文 参考訳(メタデータ) (2021-07-22T17:43:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。