論文の概要: PASTA: Proportional Amplitude Spectrum Training Augmentation for
Syn-to-Real Domain Generalization
- arxiv url: http://arxiv.org/abs/2212.00979v1
- Date: Fri, 2 Dec 2022 05:18:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 15:37:12.880134
- Title: PASTA: Proportional Amplitude Spectrum Training Augmentation for
Syn-to-Real Domain Generalization
- Title(参考訳): PASTA:Syn-to-Real領域一般化のための比例振幅スペクトルトレーニング強化
- Authors: Prithvijit Chattopadhyay, Kartik Sarangmath, Vivek Vijaykumar, Judy
Hoffman
- Abstract要約: そこで我々は,PASTA(Proportional Amplitude Spectrum Training Augmentation)を提案し,合成-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実
セマンティックセグメンテーション(GTAV to Real)、オブジェクト検出(Sim10K to Real)、オブジェクト認識(VisDA-C Syn to Real)のタスクでは、PASTAはより複雑な最先端の一般化手法よりも優れている。
- 参考スコア(独自算出の注目度): 12.314486625397825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic data offers the promise of cheap and bountiful training data for
settings where lots of labeled real-world data for tasks is unavailable.
However, models trained on synthetic data significantly underperform on
real-world data. In this paper, we propose Proportional Amplitude Spectrum
Training Augmentation (PASTA), a simple and effective augmentation strategy to
improve out-of-the-box synthetic-to-real (syn-to-real) generalization
performance. PASTA involves perturbing the amplitude spectrums of the synthetic
images in the Fourier domain to generate augmented views. We design PASTA to
perturb the amplitude spectrums in a structured manner such that high-frequency
components are perturbed relatively more than the low-frequency ones. For the
tasks of semantic segmentation (GTAV to Real), object detection (Sim10K to
Real), and object recognition (VisDA-C Syn to Real), across a total of 5
syn-to-real shifts, we find that PASTA outperforms more complex
state-of-the-art generalization methods while being complementary to the same.
- Abstract(参考訳): 合成データは、タスク用のラベル付き現実世界データを大量に使用できない設定のために、安価で価値あるトレーニングデータを約束する。
しかし、合成データで訓練されたモデルは、実世界のデータでは著しく劣っている。
本稿では,本論文で提案する比例振幅スペクトルトレーニング強化法(pasta)により,合成から実への(syn-to-real)一般化性能を向上させるための簡易かつ効果的な拡張戦略を提案する。
PASTAはフーリエ領域の合成画像の振幅スペクトルを摂動させ、拡張ビューを生成する。
我々は、高周波成分が低周波成分よりも比較的摂動されるように、振幅スペクトルを構造的に摂動するようにPASTAを設計する。
意味セグメンテーション(gtav から real へ)、オブジェクト検出(sim10k から real へ)、オブジェクト認識(visda-c syn から real へ)のタスクでは、syn-to-real シフトの合計で、pasta がより複雑な最先端の一般化メソッドよりも優れていることが分かる。
関連論文リスト
- Syn2Real Domain Generalization for Underwater Mine-like Object Detection Using Side-Scan Sonar [1.7851018240619703]
本稿では,拡散モデルを用いたSyn2Real(Synthetic to Real)領域一般化手法を提案する。
DDPMモデルとDDIMモデルによるノイズによって生成された合成データは、完全に現実的でないとしても、トレーニングのための実世界のサンプルを効果的に増強できることを実証する。
論文 参考訳(メタデータ) (2024-10-16T18:42:08Z) - Soft Segmented Randomization: Enhancing Domain Generalization in SAR-ATR for Synthetic-to-Measured [4.089756319249042]
ドメインの差を小さくし、自動目標認識モデルを一般化する能力を向上させるために設計された,新しいフレームワークであるソフトセグメントランダム化を導入する。
実験により,提案したソフトセグメントランダム化フレームワークは,測定された合成開口レーダデータに対するモデル性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-09-21T08:24:51Z) - UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception [62.71374902455154]
ニューラルレンダリングの最近の進歩を利用して、静的および動的ノベルビューUAVベースの画像レンダリングを改善する。
本研究では,主に実データと合成データのハイブリッドセットに基づいて最先端検出モデルが最適化された場合,性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-10-25T00:20:37Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z) - Adversarial Audio Synthesis with Complex-valued Polynomial Networks [60.231877895663956]
音声における時間周波数(TF)表現は、実数値ネットワークとしてますますモデル化されている。
我々は,このような複雑な数値表現を自然な方法で統合するAPOLLOと呼ばれる複雑な数値ネットワークを導入する。
APOLLOは、音声生成におけるSC09の最先端拡散モデルよりも17.5%$改善され、8.2%ドルとなる。
論文 参考訳(メタデータ) (2022-06-14T12:58:59Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure
Synthetic Data [17.529045507657944]
我々は、強力なESRGANを実用的修復アプリケーション(Real-ESRGAN)に拡張する。
複雑な実世界の劣化をシミュレートするために、高次劣化モデリングプロセスを導入する。
また、合成プロセスにおける共通リングやオーバーシュートアーティファクトについても検討する。
論文 参考訳(メタデータ) (2021-07-22T17:43:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。