論文の概要: Image-to-Image Translation of Synthetic Samples for Rare Classes
- arxiv url: http://arxiv.org/abs/2106.12212v1
- Date: Wed, 23 Jun 2021 07:57:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 21:38:55.710588
- Title: Image-to-Image Translation of Synthetic Samples for Rare Classes
- Title(参考訳): 希少クラスのための合成サンプルの画像から画像への変換
- Authors: Edoardo Lanzini and Sara Beery
- Abstract要約: いくつか例から学ぶことは、ディープラーニングベースの分類アルゴリズムの課題として知られている。
これらの希少クラスのトレーニングデータを増やすための潜在的アプローチは、限られた実データを合成サンプルで増強することである。
これは役に立つことが示されているが、実際のデータでテストした場合、実データと合成データのドメインシフトはアプローチの有効性を妨げている。
- 参考スコア(独自算出の注目度): 3.04585143845864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The natural world is long-tailed: rare classes are observed orders of
magnitudes less frequently than common ones, leading to highly-imbalanced data
where rare classes can have only handfuls of examples. Learning from few
examples is a known challenge for deep learning based classification
algorithms, and is the focus of the field of low-shot learning. One potential
approach to increase the training data for these rare classes is to augment the
limited real data with synthetic samples. This has been shown to help, but the
domain shift between real and synthetic hinders the approaches' efficacy when
tested on real data.
We explore the use of image-to-image translation methods to close the domain
gap between synthetic and real imagery for animal species classification in
data collected from camera traps: motion-activated static cameras used to
monitor wildlife. We use low-level feature alignment between source and target
domains to make synthetic data for a rare species generated using a graphics
engine more "realistic". Compared against a system augmented with unaligned
synthetic data, our experiments show a considerable decrease in classification
error rates on a rare species.
- Abstract(参考訳): 希少なクラスは一般的なクラスよりも桁違いに頻繁に観察され、希少なクラスがほんの一握りの例しか持たない高度に不均衡なデータに繋がる。
少数の例から学ぶことは、ディープラーニングベースの分類アルゴリズムにとって既知の課題であり、低ショット学習の分野の焦点である。
これらのレアクラスのトレーニングデータを増やす潜在的アプローチの一つは、限られた実データを合成サンプルで強化することである。
これは役に立つことが示されているが、実際のデータでテストした場合、実データと合成データのドメインシフトはアプローチの有効性を妨げる。
本研究では,動物種分類における合成画像と実画像の領域ギャップを埋めるための画像間翻訳手法について,野生動物を観察する静止カメラのカメラトラップから収集したデータを用いて検討する。
我々は、ソースドメインとターゲットドメイン間の低レベルの特徴アライメントを用いて、グラフィックエンジンを用いて生成される稀な種の合成データを作成する。
非整合合成データを用いたシステムと比較すると, 希少種に対する分類誤差は有意に減少した。
関連論文リスト
- ZebraPose: Zebra Detection and Pose Estimation using only Synthetic Data [0.2302001830524133]
3次元シミュレータで生成された合成データを用いて、ゼブラの検知と2次元ポーズ推定の両方に使用できる最初の合成データセットを得る。
複数の実世界および合成データセット上で検出と2次元ポーズ推定モデルを広範囲にトレーニングし、ベンチマークする。
これらの実験は、スクラッチから訓練されたモデルと合成データのみで、ゼブラの実際の画像に一貫して一般化できることを示す。
論文 参考訳(メタデータ) (2024-08-20T13:28:37Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。
本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。
本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2023-11-07T12:57:58Z) - Image change detection with only a few samples [7.5780621370948635]
画像変化検出タスクの最大の障害は、さまざまな場面をカバーする大きな注釈付きデータセットの欠如である。
本稿では,合成データを生成するための単純な画像処理手法を提案する。
次に、対象検出に基づく初期の融合ネットワークを設計し、シアムニューラルネットを上回ります。
論文 参考訳(メタデータ) (2023-11-07T07:01:35Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Synthetic Data for Model Selection [2.4499092754102874]
合成データはモデル選択に有用であることを示す。
そこで本研究では,実領域に適合する合成誤差推定をキャリブレーションする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T09:52:03Z) - Domain Decluttering: Simplifying Images to Mitigate Synthetic-Real
Domain Shift and Improve Depth Estimation [16.153683223016973]
本研究では,実際の画像における領域外領域の特定と削除を学習するアテンションモジュールを開発する。
削除された領域を視覚化することで、合成と実際のドメインギャップに関する解釈可能な洞察が得られる。
論文 参考訳(メタデータ) (2020-02-27T14:28:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。