論文の概要: A general approach to bridge the reality-gap
- arxiv url: http://arxiv.org/abs/2009.01865v1
- Date: Thu, 3 Sep 2020 18:19:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 07:18:04.949804
- Title: A general approach to bridge the reality-gap
- Title(参考訳): 現実を橋渡しする一般的なアプローチ
- Authors: Michael Lomnitz, Zigfried Hampel-Arias, Nina Lopatina, Felipe A. Mejia
- Abstract要約: これを回避するための一般的なアプローチは、大量のラベル付きデータを持つ既存の類似したデータセットを活用することである。
本稿では,任意の画像を正規分布へ変換する一般変換学習を提案する。
この変換は教師なしのシステムで訓練され、データの増大を利用して画像の非標準的な例を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Employing machine learning models in the real world requires collecting large
amounts of data, which is both time consuming and costly to collect. A common
approach to circumvent this is to leverage existing, similar data-sets with
large amounts of labelled data. However, models trained on these canonical
distributions do not readily transfer to real-world ones. Domain adaptation and
transfer learning are often used to breach this "reality gap", though both
require a substantial amount of real-world data. In this paper we discuss a
more general approach: we propose learning a general transformation to bring
arbitrary images towards a canonical distribution where we can naively apply
the trained machine learning models. This transformation is trained in an
unsupervised regime, leveraging data augmentation to generate off-canonical
examples of images and training a Deep Learning model to recover their original
counterpart. We quantify the performance of this transformation using
pre-trained ImageNet classifiers, demonstrating that this procedure can recover
half of the loss in performance on the distorted data-set. We then validate the
effectiveness of this approach on a series of pre-trained ImageNet models on a
real world data set collected by printing and photographing images in different
lighting conditions.
- Abstract(参考訳): 現実世界で機械学習モデルを採用するには大量のデータを収集する必要がある。
これを回避する一般的なアプローチは、大量のラベル付きデータを持つ既存の類似のデータセットを活用することである。
しかし、これらの標準分布で訓練されたモデルは、実世界への移動が容易ではない。
ドメイン適応と転送学習は、この「現実のギャップ」を突破するためにしばしば使用されるが、どちらもかなりの量の実世界のデータを必要とする。
本稿では、より一般的なアプローチについて論じる。我々は、訓練された機械学習モデルを自然に適用できる標準分布に任意の画像をもたらす一般的な変換の学習を提案する。
この変換は教師なしのレジームでトレーニングされ、データ拡張を利用して画像のオフカノニカルな例を生成し、ディープラーニングモデルをトレーニングして元のコンパニオンを回復する。
我々は,事前学習したImageNet分類器を用いて,この変換の性能を定量化し,歪んだデータセットの性能損失の半分を回復できることを示した。
次に、異なる照明条件下で画像の印刷と撮影によって収集した実世界のデータセット上で、事前学習した画像ネットモデルに対するこのアプローチの有効性を検証する。
関連論文リスト
- CLOFAI: A Dataset of Real And Fake Image Classification Tasks for Continual Learning [1.7256001727746018]
CLOFAI(Continual Learning on Fake and Authentic Images)と呼ばれる新しいデータセットを導入する。
ドメインインクリメンタルな画像分類の問題の形を取る。
そこで我々は,3つの基礎的連続学習手法を用いて,新しいデータセットのベースラインを設定した。
論文 参考訳(メタデータ) (2025-01-19T18:53:30Z) - FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Data Attribution for Text-to-Image Models by Unlearning Synthesized Images [71.23012718682634]
テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。
合成画像の非学習をシミュレートして効率的なデータ帰属法を提案する。
次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。
論文 参考訳(メタデータ) (2024-06-13T17:59:44Z) - Semantic Augmentation in Images using Language [6.642383216055697]
本稿では,既存のデータセットを拡張するために生成された画像を利用する手法を提案する。
本稿では,深層学習モデルの領域外一般化能力を改善するために,効果的なデータ拡張のための様々な戦略について検討する。
論文 参考訳(メタデータ) (2024-04-02T22:54:24Z) - Leveraging Self-Supervision for Cross-Domain Crowd Counting [71.75102529797549]
混雑したシーンで人をカウントするための最先端の方法は、群衆密度を推定するために深いネットワークに依存します。
われわれのネットワークは、通常の画像から逆さまの実際の画像を認識できるように訓練し、その不確実性を予測する能力を組み込む。
このアルゴリズムは、推論時に余分な計算をせずに、最先端のクロスドメイン群をカウントするアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2021-03-30T12:37:55Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Automated Synthetic-to-Real Generalization [142.41531132965585]
本稿では,レイヤワイズ学習率の選択を自動化するためのテキスト学習最適化(L2O)戦略を提案する。
提案手法は,実データを見たり,トレーニングしたりすることなく,合成から現実への一般化性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-07-14T10:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。