論文の概要: Attribute Descent: Simulating Object-Centric Datasets on the Content
Level and Beyond
- arxiv url: http://arxiv.org/abs/2202.14034v1
- Date: Mon, 28 Feb 2022 18:58:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 16:32:49.858307
- Title: Attribute Descent: Simulating Object-Centric Datasets on the Content
Level and Beyond
- Title(参考訳): Attribute Descent: コンテンツレベルとそれ以上のオブジェクト中心データセットのシミュレーション
- Authors: Yue Yao, Liang Zheng, Xiaodong Yang, Milind Napthade, and Tom Gedeon
- Abstract要約: 合成と現実の間には、コンテンツレベルと外観レベルを含む2段階のドメインギャップが存在する。
本稿では,エンジン属性を自動的に最適化し,実世界のデータに近い合成データを実現する属性降下手法を提案する。
画像分類とオブジェクト再同定の実験により、適応された合成データが3つのシナリオで効果的に利用できることを確認した。
- 参考スコア(独自算出の注目度): 22.74463739011319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article aims to use graphic engines to simulate a large number of
training data that have free annotations and possibly strongly resemble to
real-world data. Between synthetic and real, a two-level domain gap exists,
involving content level and appearance level. While the latter is concerned
with appearance style, the former problem arises from a different mechanism,
i.e., content mismatch in attributes such as camera viewpoint, object placement
and lighting conditions. In contrast to the widely-studied appearance-level
gap, the content-level discrepancy has not been broadly studied. To address the
content-level misalignment, we propose an attribute descent approach that
automatically optimizes engine attributes to enable synthetic data to
approximate real-world data. We verify our method on object-centric tasks,
wherein an object takes up a major portion of an image. In these tasks, the
search space is relatively small, and the optimization of each attribute yields
sufficiently obvious supervision signals. We collect a new synthetic asset
VehicleX, and reformat and reuse existing the synthetic assets ObjectX and
PersonX. Extensive experiments on image classification and object
re-identification confirm that adapted synthetic data can be effectively used
in three scenarios: training with synthetic data only, training data
augmentation and numerically understanding dataset content.
- Abstract(参考訳): この記事では、無料のアノテーションを持ち、おそらく現実世界のデータに強く似ている大量のトレーニングデータをシミュレートするために、グラフィックエンジンを使用します。
合成と現実の間には、コンテンツレベルと外観レベルを含む2段階のドメインギャップが存在する。
後者は外観スタイルに関するものであるが、以前の問題は、カメラ視点、物体配置、照明条件などの属性におけるコンテンツミスマッチという、異なるメカニズムから生じる。
広く研究されている外観レベルのギャップとは対照的に、内容レベルの差は広く研究されていない。
コンテンツレベルの不一致に対処するために,エンジン属性を自動的に最適化し,合成データを実世界のデータを近似する属性降下手法を提案する。
我々は,オブジェクトが画像の大部分を占めるオブジェクト中心のタスクに対して,その手法を検証する。
これらのタスクでは、探索空間は比較的小さく、各属性の最適化によって十分に明確な監視信号が得られる。
我々は,新しい合成アセットである vehiclex を収集し,既存の合成アセット objectx と personx を再構成し,再利用する。
画像分類とオブジェクト再同定に関する広範囲な実験により、適応型合成データは、合成データのみによるトレーニング、データ拡張のトレーニング、データセットの内容の数値理解という3つのシナリオで効果的に使用できることが確認された。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Massively Annotated Datasets for Assessment of Synthetic and Real Data in Face Recognition [0.2775636978045794]
実データと合成データを用いて学習したモデルの性能のドリフトについて検討する。
属性集合上の実データと合成データセットの差について検討する。
興味深いことに、我々は実際のサンプルが合成分布を説明するのに十分であるにもかかわらず、その逆はもはや真実ではないことを検証した。
論文 参考訳(メタデータ) (2024-04-23T17:10:49Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Synthetic-to-Real Domain Adaptation for Action Recognition: A Dataset and Baseline Performances [76.34037366117234]
ロボット制御ジェスチャー(RoCoG-v2)と呼ばれる新しいデータセットを導入する。
データセットは7つのジェスチャークラスの実ビデオと合成ビデオの両方で構成されている。
我々は,最先端の行動認識とドメイン適応アルゴリズムを用いて結果を示す。
論文 参考訳(メタデータ) (2023-03-17T23:23:55Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - CrossLoc: Scalable Aerial Localization Assisted by Multimodal Synthetic
Data [2.554905387213586]
本稿では,合成データを用いて実世界のカメラポーズを推定する視覚的位置決めシステムを提案する。
データ不足を緩和するために,汎用な合成データ生成ツールTOPO-DataGenを導入する。
また、ポーズ推定のためのクロスモーダル視覚表現学習手法であるCrossLocを導入する。
論文 参考訳(メタデータ) (2021-12-16T18:05:48Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Detection and Segmentation of Custom Objects using High Distraction
Photorealistic Synthetic Data [0.5076419064097732]
合成データを用いてインスタンスセグメンテーションを行うための簡便で有用な手法を示す。
目標は、カスタムオブジェクトの実際のデータを手動で収集し、注釈付けすることで、高いパフォーマンスを達成することである。
このホワイトペーパーは、光実写シミュレーションデータが現実の応用に利用できるという強い証拠を提供する。
論文 参考訳(メタデータ) (2020-07-28T16:33:42Z) - Learning to simulate complex scenes [18.51564016785853]
本稿では,意味的セグメンテーションの文脈におけるコンテンツ適応について考察する。
本稿では、属性値の最適化と、実世界のデータと類似したコンテンツのトレーニングセットを得るために、スケーラブルな離散化・緩和(SDR)アプローチを提案する。
実験により,本システムは合理的かつ有用なシーンを生成でき,そこから有望な実世界のセグメンテーション精度を得ることができた。
論文 参考訳(メタデータ) (2020-06-25T17:51:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。