論文の概要: Exploring the Effects of Data Augmentation for Drivable Area
Segmentation
- arxiv url: http://arxiv.org/abs/2208.03437v1
- Date: Sat, 6 Aug 2022 03:39:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 12:20:51.733557
- Title: Exploring the Effects of Data Augmentation for Drivable Area
Segmentation
- Title(参考訳): 乾燥領域分割におけるデータ拡張の効果の検討
- Authors: Srinjoy Bhuiya, Ayushman Kumar, Sankalok Sen
- Abstract要約: 既存の画像データセットを解析することで、データ拡張の利点を調べることに重点を置いている。
以上の結果から,既存技術(SOTA)モデルの性能とロバスト性は劇的に向上する可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The real-time segmentation of drivable areas plays a vital role in
accomplishing autonomous perception in cars. Recently there have been some
rapid strides in the development of image segmentation models using deep
learning. However, most of the advancements have been made in model
architecture design. In solving any supervised deep learning problem related to
segmentation, the success of the model that one builds depends upon the amount
and quality of input training data we use for that model. This data should
contain well-annotated varied images for better working of the segmentation
model. Issues like this pertaining to annotations in a dataset can lead the
model to conclude with overwhelming Type I and II errors in testing and
validation, causing malicious issues when trying to tackle real world problems.
To address this problem and to make our model more accurate, dynamic, and
robust, data augmentation comes into usage as it helps in expanding our sample
training data and making it better and more diversified overall. Hence, in our
study, we focus on investigating the benefits of data augmentation by analyzing
pre-existing image datasets and performing augmentations accordingly. Our
results show that the performance and robustness of existing state of the art
(or SOTA) models can be increased dramatically without any increase in model
complexity or inference time. The augmentations decided on and used in this
paper were decided only after thorough research of several other augmentation
methodologies and strategies and their corresponding effects that are in
widespread usage today. All our results are being reported on the widely used
Cityscapes Dataset.
- Abstract(参考訳): ドライビング可能な地域のリアルタイムセグメンテーションは、自動車における自律的な認識を達成する上で重要な役割を果たす。
近年,ディープラーニングを用いた画像分割モデルの開発が急速に進んでいる。
しかしながら、ほとんどの進歩はモデルアーキテクチャ設計において行われてきた。
セグメンテーションに関連する教師付きディープラーニング問題の解決において、モデルが構築するモデルの成功は、そのモデルに使用する入力トレーニングデータの量と品質に依存する。
このデータは、セグメンテーションモデルのより優れた作業のために、よく注釈付けされた様々な画像を含むべきである。
データセットのアノテーションに関連するこのような問題は、テストとバリデーションにおいて過大なタイプIとIIのエラーでモデルが終了する原因となり、現実世界の問題に対処しようとすると悪意のある問題を引き起こします。
この問題に対処し、モデルをより正確でダイナミックで堅牢にするために、サンプルトレーニングデータを拡張し、全体としてより良く、より多様なものにするために、データ拡張が使われます。
そこで本研究では,既存の画像データセットを分析し,それに応じて拡張を行うことで,データ拡張のメリットを検討することに焦点を当てる。
以上の結果から,既存技術(SOTA)モデルの性能と堅牢性は,モデル複雑性や推論時間の増加を伴わずに劇的に向上できることが示された。
本論文では,他の拡張手法と戦略の徹底的な研究と,現在広く利用されているそれに対応する効果についてのみ検討した。
結果はすべて、広く使われているCityscapes Datasetで報告されています。
関連論文リスト
- DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data [48.31817189858086]
生成データは、モデルが学習できるデータ分布を拡大し、過剰適合を軽減できると主張している。
DiverGenは強力なX-Pasteよりも優れており、すべてのカテゴリで+1.1ボックスAPと+1.1マスクAPを達成でき、まれなカテゴリでは+1.9ボックスAPと+2.5マスクAPを達成できる。
論文 参考訳(メタデータ) (2024-05-16T15:30:18Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - A Survey on Data Augmentation in Large Model Era [16.05117556207015]
大きな言語と拡散モデルを含む大きなモデルは、人間レベルの知能を近似する上で非常に有望である。
これらのモデルへの継続的な更新により、既存の高品質なデータの貯水池はすぐに枯渇する可能性がある。
本稿では,大規模モデル駆動型データ拡張手法について概観する。
論文 参考訳(メタデータ) (2024-01-27T14:19:33Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Quantifying Overfitting: Introducing the Overfitting Index [0.0]
オーバーフィッティング(overfitting)とは、トレーニングデータでは優れたパフォーマンスを示すが、目に見えないデータではフェールである。
本稿では、モデルが過度に適合する傾向を定量的に評価するために考案された新しい指標であるOverfitting Index(OI)を紹介する。
我々の結果は、アーキテクチャ全体にわたる変数過度な振る舞いを強調し、データ拡張による緩和的な影響を強調します。
論文 参考訳(メタデータ) (2023-08-16T21:32:57Z) - Exploring the Impact of Instruction Data Scaling on Large Language
Models: An Empirical Study on Real-World Use Cases [17.431381376675432]
本稿では,命令データのスケールの異なる命令データに対して,命令チューニングに基づく大規模言語モデルの性能について検討する。
ベースモデルとしてBloomz-7B1-mtを用いると、命令データの量を増やすだけで、オープン・エンド・ジェネレーションのようなタスクが継続的に改善されることが示される。
本稿では,高品質なトレーニングデータ,スケールベースモデル,ハードタスクに特化したトレーニング手法を効果的に選択する,といった将来的な研究方向を提案する。
論文 参考訳(メタデータ) (2023-03-26T14:49:37Z) - Optimizing the Procedure of CT Segmentation Labeling [1.2891210250935146]
Computed Tomographyでは、機械学習は自動データ処理によく使用される。
本稿では,アノテーションの手順とそのモデル性能への影響について考察する。
モデルトレーニングのために収集された優れたデータセットの主な利点は、ラベルの品質、多様性、完全性である、と仮定する。
論文 参考訳(メタデータ) (2023-03-24T15:52:42Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。