論文の概要: Impact of Label Types on Training SWIN Models with Overhead Imagery
- arxiv url: http://arxiv.org/abs/2310.07572v1
- Date: Wed, 11 Oct 2023 15:14:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 22:10:01.929000
- Title: Impact of Label Types on Training SWIN Models with Overhead Imagery
- Title(参考訳): オーバーヘッド画像を用いたSWINモデルの訓練におけるラベルタイプの影響
- Authors: Ryan Ford, Kenneth Hutchison, Nicholas Felts, Benjamin Cheng, Jesse
Lew, Kyle Jackson
- Abstract要約: 本研究は,境界ボックスとセグメンテーションラベルを用いたシフト窓変圧器の訓練効果について検討した。
対象画素のみにトレーニングしたモデルでは,分類タスクの性能向上が得られないことがわかった。
オブジェクト検出では、各ラベルタイプでトレーニングされたモデルが、テスト全体で同等のパフォーマンスを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding the impact of data set design on model training and performance
can help alleviate the costs associated with generating remote sensing and
overhead labeled data. This work examined the impact of training shifted window
transformers using bounding boxes and segmentation labels, where the latter are
more expensive to produce. We examined classification tasks by comparing models
trained with both target and backgrounds against models trained with only
target pixels, extracted by segmentation labels. For object detection models,
we compared performance using either label type when training. We found that
the models trained on only target pixels do not show performance improvement
for classification tasks, appearing to conflate background pixels in the
evaluation set with target pixels. For object detection, we found that models
trained with either label type showed equivalent performance across testing. We
found that bounding boxes appeared to be sufficient for tasks that did not
require more complex labels, such as object segmentation. Continuing work to
determine consistency of this result across data types and model architectures
could potentially result in substantial savings in generating remote sensing
data sets for deep learning.
- Abstract(参考訳): モデルトレーニングとパフォーマンスに対するデータセット設計の影響を理解することは、リモートセンシングとラベル付きデータの生成に関連するコストを軽減するのに役立つ。
本研究は,有界箱とセグメンテーションラベルを用いた移動窓変圧器の訓練効果について検討した。
対象画素と背景の両方で訓練されたモデルと,セグメンテーションラベルから抽出したターゲット画素のみを訓練したモデルとを比較して分類課題を検討した。
オブジェクト検出モデルでは、トレーニング時のラベルタイプでパフォーマンスを比較した。
対象画素のみに訓練されたモデルでは分類タスクの性能が向上せず,対象画素を用いた評価セットで背景画素が共役するようにみられた。
オブジェクト検出では、各ラベルタイプでトレーニングされたモデルが、テスト全体で同等のパフォーマンスを示した。
オブジェクトセグメンテーションのような複雑なラベルを必要としないタスクには,バウンディングボックスが十分であることがわかった。
データタイプとモデルアーキテクチャ間でこの結果の一貫性を決定する作業の継続は、ディープラーニングのためにリモートセンシングデータセットを生成する際の大幅な節約につながる可能性がある。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Counterfactual Reasoning for Multi-Label Image Classification via Patching-Based Training [84.95281245784348]
共起関係の過度な強調は、モデルの過度な問題を引き起こす可能性がある。
本稿では,対象対象物とその共起対象物による相関特性を媒介者とみなすことができることを示す因果推論フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T13:13:24Z) - Task Specific Pretraining with Noisy Labels for Remote Sensing Image Segmentation [18.598405597933752]
自己監督(Self-supervision)は、人造地理空間アノテーションの正確な量を減らすためのリモートセンシングツールを提供する。
本研究では,モデル事前学習のためのノイズの多いセマンティックセグメンテーションマップを提案する。
2つのデータセットから,ノイズラベルを用いたタスク固有教師付き事前学習の有効性が示唆された。
論文 参考訳(メタデータ) (2024-02-25T18:01:42Z) - Labeling Indoor Scenes with Fusion of Out-of-the-Box Perception Models [4.157013247909771]
ボトムアップセグメンテーション(SAM)、オブジェクト検出(Detic)、セマンティックセグメンテーション(MaskFormer)の最先端モデルを活用することを提案する。
室内環境におけるセマンティックセグメンテーションとオブジェクトインスタンス検出のための擬似ラベルを得るための,コスト効率の高いラベリング手法を開発することを目的とする。
提案手法の有効性を,Active VisionデータセットとADE20Kデータセットに示す。
論文 参考訳(メタデータ) (2023-11-17T21:58:26Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - Texture-Based Input Feature Selection for Action Recognition [3.9596068699962323]
本稿では,ドメインの差分を増大させる入力におけるタスク関連コンテンツを決定する新しい手法を提案する。
提案モデルは,HMDB-51データセットとPenn Actionデータセットにおいて,既存の行動認識モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-02-28T23:56:31Z) - Exploiting Unlabeled Data with Vision and Language Models for Object
Detection [64.94365501586118]
堅牢で汎用的なオブジェクト検出フレームワークを構築するには、より大きなラベルスペースとより大きなトレーニングデータセットへのスケーリングが必要である。
本稿では,近年の視覚と言語モデルで利用可能なリッチなセマンティクスを利用して,未ラベル画像中のオブジェクトのローカライズと分類を行う手法を提案する。
生成した擬似ラベルの価値を,オープン語彙検出と半教師付きオブジェクト検出の2つのタスクで示す。
論文 参考訳(メタデータ) (2022-07-18T21:47:15Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。