論文の概要: UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios
- arxiv url: http://arxiv.org/abs/2408.04922v2
- Date: Fri, 23 Aug 2024 18:01:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 20:40:24.168997
- Title: UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios
- Title(参考訳): UAVによる災害シナリオ検出データセットの総合的分析とベンチマーク
- Authors: Ragib Amin Nihal, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai,
- Abstract要約: 無人航空機(UAV)は捜索救助(SAR)活動に革命をもたらした。
機械学習モデルをトレーニングするための、特殊なヒューマン検出データセットが欠如していることは、大きな課題である。
本稿では,UAVが捉えた災害現場に人間のポーズをオーバーレイして合成したC2Aデータセットについて述べる。
- 参考スコア(独自算出の注目度): 3.759682200711633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned aerial vehicles (UAVs) have revolutionized search and rescue (SAR) operations, but the lack of specialized human detection datasets for training machine learning models poses a significant challenge.To address this gap, this paper introduces the Combination to Application (C2A) dataset, synthesized by overlaying human poses onto UAV-captured disaster scenes. Through extensive experimentation with state-of-the-art detection models, we demonstrate that models fine-tuned on the C2A dataset exhibit substantial performance improvements compared to those pre-trained on generic aerial datasets. Furthermore, we highlight the importance of combining the C2A dataset with general human datasets to achieve optimal performance and generalization across various scenarios. This points out the crucial need for a tailored dataset to enhance the effectiveness of SAR operations. Our contributions also include developing dataset creation pipeline and integrating diverse human poses and disaster scenes information to assess the severity of disaster scenarios. Our findings advocate for future developments, to ensure that SAR operations benefit from the most realistic and effective AI-assisted interventions possible.
- Abstract(参考訳): 無人航空機(UAV)は,捜索救助活動(SAR)に革命をもたらしたが,機械学習モデルを訓練するための特殊な人検出データセットが欠如していることは大きな課題であり,このギャップに対処するために,UAVが捉えた災害現場に人間のポーズをオーバーレイして合成したCombination to Application(C2A)データセットを提案する。
C2Aデータセットで微調整されたモデルは、最先端検出モデルによる広範囲な実験により、一般的な航空データセットで事前訓練されたモデルと比較して、大幅な性能向上を示すことを示した。
さらに,C2Aデータセットと一般の人間のデータセットを組み合わせることの重要性を強調し,様々なシナリオにおける最適な性能と一般化を実現する。
このことは、SAR操作の有効性を高めるために、調整されたデータセットが必要であることを指摘する。
私たちのコントリビューションには、データセット作成パイプラインの開発や、災害シナリオの深刻度を評価するために、さまざまな人間のポーズと災害現場情報の統合も含まれています。
我々の研究は、SAR操作が最も現実的で効果的なAI支援による介入の恩恵を受けることを保証するために、今後の発展を提唱する。
関連論文リスト
- UAV (Unmanned Aerial Vehicles): Diverse Applications of UAV Datasets in Segmentation, Classification, Detection, and Tracking [0.0]
無人航空機(UAV)は、さまざまな研究領域におけるデータの収集と分析のプロセスに革命をもたらした。
UAVデータセットは、衛星画像、ドローンが撮影した画像、ビデオなど、さまざまな種類のデータで構成されている。
これらのデータセットは、災害被害評価、航空監視、物体認識、追跡において重要な役割を果たす。
論文 参考訳(メタデータ) (2024-09-05T04:47:36Z) - Deep Learning Framework for History Matching CO2 Storage with 4D Seismic and Monitoring Well Data [0.0]
地質的な炭素貯蔵は、超臨界二酸化炭素のメガトンを地下層に注入する。
本稿では,早期観測に基づく生成特性の校正を可能にする履歴マッチング戦略を提案する。
論文 参考訳(メタデータ) (2024-08-02T21:14:13Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Human-Centric Aware UAV Trajectory Planning in Search and Rescue
Missions Employing Multi-Objective Reinforcement Learning with AHP and
Similarity-Based Experience Replay [0.0]
本稿では,UAV軌道計画における人中心的要因の影響について検討する。
包括的調査を通じて,UAV設計におけるジェンダー・キューと人格化が公衆の受容と信頼に与える影響を調査した。
論文 参考訳(メタデータ) (2024-02-28T17:10:22Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - Consecutive Pretraining: A Knowledge Transfer Learning Strategy with
Relevant Unlabeled Data for Remote Sensing Domain [25.84756140221655]
自然言語処理(NLP)における事前学習を停止しないという考え方に基づいて,CSPT(ConSecutive PreTraining)を提案する。
提案したCSPTは、タスク対応モデルトレーニングのためのラベルなしデータの巨大な可能性を公開することもできる。
その結果,提案したCSPTをタスク認識モデルトレーニングに活用することにより,従来の教師付きプレトレーニング-then-fine-tuning法よりもRTDのダウンストリームタスクのほとんどを上回り得ることがわかった。
論文 参考訳(メタデータ) (2022-07-08T12:32:09Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Interpretability in Convolutional Neural Networks for Building Damage
Classification in Satellite Imagery [0.0]
我々は、プレサスタ衛星画像とポストサスタ衛星画像とをラベル付けしたデータセットを使用して、建物ごとの損傷を評価する。
複数の畳み込みニューラルネットワーク(CNN)をトレーニングし、建物ごとの損傷を評価する。
我々の研究は、人為的気候変動による人道的危機の進行に、計算的に貢献することを目指している。
論文 参考訳(メタデータ) (2022-01-24T16:55:56Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z) - RescueNet: Joint Building Segmentation and Damage Assessment from
Satellite Imagery [83.49145695899388]
RescueNetは、建物を同時に分割し、個々の建物に対する損傷レベルを評価し、エンドツーエンドでトレーニングできる統一モデルである。
RescueNetは大規模で多様なxBDデータセットでテストされており、従来の手法よりもはるかに優れたセグメンテーションと損傷分類性能を実現している。
論文 参考訳(メタデータ) (2020-04-15T19:52:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。