論文の概要: CART: Caltech Aerial RGB-Thermal Dataset in the Wild
- arxiv url: http://arxiv.org/abs/2403.08997v1
- Date: Wed, 13 Mar 2024 23:31:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 22:17:16.876393
- Title: CART: Caltech Aerial RGB-Thermal Dataset in the Wild
- Title(参考訳): CART:カリフォルニア工科大学のRGB-Thermal Dataset in the Wild
- Authors: Connor Lee, Matthew Anderson, Nikhil Raganathan, Xingxing Zuo, Kevin Do, Georgia Gkioxari, Soon-Jo Chung,
- Abstract要約: 本稿では,自然環境下での航空ロボットのためのRGB熱水性データセットについて紹介する。
私たちのデータセットは、川、湖、海岸線、砂漠、森林など、アメリカ大陸の様々な地形を捉えています。
熱的およびRGB-熱的セマンティックセグメンテーション、RGB-熱的画像変換、および視覚慣性オドメトリーのための新しい、挑戦的なベンチマークを提案する。
- 参考スコア(独自算出の注目度): 14.699908177967181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the first publicly available RGB-thermal dataset designed for aerial robotics operating in natural environments. Our dataset captures a variety of terrains across the continental United States, including rivers, lakes, coastlines, deserts, and forests, and consists of synchronized RGB, long-wave thermal, global positioning, and inertial data. Furthermore, we provide semantic segmentation annotations for 10 classes commonly encountered in natural settings in order to facilitate the development of perception algorithms robust to adverse weather and nighttime conditions. Using this dataset, we propose new and challenging benchmarks for thermal and RGB-thermal semantic segmentation, RGB-to-thermal image translation, and visual-inertial odometry. We present extensive results using state-of-the-art methods and highlight the challenges posed by temporal and geographical domain shifts in our data. Dataset and accompanying code will be provided at https://github.com/aerorobotics/caltech-aerial-rgbt-dataset
- Abstract(参考訳): 本稿では,自然環境下での航空ロボットのためのRGB熱水性データセットについて紹介する。
我々のデータセットは、川、湖、海岸線、砂漠、森林など、アメリカ大陸の様々な地形を捉え、同期RGB、長波熱、地球位置、慣性データで構成されています。
さらに,悪天候や夜間条件に頑健な認識アルゴリズムの開発を容易にするため,自然環境においてよく見られる10のクラスに対してセマンティックセグメンテーションアノテーションを提供する。
このデータセットを用いて、熱的およびRGB-熱的セマンティックセグメンテーション、RGB-熱的画像変換、視覚慣性計測のための新しい、そして挑戦的なベンチマークを提案する。
我々は、最先端の手法を用いて広範な結果を提示し、我々のデータにおける時間的および地理的領域シフトによる課題を強調した。
Datasetと付随するコードはhttps://github.com/aerorobotics/caltech-aerial-rgbt-datasetで提供される。
関連論文リスト
- RaSim: A Range-aware High-fidelity RGB-D Data Simulation Pipeline for Real-world Applications [55.24463002889]
我々は深度データ合成に焦点をあて、レンジ対応RGB-Dデータシミュレーションパイプライン(RaSim)を開発した。
特に、実世界のセンサーの撮像原理を模倣して高忠実度深度データを生成する。
RaSimは、下流のRGB-D知覚タスクで微調整をすることなく、現実世界のシナリオに直接適用することができる。
論文 参考訳(メタデータ) (2024-04-05T08:52:32Z) - Closing the Gap in Human Behavior Analysis: A Pipeline for Synthesizing
Trimodal Data [1.8024397171920885]
本稿では,RGB,熱,深度,人間中心のデータセットを新たに生成する手法を提案する。
この技術は、RGB画像から得られる人間のセグメンテーションマスクと、自動的に出力される熱的背景と深さ的背景を組み合わせて活用する。
このアプローチを用いることで、限られたデータ、悪い雷条件、プライバシに敏感な領域の設定のためのモデルのトレーニングに利用できるトリモーダルデータを生成する。
論文 参考訳(メタデータ) (2024-02-02T16:27:45Z) - Attentive Multimodal Fusion for Optical and Scene Flow [24.08052492109655]
既存の方法は通常、RGB画像のみに依存するか、後段のモダリティを融合させる。
本稿では,センサモード間の早期情報融合を可能にするFusionRAFTという新しいディープニューラルネットワーク手法を提案する。
提案手法は,RGB画像に影響を及ぼすノイズや低照度条件の存在下での堅牢性の向上を示す。
論文 参考訳(メタデータ) (2023-07-28T04:36:07Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - THRawS: A Novel Dataset for Thermal Hotspots Detection in Raw Sentinel-2
Data [4.077787659104315]
THRawSは、温度の高いホットスポットを含むSentinel-2(S-2)の生データからなる最初のデータセットである。
堅牢なAIアーキテクチャの実現を促進するため、データセットは世界中のデータを集めている。
論文 参考訳(メタデータ) (2023-05-12T09:54:21Z) - Unsupervised RGB-to-Thermal Domain Adaptation via Multi-Domain Attention
Network [6.395383832909746]
教師なし熱画像分類とセマンティックセグメンテーションのための新しい手法を提案する。
本手法では, 熱アノテーションやRGB-熱的ペアの登録は不要である。
合成RGB画像のみを用いて熱水シーンセグメンテーションに適用した。
論文 参考訳(メタデータ) (2022-10-09T22:57:51Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z) - Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient
Object Detection [73.31632581915201]
深部特徴抽出に先立って,RGBとD(深部)を融合する新たなデータレベル組換え手法を提案する。
新たに設計された3重ストリームネットワークをこれらの新しい定式化データ上に適用し,RGBとDのチャネルワイドな相補的融合状態を実現する。
論文 参考訳(メタデータ) (2020-08-07T10:13:05Z) - Synergistic saliency and depth prediction for RGB-D saliency detection [76.27406945671379]
既存のRGB-Dサリエンシデータセットは小さく、多様なシナリオに対して過度に適合し、限定的な一般化につながる可能性がある。
そこで本研究では,RGB-Dサリエンシ検出のための半教師付きシステムを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:24:41Z) - HeatNet: Bridging the Day-Night Domain Gap in Semantic Segmentation with
Thermal Images [26.749261270690425]
現実の運転シナリオでは、夜間照明や光沢のような環境条件が悪くなる。
日中夜間に適用可能な多モーダルセマンティックセマンティックセマンティクスモデルを提案する。
RGB画像以外にも、サーマルイメージを活用して、ネットワークをはるかに堅牢にしています。
論文 参考訳(メタデータ) (2020-03-10T11:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。