Fugu-MT 論文翻訳(概要): UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios

論文の概要: UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios

arxiv url: http://arxiv.org/abs/2302.10082v1
Date: Mon, 20 Feb 2023 16:45:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 14:58:07.446436
Title: UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios
Title（参考訳）: UAVStereo:UAVシナリオにおけるステレオマッチングのための多重解像度データセット
Authors: Zhang Xiaoyi, Cao Xuefeng, Yu Anzhu, Yu Wenshuai, Li Zhenqi, Quan Yujun
Abstract要約: 本稿では,UAVStereoと呼ばれる多解像度UAVシナリオデータセットを構築し,34k以上のステレオ画像ペアが3つの典型的なシーンをカバーしている。本稿では,UAVシナリオにおける課題に対処する際の限界を明らかにするとともに,従来型および最先端のディープラーニング手法の評価を行う。
参考スコア（独自算出の注目度）: 0.6524460254566905
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Stereo matching is a fundamental task for 3D scene reconstruction. Recently, deep learning based methods have proven effective on some benchmark datasets, such as KITTI and Scene Flow. UAVs (Unmanned Aerial Vehicles) are commonly utilized for surface observation, and their captured images are frequently used for detailed 3D reconstruction due to high resolution and low-altitude acquisition. At present, the mainstream supervised learning network requires a significant amount of training data with ground-truth labels to learn model parameters. However, due to the scarcity of UAV stereo matching datasets, the learning-based network cannot be applied to UAV images. To facilitate further research, this paper proposes a novel pipeline to generate accurate and dense disparity maps using detailed meshes reconstructed by UAV images and LiDAR point clouds. Through the proposed pipeline, this paper constructs a multi-resolution UAV scenario dataset, called UAVStereo, with over 34k stereo image pairs covering 3 typical scenes. As far as we know, UAVStereo is the first stereo matching dataset of UAV low-altitude scenarios. The dataset includes synthetic and real stereo pairs to enable generalization from the synthetic domain to the real domain. Furthermore, our UAVStereo dataset provides multi-resolution and multi-scene images pairs to accommodate a variety of sensors and environments. In this paper, we evaluate traditional and state-of-the-art deep learning methods, highlighting their limitations in addressing challenges in UAV scenarios and offering suggestions for future research. The dataset is available at https://github.com/rebecca0011/UAVStereo.git
Abstract（参考訳）: ステレオマッチングは3次元シーン再構築の基本課題である。近年,KITTIやScene Flowなどのベンチマークデータセットでは,ディープラーニングに基づく手法が有効であることが証明されている。 UAV (Unmanned Aerial Vehicles) は地表観測によく使われ、高分解能・低高度取得による詳細な3D再構成にしばしば使用される。現在、主流の教師付き学習ネットワークでは、モデルパラメータを学習するためには、地道ラベルを用いた大量のトレーニングデータが必要である。しかし、UAVステレオマッチングデータセットが不足しているため、学習ベースネットワークはUAV画像に適用できない。本稿では,UAV画像とLiDAR点雲によって再構成された詳細なメッシュを用いて,高精度で高密度な不均質マップを生成するパイプラインを提案する。提案するパイプラインを通じて,UAVStereoと呼ばれる多解像度UAVシナリオデータセットを構築し,34k以上のステレオ画像ペアが3つの典型的なシーンをカバーする。われわれが知る限り、UAVStereoはUAV低高度シナリオの最初のステレオマッチングデータセットである。このデータセットは合成ドメインから実ドメインへの一般化を可能にする合成および実ステレオペアを含む。さらに、UAVStereoデータセットは、さまざまなセンサーや環境に対応するために、マルチ解像度とマルチシーンの画像ペアを提供する。本稿では,UAVシナリオにおける課題に対処する上での限界を強調し,今後の研究に向けて提案する,従来型および最先端のディープラーニング手法の評価を行う。データセットはhttps://github.com/rebecca0011/uavstereo.gitで入手できる。

関連論文リスト

UAVScenes: A Multi-Modal Dataset for UAVs [45.752766099526525]
UAVScenesは2Dと3Dの両方のモードでさまざまなタスクをベンチマークするために設計された大規模なデータセットである。我々は、フレームワイド画像とLiDARポイントクラウドの両方に対して、手動でラベル付けされたセマンティックアノテーションを提供することにより、このデータセットを強化する。これらの追加により、セグメンテーション、深さ推定、6-DoFローカライゼーション、位置認識、新しいビュー合成など、幅広いUAV認識タスクが可能になる。
論文参考訳（メタデータ） (2025-07-30T06:29:52Z)
UAV4D: Dynamic Neural Rendering of Human-Centric UAV Imagery using Gaussian Splatting [54.883935964137706]
UAV4Dは,UAVが捉えたダイナミックな現実世界のシーンに対して,フォトリアリスティックなレンダリングを可能にするフレームワークである。我々は3次元基礎モデルと人間のメッシュ再構築モデルを組み合わせて、シーン背景と人間の両方を再構築する。以上の結果から,新しい視点合成法に対するアプローチの利点が示され,1.5dBPSNRの改善と視覚的シャープネスの向上が達成された。
論文参考訳（メタデータ） (2025-06-05T13:21:09Z)
UAVPairs: A Challenging Benchmark for Match Pair Retrieval of Large-scale UAV Images [8.607887740177802]
本稿では,大規模UAV画像のペア検索のためのベンチマークデータセット,UAVPairs,およびトレーニングパイプラインを提案する。 UAVPairsデータセットは、30の異なるシーンにわたる21,622の高解像度画像で構成されている。 UAVPairsデータセットとトレーニングパイプラインの有効性は、3つの異なる大規模UAVデータセットに関する包括的な実験を通じて検証される。
論文参考訳（メタデータ） (2025-05-28T08:21:05Z)
More Clear, More Flexible, More Precise: A Comprehensive Oriented Object Detection benchmark for UAV [58.89234732689013]
CODroneは、現実の状況を正確に反映した、UAVのための包括的なオブジェクト指向オブジェクト検出データセットである。また、下流のタスク要求に合わせて設計された新しいベンチマークとしても機能する。我々は、CODroneを厳格に評価するために、22の古典的またはSOTA法に基づく一連の実験を行う。
論文参考訳（メタデータ） (2025-04-28T17:56:02Z)
Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0]
クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文参考訳（メタデータ） (2024-09-25T13:33:28Z)
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文参考訳（メタデータ） (2024-06-13T17:59:30Z)
UAV-VisLoc: A Large-scale Dataset for UAV Visual Localization [20.37586403749362]
大規模なUAV-VisLocデータセットを提示し、UAV視覚的ローカライゼーション作業を容易にする。われわれのデータセットには6,742枚のドローン画像と11個の衛星マップが含まれており、緯度、経度、高度、捕獲日などのメタデータがある。
論文参考訳（メタデータ） (2024-05-20T10:24:10Z)
UAVD4L: A Large-Scale Dataset for UAV 6-DoF Localization [14.87295056434887]
局所化のための大規模6-DoF UAVデータセット(UAVD4L)を提案する。オフライン合成データ生成とオンラインビジュアルローカライゼーションからなる2段階6-DoFローカライゼーションパイプライン(UAVLoc)を開発した。新しいデータセットの結果は,提案手法の有効性を示す。
論文参考訳（メタデータ） (2024-01-11T15:19:21Z)
Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve Aerial Visual Perception? [57.77643186237265]
我々は、異なる視点から同期シーンを記録するビデオデータセットであるMultiview Aerial Visual RECgnition(MAVREC)を提示する。 MAVRECは約2.5時間、業界標準の2.7K解像度ビデオシーケンス、0.5万フレーム以上のフレーム、11万の注釈付きバウンディングボックスで構成されている。これにより、MAVRECは地上および空中ビューのデータセットとして最大であり、ドローンベースのデータセットの中では4番目に大きい。
論文参考訳（メタデータ） (2023-12-07T18:59:14Z)
Investigation of UAV Detection in Images with Complex Backgrounds and Rainy Artifacts [20.20609511526255]
UAV検出のための視覚に基づく物体検出法が開発されている。複雑な背景と雨のような気象要素を持つ画像におけるUAV検出は、まだ合理的に研究されていない。この研究は、最先端のオブジェクト検出モデルのベンチマークにも重点を置いている。
論文参考訳（メタデータ） (2023-05-25T19:54:33Z)
Towards Scale Consistent Monocular Visual Odometry by Learning from the Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文参考訳（メタデータ） (2022-03-11T01:51:54Z)
Vision-Based UAV Self-Positioning in Low-Altitude Urban Environments [20.69412701553767]
無人航空機(UAV)は安定した位置決めのために衛星システムに依存している。このような状況下では、視覚に基づく技術が代替手段として機能し、UAVの自己配置能力を確実にする。本稿では,UAV自己配置タスク用に設計された最初の公開データセットであるDenseUAVを提案する。
論文参考訳（メタデータ） (2022-01-23T07:18:55Z)
Self-Supervised Depth Completion for Active Stereo [55.79929735390945]
アクティブステレオシステムは、低コストで高品質な深度マップのため、ロボット産業で広く利用されている。これらの深度センサーはステレオアーチファクトに悩まされており、密度の深い深度推定を提供していない。本稿では, 高精度な深度マップを推定するアクティブステレオシステムのための, 自己監督型深度補完法を提案する。
論文参考訳（メタデータ） (2021-10-07T07:33:52Z)
Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-08-02T07:50:50Z)
OpenREALM: Real-time Mapping for Unmanned Aerial Vehicles [62.997667081978825]
OpenREALMは無人航空機(UAV)のリアルタイムマッピングフレームワークである異なる操作モードにより、OpenREALMは近似平面場を仮定して単純な縫合を行うことができる。すべてのモードにおいて、結果のマップの漸進的な進捗は、地上のオペレータによってライブで見ることができる。
論文参考訳（メタデータ） (2020-09-22T12:28:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。