Fugu-MT 論文翻訳(概要): An evaluation of Deep Learning based stereo dense matching dataset shift from aerial images and a large scale stereo dataset

論文の概要: An evaluation of Deep Learning based stereo dense matching dataset shift from aerial images and a large scale stereo dataset

arxiv url: http://arxiv.org/abs/2402.12522v1
Date: Mon, 19 Feb 2024 20:33:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 18:11:09.307736
Title: An evaluation of Deep Learning based stereo dense matching dataset shift from aerial images and a large scale stereo dataset
Title（参考訳）: 空中画像と大規模ステレオデータセットからのディープラーニングに基づく立体密マッチングデータセットシフトの評価
Authors: Teng Wu, Bruno Vallet, Marc Pierrot-Deseilligny, Ewelina Rupnik
Abstract要約: そこで本研究では,光検出・ランドング(LiDAR)と画像から直接地中不均質マップを生成する手法を提案する。多様なシーンタイプ、画像解像度、幾何学的構成を持つデータセット間の11の密マッチング手法を評価した。
参考スコア（独自算出の注目度）: 2.048226951354646
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Dense matching is crucial for 3D scene reconstruction since it enables the recovery of scene 3D geometry from image acquisition. Deep Learning (DL)-based methods have shown effectiveness in the special case of epipolar stereo disparity estimation in the computer vision community. DL-based methods depend heavily on the quality and quantity of training datasets. However, generating ground-truth disparity maps for real scenes remains a challenging task in the photogrammetry community. To address this challenge, we propose a method for generating ground-truth disparity maps directly from Light Detection and Ranging (LiDAR) and images to produce a large and diverse dataset for six aerial datasets across four different areas and two areas with different resolution images. We also introduce a LiDAR-to-image co-registration refinement to the framework that takes special precautions regarding occlusions and refrains from disparity interpolation to avoid precision loss. Evaluating 11 dense matching methods across datasets with diverse scene types, image resolutions, and geometric configurations, which are deeply investigated in dataset shift, GANet performs best with identical training and testing data, and PSMNet shows robustness across different datasets, and we proposed the best strategy for training with a limit dataset. We will also provide the dataset and training models; more information can be found at https://github.com/whuwuteng/Aerial_Stereo_Dataset.
Abstract（参考訳）: 画像取得からシーン3次元幾何の復元を可能にするため,3次元シーン再構築にはディエンスマッチングが不可欠である。深層学習(DL)に基づく手法は,コンピュータビジョンコミュニティにおいて,エピポーラステレオ異方性推定の特別な場合において有効であることが示された。 dlベースの方法は、トレーニングデータセットの品質と量に大きく依存する。しかし, 実写シーンの地道不均質マップの作成は, 写真撮影コミュニティでは難しい課題である。そこで本研究では,光検出・測位 (lidar) と画像から直接地中不均等地図を生成する手法を提案し,4つの異なる領域と2つの異なる解像度の領域にまたがる6つの空中データセットに対して,多種多様なデータセットを作成する。また,このフレームワークにLiDAR-to-image共同登録の改良を導入し,オクルージョンや不均一な補間を回避し,精度の低下を回避する。多様なシーンタイプ,画像解像度,幾何学的構成を持つデータセットをまたいだ11の密集したマッチング手法を評価し,データセットシフトで深く検討し,ganetは同一のトレーニングとテストデータで最高の性能を示し,psmnetは異なるデータセットにまたがる堅牢性を示し,リミットデータセットでトレーニングするための最善の戦略を提案した。より詳しい情報はhttps://github.com/whuwuteng/Aerial_Stereo_Dataset.comで確認できます。

関連論文リスト

AerialMegaDepth: Learning Aerial-Ground Reconstruction and View Synthesis [57.249817395828174]
本研究では,3次元都市規模のメッシュからの擬似合成レンダリングと,実地レベルでのクラウドソース画像を組み合わせたスケーラブルなフレームワークを提案する。擬似合成データは、幅広い空中視点をシミュレートする一方、実際のクラウドソース画像は、地上レベルの画像の視覚的忠実度を改善するのに役立つ。このハイブリッドデータセットを使用して、いくつかの最先端のアルゴリズムを微調整し、実世界のゼロショット地上作業において大幅な改善を実現する。
論文参考訳（メタデータ） (2025-04-17T17:57:05Z)
SatDepth: A Novel Dataset for Satellite Image Matching [0.0]
SatDepth'は,衛星画像のための画像マッチングフレームワークをトレーニングするために,高密度な地上真実対応を提供する新しいデータセットである。我々は、我々のデータセットを使用して、既存の4つの画像マッチングフレームワークをベンチマークし、我々のデータセットでトレーニングされたモデルが、他のデータセットでトレーニングされたモデルよりも40%高い(最大40%の精度で)ことを確認するアブレーション調査を実施した。
論文参考訳（メタデータ） (2025-03-17T00:14:13Z)
3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching [6.13702551312774]
光SAR画像マッチングのための大規模マルチソース、マルチ解像度、マルチシーンデータセット(3MOS)を紹介する。 6つの商用衛星からのSARデータを含む155Kの光学SAR画像対で構成され、解像度は1.25mから12.5mである。データは、都市、農村、平野、丘、山、水、砂漠、凍った土を含む8つのシーンに分類されている。
論文参考訳（メタデータ） (2024-04-01T00:31:11Z)
Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳（メタデータ） (2024-03-23T22:32:06Z)
SIDAR: Synthetic Image Dataset for Alignment & Restoration [2.9649783577150837]
エンドツーエンドのディープラーニングモデルのトレーニングと評価に十分なデータを提供するデータセットが不足している。提案したデータ拡張は,3次元レンダリングを用いてデータの不足を克服するのに役立つ。得られたデータセットは、画像アライメントとアーティファクト削除を含むさまざまなタスクのトレーニングと評価セットとして機能する。
論文参考訳（メタデータ） (2023-05-19T23:32:06Z)
Unsupervised Domain Adaptation with Histogram-gated Image Translation for Delayered IC Image Analysis [2.720699926154399]
Histogram-gated Image Translation (HGIT)は、特定のソースデータセットからターゲットデータセットのドメインに変換する、教師なしのドメイン適応フレームワークである。提案手法は,報告したドメイン適応手法と比較して最高の性能を達成し,完全教師付きベンチマークに適当に近い。
論文参考訳（メタデータ） (2022-09-27T15:53:22Z)
Towards Scale Consistent Monocular Visual Odometry by Learning from the Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文参考訳（メタデータ） (2022-03-11T01:51:54Z)
Sci-Net: a Scale Invariant Model for Building Detection from Aerial Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文参考訳（メタデータ） (2021-11-12T16:45:20Z)
Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文参考訳（メタデータ） (2021-10-29T16:51:16Z)
Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文参考訳（メタデータ） (2021-04-09T02:58:59Z)
JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文参考訳（メタデータ） (2020-04-07T14:59:35Z)
Weakly-supervised land classification for coastal zone based on deep convolutional neural networks by incorporating dual-polarimetric characteristics into training dataset [1.0494061710470493]
本研究では, 空間偏光合成開口レーダ(PolSAR)を用いた意味的セグメンテーションにおけるDCNNの性能について検討する。 PolSARデータを用いたセマンティックセグメンテーションタスクは、SARデータの特徴とアノテート手順が考慮されている場合、弱い教師付き学習に分類することができる。次に、SegNet、U-Net、LinkNetを含む3つのDCNNモデルが実装されている。
論文参考訳（メタデータ） (2020-03-30T17:32:49Z)
Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文参考訳（メタデータ） (2020-01-14T20:22:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。