論文の概要: DDOS: The Drone Depth and Obstacle Segmentation Dataset
- arxiv url: http://arxiv.org/abs/2312.12494v1
- Date: Tue, 19 Dec 2023 18:54:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 17:59:41.204372
- Title: DDOS: The Drone Depth and Obstacle Segmentation Dataset
- Title(参考訳): DDOS:ドローンの深さと障害物セグメンテーションデータセット
- Authors: Benedikt Kolbeinsson and Krystian Mikolajczyk
- Abstract要約: 現実の航空データセットの不足は、ロバストなモデルのトレーニングと評価に重大な課題をもたらす。
本研究では,航空ビューにおける深度とセマンティックセグメンテーションタスクに特化して設計された新しい合成データセットを提案する。
- 参考スコア(独自算出の注目度): 19.924944826583605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate depth and semantic segmentation are crucial for various computer
vision tasks. However, the scarcity of annotated real-world aerial datasets
poses a significant challenge for training and evaluating robust models.
Additionally, the detection and segmentation of thin objects, such as wires,
cables, and fences, present a critical concern for ensuring the safe operation
of drones. To address these limitations, we present a novel synthetic dataset
specifically designed for depth and semantic segmentation tasks in aerial
views. Leveraging photo-realistic rendering techniques, our dataset provides a
valuable resource for training models using a synthetic-supervision training
scheme while introducing new drone-specific metrics for depth accuracy.
- Abstract(参考訳): 正確な深度とセマンティックセグメンテーションは様々なコンピュータビジョンタスクに不可欠である。
しかし、注釈付き実世界の空中データセットの不足は、堅牢なモデルのトレーニングと評価において大きな課題となる。
さらに、ワイヤー、ケーブル、フェンスなどの薄い物体の検出とセグメント化は、ドローンの安全な運用を確保する上で重要な関心事となっている。
これらの制約に対処するため,航空ビューにおける深度・意味的セグメンテーションタスクに特化して設計された新しい合成データセットを提案する。
フォトリアリスティックなレンダリング技術を活用したデータセットは,合成スーパービジョンのトレーニングスキームを用いたモデルのトレーニングに有用なリソースを提供すると同時に,深さ精度のためのドローン固有のメトリクスも新たに導入する。
関連論文リスト
- SAID-NeRF: Segmentation-AIDed NeRF for Depth Completion of Transparent Objects [7.529049797077149]
市販のRGB-Dカメラを使って透明物体の正確な深度情報を取得することは、コンピュータビジョンとロボティクスにおいてよく知られた課題である。
NeRFは学習のないアプローチであり、新しいビューの合成と形状回復に広く成功している。
提案したAID-NeRF法は,透明物体とロボットグルーピングのための深度補完データセットに有意な性能を示す。
論文 参考訳(メタデータ) (2024-03-28T17:28:32Z) - From-Ground-To-Objects: Coarse-to-Fine Self-supervised Monocular Depth
Estimation of Dynamic Objects with Ground Contact Prior [27.178810518086493]
移動物体の深度推定のための粗大な訓練戦略を提案する。
粗いトレーニング段階では、再投射損失計算から動的クラスのオブジェクトを除外する。
微妙な訓練段階において、再投射損失からオブジェクトの詳細な深さを学習するために、DECネットワークを洗練する。
論文 参考訳(メタデータ) (2023-12-15T11:22:17Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Robust Geometry-Preserving Depth Estimation Using Differentiable
Rendering [93.94371335579321]
我々は、余分なデータやアノテーションを必要とせずに、幾何学保存深度を予測するためにモデルを訓練する学習フレームワークを提案する。
包括的な実験は、我々のフレームワークの優れた一般化能力を強調します。
我々の革新的な損失関数は、ドメイン固有のスケール・アンド・シフト係数を自律的に復元するモデルを可能にします。
論文 参考訳(メタデータ) (2023-09-18T12:36:39Z) - SynDrone -- Multi-modal UAV Dataset for Urban Scenarios [11.338399194998933]
ピクセルレベルのアノテーションを持つ大規模な実際のデータセットの不足は、研究者にとって大きな課題となっている。
本研究では,複数の飛行高度で撮影された画像と3次元データを含むマルチモーダル合成データセットを提案する。
データセットは、UAVアプリケーションをターゲットにした新しいコンピュータビジョンメソッドの開発をサポートするために公開されます。
論文 参考訳(メタデータ) (2023-08-21T06:22:10Z) - VDD: Varied Drone Dataset for Semantic Segmentation [10.15287426479444]
400の高解像度画像からなる大規模で高密度なラベル付きデータセットを提供する。
我々はCNNとTransformerのバックボーンを組み合わせた新しいDeepLabTモデルを開発した。
実験の結果,DeepLabTはVDDや他のドローンのデータセットで良好に動作することがわかった。
論文 参考訳(メタデータ) (2023-05-23T02:16:14Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for
Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。
トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。
単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。
我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文 参考訳(メタデータ) (2022-11-07T16:17:47Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - DeepSatData: Building large scale datasets of satellite images for
training machine learning models [77.17638664503215]
本稿では,機械学習モデルの学習のための衛星画像データセットの自動生成のための設計検討を行う。
本稿では,ニューラルネットワークの深層学習と評価の観点から直面する課題について論じる。
論文 参考訳(メタデータ) (2021-04-28T15:13:12Z) - Exploring the Impacts from Datasets to Monocular Depth Estimation (MDE)
Models with MineNavi [5.689127984415125]
ディープラーニングに基づく現在のコンピュータビジョンタスクは、モデルトレーニングやテストのためのアノテーションを備えた大量のデータを必要とする。
実際には、高密度推定タスクのための手動ラベリングは非常に困難または不可能であり、データセットのシーンは小さな範囲に制限されることが多い。
本稿では,手作業の負担を伴わない拡張可能なデータセットを得るための合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2020-08-19T14:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。