論文の概要: EDFNet: Early Fusion of Edge and Depth for Thin-Obstacle Segmentation in UAV Navigation
- arxiv url: http://arxiv.org/abs/2604.09694v1
- Date: Mon, 06 Apr 2026 15:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.601667
- Title: EDFNet: Early Fusion of Edge and Depth for Thin-Obstacle Segmentation in UAV Navigation
- Title(参考訳): EDFNet:UAVナビゲーションにおける薄膜セグメンテーションのためのエッジと深さの早期融合
- Authors: Negar Fathi,
- Abstract要約: 本稿では,RGB,深度,エッジ情報を統合したモジュール型早期融合セグメンテーションフレームワークであるEDFNetについて述べる。
我々は,U-NetとDeepLabV3を用いた16のモダリティバックボーン構成のDDOS(Drone Depth and Obstacle)データセットにおけるEDFNetの評価を行った。
事前トレーニングされたRGBDE U-Netは、最高性能(0.244)、平均IoU(0.2)、境界IoU(0.234)を達成し、競争力のある実行性能(19.62 FPS)を維持している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Unmanned Aerial Vehicles (UAVs) must reliably detect thin obstacles such as wires, poles, and branches to navigate safely in real-world environments. These structures remain difficult to perceive because they occupy few pixels, often exhibit weak visual contrast, and are strongly affected by class imbalance. Existing segmentation methods primarily target coarser obstacles and do not fully exploit the complementary multimodal cues needed for thin-structure perception. We present EDFNet, a modular early-fusion segmentation framework that integrates RGB, depth, and edge information for thin-obstacle perception in cluttered aerial scenes. We evaluate EDFNet on the Drone Depth and Obstacle Segmentation (DDOS) dataset across sixteen modality-backbone configurations using U-Net and DeepLabV3 in pretrained and non-pretrained settings. The results show that early RGB-Depth-Edge fusion provides a competitive and well-balanced baseline, with the most consistent gains appearing in boundary-sensitive and recall-oriented metrics. The pretrained RGBDE U-Net achieves the best overall performance, with the highest Thin-Structure Evaluation Score (0.244), mean IoU (0.219), and boundary IoU (0.234), while maintaining competitive runtime performance (19.62 FPS) on our evaluation hardware. However, performance on the rarest ultra-thin categories remains low across all models, indicating that reliable ultra-thin segmentation is still an open challenge. Overall, these findings position early RGB-Depth-Edge fusion as a practical and modular baseline for thin-obstacle segmentation in UAV navigation.
- Abstract(参考訳): 無人航空機(UAV)は、現実世界の環境で安全に航行するために、ワイヤー、ポール、枝などの薄い障害物を確実に検出する必要がある。
これらの構造は、少ないピクセルを占有し、しばしば視覚的コントラストが弱く、クラス不均衡に強く影響を受けるため、知覚し難いままである。
既存のセグメンテーション手法は主に粗い障害物をターゲットにしており、薄膜の知覚に必要な相補的なマルチモーダルキューを十分に活用していない。
本稿では, RGB, 深度, エッジ情報を統合するモジュール型早期融合セグメンテーションフレームワークであるEDFNetについて述べる。
我々は,U-NetとDeepLabV3を用いた16のモダリティバックボーン構成を対象に,ドローン深度・障害物セグメンテーション(DDOS)データセット上でEDFNetを評価した。
その結果、初期のRGB-Depth-Edge融合は、境界感度とリコール指向のメトリクスに最も一貫性のあるゲインを持つ、競争的でバランスの取れたベースラインを提供することが示された。
事前学習したRGBDE U-Netは,評価ハードウェア上での競合実行性能(19.62FPS)を維持しつつ,最高評価スコア(0.244),平均IoU(0.219),境界IoU(0.234),最高評価スコア(0.244),最高性能を達成する。
しかしながら、最も稀な超薄層カテゴリーのパフォーマンスは、すべてのモデルで低いままであり、信頼性の高い超薄層セグメンテーションが依然としてオープンな課題であることを示している。
以上より, 早期RGB-Depth-Edge融合は, UAVナビゲーションにおける薄い障害物セグメンテーションのための実用的, モジュール的ベースラインとして位置づけられた。
関連論文リスト
- Amped: Adaptive Multi-stage Non-edge Pruning for Edge Detection [53.59823657644554]
エッジ検出のための適応型多段非エッジプルーニングフレームワーク(Amped)を提案する。
Ampedは高信頼の非エッジトークンを識別し、可能な限り早く削除し、計算を大幅に削減する。
既存のエッジ検出ネットワークの構造的複雑さを軽減するため,Streamline Edge Detector(SED)と呼ばれる,シンプルながら高性能なTransformerベースのモデルを導入する。
論文 参考訳(メタデータ) (2026-03-29T12:26:35Z) - Alternating Gradient Flow Utility: A Unified Metric for Structural Pruning and Dynamic Routing in Deep Networks [52.153950303594684]
交互勾配流(Alternating Gradient Flow, AGF)に着想を得た非結合型運動パラダイムを提案する。
AGFはネットワークの構造的「運動ユーティリティ」を正確にキャプチャする
我々は、AGFに誘導されるオフライン構造探索を、ゼロコストの物理プリミティブを介してオンライン実行から切り離すハイブリッドルーティングフレームワークを設計する。
論文 参考訳(メタデータ) (2026-03-12T18:19:21Z) - RTFDNet: Fusion-Decoupling for Robust RGB-T Segmentation [0.2578242050187029]
RGB-Thermal (RGB-T)セマンティックセマンティックセグメンテーションは、低照度環境で動作するロボットシステムに不可欠である。
伝統的なアプローチは、しばしばモダリティバランスを過度に強調し、センサー信号が部分的に欠如している場合に、頑丈さや厳しい性能が制限される。
論文 参考訳(メタデータ) (2026-03-10T03:40:26Z) - A Contrastive Fewshot RGBD Traversability Segmentation Framework for Indoor Robotic Navigation [0.7258309433541204]
純粋な視覚ベースのモデルは、しばしば椅子の脚のような薄い障害物を検出することができず、深刻な安全性のリスクを生じさせる。
RGB画像とスパース1Dレーザー深度情報を利用するマルチモーダルセグメンテーションフレームワークを提案する。
提案手法は, 最大9%のmIoUを1ショットおよび5ショット設定で達成する。
論文 参考訳(メタデータ) (2026-03-06T22:56:39Z) - Rule-Based Spatial Mixture-of-Experts U-Net for Explainable Edge Detection [0.0]
ルールベースの空間混合U-Netは、高性能深層学習と解釈可能な論理のギャップを埋める。
提案手法をBSDS500ベンチマークで評価し, 最適データセットスケール(ODS)Fスコア0.7628を達成した。
我々のモデルは、"Rule Firing Maps"と"Strategy Maps"を通じてピクセルレベルの説明可能性を提供する。
論文 参考訳(メタデータ) (2026-02-04T22:33:18Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff [26.566339984225756]
既存の有能なオブジェクト検出手法では、より深いネットワークが採用され、性能が向上する。
本稿では,U字形構造を3つの相補枝に分解することで,新しい3方向デコーダフレームワークを提案する。
提案手法は,5つのベンチマークにおいて効率と精度のバランスが良くなることを示す。
論文 参考訳(メタデータ) (2023-01-17T03:43:25Z) - Benchmarking the Robustness of LiDAR Semantic Segmentation Models [78.6597530416523]
本稿では,LiDARセマンティックセグメンテーションモデルのロバスト性を,様々な汚職の下で包括的に解析することを目的とする。
本稿では,悪天候,計測ノイズ,デバイス間不一致という3つのグループで16のドメイン外LiDAR破損を特徴とするSemanticKITTI-Cというベンチマークを提案する。
我々は、単純だが効果的な修正によってロバスト性を大幅に向上させるロバストLiDARセグメンテーションモデル(RLSeg)を設計する。
論文 参考訳(メタデータ) (2023-01-03T06:47:31Z) - Anchor-free Oriented Proposal Generator for Object Detection [59.54125119453818]
オブジェクト指向物体検出はリモートセンシング画像解釈において実用的で困難な課題である。
今日では、指向性検出器は主に水平方向の箱を中間体として使用し、それらから指向性のある箱を導出している。
本稿では,ネットワークアーキテクチャから水平ボックス関連操作を放棄する,AOPG(Anchor-free Oriented Proposal Generator)を提案する。
論文 参考訳(メタデータ) (2021-10-05T10:45:51Z) - BEFD: Boundary Enhancement and Feature Denoising for Vessel Segmentation [15.386077363312372]
セマンティックセグメンテーションにおける境界情報抽出のネットワーク機能を容易にするため,BEFD(Boundary Enhancement and Feature Denoising)モジュールを提案する。
ソベルエッジディテクタの導入により、ネットワークは追加のエッジを事前に取得できるため、医療画像セグメンテーションの監視されていない方法で境界を強化することができます。
論文 参考訳(メタデータ) (2021-04-08T13:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。