論文の概要: SkySeg: Collaborative Onboard Semantic Segmentation with Heterogeneous UAVs in the Wild
- arxiv url: http://arxiv.org/abs/2605.24014v1
- Date: Wed, 20 May 2026 03:10:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.534398
- Title: SkySeg: Collaborative Onboard Semantic Segmentation with Heterogeneous UAVs in the Wild
- Title(参考訳): SkySeg: 野生での不均質なUAVとセマンティックセマンティックセマンティックセグメンテーション
- Authors: Anqi Lu, Yun Cheng, Youbing Hu, Zhiqiang Cao, Jie Liu, Zhijun Li,
- Abstract要約: 低コストセンサを用いたセマンティックセマンティックセグメンテーションを実現するために, 異種マルチUAV空対空協調フレームワークSkySegを紹介する。
実験の結果,SkySegフレームワークは推論遅延を約3.6倍加速し,セグメンテーション精度を5.91%向上し,平均精度が10.91%向上した。
- 参考スコア(独自算出の注目度): 13.78779735589176
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The demand for unmanned aerial vehicle (UAV)-based image acquisition and analysis has surged, with UAVs increasingly utilized for semantic segmentation tasks. To meet the real-time analysis requirements of UAV remote sensing missions, performing onboard computation and making decisions based on the results is a natural approach. However, deploying semantic segmentation on resource-constrained UAV platforms presents two significant challenges: 1) hardware constraints limit the ability of UAVs to perform real-time semantic segmentation, and 2) environmental variations during flight cause data distribution shifts, deviating from the original training data. To address these issues, this paper introduces SkySeg, a heterogeneous multi-UAV air-air cooperation framework that integrates computer vision and flight pattern to enable onboard semantic segmentation using low-cost sensors. SkySeg employs an efficient information fusion inference method, combining low-definition, wide-area images with high-definition, focused-area images. Additionally, it incorporates a cross-device test-time adaptation (TTA) strategy to enhance segmentation performance in dynamic environments by collaboratively addressing distribution shifts of test data streams across UAVs. Experimental results demonstrate that our SkySeg framework accelerates inference latency by approximately 3.6x, improves onboard segmentation accuracy by 5.91\%, and achieves a 10.91\% average accuracy gain in the wild.
- Abstract(参考訳): 無人航空機(UAV)による画像取得と分析の需要は急増しており、UAVは意味的セグメンテーションのタスクにますます活用されている。
UAVリモートセンシングミッションのリアルタイム解析要求を満たすために、オンボード計算を行い、結果に基づいて意思決定を行うことは自然なアプローチである。
しかし、リソース制約のあるUAVプラットフォームにセマンティックセグメンテーションを配置することは、2つの重要な課題を提示する。
1) ハードウェア制約は、UAVがリアルタイムセマンティックセグメンテーションを行う能力を制限し、
2) 飛行時の環境変動は, 当初の訓練データから逸脱した。
このような問題に対処するために,SkySegは,コンピュータビジョンと飛行パターンを統合した,低コストなセンサを用いたセマンティックセマンティックセマンティクスを可能にする,異種多UAV空対空協調フレームワークである。
SkySegは、高解像度の広領域画像と高解像度の焦点領域画像を組み合わせた効率的な情報融合推定手法を採用している。
さらに、UAV間のテストデータストリームの分散シフトに協調して対処することで、動的環境におけるセグメンテーション性能を向上させるためのデバイス間テスト時間適応(TTA)戦略も組み込まれている。
実験の結果,SkySegフレームワークは推論遅延を約3.6倍に加速し,セグメンテーション精度を5.91倍に向上し,平均精度を10.91倍に向上した。
関連論文リスト
- Leveraging Large Vision Model for Multi-UAV Co-perception in Low-Altitude Wireless Networks [51.323657802729535]
多様な低高度経済応用のための有望なパラダイムとして、UAV(Multi-Uncrewed Aero Vehicle)協調認識が出現している。
本稿では,BHU(Base-Station-Helped UAV)と呼ばれるコミュニケーション効率の良い協調認識フレームワークを提案する。
我々は、UAVキャプチャされたRGB画像から最も情報性の高い画素を識別するためにTop-K選択機構を使用し、データボリュームと遅延を低減したスペーサー化された視覚伝達を可能にする。
論文 参考訳(メタデータ) (2026-03-13T17:49:28Z) - STVG-R1: Incentivizing Instance-Level Reasoning and Grounding in Videos via Reinforcement Learning [65.36458157092207]
視覚言語モデル(VLM)では、テキスト記述と視覚座標のミスアライメントはしばしば幻覚を引き起こす。
本稿では,座標の調整が難しい問題を回避するために,新しい視覚的プロンプトパラダイムを提案する。
本稿では,STVGの最初の強化学習フレームワークであるSTVG-R1を紹介する。
論文 参考訳(メタデータ) (2026-02-12T08:53:32Z) - AdaptFly: Prompt-Guided Adaptation of Foundation Models for Low-Altitude UAV Networks [10.80018338292861]
低高度無人航空機(UAV)ネットワークは、分散センシング・通信制御協調設計の基盤として、ロバストなセマンティックセグメンテーションに依存している。
本稿では,重み更新なしでセグメンテーションモデルを調整する,プロンプト誘導型テスト時間適応フレームワークAdaptFlyを提案する。
UAVidとVDDベンチマークの実験は、様々な気象条件下での実際のUAV展開と共に、AdaptFlyがセグメンテーション精度とロバスト性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-11-13T00:20:37Z) - Trajectory Design for UAV-Based Low-Altitude Wireless Networks in Unknown Environments: A Digital Twin-Assisted TD3 Approach [62.11847362756054]
低高度無線ネットワーク(LAWN)のキーイネーブラーとして無人航空機(UAV)が登場している
我々は、デジタルツイン(DT)支援トレーニングおよびデプロイメントフレームワークを提案する。
このフレームワークでは、UAVは統合されたセンシングと通信信号を送信し、地上ユーザーに通信サービスを提供し、同時にDTサーバにアップロードされたエコーを収集して、仮想環境(VE)を段階的に構築する。
これらのVEはモデルトレーニングを加速し、展開中のリアルタイムUAVセンシングデータを継続的に更新し、意思決定をサポートし、飛行安全性を向上する。
論文 参考訳(メタデータ) (2025-10-28T10:05:53Z) - MobileGeo: Exploring Hierarchical Knowledge Distillation for Resource-Efficient Cross-view Drone Geo-Localization [47.16612614191333]
クロスビューなジオローカライゼーションにより、航空画像とジオタグ付き衛星データベースとのマッチングによるドローンのローカライゼーションが可能になる。
MobileGeoは、デバイス上の効率的なCVGL用に設計されたモバイルフレンドリーなフレームワークである。
MobileGeoはNVIDIA AGX Orinエッジデバイス上で251.5FPSで動作する。
論文 参考訳(メタデータ) (2025-10-26T08:47:20Z) - A Transformer-Based Conditional GAN with Multiple Instance Learning for UAV Signal Detection and Classification [17.586093539522327]
本稿では,トランスフォーマーをベースとしたGAN(Generative Adversarial Network)とMILET(Multiple Examplely Explainable Learning)を統合した新しいフレームワークを提案する。
実験の結果,DroneDetectデータセットでは96.5%,DroneRFデータセットでは98.6%の精度が得られた。
このフレームワークはまた、様々なUAVプラットフォームと飛行状態にまたがる強力な計算効率と堅牢な一般化を示す。
論文 参考訳(メタデータ) (2025-07-19T12:35:45Z) - Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark [15.405137983083875]
航空と地上の協力は、UAVの空中視界と地上の車両の局部的な観測を統合することで、有望な解決策を提供する。
本稿では,3つの重要な貢献を通じて,地上3次元協調認識のための包括的ソリューションを提案する。
論文 参考訳(メタデータ) (2025-03-10T07:00:07Z) - Semantic Segmentation of Unmanned Aerial Vehicle Remote Sensing Images using SegFormer [0.14999444543328289]
本稿では,UAV画像のセマンティックセグメンテーションのためのセマンティックセグメンテーションフレームワークであるSegFormerの有効性と効率を評価する。
SegFormerの変種は、リアルタイム(B0)から高性能(B5)モデルまで、セマンティックセグメンテーションタスクに適したUAVidデータセットを使用して評価される。
実験結果は、モデルの性能をベンチマークデータセットで示し、多様なUAVシナリオにおけるオブジェクトとランドカバーの特徴を正確に記述する能力を強調した。
論文 参考訳(メタデータ) (2024-10-01T21:40:15Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Integrated Sensing, Computation, and Communication for UAV-assisted
Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。
無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文 参考訳(メタデータ) (2023-06-05T16:01:33Z) - Adaptive Path Planning for UAVs for Multi-Resolution Semantic
Segmentation [28.104584236205405]
重要な課題は、大規模な環境で取得したデータの価値を最大化するミッションを計画することである。
これは例えば、農地のモニタリングに関係している。
本稿では,UAV経路に適応して高精細なセマンティックセマンティックセマンティクスを得るオンライン計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-03T11:03:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。