論文の概要: Empower Low-Altitude Economy: A Reliability-Aware Dynamic Weighting Allocation for Multi-modal UAV Beam Prediction
- arxiv url: http://arxiv.org/abs/2512.24324v1
- Date: Tue, 30 Dec 2025 16:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.426059
- Title: Empower Low-Altitude Economy: A Reliability-Aware Dynamic Weighting Allocation for Multi-modal UAV Beam Prediction
- Title(参考訳): エンパワー低高度経済:マルチモーダルUAVビーム予測のための信頼性を考慮した動的重み付け配置
- Authors: Haojin Li, Anbang Zhang, Chen Sun, Chenyuan Feng, Kaiqian Qu, Tony Q. S. Quek, Haijun Zhang,
- Abstract要約: 低高度経済(LAE)は、都市空気移動、ロジスティクスドローン、空中センシングによって急速に拡大している。
現在の研究は、シングルシグナルからマルチモーダルコラボレーティブアプローチにシフトしている。
セマンティック・アウェアなマルチモーダルビーム予測フレームワークSaM2Bに,信頼性を考慮した動的重み付け手法を提案する。
- 参考スコア(独自算出の注目度): 57.04985443535312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The low-altitude economy (LAE) is rapidly expanding driven by urban air mobility, logistics drones, and aerial sensing, while fast and accurate beam prediction in uncrewed aerial vehicles (UAVs) communications is crucial for achieving reliable connectivity. Current research is shifting from single-signal to multi-modal collaborative approaches. However, existing multi-modal methods mostly employ fixed or empirical weights, assuming equal reliability across modalities at any given moment. Indeed, the importance of different modalities fluctuates dramatically with UAV motion scenarios, and static weighting amplifies the negative impact of degraded modalities. Furthermore, modal mismatch and weak alignment further undermine cross-scenario generalization. To this end, we propose a reliability-aware dynamic weighting scheme applied to a semantic-aware multi-modal beam prediction framework, named SaM2B. Specifically, SaM2B leverages lightweight cues such as environmental visual, flight posture, and geospatial data to adaptively allocate contributions across modalities at different time points through reliability-aware dynamic weight updates. Moreover, by utilizing cross-modal contrastive learning, we align the "multi-source representation beam semantics" associated with specific beam information to a shared semantic space, thereby enhancing discriminative power and robustness under modal noise and distribution shifts. Experiments on real-world low-altitude UAV datasets show that SaM2B achieves more satisfactory results than baseline methods.
- Abstract(参考訳): 低高度経済(LAE)は、都市空力、ロジスティクスドローン、空中センシングによって急速に拡大している一方、無人航空機(UAV)通信における高速で正確なビーム予測は、信頼性の高い接続を実現するために不可欠である。
現在の研究は、シングルシグナルからマルチモーダルコラボレーティブアプローチにシフトしている。
しかし、既存のマルチモーダル法は主に固定的あるいは経験的重みを使い、任意の瞬間においてモダリティにわたって等しい信頼性を仮定する。
実際、異なるモダリティの重要性はUAV運動シナリオによって劇的に変動し、静的重み付けは劣化したモダリティの負の影響を増幅する。
さらに、モダルミスマッチと弱いアライメントは、クロスシナリオの一般化をさらに損なう。
そこで本研究では,Sam2B という名称のセマンティックアウェアなマルチモーダルビーム予測フレームワークに適用した信頼性を考慮した動的重み付け手法を提案する。
具体的には、Sam2Bは、環境視覚、飛行姿勢、地理空間データなどの軽量なキューを活用し、信頼性を意識した動的重み更新を通じて、異なる時点におけるモダリティ間のコントリビューションを適応的に割り当てる。
さらに,クロスモーダルコントラスト学習を利用して,特定のビーム情報に関連する「マルチソース表現ビームセマンティクス」を共有セマンティクス空間に整列し,モーダルノイズや分布シフトの下での識別力とロバスト性を向上する。
実世界の低高度UAVデータセットの実験により、SaM2Bはベースライン法よりも良好な結果が得られることが示された。
関連論文リスト
- Learning Multi-Modal Mobility Dynamics for Generalized Next Location Recommendation [51.00494428978262]
位置推薦タスクの移動力学を特徴付けるために,マルチモーダルな時空間知識を利用する。
まず、マルチモーダル表現のための統合時空間関係グラフ(STRG)を構築する。
第二に、異なるモーダルの空間時間グラフ表現を融合するゲーティング機構を設計する。
論文 参考訳(メタデータ) (2025-12-27T14:23:04Z) - Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.4812458793128]
動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。
我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文 参考訳(メタデータ) (2025-12-02T14:42:54Z) - Multimodal Mixture-of-Experts for ISAC in Low-Altitude Wireless Networks [33.986844210423996]
低高度無線ネットワーク(LAWN)におけるISAC(Integrated Sensration and Communication)の意義
LAWNにおけるマルチモーダルISACのためのMix-of-experts(MoE)フレームワークを提案する。
航空プラットフォームにおける制約付きエネルギー制約下でのスケーラビリティ向上のために,専門家のサブセットのみを選択的に活性化するスパースMOE変異体を開発した。
論文 参考訳(メタデータ) (2025-12-01T14:53:29Z) - A Tri-Modal Dataset and a Baseline System for Tracking Unmanned Aerial Vehicles [74.8162337823142]
MM-UAVはMulti-Modal UAV Trackingの最初の大規模ベンチマークである。
データセットは30以上の挑戦的なシナリオにまたがっており、1,321の同期マルチモーダルシーケンスと280万以上の注釈付きフレームがある。
データセットを伴って、我々は新しいマルチモーダルマルチUAV追跡フレームワークを提供する。
論文 参考訳(メタデータ) (2025-11-23T08:42:17Z) - Multimodal Trajectory Representation Learning for Travel Time Estimation [15.25848441558445]
本稿では,Multimodal Dynamic Trajectory Integrationフレームワークを紹介する。
GPSシーケンス、グリッドトラジェクトリ、道路ネットワークの制約を統合して、TTEの精度を向上させる。
3つの実世界のデータセットの実験において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-10-07T12:04:16Z) - MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings [75.0617088717528]
MoCaは、トレーニング済みのVLMバックボーンを効果的な双方向埋め込みモデルに変換するためのフレームワークである。
MoCaは、MMEBとViDoRe-v2ベンチマークのパフォーマンスを継続的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-06-29T06:41:00Z) - Learning to Fuse: Modality-Aware Adaptive Scheduling for Robust Multimodal Foundation Models [0.0]
モーダリティ・アウェア・アダプティブ・フュージョン・スケジューリング(MA-AFS)は、各モーダリティの寄与をインスタンス単位で動的に調節することを学ぶ。
本研究は, 適応融合の重要性を強調し, 信頼性と不確実性を考慮したマルチモーダル学習に向けた有望な方向性を開く。
論文 参考訳(メタデータ) (2025-06-15T05:57:45Z) - Asymmetric Reinforcing against Multi-modal Representation Bias [59.685072206359855]
マルチモーダル表現バイアス(ARM)に対する非対称強化法を提案する。
我々のARMは、条件付き相互情報を通じて支配的なモダリティを表現する能力を維持しながら、弱いモダリティを動的に強化する。
我々はマルチモーダル学習の性能を著しく改善し、不均衡なマルチモーダル学習の軽減に顕著な進展をもたらした。
論文 参考訳(メタデータ) (2025-01-02T13:00:06Z) - Improving Autonomous Separation Assurance through Distributed
Reinforcement Learning with Attention Networks [0.0]
本稿では,AAM廊下内で自律的な自己分離機能を実現するための強化学習フレームワークを提案する。
この問題はマルコフ決定プロセス(Markov Decision Process)として定式化され、サンプル効率の良いオフポリティ・ソフトアクター・クリティック(SAC)アルゴリズムへの新たな拡張を開発することで解決される。
包括的数値計算により,提案手法は高密度・動的環境下で航空機の安全かつ効率的な分離を保証できることが示唆された。
論文 参考訳(メタデータ) (2023-08-09T13:44:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。