Fugu-MT 論文翻訳(概要): Finding Point with Image: A Simple and Efficient Method for UAV Self-Localization

論文の概要: Finding Point with Image: A Simple and Efficient Method for UAV Self-Localization

arxiv url: http://arxiv.org/abs/2208.06561v2
Date: Tue, 5 Dec 2023 06:18:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-06 20:41:46.118750
Title: Finding Point with Image: A Simple and Efficient Method for UAV Self-Localization
Title（参考訳）: 画像によるポイント発見:UAV自己ローカライゼーションの簡便かつ効率的な方法
Authors: Ming Dai, Enhui Zheng, Zhenhua Feng, Jiahao Chen, Wankou Yang
Abstract要約: 本稿では、画像を用いたFindering Point with Image(FPI)というエンドツーエンドの位置決めフレームワークを提案する。 FPIは、UAVビュー画像を介して、衛星ビュー画像中のUAVの対応する位置を直接識別することを目的としている。本フレームワークの実用性を検証するため,UAVと衛星ビューからなるUL14というペアデータセットを構築した。
参考スコア（独自算出の注目度）: 21.187322738122113
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Image retrieval has emerged as a prominent solution for the self-localization task of unmanned aerial vehicles (UAVs). However, this approach involves complicated pre-processing and post-processing operations, placing significant demands on both computational and storage resources. To mitigate this issue, this paper presents an end-to-end positioning framework, namely Finding Point with Image (FPI), which aims to directly identify the corresponding location of a UAV in satellite-view images via a UAV-view image. To validate the practicality of our framework, we construct a paired dataset, namely UL14, that consists of UAV and satellite views. In addition, we establish two transformer-based baseline models, Post Fusion and Mix Fusion, for end-to-end training and inference. Through experiments, we can conclude that fusion in the backbone network can achieve better performance than later fusion. Furthermore, considering the singleness of paired images, Random Scale Crop (RSC) is proposed to enrich the diversity of the paired data. Also, the ratio and weight of positive and negative samples play a key role in model convergence. Therefore, we conducted experimental verification and proposed a Weight Balance Loss (WBL) to weigh the impact of positive and negative samples. Last, our proposed baseline based on Mix Fusion structure exhibits superior performance in time and storage efficiency, amounting to just 1/24 and 1/68, respectively, while delivering comparable or even superior performance compared to the image retrieval method. The dataset and code will be made publicly available.
Abstract（参考訳）: 画像検索は無人航空機(UAV)の自己ローカライゼーションタスクの顕著な解決策として浮上している。しかし、このアプローチは複雑な前処理と後処理を伴い、計算資源とストレージ資源の両方にかなりの要求を課す。本報告では,衛星画像におけるUAVの対応する位置を,UAVビュー画像を介して直接識別することを目的とした,画像付きポイント(FPI)のエンドツーエンド位置決めフレームワークを提案する。本フレームワークの実用性を検証するため,UAVと衛星ビューからなるUL14というペアデータセットを構築した。さらに、エンドツーエンドのトレーニングと推論のための2つのトランスフォーマーベースベースラインモデル、Post FusionとMix Fusionを構築した。実験により、バックボーンネットワークにおける融合は、後続の融合よりも優れた性能が得られると結論付けることができる。さらに、ペア画像の単一性を考慮して、ペアデータの多様性を高めるためにランダムスケールクロップ(RSC)を提案する。また、正と負のサンプルの比率と重み付けはモデル収束において重要な役割を果たす。そこで本研究では, 正および負の試料の影響を評価するために, 重量バランス損失 (WBL) を実験的に検証し, 提案した。最後に,Mix Fusion 構造をベースとしたベースラインは,画像検索法と同等あるいはそれ以上の性能を達成しつつ,それぞれ1/24 と 1/68 に留まり,時間と記憶効率に優れた性能を示す。データセットとコードは公開される予定だ。

関連論文リスト

Semi-distributed Cross-modal Air-Ground Relative Localization [11.828259485114598]
ロボット相対的ローカライゼーションの現在のアプローチは、分散マルチロボットSLAMシステムという形で主に実現されている。我々は、複数のセンサーを統合するために、無人地上車両(UGV)の容量を十分に活用する。この研究において、UGVと無人航空機(UAV)は独立してSLAMを行い、深層学習に基づくキーポイントとグローバルディスクリプタを抽出した。
論文参考訳（メタデータ） (2025-11-10T06:28:31Z)
Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文参考訳（メタデータ） (2025-10-16T03:37:16Z)
Echo: Decoupling Inference and Training for Large-Scale RL Alignment on Heterogeneous Swarms [4.127488674019288]
大規模言語モデルのポストトレーニングは、同じGPUクラスタ上でトラジェクトリサンプリングとポリシ最適化を併用する。ヘテロジニアスな"推論"と"トレーニング"スワムにまたがって、これらの2つのフェーズをきれいに分離するRLシステムであるEchoを紹介します。
論文参考訳（メタデータ） (2025-08-07T13:37:04Z)
Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文参考訳（メタデータ） (2025-07-14T16:19:00Z)
StreamRL: Scalable, Heterogeneous, and Elastic RL for LLMs with Disaggregated Stream Generation [55.75008325187133]
強化学習(RL)は,大規模言語モデル(LLM)の学習後のコアとなる。 StreamRLは、最初の原則から分離して、2種類のパフォーマンスボトルネックに対処するように設計されている。実験により、StreamRLは既存の最先端システムと比較してスループットを最大2.66倍改善することが示された。
論文参考訳（メタデータ） (2025-04-22T14:19:06Z)
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model [8.720833232645155]
Bird's-Eye-View (BEV) 画像は、自動運転において最も広く採用されているデータ表現の1つである。ポーズの条件生成としてLiDAR局所化を定式化する新しいフレームワークであるBEVDiffLocを提案する。
論文参考訳（メタデータ） (2025-03-14T13:17:43Z)
Provably Efficient Online RLHF with One-Pass Reward Modeling [59.30310692855397]
本稿では,過去のデータを保存する必要がなく,一定時間で計算できるワンパス報酬モデリング手法を提案する。提案手法は,統計的および計算効率の両面で向上することを示す理論的保証を提供する。我々はUltrafeedback-binarizedおよびMixture2データセット上でLlama-3-8B-InstructとQwen2.5-7B-Instructモデルを用いて実験を行った。
論文参考訳（メタデータ） (2025-02-11T02:36:01Z)
Fast-Convergent and Communication-Alleviated Heterogeneous Hierarchical Federated Learning in Autonomous Driving [29.646749372031593]
ストリートシーンのセマンティック理解(TriSU)は、自動運転(AD)の複雑なタスクである特定の地理的領域のデータからトレーニングされた推論モデルは、都市間データドメインシフトによって他の領域に適用された場合、一般化が不十分である。 Hierarchical Federated Learning (HFL)は、異なる都市の分散データセット上での協調的なプライバシ保存トレーニングによって、TriSUモデルの一般化を改善する潜在的なソリューションを提供する。
論文参考訳（メタデータ） (2024-09-29T05:27:40Z)
A Distribution-Aware Flow-Matching for Generating Unstructured Data for Few-Shot Reinforcement Learning [1.0709300917082865]
数発の強化学習のための合成非構造化データを生成するための分布認識フローマッチング手法を提案する。我々のアプローチは、オーバーフィッティングやデータ相関など、従来のモデルベースRLにおける重要な課題に対処する。提案手法は,初期タイムスタンプのフレームレートを30%向上させながら,最大Q値で安定した収束を実現することを示す。
論文参考訳（メタデータ） (2024-09-21T15:50:59Z)
DANCE: Dual-View Distribution Alignment for Dataset Condensation [39.08022095906364]
我々は、データセットのコンディエンテーション(DANCE)のためのDMベースの新しいDual-view Distribution AligNmentを提案する。具体的には、内部クラスの観点から複数の「中間エンコーダ」を構築し、擬似的な長期分布アライメントを行う。クラス間の観点からは,分布キャリブレーションを行うために専門家モデルを用いる。
論文参考訳（メタデータ） (2024-06-03T07:22:17Z)
Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文参考訳（メタデータ） (2023-07-19T04:07:33Z)
Learning Better with Less: Effective Augmentation for Sample-Efficient Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文参考訳（メタデータ） (2023-05-25T15:46:20Z)
Train a Real-world Local Path Planner in One Hour via Partially Decoupled Reinforcement Learning and Vectorized Diversity [8.068886870457561]
深層強化学習(DRL)は局所経路計画(LPP)問題の解決に有効である。実世界におけるそのような応用は、DRLの訓練効率と一般化能力の不足により、非常に制限されている。アクター・シャーラーラーナー(ASL)トレーニングフレームワークと移動ロボット指向シミュレータSparrowで構成されたColorというソリューションが提案されている。
論文参考訳（メタデータ） (2023-05-07T03:39:31Z)
Parallel Augmentation and Dual Enhancement for Occluded Person Re-identification [70.96277129480478]
被占領者の再識別(Re-ID)はここ数十年で多くの注目を集めている。近年のアプローチは、隠蔽データの性能向上に重点を置いている。 PADE(Parallel Augmentation and Dual Enhancement)を用いた簡易かつ効果的な手法を提案する。提案手法の有効性を検証するために, 広く使用されている3つの隠蔽データセットと2つの非隠蔽データセットの実験結果を得た。
論文参考訳（メタデータ） (2022-10-11T13:29:38Z)
Enhancing Generative Networks for Chest Anomaly Localization through Automatic Registration-Based Unpaired-to-Pseudo-Paired Training Data Translation [4.562196564569076]
胸部X線画像(AL-CXR)におけるGAN-ITは異常領域の正確な位置決め法として有望である本稿では,登録とデータ拡張を含む2段階のGAN-ITを提案する。
論文参考訳（メタデータ） (2022-07-21T06:42:12Z)
Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文参考訳（メタデータ） (2022-06-11T18:03:26Z)
Auto-FedRL: Federated Hyperparameter Optimization for Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文参考訳（メタデータ） (2022-03-12T04:11:42Z)
DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文参考訳（メタデータ） (2020-10-02T13:59:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。