論文の概要: Autonomous FPV Flight with Translational Optical Flow and Uncertainty Mask
- arxiv url: http://arxiv.org/abs/2606.09088v1
- Date: Mon, 08 Jun 2026 06:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.76595
- Title: Autonomous FPV Flight with Translational Optical Flow and Uncertainty Mask
- Title(参考訳): トランスレーショナルオプティカルフローと不確かさマスクを用いた自律型FPV飛行
- Authors: Yang Deng, Yu Hu, Feng Yu, Linzuo Zhang, Danping Zou,
- Abstract要約: 本研究では,エゴモーション背景流からの障害物誘起光流を遠絡させ,低信号対雑音比に苦しむ方法を示す。
提案システムは、シミュレーションで最大13.91m/s、実世界のテストで11.79m/sの速度で堅牢な飛行を実現し、実際の30回の試験で93.3%の成功率を達成した。
- 参考スコア(独自算出の注目度): 21.625723699038897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous FPV quadrotor flight in complex environments using a monocular RGB camera as the sole exteroceptive sensor remains a fundamental challenge. Recent research has shown that using optical flow as the input of a neural network can achieve end-to-end autonomous flight in cluttered scenes. However, extracting the most relevant information from the flow estimation is the key bottleneck limiting agility and robustness. Existing methods struggle to disentangle obstacle-induced optical flow from the ego-motion background flow and suffer from low signal-to-noise ratios near the focus of expansion (FoE). To address these issues, we decompose the optical flow into translational and rotational components and utilize only the translational flow, which captures scene geometry and depth cues. In addition, we introduce an uncertainty mask derived from inconsistencies between forward and backward flow estimates. This mask highlights obstacle structures, including those within the FoE region. Both cues are fed to a control policy trained in a differentiable simulation framework, which enables efficient first-order optimization across perception and control. We validate our approach through extensive experiments in both simulated and real-world forest environments. The proposed system achieves robust flight at speeds of up to 13.91 m/s in simulation and 11.79 m/s in real-world tests, with a 93.3\% success rate over 30 real-world trials, nearly doubling the previously reported 6 m/s real-world speed of the monocular-RGB optical-flow UAV obstacle avoidance system.
- Abstract(参考訳): 単眼のRGBカメラを唯一の排ガスセンサーとして使用した複雑な環境での自律型FPV四極子飛行は、依然として根本的な課題である。
近年の研究では、ニューラルネットワークの入力として光学フローを使用することで、散らかったシーンでエンドツーエンドの自律飛行が可能になることが示されている。
しかし、フロー推定から最も関連性の高い情報を抽出することは、俊敏性と堅牢性を制限する重要なボトルネックである。
既存の手法では、エゴモーション背景の流れから障害物誘起光の流れを遠ざけ、拡張(FoE)の焦点付近で低信号対雑音比に悩まされている。
これらの問題に対処するために、光学流を翻訳・回転成分に分解し、シーン形状と深度をキャプチャする翻訳流のみを利用する。
さらに,前向きと後向きのフロー推定の不整合から導かれる不確実性マスクを導入する。
このマスクは、FoE領域を含む障害物構造をハイライトする。
どちらのキューも、識別可能なシミュレーションフレームワークでトレーニングされた制御ポリシーに供給され、知覚と制御を横断する効率的な一階最適化を可能にする。
我々は,シミュレートされた森林環境と実世界の森林環境の両方において,広範囲な実験を通じてアプローチを検証する。
提案システムは、実世界の実験で最大13.91m/s、実世界の実験で最大11.79m/sの速度でロバスト飛行を達成し、実世界の30回の試験で93.3\%の成功率を達成し、モノクロRGB光フローUAV障害物回避システムの6m/sの実世界の速度をほぼ倍増させた。
関連論文リスト
- RAFT-MSF++: Temporal Geometry-Motion Feature Fusion for Self-Supervised Monocular Scene Flow [51.43025173196566]
単眼のシーンフロー推定は画像列から高密度な3次元動きを復元することを目的としている。
RAFT-MSF++は,時間的特徴を融合して深度とシーンフローを推定する自己教師型マルチフレームフレームワークである。
実験の結果、RAFT-MSF++はKITTI Scene Flowベンチマークで24.14%のSF-allを達成した。
論文 参考訳(メタデータ) (2026-04-21T11:32:49Z) - PMA-Diffusion: A Physics-guided Mask-Aware Diffusion Framework for TSE from Sparse Observations [0.6918455480131249]
PMA-Diffusionは物理誘導型マスク認識拡散フレームワークである。
不完全な観測から未観測の高速道路の速度場を再構築する。
可視率の異なるI-24 MOTIONデータセットでテストされている。
論文 参考訳(メタデータ) (2025-12-05T22:05:01Z) - Multi-Modal Neural Radiance Field for Monocular Dense SLAM with a
Light-Weight ToF Sensor [58.305341034419136]
単眼カメラと軽量ToFセンサを備えた初の高密度SLAMシステムを提案する。
本稿では,RGBカメラと軽量ToFセンサの両方の信号のレンダリングをサポートするマルチモーダル暗黙のシーン表現を提案する。
実験により,本システムは軽量なToFセンサの信号をうまく利用し,競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-08-28T07:56:13Z) - Towards Anytime Optical Flow Estimation with Event Cameras [37.892840680923584]
イベントカメラはミリ秒レベルでの対数輝度の変化に反応し、光フロー推定に最適である。
既存のイベントカメラからのデータセットは、光学フローに対して低フレームレートの地上真実を提供するのみである。
本研究では,高フレームレートのイベント光流を生成するEVent-based Anytime Flow推定ネットワークであるEVA-Flowを提案する。
論文 参考訳(メタデータ) (2023-07-11T06:15:12Z) - Dense Optical Flow from Event Cameras [55.79329250951028]
本稿では,イベントカメラからの高密度光フロー推定に特徴相関と逐次処理を導入することを提案する。
提案手法は、高密度光流を計算し、MVSEC上での終点誤差を23%削減する。
論文 参考訳(メタデータ) (2021-08-24T07:39:08Z) - Unsupervised Motion Representation Enhanced Network for Action
Recognition [4.42249337449125]
連続するフレーム間の動きの表現は、ビデオの理解を大いに促進することが証明されている。
効果的な光フロー解決器であるTV-L1法は、抽出した光フローをキャッシュするために時間と費用がかかる。
UF-TSN(UF-TSN)は、軽量な非監視光フロー推定器を組み込んだ、エンドツーエンドのアクション認識手法です。
論文 参考訳(メタデータ) (2021-03-05T04:14:32Z) - Optical Flow Estimation from a Single Motion-blurred Image [66.2061278123057]
画像内の動きのぼかしは、基本的なコンピュータビジョンの問題に実用的な関心を持つ可能性があります。
本研究では,単一動画像からの光流れをエンドツーエンドで推定する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T12:45:18Z) - FAITH: Fast iterative half-plane focus of expansion estimation using
event-based optic flow [3.326320568999945]
本研究では, 小型航空機(MAV)の走行経路を決定するためのFAst ITerative Half-plane (FAITH)法を提案する。
その結果,提案手法の計算効率は高い精度を維持しながら最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-02-25T12:49:02Z) - FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation [97.99012124785177]
FLAVRは、3D空間時間の畳み込みを使用して、ビデオフレームのエンドツーエンドの学習と推論を可能にする柔軟で効率的なアーキテクチャです。
FLAVRは、アクション認識、光フロー推定、モーション拡大のための有用な自己解釈タスクとして役立つことを実証します。
論文 参考訳(メタデータ) (2020-12-15T18:59:30Z) - End-to-end Learning for Inter-Vehicle Distance and Relative Velocity
Estimation in ADAS with a Monocular Camera [81.66569124029313]
本稿では,ディープニューラルネットワークのエンドツーエンドトレーニングに基づくカメラによる車間距離と相対速度推定手法を提案する。
提案手法の重要な特徴は,2つの時間的単眼フレームによって提供される複数の視覚的手がかりの統合である。
また,移動場における視線歪みの影響を緩和する車両中心サンプリング機構を提案する。
論文 参考訳(メタデータ) (2020-06-07T08:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。