論文の概要: Efficient Self-Supervised Neuro-Analytic Visual Servoing for Real-time Quadrotor Control
- arxiv url: http://arxiv.org/abs/2507.19878v1
- Date: Sat, 26 Jul 2025 09:17:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.36544
- Title: Efficient Self-Supervised Neuro-Analytic Visual Servoing for Real-time Quadrotor Control
- Title(参考訳): リアルタイムクアドロレータ制御のための高能率自己監督型神経分析型ビジュアルサーボ
- Authors: Sebastian Mocanu, Sebastian-Ion Nae, Mihai-Eugen Barbu, Marius Leordeanu,
- Abstract要約: この研究は、教師による神経分析、コスト効率、視覚ベースの四元数制御モデルを導入し、小さな1.7MパラメーターのConvNetが分析教師から自動的に学習する。
視覚のみの自己教師型神経分析制御は、明示的な幾何学的モデルやフィデューシャルマーカーを必要とせず、四面体方向と運動を可能にする。
- 参考スコア(独自算出の注目度): 7.791675745811072
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work introduces a self-supervised neuro-analytical, cost efficient, model for visual-based quadrotor control in which a small 1.7M parameters student ConvNet learns automatically from an analytical teacher, an improved image-based visual servoing (IBVS) controller. Our IBVS system solves numerical instabilities by reducing the classical visual servoing equations and enabling efficient stable image feature detection. Through knowledge distillation, the student model achieves 11x faster inference compared to the teacher IBVS pipeline, while demonstrating similar control accuracy at a significantly lower computational and memory cost. Our vision-only self-supervised neuro-analytic control, enables quadrotor orientation and movement without requiring explicit geometric models or fiducial markers. The proposed methodology leverages simulation-to-reality transfer learning and is validated on a small drone platform in GPS-denied indoor environments. Our key contributions include: (1) an analytical IBVS teacher that solves numerical instabilities inherent in classical approaches, (2) a two-stage segmentation pipeline combining YOLOv11 with a U-Net-based mask splitter for robust anterior-posterior vehicle segmentation to correctly estimate the orientation of the target, and (3) an efficient knowledge distillation dual-path system, which transfers geometric visual servoing capabilities from the analytical IBVS teacher to a compact and small student neural network that outperforms the teacher, while being suitable for real-time onboard deployment.
- Abstract(参考訳): 本研究は,1.7Mの小さなパラメーターを持つConvNetが分析教師から自動的に学習し,画像ベースの視覚サーボ(IBVS)制御を改良した,自己教師型神経分析・費用効率モデルを導入する。
IBVSシステムは,古典的視覚サーボ方程式を減らし,効率的な画像特徴検出を可能にすることで,数値的不安定を解消する。
知識蒸留により、学生モデルは教師のIBVSパイプラインに比べて11倍高速な推論を実現し、同様の制御精度を計算コストとメモリコストで明らかにした。
視覚のみの自己教師型神経分析制御は、明示的な幾何学的モデルやフィデューシャルマーカーを必要とせず、四面体方向と運動を可能にする。
提案手法はシミュレーションから現実への移行学習を活用し,GPSを用いた屋内環境における小型ドローンプラットフォーム上で検証する。
主な貢献は,(1)古典的アプローチに固有の数値的不安定性を解決する解析的IBVS教師,(2) YOLOv11とU-Netベースのマスク分割器を併用して目標の向きを正確に推定する2段階分割パイプライン,(3) 分析的IBVS教師から,実時間での配備に適した小型・小型の学生ニューラルネットワークへ,幾何学的視覚サーボ機能を伝達する効率的な知識蒸留デュアルパスシステムである。
関連論文リスト
- Advancing from Automated to Autonomous Beamline by Leveraging Computer Vision [16.747469612768917]
現在の最先端のシンクロトロンビームは、人間の安全の監視に大きく依存している。
リアルタイム衝突検出のためのディープラーニングとマルチビューカメラを統合したコンピュータビジョンに基づくシステムを提案する。
実ビームラインデータセットの実験では、高精度、リアルタイムな性能、そして自律的なシンクロトロンビームライン操作の強いポテンシャルが示される。
論文 参考訳(メタデータ) (2025-06-01T04:53:55Z) - Inverse RL Scene Dynamics Learning for Nonlinear Predictive Control in Autonomous Vehicles [0.0]
本稿では,自律ナビゲーションのための深層学習に基づくScene Dynamics(DL-NMPC-SD)手法を提案する。
DL-NMPC-SDは、時間範囲センシング情報から学習したシーンダイナミクスモデルと組み合わせて、アプリオリ名車モデルを使用する。
論文 参考訳(メタデータ) (2025-04-02T03:46:37Z) - LEGO-Motion: Learning-Enhanced Grids with Occupancy Instance Modeling for Class-Agnostic Motion Prediction [12.071846486955627]
本稿ではLEGO-Motionという,クラスに依存しない動作予測タスクのための新しい占有状況モデリングフレームワークを提案する。
本モデルは,(1)BEVエンコーダ,(2)Interaction-Augmented Instance,(3)インスタンス強化型BEVからなる。
提案手法は最先端の性能を達成し,既存手法より優れている。
論文 参考訳(メタデータ) (2025-03-10T14:26:21Z) - An Interpretable Neural Control Network with Adaptable Online Learning for Sample Efficient Robot Locomotion Learning [7.6119527195998]
シーケンシャル・モーション・エクゼクタ(Sequential Motion Executor, SME)は、3層の解釈可能なニューラルネットワークである。
Adaptable Gradient-weighting Online Learning (AGOL)アルゴリズムは、関連性の高いスコアを持つパラメータの更新を優先する。
SME-AGOLはサンプルを40%減らし、シミュレートされた六足歩行ロボットで最終報酬/移動性能が150%向上する。
論文 参考訳(メタデータ) (2025-01-18T08:37:33Z) - TraceVLA: Visual Trace Prompting Enhances Spatial-Temporal Awareness for Generalist Robotic Policies [95.30717188630432]
VLAモデルの行動予測のための時空間認識を容易にするために,視覚的トレースプロンプトを導入する。
我々は,これまでに収集した150Kロボット操作トラジェクトリのデータセットに基づいてOpenVLAを微調整し,新しいTraceVLAモデルを開発した。
4B Phi-3-Vision に基づくコンパクトな VLA モデルを提案する。
論文 参考訳(メタデータ) (2024-12-13T18:40:51Z) - CARE Transformer: Mobile-Friendly Linear Visual Transformer via Decoupled Dual Interaction [77.8576094863446]
本稿では,新しいdetextbfCoupled dutextbfAl-interactive lineatextbfR atttextbfEntion (CARE) 機構を提案する。
まず,非対称な特徴分離戦略を提案し,非対称的に学習プロセスを局所帰納バイアスと長距離依存に分解する。
分離学習方式を採用し,特徴間の相補性を完全に活用することにより,高い効率性と精度を両立させることができる。
論文 参考訳(メタデータ) (2024-11-25T07:56:13Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Model-free tracking control of complex dynamical trajectories with
machine learning [0.2356141385409842]
我々は,2腕ロボットマニピュレータを制御するモデルフリーの機械学習フレームワークを開発した。
様々な周期的信号とカオス的信号を用いた制御フレームワークの有効性を示す。
論文 参考訳(メタデータ) (2023-09-20T17:10:10Z) - A Light-weight Deep Learning Model for Remote Sensing Image
Classification [70.66164876551674]
リモートセンシング画像分類(RSIC)のための高性能で軽量なディープラーニングモデルを提案する。
NWPU-RESISC45ベンチマークで広範な実験を行うことで、提案した教師学生モデルは最先端システムより優れている。
論文 参考訳(メタデータ) (2023-02-25T09:02:01Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。