論文の概要: Online Bayesian Meta-Learning for Cognitive Tracking Radar
- arxiv url: http://arxiv.org/abs/2207.06917v1
- Date: Thu, 7 Jul 2022 20:21:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-17 17:38:01.407274
- Title: Online Bayesian Meta-Learning for Cognitive Tracking Radar
- Title(参考訳): 認知トラッキングレーダのためのオンラインベイズメタラーニング
- Authors: Charles E. Thornton, R. Michael Buehrer, Anthony F. Martone
- Abstract要約: 波形・アジャイル追跡のためのオンラインメタラーニング手法を開発した。
我々は、ターゲットタイプやクラッタなどの一般的な物理要素に起因する、トラッキングシーン間の固有の類似性を生かしている。
- 参考スコア(独自算出の注目度): 9.805913930878
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: A key component of cognitive radar is the ability to generalize, or achieve
consistent performance across a broad class of sensing environments, since
aspects of the physical scene may vary over time. This presents a challenge for
learning-based waveform selection approaches, since transmission policies which
are effective in one scene may be highly suboptimal in another. One way to
address this problem is to bias a learning algorithm strategically by
exploiting high-level structure across tracking instances, referred to as
meta-learning. In this work, we develop an online meta-learning approach for
waveform-agile tracking. This approach uses information gained from previous
target tracks to speed up and enhance learning in new tracking instances. This
results in sample-efficient learning across a class of finite state target
channels by exploiting inherent similarity across tracking scenes, attributed
to common physical elements such as target type or clutter. We formulate the
online waveform selection problem in the framework of Bayesian learning, and
provide prior-dependent performance bounds for the meta-learning problem using
PAC-Bayes theory. We present a computationally feasible posterior sampling
algorithm and study the performance in a simulation study consisting of diverse
scenes. Finally, we examine the potential performance benefits and practical
challenges associated with online meta-learning for waveform-agile tracking.
- Abstract(参考訳): cognitive radarの重要なコンポーネントは、物理的なシーンの側面が時間とともに変化する可能性があるため、幅広い種類のセンシング環境にわたって一貫したパフォーマンスを一般化し、達成する能力である。
これは、あるシーンで有効な伝達ポリシーが他のシーンでは非常に最適である可能性があるため、学習に基づく波形選択アプローチへの挑戦を示す。
この問題に対処する1つの方法は、メタラーニングと呼ばれるトラッキングインスタンスにまたがる高レベルの構造を利用して、学習アルゴリズムを戦略的にバイアスすることである。
本研究では,ウェーブフォーム・アジャイル・トラッキングのためのオンラインメタ学習手法を開発する。
このアプローチでは、以前のターゲットトラックから得た情報を使用して、新しいトラッキングインスタンスでの学習をスピードアップし、強化する。
これにより、追跡シーン間の固有の類似性を利用して、有限状態ターゲットチャネルのクラスを横断するサンプル効率の高い学習が可能になる。
我々はベイズ学習の枠組みにおけるオンライン波形選択問題を定式化し、PAC-Bayes理論を用いたメタラーニング問題に対する事前依存性能境界を提供する。
本研究では,様々なシーンからなるシミュレーション研究において,計算可能な後続サンプリングアルゴリズムを提案し,その性能について検討する。
最後に、ウェーブフォーム・アジャイル・トラッキングにおけるオンラインメタラーニングに関連する潜在的なパフォーマンス上の利点と実践的課題について検討する。
関連論文リスト
- Online waveform selection for cognitive radar [8.187445866881637]
オンライン方式で波形パラメータを選択する適応アルゴリズムを提案する。
本稿では,帯域幅のスケーリング,Qラーニング,Qラーニングのルックアヘッドという3つの強化学習アルゴリズムを提案する。
提案アルゴリズムは、目標を失わずにレンジ誤差を最小化し、連続的な追跡を維持するという2つの目的を達成する。
論文 参考訳(メタデータ) (2024-10-14T15:01:41Z) - Causality-Aware Transformer Networks for Robotic Navigation [13.719643934968367]
Visual Navigationの現在の研究は、改善の機会を明らかにしている。
RNNとTransformerの直接的な採用はしばしば、Embodied AIと従来のシーケンシャルなデータモデリングの具体的な違いを見落としている。
因果理解モジュールを特徴とするナビゲーション用因果認識変換器(CAT)ネットワークを提案する。
論文 参考訳(メタデータ) (2024-09-04T12:53:26Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Meta-learning the Learning Trends Shared Across Tasks [123.10294801296926]
グラディエントベースのメタ学習アルゴリズムは、限られたデータで新しいタスクに素早く適応する。
既存のメタ学習アプローチは、適応中の現在のタスク情報にのみ依存する。
パターン認識型メタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-10-19T08:06:47Z) - Meta-Gradient Reinforcement Learning with an Objective Discovered Online [54.15180335046361]
本稿では,深層ニューラルネットワークによって柔軟にパラメータ化される,自己目的のメタ段階的降下に基づくアルゴリズムを提案する。
目的はオンラインで発見されるため、時間とともに変化に適応することができる。
Atari Learning Environmentでは、メタグラディエントアルゴリズムが時間とともに適応して、より効率よく学習する。
論文 参考訳(メタデータ) (2020-07-16T16:17:09Z) - Neuromodulated Neural Architectures with Local Error Signals for
Memory-Constrained Online Continual Learning [4.2903672492917755]
我々は,局所学習とニューロ変調を取り入れた,生物学的にインスパイアされた軽量ニューラルネットワークアーキテクチャを開発した。
一つの課題と連続的な学習環境の両方にアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-07-16T07:41:23Z) - Efficient Exploration in Constrained Environments with Goal-Oriented
Reference Path [15.679210057474922]
環境マップに基づいて衝突のない経路を予測できる深層畳み込みネットワークを訓練する。
これは強化学習アルゴリズムによって、経路を忠実に追従することを学ぶために使われる。
提案手法は,新しい環境へのサンプル効率と一般化能力を継続的に改善することを示す。
論文 参考訳(メタデータ) (2020-03-03T17:07:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。