論文の概要: Computational Impact Time Guidance: A Learning-Based
Prediction-Correction Approach
- arxiv url: http://arxiv.org/abs/2103.05196v1
- Date: Tue, 9 Mar 2021 03:10:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 05:01:59.029534
- Title: Computational Impact Time Guidance: A Learning-Based
Prediction-Correction Approach
- Title(参考訳): 計算的インパクト時間ガイダンス:学習に基づく予測補正手法
- Authors: Zichao Liu, Jiang Wang, Shaoming He, Hyo-Sang Shin and Antonios
Tsourdos
- Abstract要約: 提案されたガイダンスアルゴリズムは,一般予測補正の概念に基づいて開発された。
ディープニューラルネットワークは、スパース報酬の問題を解決するために強化学習ブロックに拡張される。
- 参考スコア(独自算出の注目度): 10.98337451569494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates the problem of impact-time-control and proposes a
learning-based computational guidance algorithm to solve this problem. The
proposed guidance algorithm is developed based on a general
prediction-correction concept: the exact time-to-go under proportional
navigation guidance with realistic aerodynamic characteristics is estimated by
a deep neural network and a biased command to nullify the impact time error is
developed by utilizing the emerging reinforcement learning techniques. The deep
neural network is augmented into the reinforcement learning block to resolve
the issue of sparse reward that has been observed in typical reinforcement
learning formulation. Extensive numerical simulations are conducted to support
the proposed algorithm.
- Abstract(参考訳): 本稿では,影響時間制御の問題を考察し,この問題を解決するための学習型計算指導アルゴリズムを提案する。
本提案のガイダンスアルゴリズムは,リアルな空力特性を有する比例航法誘導の下での正確な移動時刻をディープニューラルネットワークにより推定し,新たな強化学習技術を用いて影響時間誤差を緩和するバイアスコマンドを開発する,一般予測補正の概念に基づいて開発された。
ディープニューラルネットワークは強化学習ブロックに拡張され、典型的な強化学習の定式化で観測されたスパース報酬の問題を解決する。
提案アルゴリズムを支援するために, 大規模数値シミュレーションを行った。
関連論文リスト
- Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE [68.6018458996143]
本稿では,量子化と早期出口動的ネットワークを組み合わせたより一般的な動的ネットワークQuEEを提案する。
我々のアルゴリズムは、ソフトアーリーエグジットや入力依存圧縮の一形態と見なすことができる。
提案手法の重要な要素は、さらなる計算によって実現可能な潜在的な精度向上の正確な予測である。
論文 参考訳(メタデータ) (2024-06-20T15:25:13Z) - Liquid Neural Network-based Adaptive Learning vs. Incremental Learning for Link Load Prediction amid Concept Drift due to Network Failures [37.66676003679306]
概念の漂流に適応することは、機械学習において難しい課題である。
通信ネットワークでは、障害イベントの後に交通予報を行う際にこのような問題が生じる。
本稿では,適応学習アルゴリズム,すなわち,データパターンの急激な変化を,再学習を必要とせずに自己適応できる手法を提案する。
論文 参考訳(メタデータ) (2024-04-08T08:47:46Z) - Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Physics-informed neural networks for pathloss prediction [0.9208007322096533]
提案した学習問題の解法は、少数のニューラルネットワーク層とパラメータを用いて一般化と予測品質を向上させる。
物理インフォームド・フォーミュレーションは、少量のトレーニングデータによるトレーニングと予測を可能にし、幅広い実用的なパスロス予測シナリオにアピールする。
論文 参考訳(メタデータ) (2022-11-23T14:45:48Z) - Learning Dynamics and Generalization in Reinforcement Learning [59.530058000689884]
時間差学習は, エージェントが訓練の初期段階において, 値関数の非平滑成分を適合させるのに役立つことを理論的に示す。
本研究では,高密度報酬タスクの時間差アルゴリズムを用いて学習したニューラルネットワークが,ランダムなネットワークや政策手法で学習した勾配ネットワークよりも,状態間の一般化が弱いことを示す。
論文 参考訳(メタデータ) (2022-06-05T08:49:16Z) - Scalable computation of prediction intervals for neural networks via
matrix sketching [79.44177623781043]
既存の不確実性推定アルゴリズムでは、モデルアーキテクチャとトレーニング手順を変更する必要がある。
本研究では、与えられたトレーニングされたニューラルネットワークに適用し、近似予測間隔を生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-06T13:18:31Z) - Analytically Tractable Inference in Deep Neural Networks [0.0]
Tractable Approximate Inference (TAGI)アルゴリズムは、浅いフルコネクテッドニューラルネットワークのバックプロパゲーションに対する実行可能でスケーラブルな代替手段であることが示された。
従来のディープニューラルネットワークアーキテクチャをトレーニングするために、TAGIがバックプロパゲーションのパフォーマンスとどのように一致するか、または上回るかを実証しています。
論文 参考訳(メタデータ) (2021-03-09T14:51:34Z) - Strong overall error analysis for the training of artificial neural
networks via random initializations [3.198144010381572]
その結果,同じ近似速度を得るためには,ニューラルネットワークの深さがはるかに遅くなるだけでよいことがわかった。
i.i.dの任意の最適化アルゴリズムの場合、結果は保持される。
ランダム初期化。
論文 参考訳(メタデータ) (2020-12-15T17:34:16Z) - Relaxing the Constraints on Predictive Coding Models [62.997667081978825]
予測符号化(英: Predictive coding)は、脳が行う主計算が予測誤差の最小化であるとする皮質機能の影響力のある理論である。
アルゴリズムの標準的な実装は、同じ前方と後方の重み、後方の非線形微分、1-1エラーユニット接続といった、潜在的に神経的に予測できない特徴を含んでいる。
本稿では,これらの特徴はアルゴリズムに不可欠なものではなく,Hebbianの更新ルールを用いてパラメータセットを直接あるいは学習することで,学習性能に悪影響を及ぼすことなく除去可能であることを示す。
論文 参考訳(メタデータ) (2020-10-02T15:21:37Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。