論文の概要: An Application of Online Learning to Spacecraft Memory Dump Optimization
- arxiv url: http://arxiv.org/abs/2202.06617v1
- Date: Mon, 14 Feb 2022 11:13:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 17:10:47.028863
- Title: An Application of Online Learning to Spacecraft Memory Dump Optimization
- Title(参考訳): オンライン学習の宇宙用メモリダンプ最適化への応用
- Authors: Tommaso Cesari, Jonathan Pergoli, Michele Maestrini, Pierluigi Di
Lizia
- Abstract要約: 本研究では,空間操作分野の専門家によるオンライン学習の現実的な応用について紹介する。
本研究では,Spacecraft Memory Dump Optimization において,従来の手法と比較して,Follow-The-Leader アルゴリズムが60%以上の性能向上をもたらすことを示す。
- 参考スコア(独自算出の注目度): 0.5735035463793008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a real-world application of online learning with
expert advice to the field of Space Operations, testing our theory on real-life
data coming from the Copernicus Sentinel-6 satellite. We show that in
Spacecraft Memory Dump Optimization, a lightweight Follow-The-Leader algorithm
leads to an increase in performance of over $60\%$ when compared to traditional
techniques.
- Abstract(参考訳): 本稿では,copernicus sentinel-6衛星から得られた実生活データに関する理論を検証し,宇宙運用の分野における専門家のアドバイスを伴う実世界のオンライン学習の応用について述べる。
本研究では,Spacecraft Memory Dump Optimization において,従来の手法と比較して,Follow-The-Leader の軽量アルゴリズムが60 %以上の性能向上をもたらすことを示す。
関連論文リスト
- Adaptive Data Exploitation in Deep Reinforcement Learning [50.53705050673944]
深層強化学習(RL)における**データ効率**と**一般化**を強化する強力なフレームワークであるADEPTを紹介する。
具体的には、ADEPTはマルチアーム・バンディット(MAB)アルゴリズムを用いて、異なる学習段階にわたるサンプルデータの使用を適応的に管理する。
Procgen、MiniGrid、PyBulletなどのベンチマークでADEPTをテストする。
論文 参考訳(メタデータ) (2025-01-22T04:01:17Z) - Space for Improvement: Navigating the Design Space for Federated Learning in Satellite Constellations [0.8437187555622164]
衛星コンステレーションの設計とハードウェア対応テストプラットフォームであるFLySTacKを用いて,既存のFLアルゴリズムの空間化手法を開発した。
我々はAutoFLSatを紹介した。これは空間に対する一般化された階層的な自律的FLアルゴリズムであり、主要な代替手段よりも12.5%から37.5%のモデルトレーニング時間を短縮する。
論文 参考訳(メタデータ) (2024-10-31T23:49:36Z) - Scattered Forest Search: Smarter Code Space Exploration with LLMs [55.71665969800222]
Scattered Forest Searchを導入し,ソリューションを探索しながら解の多様性を高める。
HumanEval、MBPP、APPS、CodeContests、Leetcodeの実験では、大幅なパフォーマンス向上が示されている。
論文 参考訳(メタデータ) (2024-10-22T01:58:29Z) - Language Models are Spacecraft Operators [36.943670587532026]
大規模言語モデル(LLM)は、ユーザのテキストプロンプトの内容に基づいてアクションを行う自律エージェントである。
我々は,KSPDG(Kerbal Space Program Differential Games)チャレンジに対して,純粋なLLMベースのソリューションを開発した。
論文 参考訳(メタデータ) (2024-03-30T16:43:59Z) - Semi-Offline Reinforcement Learning for Optimized Text Generation [35.1606951874979]
強化学習(RL)では、オンラインとオフラインという、環境と対話するための2つの主要な設定がある。
オフライン手法は探索能力を犠牲にして効率よく報奨信号を得る。
オフラインからオンラインへスムーズに移行し、探索能力とトレーニングコストのバランスをとる新しいパラダイムである半オフラインRLを提案し、異なるRL設定を比較する理論的基盤を提供する。
論文 参考訳(メタデータ) (2023-06-16T09:24:29Z) - TRAIL: Near-Optimal Imitation Learning with Suboptimal Data [100.83688818427915]
オフラインデータセットを使用してファクタードトランジションモデルを学習するトレーニング目標を提案する。
我々の理論的分析は、学習された潜在行動空間が下流模倣学習のサンプル効率を高めることを示唆している。
実際に潜伏行動空間を学習するために、エネルギーベースの遷移モデルを学ぶアルゴリズムTRAIL(Transition-Reparametrized Actions for Imitation Learning)を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:05:00Z) - Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。
比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文 参考訳(メタデータ) (2021-09-09T12:32:28Z) - PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for
Reinforcement Learning [84.30765628008207]
本稿では,RL特徴表現学習におけるデータ効率を向上させるために,サイクル一貫性のある仮想トラジェクトリを付加するPlayVirtualという新しい手法を提案する。
本手法は,両ベンチマークにおいて,最先端の手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2021-06-08T07:37:37Z) - Rule-Based Reinforcement Learning for Efficient Robot Navigation with
Space Reduction [8.279526727422288]
本稿では,強化学習(RL)技術を用いた効率的なナビゲーションに焦点を当てた。
軌道を縮小するために減速ルールを採用し、冗長な探査空間を効果的に削減します。
ヘックスグリッド環境における実際のロボットナビゲーション問題に対する実験は、RuRLが航法性能を向上させることを実証している。
論文 参考訳(メタデータ) (2021-04-15T07:40:27Z) - Learning to Localize Using a LiDAR Intensity Map [87.04427452634445]
自動運転車のリアルタイム・キャリブレーション非依存・効果的なローカライズシステムを提案する。
私たちの方法は、オンラインLiDARスイープと強度マップをジョイントディープ埋め込みスペースに埋め込む方法を学びます。
システム全体の動作は15hzで,さまざまなlidarセンサや環境においてセンチメートルレベルの精度を実現しています。
論文 参考訳(メタデータ) (2020-12-20T11:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。