Fugu-MT 論文翻訳(概要): An Application of Online Learning to Spacecraft Memory Dump Optimization

論文の概要: An Application of Online Learning to Spacecraft Memory Dump Optimization

arxiv url: http://arxiv.org/abs/2202.06617v1
Date: Mon, 14 Feb 2022 11:13:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-15 17:10:47.028863
Title: An Application of Online Learning to Spacecraft Memory Dump Optimization
Title（参考訳）: オンライン学習の宇宙用メモリダンプ最適化への応用
Authors: Tommaso Cesari, Jonathan Pergoli, Michele Maestrini, Pierluigi Di Lizia
Abstract要約: 本研究では,空間操作分野の専門家によるオンライン学習の現実的な応用について紹介する。本研究では,Spacecraft Memory Dump Optimization において,従来の手法と比較して,Follow-The-Leader アルゴリズムが60%以上の性能向上をもたらすことを示す。
参考スコア（独自算出の注目度）: 0.5735035463793008
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we present a real-world application of online learning with expert advice to the field of Space Operations, testing our theory on real-life data coming from the Copernicus Sentinel-6 satellite. We show that in Spacecraft Memory Dump Optimization, a lightweight Follow-The-Leader algorithm leads to an increase in performance of over $60\%$ when compared to traditional techniques.
Abstract（参考訳）: 本稿では,copernicus sentinel-6衛星から得られた実生活データに関する理論を検証し,宇宙運用の分野における専門家のアドバイスを伴う実世界のオンライン学習の応用について述べる。本研究では,Spacecraft Memory Dump Optimization において,従来の手法と比較して,Follow-The-Leader の軽量アルゴリズムが60 %以上の性能向上をもたらすことを示す。

関連論文リスト

Flight Validation of Learning-Based Trajectory Optimization for the Astrobee Free-Flyer [17.306347323545985]
国際宇宙ステーションのアストローブ自由飛行ロボットによる飛行実験の結果を報告する。理論的解決の保証を保ちながら、機械学習が軌道上での軌道最適化をいかに加速するかを実証する。
論文参考訳（メタデータ） (2025-05-08T18:42:36Z)
EclipseNETs: Learning Irregular Small Celestial Body Silhouettes [4.868863044142366]
不規則な小さな天体を取り巻く日食の正確な予測は、宇宙船の航法、軌道決定、宇宙船システム管理に不可欠である。本稿では,日食条件を効率的にかつ確実にモデル化するために,ニューラルな暗黙表現を活用する新しいアプローチを提案する。ベンヌ、伊藤川、67P/Churyumov-Gerasimenko、Erosの4体で試験された。
論文参考訳（メタデータ） (2025-04-06T11:51:44Z)
Adaptive Data Exploitation in Deep Reinforcement Learning [50.53705050673944]
深層強化学習(RL)における**データ効率**と**一般化**を強化する強力なフレームワークであるADEPTを紹介する。具体的には、ADEPTはマルチアーム・バンディット(MAB)アルゴリズムを用いて、異なる学習段階にわたるサンプルデータの使用を適応的に管理する。 Procgen、MiniGrid、PyBulletなどのベンチマークでADEPTをテストする。
論文参考訳（メタデータ） (2025-01-22T04:01:17Z)
Space for Improvement: Navigating the Design Space for Federated Learning in Satellite Constellations [0.8437187555622164]
衛星コンステレーションの設計とハードウェア対応テストプラットフォームであるFLySTacKを用いて,既存のFLアルゴリズムの空間化手法を開発した。我々はAutoFLSatを紹介した。これは空間に対する一般化された階層的な自律的FLアルゴリズムであり、主要な代替手段よりも12.5%から37.5%のモデルトレーニング時間を短縮する。
論文参考訳（メタデータ） (2024-10-31T23:49:36Z)
Scattered Forest Search: Smarter Code Space Exploration with LLMs [55.71665969800222]
Scattered Forest Searchを導入し,ソリューションを探索しながら解の多様性を高める。 HumanEval、MBPP、APPS、CodeContests、Leetcodeの実験では、大幅なパフォーマンス向上が示されている。
論文参考訳（メタデータ） (2024-10-22T01:58:29Z)
Language Models are Spacecraft Operators [36.943670587532026]
大規模言語モデル(LLM)は、ユーザのテキストプロンプトの内容に基づいてアクションを行う自律エージェントである。我々は,KSPDG(Kerbal Space Program Differential Games)チャレンジに対して,純粋なLLMベースのソリューションを開発した。
論文参考訳（メタデータ） (2024-03-30T16:43:59Z)
Semi-Offline Reinforcement Learning for Optimized Text Generation [35.1606951874979]
強化学習(RL)では、オンラインとオフラインという、環境と対話するための2つの主要な設定がある。オフライン手法は探索能力を犠牲にして効率よく報奨信号を得る。オフラインからオンラインへスムーズに移行し、探索能力とトレーニングコストのバランスをとる新しいパラダイムである半オフラインRLを提案し、異なるRL設定を比較する理論的基盤を提供する。
論文参考訳（メタデータ） (2023-06-16T09:24:29Z)
Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文参考訳（メタデータ） (2023-02-06T17:30:22Z)
TRAIL: Near-Optimal Imitation Learning with Suboptimal Data [100.83688818427915]
オフラインデータセットを使用してファクタードトランジションモデルを学習するトレーニング目標を提案する。我々の理論的分析は、学習された潜在行動空間が下流模倣学習のサンプル効率を高めることを示唆している。実際に潜伏行動空間を学習するために、エネルギーベースの遷移モデルを学ぶアルゴリズムTRAIL(Transition-Reparametrized Actions for Imitation Learning)を提案する。
論文参考訳（メタデータ） (2021-10-27T21:05:00Z)
Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文参考訳（メタデータ） (2021-09-09T12:32:28Z)
PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for Reinforcement Learning [84.30765628008207]
本稿では,RL特徴表現学習におけるデータ効率を向上させるために,サイクル一貫性のある仮想トラジェクトリを付加するPlayVirtualという新しい手法を提案する。本手法は,両ベンチマークにおいて,最先端の手法よりも高い性能を示す。
論文参考訳（メタデータ） (2021-06-08T07:37:37Z)
Rule-Based Reinforcement Learning for Efficient Robot Navigation with Space Reduction [8.279526727422288]
本稿では,強化学習(RL)技術を用いた効率的なナビゲーションに焦点を当てた。軌道を縮小するために減速ルールを採用し、冗長な探査空間を効果的に削減します。ヘックスグリッド環境における実際のロボットナビゲーション問題に対する実験は、RuRLが航法性能を向上させることを実証している。
論文参考訳（メタデータ） (2021-04-15T07:40:27Z)
Learning to Localize Using a LiDAR Intensity Map [87.04427452634445]
自動運転車のリアルタイム・キャリブレーション非依存・効果的なローカライズシステムを提案する。私たちの方法は、オンラインLiDARスイープと強度マップをジョイントディープ埋め込みスペースに埋め込む方法を学びます。システム全体の動作は15hzで,さまざまなlidarセンサや環境においてセンチメートルレベルの精度を実現しています。
論文参考訳（メタデータ） (2020-12-20T11:56:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。