論文の概要: Deep reinforcement learning for smart calibration of radio telescopes
- arxiv url: http://arxiv.org/abs/2102.03200v1
- Date: Fri, 5 Feb 2021 14:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-08 14:47:15.613143
- Title: Deep reinforcement learning for smart calibration of radio telescopes
- Title(参考訳): 無線望遠鏡のスマートキャリブレーションのための深層補強学習
- Authors: Sarod Yatawatta and Ian M. Avruch
- Abstract要約: 本稿では,データ校正パイプラインの微調整を行う自律エージェントの訓練に強化学習を導入する。
我々は、パイプラインを、エージェントがパイプラインの解釈状態のみを使用するブラックボックスシステムとみなす。
この方法で訓練された自律エージェントは、多様な観察のための最適な設定を決定でき、従って、人間の介入の必要性を最小限に抑える「マート」キャリブレーションを実行することができる。
- 参考スコア(独自算出の注目度): 3.655021726150368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern radio telescopes produce unprecedented amounts of data, which are
passed through many processing pipelines before the delivery of scientific
results. Hyperparameters of these pipelines need to be tuned by hand to produce
optimal results. Because many thousands of observations are taken during a
lifetime of a telescope and because each observation will have its unique
settings, the fine tuning of pipelines is a tedious task. In order to automate
this process of hyperparameter selection in data calibration pipelines, we
introduce the use of reinforcement learning. We use a reinforcement learning
technique called twin delayed deep deterministic policy gradient (TD3) to train
an autonomous agent to perform this fine tuning. For the sake of
generalization, we consider the pipeline to be a black-box system where only an
interpreted state of the pipeline is used by the agent. The autonomous agent
trained in this manner is able to determine optimal settings for diverse
observations and is therefore able to perform 'smart' calibration, minimizing
the need for human intervention.
- Abstract(参考訳): 現代の電波望遠鏡は前例のない量のデータを生成し、科学的な結果が届く前に多くの処理パイプラインを通過します。
これらのパイプラインのハイパーパラメータは、最適な結果を得るために手動で調整する必要がある。
望遠鏡の寿命に何万もの観測が行われ、それぞれの観測には独自の設定があるため、パイプラインの微調整は面倒な作業である。
データキャリブレーションパイプラインにおけるハイパーパラメータ選択のプロセスを自動化するために,強化学習について紹介する。
我々は,この微調整を行うための自律エージェントを訓練するために,ツイン遅延Deep Deterministic Policy gradient (TD3)と呼ばれる強化学習手法を用いる。
一般化のために、パイプラインは、パイプラインの解釈状態のみがエージェントによって使用されるブラックボックスシステムであると考えています。
この方法で訓練された自律エージェントは、多様な観察に最適な設定を決定することができるため、人間の介入の必要性を最小限に抑えて「スマート」キャリブレーションを実行できます。
関連論文リスト
- SPOT: Scalable 3D Pre-training via Occupancy Prediction for Learning Transferable 3D Representations [76.45009891152178]
トレーニング-ファインタニングアプローチは、さまざまな下流データセットとタスクをまたいだトレーニング済みのバックボーンを微調整することで、ラベル付けの負担を軽減することができる。
本稿では, 一般表現学習が, 占領予測のタスクを通じて達成できることを, 初めて示す。
本研究は,LiDAR 点の理解を促進するとともに,LiDAR の事前訓練における今後の進歩の道を開くことを目的とする。
論文 参考訳(メタデータ) (2023-09-19T11:13:01Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Deep Pipeline Embeddings for AutoML [11.168121941015015]
AutoMLは、最小限の人間の専門知識で機械学習システムを自動デプロイすることで、AIを民主化するための有望な方向である。
既存のパイプライン最適化テクニックでは、パイプラインステージ/コンポーネント間の深いインタラクションを探索できない。
本稿では,機械学習パイプラインのコンポーネント間のディープインタラクションをキャプチャするニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-05-23T12:40:38Z) - A Deep-Learning-Aided Pipeline for Efficient Post-Silicon Tuning [5.904240881373805]
シリコン後の検証では、チューニングノブの値をプロセスパラメータや既知の動作条件の関数として見つける。
ニューラルネットワークを利用して、最も関連性の高い変数を効率的に選択し、それに対応するディープラーニング支援パイプラインを効率よくチューニングする。
論文 参考訳(メタデータ) (2022-07-01T11:04:53Z) - Self-supervised Transformer for Deepfake Detection [112.81127845409002]
現実世界のシナリオにおけるディープフェイク技術は、顔偽造検知器のより強力な一般化能力を必要とする。
転送学習に触発されて、他の大規模な顔関連タスクで事前訓練されたニューラルネットワークは、ディープフェイク検出に有用な機能を提供する可能性がある。
本稿では,自己教師型変換器を用いた音声視覚コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-02T17:44:40Z) - Where Is My Training Bottleneck? Hidden Trade-Offs in Deep Learning
Preprocessing Pipelines [77.45213180689952]
ディープラーニングにおける前処理パイプラインは、トレーニングプロセスを忙しくするための十分なデータスループットの提供を目的としている。
エンドツーエンドのディープラーニングパイプラインのためのデータセットを効率的に準備する新たな視点を導入する。
チューニングされていないシステムに比べてスループットが3倍から13倍に向上する。
論文 参考訳(メタデータ) (2022-02-17T14:31:58Z) - Predicting pigging operations in oil pipelines [0.0]
本稿では,石油トランクラインにおける養豚作業の自動予測を行うための,革新的な機械学習手法を提案する。
歴史的圧力信号は、北イタリアにある石油パイプライン(長さ100km、直径16インチのパイプ)に沿って、エニによって2年間収集されてきた。
ライン上で実行された履歴的な豚の操作を自動的にハイライトするために、ツールが実装されている。
論文 参考訳(メタデータ) (2021-09-24T08:49:33Z) - Deep Shells: Unsupervised Shape Correspondence with Optimal Transport [52.646396621449]
本稿では,3次元形状対応のための教師なし学習手法を提案する。
提案手法は,複数のデータセット上での最先端技術よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-28T22:24:07Z) - Learning Dexterous Manipulation from Suboptimal Experts [69.8017067648129]
相対エントロピーQラーニング(Relative Entropy Q-Learning、REQ)は、オフラインおよび従来のRLアルゴリズムのアイデアを組み合わせた単純なポリシーアルゴリズムである。
本稿では、REQが、デモから一般の政治外RL、オフラインRL、およびRLにどのように有効であるかを示す。
論文 参考訳(メタデータ) (2020-10-16T18:48:49Z) - AVATAR -- Machine Learning Pipeline Evaluation Using Surrogate Model [10.83607599315401]
本稿では,サロゲートモデル(AVATAR)を用いたMLパイプラインの有効性評価手法を提案する。
実験の結果, AVATARは, 従来の評価手法と比較して, 複雑なパイプラインの評価においてより効率的であることがわかった。
論文 参考訳(メタデータ) (2020-01-30T02:53:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。