Fugu-MT 論文翻訳(概要): Reinforcement learning

論文の概要: Reinforcement learning

arxiv url: http://arxiv.org/abs/2405.10369v1
Date: Thu, 16 May 2024 18:03:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-20 17:42:52.337103
Title: Reinforcement learning
Title（参考訳）: 強化学習
Authors: Sarod Yatawatta,
Abstract要約: 強化学習(Reinforcement learning)とは、人間や天文学者が人工知能のエージェントに、こうした面倒な作業の実行を教えるメカニズムである。本稿では,強化学習の現状と天文学的メリットについて述べる。
参考スコア（独自算出の注目度）: 0.8702432681310399
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Observing celestial objects and advancing our scientific knowledge about them involves tedious planning, scheduling, data collection and data post-processing. Many of these operational aspects of astronomy are guided and executed by expert astronomers. Reinforcement learning is a mechanism where we (as humans and astronomers) can teach agents of artificial intelligence to perform some of these tedious tasks. In this paper, we will present a state of the art overview of reinforcement learning and how it can benefit astronomy.
Abstract（参考訳）: 天体の観測とそれに関する科学的知識の進歩には、面倒な計画、スケジューリング、データ収集、データ後処理が含まれる。これらの天文学の運用上の側面の多くは、専門家の天文学者によって導かれ、実行されている。強化学習(Reinforcement learning)とは、人間や天文学者が人工知能のエージェントに、こうした面倒な作業の実行を教えるメカニズムである。本稿では,強化学習の現状と天文学的メリットについて概説する。

関連論文リスト

SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳（メタデータ） (2024-10-23T17:42:07Z)
Lessons from Learning to Spin "Pens" [51.9182692233916]
本研究では,ペンのような物体を回転させる能力を示すことによって,学習に基づく手動操作システムの境界を推し進める。まず、強化学習を用いて、特権情報でオラクルポリシーを訓練し、シミュレーションにおいて高忠実度軌道データセットを生成する。次に、これらの実世界の軌道を用いて感覚運動のポリシーを微調整し、実世界の力学に適応させる。
論文参考訳（メタデータ） (2024-07-26T17:56:01Z)
Large Language Models for Scientific Synthesis, Inference and Explanation [56.41963802804953]
大規模言語モデルがどのように科学的合成、推論、説明を行うことができるかを示す。我々は,この「知識」を科学的文献から合成することで,大きな言語モデルによって強化できることを示す。このアプローチは、大きな言語モデルが機械学習システムの予測を説明することができるというさらなる利点を持っている。
論文参考訳（メタデータ） (2023-10-12T02:17:59Z)
Assessing Exoplanet Habitability through Data-driven Approaches: A Comprehensive Literature Review [0.0]
レビューは、太陽系外惑星研究における新たなトレンドと進歩を照らすことを目的としている。太陽系外惑星の検出、分類、可視化の相互作用に焦点を当てる。太陽系外惑星研究で使用される機械学習アプローチの幅広いスペクトルを記述する。
論文参考訳（メタデータ） (2023-05-18T17:18:15Z)
Artificial intelligence to advance Earth observation: : A review of models, recent trends, and pathways forward [60.43248801101935]
本稿では、生のEOデータから使用可能なEOベースの情報への移行を通知し、支援する、重要な科学的ツールとアプローチについて、鳥の視点で説明する。 i)コンピュータビジョン, (ii) 機械学習, (iii) 高度な処理とコンピューティング, (iv) 知識ベースAI, (v) 説明可能なAIと因果推論, (vi) 物理認識モデル, (vii) ユーザ中心のアプローチ, (viii) EOにおけるML技術の大量使用に関する倫理的・社会的問題に関する議論の議論を網羅する。
論文参考訳（メタデータ） (2023-05-15T07:47:24Z)
Applications of AI in Astronomy [0.0]
本稿では、天文学、天体物理学、宇宙論における機械学習(ML)およびその他のAI手法の使用の概要について述べる。過去10年間で、さまざまなML/AI応用を含む天文学文献が指数関数的に成長してきた。データの複雑さが増し続ければ、協力的な人間とAIの発見につながるさらなる進歩が期待できる。
論文参考訳（メタデータ） (2022-12-03T00:38:59Z)
Elements of effective machine learning datasets in astronomy [1.552171919003135]
天文学における効果的な機械学習データセットの要素を同定する。これらの要素が天文学的な応用に重要である理由と、それを実現する方法について議論する。
論文参考訳（メタデータ） (2022-11-25T23:37:24Z)
Astronomia ex machina: a history, primer, and outlook on neural networks in astronomy [0.0]
我々は天文学における接続性の進化をその3つの波で追跡した。我々は、天文学的な応用のために微調整されたGPTライクな基礎モデルの採用を論じる。
論文参考訳（メタデータ） (2022-11-07T19:00:00Z)
A Survey of Exploration Methods in Reinforcement Learning [64.01676570654234]
強化学習エージェントは、学習プロセスのための情報データを得るために、探索に極めて依存する。本稿では,(逐次的)強化学習における近代的な探究手法の調査と,探索手法の分類について述べる。
論文参考訳（メタデータ） (2021-09-01T02:36:14Z)
Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills [93.12417203541948]
与えられたデータセットの任意の目標状態に到達するために学習することによって、環境の機能的な理解を学ぶ目的を提案する。提案手法は,高次元カメラ画像上で動作し,これまで見つからなかったシーンやオブジェクトに一般化した実ロボットの様々なスキルを学習することができる。
論文参考訳（メタデータ） (2021-04-15T20:10:11Z)
Self-supervised Learning for Astronomical Image Classification [1.2891210250935146]
天文学では、毎日大量の画像データが測光サーベイによって生成される。本稿では,未ラベルの天体画像から深部畳み込みニューラルネットワークを学習する手法を提案する。
論文参考訳（メタデータ） (2020-04-23T17:32:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。