論文の概要: Elements of effective machine learning datasets in astronomy
- arxiv url: http://arxiv.org/abs/2211.14401v1
- Date: Fri, 25 Nov 2022 23:37:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 20:26:16.034091
- Title: Elements of effective machine learning datasets in astronomy
- Title(参考訳): 天文学における効果的な機械学習データセットの要素
- Authors: Bernie Boscoe, Tuan Do, Evan Jones, Yunqi Li, Kevin Alfaro, Christy Ma
- Abstract要約: 天文学における効果的な機械学習データセットの要素を同定する。
これらの要素が天文学的な応用に重要である理由と、それを実現する方法について議論する。
- 参考スコア(独自算出の注目度): 1.552171919003135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we identify elements of effective machine learning datasets in
astronomy and present suggestions for their design and creation. Machine
learning has become an increasingly important tool for analyzing and
understanding the large-scale flood of data in astronomy. To take advantage of
these tools, datasets are required for training and testing. However, building
machine learning datasets for astronomy can be challenging. Astronomical data
is collected from instruments built to explore science questions in a
traditional fashion rather than to conduct machine learning. Thus, it is often
the case that raw data, or even downstream processed data is not in a form
amenable to machine learning. We explore the construction of machine learning
datasets and we ask: what elements define effective machine learning datasets?
We define effective machine learning datasets in astronomy to be formed with
well-defined data points, structure, and metadata. We discuss why these
elements are important for astronomical applications and ways to put them in
practice. We posit that these qualities not only make the data suitable for
machine learning, they also help to foster usable, reusable, and replicable
science practices.
- Abstract(参考訳): 本研究では、天文学における効果的な機械学習データセットの要素を特定し、その設計と作成について提案する。
機械学習は、天文学における大規模なデータの洪水を分析し理解するための、ますます重要なツールになりつつある。
これらのツールを利用するには、トレーニングとテストにデータセットが必要である。
しかし、天文学のための機械学習データセットの構築は困難である。
天文学的データは、機械学習を行うのではなく、伝統的な方法で科学的な疑問を探求するために作られた機器から収集される。
したがって、生データ、あるいは下流の処理データでさえ、機械学習に対処可能な形式になっていない場合が多い。
機械学習データセットの構築について検討し、次のような質問をする: 効果的な機械学習データセットを定義する要素は何か?
天文学における効果的な機械学習データセットを、明確に定義されたデータポイント、構造、メタデータで形成するように定義する。
これらの要素が天文学的な応用に重要である理由と、それを実現する方法について議論する。
これらの品質が機械学習に適合するだけでなく、有用で再利用可能な、複製可能な科学プラクティスの育成にも役立ちます。
関連論文リスト
- Reinforcement learning [0.8702432681310399]
強化学習(Reinforcement learning)とは、人間や天文学者が人工知能のエージェントに、こうした面倒な作業の実行を教えるメカニズムである。
本稿では,強化学習の現状と天文学的メリットについて述べる。
論文 参考訳(メタデータ) (2024-05-16T18:03:17Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Machine learning in solar physics [0.0]
太陽物理学における機械学習の応用は、太陽の大気で起こる複雑な過程の理解を大幅に強化する可能性がある。
深層学習などの手法を用いることで、私たちは現在、太陽観測から大量のデータを分析する立場にある。
太陽フレアのような爆発的な現象の理解を深め、地球環境に強い影響を与える可能性がある。
論文 参考訳(メタデータ) (2023-06-27T08:55:20Z) - Position Paper on Dataset Engineering to Accelerate Science [1.952708415083428]
この作業では、トークン ittextdataset を使用して、明確に定義されたタスクを実行するために構築されたデータの構造化セットを指定する。
具体的には、科学において、各領域にはデータセットを整理、収集、処理するためのユニークな形態がある。
科学と工学の発見プロセスは、データセット上のそのような組織の必要性の極端な例である、と我々は主張する。
論文 参考訳(メタデータ) (2023-03-09T19:07:40Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - A Spacecraft Dataset for Detection, Segmentation and Parts Recognition [42.27081423489484]
本稿では,宇宙船検出,インスタンスのセグメンテーション,部分認識のためのデータセットをリリースする。
この研究の主な貢献は、宇宙ステーションと衛星の画像を用いたデータセットの開発である。
また、データセットのベンチマークとして、オブジェクト検出やインスタンスセグメンテーションにおける最先端の手法による評価も提供する。
論文 参考訳(メタデータ) (2021-06-15T14:36:56Z) - First Full-Event Reconstruction from Imaging Atmospheric Cherenkov
Telescope Real Data with Deep Learning [55.41644538483948]
チェレンコフ望遠鏡アレイは、地上のガンマ線天文学の未来である。
地上で作られた最初のプロトタイプ望遠鏡であるLarge Size Telescope 1は現在、最初の科学データを収集している。
我々は、深層畳み込みニューラルネットワークに基づくフルイベント再構築の開発とその実データへの適用を初めて提示する。
論文 参考訳(メタデータ) (2021-05-31T12:51:42Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Incorporating Physical Knowledge into Machine Learning for Planetary
Space Physics [0.0]
我々は、土星の磁気圏におけるプラズマ不安定性の半教師付き物理に基づく分類を適用した以前の試みを構築した。
これらの軌道上の宇宙船データ特性の知識を取り入れることで、機械学習手法の性能と解釈性が向上することを示す。
論文 参考訳(メタデータ) (2020-06-02T20:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。