論文の概要: Identifying Planetary Names in Astronomy Papers: A Multi-Step Approach
- arxiv url: http://arxiv.org/abs/2312.08579v1
- Date: Thu, 14 Dec 2023 00:50:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-16 00:19:22.406232
- Title: Identifying Planetary Names in Astronomy Papers: A Multi-Step Approach
- Title(参考訳): 天文学論文における惑星名同定 : マルチステップアプローチ
- Authors: Golnaz Shapurian, Michael J Kurtz, and Alberto Accomazzi
- Abstract要約: 多くの特徴名はシリア、アインシュタイン、セーガンなどの名前にちなむ地名や人物の名前と重複している。
いくつかの特徴名は、月のクレーターであるブラック、グリーン、ホワイトなど、形容詞である。
いくつかの特徴名は、月の西と南のクレーターのような方向を向いている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The automatic identification of planetary feature names in astronomy
publications presents numerous challenges. These features include craters,
defined as roughly circular depressions resulting from impact or volcanic
activity; dorsas, which are elongate raised structures or wrinkle ridges; and
lacus, small irregular patches of dark, smooth material on the Moon, referred
to as "lake" (Planetary Names Working Group, n.d.). Many feature names overlap
with places or people's names that they are named after, for example, Syria,
Tempe, Einstein, and Sagan, to name a few (U.S. Geological Survey, n.d.). Some
feature names have been used in many contexts, for instance, Apollo, which can
refer to mission, program, sample, astronaut, seismic, seismometers, core, era,
data, collection, instrument, and station, in addition to the crater on the
Moon. Some feature names can appear in the text as adjectives, like the lunar
craters Black, Green, and White. Some feature names in other contexts serve as
directions, like craters West and South on the Moon. Additionally, some
features share identical names across different celestial bodies, requiring
disambiguation, such as the Adams crater, which exists on both the Moon and
Mars. We present a multi-step pipeline combining rule-based filtering,
statistical relevance analysis, part-of-speech (POS) tagging, named entity
recognition (NER) model, hybrid keyword harvesting, knowledge graph (KG)
matching, and inference with a locally installed large language model (LLM) to
reliably identify planetary names despite these challenges. When evaluated on a
dataset of astronomy papers from the Astrophysics Data System (ADS), this
methodology achieves an F1-score over 0.97 in disambiguating planetary feature
names.
- Abstract(参考訳): 天文学出版物における惑星名の自動識別には多くの課題がある。
これらの特徴は、衝突や火山活動によって生じる概ね円形の凹凸として定義されるクレーター、長く伸びた構造物やひび割れの尾根、月面の暗い滑らかな物質の小さな不規則な斑点、すなわち「ラク」(Planetary Names Working Group, n.d.)である。
多くの特徴名はシリア、テンペ、アインシュタイン、セーガンといった地名に因んで命名された場所や人々の名前と重なり合い、いくつかの地名(アメリカ合衆国地質調査所)を冠している。
例えばアポロは、月上のクレーターに加えて、ミッション、プログラム、サンプル、宇宙飛行士、地震計、地震計、コア、時代、データ、収集、機器、ステーションなど、様々な場面で使われている。
いくつかの特徴名は、月のクレーターである黒、緑、白などの形容詞としてテキストに現れる。
他の文脈でのいくつかの特徴名は、月の西と南のクレーターのような方向として機能する。
さらに、いくつかの特徴は、月と火星の両方に存在するアダムズクレーターのような曖昧さをなくすために、異なる天体に同じ名前を持つ。
本稿では,ルールに基づくフィルタリング,統計的関連分析,部分音声(pos)タグ付け,名前付きエンティティ認識(ner)モデル,ハイブリッドキーワード抽出,知識グラフ(kg)マッチング,および局所的に設置された大規模言語モデル(llm)による推論を組み合わせた多段階パイプラインを提案する。
ADS(Astrophysics Data System)の天文学論文のデータセットで評価すると、この手法は惑星の特徴を曖昧にするために0.97以上のF1スコアを達成する。
関連論文リスト
- Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - Searching for Novel Chemistry in Exoplanetary Atmospheres using Machine
Learning for Anomaly Detection [1.8434042562191815]
我々は、異常検出のための機械学習(ML)技術の太陽系外惑星トランジットスペクトルへの応用を提唱する。
合成スペクトルの大規模公開データベース上での2つの一般的な異常検出手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-08-15T07:19:54Z) - Deep learning universal crater detection using Segment Anything Model
(SAM) [6.729108277517129]
クレーターは惑星探査において最も重要な形態学的特徴の一つである。
機械学習(ML)とコンピュータビジョンはクレーターの検出とそのサイズ推定の両方に成功している。
本稿では,META AIから最近提案されたSegment Anything Model(SAM)に基づく,普遍的なクレーター検出手法を提案する。
論文 参考訳(メタデータ) (2023-04-16T12:36:37Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Zero-phase angle asteroid taxonomy classification using unsupervised
machine learning algorithms [0.0]
我々は、位相角の変化の影響を受けない大きさに基づいて、小惑星の分類を新たに作成する。
我々はファジィC平均と呼ばれる教師なし機械学習アルゴリズムを用いて分類を行った。
V型小惑星候補15種をヴェスタ族領域外から同定した。
論文 参考訳(メタデータ) (2022-04-11T13:24:54Z) - Identifying Exoplanets with Machine Learning Methods: A Preliminary
Study [1.553390835237685]
本研究では,太陽系外惑星の同定に機械学習を用いた手法を提案する。
我々はケプラー宇宙観測所からNASAが収集したケプラーデータセットを用いて教師あり学習を行った。
我々はまた、k平均クラスタリングを用いて、確認された外惑星を異なるクラスタに分割する教師なし学習も行った。
論文 参考訳(メタデータ) (2022-04-01T23:48:26Z) - MACRONYM: A Large-Scale Dataset for Multilingual and Multi-Domain
Acronym Extraction [66.60031336330547]
様々なNLPアプリケーションには、頭字語とその拡張形式が必要である。
既存のAE研究の限界の1つは、それらが英語と特定のドメインに限定されていることである。
複数の言語やドメインにアノテートされたデータセットが欠落することは、この分野の研究を妨げる大きな問題となっている。
論文 参考訳(メタデータ) (2022-02-19T23:08:38Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - Automation Of Transiting Exoplanet Detection, Identification and
Habitability Assessment Using Machine Learning Approaches [0.0]
我々はケプラー望遠鏡で捉えた恒星からの光強度曲線を分析し、惑星系の存在の性質を示すポテンシャル曲線を検出する。
我々は、いくつかの最先端機械学習とアンサンブルアプローチを活用することで、外惑星識別と居住可能性判定の自動化に取り組む。
論文 参考訳(メタデータ) (2021-12-06T19:00:12Z) - Informational Space of Meaning for Scientific Texts [68.8204255655161]
本稿では,単語の意味を,テキストが属する対象カテゴリに関する相対情報ゲイン(RIG)のベクトルで表現する意味空間を紹介する。
Leicester Scientific Corpus (LSC) と Leicester Scientific Dictionary-Core (LScDC) に基づく意味空間の構築に本手法を適用した。
RIGに基づく提案モデルでは,カテゴリ内の話題特化語を際立たせる能力があることが示されている。
論文 参考訳(メタデータ) (2020-04-28T14:26:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。