論文の概要: Adaptive and Multi-Source Entity Matching for Name Standardization of Astronomical Observation Facilities
- arxiv url: http://arxiv.org/abs/2510.05744v1
- Date: Tue, 07 Oct 2025 10:04:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.192163
- Title: Adaptive and Multi-Source Entity Matching for Name Standardization of Astronomical Observation Facilities
- Title(参考訳): 天文観測施設名標準化のための適応型・多ソース型エンティティマッチング
- Authors: Liza Fretel, Baptiste Cecconi, Laura Debisschop,
- Abstract要約: 本研究は、天文観測施設のマルチソースマッピングを作成する手法の開発に焦点をあてる。
適応可能な基準と自然言語処理(NLP)技術を用いてスコアを計算し、2つのエンティティを比較した。
ラベルや定義,説明,外部識別子など,利用可能なすべてのプロパティを活用しています。
結果として得られるマッピングは、エンティティごとに1つの標準化されたラベルのみを提供するマルチソースの同義集合で構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This ongoing work focuses on the development of a methodology for generating a multi-source mapping of astronomical observation facilities. To compare two entities, we compute scores with adaptable criteria and Natural Language Processing (NLP) techniques (Bag-of-Words approaches, sequential approaches, and surface approaches) to map entities extracted from eight semantic artifacts, including Wikidata and astronomy-oriented resources. We utilize every property available, such as labels, definitions, descriptions, external identifiers, and more domain-specific properties, such as the observation wavebands, spacecraft launch dates, funding agencies, etc. Finally, we use a Large Language Model (LLM) to accept or reject a mapping suggestion and provide a justification, ensuring the plausibility and FAIRness of the validated synonym pairs. The resulting mapping is composed of multi-source synonym sets providing only one standardized label per entity. Those mappings will be used to feed our Name Resolver API and will be integrated into the International Virtual Observatory Alliance (IVOA) Vocabularies and the OntoPortal-Astro platform.
- Abstract(参考訳): 本研究は、天文観測施設のマルチソースマッピングを作成する手法の開発に重点を置いている。
2つのエンティティを比較するために、Wikidataや天文学指向のリソースを含む8つのセマンティックアーティファクトから抽出されたエンティティをマッピングするために、適応可能な基準と自然言語処理(NLP)技術(Bag-of-Wordsアプローチ、シーケンシャルアプローチ、表面アプローチ)を用いてスコアを計算する。
ラベルや定義,説明,外部識別子など,利用可能なすべてのプロパティを活用しています。
最後に,Large Language Model (LLM) を用いてマッピング提案を受理または拒否し,正当性を提供し,検証された同義語対の妥当性とFAIR性を保証する。
結果として得られるマッピングは、エンティティごとに1つの標準化されたラベルのみを提供するマルチソースの同義集合で構成されている。
これらのマッピングは、私たちのName Resolver APIをフィードするために使用され、国際仮想天文台協会(IVOA)の語彙とOntoPortal-Astroプラットフォームに統合されます。
関連論文リスト
- MapperGPT: Large Language Models for Linking and Mapping Entities [1.5340902251924438]
MapperGPTは、大規模言語モデルを用いて、マッピングを後処理のステップとしてレビューし、洗練するアプローチである。
ハイリコール法と組み合わせることで,MapperGPTは精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-10-05T16:43:04Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Graph Adaptive Semantic Transfer for Cross-domain Sentiment
Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。
本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文 参考訳(メタデータ) (2022-05-18T07:47:01Z) - Extracting Domain-specific Concepts from Large-scale Linked Open Data [0.0]
提案手法は,LOD語彙を対象ドメインに関連する用語とリンクすることにより,検索エンティティを定義する。
対象領域における概念的関係の範囲を決定するために,共通上層実体の発生と経路の連鎖関係について検討した。
論文 参考訳(メタデータ) (2021-11-22T10:25:57Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。