論文の概要: Predicting New Concept-Object Associations in Astronomy by Mining the Literature
- arxiv url: http://arxiv.org/abs/2602.14335v1
- Date: Sun, 15 Feb 2026 23:07:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.959606
- Title: Predicting New Concept-Object Associations in Astronomy by Mining the Literature
- Title(参考訳): 文献のマイニングによる天文学における新しい概念対象協会の予測
- Authors: Jinchu Li, Yuan-Sen Ting, Alberto Accomazzi, Tirthankar Ghosal, Nesar Ramachandra,
- Abstract要約: 2025年7月までのフルアストロフコーパスから概念対象知識グラフを構築した。
我々は、OCR処理した論文から名前付き天体を抽出し、SIMBAD識別子に分解し、ソースコーパスに注釈付けされた科学概念にリンクする。
次に、過去のグラフ構造が印刷に現れる前に新しい概念オブジェクトを予測できるかどうかをテストする。
- 参考スコア(独自算出の注目度): 2.922353075144491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We construct a concept-object knowledge graph from the full astro-ph corpus through July 2025. Using an automated pipeline, we extract named astrophysical objects from OCR-processed papers, resolve them to SIMBAD identifiers, and link them to scientific concepts annotated in the source corpus. We then test whether historical graph structure can forecast new concept-object associations before they appear in print. Because the concepts are derived from clustering and therefore overlap semantically, we apply an inference-time concept-similarity smoothing step uniformly to all methods. Across four temporal cutoffs on a physically meaningful subset of concepts, an implicit-feedback matrix factorization model (alternating least squares, ALS) with smoothing outperforms the strongest neighborhood baseline (KNN using text-embedding concept similarity) by 16.8% on NDCG@100 (0.144 vs 0.123) and 19.8% on Recall@100 (0.175 vs 0.146), and exceeds the best recency heuristic by 96% and 88%, respectively. These results indicate that historical literature encodes predictive structure not captured by global heuristics or local neighborhood voting, suggesting a path toward tools that could help triage follow-up targets for scarce telescope time.
- Abstract(参考訳): 2025年7月までのフルアストロフコーパスから概念対象知識グラフを構築した。
自動パイプラインを用いて、OCR処理した論文から名前付き天体を抽出し、SIMBAD識別子に分解し、ソースコーパスに注釈付けされた科学概念にリンクする。
次に、印刷に現れる前に、過去のグラフ構造が新しい概念オブジェクトの関連を予測できるかどうかを検証する。
これらの概念はクラスタリングから派生したものであり、したがって意味的に重複するため、推論時の概念相似性平滑化ステップを全てのメソッドに均一に適用する。
概念の物理的に意味のある部分集合上の4つの時間的カットオフにおいて、暗黙のフィードバック行列分解モデル(最小二乗法、ALS)は、NDCG@100(0.144 vs 0.123)において16.8%、Recall@100(0.175 vs 0.146)では19.8%、最も高い相対性ヒューリスティック(英語版)である96%と88%を上回っている。
これらの結果は,地球規模のヒューリスティックスや地域住民投票では捉えられない予測構造を歴史的文献にエンコードしており,望遠鏡の時間不足による追従目標の達成に役立つツールへの道のりを示唆している。
関連論文リスト
- Assessing LLM Reliability on Temporally Recent Open-Domain Questions [15.456770184839726]
大規模言語モデル(LLM)は、オープンドメインの質問応答のためにますます多くデプロイされている。
我々は4つのオープンソース LLM が最近のReddit の質問 15,000 に対してどのように反応するかを調査した。
すべてのモデルは、8%のBLEU-1オーバーラップにもかかわらず、参照と99%以上のコサイン類似性を達成している。
論文 参考訳(メタデータ) (2026-01-17T21:33:27Z) - ET-Former: Efficient Triplane Deformable Attention for 3D Semantic Scene Completion From Monocular Camera [53.20087549782785]
本稿では,単一単眼カメラを用いたセマンティックシーン補完のための新しいエンドツーエンドアルゴリズムET-Formerを紹介する。
本手法は,単一のRGB観測からセマンティック占有マップを生成すると同時に,セマンティック予測のための不確実性推定を行う。
論文 参考訳(メタデータ) (2024-10-14T19:14:49Z) - Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [68.18620488664187]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。
各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - Prediction of concept lengths for fast concept learning in description
logics [2.0474076605741036]
洗練された演算子に基づく概念学習アプローチは、概念を計算するために部分的に順序付けられた解空間を探索する。
本稿では,対象概念の長さを予測するための教師付き機械学習手法を提案する。
概念長予測器をCELOEアルゴリズムに統合することで、CELOEのランタイムを最大13.4倍改善し、結果の品質に大きな変更を加えることなく実現可能であることを示す。
論文 参考訳(メタデータ) (2021-07-10T21:00:48Z) - Confidence Adaptive Anytime Pixel-Level Recognition [86.75784498879354]
任意の時間推論は、いつでも停止される可能性のある予測の進行を行うモデルを必要とする。
我々は,任意のピクセルレベルの認識に対して,最初の統一とエンドツーエンドのモデルアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-01T20:01:57Z) - Novel Perception Algorithmic Framework For Object Identification and
Tracking In Autonomous Navigation [1.370633147306388]
本稿では,自律走行車における物体の認識・追跡機能を備えた新しい認識フレームワークを提案する。
このフレームワークは、Ego-vehicleのポーズ推定とKD-Treeベースのゴールセグメンテーションアルゴリズムを利用する。
方法論の有効性は、KITTIデータセット上で検証される。
論文 参考訳(メタデータ) (2020-06-08T18:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。