論文の概要: THE-Tree: Can Tracing Historical Evolution Enhance Scientific Verification and Reasoning?
- arxiv url: http://arxiv.org/abs/2506.21763v1
- Date: Thu, 26 Jun 2025 20:44:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.009336
- Title: THE-Tree: Can Tracing Historical Evolution Enhance Scientific Verification and Reasoning?
- Title(参考訳): The-Tree: 科学的検証と推論の歴史的進化を追跡できるか?
- Authors: Xin Wang, Jiyao Liu, Yulong Xiao, Junzhi Ning, Lihao Liu, Junjun He, Botian Shi, Kaicheng Yu,
- Abstract要約: textbfTechnology textbfHistory textbfEvolution Treeは,これらの領域固有の進化木を科学文献から構築する計算フレームワークである。
ノード拡張の間、新しい"Think-Verbalize-Cite-Verify"プロセスを利用している。
それぞれの進化的リンクは、回復した自然言語推論機構によって論理的コヒーレンスと明らかな支持のために検証される。
- 参考スコア(独自算出の注目度): 16.91455372359864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) are accelerating scientific idea generation, but rigorously evaluating these numerous, often superficial, AI-generated propositions for novelty and factual accuracy is a critical bottleneck; manual verification is too slow.Existing validation methods are inadequate: LLMs as standalone verifiers may hallucinate and lack domain knowledge (our findings show ~60\% unawareness of relevant papers in specific domains), while traditional citation networks lack explicit causality and narrative surveys are unstructured.This underscores a core challenge: the absence of structured, verifiable, and causally-linked historical data of scientific evolution.To address this,we introduce \textbf{THE-Tree} (\textbf{T}echnology \textbf{H}istory \textbf{E}volution Tree), a computational framework that constructs such domain-specific evolution trees from scientific literature.THE-Tree employs a search algorithm to explore evolutionary paths. During its node expansion, it utilizes a novel "Think-Verbalize-Cite-Verify" process: an LLM proposes potential advancements and cites supporting literature. Critically, each proposed evolutionary link is then validated for logical coherence and evidential support by a recovered natural language inference mechanism that interrogates the cited literature, ensuring that each step is grounded.We construct and validate 88 THE-Trees across diverse domains and release a benchmark dataset including up to 71k fact verifications covering 27k papers to foster further research.Experiments demonstrate that i) in graph completion, our THE-Tree improves hit@1 by 8\% to 14\% across multiple models compared to traditional citation networks; ii) for predicting future scientific developments, it improves hit@1 metric by nearly 10\%; and iii) when combined with other methods, it boosts the performance of evaluating important scientific papers by almost 100\%.
- Abstract(参考訳): 大規模言語モデル(LLMs)は、科学的アイデアの生成を加速しているが、これら数多くの、表面的で、しばしば表面的で、現実的な正確性のためのAI生成命題を厳密に評価することは、重大なボトルネックであり、手作業による検証は不十分である。既存の検証手法は不十分である: 独立した検証対象としてのLLMは、ドメイン知識を幻覚し、欠如している(我々の発見は、特定のドメインにおける関係する論文の無知を示している)。一方、伝統的な引用ネットワークには明確な因果性や物語的サーベイが欠如している。これは、構造的、検証可能で、因果的にリンクされた科学進化の歴史的データがないこと。これに対処するために、 {\textbf{Thee} (\text{bech} \text{bech} \text{bech} \text{fectory \text{fectory \text{e}}}}}, 科学進化の進化の過程を探索する。
ノード拡張の間、新しい"Think-Verbalize-Cite-Verify"プロセスを使用し、LCMは潜在的な進歩を提案し、文献を引用する。
批判的に、各進化的リンクは、引用された文献を疑問視し、各ステップが根拠となるように復元された自然言語推論機構によって論理的コヒーレンスと明らかな支持のために検証され、我々は、さまざまなドメインにまたがる88のThe-Treesを構築し検証し、さらに研究を促進するために、27k論文をカバーする71kの事実検証を含むベンチマークデータセットをリリースする。
i) グラフ補完においては、従来の引用ネットワークと比較して、hit@1を8\%から14\%改善します。
二 今後の科学的発展を予測するため、hit@1の指標を約10%改善する。
三 他の方法と組み合わせることで、重要科学論文の評価性能を約100倍に向上させる。
関連論文リスト
- Mapping the Evolution of Research Contributions using KnoVo [0.0]
KnoVoは、科学文献における研究ノベルティの進化を定量化し分析するために設計されたインテリジェントなフレームワークである。
論文の新規性は、その多層励起ネットワークにおける前処理と後処理の両方に対して決定される。
論文 参考訳(メタデータ) (2025-06-20T23:17:11Z) - Bayesian Epistemology with Weighted Authority: A Formal Architecture for Truth-Promoting Autonomous Scientific Reasoning [0.0]
本稿では,ベイジアン・エピステロジーとウェイト・オーソリティ(BEWA)を紹介する。
BEWAは、構造化された科学的主張に対する動的で確率論的に一貫性のある関数としての信念を運用している。
グラフベースのクレーム伝搬、権威的信頼性モデリング、暗号化アンカー、ゼロ知識監査検証をサポートする。
論文 参考訳(メタデータ) (2025-06-19T04:22:35Z) - Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [63.98194996746229]
大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。
我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文 参考訳(メタデータ) (2024-12-19T13:55:48Z) - Enhancing Systematic Decompositional Natural Language Inference Using Informal Logic [51.967603572656266]
我々は,分解包含を注釈付けするための一貫した理論的なアプローチを導入する。
我々の新しいデータセットRDTEは、前回の分解エンターメントデータセットよりもかなり高い内部整合性(+9%)を持つことがわかった。
また,RDTE による知識蒸留によるエンテーメント分類器の訓練や,エンテーメントツリー推論エンジンへの導入により,精度と検証精度が向上することが確認された。
論文 参考訳(メタデータ) (2024-02-22T18:55:17Z) - Evaluating BERT-based Scientific Relation Classifiers for Scholarly
Knowledge Graph Construction on Digital Library Collections [5.8962650619804755]
関連する科学的概念間の意味的関係を推測することは重要なステップである。
BERTベースの事前学習モデルは、自動関係分類のために広く研究されている。
既存の手法は主にクリーンテキストで評価される。
これらの制限に対処するため、私たちはOCRノイズの多いテキストを作成しました。
論文 参考訳(メタデータ) (2023-05-03T17:32:16Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。