論文の概要: DAGverse: Building Document-Grounded Semantic DAGs from Scientific Papers
- arxiv url: http://arxiv.org/abs/2603.25293v1
- Date: Thu, 26 Mar 2026 10:33:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.246088
- Title: DAGverse: Building Document-Grounded Semantic DAGs from Scientific Papers
- Title(参考訳): DAGverse:科学論文からドキュメントを取り巻くセマンティックなDAGを作る
- Authors: Shu Wan, Saketh Vishnubhatla, Iskander Kushbay, Tom Heffernan, Aaron Belikoff, Raha Moraffah, Huan Liu,
- Abstract要約: DAGverseは,オンライン科学論文から文書ベースセマンティックDAGを構築するためのフレームワークである。
我々のコアコンポーネントであるDAGverse-Pipelineは、高精度セマンティックDAGの例を生成するために設計された半自動システムである。
ケーススタディとして、グラフレベル、ノードレベル、エッジレベルのエビデンスを持つ108のエキスパート検証済みセマンティックDAGのデータセットであるDAGverse-1をリリースする。
- 参考スコア(独自算出の注目度): 7.226628547623971
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Directed Acyclic Graphs (DAGs) are widely used to represent structured knowledge in scientific and technical domains. However, datasets for real-world DAGs remain scarce because constructing them typically requires expert interpretation of domain documents. We study Doc2SemDAG construction: recovering a preferred semantic DAG from a document together with the cited evidence and context that explain it. This problem is challenging because a document may admit multiple plausible abstractions, the intended structure is often implicit, and the supporting evidence is scattered across prose, equations, captions, and figures. To address these challenges, we leverage scientific papers containing explicit DAG figures as a natural source of supervision. In this setting, the DAG figure provides the DAG structure, while the accompanying text provides context and explanation. We introduce DAGverse, a framework for constructing document-grounded semantic DAGs from online scientific papers. Its core component, DAGverse-Pipeline, is a semi-automatic system designed to produce high-precision semantic DAG examples through figure classification, graph reconstruction, semantic grounding, and validation. As a case study, we test the framework for causal DAGs and release DAGverse-1, a dataset of 108 expert-validated semantic DAGs with graph-level, node-level, and edge-level evidence. Experiments show that DAGverse-Pipeline outperforms existing Vision-Language Models on DAG classification and annotation. DAGverse provides a foundation for document-grounded DAG benchmarks and opens new directions for studying structured reasoning grounded in real-world evidence.
- Abstract(参考訳): DAG(Directed Acyclic Graphs)は、科学的および技術的領域における構造化された知識を表現するために広く使われている。
しかし、実際のDAGのデータセットは、ドメイン文書の専門的な解釈を必要とするため、ほとんど残っていない。
我々はDoc2SemDAGの構築について研究し、文書から好ましい意味的DAGを復元し、それを説明する証拠や文脈を引用する。
この問題は、文書が複数の可算抽象を許容し、意図された構造はしばしば暗黙的であり、支持する証拠は散文、方程式、キャプション、数字に散らばっているためである。
これらの課題に対処するために、我々は、DAGの明確な数字を含む科学論文を、自然の監督源として活用する。
この設定では、DAGフィギュアはDAG構造を提供し、付随するテキストはコンテキストと説明を提供する。
DAGverseは,オンライン科学論文から文書ベースセマンティックDAGを構築するためのフレームワークである。
コアコンポーネントであるDAGverse-Pipelineは、図形分類、グラフ再構成、セマンティックグラウンド、バリデーションを通じて高精度な意味的DAG例を生成するように設計された半自動システムである。
ケーススタディでは、因果DAGのフレームワークを検証し、グラフレベル、ノードレベル、エッジレベルのエビデンスを持つ108のエキスパートバリデーションDAGのデータセットであるDAGverse-1をリリースする。
DAGverse-Pipelineは、DAG分類とアノテーションの既存のビジョンランゲージモデルよりも優れていることを示す実験である。
DAGverseは文書グラウンドのDAGベンチマークの基礎を提供し、現実世界のエビデンスに根ざした構造化推論を研究するための新しい方向性を開く。
関連論文リスト
- From Chains to DAGs: Probing the Graph Structure of Reasoning in LLMs [14.863369207533966]
本稿では,DAG形状の推論がモデル内部にエンコードされているかどうかを問うフレームワークであるReasoning DAG Probingを紹介する。
我々はこれらのプローブを用いて、DAG構造の階層的出現を分析し、推論関連構造を乱す制御を評価する。
この結果から,DAGの幾何学的推論が中間層に有意に符号化されていることを示す。
論文 参考訳(メタデータ) (2026-01-24T21:11:51Z) - Causal Discovery on Higher-Order Interactions [2.0697105762666324]
因果発見は、与えられた変数のセット間の因果関係を表すDAGを学ぶために専門家が提供した知識とデータを組み合わせる。
データが不足している場合、バッグングは、ブートストラップされたDAGを集約して得られる平均DAGの信頼度を測定するのに使用される。
我々は高次構造に基づく新しい理論フレームワークを導入し、新しいDAG集約アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2025-11-18T07:35:00Z) - Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graphs for Retrieval-Augmented Generation [69.45495166424642]
我々は,物語文書における時間的,因果的,文字的整合性を理解するために,頑健で差別的なQAベンチマークを開発する。
次に、バイナリマッピングでリンクされたエンティティとイベントのサブグラフを分離したまま保持するデュアルグラフフレームワークであるEntity-Event RAG(E2RAG)を紹介します。
ChronoQA全体で、我々のアプローチは最先端の非構造化およびKGベースのRAGベースラインよりも優れており、因果一貫性クエリや文字整合性クエリが顕著である。
論文 参考訳(メタデータ) (2025-06-06T10:07:21Z) - Directed Graph Grammars for Sequence-based Learning [20.579076532082684]
有向非巡回グラフ(英: Directed acyclic graph、DAG)は、実際には一般的に用いられるグラフのクラスである。
本稿では,DAGの原理的,コンパクトかつ等価な逐次表現を構築するための文法に基づく手法を提案する。
論文 参考訳(メタデータ) (2025-05-29T00:05:07Z) - Structural transfer learning of non-Gaussian DAG [24.11895013147964]
直接非巡回グラフ(DAG)は、収集されたノードの集合間の方向関係を表現するために広く用いられている。
対象研究において、DAG構造を再構築するために、異種データをまとめる方法については、未解決の問題が残る。
本稿では,DAGの構造的類似度尺度を新たに導入し,DAG学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T10:01:27Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - DAPDAG: Domain Adaptation via Perturbed DAG Reconstruction [78.76115370275733]
本研究では,人口統計量の推定を行う自動エンコーダを学習し,有向非巡回グラフ(DAG)を補助的タスクとして再構築する。
基礎となるDAG構造は、条件分布が潜伏環境変数$E$によって導かれる領域間で変化することが許される観測変数の間で不変であると仮定される。
我々は、エンコーダとデコーダをエンドツーエンドで共同で訓練し、混合変数を用いた合成および実データセットの実験を行う。
論文 参考訳(メタデータ) (2022-08-02T11:43:03Z) - DART: Open-Domain Structured Data Record to Text Generation [91.23798751437835]
82k以上のインスタンス(DART)を持つオープンドメイン構造化DAta Record to Text生成データセットであるDARTを提案する。
本稿では,テーブルヘッダとテーブルタイトル間の意味的依存関係を利用して,その構造を符号化するテーブルから意味的三重項を抽出する手法を提案する。
我々のデータセット構築フレームワークは、オープンドメイン意味解析と対話行動に基づく意味表現タスクからヘテロジニアスソースを効果的に統合する。
論文 参考訳(メタデータ) (2020-07-06T16:35:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。