論文の概要: EmpiriGraph-Psy: A Dataset and LLM Pipeline for Extracting Empirical Relation Graphs from Psychology Abstracts
- arxiv url: http://arxiv.org/abs/2606.08362v1
- Date: Sat, 06 Jun 2026 22:34:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.059459
- Title: EmpiriGraph-Psy: A Dataset and LLM Pipeline for Extracting Empirical Relation Graphs from Psychology Abstracts
- Title(参考訳): EmpiriGraph-Psy:心理学の要約から経験的関係グラフを抽出するためのデータセットとLLMパイプライン
- Authors: Danqin Zhao, Yicun Liu, Xingwei Tan, Thomas T. Hills,
- Abstract要約: EmpiriGraph-Psyは、正規化された変数、概念階層、経験的関係型、検証状態を持つドメイン訓練されたアノテータによって注釈付けされた210の心理学的抽象化のベンチマークである。
我々は,変数抽出,正規化,階層構造,エビデンス選択,関係抽出,エッジ検証を分離するグラフ構築パイプラインと直接抽出の両方を用いて,フロンティアとオープンウェイトLLMを評価した。
- 参考スコア(独自算出の注目度): 1.811932900834058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing scientific relation extraction benchmarks mainly target domains such as computer science, where entities are tasks, methods, datasets, materials, or metrics. This leaves a gap in variable-oriented empirical fields such as psychology, where findings are expressed as relations among constructs, measurements, interventions, and outcomes. We introduce variable-centered empirical graph extraction, the task of mapping scientific abstracts to typed graphs whose nodes are normalized variables and whose edges represent empirical and hierarchical relations. To support this task, we construct EmpiriGraph-Psy, a benchmark of 210 psychology abstracts annotated by domain-trained annotators with normalized variables, concept hierarchies, empirical relation types, and validation states. We evaluate frontier and open-weight LLMs using both direct extraction and a staged graph-construction pipeline that separates variable extraction, normalization, hierarchy construction, evidence selection, relation extraction, and edge validation. The staged pipeline substantially outperforms direct extraction, with the best configuration achieving a macro-F1 of 0.74. Error analysis shows that moderation relations and concept hierarchies remain the most challenging cases, highlighting the difficulty of extracting higher-order empirical claims and implicit abstraction structure from scientific abstracts.
- Abstract(参考訳): 既存の科学関係抽出ベンチマークは主に、タスク、メソッド、データセット、材料、メトリクスなどのエンティティを含むコンピュータ科学のような分野をターゲットにしている。
このことは、構成、測定、介入、結果の間の関係として発見が表現される心理学のような変数指向の経験的分野のギャップを残している。
本稿では,ノードが正規化変数であり,エッジが経験的および階層的関係を表す型グラフに科学的な抽象物をマッピングする作業である,変数中心の経験的グラフ抽出を導入する。
この課題を支援するために,210の心理学的ベンチマークであるEmpiriGraph-Psyを構築し,正規化変数,概念階層,経験的関係型,検証状態を備えたドメイン学習アノテータによって注釈付けされた心理学的アノテータを抽象化する。
我々は,変数抽出,正規化,階層構造,エビデンス選択,関係抽出,エッジ検証を分離するグラフ構築パイプラインと直接抽出の両方を用いて,フロンティアとオープンウェイトLLMを評価した。
ステージ化されたパイプラインは直接抽出よりも大幅に優れ、最高の構成でマクロF1が0.74となる。
誤り分析は、モデレーション関係と概念階層が最も困難なケースであり、科学的抽象論から高次の経験的主張と暗黙的な抽象構造を抽出することの難しさを強調している。
関連論文リスト
- Topology-Aware State Abstraction with Tangle Cores for Markov Decision Processes [6.908972852063454]
強化学習における状態抽象化は通常、報酬と遷移の類似性に基づいて状態の分割として定式化される。
これは、ナビゲーション、グラフ、階層的な決定問題において共通の構造パターンを除外する:ドア、ハブ、ボトルネックといったインターフェース状態は、自然に複数の領域にまたがる。
経験的遷移グラフのグラフトライアングルに基づいて,エンファングルコアの抽象化を導入する。
論文 参考訳(メタデータ) (2026-05-29T23:29:49Z) - Transformers Provably Learn Directed Acyclic Graphs via Kernel-Guided Mutual Information [91.66597637613263]
注意機構を活用するトランスフォーマーベースのモデルは、グラフ内の複雑な依存関係をキャプチャする上で、強い経験的成功を示している。
本稿では,カーネル誘導相互情報(KG-MI)を$f$-divergenceに基づく新しい情報理論指標を提案する。
我々は、K$親和性DAGによって生成された任意のシーケンスが、勾配上昇による単層マルチヘッドトランスを訓練し、大域的最適時間に収束することを証明した。
論文 参考訳(メタデータ) (2025-10-29T14:07:12Z) - An Empirical Study of Causal Relation Extraction Transfer: Design and Data [0.8785265845731496]
比較的単純なBioBERT-BiGRU関係抽出モデルが、様々なWebベースソースやアノテーション戦略をまたいだ他のアーキテクチャよりも一般化されていることを示す。
また、ターゲットタグを直接マッチングするのではなく、名詞句のローカライゼーションを重視した転送性能の評価指標である$Fphrase$を導入する。
論文 参考訳(メタデータ) (2025-03-08T05:51:27Z) - Entity or Relation Embeddings? An Analysis of Encoding Strategies for Relation Extraction [19.019881161010474]
関係抽出は、本質的にはテキスト分類問題であり、事前学習言語モデル(LM)を微調整することで取り組める。
既存のアプローチでは、LMを微調整して頭と尾のエンティティの埋め込みを学習し、それらのエンティティの埋め込みから関係を予測する。
本稿では,より直接的な方法で関係を捉えることにより,関係抽出モデルを改善することができるという仮説を立てる。
論文 参考訳(メタデータ) (2023-12-18T09:58:19Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - On Neural Architecture Inductive Biases for Relational Tasks [76.18938462270503]
合成ネットワーク一般化(CoRelNet)と呼ばれる類似度分布スコアに基づく簡単なアーキテクチャを導入する。
単純なアーキテクチャの選択は、分布外一般化において既存のモデルより優れていることが分かる。
論文 参考訳(メタデータ) (2022-06-09T16:24:01Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。