論文の概要: AutoSchemaKG: Autonomous Knowledge Graph Construction through Dynamic Schema Induction from Web-Scale Corpora
- arxiv url: http://arxiv.org/abs/2505.23628v3
- Date: Fri, 01 Aug 2025 06:39:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 12:04:25.377126
- Title: AutoSchemaKG: Autonomous Knowledge Graph Construction through Dynamic Schema Induction from Web-Scale Corpora
- Title(参考訳): AutoSchemaKG: Webスケールコーパスからの動的スキーマ誘導による自律的知識グラフ構築
- Authors: Jiaxin Bai, Wei Fan, Qi Hu, Qing Zong, Chunyang Li, Hong Ting Tsang, Hongyu Luo, Yauwai Yim, Haoyu Huang, Xiao Zhou, Feng Qin, Tianshi Zheng, Xi Peng, Xin Yao, Huiwen Yang, Leijie Wu, Yi Ji, Gong Zhang, Renhai Chen, Yangqiu Song,
- Abstract要約: 完全自律的な知識グラフ構築のためのフレームワークであるAutoKGを提案する。
大規模言語モデルを利用して知識トリプルを同時に抽出し,テキストから直接包括的なスキーマを誘導する。
我々は,9億以上のノードと590億のエッジを持つ知識グラフ群であるATLAS(Automated Triple Linking And induction)を構築した。
- 参考スコア(独自算出の注目度): 51.77079220622184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present AutoSchemaKG, a framework for fully autonomous knowledge graph construction that eliminates the need for predefined schemas. Our system leverages large language models to simultaneously extract knowledge triples and induce comprehensive schemas directly from text, modeling both entities and events while employing conceptualization to organize instances into semantic categories. Processing over 50 million documents, we construct ATLAS (Automated Triple Linking And Schema induction), a family of knowledge graphs with 900+ million nodes and 5.9 billion edges. This approach outperforms state-of-the-art baselines on multi-hop QA tasks and enhances LLM factuality. Notably, our schema induction achieves 92\% semantic alignment with human-crafted schemas with zero manual intervention, demonstrating that billion-scale knowledge graphs with dynamically induced schemas can effectively complement parametric knowledge in large language models.
- Abstract(参考訳): 本稿では,事前定義されたスキーマを必要としない,完全自律的な知識グラフ構築のためのフレームワークであるAutoSchemaKGを提案する。
我々のシステムは,大規模言語モデルを活用して知識三重項を同時に抽出し,テキストから直接包括的スキーマを導き,エンティティとイベントの両方をモデル化し,概念化を活用してインスタンスをセマンティックなカテゴリに整理する。
5000万以上のドキュメントを処理し、9億以上のノードと590億のエッジを持つ知識グラフのファミリーであるATLAS(Automated Triple Linking And Schema induction)を構築します。
このアプローチは、マルチホップQAタスクにおける最先端のベースラインよりも優れ、LLMの事実性を高める。
特に、我々のスキーマ誘導は、手作業による介入がゼロの人造スキーマと92 %のセマンティックアライメントを実現し、動的に誘導されたスキーマを持つ数十億の知識グラフが、大規模言語モデルにおけるパラメトリック知識を効果的に補完できることを実証した。
関連論文リスト
- Schema Generation for Large Knowledge Graphs Using Large Language Models [5.764388991407566]
大規模言語モデル(LLM)を用いた自動スキーマ生成について検討する。
本ベンチマークでは,LLMの制約を構文的にリッチな定式化に推し進める構造生成の新たな課題について紹介する。
論文 参考訳(メタデータ) (2025-06-04T23:25:16Z) - LLMs4SchemaDiscovery: A Human-in-the-Loop Workflow for Scientific Schema Mining with Large Language Models [0.22470290096767]
従来のスキーママイニングは半構造化データに依存しており、スケーラビリティを制限している。
本稿では,大規模な言語モデルと人間のフィードバックを組み合わせてスキーマ抽出を自動化・洗練する新しいツールであるスキーママイナーを紹介する。
論文 参考訳(メタデータ) (2025-04-01T13:03:33Z) - Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z) - A Hierarchical Language Model For Interpretable Graph Reasoning [47.460255447561906]
ノード中心の局所情報と相互作用中心のグローバル構造を捉えるために2ブロックアーキテクチャを用いる階層型グラフ言語モデル(HLM-G)を導入する。
提案手法は,大規模グラフ処理における計算コストを削減しつつ,高い効率性,効率性,ロバスト性で様々なグラフクエリに対処することを可能にする。
多様なグラフ推論およびノード,リンク,グラフレベルの実世界のタスクに対する総合的な評価は,本手法の優位性を強調している。
論文 参考訳(メタデータ) (2024-10-29T00:28:02Z) - LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.28294528654885]
GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは、ゼロショットソーシャルグラフ生成のための時間ノードとエッジ生成プロセスをシミュレートする。
得られたグラフは7つの主要なマクロ的ネットワーク特性に付着し、微視的グラフ構造測定において11%の改善が達成される。
論文 参考訳(メタデータ) (2024-10-13T12:57:08Z) - Open-Domain Hierarchical Event Schema Induction by Incremental Prompting
and Verification [81.17473088621209]
イベントスキーマを,大規模言語モデル(LLM)から導出可能なコモンセンス知識の一形態として扱う。
複雑なイベントグラフの構築を3段階に分割するインクリメンタルなプロンプトおよび検証手法を設計する。
線形化グラフを生成するのにLLMを直接使用するのに比べ、時間関係が7.2%F1、階層関係が31.0%F1の大規模かつ複雑なスキーマを生成することができる。
論文 参考訳(メタデータ) (2023-07-05T01:00:44Z) - Schema-adaptable Knowledge Graph Construction [47.772335354080795]
従来の知識グラフ構築(KGC)アプローチは、通常、事前定義されたスキーマの閉じたセットで静的情報抽出パラダイムに従う。
我々は,スキーマ適応型KGCと呼ばれる新しいタスクを提案する。このタスクは,動的に変化するスキーマグラフに基づいて,再学習せずにエンティティ,リレーション,イベントを継続的に抽出することを目的としている。
論文 参考訳(メタデータ) (2023-05-15T15:06:20Z) - KGLM: Integrating Knowledge Graph Structure in Language Models for Link
Prediction [0.0]
我々は、異なるエンティティと関係型を区別することを学ぶ新しいエンティティ/リレーション埋め込み層を導入する。
知識グラフから抽出したトリプルを用いて、この追加埋め込み層を用いて言語モデルをさらに事前学習し、続いて標準微調整フェーズにより、ベンチマークデータセット上のリンク予測タスクに対して、新しい最先端のパフォーマンスが設定されることを示す。
論文 参考訳(メタデータ) (2022-11-04T20:38:12Z) - Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph
Construction [57.854498238624366]
本稿では,データ効率のよい知識グラフ構築のためのRAP(Schema-Aware Reference As Prompt)の検索手法を提案する。
RAPは、人間の注釈付きおよび弱教師付きデータから受け継いだスキーマと知識を、各サンプルのプロンプトとして動的に活用することができる。
論文 参考訳(メタデータ) (2022-10-19T16:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。