論文の概要: OntoMetric: An Ontology-Guided Framework for Automated ESG Knowledge Graph Construction
- arxiv url: http://arxiv.org/abs/2512.01289v1
- Date: Mon, 01 Dec 2025 05:21:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.691825
- Title: OntoMetric: An Ontology-Guided Framework for Automated ESG Knowledge Graph Construction
- Title(参考訳): OntoMetric: ESG知識グラフ構築自動化のためのオントロジーガイドフレームワーク
- Authors: Mingqin Yu, Fethi Rabhi, Boming Xia, Zhengyi Yang, Felix Tan, Qinghua Lu,
- Abstract要約: OntoMetricは、ESG規制文書を検証済みのAIおよびWeb対応の知識グラフに変換するオントロジーガイダンスフレームワークである。
OntoMetricは65-90%のセマンティック精度と80-90%のスキーマ準拠を実現している。
- 参考スコア(独自算出の注目度): 4.736397889087109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Environmental, Social, and Governance (ESG) disclosure frameworks such as SASB, TCFD, and IFRS S2 require organizations to compute and report numerous metrics for compliance, yet these requirements are embedded in long, unstructured PDF documents that are difficult to interpret, standardize, and audit. Manual extraction is unscalable, while unconstrained large language model (LLM) extraction often produces inconsistent entities, hallucinated relationships, missing provenance, and high validation failure rates. We present OntoMetric, an ontology-guided framework that transforms ESG regulatory documents into validated, AI- and web-ready knowledge graphs. OntoMetric operates through a three-stage pipeline: (1) structure-aware segmentation using table-of-contents boundaries, (2) ontology-constrained LLM extraction that embeds the ESGMKG schema into prompts while enriching entities with semantic fields for downstream reasoning, and (3) two-phase validation that combines LLM-based semantic verification with rule-based schema checking across entity, property, and relationship levels (VR001-VR006). The framework preserves both segment-level and page-level provenance for audit traceability. Evaluated on five ESG standards (SASB Commercial Banks, SASB Semiconductors, TCFD, IFRS S2, AASB S2) totaling 228 pages and 60 segments, OntoMetric achieves 65-90% semantic accuracy and 80-90% schema compliance, compared to 3-10% for baseline unconstrained extraction, at approximately 0.01 to 0.02 USD per validated entity. Our results demonstrate that combining symbolic ontology constraints with neural extraction enables reliable, auditable knowledge graphs suitable for regulatory compliance and web integration, supporting downstream applications such as sustainable-finance analytics, transparency portals, and automated compliance tools.
- Abstract(参考訳): SASB、TFD、IFRS S2といった環境、社会、ガバナンス(ESG)の開示フレームワークは、コンプライアンスのための多くのメトリクスを計算し、報告する必要があるが、これらの要件は解釈、標準化、監査が難しい長く構造化されていないPDF文書に埋め込まれている。
手動の抽出は不可能であるが、制約のない大言語モデル(LLM)の抽出は、一貫性のない実体、幻覚的関係、未解決の証明、高い検証失敗率をしばしば生み出す。
OntoMetricは、ESG規制文書を検証済みのAIおよびWeb対応の知識グラフに変換するオントロジー誘導フレームワークである。
OntoMetric は,(1) テーブル・オブ・コンテント境界を用いた構造認識セグメンテーション,(2) ESGMKG スキーマをプロンプトに組み込んだオントロジー制約付き LLM 抽出,(3) エンティティを下流推論のセマンティックフィールドと組み合わせたエンティティの強化,(3) ルールベースのセマンティック検証とエンティティ,プロパティ,関係レベルをまたいだルールベースのスキーマチェック(VR001-VR006) という3段階のパイプラインを通じて動作する。
このフレームワークは、監査トレーサビリティのためのセグメントレベルとページレベルの証明の両方を保存する。
5つのESG標準(SASB Commercial Banks, SASB Semiconductors, TCFD, IFRS S2, AASB S2)の合計228ページと60セグメントで評価され、OntoMetricは65-90%のセマンティック精度と80-90%のスキーマコンプライアンスを達成した。
我々の結果は,ニューラル抽出とシンボリックオントロジー制約を組み合わせることで,規制コンプライアンスやWeb統合に適した信頼性の高い監査可能な知識グラフが実現できることを示し,持続可能なファイナンス分析,透明性ポータル,自動コンプライアンスツールといった下流アプリケーションをサポートする。
関連論文リスト
- A Modular, Data-Free Pipeline for Multi-Label Intention Recognition in Transportation Agentic AI Applications [12.25149118082394]
輸送におけるエージェントAIアプリケーションに対して,マルチラベル意図認識のためのモジュール型データフリーパイプラインを提案する。
大規模で注釈付きコーパスに依存する従来の意図認識システムとは異なり、当社のアプローチはコストのかかるデータ収集の必要性を排除している。
我々のシステムはユーザクエリをタスク固有のモジュールにシームレスにルーティングし、完全な自律的意図認識エージェントの基盤となる。
論文 参考訳(メタデータ) (2025-11-05T11:08:08Z) - Automatic Building Code Review: A Case Study [6.530899637501737]
建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-03T00:30:14Z) - Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文 参考訳(メタデータ) (2025-09-30T22:19:44Z) - RELATE: Relation Extraction in Biomedical Abstracts with LLMs and Ontology Constraints [2.844531679990474]
我々は,LLM抽出された関係を標準化されたKGにマッピングする3段階パイプラインであるRELATEを紹介する。
パイプラインには、(1)埋め込みによる前処理、(2)SapBERTで強化された類似性ベースの検索、(3)明示的な否定処理を備えた再ランクが含まれる。
ChemProtベンチマークでは、RELATEは52%の正確な一致と94%の精度@10を2,400 HEAL Projectの抽象化で達成している。
論文 参考訳(メタデータ) (2025-09-23T14:21:46Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - Explainable Rule Application via Structured Prompting: A Neural-Symbolic Approach [0.0]
大規模言語モデル(LLM)は複雑な推論タスクでは優れているが、一貫性のあるルールアプリケーション、例外処理、説明可能性に苦慮している。
本稿では、推論を3つの検証可能なステップ(エンティティ識別、プロパティ抽出、シンボリックルール適用)に分解する構造化プロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-19T14:14:01Z) - A Controllable Examination for Long-Context Language Models [62.845852724511964]
本研究では,長文言語モデルを評価するベンチマークである$textbfLongBioBenchを紹介する。
その結果,ほとんどのモデルでは,検索結果に対する意味的理解や基礎的推論が不足していることが判明した。
我々のさらなる分析は、文脈的非コヒーレンスなど、既存の合成ベンチマークで採用されているいくつかの設計選択を示している。
論文 参考訳(メタデータ) (2025-06-03T14:23:06Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - Sparse Autoencoder Features for Classifications and Transferability [11.2185030332009]
大規模言語モデル(LLM)からの特徴抽出のためのスパースオートエンコーダ(SAE)の解析
本フレームワークは,(1)モデル層選択とスケーリング特性,(2)幅とプール戦略を含むSAEアーキテクチャ構成,(3)連続SAE活性化のバイナライズ効果を評価する。
論文 参考訳(メタデータ) (2025-02-17T02:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。