論文の概要: Knowledge Graph Representations for LLM-Based Policy Compliance Reasoning
- arxiv url: http://arxiv.org/abs/2604.27713v1
- Date: Thu, 30 Apr 2026 10:57:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.054867
- Title: Knowledge Graph Representations for LLM-Based Policy Compliance Reasoning
- Title(参考訳): LLMに基づくポリシーコンプライアンス推論のための知識グラフ表現
- Authors: Wilder Baldwin, Sepideh Ghanavati,
- Abstract要約: 本稿では、AIポリシー文書から知識グラフ(KG)を構築し、ポリシー関連情報を検索して質問に答えるエージェントフレームワークを提案する。
我々は、2つのオントロジースキーマの下で3つのAIリスク関連警察からKGを構築し、次に6つの推論タイプにまたがる42のポリシーQAタスクに対して5つのLCMを評価する。
- 参考スコア(独自算出の注目度): 0.4010598744735378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The risks posed by AI features are increasing as they are rapidly integrated into software applications. In response, regulations and standards for safe and secure AI have been proposed. In this paper, we present an agentic framework that constructs knowledge graphs (KGs) from AI policy documents and retrieves policy-relevant information to answer questions. We build KGs from three AI risk-related polices under two ontology schemas, and then evaluate five LLMs on 42 policy QA tasks spanning six reasoning types, from entity lookup to cross-policy inference, using both heuristic scoring and an LLM-as-judge. KG augmentation improves scores for all five models, and an open, LLM-discovered schema matches or exceeds the formal ontology.
- Abstract(参考訳): AI機能によって引き起こされるリスクは、ソフトウェアアプリケーションに急速に統合されるにつれて増大している。
これに対し、安全でセキュアなAIの規則と標準が提案されている。
本稿では、AIポリシー文書から知識グラフ(KG)を構築し、ポリシー関連情報を検索して質問に答えるエージェントフレームワークを提案する。
2つのオントロジースキーマの下で3つのAIリスク関連警察からKGを構築し、その後、ヒューリスティックスコアとLLM-as-judgeの両方を用いて、エンティティルックアップからクロス政治推論までの6つの推論タイプにわたる42のポリシーQAタスクに対して、5つのLLMを評価する。
KG拡張は5つのモデルのスコアを改善し、オープンでLLMで発見されたスキーマは公式なオントロジーにマッチするか、超える。
関連論文リスト
- Executable Knowledge Graphs for Replicating AI Research [65.41207324831583]
Executable Knowledge Graphs (xKG) は、科学文献から抽出された技術的洞察、コードスニペット、ドメイン固有の知識を自動的に統合するモジュラーでプラグイン可能な知識基盤である。
コードはhttps://github.com/zjunlp/xKGでリリースされる。
論文 参考訳(メタデータ) (2025-10-20T17:53:23Z) - Analyzing and Internalizing Complex Policy Documents for LLM Agents [53.14898416858099]
大規模言語モデル(LLM)ベースのエージェントシステムは、多様なビジネスルールをコードするコンテキスト内ポリシー文書に依存している。
これは、パフォーマンスを保ちながら、ポリシー文書をモデルプリエントに組み込む内部化手法の開発を動機付けます。
CC-Genは4つのレベルにまたがる制御可能な複雑度を持つエージェントベンチマークジェネレータである。
論文 参考訳(メタデータ) (2025-10-13T16:30:07Z) - Large model retrieval enhancement framework for construction site risk identification [13.937158723906876]
本研究では,大規模言語モデル(LLM)を微調整を必要とせずに拡張する検索拡張フレームワークを提案する。
提案手法は外部知識を統合し,プロンプトチューニングにより類似事例を検索する。
実地データに基づいて評価した結果,GLM-4Vの精度は50%に向上し,ベースラインよりも35.49%向上した。
論文 参考訳(メタデータ) (2025-08-04T05:28:58Z) - Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization [80.09112808413133]
Mujicaは、質問をサブクエストの非循環グラフに分解するプランナーであり、検索と推論を通じて質問を解決するワーカーである。
MyGOは、従来のポリシー更新を勾配的いいねりの最大推定に置き換える、新しい強化学習手法である。
複数のデータセットにまたがる実験結果から,マルチホップQA性能向上における MujicaMyGO の有効性が示された。
論文 参考訳(メタデータ) (2025-05-20T18:33:03Z) - Mitigating LLM Hallucinations with Knowledge Graphs: A Case Study [2.40997250653065]
LinkQは、LLMに質問応答(QA)中の地文データに対する知識グラフをクエリさせ、幻覚と戦うために開発されたオープンソースの自然言語インタフェースである。
我々は、よく知られたKGQAデータセットを用いてLinkQの定量的評価を行い、システムがGPT-4より優れているが、まだ特定の質問カテゴリに苦慮していることを示す。
実際のサイバーセキュリティKGを使用して、2つのドメインの専門家とLinkQの質的研究を議論し、これらの専門家のフィードバック、提案、認識された制限、LinkQのようなシステムの将来的な機会について概説する。
論文 参考訳(メタデータ) (2025-04-16T18:40:01Z) - Graph-Augmented Reasoning: Evolving Step-by-Step Knowledge Graph Retrieval for LLM Reasoning [55.6623318085391]
最近の大規模言語モデル(LLM)推論は、限られたドメイン知識、幻覚への感受性、制約された推論深さに悩まされている。
本稿では、ステップワイズ知識グラフ検索とステップワイズ推論の統合に関する最初の研究について述べる。
本稿では,プロセス指向の知識グラフ構築を中心としたフレームワークであるKG-RAR,階層的検索戦略,検索後処理と報酬モデルを提案する。
論文 参考訳(メタデータ) (2025-03-03T15:20:41Z) - SymAgent: A Neural-Symbolic Self-Learning Agent Framework for Complex Reasoning over Knowledge Graphs [38.517345561999115]
SymAgentは、知識グラフと大規模言語モデルとの協調的な拡張を実現する革新的なニューラルシンボリックエージェントフレームワークである。
我々はKGを動的環境として概念化し、複雑な推論タスクを多段階の対話プロセスに変換することにより、KGが推論プロセスに深く参加できるようにする。
論文 参考訳(メタデータ) (2025-02-05T15:37:05Z) - Navigating the Risks: A Survey of Security, Privacy, and Ethics Threats in LLM-Based Agents [67.07177243654485]
この調査は、大規模言語モデルに基づくエージェントが直面するさまざまな脅威を収集、分析する。
LLMをベースとしたエージェントの6つの重要な特徴を概説する。
4つの代表エージェントをケーススタディとして選択し,実践的に直面する可能性のあるリスクを分析した。
論文 参考訳(メタデータ) (2024-11-14T15:40:04Z) - SecQA: A Concise Question-Answering Dataset for Evaluating Large
Language Models in Computer Security [0.0]
本稿では,コンピュータセキュリティ分野におけるLarge Language Models(LLM)の性能評価を目的とした,新しいデータセットSecQAを紹介する。
複雑さが増大する2つのバージョンを含むSecQAの構造と意図を詳述し、様々な難易度で簡潔な評価を行う。
GPT-3.5-Turbo, GPT-4, Llama-2, Vicuna, Mistral, Zephyrの各モデルにおいて,0ショットと5ショットの学習設定を用いて,優れたLCMの評価を行った。
論文 参考訳(メタデータ) (2023-12-26T00:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。