論文の概要: Leveraging Graph Structures to Detect Hallucinations in Large Language Models
- arxiv url: http://arxiv.org/abs/2407.04485v1
- Date: Fri, 5 Jul 2024 13:08:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 13:30:37.810123
- Title: Leveraging Graph Structures to Detect Hallucinations in Large Language Models
- Title(参考訳): 大規模言語モデルにおける幻覚検出のためのグラフ構造の活用
- Authors: Noa Nonkes, Sergei Agaronian, Evangelos Kanoulas, Roxana Petcu,
- Abstract要約: 本稿では,潜在空間の構造から幻覚を検出する手法を提案する。
埋め込み空間に近くにある世代を接続するグラフ構造を作成します。
近隣ノードからの情報を集約するためにメッセージパッシングを利用するグラフアテンションネットワークを採用している。
- 参考スコア(独自算出の注目度): 11.64430093324654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models are extensively applied across a wide range of tasks, such as customer support, content creation, educational tutoring, and providing financial guidance. However, a well-known drawback is their predisposition to generate hallucinations. This damages the trustworthiness of the information these models provide, impacting decision-making and user confidence. We propose a method to detect hallucinations by looking at the structure of the latent space and finding associations within hallucinated and non-hallucinated generations. We create a graph structure that connects generations that lie closely in the embedding space. Moreover, we employ a Graph Attention Network which utilizes message passing to aggregate information from neighboring nodes and assigns varying degrees of importance to each neighbor based on their relevance. Our findings show that 1) there exists a structure in the latent space that differentiates between hallucinated and non-hallucinated generations, 2) Graph Attention Networks can learn this structure and generalize it to unseen generations, and 3) the robustness of our method is enhanced when incorporating contrastive learning. When evaluated against evidence-based benchmarks, our model performs similarly without access to search-based methods.
- Abstract(参考訳): 大規模言語モデルは、カスタマーサポート、コンテンツ作成、教育指導、財務指導など、幅広いタスクに広く適用されている。
しかし、よく知られた欠点は幻覚を発生させる前兆である。
これにより、これらのモデルが提供する情報の信頼性が損なわれ、意思決定やユーザの信頼に影響を与えます。
本研究では,潜伏空間の構造を調べ,幻覚・非幻覚世代内の関連を見出すことにより幻覚を検出する手法を提案する。
埋め込み空間に近くにある世代を接続するグラフ構造を作成します。
さらに,隣接ノードからの情報を集約するためにメッセージパッシングを利用したグラフアテンションネットワークを用い,その関連性に基づいて各ノードに様々な重要度を割り当てる。
以上の結果から
1) 潜在空間には、幻覚的世代と非幻覚的世代を区別する構造が存在する。
2)グラフ注意ネットワークは、この構造を学習し、それを目に見えない世代に一般化し、
3) コントラスト学習を取り入れた場合, 本手法の頑健さが向上する。
また,エビデンスベースのベンチマークに対して評価を行う場合,検索手法を使わずに同様の動作を行う。
関連論文リスト
- G-SAP: Graph-based Structure-Aware Prompt Learning over Heterogeneous Knowledge for Commonsense Reasoning [8.02547453169677]
本稿では,G-SAP という名称のコモンセンス推論のためのグラフベース構造認識プロンプト学習モデルを提案する。
特にエビデンスグラフは、ConceptNet、Wikipedia、Cambridge Dictionaryといった複数の知識ソースを統合することで構築される。
その結果、既存のモデル、特にOpenbookQAデータセット上のSoTA LM+GNNsモデルよりも6.12%改善された。
論文 参考訳(メタデータ) (2024-05-09T08:28:12Z) - Investigating the Interplay between Features and Structures in Graph
Learning [6.436174170552484]
過去には、メッセージパッシング手法のノード分類予測の改善と、ホモフィリィに強く関連していると考えられていた。
最近では、グラフが完全にヘテロ親和性であるが性能が高いノード分類タスクを構築することができるため、そのような二分法は単純すぎると研究者らは指摘した。
本研究は,ノード分類タスクの2つの生成過程を定式化することにより,この強い仮定が成立しない場合に何が起こるかを検討する。
論文 参考訳(メタデータ) (2023-08-18T14:02:56Z) - Language Knowledge-Assisted Representation Learning for Skeleton-Based
Action Recognition [71.35205097460124]
人間が他人の行動を理解して認識する方法は、複雑な神経科学の問題である。
LA-GCNは、大規模言語モデル(LLM)知識アシストを用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-21T08:29:16Z) - Representation Learning for Person or Entity-centric Knowledge Graphs:
An Application in Healthcare [0.757843972001219]
本稿では、構造化データと非構造化データからエンティティ中心のKGを抽出するエンドツーエンド表現学習フレームワークを提案する。
我々は、人の複数の面を表す星型分類器を導入し、それをKG生成のガイドに利用する。
このアプローチにはいくつかの潜在的なアプリケーションがあり、オープンソースであることを強調します。
論文 参考訳(メタデータ) (2023-05-09T17:39:45Z) - Self-organization Preserved Graph Structure Learning with Principle of
Relevant Information [72.83485174169027]
PRI-GSLは、自己組織化を特定し、隠された構造を明らかにするグラフ構造学習フレームワークである。
PRI-GSLは、フォン・ノイマンエントロピーと量子ジェンセン=シャノンの発散によって定量化された最も関連性が最も低い冗長な情報を含む構造を学ぶ。
論文 参考訳(メタデータ) (2022-12-30T16:02:02Z) - Joint Language Semantic and Structure Embedding for Knowledge Graph
Completion [66.15933600765835]
本稿では,知識三重項の自然言語記述と構造情報とを共同で組み込むことを提案する。
本手法は,学習済み言語モデルを微調整することで,完了作業のための知識グラフを埋め込む。
各種知識グラフベンチマーク実験により,本手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2022-09-19T02:41:02Z) - Integrating Visuospatial, Linguistic and Commonsense Structure into
Story Visualization [81.26077816854449]
まず、構造的入力を符号化するための選挙区解析木の利用について検討する。
第二に、構造化されたインプットをコモンセンス情報で強化し、この外部知識が視覚的ストーリーの生成に与える影響について検討する。
第3に、境界ボックスと高密度キャプションによって視覚構造を組み込んで、生成された画像の文字やオブジェクトに関するフィードバックを提供する。
論文 参考訳(メタデータ) (2021-10-21T00:16:02Z) - DisenHAN: Disentangled Heterogeneous Graph Attention Network for
Recommendation [11.120241862037911]
不均一な情報ネットワークは、リコメンデータシステムにおけるスパーシリティとコールドスタートの問題を軽減するために広く利用されている。
そこで本稿では,非交叉不均質グラフアテンションネットワークDisenHANについて,トップ$N$のレコメンデーションを提案する。
論文 参考訳(メタデータ) (2021-06-21T06:26:10Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z) - Towards Graph Representation Learning in Emergent Communication [37.8523331078468]
我々は,マルチエージェントシステムにおける言語進化と協調を支援するために,グラフ畳み込みネットワークを利用する。
画像ベースの参照ゲームに動機づけられた,複雑度の異なるグラフ参照ゲームを提案する。
出現した通信プロトコルは堅牢であり、エージェントはゲームの変動の真の要因を明らかにし、トレーニング中に遭遇したサンプルを超えて一般化することを学ぶ。
論文 参考訳(メタデータ) (2020-01-24T15:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。