論文の概要: Addressing accuracy and hallucination of LLMs in Alzheimer's disease research through knowledge graphs
- arxiv url: http://arxiv.org/abs/2508.21238v1
- Date: Thu, 28 Aug 2025 22:03:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.885679
- Title: Addressing accuracy and hallucination of LLMs in Alzheimer's disease research through knowledge graphs
- Title(参考訳): 知識グラフを用いたアルツハイマー病研究におけるLSMの適応精度と幻覚
- Authors: Tingxuan Xu, Jiarui Feng, Justin Melendez, Kaleigh Roberts, Donghong Cai, Mingfang Zhu, Donald Elbert, Yixin Chen, Randall J. Bateman,
- Abstract要約: 2つの人気のあるGraphRAGシステムの品質とトレーサビリティを評価する。
アルツハイマー病に関する50の論文と70の専門的な質問をデータベースにまとめる。
本稿では,複数の検索拡張生成システム(RAG)とグラフRAGシステムのトレーサビリティについて論じ,評価する。
- 参考スコア(独自算出の注目度): 8.47539227324541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the past two years, large language model (LLM)-based chatbots, such as ChatGPT, have revolutionized various domains by enabling diverse task completion and question-answering capabilities. However, their application in scientific research remains constrained by challenges such as hallucinations, limited domain-specific knowledge, and lack of explainability or traceability for the response. Graph-based Retrieval-Augmented Generation (GraphRAG) has emerged as a promising approach to improving chatbot reliability by integrating domain-specific contextual information before response generation, addressing some limitations of standard LLMs. Despite its potential, there are only limited studies that evaluate GraphRAG on specific domains that require intensive knowledge, like Alzheimer's disease or other biomedical domains. In this paper, we assess the quality and traceability of two popular GraphRAG systems. We compile a database of 50 papers and 70 expert questions related to Alzheimer's disease, construct a GraphRAG knowledge base, and employ GPT-4o as the LLM for answering queries. We then compare the quality of responses generated by GraphRAG with those from a standard GPT-4o model. Additionally, we discuss and evaluate the traceability of several Retrieval-Augmented Generation (RAG) and GraphRAG systems. Finally, we provide an easy-to-use interface with a pre-built Alzheimer's disease database for researchers to test the performance of both standard RAG and GraphRAG.
- Abstract(参考訳): 過去2年間で、ChatGPTのような大規模言語モデル(LLM)ベースのチャットボットは、多様なタスク補完と質問応答機能を実現することで、様々なドメインに革命をもたらした。
しかしながら、科学的研究におけるそれらの応用は、幻覚、限られたドメイン固有の知識、そして応答に対する説明可能性やトレーサビリティの欠如といった課題によって制限されている。
グラフベースのRetrieval-Augmented Generation(GraphRAG)は、応答生成前にドメイン固有のコンテキスト情報を統合することで、チャットボットの信頼性を向上させるための有望なアプローチとして登場した。
その可能性にもかかわらず、アルツハイマー病や他の生物医学領域のような集中的な知識を必要とする特定の領域でGraphRAGを評価する研究は限られている。
本稿では,2種類のGraphRAGシステムの品質とトレーサビリティを評価する。
我々は、アルツハイマー病に関する50の論文と70の専門的質問のデータベースをコンパイルし、GraphRAG知識ベースを構築し、問合せにLPMとしてGPT-4oを用いる。
次に、GraphRAGが生成する応答の質を標準GPT-4oモデルと比較する。
さらに,複数のレトリーバル拡張生成システム(RAG)とグラフRAGシステムのトレーサビリティを議論し,評価する。
最後に、研究者が標準的なRAGとGraphRAGの両方の性能をテストするために、プレビルドされたアルツハイマー病データベースを用いた使い勝手の良いインタフェースを提供する。
関連論文リスト
- Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey [15.60128530639056]
大規模な言語モデル(LLM)は、十分なトレーニングデータと最も更新された知識が不足しているため、推論中に事実エラーに悩まされる。
検索・拡張生成(RAG)はLLMの限界に対処するための有望な解決策として注目されている。
この調査は、RAG内のグラフの機能とパフォーマンス向上への影響について、新たな視点を提供する。
論文 参考訳(メタデータ) (2025-04-08T03:52:05Z) - Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文 参考訳(メタデータ) (2024-12-31T06:59:35Z) - Graph Retrieval-Augmented Generation: A Survey [28.979898837538958]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の課題に再トレーニングを必要とせずに対処することに成功した。
本稿では,GraphRAGの方法論について概観する。
Graph-Based Indexing、Graph-Guided Retrieval、Graph-Enhanced Generationを含むGraphRAGワークフローを形式化する。
論文 参考訳(メタデータ) (2024-08-15T12:20:24Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - Biomedical knowledge graph-optimized prompt generation for large language models [1.6658478064349376]
大規模言語モデル(LLM)は前例のない速度で採用されているが、バイオメディシンのような知識集約ドメインでは依然として課題に直面している。
本稿では,トークン最適化およびロバストな知識グラフに基づくRetrieval Augmented Generationフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-11-29T03:07:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。