論文の概要: Mind the Gap: Aligning Knowledge Bases with User Needs to Enhance Mental Health Retrieval
- arxiv url: http://arxiv.org/abs/2509.13626v1
- Date: Wed, 17 Sep 2025 01:54:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.686777
- Title: Mind the Gap: Aligning Knowledge Bases with User Needs to Enhance Mental Health Retrieval
- Title(参考訳): Mind the Gap: メンタルヘルスの検索を促進するための知識ベースとユーザニーズの調整
- Authors: Amanda Chan, James Jiayu Liu, He Kai, Onno P. Kampman,
- Abstract要約: 信頼できるメンタルヘルス情報へのアクセスは、早期のヘルプ検索には不可欠であるが、知識ベースの拡大はリソース集約であり、しばしばユーザのニーズと一致しない。
本稿では,コーパス拡張のためのAIベースのギャップインフォームド・フレームワークを提案する。このフレームワークは,対象範囲と有用性に基づいて拡張を優先順位付けするために,フォーラムポストなどの自然主義的ユーザデータをオーバーレイすることで,未表現のトピック(ギャップ)を忠実に識別する。
- 参考スコア(独自算出の注目度): 0.5571036442908964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Access to reliable mental health information is vital for early help-seeking, yet expanding knowledge bases is resource-intensive and often misaligned with user needs. This results in poor performance of retrieval systems when presented concerns are not covered or expressed in informal or contextualized language. We present an AI-based gap-informed framework for corpus augmentation that authentically identifies underrepresented topics (gaps) by overlaying naturalistic user data such as forum posts in order to prioritize expansions based on coverage and usefulness. In a case study, we compare Directed (gap-informed augmentations) with Non-Directed augmentation (random additions), evaluating the relevance and usefulness of retrieved information across four retrieval-augmented generation (RAG) pipelines. Directed augmentation achieved near-optimal performance with modest expansions--requiring only a 42% increase for Query Transformation, 74% for Reranking and Hierarchical, and 318% for Baseline--to reach ~95% of the performance of an exhaustive reference corpus. In contrast, Non-Directed augmentation required substantially larger and thus practically infeasible expansions to achieve comparable performance (232%, 318%, 403%, and 763%, respectively). These results show that strategically targeted corpus growth can reduce content creation demands while sustaining high retrieval and provision quality, offering a scalable approach for building trusted health information repositories and supporting generative AI applications in high-stakes domains.
- Abstract(参考訳): 信頼できるメンタルヘルス情報へのアクセスは、早期のヘルプ検索には不可欠であるが、知識ベースの拡大はリソース集約であり、しばしばユーザのニーズと一致しない。
その結果、提示された関心が非公式あるいは文脈化された言語でカバーされない、あるいは表現されていない場合、検索システムの性能は低下する。
本稿では,コーパス拡張のためのAIベースのギャップインフォームド・フレームワークを提案する。このフレームワークは,対象範囲と有用性に基づいて拡張を優先順位付けするために,フォーラムポストなどの自然主義的ユーザデータをオーバーレイすることで,未表現のトピック(ギャップ)を忠実に識別する。
ケーススタディでは、4つの検索拡張世代(RAG)パイプラインにおける検索情報の有効性と有用性を評価し、ダイレクト(ギャップインフォームド・オーグメンテーション)と非ダイレクト・オーグメンテーション(ランダム加算)を比較した。
クエリ変換の42%増加、74%のランク付けと階層化、318%のベースライン – 徹底的な参照コーパスのパフォーマンスの95%に到達した。
対照的に、非指向的な拡張は、同等のパフォーマンスを達成するために、実質的には不可能な拡張を必要とした(232%、318%、403%、763%)。
これらの結果から、戦略的にターゲットとするコーパス成長は、高い検索と供給品質を維持しながら、コンテンツ作成要求を低減し、信頼されたヘルス情報リポジトリの構築と、高い領域における生成AIアプリケーションのサポートにスケーラブルなアプローチを提供することを示す。
関連論文リスト
- Ontology-Guided Query Expansion for Biomedical Document Retrieval using Large Language Models [2.4897806364302633]
BMQExpanderは、UMLSメタセサウルスからの医療知識(定義と関係)と大規模言語モデル(LLM)の生成能力を組み合わせた、検索効率を向上させる新しいクエリ拡張パイプラインである。
我々は,BMQExpanderが3つの一般的なバイオメディカル情報検索(IR)ベンチマークにおいて,より優れた検索性能を有することを示す。
論文 参考訳(メタデータ) (2025-08-15T19:23:26Z) - Divide-Then-Align: Honest Alignment based on the Knowledge Boundary of RAG [51.120170062795566]
本稿では,問合せが知識境界外にある場合の"I don't know"で応答する機能を備えたRAGシステムを実現するためのDTAを提案する。
DTAは適切な棄権と精度のバランスをとり、検索強化システムの信頼性と信頼性を高める。
論文 参考訳(メタデータ) (2025-05-27T08:21:21Z) - Safety Devolution in AI Agents [56.482973617087254]
本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。
整列 LLM 上に構築された検索補助エージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。
これらの発見は、検索が強化され、ますます自律的なAIシステムにおいて、公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-20T11:21:40Z) - Enhancing Health Information Retrieval with RAG by Prioritizing Topical Relevance and Factual Accuracy [0.7673339435080445]
本稿では, 科学的根拠に基づく健康関連文書の検索を促進するために, RAG(Retrieval-Augmented Generation)を駆使した手法を提案する。
特に,3段階のモデルを提案する。第1段階では,科学的文献によって構成された知識ベースから,利用者のクエリを用いて,関連した項目を検索する。
第2段階では、これらのパスは初期クエリとともにLLMによって処理され、コンテキストに関連のあるリッチテキスト(GenText)を生成する。
最終段階では、検索対象の文書を評価・ランク付けする。
論文 参考訳(メタデータ) (2025-02-07T05:19:13Z) - Context Awareness Gate For Retrieval Augmented Generation [2.749898166276854]
Retrieval Augmented Generation (RAG) は、大規模言語モデル(LLM)の限界を軽減し、ドメイン固有の質問に答える手段として広く採用されている。
これまでの研究は主に、取得したデータチャンクの精度と品質を改善し、生成パイプライン全体のパフォーマンスを向上させることに重点を置いてきた。
オープンドメイン質問応答における無関係情報検索の効果について検討し,LLM出力の品質に対する顕著な有害な影響を明らかにする。
論文 参考訳(メタデータ) (2024-11-25T06:48:38Z) - Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage [74.70255719194819]
サブクエストカバレッジに基づく新しいフレームワークを導入し、RAGシステムが質問の異なる面にどのように対処するかを計測する。
このフレームワークを使用して、You.com、Perplexity AI、Bing Chatの3つの商用生成応答エンジンを評価します。
すべての回答エンジンは、バックグラウンドやフォローアップよりも、コアサブクエストを頻繁にカバーしていますが、コアサブクエストの約50%を見逃しています。
論文 参考訳(メタデータ) (2024-10-20T22:59:34Z) - The Geometry of Queries: Query-Based Innovations in Retrieval-Augmented Generation for Healthcare QA [1.2839205715237014]
QB-RAG(QB-RAG)は、医療質問応答における検索機能強化のためのフレームワークである。
QB-RAG の鍵となるコンポーネントは LLM ベースのフィルタリング機構であり、関連する質問と回答可能な質問だけがデータベースに含まれることを保証する。
医療データを用いた経験的評価は,既存の検索手法と比較してQB-RAGの優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-25T13:47:01Z) - Query Augmentation by Decoding Semantics from Brain Signals [61.89860975682576]
本稿では,脳信号からデコードされた意味情報を組み込んでクエリを強化するBrain-Augを提案する。
fMRIデータセットの実験的結果は、Brain-Augが意味的により正確なクエリを生成することを示している。
論文 参考訳(メタデータ) (2024-02-24T04:08:51Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。