Fugu-MT 論文翻訳(概要): COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling

論文の概要: COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling

arxiv url: http://arxiv.org/abs/2603.08392v1
Date: Mon, 09 Mar 2026 13:49:57 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-10 15:13:16.115417
Title: COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling
Title（参考訳）: COACHがQUORUMに到達 - LLMによるヘルスカウンセラーにおけるユーザ、エキスパート、開発者の視点からのフレームワークとパイプライン
Authors: Yee Man Ng, Bram van Dijk, Pieter Beynen, Otto Boekesteijn, Joris Jansen, Gerard van Oortmerssen, Max van Duijn, Marco Spruit,
Abstract要約: 開発者、専門家、ユーザ中心の視点を統一する新しい評価フレームワークであるQUORUMを紹介します。実際のケーススタディで、利害関係者の視点の収束と分散を有意義に追跡していることを示します。当社のフレームワークを適用すると、ユーザ、医療専門家、開発者は、生成されたカウンセリングは関連性があり、品質が良く、信頼性が高いという意見に収束します。
参考スコア（独自算出の注目度）: 2.376986521880118
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Systems that collect data on sleep, mood, and activities can provide valuable lifestyle counselling to populations affected by chronic disease and its consequences. Such systems are, however, challenging to develop; besides reliably extracting patterns from user-specific data, systems should also contextualise these patterns with validated medical knowledge to ensure the quality of counselling, and generate counselling that is relevant to a real user. We present QUORUM, a new evaluation framework that unifies these developer-, expert-, and user-centric perspectives, and show with a real case study that it meaningfully tracks convergence and divergence in stakeholder perspectives. We also present COACH, a Large Language Model-driven pipeline to generate personalised lifestyle counselling for our Healthy Chronos use case, a diary app for cancer patients and survivors. Applying our framework shows that overall, users, medical experts, and developers converge on the opinion that the generated counselling is relevant, of good quality, and reliable. However, stakeholders also diverge on the tone of the counselling, sensitivity to errors in pattern-extraction, and potential hallucinations. These findings highlight the importance of multi-stakeholder evaluation for consumer health language technologies and illustrate how a unified evaluation framework can support trustworthy, patient-centered NLP systems in real-world settings.
Abstract（参考訳）: 睡眠、気分、活動に関するデータを収集するシステムは、慢性疾患の影響を受ける人口とその影響に対する貴重なライフスタイルカウンセリングを提供することができる。しかし、このようなシステムは開発が困難であり、ユーザ固有のデータからパターンを確実に抽出するだけでなく、検証済みの医療知識でパターンを文脈化してカウンセリングの品質を確保し、実際のユーザに関連するカウンセリングを生成する必要がある。我々は,これらの開発者,専門家,ユーザ中心の視点を統一する新たな評価フレームワークであるQUORUMを紹介し,利害関係者の視点の収束と分散を有意義に追跡する実例を提示する。我々はまた,我々のHealthy Chronosユースケースのための個人化されたライフスタイルカウンセリングを生成するための大規模言語モデル駆動パイプラインであるCOACH,がん患者や生き残りのための日記アプリについても紹介する。私たちのフレームワークを適用することで、ユーザ、医療専門家、開発者は、生成したカウンセリングは関連性があり、品質が良く、信頼性が高い、という意見にまとめられます。しかし、利害関係者はカウンセリングのトーン、パターン抽出におけるエラーへの感受性、および潜在的幻覚にも依存する。これらの知見は、消費者健康言語技術におけるマルチステークホルダー評価の重要性を浮き彫りにし、現実の環境で患者中心のNLPシステムに対して、統一評価フレームワークがいかにして、信頼できる、患者中心のNLPシステムをサポートするかを示した。

関連論文リスト

CARE: An Explainable Computational Framework for Assessing Client-Perceived Therapeutic Alliance Using Large Language Models [19.027335814014528]
本稿では,多次元アライアンススコアを自動的に予測し,カウンセリングテキストから解釈可能な有理性を生成するLLMベースのフレームワークであるCAREを提案する。 CAREはCounselingWAIデータセット上に構築されており、9,516人の専門家による合理性によって強化されている。実験の結果,CAREはLLMよりも優れており,カウンセラー評価とクライアント認識アライアンスとのギャップを大幅に減らすことがわかった。
論文参考訳（メタデータ） (2026-02-24T07:52:56Z)
An Interpretable Recommendation Model for Psychometric Data, With an Application to Gerontological Primary Care [0.4464102544889846]
提案する推奨モデルが,個人化されたケアプランの作成に役立てられることを示すため,狭義の医療ニッチである老年学プライマリケアに重点を置いている。以上の結果から,提案モデルが医療ニッチにおけるレコメンダシステムの適用を推し進める可能性が示唆された。
論文参考訳（メタデータ） (2026-01-27T17:29:21Z)
PsyProbe: Proactive and Interpretable Dialogue through User State Modeling for Exploratory Counseling [14.53071190134928]
PsyProbeはカウンセリングの探索フェーズ用に設計された対話システムである。 PPPPPIフレームワークを通じてユーザーの心理状態を追跡する。文脈的に適切で前向きな質問を生成する。
論文参考訳（メタデータ） (2026-01-27T01:59:41Z)
PAIR-SAFE: A Paired-Agent Approach for Runtime Auditing and Refining AI-Mediated Mental Health Support [18.251267901872886]
大規模言語モデル(LLM)は、メンタルヘルスのサポートにますます利用されている。 LLMは、過度に指示的、一貫性のない、または臨床的に不一致な応答を生成することができる。 PAIR-SAFEはAIによるメンタルヘルスサポートの監査と改善のためのペアエージェントフレームワークである。
論文参考訳（メタデータ） (2026-01-19T06:20:57Z)
Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-12T09:03:30Z)
Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.26493826461026]
大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。 8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文参考訳（メタデータ） (2025-05-06T08:22:51Z)
Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである* Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。 Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文参考訳（メタデータ） (2023-10-28T12:08:03Z)
RECAP-KG: Mining Knowledge Graphs from Raw GP Notes for Remote COVID-19 Assessment in Primary Care [45.43645878061283]
本稿では,患者相談の前後に書かれた生のGP医療ノートから知識グラフ構築を行うフレームワークを提案する。私たちの知識グラフには、既存の患者の症状、その持続時間、重症度に関する情報が含まれています。本フレームワークを英国における新型コロナウイルス患者の相談ノートに適用する。
論文参考訳（メタデータ） (2023-06-17T23:35:51Z)
Informing clinical assessment by contextualizing post-hoc explanations of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文参考訳（メタデータ） (2023-02-11T18:07:11Z)
Revealing Patient-Reported Experiences in Healthcare from Social Media using the DAPMAV Framework [0.04096453902709291]
本稿では,DAPMAV(Design-Acquire-Process-Model-Analyse-Visualise)フレームワークを紹介し,ソーシャルメディアデータから患者に報告された経験を捉える手法とアプローチを提案する。この枠組みを, /r/ProstateCancer による前立腺癌データのケーススタディに適用する。
論文参考訳（メタデータ） (2022-10-09T11:38:41Z)
Opportunities of a Machine Learning-based Decision Support System for Stroke Rehabilitation Assessment [64.52563354823711]
リハビリテーションアセスメントは、患者の適切な介入を決定するために重要である。現在の評価の実践は、主にセラピストの経験に依存しており、セラピストの可用性が限られているため、アセスメントは頻繁に実施される。我々は、強化学習を用いて評価の健全な特徴を識別できるインテリジェントな意思決定支援システムを開発した。
論文参考訳（メタデータ） (2020-02-27T17:04:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。