論文の概要: "What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets
- arxiv url: http://arxiv.org/abs/2506.21532v1
- Date: Thu, 26 Jun 2025 17:52:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.232268
- Title: "What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets
- Title(参考訳): 「どうか、Doc?」:大規模会話型AIデータセットにおける健康情報の検索方法の分析
- Authors: Akshay Paruchuri, Maryam Aziz, Rohit Vartak, Ayman Ali, Best Uchehara, Xin Liu, Ishan Chatterjee, Monica Agrawal,
- Abstract要約: HealthChat-11Kは、25万のユーザメッセージからなる1万1千の現実世界の会話のキュレートされたデータセットである。
我々の分析は、ユーザーが健康情報を求める方法と理由に関する洞察を明らかにする。
- 参考スコア(独自算出の注目度): 6.459488580102546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: People are increasingly seeking healthcare information from large language models (LLMs) via interactive chatbots, yet the nature and inherent risks of these conversations remain largely unexplored. In this paper, we filter large-scale conversational AI datasets to achieve HealthChat-11K, a curated dataset of 11K real-world conversations composed of 25K user messages. We use HealthChat-11K and a clinician-driven taxonomy for how users interact with LLMs when seeking healthcare information in order to systematically study user interactions across 21 distinct health specialties. Our analysis reveals insights into the nature of how and why users seek health information, such as common interactions, instances of incomplete context, affective behaviors, and interactions (e.g., leading questions) that can induce sycophancy, underscoring the need for improvements in the healthcare support capabilities of LLMs deployed as conversational AI. Code and artifacts to retrieve our analyses and combine them into a curated dataset can be found here: https://github.com/yahskapar/HealthChat
- Abstract(参考訳): 人々は対話型チャットボットを通じて、大きな言語モデル(LLM)から医療情報をますます求めている。
本稿では、大規模会話AIデータセットをフィルタリングして、25Kユーザメッセージからなる1万1千件の現実世界会話のキュレートされたデータセットであるHealthChat-11Kを実現する。
我々は、21の異なる医療専門分野のユーザインタラクションを体系的に研究するために、HealthChat-11Kと、LLMとどのように相互作用するかを臨床主導の分類法を用いて検討する。
我々の分析は、コミュニケーションAIとして展開されるLLMの医療支援能力の改善の必要性を浮き彫りにしながら、どのようにしてユーザーが健康情報を求めるか、なぜ不完全なコンテキストのインスタンス、情緒的行動、およびシコファンシーを誘発する相互作用(例えば、主要な質問)といった、ユーザーがどのようにして健康情報を求めるかについての洞察を明らかにする。
分析を検索し、それらをキュレートしたデータセットに組み合わせるためのコードとアーティファクトは以下の通りである。
関連論文リスト
- From Chat Logs to Collective Insights: Aggregative Question Answering [28.700113669309314]
Aggregative Question Answeringは、何千ものユーザとチャットボットのインタラクションを明示的に推論し、集約的なクエリに答えることを必要とする新しいタスクである。
この方向の研究を可能にするために,実世界の会話182,330から派生した6,027の集約質問からなるWildChat-AQAというベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-29T17:59:55Z) - A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文 参考訳(メタデータ) (2025-03-26T05:56:46Z) - Leveraging Large Language Models for Patient Engagement: The Power of Conversational AI in Digital Health [1.8772687384996551]
大規模言語モデル(LLM)は、会話型AIを通じて医療における患者のエンゲージメントを変革する新たな機会を開いた。
4つのケーススタディを通して,LLMの非構造化会話データ処理能力を示す。
論文 参考訳(メタデータ) (2024-06-19T16:02:04Z) - Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.4597673707346281]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。
我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。
openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文 参考訳(メタデータ) (2023-10-03T18:54:10Z) - AutoConv: Automatically Generating Information-seeking Conversations
with Large Language Models [74.10293412011455]
合成会話生成のためのAutoConvを提案する。
具体的には,会話生成問題を言語モデリングタスクとして定式化する。
我々は、情報探索プロセスの特徴を捉えるために、人間同士の会話でLLMを微調整する。
論文 参考訳(メタデータ) (2023-08-12T08:52:40Z) - GenSpectrum Chat: Data Exploration in Public Health Using Large Language
Models [2.9823962001574187]
新型コロナウイルスのパンデミックは、疫学的データを容易にアクセスし、探索可能にすることの重要性を強調した。
我々は、GPT-4を基盤となる大規模言語モデル(LLM)として、SARS-CoV-2ゲノムシークエンシングデータを調べる「GenSpectrum Chat」を開発した。
論文 参考訳(メタデータ) (2023-05-23T08:43:43Z) - PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。
人工会話の徹底的な評価を,人間による会話と比較して行った。
論文 参考訳(メタデータ) (2023-02-07T05:48:16Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。