Fugu-MT 論文翻訳(概要): "What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets

論文の概要: "What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets

arxiv url: http://arxiv.org/abs/2506.21532v1
Date: Thu, 26 Jun 2025 17:52:18 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-27 19:53:10.232268
Title: "What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets
Title（参考訳）: 「どうか、Doc?」:大規模会話型AIデータセットにおける健康情報の検索方法の分析
Authors: Akshay Paruchuri, Maryam Aziz, Rohit Vartak, Ayman Ali, Best Uchehara, Xin Liu, Ishan Chatterjee, Monica Agrawal,
Abstract要約: HealthChat-11Kは、25万のユーザメッセージからなる1万1千の現実世界の会話のキュレートされたデータセットである。我々の分析は、ユーザーが健康情報を求める方法と理由に関する洞察を明らかにする。
参考スコア（独自算出の注目度）: 6.459488580102546
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: People are increasingly seeking healthcare information from large language models (LLMs) via interactive chatbots, yet the nature and inherent risks of these conversations remain largely unexplored. In this paper, we filter large-scale conversational AI datasets to achieve HealthChat-11K, a curated dataset of 11K real-world conversations composed of 25K user messages. We use HealthChat-11K and a clinician-driven taxonomy for how users interact with LLMs when seeking healthcare information in order to systematically study user interactions across 21 distinct health specialties. Our analysis reveals insights into the nature of how and why users seek health information, such as common interactions, instances of incomplete context, affective behaviors, and interactions (e.g., leading questions) that can induce sycophancy, underscoring the need for improvements in the healthcare support capabilities of LLMs deployed as conversational AI. Code and artifacts to retrieve our analyses and combine them into a curated dataset can be found here: https://github.com/yahskapar/HealthChat
Abstract（参考訳）: 人々は対話型チャットボットを通じて、大きな言語モデル(LLM)から医療情報をますます求めている。本稿では、大規模会話AIデータセットをフィルタリングして、25Kユーザメッセージからなる1万1千件の現実世界会話のキュレートされたデータセットであるHealthChat-11Kを実現する。我々は、21の異なる医療専門分野のユーザインタラクションを体系的に研究するために、HealthChat-11Kと、LLMとどのように相互作用するかを臨床主導の分類法を用いて検討する。我々の分析は、コミュニケーションAIとして展開されるLLMの医療支援能力の改善の必要性を浮き彫りにしながら、どのようにしてユーザーが健康情報を求めるか、なぜ不完全なコンテキストのインスタンス、情緒的行動、およびシコファンシーを誘発する相互作用(例えば、主要な質問)といった、ユーザーがどのようにして健康情報を求めるかについての洞察を明らかにする。分析を検索し、それらをキュレートしたデータセットに組み合わせるためのコードとアーティファクトは以下の通りである。

関連論文リスト

Towards Better Health Conversations: The Benefits of Context-seeking [17.329382113242556]
我々は、人々が大きな言語モデル(LLM)とどのように相互作用するかについての洞察を自身の健康問題に対して提示する。研究は、ある人がボランティアや共有することができない特定の詳細を引き出すために、会話型AIにおける文脈探索の重要性を明らかにした。我々は、積極的にコンテキストを検索する「Wayfinding AI」を開発した。
論文参考訳（メタデータ） (2025-09-14T01:08:42Z)
From Chat Logs to Collective Insights: Aggregative Question Answering [28.700113669309314]
Aggregative Question Answeringは、何千ものユーザとチャットボットのインタラクションを明示的に推論し、集約的なクエリに答えることを必要とする新しいタスクである。この方向の研究を可能にするために,実世界の会話182,330から派生した6,027の集約質問からなるWildChat-AQAというベンチマークを構築した。
論文参考訳（メタデータ） (2025-05-29T17:59:55Z)
A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。 Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文参考訳（メタデータ） (2025-03-26T05:56:46Z)
Leveraging Large Language Models for Patient Engagement: The Power of Conversational AI in Digital Health [1.8772687384996551]
大規模言語モデル(LLM)は、会話型AIを通じて医療における患者のエンゲージメントを変革する新たな機会を開いた。 4つのケーススタディを通して,LLMの非構造化会話データ処理能力を示す。
論文参考訳（メタデータ） (2024-06-19T16:02:04Z)
Quriosity: Analyzing Human Questioning Behavior and Causal Inquiry through Curiosity-Driven Queries [92.1651731484397]
本稿では,3つの情報源から自然発生の13.5Kの質問を集めたQuriosityを紹介する。分析の結果,データセットに因果的疑問(最大42%)が存在することが明らかとなった。
論文参考訳（メタデータ） (2024-05-30T17:55:28Z)
Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.4597673707346281]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。 openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文参考訳（メタデータ） (2023-10-03T18:54:10Z)
AutoConv: Automatically Generating Information-seeking Conversations with Large Language Models [74.10293412011455]
合成会話生成のためのAutoConvを提案する。具体的には,会話生成問題を言語モデリングタスクとして定式化する。我々は、情報探索プロセスの特徴を捉えるために、人間同士の会話でLLMを微調整する。
論文参考訳（メタデータ） (2023-08-12T08:52:40Z)
MedNgage: A Dataset for Understanding Engagement in Patient-Nurse Conversations [4.847266237348932]
症状を効果的に管理する患者は、医療従事者との会話や介入において、より高いレベルのエンゲージメントを示すことが多い。 AIシステムは、患者と実践者との自然な会話におけるエンゲージメントを理解して、患者のケアにもっと貢献することが不可欠である。本稿では,がん症状管理に関する患者と看護者の会話をまとめた新しいデータセット(MedNgage)を提案する。
論文参考訳（メタデータ） (2023-05-31T16:06:07Z)
GenSpectrum Chat: Data Exploration in Public Health Using Large Language Models [2.9823962001574187]
新型コロナウイルスのパンデミックは、疫学的データを容易にアクセスし、探索可能にすることの重要性を強調した。我々は、GPT-4を基盤となる大規模言語モデル(LLM)として、SARS-CoV-2ゲノムシークエンシングデータを調べる「GenSpectrum Chat」を開発した。
論文参考訳（メタデータ） (2023-05-23T08:43:43Z)
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots [7.2676028986202]
知識グラフ(KG)のための会話型AIと質問応答システム(QAS)はどちらも新興研究分野である。 QASは、自然言語質問を理解して翻訳することで、KGから最新の情報を検索し、データベースエンジンがサポートする形式的なクエリに変換する。本フレームワークでは,現在最先端のQASであるKGQANに対して,ChatGPTとGalacticaの2つの代表的な対話モデルを比較した。
論文参考訳（メタデータ） (2023-02-08T13:03:27Z)
PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。人工会話の徹底的な評価を,人間による会話と比較して行った。
論文参考訳（メタデータ） (2023-02-07T05:48:16Z)
Training Conversational Agents with Generative Conversational Networks [74.9941330874663]
我々は、生成会話ネットワークを使用して、自動的にデータを生成し、社会的会話エージェントを訓練する。自動メトリクスと人的評価器を用いてTopicalChatのアプローチを評価し、10%のシードデータで100%のデータを使用するベースラインに近いパフォーマンスを示す。
論文参考訳（メタデータ） (2021-10-15T21:46:39Z)
MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。 MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文参考訳（メタデータ） (2020-10-15T03:34:33Z)
Conversations with Search Engines: SERP-based Conversational Response Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。 CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文参考訳（メタデータ） (2020-04-29T13:07:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。