論文の概要: Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol
- arxiv url: http://arxiv.org/abs/2509.16378v1
- Date: Fri, 19 Sep 2025 19:42:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:15.7632
- Title: Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol
- Title(参考訳): AIと会計研究のための実世界の患者・クリニシアン会話をキャプチャする縦・マルチモーダル記録システム:プロトコル
- Authors: Misk Al Zahidy, Kerly Guevara Maldonado, Luis Vilatuna Andrango, Ana Cristina Proano, Ana Gabriela Claros, Maria Lizarazo Jimenez, David Toro-Tobon, Oscar J. Ponce-Ponce, Juan P. Brito,
- Abstract要約: 本研究は,マヨクリニックの外来内科で実施されている。
参加診療所への直接訪問患者を招待し、360度ビデオカメラで記録する。
訪問後、患者は共感、満足度、ペース、治療負担に関する調査を完了する。
2025年8月までに、36人の臨床医のうち35人(97%)と281人の患者のうち212人(75%)が同意した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The promise of AI in medicine depends on learning from data that reflect what matters to patients and clinicians. Most existing models are trained on electronic health records (EHRs), which capture biological measures but rarely patient-clinician interactions. These relationships, central to care, unfold across voice, text, and video, yet remain absent from datasets. As a result, AI systems trained solely on EHRs risk perpetuating a narrow biomedical view of medicine and overlooking the lived exchanges that define clinical encounters. Our objective is to design, implement, and evaluate the feasibility of a longitudinal, multimodal system for capturing patient-clinician encounters, linking 360 degree video/audio recordings with surveys and EHR data to create a dataset for AI research. This single site study is in an academic outpatient endocrinology clinic at Mayo Clinic. Adult patients with in-person visits to participating clinicians are invited to enroll. Encounters are recorded with a 360 degree video camera. After each visit, patients complete a survey on empathy, satisfaction, pace, and treatment burden. Demographic and clinical data are extracted from the EHR. Feasibility is assessed using five endpoints: clinician consent, patient consent, recording success, survey completion, and data linkage across modalities. Recruitment began in January 2025. By August 2025, 35 of 36 eligible clinicians (97%) and 212 of 281 approached patients (75%) had consented. Of consented encounters, 162 (76%) had complete recordings and 204 (96%) completed the survey. This study aims to demonstrate the feasibility of a replicable framework for capturing the multimodal dynamics of patient-clinician encounters. By detailing workflows, endpoints, and ethical safeguards, it provides a template for longitudinal datasets and lays the foundation for AI models that incorporate the complexity of care.
- Abstract(参考訳): 医学におけるAIの約束は、患者や臨床医にとって何が重要なのかを反映したデータから学ぶことに依存する。
既存のモデルの多くは電子健康記録(EHRs)に基づいて訓練されており、生物学的な測定を捉えているが、患者と臨床の相互作用はめったにない。
これらの関係は、注意の中心であり、音声、テキスト、ビデオにまたがって展開されるが、データセットはいまだに欠落している。
その結果、EHRのみを訓練したAIシステムは、医学の狭い生体医学的視点を永続させ、臨床的な出会いを定義する生きた交換を見渡すリスクを負うことになった。
本研究の目的は,360度ビデオ/オーディオ記録とサーベイとEHRデータとをリンクし,AI研究のためのデータセットを作成することで,患者・クリニックの遭遇を捉えた,縦方向のマルチモーダルシステムの実現性,実装,評価を行うことである。
このシングルサイトスタディは、マヨクリニックの学術的外来内分泌学クリニックにある。
参加診療所を訪問する成人患者が入学に招待される。
撮影者は360度ビデオカメラで撮影される。
訪問後、患者は共感、満足度、ペース、治療負担に関する調査を完了する。
EHRからデモグラフィーおよび臨床データを抽出する。
フィージビリティーは、臨床医の同意、患者の同意、記録成功、調査完了、モダリティ間のデータリンクの5つのエンドポイントを用いて評価される。
改修は2025年1月に始まった。
2025年8月までに36名中35名(97%)と281名中212名(75%)が同意した。
同意された出会いのうち、162人(76%)が完全な記録を持ち、204人(96%)が調査を完了した。
本研究の目的は,患者とクリニックの出会いのマルチモーダルなダイナミクスを捉えるために,複製可能なフレームワークの実現可能性を示すことである。
ワークフロー、エンドポイント、倫理的保護について詳述することで、縦長データセットのテンプレートを提供し、ケアの複雑さを取り入れたAIモデルの基盤を提供する。
関連論文リスト
- Barriers in Integrating Medical Visual Question Answering into Radiology Workflows: A Scoping Review and Clinicians' Insights [6.5907034989882725]
MedVQA (Medicical Visual Question Answering) は、医療画像の解釈を質問応答によって自動化し、放射線科医を支援するための有望なツールである。
モデルやデータセットの進歩にもかかわらず、MedVQAの臨床システムへの統合は依然として限られている。
本研究は,インドとタイから68の出版物と50人の臨床医を体系的にレビューし,MedVQAの実用性,課題,ギャップについて検討した。
論文 参考訳(メタデータ) (2025-07-09T09:51:20Z) - PatientSim: A Persona-Driven Simulator for Realistic Doctor-Patient Interactions [15.272979678875787]
本稿では,臨床シナリオのための現実的で多様な患者ペルソナを生成する患者シミュレータであるPatentSimを紹介する。
patientSimは、1)MIMIC-EDおよびMIMIC-IVデータセットの実際のデータから得られた症状や医療史を含む臨床プロファイル、2)性格、言語能力、医療履歴のリコールレベル、認知的混乱レベルという4つの軸で定義されたペルソナを使用する。
トップパフォーマンスのオープンソースモデルであるLlama 3.3は、我々のフレームワークの堅牢性を確認するために、4人の臨床医によって検証された。
論文 参考訳(メタデータ) (2025-05-23T12:34:48Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.432205523734707]
医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文 参考訳(メタデータ) (2023-12-24T23:01:00Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。