論文の概要: CliniDial: A Naturally Occurring Multimodal Dialogue Dataset for Team Reflection in Action During Clinical Operation
- arxiv url: http://arxiv.org/abs/2506.12936v1
- Date: Sun, 15 Jun 2025 18:39:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.111841
- Title: CliniDial: A Naturally Occurring Multimodal Dialogue Dataset for Team Reflection in Action During Clinical Operation
- Title(参考訳): CliniDial: 自然に発生する多モーダル対話データセット
- Authors: Naihao Deng, Kapotaksha Das, Rada Mihalcea, Vitaliy Popov, Mohamed Abouelenien,
- Abstract要約: 運用中にチームがどのようにチームワークを実践しているかを理解するため、医療活動のシミュレーションからCliniDialを収集しました。
CliniDialには、音声データとその転写、患者のマニキンのシミュレートされた生理的信号、そして2つのカメラアングルからの操作方法が含まれている。
- 参考スコア(独自算出の注目度): 23.006540048395472
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In clinical operations, teamwork can be the crucial factor that determines the final outcome. Prior studies have shown that sufficient collaboration is the key factor that determines the outcome of an operation. To understand how the team practices teamwork during the operation, we collected CliniDial from simulations of medical operations. CliniDial includes the audio data and its transcriptions, the simulated physiology signals of the patient manikins, and how the team operates from two camera angles. We annotate behavior codes following an existing framework to understand the teamwork process for CliniDial. We pinpoint three main characteristics of our dataset, including its label imbalances, rich and natural interactions, and multiple modalities, and conduct experiments to test existing LLMs' capabilities on handling data with these characteristics. Experimental results show that CliniDial poses significant challenges to the existing models, inviting future effort on developing methods that can deal with real-world clinical data. We open-source the codebase at https://github.com/MichiganNLP/CliniDial
- Abstract(参考訳): 臨床手術では、チームワークが最終結果を決定する重要な要因となり得る。
以前の研究では、十分な協力が手術の結果を決定する重要な要因であることが示されている。
運用中にチームがどのようにチームワークを実践しているかを理解するため、医療活動のシミュレーションからCliniDialを収集しました。
CliniDialには、音声データとその転写、患者のマニキンのシミュレートされた生理的信号、そして2つのカメラアングルからの操作方法が含まれている。
我々は、CliniDialのチームワークプロセスを理解するために、既存のフレームワークに従って振る舞いコードに注釈を付けます。
我々は,ラベルの不均衡,リッチで自然な相互作用,マルチモーダル性など,データセットの主な特徴を3つ指摘し,これらの特徴を用いたデータ処理における既存のLLMの機能をテストする実験を行った。
実験の結果、CliniDialは既存のモデルに重大な課題をもたらしており、実際の臨床データを扱う方法の開発に今後の取り組みを奨励している。
私たちは、https://github.com/MichiganNLP/CliniDialでコードベースをオープンソース化しました。
関連論文リスト
- When do they StOP?: A First Step Towards Automatically Identifying Team Communication in the Operating Room [2.508931612863749]
ORのマルチビューカメラシステムによって捉えられた100時間以上の手術ビデオを,Team-ORと呼ばれる実際の外科手術のデータセットを生成する。
このデータセットには、33のタイムアウトと22のStOP?-protocolアクティビティの時間アノテーションが含まれている。
次に、シーンコンテキストとアクション特徴の両方を符号化し、効率的なニューラルネットワークモデルを用いて結果を出力するグループアクティビティ検出手法を提案する。
論文 参考訳(メタデータ) (2025-02-12T10:59:45Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - LLM-Assisted Multi-Teacher Continual Learning for Visual Question Answering in Robotic Surgery [57.358568111574314]
患者のデータのプライバシは、モデル更新時に古いデータの可用性を制限することが多い。
CL研究は外科領域で2つの重要な問題を見落としていた。
本稿では,多モーダル大規模言語モデル (LLM) と適応重み付け手法を用いて,これらの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-02-26T15:35:24Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Jumpstarting Surgical Computer Vision [2.7396997668655163]
我々は、多様な外科的データセットを柔軟に活用するために、自己教師付き学習を採用する。
腹腔鏡下胆嚢摘出術と腹腔鏡下子宮摘出術の位相認識と安全性の検討を行った。
事前トレーニングデータセットの構成は、さまざまな下流タスクに対するSSLメソッドの有効性に大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2023-12-10T18:54:16Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。