論文の概要: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
- arxiv url: http://arxiv.org/abs/2502.01789v1
- Date: Mon, 03 Feb 2025 20:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:21:55.731579
- Title: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
- Title(参考訳): 実世界データにおける認知的関心事検出のためのエージェントAIワークフロー
- Authors: Jiazi Tian, Liqin Wang, Pedram Fard, Valdery Moura Junior, Deborah Blacker, Jennifer S. Haas, Chirag Patel, Shawn N. Murphy, Lidia M. V. R. Moura, Hossein Estiri,
- Abstract要約: 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。
この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
- 参考スコア(独自算出の注目度): 4.161501422808857
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Early identification of cognitive concerns is critical but often hindered by subtle symptom presentation. This study developed and validated a fully automated, multi-agent AI workflow using LLaMA 3 8B to identify cognitive concerns in 3,338 clinical notes from Mass General Brigham. The agentic workflow, leveraging task-specific agents that dynamically collaborate to extract meaningful insights from clinical notes, was compared to an expert-driven benchmark. Both workflows achieved high classification performance, with F1-scores of 0.90 and 0.91, respectively. The agentic workflow demonstrated improved specificity (1.00) and achieved prompt refinement in fewer iterations. Although both workflows showed reduced performance on validation data, the agentic workflow maintained perfect specificity. These findings highlight the potential of fully automated multi-agent AI workflows to achieve expert-level accuracy with greater efficiency, offering a scalable and cost-effective solution for detecting cognitive concerns in clinical settings.
- Abstract(参考訳): 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。
この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
エージェントワークフローは、動的に協調して臨床ノートから意味のある洞察を抽出するタスク固有のエージェントを活用し、専門家主導のベンチマークと比較した。
両方のワークフローは、それぞれ0.90と0.91のF1スコアで高い分類性能を達成した。
エージェントワークフローは、改良された特異性(1.00)を示し、より少ないイテレーションで迅速な改善を実現した。
どちらのワークフローもバリデーションデータのパフォーマンスは低下していたが、エージェントワークフローは完全な特異性を維持していた。
これらの知見は、専門家レベルの精度を高い効率で達成するために、完全に自動化されたマルチエージェントAIワークフローの可能性を強調し、クリニカルセッティングにおける認知的関心事を検出するスケーラブルで費用対効果の高いソリューションを提供する。
関連論文リスト
- TUMLS: Trustful Fully Unsupervised Multi-Level Segmentation for Whole Slide Images of Histology [41.94295877935867]
We present a Trustful fully unsupervised multi-level segmentation method (TUMLS) for whole slide image (WSIs)。
TUMLSは、低解像度のトレーニングデータの中で異なる組織タイプを特定するために、オートエンコーダ(AE)を特徴抽出器として採用している。
このソリューションは、臨床医にシームレスに統合され、WSI全体の検査を簡潔で解釈可能なクロスレベル洞察のレビューに変換する。
論文 参考訳(メタデータ) (2025-04-17T07:48:05Z) - DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding [61.26026947423187]
人間の専門家は、ドメイン知識を活用して知覚的特徴を洗練することによって、きめ細かい視覚的識別に長けている。
現在のMLLM(Multimodal Large Language Models)は、推論を視覚的知覚に統合するのに苦労している。
本稿では,認知的視覚能力を強化したMLLMであるDeepPerceptionを提案する。
論文 参考訳(メタデータ) (2025-03-17T04:06:34Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Turning Conversations into Workflows: A Framework to Extract and Evaluate Dialog Workflows for Service AI Agents [65.36060818857109]
本稿では,過去の対話から対話を抽出し,評価するための新しい枠組みを提案する。
抽出プロセスは,(1)重要な手続き的要素に基づいて関連する会話を選択するための検索ステップ,(2)質問応答に基づくチェーン・オブ・シークレット(QA-CoT)プロンプトを用いた構造化ワークフロー生成プロセスの2つの主要な段階から構成される。
論文 参考訳(メタデータ) (2025-02-24T16:55:15Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - The Impact of AI Assistance on Radiology Reporting: A Pilot Study Using Simulated AI Draft Reports [1.717011912812067]
放射線学者は、画像量の増加に伴い作業負荷が増加し、燃え尽きや報告の遅れのリスクが生じる。
人工知能(AI)をベースとした自動放射線学レポート生成では、ワークフロー最適化の報告が約束されているが、臨床精度と効率に対する実際の影響の証拠は限られている。
論文 参考訳(メタデータ) (2024-12-16T18:10:49Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorFBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorFEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することができることを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2024-06-17T03:29:13Z) - Concept Matching with Agent for Out-of-Distribution Detection [19.407364109506904]
本稿では,エージェントパラダイムをアウト・オブ・ディストリビューション(OOD)検出タスクに統合する手法を提案する。
提案手法であるConcept Matching with Agent (CMA) は、CLIPに基づくOOD検出プロセスを強化するために、中性プロンプトをエージェントとして利用する。
実験結果から, ゼロショット法とトレーニング要求法の両方よりもCMAの方が優れた性能を示した。
論文 参考訳(メタデータ) (2024-05-27T02:27:28Z) - Exploring LLM Multi-Agents for ICD Coding [15.730751450511333]
ICD符号化のためのマルチエージェント方式は実世界の符号化プロセスを効果的に模倣し、一般的な符号と稀な符号の両方の性能を向上させる。
提案手法は, 事前学習や微調整を必要とする最先端のICD符号化手法に匹敵する結果を得るとともに, 稀なコード精度, 説明可能性で性能を向上する。
論文 参考訳(メタデータ) (2024-04-01T15:17:39Z) - ADT: Agent-based Dynamic Thresholding for Anomaly Detection [4.356615197661274]
本稿では,エージェントベースの動的しきい値処理(ADT)フレームワークを提案する。
本研究では,自動エンコーダを用いて特徴表現を取得し,複雑な入力データに対する異常スコアを生成する。
ADTはオートエンコーダの異常スコアを利用して閾値を適応的に調整することができる。
論文 参考訳(メタデータ) (2023-12-03T19:07:30Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Detecting Affective Flow States of Knowledge Workers Using Physiological
Sensors [0.9912861954256301]
仕事におけるフローのような経験は、生産性と労働者の幸福のために重要です。
作業中に労働者が流れを経験しているかを客観的に検出することは困難である。
本稿では,生理的信号に基づいて作業者の焦点状態を予測する方法について検討する。
論文 参考訳(メタデータ) (2020-06-18T15:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。