論文の概要: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
- arxiv url: http://arxiv.org/abs/2502.01789v1
- Date: Mon, 03 Feb 2025 20:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:57:11.449307
- Title: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
- Title(参考訳): 実世界データにおける認知的関心事検出のためのエージェントAIワークフロー
- Authors: Jiazi Tian, Liqin Wang, Pedram Fard, Valdery Moura Junior, Deborah Blacker, Jennifer S. Haas, Chirag Patel, Shawn N. Murphy, Lidia M. V. R. Moura, Hossein Estiri,
- Abstract要約: 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。
この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
- 参考スコア(独自算出の注目度): 4.161501422808857
- License:
- Abstract: Early identification of cognitive concerns is critical but often hindered by subtle symptom presentation. This study developed and validated a fully automated, multi-agent AI workflow using LLaMA 3 8B to identify cognitive concerns in 3,338 clinical notes from Mass General Brigham. The agentic workflow, leveraging task-specific agents that dynamically collaborate to extract meaningful insights from clinical notes, was compared to an expert-driven benchmark. Both workflows achieved high classification performance, with F1-scores of 0.90 and 0.91, respectively. The agentic workflow demonstrated improved specificity (1.00) and achieved prompt refinement in fewer iterations. Although both workflows showed reduced performance on validation data, the agentic workflow maintained perfect specificity. These findings highlight the potential of fully automated multi-agent AI workflows to achieve expert-level accuracy with greater efficiency, offering a scalable and cost-effective solution for detecting cognitive concerns in clinical settings.
- Abstract(参考訳): 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。
この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
エージェントワークフローは、動的に協調して臨床ノートから意味のある洞察を抽出するタスク固有のエージェントを活用し、専門家主導のベンチマークと比較した。
両方のワークフローは、それぞれ0.90と0.91のF1スコアで高い分類性能を達成した。
エージェントワークフローは、改良された特異性(1.00)を示し、より少ないイテレーションで迅速な改善を実現した。
どちらのワークフローもバリデーションデータのパフォーマンスは低下していたが、エージェントワークフローは完全な特異性を維持していた。
これらの知見は、専門家レベルの精度を高い効率で達成するために、完全に自動化されたマルチエージェントAIワークフローの可能性を強調し、クリニカルセッティングにおける認知的関心事を検出するスケーラブルで費用対効果の高いソリューションを提供する。
関連論文リスト
- Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Ensuring Medical AI Safety: Explainable AI-Driven Detection and Mitigation of Spurious Model Behavior and Associated Data [14.991686165405959]
本稿では,データとモデルの両方の観点から,突発的行動を特定するための半自動フレームワークを提案する。
これにより、急激なデータポイントの検索と、関連する予測ルールを符号化するモデル回路の検出が可能になる。
4つの医療データセットを用いて,本フレームワークの適用性を示す。
論文 参考訳(メタデータ) (2025-01-23T16:39:09Z) - The Impact of AI Assistance on Radiology Reporting: A Pilot Study Using Simulated AI Draft Reports [1.717011912812067]
放射線学者は、画像量の増加に伴い作業負荷が増加し、燃え尽きや報告の遅れのリスクが生じる。
人工知能(AI)をベースとした自動放射線学レポート生成では、ワークフロー最適化の報告が約束されているが、臨床精度と効率に対する実際の影響の証拠は限られている。
論文 参考訳(メタデータ) (2024-12-16T18:10:49Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorFBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorFEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することができることを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2024-06-17T03:29:13Z) - ADT: Agent-based Dynamic Thresholding for Anomaly Detection [4.356615197661274]
本稿では,エージェントベースの動的しきい値処理(ADT)フレームワークを提案する。
本研究では,自動エンコーダを用いて特徴表現を取得し,複雑な入力データに対する異常スコアを生成する。
ADTはオートエンコーダの異常スコアを利用して閾値を適応的に調整することができる。
論文 参考訳(メタデータ) (2023-12-03T19:07:30Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Quality control for more reliable integration of deep learning-based
image segmentation into medical workflows [0.23609258021376836]
本稿では,その出力の確実性を推定するために,最先端自動品質制御(QC)手法の解析を行う。
磁気共鳴画像データにおける白色物質の超強度(WMH)を識別する脳画像分割タスクにおける最も有望なアプローチを検証した。
論文 参考訳(メタデータ) (2021-12-06T16:30:43Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Detecting Affective Flow States of Knowledge Workers Using Physiological
Sensors [0.9912861954256301]
仕事におけるフローのような経験は、生産性と労働者の幸福のために重要です。
作業中に労働者が流れを経験しているかを客観的に検出することは困難である。
本稿では,生理的信号に基づいて作業者の焦点状態を予測する方法について検討する。
論文 参考訳(メタデータ) (2020-06-18T15:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。