Fugu-MT 論文翻訳(概要): An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data

論文の概要: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data

arxiv url: http://arxiv.org/abs/2502.01789v1
Date: Mon, 03 Feb 2025 20:08:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:55.731579
Title: An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data
Title（参考訳）: 実世界データにおける認知的関心事検出のためのエージェントAIワークフロー
Authors: Jiazi Tian, Liqin Wang, Pedram Fard, Valdery Moura Junior, Deborah Blacker, Jennifer S. Haas, Chirag Patel, Shawn N. Murphy, Lidia M. V. R. Moura, Hossein Estiri,
Abstract要約: 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
参考スコア（独自算出の注目度）: 4.161501422808857
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Early identification of cognitive concerns is critical but often hindered by subtle symptom presentation. This study developed and validated a fully automated, multi-agent AI workflow using LLaMA 3 8B to identify cognitive concerns in 3,338 clinical notes from Mass General Brigham. The agentic workflow, leveraging task-specific agents that dynamically collaborate to extract meaningful insights from clinical notes, was compared to an expert-driven benchmark. Both workflows achieved high classification performance, with F1-scores of 0.90 and 0.91, respectively. The agentic workflow demonstrated improved specificity (1.00) and achieved prompt refinement in fewer iterations. Although both workflows showed reduced performance on validation data, the agentic workflow maintained perfect specificity. These findings highlight the potential of fully automated multi-agent AI workflows to achieve expert-level accuracy with greater efficiency, offering a scalable and cost-effective solution for detecting cognitive concerns in clinical settings.
Abstract（参考訳）: 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。エージェントワークフローは、動的に協調して臨床ノートから意味のある洞察を抽出するタスク固有のエージェントを活用し、専門家主導のベンチマークと比較した。両方のワークフローは、それぞれ0.90と0.91のF1スコアで高い分類性能を達成した。エージェントワークフローは、改良された特異性(1.00)を示し、より少ないイテレーションで迅速な改善を実現した。どちらのワークフローもバリデーションデータのパフォーマンスは低下していたが、エージェントワークフローは完全な特異性を維持していた。これらの知見は、専門家レベルの精度を高い効率で達成するために、完全に自動化されたマルチエージェントAIワークフローの可能性を強調し、クリニカルセッティングにおける認知的関心事を検出するスケーラブルで費用対効果の高いソリューションを提供する。

関連論文リスト

An Interpretable Transformer-Based Foundation Model for Cross-Procedural Skill Assessment Using Raw fNIRS Signals [0.0]
本稿では,FNIRS信号の最小処理に基づく解釈可能なトランスフォーマーベース基礎モデルを提案する。このモデルは全てのタスクにおいて88%以上の分類精度を達成し、マシューズ相関係数はETIで0.91を超える。これは、30個未満のラベル付きサンプルと軽量(2kパラメータ未満)アダプターモジュールを使用する新しい緊急気道手順に一般化する。
論文参考訳（メタデータ） (2025-06-21T18:30:58Z)
Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。 Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文参考訳（メタデータ） (2025-05-26T09:46:50Z)
SEW: Self-Evolving Agentic Workflows for Automated Code Generation [24.16770109875788]
textbfSelf-textbfEvolving textbfSEW(textbfSEW)を提案する。当社のSEWは,エージェントを自動設計し,自己進化を通じて最適化することが可能で,LiveCodeBenchの33%の改善を実現しています。
論文参考訳（メタデータ） (2025-05-24T11:12:14Z)
TUMLS: Trustful Fully Unsupervised Multi-Level Segmentation for Whole Slide Images of Histology [41.94295877935867]
We present a Trustful fully unsupervised multi-level segmentation method (TUMLS) for whole slide image (WSIs)。 TUMLSは、低解像度のトレーニングデータの中で異なる組織タイプを特定するために、オートエンコーダ(AE)を特徴抽出器として採用している。このソリューションは、臨床医にシームレスに統合され、WSI全体の検査を簡潔で解釈可能なクロスレベル洞察のレビューに変換する。
論文参考訳（メタデータ） (2025-04-17T07:48:05Z)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding [61.26026947423187]
人間の専門家は、ドメイン知識を活用して知覚的特徴を洗練することによって、きめ細かい視覚的識別に長けている。現在のMLLM(Multimodal Large Language Models)は、推論を視覚的知覚に統合するのに苦労している。本稿では,認知的視覚能力を強化したMLLMであるDeepPerceptionを提案する。
論文参考訳（メタデータ） (2025-03-17T04:06:34Z)
Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文参考訳（メタデータ） (2025-03-06T18:35:39Z)
Turning Conversations into Workflows: A Framework to Extract and Evaluate Dialog Workflows for Service AI Agents [65.36060818857109]
本稿では,過去の対話から対話を抽出し,評価するための新しい枠組みを提案する。抽出プロセスは,(1)重要な手続き的要素に基づいて関連する会話を選択するための検索ステップ,(2)質問応答に基づくチェーン・オブ・シークレット(QA-CoT)プロンプトを用いた構造化ワークフロー生成プロセスの2つの主要な段階から構成される。
論文参考訳（メタデータ） (2025-02-24T16:55:15Z)
Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文参考訳（メタデータ） (2025-02-18T17:12:26Z)
The Impact of AI Assistance on Radiology Reporting: A Pilot Study Using Simulated AI Draft Reports [1.717011912812067]
放射線学者は、画像量の増加に伴い作業負荷が増加し、燃え尽きや報告の遅れのリスクが生じる。人工知能(AI)をベースとした自動放射線学レポート生成では、ワークフロー最適化の報告が約束されているが、臨床精度と効率に対する実際の影響の証拠は限られている。
論文参考訳（メタデータ） (2024-12-16T18:10:49Z)
Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorFBenchを紹介する。また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorFEvalを提案する。我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することができることを観察する。
論文参考訳（メタデータ） (2024-10-10T12:41:19Z)
Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。 3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文参考訳（メタデータ） (2024-06-17T03:29:13Z)
Concept Matching with Agent for Out-of-Distribution Detection [19.407364109506904]
本稿では,エージェントパラダイムをアウト・オブ・ディストリビューション(OOD)検出タスクに統合する手法を提案する。提案手法であるConcept Matching with Agent (CMA) は、CLIPに基づくOOD検出プロセスを強化するために、中性プロンプトをエージェントとして利用する。実験結果から, ゼロショット法とトレーニング要求法の両方よりもCMAの方が優れた性能を示した。
論文参考訳（メタデータ） (2024-05-27T02:27:28Z)
Exploring LLM Multi-Agents for ICD Coding [15.730751450511333]
ICD符号化のためのマルチエージェント方式は実世界の符号化プロセスを効果的に模倣し、一般的な符号と稀な符号の両方の性能を向上させる。提案手法は, 事前学習や微調整を必要とする最先端のICD符号化手法に匹敵する結果を得るとともに, 稀なコード精度, 説明可能性で性能を向上する。
論文参考訳（メタデータ） (2024-04-01T15:17:39Z)
ADT: Agent-based Dynamic Thresholding for Anomaly Detection [4.356615197661274]
本稿では,エージェントベースの動的しきい値処理(ADT)フレームワークを提案する。本研究では,自動エンコーダを用いて特徴表現を取得し,複雑な入力データに対する異常スコアを生成する。 ADTはオートエンコーダの異常スコアを利用して閾値を適応的に調整することができる。
論文参考訳（メタデータ） (2023-12-03T19:07:30Z)
Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。 LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文参考訳（メタデータ） (2023-08-31T14:31:48Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)
Detecting Affective Flow States of Knowledge Workers Using Physiological Sensors [0.9912861954256301]
仕事におけるフローのような経験は、生産性と労働者の幸福のために重要です。作業中に労働者が流れを経験しているかを客観的に検出することは困難である。本稿では,生理的信号に基づいて作業者の焦点状態を予測する方法について検討する。
論文参考訳（メタデータ） (2020-06-18T15:59:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。