論文の概要: Scan-do Attitude: Towards Autonomous CT Protocol Management using a Large Language Model Agent
- arxiv url: http://arxiv.org/abs/2509.20270v1
- Date: Wed, 24 Sep 2025 16:04:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.891347
- Title: Scan-do Attitude: Towards Autonomous CT Protocol Management using a Large Language Model Agent
- Title(参考訳): Scan-do Attitude:大規模言語モデルエージェントを用いた自動CTプロトコル管理に向けて
- Authors: Xingjian Kang, Linda Vorberg, Andreas Maier, Alexander Katzmann, Oliver Taubmann,
- Abstract要約: プロトコル構成要求の解釈と実行を支援するために,LLM(Large Language Model)ベースのエージェントフレームワークが提案されている。
このエージェントは、コンテキスト内学習、命令フォロー、構造化ツールコール機能を組み合わせて、関連するプロトコル要素を特定し、正確な修正を適用する。
- 参考スコア(独自算出の注目度): 39.72587188702086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Managing scan protocols in Computed Tomography (CT), which includes adjusting acquisition parameters or configuring reconstructions, as well as selecting postprocessing tools in a patient-specific manner, is time-consuming and requires clinical as well as technical expertise. At the same time, we observe an increasing shortage of skilled workforce in radiology. To address this issue, a Large Language Model (LLM)-based agent framework is proposed to assist with the interpretation and execution of protocol configuration requests given in natural language or a structured, device-independent format, aiming to improve the workflow efficiency and reduce technologists' workload. The agent combines in-context-learning, instruction-following, and structured toolcalling abilities to identify relevant protocol elements and apply accurate modifications. In a systematic evaluation, experimental results indicate that the agent can effectively retrieve protocol components, generate device compatible protocol definition files, and faithfully implement user requests. Despite demonstrating feasibility in principle, the approach faces limitations regarding syntactic and semantic validity due to lack of a unified device API, and challenges with ambiguous or complex requests. In summary, the findings show a clear path towards LLM-based agents for supporting scan protocol management in CT imaging.
- Abstract(参考訳): CT(Computed Tomography)におけるスキャンプロトコルの管理には、取得パラメータの調整や再構成の設定、患者固有の方法で後処理ツールの選択などが含まれる。
同時に、放射線学における熟練労働者の不足が増大しているのを観察する。
この問題に対処するため、Large Language Model (LLM)ベースのエージェントフレームワークが提案され、自然言語やデバイスに依存しない構造化されたフォーマットで提供されるプロトコル構成要求の解釈と実行を支援する。
このエージェントは、コンテキスト内学習、命令フォロー、構造化ツールコール機能を組み合わせて、関連するプロトコル要素を特定し、正確な修正を適用する。
システム評価では, エージェントが効率的にプロトコルコンポーネントを検索し, デバイス互換のプロトコル定義ファイルを生成し, ユーザ要求を忠実に実装できることを示す。
原則として実現可能性を示すにもかかわらず、統一されたデバイスAPIがないため、構文的および意味論的妥当性に関する制限と、曖昧で複雑な要求を伴う課題に直面している。
以上より,CT画像におけるスキャンプロトコル管理を支援するLLMエージェントへの明確な道筋が示唆された。
関連論文リスト
- TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs) [7.2159153945746795]
LLM(Large Language Models)は、広範囲にわたる医学的知識を符号化するが、縦断的患者の軌跡に確実に適用することは困難である。
凍結LDMによる時間的臨床推論を可能にするフレームワークであるTRACEを紹介する。
MIMIC-IVによる縦断的臨床イベントストリームの評価
論文 参考訳(メタデータ) (2026-02-13T11:39:19Z) - PRISM: Protocol Refinement through Intelligent Simulation Modeling [4.839327116611717]
本稿では,実験プロトコルの設計,検証,実行を自動化するフレームワークであるPRISMを紹介する。
PRISMは言語モデルに基づくエージェントのセットを使用し、共同で実験的なステップを生成し、洗練する。
我々は、PRISMを言語ベースのプロトコル生成、シミュレーションベースの検証、自動ロボット実行をブリッジする実用的なエンドツーエンドワークフローとして実証する。
論文 参考訳(メタデータ) (2026-01-08T20:15:28Z) - TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation [62.0150409256153]
我々は、CXR解釈のためのディレクター調整型多段階エージェントであるCXRAgentを提案する。
エージェントは、Evidence-driven Validatorによって正規化され検証された出力を持つ一連のCXR分析ツールを戦略的にオーケストレーションする。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
論文 参考訳(メタデータ) (2025-10-24T10:31:30Z) - Align Your Query: Representation Alignment for Multimodality Medical Object Detection [55.86070915426998]
本稿では,表現をモダリティの文脈と整合させる検出非依存の枠組みを提案する。
モーダリティトークンをマルチモーダリティコンテキスト注意による検出プロセスに統合する。
提案されたアプローチは、最小限のオーバーヘッドとアーキテクチャの変更を伴わず、APを継続的に改善する。
論文 参考訳(メタデータ) (2025-10-03T07:49:21Z) - An Agentic Model Context Protocol Framework for Medical Concept Standardization [5.12407270785129]
モデルコンテキストプロトコル(MCP)に基づくゼロトレーニング・幻覚防止マッピングシステムの開発
このシステムは説明可能なマッピングを可能にし、最小限の労力で効率と精度を大幅に改善する。
論文 参考訳(メタデータ) (2025-09-04T02:32:22Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - ProtocolLLM: RTL Benchmark for SystemVerilog Generation of Communication Protocols [45.66401695351214]
本稿では,広く使用されているSystemVerilogプロトコルを対象とした最初のベンチマークスイートであるProtocolLLMを紹介する。
我々は,ほとんどのモデルがタイミング制約に従う通信プロトコルのSystemVerilogコードを生成するのに失敗したことを観察する。
論文 参考訳(メタデータ) (2025-06-09T17:10:47Z) - A Survey of AI Agent Protocols [35.431057321412354]
大きな言語モデル(LLM)エージェントが外部ツールやデータソースと通信する標準的な方法はありません。
この標準化されたプロトコルの欠如は、エージェントが協力したり、効果的にスケールするのを難しくする。
LLMエージェントの統一通信プロトコルは、これを変更できる。
論文 参考訳(メタデータ) (2025-04-23T14:07:26Z) - Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability, and Efficiency [59.15544887307901]
画像意味コミュニケーション(ISC)は,高効率な映像コンテンツ伝送を実現する可能性に注目されている。
既存のISCシステムは、解釈可能性、操作性、互換性の課題に直面している。
我々は、複数の下流推論タスクにGenerative Artificial Intelligence(GenAI)を利用する新しい信頼できるISCフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-07T14:32:36Z) - Towards Semantic Communication Protocols: A Probabilistic Logic
Perspective [69.68769942563812]
我々は,NPMを確率論理型言語ProbLogで記述された解釈可能なシンボルグラフに変換することによって構築された意味プロトコルモデル(SPM)を提案する。
その解釈性とメモリ効率を利用して、衝突回避のためのSPM再構成などのいくつかの応用を実演する。
論文 参考訳(メタデータ) (2022-07-08T14:19:36Z) - A Review of Published Machine Learning Natural Language Processing
Applications for Protocolling Radiology Imaging [0.02408121010538496]
機械学習(ML)は人工知能(AI)のサブフィールドであり、放射線学におけるその応用は絶えず加速している。
自然言語処理(NLP)は、テキスト解釈タスクのMLと組み合わせることができるが、放射線学にも多くの応用が考えられる。
そのような応用の1つは、臨床放射線学参照を解釈し、適切な撮像技術を選択することを含む放射線学プロトコルの自動化である。
論文 参考訳(メタデータ) (2022-06-23T06:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。