論文の概要: Human-in-the-Loop Multi-Agent Ventilator Decision Support with Contextual Bandit Preference Learning
- arxiv url: http://arxiv.org/abs/2605.23320v1
- Date: Fri, 22 May 2026 07:36:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.24197
- Title: Human-in-the-Loop Multi-Agent Ventilator Decision Support with Contextual Bandit Preference Learning
- Title(参考訳): コンテキスト帯域優先学習を用いたマルチエージェント型人工呼吸器意思決定支援
- Authors: Sijia Li, Xiaoyu Tan, Qixing Wang, Weiyi Zhao, Chen Zhan, Teqi Hao, Xuemin Wang, Lei Gu, Roland Eils, Xihe Qiu,
- Abstract要約: 人工呼吸器の意思決定支援には、進化する生理学と疾患の軌跡を追跡するシーケンシャルな決定が必要である。
本稿では,モジュール型意思決定コンポーネントを協調するループ型マルチエージェントフレームワークであるVDSSを提案する。
- 参考スコア(独自算出の注目度): 15.41239614844415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ventilator decision support requires sequential decisions that track evolving physiology and disease trajectories while respecting safety boundaries and clinician specific tuning styles. Rule based approaches rarely generalize personalization, and end to end reinforcement learning or single large language model systems remain difficult to control and audit. We propose the Ventilator Decision Support System (VDSS), a human in the loop multi agent framework that coordinates modular decision components through contract driven structured interfaces and produces traceable evidence for review. VDSS performs online preference adaptation with a contextual bandit, updating clinician specific preferences from the final accepted decision at each adjustment cycle and using them to guide subsequent recommendations. Structured rejection feedback triggers targeted replanning to reduce unproductive iterations and improve interaction stability. Retrospective ICU trajectory replay with expert review indicates higher recommendation acceptability and fewer interaction rounds to reach an acceptable plan, supporting clinically deployable human AI collaboration.
- Abstract(参考訳): 人工呼吸器の決定支援は、安全境界と臨床特有のチューニングスタイルを尊重しながら、進化する生理学と疾患の軌跡を追跡するシーケンシャルな決定を必要とする。
ルールベースのアプローチはパーソナライズを一般化することはめったになく、エンドツーエンドの強化学習や単一大規模言語モデルシステムは制御と監査が難しいままである。
本稿では,VDSS (Ventilator Decision Support System) を提案する。
VDSSは、文脈的帯域幅でオンラインの嗜好適応を行い、調整サイクル毎に最終決定から臨床特有の嗜好を更新し、それを使用してその後の勧告をガイドする。
構造的拒絶フィードバックは、非生産的なイテレーションを減らし、相互作用の安定性を改善するために、ターゲットリプランニングをトリガーする。
専門家レビューによる振り返りICUトラジェクトリのリプレイは、臨床にデプロイ可能な人間のAIコラボレーションをサポートするため、推奨の受け入れ率が高く、許容可能な計画に到達するためのインタラクションラウンドが少なくなることを示している。
関連論文リスト
- Towards a Virtual Neuroscientist: Autonomous Neuroimaging Analysis via Multi-Agent Collaboration [53.772014300855375]
我々は,自律型エンドツーエンド神経画像解析のためのマルチエージェントシステムであるNIAgentを紹介する。
従来のフラットなツール呼び出しエージェントとは異なり、NIAgentはコード中心の実行パラダイムを採用している。
本稿では,コホートレベルの検定とエージェント視覚検査を組み合わせた,自律的品質管理のための階層的検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-10T06:30:19Z) - Green Shielding: A User-Centric Approach Towards Trustworthy AI [19.485991712624095]
Green Shieldingはエビデンスベースのデプロイメントガイダンスを構築するための,ユーザ中心のアジェンダだ。
HealthCareMagic-Diagnosis による医療診断における Green Shielding のインスタンス化
ここでは医療診断においてインスタンス化されているが、アジェンダは他の意思決定支援設定やエージェントAIシステムに自然に拡張されている。
論文 参考訳(メタデータ) (2026-04-27T17:04:17Z) - Self-Distilled Reinforcement Learning for Co-Evolving Agentic Recommender Systems [47.428704670017765]
大規模言語モデルを用いたエージェント推薦システム(ARS)は、推奨エージェントとユーザエージェントとのマルチターンインタラクションとしてレコメンデーションを再構成する。
既存のARSは主にリフレクションスタイルのパラダイムで最適化されており、過去のインタラクショントラジェクトリはテキストメモリとして格納される。
エージェントレコメンデータシステムの共進化のための自己蒸留型強化学習フレームワークであるCoARSを提案する。
論文 参考訳(メタデータ) (2026-04-11T04:52:38Z) - Care-Conditioned Neuromodulation for Autonomy-Preserving Supportive Dialogue Agents [3.7958475517455947]
状態依存型制御フレームワークであるCCN(Care-Conditioned Neuromodulation)を導入する。
依存関係と強制をペナルティ化しながら、自律的なサポートと支援に報いるユーティリティ機能を定義します。
これらの結果から,自律感性対話における状態依存制御とユーティリティベース選択を併用した多目的アライメントの実践的アプローチが示唆された。
論文 参考訳(メタデータ) (2026-04-02T03:44:58Z) - DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding [59.16244104797919]
本稿では,リスク制約付き復号法(DARC)*による分散アライメント(Disagreement-Aware Alignment)を提案する。
DARCは応答選択を、分布的に堅牢で、リスクに敏感な意思決定として捉えている。
アライメントベンチマークの実験では、DARCは競合平均品質を維持しながら、不一致と尾のリスクを低減する。
論文 参考訳(メタデータ) (2026-03-09T09:21:29Z) - Continuous Telemonitoring of Heart Failure using Personalised Speech Dynamics [17.682803546212824]
本研究では,個人内における相対的な症状変化の軌跡を捉えるためのLIPT方式を提案する。
このフレームワークの中心は、縦長の音声記録を文脈対応の潜在表現に変換するシーケンスパーソナライズ(PSE)である。
225人のコホートによる実験の結果、LIPTパラダイムは古典的な横断的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-23T10:19:17Z) - TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs) [7.2159153945746795]
LLM(Large Language Models)は、広範囲にわたる医学的知識を符号化するが、縦断的患者の軌跡に確実に適用することは困難である。
凍結LDMによる時間的臨床推論を可能にするフレームワークであるTRACEを紹介する。
MIMIC-IVによる縦断的臨床イベントストリームの評価
論文 参考訳(メタデータ) (2026-02-13T11:39:19Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - Empowering Clinicians with Medical Decision Transformers: A Framework for Sepsis Treatment [5.0005174003014865]
安全クリティカルな環境下での課題を解決するための医療意思決定変換器(MeDT)を提案する。
MeDTは、決定トランスフォーマーアーキテクチャを使用して、薬物投与推奨のポリシーを学ぶ。
MeDTは、患者の医療履歴、治療決定、結果、安定性に対する短期的影響の複雑な依存関係をキャプチャする。
論文 参考訳(メタデータ) (2024-07-28T03:40:00Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Causal Disentangled Variational Auto-Encoder for Preference
Understanding in Recommendation [50.93536377097659]
本稿では,コメンテータシステムにおける対話データから因果不整合表現を学習するためのCaD-VAE(Causal Disentangled Variational Auto-Encoder)を提案する。
この手法は構造因果モデルを用いて、潜在因子間の因果関係を記述する因果表現を生成する。
論文 参考訳(メタデータ) (2023-04-17T00:10:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。