論文の概要: SepsisAI Orchestrator: A Containerized and Scalable Platform for Deploying AI Models and Real-Time Monitoring in Early Sepsis Detection
- arxiv url: http://arxiv.org/abs/2605.22331v1
- Date: Thu, 21 May 2026 11:19:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.223198
- Title: SepsisAI Orchestrator: A Containerized and Scalable Platform for Deploying AI Models and Real-Time Monitoring in Early Sepsis Detection
- Title(参考訳): SepsisAI Orchestrator: 早期セプシス検出におけるAIモデルのデプロイとリアルタイムモニタリングのためのコンテナ化およびスケーラブルなプラットフォーム
- Authors: Santiago Ospitia, John Sanabria, John Garcia-Henao,
- Abstract要約: 本稿では,機械学習のためのオープンソースのモジュールプラットフォームであるSepsisAI-Orchestratorを紹介する。
このプラットフォームはHL7 FHIRにインスパイアされた臨床文書アーキテクチャを統合している。
レプリカカウントはホストの物理CPUスレッドカウントと一致しなければなりません。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite strong predictive results in the clinical machine learning literature, the translation of these models into bedside use remains limited by systems-level barriers: heterogeneous data representations, the absence of standardized deployment workflows, and a mismatch between research prototypes and the concurrency and latency requirements of hospital environments. We present the SepsisAI-Orchestrator, an open-source modular platform that addresses this deployment gap for early sepsis detection. The platform integrates HL7 FHIR-inspired Clinical Document Architecture (CDA) preprocessing, NoSQL storage, a containerized LightGBM classifier served via REST APIs, and a Streamlit clinical dashboard, orchestrated with Docker and Kubernetes. A previously validated LightGBM model (F1 0.87-0.94 on PhysioNet 2019) is reused without modification; the contribution lies in the surrounding infrastructure and its empirical characterization under load. Using k6 with 50-1000 concurrent virtual users, we find that replica count must be matched to the physical CPU thread count of the host: scaling from 3 to 12 replicas on a 12-thread CPU reduces p95 latency from 3.3s to 1.41s (57.3% reduction) and eliminates all request failures, while over-provisioning to 24 or 48 replicas degrades performance due to scheduler contention. To our knowledge this U-shaped scaling behavior has not been quantified previously for clinical AI inference workloads. We do not claim prospective clinical validation. Source code and deployment manifests are available at https://github.com/nucleusai/sepsisai-orchestrator.
- Abstract(参考訳): 臨床機械学習の文献に強い予測結果があるにもかかわらず、これらのモデルのベッドサイド使用への変換は、不均一なデータ表現、標準化されたデプロイメントワークフローの欠如、研究プロトタイプと病院環境の並行性と遅延要件のミスマッチなど、システムレベルの障壁によって制限されている。
SepsisAI-Orchestratorはオープンソースのモジュールプラットフォームで、早期のセシス検出のためにこのデプロイメントギャップに対処します。
このプラットフォームはHL7 FHIRにインスパイアされた臨床ドキュメントアーキテクチャ(CDA)の事前処理、NoSQLストレージ、REST API経由で提供されるコンテナ化されたLightGBM分類器、DockerとKubernetesでオーケストレーションされたStreamlit臨床ダッシュボードを統合している。
以前検証されたLightGBMモデル(F1 0.87-0.94 on PhysioNet 2019)は変更せずに再利用されている。
例えば、12スレッドのCPU上で3から12のレプリカをスケーリングすることで、p95のレイテンシを3.3秒から1.41秒(57.3%の削減)に削減し、すべての要求障害を解消します。
我々の知る限り、このU字型のスケーリングの挙動は、これまで臨床AI推論のワークロードで定量化されていなかった。
臨床検査は行わない。
ソースコードとデプロイメントマニフェストはhttps://github.com/nucleusai/sepsisai-orchestrator.comで公開されている。
関連論文リスト
- Template-as-Ontology: Configurable Synthetic Data Infrastructure for Cross-Domain Manufacturing AI Validation [0.0]
1つのPython構成モジュールは、タイムステップ製造シミュレータの仕様として機能する。
5層パイプライン-シミュレート、CDC/Icebergレイクハウス、スタースキーマ、12のパラメータ化されたAIツール-は、因果的に一貫性のあるMES型のデータを生成します。
このフレームワークは、個別の製造AIバリデーションのための再利用可能なデータ層を提供する。
論文 参考訳(メタデータ) (2026-05-11T21:36:05Z) - SemanticALLI: Caching Reasoning, Not Just Responses, in Agentic Systems [4.029672905329379]
PMGのマーケティングインテリジェンスプラットフォームのパイプライン対応アーキテクチャであるSemanticALLIを紹介する。
生成をAIR(Analytic Intent Resolution)とVS(Analytic Intent Synthesis)に分解することで、SemanticALLIは中間表現(IR)を第一級のキャッシュ可能なアーティファクトに構造化した。
我々の構造的アプローチは、83.10%のヒット率を達成するための追加のステージである可視化合成ステージを可能にし、4,023 LLMコールを2.66msで通過させる。
論文 参考訳(メタデータ) (2026-01-22T19:42:21Z) - Scalable and Secure AI Inference in Healthcare: A Comparative Benchmarking of FastAPI and Triton Inference Server on Kubernetes [0.0]
本稿では,FastAPIを用いた軽量なPythonベースのRESTサービスと,NVIDIA Triton Inference Serverという特殊な高性能サービスエンジンであるNVIDIA Triton Inference Serverを比較したベンチマーク分析を行う。
結果から,単一要求ワークロードに対するFastAPIとTritonの明確なトレードオフが示唆された。
本研究は、企業臨床AIのベストプラクティスとしてハイブリッドモデルを検証し、セキュアで高可用性なデプロイメントのための青写真を提供する。
論文 参考訳(メタデータ) (2026-01-19T18:48:29Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - Calibrated and Robust Foundation Models for Vision-Language and Medical Image Tasks Under Distribution Shift [2.292525568003776]
CLIPやSAMといった基礎モデルには、低ショット転送学習による高度なコンピュータビジョンと医療画像があり、限られたデータでCADDを支援する。
両課題に対処するためのFIPとCMPの融合である textbfStaRFM を提案する。
パッチワイド正規化により3Dに拡張されたFIPを適用し、埋め込みシフトを減らすとともに、ボクセルレベルの予測のために修正されたCMPをセグメンテーションの不確実性に適用する。
論文 参考訳(メタデータ) (2025-07-12T09:39:07Z) - MorpheusNet: Resource efficient sleep stage classifier for embedded
on-line systems [0.0]
睡眠段階分類(SSC)は労働集約的な作業であり、専門家は手動の分類のために数時間の電気生理学的記録を調べる必要がある。
ウェアラブルデバイスの普及と拡張により、SSCは睡眠ベースの治療法を大規模に展開することができる。
ディープラーニングはこのプロセスを自動化するための潜在的な方法として注目を集めている。
論文 参考訳(メタデータ) (2024-01-14T17:52:08Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。