論文の概要: A Locally Executable AI System for Improving Preoperative Patient Communication: A Multi-Domain Clinical Evaluation
- arxiv url: http://arxiv.org/abs/2510.01671v1
- Date: Thu, 02 Oct 2025 04:53:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.998327
- Title: A Locally Executable AI System for Improving Preoperative Patient Communication: A Multi-Domain Clinical Evaluation
- Title(参考訳): 手術前コミュニケーション改善のための局所的実行可能なAIシステム:多施設臨床評価
- Authors: Motoki Sato, Yuki Matsushita, Hidekazu Takahashi, Tomoaki Kakazu, Sou Nagata, Mizuho Ohnuma, Atsushi Yoshikawa, Masayuki Yamamura,
- Abstract要約: LENOHAは、入力を高精度な文変換器の制約でルーティングする安全第一のローカルファーストシステムである。
臨床問合せのために、クリニカルカレーションされたFAQから口頭で回答を返す。
エネルギー検定の結果,1回の入力で1.0 mWh,小語で168 mWhの応答で1回の応答で1.0 mWhを消費することがわかった。
- 参考スコア(独自算出の注目度): 1.9205944025326396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patients awaiting invasive procedures often have unanswered pre-procedural questions; however, time-pressured workflows and privacy constraints limit personalized counseling. We present LENOHA (Low Energy, No Hallucination, Leave No One Behind Architecture), a safety-first, local-first system that routes inputs with a high-precision sentence-transformer classifier and returns verbatim answers from a clinician-curated FAQ for clinical queries, eliminating free-text generation in the clinical path. We evaluated two domains (tooth extraction and gastroscopy) using expert-reviewed validation sets (n=400/domain) for thresholding and independent test sets (n=200/domain). Among the four encoders, E5-large-instruct (560M) achieved an overall accuracy of 0.983 (95% CI 0.964-0.991), AUC 0.996, and seven total errors, which were statistically indistinguishable from GPT-4o on this task; Gemini made no errors on this test set. Energy logging shows that the non-generative clinical path consumes ~1.0 mWh per input versus ~168 mWh per small-talk reply from a local 8B SLM, a ~170x difference, while maintaining ~0.10 s latency on a single on-prem GPU. These results indicate that near-frontier discrimination and generation-induced errors are structurally avoided in the clinical path by returning vetted FAQ answers verbatim, supporting privacy, sustainability, and equitable deployment in bandwidth-limited environments.
- Abstract(参考訳): 侵襲的な手続きを待っている患者は、未解決の手続き前の質問に答えることが多いが、時間的に圧迫されたワークフローとプライバシ制約はパーソナライズされたカウンセリングを制限する。
本稿では, 高精度文変換器分類器を用いて入力をルーティングし, 臨床問合せのためにクリニカルキュレートされたFAQから音声応答を返却し, 臨床パスにおける自由テキスト生成を除去する, 安全性第一のローカルファーストシステムであるLENOHA(Low Energy, No Hallucination, leave No One Behind Architecture)を提案する。
しきい値と独立したテストセット(n=200/ドメイン)について,専門家レビューによる検証セット(n=400/ドメイン)を用いて2つの領域(歯抜,胃内視鏡)を評価した。
4つのエンコーダのうち、E5-large-instruct (560M) は0.983 (95% CI 0.964-0.991)、AUC 0.996、および7つの合計誤差を達成した。
エネルギーログによると、非生成的な臨床パスは入力毎に ~1.0 mWh を消費し、局所8B SLM からの小さなトーク応答あたり ~168 mWh は ~170倍の差であり、1つのオンプレムGPU上では ~0.10 秒のレイテンシを維持している。
以上の結果から,評価されたFAQ回答を冗長に返却し,プライバシ,持続可能性,帯域幅に制限のある環境における公平な展開をサポートすることにより,臨床経過において最前線の識別や発生によるエラーを回避できることが示唆された。
関連論文リスト
- Retrieval-Augmented Guardrails for AI-Drafted Patient-Portal Messages: Error Taxonomy Construction and Large-Scale Evaluation [5.555479009357263]
EHRポータル経由の非同期患者・クリニックメッセージングは、クリニックのワークロードの増加源である。
1) 5つのドメインと59の粒度のエラーコードからなる臨床基礎的エラーオントロジーを導入し,(2)検索強化評価パイプラインを開発し,(3)拡張性,解釈性,階層的エラー検出を実現するためにDSPyを用いた2段階のプロンプトアーキテクチャを提供する。
論文 参考訳(メタデータ) (2025-09-26T16:42:43Z) - EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.66870367661342]
大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。
LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。
敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。
私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文 参考訳(メタデータ) (2025-07-30T08:44:22Z) - Neural at ArchEHR-QA 2025: Agentic Prompt Optimization for Evidence-Grounded Clinical Question Answering [3.3260862557368926]
今回我々は,BioNLP 2025 Arch-QA の準優勝者である Neural について紹介する。
提案手法は,(1)文章レベルのエビデンス同定と(2)明示的な引用による回答合成にタスクを分解する。
自己整合性投票方式は、精度を犠牲にすることなく証拠リコールをさらに改善する。
論文 参考訳(メタデータ) (2025-06-12T14:36:18Z) - Uncertainty-guided annotation enhances segmentation with the human-in-the-loop [5.669636524329784]
不確実性ガイド。
(UGA)は、AIがその不確実性を臨床医に伝えることを可能にする、ループ内の人間的アプローチを導入している。
UGAはピクセルレベルでの不確実性を定量化することでこの相互作用を緩和し、それによってモデルの限界を明らかにする。
より広範なアプリケーションとコミュニティへの貢献を促進するために、私たちはコードをアクセス可能にしました。
論文 参考訳(メタデータ) (2024-02-16T16:41:15Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - An End-to-End Set Transformer for User-Level Classification of
Depression and Gambling Disorder [24.776445591293186]
本研究は,ギャンブル中毒とうつ病のユーザレベル分類のためのトランスフォーマーアーキテクチャを提案する。
我々は、特定の個人からソーシャルメディア投稿の集合を処理し、投稿間の相互作用を利用し、ポストレベルでラベルノイズを除去する。
我々のアーキテクチャは、現代の特徴属性法と解釈可能であり、自動データセット作成を可能にします。
論文 参考訳(メタデータ) (2022-07-02T06:40:56Z) - Controlling False Positive/Negative Rates for Deep-Learning-Based
Prostate Cancer Detection on Multiparametric MR images [58.85481248101611]
そこで本研究では,病変からスライスまでのマッピング機能に基づく,病変レベルのコスト感受性損失と付加的なスライスレベルの損失を組み込んだ新しいPCa検出ネットワークを提案する。
1) 病変レベルFNRを0.19から0.10に, 病変レベルFPRを1.03から0.66に減らした。
論文 参考訳(メタデータ) (2021-06-04T09:51:27Z) - DDANet: Dual Decoder Attention Network for Automatic Polyp Segmentation [0.3734402152170273]
本稿では,デュアルデコーダアテンションネットワークに基づくDDANet'という新しいアーキテクチャを提案する。
実験では、Kvasir-SEGデータセットで訓練され、見えないデータセットでテストされたモデルは、0.7874のダイス係数、0.7010のmIoU、0.7987のリコール、0.8577の精度を達成した。
論文 参考訳(メタデータ) (2020-12-30T17:52:35Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。