論文の概要: Continually Self-Improving Language Models for Bariatric Surgery Question--Answering
- arxiv url: http://arxiv.org/abs/2505.16102v1
- Date: Thu, 22 May 2025 01:02:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.958151
- Title: Continually Self-Improving Language Models for Bariatric Surgery Question--Answering
- Title(参考訳): バラエティ科手術における自己改善型言語モデルの検討--回答
- Authors: Yash Kumar Atri, Thomas H Shin, Thomas Hartvigsen,
- Abstract要約: 本稿では,リアルタイムな医学的証拠を自律的に統合する適応型検索拡張生成モデルであるbRAGgenを紹介する。
また,bRAGqは1,302例の手術関連質問項目を収集し,専門的外科医による検証を行った。
- 参考スコア(独自算出の注目度): 12.694485038895813
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While bariatric and metabolic surgery (MBS) is considered the gold standard treatment for severe and morbid obesity, its therapeutic efficacy hinges upon active and longitudinal engagement with multidisciplinary providers, including surgeons, dietitians/nutritionists, psychologists, and endocrinologists. This engagement spans the entire patient journey, from preoperative preparation to long-term postoperative management. However, this process is often hindered by numerous healthcare disparities, such as logistical and access barriers, which impair easy patient access to timely, evidence-based, clinician-endorsed information. To address these gaps, we introduce bRAGgen, a novel adaptive retrieval-augmented generation (RAG)-based model that autonomously integrates real-time medical evidence when response confidence dips below dynamic thresholds. This self-updating architecture ensures that responses remain current and accurate, reducing the risk of misinformation. Additionally, we present bRAGq, a curated dataset of 1,302 bariatric surgery--related questions, validated by an expert bariatric surgeon. bRAGq constitutes the first large-scale, domain-specific benchmark for comprehensive MBS care. In a two-phase evaluation, bRAGgen is benchmarked against state-of-the-art models using both large language model (LLM)--based metrics and expert surgeon review. Across all evaluation dimensions, bRAGgen demonstrates substantially superior performance in generating clinically accurate and relevant responses.
- Abstract(参考訳): 重症および致死的な肥満に対する外科的および代謝的手術(MBS)は、金の標準治療とされているが、その治療効果は、外科医、栄養士、栄養士、心理学者、内分泌学者など、多分野の医療機関との活発かつ長期にわたる関わりによるものである。
このエンゲージメントは、術前の準備から長期の術後管理まで、患者の全旅にまたがる。
しかし、このプロセスは、論理学やアクセス障壁のような多くの医療格差によって妨げられ、タイムリーでエビデンスベースの臨床医が推奨する情報への患者へのアクセスを困難にしている。
このようなギャップに対処するために,動的しきい値以下で応答信頼度が低下した場合に,リアルタイムの医療証拠を自律的に統合する新しい適応型検索強化世代(RAG)モデルであるbRAGgenを導入する。
この自己更新アーキテクチャは、応答が現在かつ正確であることを保証し、誤報のリスクを低減します。
また,bRAGqは1,302例の手術関連質問項目を収集し,専門的外科医による検証を行った。
bRAGqは、包括的なMBSケアのための最初の大規模ドメイン固有のベンチマークである。
二相評価では、bRAGgenは、大言語モデル(LLM)ベースのメトリクスと専門外科医レビューの両方を用いて、最先端のモデルに対してベンチマークされる。
すべての評価次元において、bRAGgenは臨床的に正確で関連する反応を生成する上で、極めて優れた性能を示す。
関連論文リスト
- Surgeons vs. Computer Vision: A comparative analysis on surgical phase recognition capabilities [65.66373425605278]
自動手術相認識(SPR)は、人工知能(AI)を使用して、手術ワークフローをその重要なイベントに分割する。
従来の研究は、短い外科手術と直線的な外科手術に焦点を合わせており、時間的文脈が手術の段階をよりよく分類する専門家の能力に影響を与えるかどうかを探索していない。
本研究は,ロボットによる部分腎切除(RAPN)を高度に非直線的に行うことに焦点を当て,これらのギャップに対処する。
論文 参考訳(メタデータ) (2025-04-26T15:37:22Z) - SurgRAW: Multi-Agent Workflow with Chain-of-Thought Reasoning for Surgical Intelligence [16.584722724845182]
手術インテリジェンスにおける視覚-言語モデルの統合は、幻覚、ドメイン知識のギャップ、タスク相互依存性の限定的な理解によって妨げられている。
本稿では,CoT駆動型マルチエージェントフレームワークであるSurgRAWについて紹介する。
論文 参考訳(メタデータ) (2025-03-13T11:23:13Z) - RGAR: Recurrence Generation-augmented Retrieval for Factual-aware Medical Question Answering [29.065294682044]
現在のパラダイムであるRetrieval-Augmented Generation (RAG)は、大規模なコーパス検索を通じて専門的な医療知識を取得する。
本稿では,2つの情報源から関連する事実知識と概念知識の両方を検索する再帰生成拡張検索フレームワークであるRGARを紹介する。
論文 参考訳(メタデータ) (2025-02-19T01:50:10Z) - Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。
医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。
実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文 参考訳(メタデータ) (2024-11-14T06:19:18Z) - ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.09498356923132]
外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。
最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。
我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文 参考訳(メタデータ) (2024-04-22T10:33:06Z) - Automatic registration with continuous pose updates for marker-less
surgical navigation in spine surgery [52.63271687382495]
本研究では, 腰部脊柱管固定術の登録問題を, 無放射線で自動的に解決するアプローチを提案する。
深部神経ネットワークは、腰椎を分割し、その方向を同時に予測するように訓練され、前手術モデルに対する最初のポーズが得られた。
拡張現実ベースのナビゲーションシステムとの統合により、直感的な外科的ガイダンスが提供される。
論文 参考訳(メタデータ) (2023-08-05T16:26:41Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - The Brain Tumor Sequence Registration (BraTS-Reg) Challenge: Establishing Correspondence Between Pre-Operative and Follow-up MRI Scans of Diffuse Glioma Patients [31.567542945171834]
脳腫瘍シーケンス登録(BraTS-Reg)の課題について述べる。
BraTS-Regは、変形可能な登録アルゴリズムのための最初の公開ベンチマーク環境である。
BraTS-Regの目的は、引き続き研究の活発な資源として機能することである。
論文 参考訳(メタデータ) (2021-12-13T19:25:16Z) - Transformer-based unsupervised patient representation learning based on
medical claims for risk stratification and analysis [3.5492837081144204]
トランスフォーマーベースのマルチモーダルオートエンコーダ(TMAE)は,クレームデータから有意義な情報を符号化することで,効率的な患者表現を学習することができる。
我々は,60,000人以上の患者を対象とする実世界の小児検診データセットを用いてTMAEを訓練した。
論文 参考訳(メタデータ) (2021-06-23T21:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。