論文の概要: Dental-TriageBench: Benchmarking Multimodal Reasoning for Hierarchical Dental Triage
- arxiv url: http://arxiv.org/abs/2604.13060v1
- Date: Wed, 18 Mar 2026 07:43:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.647263
- Title: Dental-TriageBench: Benchmarking Multimodal Reasoning for Hierarchical Dental Triage
- Title(参考訳): 歯科用トリアージベンチ : 階層型歯科トリアージにおけるマルチモーダル推論のベンチマーク
- Authors: Ziyi He, Yushi Feng, Shuangyu Yang, Yinghao Zhu, Xichen Zhang, Pak Chuen Patrick Tai, Hei Yuet Lo, Songying Wu, Weifa Yang, Lequan Yu,
- Abstract要約: 理学療法を駆使した歯科用トリアージベンチマークとして,初となる歯科用トリアージベンチについて紹介する。
専門家が承認した黄金の推論軌跡に注釈を付けた未確認ケースが246件含まれている。
歯科医師3名に対して, プロプライエタリ, オープンソース, 医療ドメインMLLM19名を対象にベンチマークを行った。
- 参考スコア(独自算出の注目度): 20.215180861560558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dental triage is a safety-critical clinical routing task that requires integrating multimodal clinical information (e.g., patient complaints and radiographic evidence) to determine complete referral plans. We present Dental-TriageBench, the first expert-annotated benchmark for reasoning-driven multimodal dental triage. Built from authentic outpatient workflows, it contains 246 de-identified cases annotated with expert-authored golden reasoning trajectories, together with hierarchical triage labels. We benchmark 19 proprietary, open-source, and medical-domain MLLMs against three junior dentists serving as the human baseline, and find a substantial human--model gap, on fine-grained treatment-level triage. Further analyses show that accurate triage requires both complaint and OPG information, and that model errors concentrate on cases with multiple referral domains, where MLLMs tend to produce overly narrow referral sets and omission-heavy errors. Dental-TriageBench provides a realistic testbed for developing multimodal clinical AI systems that are more clinically grounded, coverage-aware, and safer for downstream care.
- Abstract(参考訳): 歯科トリアージ(英: Dental triage)は、患者の苦情やX線学的証拠など、マルチモーダルな臨床情報を統合することで、完全なレファレンス計画を決定する安全クリティカルな臨床ルーティングタスクである。
理学療法を駆使したマルチモーダルデンタルトリアージのための最初のエキスパートアノテートベンチマークであるDate-TriageBenchについて紹介する。
本物の外来のワークフローから構築され、専門家が承認した黄金の推論軌跡に注釈を付けた246件の未確認ケースと、階層的なトリアージラベルを含んでいる。
人体ベースラインとして機能する若年者歯科医師3名に対して, プロプライエタリ, オープンソース, 医療ドメインMLLM19例をベンチマークし, きめ細かい治療レベルトリアージに基づいて, 有意な人-モデルギャップを見いだした。
さらに分析したところ、正確なトリアージには苦情情報とOPG情報の両方が必要であり、モデルエラーは複数の参照ドメインを持つケースに集中しており、MLLMは過度に狭い参照セットと省略重大なエラーを生じる傾向にある。
Dental-TriageBenchはマルチモーダルな臨床AIシステムを開発するための現実的なテストベッドを提供する。
関連論文リスト
- SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation [17.16459372606428]
近年,Cone-Beam Computed Tomography (CBCT) の歯構造セグメンテーションは著しい進歩を遂げている。
課題は、フルアノテートされたデータの取得困難と、マルチソースデータの取得容易性から生じる。
マルチソース歯のセグメンテーションのための一般化可能な半教師付きフレームワークであるSemiToothを提案する。
論文 参考訳(メタデータ) (2026-03-12T07:15:48Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - DentalGPT: Incentivizing Multimodal Complex Reasoning in Dentistry [28.389946455559713]
現在のマルチモーダル大言語モデル(MLLM)は、細粒度の歯の視覚的詳細を捉えるのに苦労している。
高品質なドメイン知識注入と強化学習により開発された歯科用MLLMである歯科用GPTについて述べる。
論文 参考訳(メタデータ) (2025-12-12T13:42:57Z) - OralGPT-Omni: A Versatile Dental Multimodal Large Language Model [44.919874082284686]
オラルGPT-オムニ (OralGPT-Omni) は, 各種歯科画像モダリティおよび臨床タスクを包括的に分析するための最初の歯科用特殊化MLLMである。
歯科医師の診断的推論を的確に把握するために,臨床に基礎をおくチェーン・オブ・ソート・データセットであるTRACE-CoTを構築した。
MMOral-Uniは歯科画像解析のための最初の統一型マルチモーダルベンチマークである。
論文 参考訳(メタデータ) (2025-11-27T03:21:20Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - DentalBench: Benchmarking and Advancing LLMs Capability for Bilingual Dentistry Understanding [18.678007079687706]
歯科領域における大規模言語モデル(LLM)の評価と進歩を目的とした,最初の総合的なベンチマークであるDentureBenchを紹介する。
デンタルベンチは、4つのタスクと16の歯科サブフィールドにまたがる36,597の質問がある英語と中国語の質問回答(QA)ベンチマークであるデンタルQAと、337.35万のトークンを歯科領域適応のためにキュレートした大規模で高品質なコーパスであるデンタルコーパスの2つの主要コンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-08-28T04:35:51Z) - LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation [58.25892575437433]
医学における大規模言語モデル (LLMs) の評価は, 医療応用には精度が高く, 誤差の少ないため重要である。
LLMEval-Medは、5つの中核医療領域をカバーする新しいベンチマークであり、現実の電子健康記録から得られた2,996の質問と専門家が設計した臨床シナリオを含む。
論文 参考訳(メタデータ) (2025-06-04T15:43:14Z) - ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection [54.270188252068145]
ProstaTDは、ロボット補助前立腺切除術の技術的要求領域から開発された、外科的三重項検出のための大規模なデータセットである。
このデータセットは、71,775の動画フレームと196,490の注釈付きトリプルトインスタンスで構成され、複数の機関で実施された21の手術から収集された。
ProstaTDは、これまでで最大かつ最も多様な3重項データセットであり、単純な分類から正確な空間的境界と時間的境界を持つ完全な検出へとフィールドを移動している。
論文 参考訳(メタデータ) (2025-06-01T19:29:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。