論文の概要: Beyond Long Context: When Semantics Matter More than Tokens
- arxiv url: http://arxiv.org/abs/2510.25816v1
- Date: Wed, 29 Oct 2025 16:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.509533
- Title: Beyond Long Context: When Semantics Matter More than Tokens
- Title(参考訳): 長いコンテキストを超えて: 意味論がトークンよりも重要になるとき
- Authors: Tarun Kumar Chawdhury, Jon D. Duke,
- Abstract要約: Electronic Health Recordsは、FHIR DocumentReferenceリソースにエンコードされたbase64アタッチメントとして、臨床ドキュメントを保存している。
Lopezらによって導入されたクリニカルエンティティ拡張検索(CLEAR)法は、エンティティ認識検索を使用している。
CLEARは58.3%の勝利率を達成し、平均的な意味的類似度は0.878であり、幅広いコンテキスト処理よりも78%少ないトークンを使用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic Health Records (EHR) store clinical documentation as base64 encoded attachments in FHIR DocumentReference resources, which makes semantic question answering difficult. Traditional vector database methods often miss nuanced clinical relationships. The Clinical Entity Augmented Retrieval (CLEAR) method, introduced by Lopez et al. 2025, uses entity aware retrieval and achieved improved performance with an F1 score of 0.90 versus 0.86 for embedding based retrieval, while using over 70 percent fewer tokens. We developed a Clinical Notes QA Evaluation Platform to validate CLEAR against zero shot large context inference and traditional chunk based retrieval augmented generation. The platform was tested on 12 clinical notes ranging from 10,000 to 65,000 tokens representing realistic EHR content. CLEAR achieved a 58.3 percent win rate, an average semantic similarity of 0.878, and used 78 percent fewer tokens than wide context processing. The largest performance gains occurred on long notes, with a 75 percent win rate for documents exceeding 65,000 tokens. These findings confirm that entity aware retrieval improves both efficiency and accuracy in clinical natural language processing. The evaluation framework provides a reusable and transparent benchmark for assessing clinical question answering systems where semantic precision and computational efficiency are critical.
- Abstract(参考訳): EHR(Electronic Health Records)は、FHIR DocumentReferenceリソースにbase64エンコードされたアタッチメントとして臨床文書を格納する。
伝統的なベクトルデータベースの手法は、しばしば微妙な臨床関係を見逃す。
Lopezらによって導入されたCLEAR法は、エンティティ認識検索を使用し、F1スコアが0.90対0.86と改善された。
クリニカルノートQA評価プラットフォームを開発し,ゼロショット大コンテキスト推論と従来型のチャンクベース検索拡張に対するCLEARの有効性を検証した。
このプラットフォームは、1万から6万5000個のトークンからリアルなEHRコンテンツを表す12の臨床記録でテストされた。
CLEARは58.3%の勝利率を達成し、平均的な意味的類似度は0.878であり、幅広いコンテキスト処理よりも78%少ないトークンを使用した。
最大のパフォーマンス向上はロングノートで行われ、75%の勝利率は6万5000トークンを超えた。
これらの結果から, 実体認識検索は, 臨床自然言語処理の効率と精度を両立させることが明らかとなった。
この評価フレームワークは、意味的精度と計算効率が重要な臨床質問応答システムを評価するために、再利用可能な透明なベンチマークを提供する。
関連論文リスト
- EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Detection of Adverse Drug Events in Dutch clinical free text documents using Transformer Models: benchmark study [2.6758306285161075]
オランダのフリーテキスト文書における有害薬物事象(ADE)検出の基準を確立した。
両方向長短期記憶(Bidirectional Long Short-Term Memory, Bi-LSTM)モデルと4つのトランスフォーマーベースオランダ語および/または多言語エンコーダモデルを訓練した。
ADE RCモデルを金標準(2ステップタスク)と予測エンティティを用いて内部的に評価した。
論文 参考訳(メタデータ) (2025-07-25T16:02:02Z) - Development and Validation of the Provider Documentation Summarization Quality Instrument for Large Language Models [3.0569643495382173]
The Provider Summarization Quality Instrument (PDSQI-9) was developed to evaluate LLM- generated clinical summaries。
検証には、実体的妥当性のためのピアソン相関、因子分析、構造的妥当性のためのクロンバッハのαが含まれていた。
PDSQI-9は強い内部整合性と信頼性を示した。
論文 参考訳(メタデータ) (2025-01-15T17:47:57Z) - Leveraging deep active learning to identify low-resource mobility
functioning information in public clinical notes [0.157286095422595]
国際機能・障害・健康分類(ICF)のモビリティ領域に関する最初の公開アノテートデータセット
我々はNational NLP Clinical Challenges (n2c2) 研究データセットを用いてキーワード拡張を用いた候補文のプールを構築する。
最終的なデータセットは,5,511のアクションエンティティ,5,328のモビリティエンティティ,306のアシストエンティティ,639の量子化エンティティを含む,合計11,784のエンティティからなる4,265の文で構成されています。
論文 参考訳(メタデータ) (2023-11-27T15:53:11Z) - A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Detecting of a Patient's Condition From Clinical Narratives Using
Natural Language Representation [0.3149883354098941]
本稿では,臨床自然言語表現学習と教師付き分類フレームワークを提案する。
この新しいフレームワークは、文脈的臨床物語入力から分布構文と潜在意味論(表現学習)を共同で発見する。
提案手法では, 精度, 再現性, 精度をそれぞれ89 %, 88 %, 89 %とした総合分類性能が得られる。
論文 参考訳(メタデータ) (2021-04-08T17:16:04Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。