論文の概要: Zero-Shot Clinical Acronym Expansion via Latent Meaning Cells
- arxiv url: http://arxiv.org/abs/2010.02010v2
- Date: Thu, 12 Nov 2020 19:25:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 05:16:33.579724
- Title: Zero-Shot Clinical Acronym Expansion via Latent Meaning Cells
- Title(参考訳): 潜在意味細胞によるゼロショット臨床頭字語拡大
- Authors: Griffin Adams, Mert Ketenci, Shreyas Bhave, Adler Perotte, No\'emie
Elhadad
- Abstract要約: 本稿では,単語の文脈的表現を局所的文脈とメタデータを組み合わせて学習する潜時変数モデルであるLatent Meaning Cellsを紹介する。
3つのデータセットにまたがるゼロショット臨床頭字語拡張作業におけるモデルの評価を行った。
- 参考スコア(独自算出の注目度): 2.5374060352463697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Latent Meaning Cells, a deep latent variable model which learns
contextualized representations of words by combining local lexical context and
metadata. Metadata can refer to granular context, such as section type, or to
more global context, such as unique document ids. Reliance on metadata for
contextualized representation learning is apropos in the clinical domain where
text is semi-structured and expresses high variation in topics. We evaluate the
LMC model on the task of zero-shot clinical acronym expansion across three
datasets. The LMC significantly outperforms a diverse set of baselines at a
fraction of the pre-training cost and learns clinically coherent
representations. We demonstrate that not only is metadata itself very helpful
for the task, but that the LMC inference algorithm provides an additional large
benefit.
- Abstract(参考訳): 本稿では,単語の文脈的表現を局所的文脈とメタデータを組み合わせて学習する潜時変数モデルであるLatent Meaning Cellsを紹介する。
メタデータはセクションタイプのような粒度の細かいコンテキストや、ユニークなドキュメントIDのようなよりグローバルなコンテキストを参照することができる。
文脈的表現学習のためのメタデータの信頼性は、テキストが半構造化されトピックの高度変動を表現する臨床領域におけるアプロポである。
3つのデータセットにまたがるゼロショット臨床頭字語拡張作業におけるLCCモデルの評価を行った。
lmcは、プレトレーニングコストのごく一部で、さまざまなベースラインセットを著しく上回り、臨床的にコヒーレントな表現を学ぶ。
我々は、メタデータ自体がタスクに非常に役立つだけでなく、LCC推論アルゴリズムがさらなる大きな利点をもたらすことを実証した。
関連論文リスト
- Attribute Structuring Improves LLM-Based Evaluation of Clinical Text
Summaries [62.32403630651586]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - On the Semantics of LM Latent Space: A Vocabulary-defined Approach [29.55309950026882]
本稿では,LM潜在空間内で参照フレームを確立する語彙定義セマンティクスを提案する。
我々のアプローチは、モデル中心の洞察にLM語彙を活用する、事前の絡み合った分析を超越する。
また,ロジットを計算し,微分可能性や局所等方性を重視した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-29T14:29:48Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Language Models As Semantic Indexers [80.76133595275728]
生成言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMINDEXERを紹介する。
本稿では, 逐次離散表現を生成可能なセマンティックインデクサを導入することで, シーケンシャルなシーケンシャルIDの課題に対処する。
学習したセマンティックインデクサは、レコメンデーションや検索など、さまざまな下流タスクを容易にすることができる。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - A Data-driven Latent Semantic Analysis for Automatic Text Summarization
using LDA Topic Modelling [0.0]
本研究では、トピックモデリングを行うために使用されるLDA(Latent Dirichlet Allocation)アプローチを提案する。
可視化は主要なトピックを概観し、個々のトピックに対する深い意味を許容し、帰結させる。
その結果,処理文書中の話題の出現確率を考慮し,純粋にランク付けされた用語が示唆された。
論文 参考訳(メタデータ) (2022-07-23T11:04:03Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Referring Image Segmentation via Cross-Modal Progressive Comprehension [94.70482302324704]
画像セグメンテーションの参照は、自然言語表現で与えられた記述によく一致するエンティティの前景マスクをセグメンテーションすることを目的としている。
従来のアプローチでは、暗黙的な特徴相互作用と視覚的モダリティと言語的モダリティの融合を用いてこの問題に対処していた。
本稿では,この課題に効果的に対応するために,Cross-Modal Progressive (CMPC) モジュールと Text-Guided Feature Exchange (TGFE) モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-01T16:02:30Z) - A Benchmark for LiDAR-based Panoptic Segmentation based on KITTI [44.79849028988664]
本稿では,レーザーによるパノプティックセグメンテーションのトレーニングと評価のためのセマンティックキッティの拡張について述べる。
データを提供し、時間的に一貫したインスタンス情報で与えられたセマンティックアノテーションを強化するために必要な処理手順について議論する。
我々は、最先端LiDARに基づくセマンティックセグメンテーションアプローチと最先端検出器を組み合わせた2つの強力なベースラインを提案する。
論文 参考訳(メタデータ) (2020-03-04T23:44:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。