論文の概要: Automated Spelling Correction for Clinical Text Mining in Russian
- arxiv url: http://arxiv.org/abs/2004.04987v1
- Date: Fri, 10 Apr 2020 10:59:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 20:53:32.574565
- Title: Automated Spelling Correction for Clinical Text Mining in Russian
- Title(参考訳): ロシア語における臨床テキストマイニングのための自動綴り補正
- Authors: Ksenia Balabaeva, Anastasia Funkner, Sergey Kovalchuk
- Abstract要約: ロシア語の臨床テキストのためのスペルチェッカーモジュールを開発した。
全体的な精度は0.86、語彙精度は0.975、誤り精度は0.74である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The main goal of this paper is to develop a spell checker module for clinical
text in Russian. The described approach combines string distance measure
algorithms with technics of machine learning embedding methods. Our overall
precision is 0.86, lexical precision - 0.975 and error precision is 0.74. We
develop spell checker as a part of medical text mining tool regarding the
problems of misspelling, negation, experiencer and temporality detection.
- Abstract(参考訳): 本研究の目的は,ロシア語で臨床用テキスト用スペルチェッカーモジュールを開発することである。
説明されたアプローチは、文字列距離測定アルゴリズムと機械学習の埋め込み手法のテクニックを組み合わせる。
全体の精度は 0.86 、語彙精度 - 0.975 、誤差精度は 0.74 である。
我々は,医療用テキストマイニングツールの一部としてスペルチェッカーを開発し,ミススペル,否定,経験者,時間的検出の問題点について考察した。
関連論文リスト
- Assessing the Efficacy of Grammar Error Correction: A Human Evaluation
Approach in the Japanese Context [10.047123247001714]
我々は,最先端のシーケンスタギング文法誤り検出・修正モデル(SeqTagger)の性能評価を行った。
自動アノテーションツールキット ERRANT を用いて,SeqTagger の性能評価を行った。
その結果、精度は63.66%、リコールは20.19%であった。
論文 参考訳(メタデータ) (2024-02-28T06:43:43Z) - MISMATCH: Fine-grained Evaluation of Machine-generated Text with
Mismatch Error Types [68.76742370525234]
テキスト間のきめ細かいミスマッチに基づいて、7つのNLPタスクにおける人間の判断をモデル化する新しい評価手法を提案する。
細粒度評価のためのNLPタスクの最近の取り組みに触発されて,13種類のミスマッチエラータイプを紹介した。
7つのNLPタスクから得られた有意なデータセットの文対間のミスマッチ誤差は,人間の評価とよく一致している。
論文 参考訳(メタデータ) (2023-06-18T01:38:53Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - SoftCorrect: Error Correction with Soft Detection for Automatic Speech
Recognition [116.31926128970585]
我々は,明示的かつ暗黙的な誤り検出の限界を回避するため,ソフトエラー検出機構を備えたSoftCorrectを提案する。
暗黙的な誤り検出とCTC損失と比較すると、SoftCorrectはどの単語が誤りであるかを明示的な信号を提供する。
AISHELL-1とAidatatangデータセットの実験では、SoftCorrectはそれぞれ26.1%と9.4%のCER削減を達成した。
論文 参考訳(メタデータ) (2022-12-02T09:11:32Z) - Medication Error Detection Using Contextual Language Models [12.100309608440103]
本稿では,BERTに基づく文脈言語モデルを用いて,テキストや音声の異常を検出する方法について述べる。
提案モデルは,患者データなどのコンテキスト情報に基づいて,テキスト依存のパターンを学習し,誤出力を予測する。
実験の結果、テキスト入力では96.63%、音声入力では79.55%の精度が得られた。
論文 参考訳(メタデータ) (2022-01-09T15:21:54Z) - Vartani Spellcheck -- Automatic Context-Sensitive Spelling Correction of
OCR-generated Hindi Text Using BERT and Levenshtein Distance [3.0422254248414276]
Vartani Spellcheck はヒンディー語テキストのスペル補正のための文脈依存型アプローチである。
81%の精度で, 従来確立されていたヒンディー語における文脈依存的誤り訂正機構よりも有意な改善が認められた。
論文 参考訳(メタデータ) (2020-12-14T15:49:54Z) - Context-aware Stand-alone Neural Spelling Correction [11.643354740136953]
本稿では,事前学習した言語モデルを微調整することにより,ミススペルをシーケンスラベリングタスクとして共同で検出し,修正する,シンプルで強力なソリューションを提案する。
我々の解は、これまでの最先端の結果を12.8%の絶対F0.5スコアで上回っている。
論文 参考訳(メタデータ) (2020-11-12T20:34:49Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z) - Provably Robust Metric Learning [98.50580215125142]
既存のメトリクス学習アルゴリズムは、ユークリッド距離よりもロバストなメトリクスをもたらすことを示す。
対向摂動に対して頑健なマハラノビス距離を求めるための新しい距離学習アルゴリズムを提案する。
実験結果から,提案アルゴリズムは証明済みの堅牢な誤りと経験的堅牢な誤りの両方を改善した。
論文 参考訳(メタデータ) (2020-06-12T09:17:08Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z) - Negation Detection for Clinical Text Mining in Russian [0.0]
ロシアでは、医療記録の問題に対処する自然言語処理のための手段は存在しない。
本稿では,否定検出モジュールについて述べる。
この検出器は5つの疾患の否定を分類し、平均Fスコアは0.81から0.93である。
論文 参考訳(メタデータ) (2020-04-10T10:38:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。