論文の概要: Factuality Detection using Machine Translation -- a Use Case for German
Clinical Text
- arxiv url: http://arxiv.org/abs/2308.08827v1
- Date: Thu, 17 Aug 2023 07:24:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 17:35:05.218293
- Title: Factuality Detection using Machine Translation -- a Use Case for German
Clinical Text
- Title(参考訳): 機械翻訳による事実性検出 -ドイツ語臨床テキストへの適用-
- Authors: Mohammed Bin Sumait, Aleksandra Gabryszak, Leonhard Hennig, Roland
Roller
- Abstract要約: 本研究は、機械翻訳を用いて、英語データをドイツ語に翻訳し、トランスフォーマーに基づく事実性検出モデルを訓練する簡単な解を提案する。
臨床的テキストを自動的に処理する際には、特定の症状が明示的に存在せず、おそらくは存在せず、言及されていない、あるいは肯定されていない場合、その違いが生じるため、現実性は重要な役割を果たす。
- 参考スコア(独自算出の注目度): 45.875111164923545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Factuality can play an important role when automatically processing clinical
text, as it makes a difference if particular symptoms are explicitly not
present, possibly present, not mentioned, or affirmed. In most cases, a
sufficient number of examples is necessary to handle such phenomena in a
supervised machine learning setting. However, as clinical text might contain
sensitive information, data cannot be easily shared. In the context of
factuality detection, this work presents a simple solution using machine
translation to translate English data to German to train a transformer-based
factuality detection model.
- Abstract(参考訳): 事実性は、臨床テキストの自動処理において重要な役割を果たす。特定の症状が明示的に存在せず、おそらく言及されていない、あるいは肯定されていない場合、違いが生じるためである。
ほとんどの場合、教師付き機械学習環境でそのような現象を扱うには十分な数の例が必要である。
しかし、臨床テキストには機密情報が含まれているため、データは簡単には共有できない。
事実検出の文脈において、この研究は機械翻訳を用いて英語データをドイツ語に翻訳し、トランスフォーマーに基づく事実検出モデルを訓練する簡単な方法を示す。
関連論文リスト
- Cross-lingual Argument Mining in the Medical Domain [6.0158981171030685]
注釈付きデータがない医療用テキストでArgument Mining(AM)を実行する方法を示す。
我々の研究は、アノテーション(データ転送)を英語から特定のターゲット言語に自動翻訳・投影することは、注釈付きデータを生成する効果的な方法であることを示している。
また、スペイン語で自動生成されたデータを用いて、元の英語単言語設定の結果を改善する方法も示す。
論文 参考訳(メタデータ) (2023-01-25T11:21:12Z) - Prompting Large Language Model for Machine Translation: A Case Study [87.88120385000666]
我々は機械翻訳戦略の推進に関する体系的研究を行っている。
本稿では,プロンプトテンプレートと実演例選択の要因について検討する。
本稿では,モノリンガルデータの利用と,クロスリンガル,クロスドメイン,文-文書間伝達学習の実現可能性について検討する。
論文 参考訳(メタデータ) (2023-01-17T18:32:06Z) - Word Order Matters when you Increase Masking [70.29624135819884]
本研究では,事前学習対象自体に対する位置エンコーディングの除去効果について検討し,モデルが共起点のみの位置情報を再構成できるかどうかを検証した。
位置情報の必要性はマスキングの量とともに増大し、位置エンコーディングのないマスキング言語モデルではタスク上でこの情報を再構築できないことがわかった。
論文 参考訳(メタデータ) (2022-11-08T18:14:04Z) - A Medical Information Extraction Workbench to Process German Clinical
Text [5.519657218427976]
我々は、ドイツの臨床テキスト処理モデルのコレクションであるワークベンチを紹介する。
これらのモデルは、ドイツのネフローロジーレポートの未確認コーパスで訓練されている。
私たちのワークベンチは公開されており、すぐに、ベンチマークとして、あるいは関連する問題に移行できるようにしています。
論文 参考訳(メタデータ) (2022-07-08T13:19:19Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Learning to Detect Unacceptable Machine Translations for Downstream
Tasks [33.07594909221625]
機械翻訳を言語横断パイプラインに配置し、下流タスクを導入し、機械翻訳のタスク固有の受容性を定義する。
これにより、並列データを活用して、大規模なアクセプタビリティアノテーションを自動的に生成できます。
我々は、下流のタスクや翻訳モデルに対するフレームワークの有効性を示す実験を行う。
論文 参考訳(メタデータ) (2020-05-08T09:37:19Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - Data Mining in Clinical Trial Text: Transformers for Classification and
Question Answering Tasks [2.127049691404299]
本研究は,医学的テキストに基づくエビデンス合成に自然言語処理の進歩を適用した。
主な焦点は、Population、Intervention、Comparator、Outcome(PICO)フレームワークを通じて特徴づけられる情報である。
トランスフォーマーに基づく最近のニューラルネットワークアーキテクチャは、トランスファーラーニングの能力を示し、下流の自然言語処理タスクのパフォーマンスが向上している。
論文 参考訳(メタデータ) (2020-01-30T11:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。