論文の概要: A New NMT Model for Translating Clinical Texts from English to Spanish
- arxiv url: http://arxiv.org/abs/2508.18607v1
- Date: Tue, 26 Aug 2025 02:24:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.640135
- Title: A New NMT Model for Translating Clinical Texts from English to Spanish
- Title(参考訳): 英語からスペイン語への翻訳のための新しいNMTモデル
- Authors: Rumeng Li, Xun Wang, Hong Yu,
- Abstract要約: 電子健康記録の物語を英語からスペイン語に翻訳することは臨床的に重要であるが、難しい課題である。
我々は、トレーニングにドメイン内並列コーパスをほとんど必要としない新しいニューラルマシン翻訳(NMT)システムである textbfNOOV (No OOV) を提案する。
NOOVは、並列整列コーパスから自動的に学習されるバイリンガル辞書と、大きな生物医学知識資源から抽出されたフレーズ検索テーブルとを統合する。
- 参考スコア(独自算出の注目度): 9.87164447021602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Translating electronic health record (EHR) narratives from English to Spanish is a clinically important yet challenging task due to the lack of a parallel-aligned corpus and the abundant unknown words contained. To address such challenges, we propose \textbf{NOOV} (for No OOV), a new neural machine translation (NMT) system that requires little in-domain parallel-aligned corpus for training. NOOV integrates a bilingual lexicon automatically learned from parallel-aligned corpora and a phrase look-up table extracted from a large biomedical knowledge resource, to alleviate both the unknown word problem and the word-repeat challenge in NMT, enhancing better phrase generation of NMT systems. Evaluation shows that NOOV is able to generate better translation of EHR with improvement in both accuracy and fluency.
- Abstract(参考訳): 電子健康記録(EHR)を英語からスペイン語に翻訳することは、平行したコーパスの欠如と、豊富な未知の単語を含むため、臨床的に重要であるが難しい課題である。
このような課題に対処するために、トレーニングにドメイン内並列コーパスをほとんど必要としない新しいニューラルマシン翻訳(NMT)システムである \textbf{NOOV} (No OOV) を提案する。
NOOVは、パラレルアライメントコーパスから自動的に学習されるバイリンガル辞書と、大きなバイオメディカル知識資源から抽出されたフレーズ検索テーブルを統合し、NMTにおける未知語問題と単語削除課題の両方を緩和し、NTTシステムのフレーズ生成を改善する。
評価の結果,NOOV は精度と流速の両面において,より優れた EHR 翻訳を実現できることが示された。
関連論文リスト
- Extending Multilingual Machine Translation through Imitation Learning [60.15671816513614]
Imit-MNMTは、タスクを専門家の行動を模倣する模倣学習プロセスとして扱う。
提案手法は,新言語と原言語の翻訳性能を大幅に向上させることを示す。
我々はまた、我々のアプローチがコピーとオフターゲットの問題を解決することができることを示した。
論文 参考訳(メタデータ) (2023-11-14T21:04:03Z) - Code-Switching with Word Senses for Pretraining in Neural Machine
Translation [107.23743153715799]
ニューラルネットワーク翻訳のための単語センス事前学習(WSP-NMT)について紹介する。
WSP-NMTは、知識ベースからの単語感覚情報を活用した多言語NMTモデルの事前学習のためのエンドツーエンドアプローチである。
実験の結果,全体の翻訳品質が大幅に向上した。
論文 参考訳(メタデータ) (2023-10-21T16:13:01Z) - Toward Improving Health Literacy in Patient Education Materials with
Neural Machine Translation Models [4.402142901902557]
健康リテラシーの低い人は、通常、診察後指示に従って処方薬を使用するなど、健康情報を理解するのに苦労する。
本稿では, 自然言語処理技術を活用して, 文中のイルミネーション言語を自動的に翻訳することで, 患者教育教材の健康リテラシーを向上させることを提案する。
私たちは、銀標準トレーニングデータセットと金標準テストデータセットを使用して、最先端のニューラルネットワーク翻訳(NMT)モデルをトレーニングし、テストしました。
論文 参考訳(メタデータ) (2022-09-14T15:30:54Z) - Learning Domain Specific Language Models for Automatic Speech
Recognition through Machine Translation [0.0]
我々は、タスク固有のテキストデータの翻訳を最初に取得するために、中間ステップとしてNeural Machine Translationを使用します。
我々はNMTビームサーチグラフから単語混乱ネットワークを導出する手法を開発した。
NMT混在ネットワークは、n-gramと繰り返しニューラルネットワークLMの両方の難易度を低減するのに有効であることを示す。
論文 参考訳(メタデータ) (2021-09-21T10:29:20Z) - Phrase-level Active Learning for Neural Machine Translation [107.28450614074002]
ドメイン内データの翻訳に所定の予算を費やすことのできる,アクティブな学習環境を提案する。
我々は、人間の翻訳者へのルーティングのために、新しいドメインの未ラベルデータから全文と個々の句を選択する。
ドイツ語と英語の翻訳タスクでは,不確実性に基づく文選択法に対して,能動的学習手法が一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-06-21T19:20:42Z) - Sentence Alignment with Parallel Documents Helps Biomedical Machine
Translation [0.5430741734728369]
本研究は、新しい教師なし文アライメント手法を示し、生体医学的ニューラルネットワーク翻訳(NMT)システムの訓練における特徴を探求する。
二言語間単語の類似性を評価するために,二言語間単語埋め込みの構築には単純かつ効果的な手法を用いる。
提案手法は1対1および多対多のケースで高い精度を達成した。
論文 参考訳(メタデータ) (2021-04-17T16:09:30Z) - Improving the Lexical Ability of Pretrained Language Models for
Unsupervised Neural Machine Translation [127.81351683335143]
クロスリンガルプリトレーニングは、2つの言語の語彙的表現と高レベル表現を整列させるモデルを必要とする。
これまでの研究では、これは表現が十分に整合していないためです。
本稿では,語彙レベルの情報で事前学習するバイリンガルマスク言語モデルを,型レベルのクロスリンガルサブワード埋め込みを用いて強化する。
論文 参考訳(メタデータ) (2021-03-18T21:17:58Z) - Assessing the Bilingual Knowledge Learned by Neural Machine Translation
Models [72.56058378313963]
NMTモデルで学習したバイリンガル知識をフレーズテーブルで評価することで,このギャップを埋める。
NMTモデルは、単純なものから複雑なものまでパターンを学習し、トレーニング例から本質的なバイリンガル知識を抽出する。
論文 参考訳(メタデータ) (2020-04-28T03:44:34Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。