論文の概要: Two Demonstrations of the Machine Translation Applications to Historical
Documents
- arxiv url: http://arxiv.org/abs/2102.01417v1
- Date: Tue, 2 Feb 2021 10:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 05:14:17.505712
- Title: Two Demonstrations of the Machine Translation Applications to Historical
Documents
- Title(参考訳): 歴史資料への機械翻訳応用の2つの実証
- Authors: Miguel Domingo and Francisco Casacuberta
- Abstract要約: 歴史的文書に2つの機械翻訳の応用例を示す。
最初の課題は、その原言語の現代版で書かれた、歴史文書の新バージョンを作成することである。
第2のアプリケーションは文書の正書法に限られる。
正書法の整合性を達成し、綴り規則の欠如を説明するために、文書の綴りを現代の標準に適合させる。
- 参考スコア(独自算出の注目度): 7.5765554531658665
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present our demonstration of two machine translation applications to
historical documents. The first task consists in generating a new version of a
historical document, written in the modern version of its original language.
The second application is limited to a document's orthography. It adapts the
document's spelling to modern standards in order to achieve an orthography
consistency and accounting for the lack of spelling conventions. We followed an
interactive, adaptive framework that allows the user to introduce corrections
to the system's hypothesis. The system reacts to these corrections by
generating a new hypothesis that takes them into account. Once the user is
satisfied with the system's hypothesis and validates it, the system adapts its
model following an online learning strategy. This system is implemented
following a client-server architecture. We developed a website which
communicates with the neural models. All code is open-source and publicly
available. The demonstration is hosted at http://demosmt.prhlt.upv.es/mthd/.
- Abstract(参考訳): 歴史的文書に2つの機械翻訳の応用例を示す。
最初のタスクは、その元の言語の現代バージョンで書かれた歴史的な文書の新バージョンを生成することです。
第2のアプリケーションは文書の正書法に限られる。
文章の綴りの一貫性と綴り規則の欠如を会計するために、文書の綴りを現代の標準に適応させます。
我々は、ユーザがシステムの仮説に修正を導入することができる、インタラクティブで適応的なフレームワークに従った。
システムはこれらの補正に反応し、それらを考慮した新しい仮説を生成する。
ユーザがシステムの仮説に満足して検証すると、システムはオンライン学習戦略に従ってそのモデルに適応する。
このシステムはクライアントサーバアーキテクチャに従って実装される。
ニューラルモデルと通信するWebサイトを開発した。
すべてのコードはオープンソースで公開されています。
デモはhttp://demosmt.prhlt.upv.es/mthd/にホストされている。
関連論文リスト
- CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script
Handwritten Text Recognition [7.39273105421963]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - Pix2Struct: Screenshot Parsing as Pretraining for Visual Language
Understanding [58.70423899829642]
Pix2Structは、純粋に視覚的な言語理解のための事前訓練された画像-テキストモデルである。
4つの領域にまたがる9つのタスクのうち6つのタスクにおいて、1つの事前訓練されたモデルが最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-10-07T06:42:06Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
現実世界の対話システムでは、生成された応答はいくつかのインターロック制約を満たす必要がある。
言語生成における2つの主要なパラダイム – ニューラル言語モデリングとルールベースの生成 – はいずれも,これらの制約を満たすのに苦労している。
両手法の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - Detecting Text Formality: A Study of Text Classification Approaches [71.51905606492376]
本研究は,現在の(そしてより古典的な)機械学習手法に基づく形式性検出手法に関する最初の体系的研究を提案する。
モノリンガル,マルチリンガル,クロスリンガルの3種類の実験を行った。
我々は,複数の言語に対する形式性検出モデルをリリースし,その結果を出力し,テストされた言語間機能を保有する。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - CsFEVER and CTKFacts: Czech Datasets for Fact Verification [0.0]
自動ファクトチェック機械学習モデルのトレーニングを目的としたチェコのデータセットを2つ提示する。
最初のデータセットは、約112kのクレームを持つCsFEVERで、有名なウィキペディアベースのFEVERデータセットのチェコ語バージョンを自動生成する。
3,097件からなる2番目のデータセットCTKFactsは、約200万件のチェコのニュースエージェンシーの報道のコーパス上に構築されている。
論文 参考訳(メタデータ) (2022-01-26T18:48:42Z) - Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods
in Natural Language Processing [78.8500633981247]
本稿では,自然言語処理における新たなパラダイムにおける研究成果の探索と整理を行う。
入力xを取り込んで出力yをP(y|x)として予測するようにモデルを訓練する従来の教師付き学習とは異なり、プロンプトベースの学習は直接テキストの確率をモデル化する言語モデルに基づいている。
論文 参考訳(メタデータ) (2021-07-28T18:09:46Z) - Hierarchical Transformer Encoders for Vietnamese Spelling Correction [1.0779600811805266]
ベトナム語スペル訂正問題に対する階層変換器モデルを提案する。
このモデルは、複数のトランスフォーマーエンコーダで構成され、文字レベルと単語レベルの両方を使用してエラーを検出し、修正する。
論文 参考訳(メタデータ) (2021-05-28T04:09:15Z) - Methods for Detoxification of Texts for the Russian Language [55.337471467610094]
我々は、攻撃的言語と戦うために、ロシア語のテキストを自動で解毒する研究を初めて紹介する。
我々は、局所的な修正を行う教師なしアプローチと、事前訓練された言語GPT-2モデルに基づく教師なしアプローチの2種類のモデルをテストする。
以上の結果から, 改良の余地はあるものの, 脱毒に有効であることが明らかとなった。
論文 参考訳(メタデータ) (2021-05-19T10:37:44Z) - Are Neural Language Models Good Plagiarists? A Benchmark for Neural
Paraphrase Detection [5.847824494580938]
トランスフォーマーアーキテクチャに基づく最近の言語モデルを用いたパラフレーズ記事からなるベンチマークを提案する。
我々の貢献は、パラフレーズ検出システムに関する将来的な研究を後押しし、大量の原文およびパラフレーズ文書のコレクションを提供する。
論文 参考訳(メタデータ) (2021-03-23T11:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。