論文の概要: Two Demonstrations of the Machine Translation Applications to Historical
Documents
- arxiv url: http://arxiv.org/abs/2102.01417v1
- Date: Tue, 2 Feb 2021 10:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 05:14:17.505712
- Title: Two Demonstrations of the Machine Translation Applications to Historical
Documents
- Title(参考訳): 歴史資料への機械翻訳応用の2つの実証
- Authors: Miguel Domingo and Francisco Casacuberta
- Abstract要約: 歴史的文書に2つの機械翻訳の応用例を示す。
最初の課題は、その原言語の現代版で書かれた、歴史文書の新バージョンを作成することである。
第2のアプリケーションは文書の正書法に限られる。
正書法の整合性を達成し、綴り規則の欠如を説明するために、文書の綴りを現代の標準に適合させる。
- 参考スコア(独自算出の注目度): 7.5765554531658665
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present our demonstration of two machine translation applications to
historical documents. The first task consists in generating a new version of a
historical document, written in the modern version of its original language.
The second application is limited to a document's orthography. It adapts the
document's spelling to modern standards in order to achieve an orthography
consistency and accounting for the lack of spelling conventions. We followed an
interactive, adaptive framework that allows the user to introduce corrections
to the system's hypothesis. The system reacts to these corrections by
generating a new hypothesis that takes them into account. Once the user is
satisfied with the system's hypothesis and validates it, the system adapts its
model following an online learning strategy. This system is implemented
following a client-server architecture. We developed a website which
communicates with the neural models. All code is open-source and publicly
available. The demonstration is hosted at http://demosmt.prhlt.upv.es/mthd/.
- Abstract(参考訳): 歴史的文書に2つの機械翻訳の応用例を示す。
最初のタスクは、その元の言語の現代バージョンで書かれた歴史的な文書の新バージョンを生成することです。
第2のアプリケーションは文書の正書法に限られる。
文章の綴りの一貫性と綴り規則の欠如を会計するために、文書の綴りを現代の標準に適応させます。
我々は、ユーザがシステムの仮説に修正を導入することができる、インタラクティブで適応的なフレームワークに従った。
システムはこれらの補正に反応し、それらを考慮した新しい仮説を生成する。
ユーザがシステムの仮説に満足して検証すると、システムはオンライン学習戦略に従ってそのモデルに適応する。
このシステムはクライアントサーバアーキテクチャに従って実装される。
ニューラルモデルと通信するWebサイトを開発した。
すべてのコードはオープンソースで公開されています。
デモはhttp://demosmt.prhlt.upv.es/mthd/にホストされている。
関連論文リスト
- DemoCraft: Using In-Context Learning to Improve Code Generation in Large Language Models [0.0]
テキスト内学習と実演選択を活用してコード生成を向上させるDemoCraftを提案する。
潜在概念学習は、タスク固有の知識をキャプチャするトレーニング可能な埋め込みである、追加の概念トークンを導入している。
実験の結果,提案方式はpass@kの2倍の精度向上を実現していることがわかった。
我々の実証研究は、我々のシステムがこれらの指標の約3倍の改善を達成したことを示唆している。
論文 参考訳(メタデータ) (2024-10-30T19:45:50Z) - SADAS: A Dialogue Assistant System Towards Remediating Norm Violations
in Bilingual Socio-Cultural Conversations [56.31816995795216]
SADAS(Socially-Aware Dialogue Assistant System)は、会話が敬意と理解で広がることを保証するためのシステムである。
本システムの新しいアーキテクチャは,(1)対話に存在する規範のカテゴリを特定すること,(2)潜在的な規範違反を検出すること,(3)違反の深刻さを評価すること,(4)違反の是正を目的とした対策を実施すること,を含む。
論文 参考訳(メタデータ) (2024-01-29T08:54:21Z) - Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。
既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。
資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:01:19Z) - A Question Answering Framework for Decontextualizing User-facing
Snippets from Scientific Documents [47.39561727838956]
言語モデルを使って、科学文書からスニペットを書き直して、自分で読むことができます。
本稿では,タスクを質問生成,質問応答,書き直しの3段階に分割するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-24T06:23:02Z) - CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script Handwritten Text Recognition [16.987008461171065]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods
in Natural Language Processing [78.8500633981247]
本稿では,自然言語処理における新たなパラダイムにおける研究成果の探索と整理を行う。
入力xを取り込んで出力yをP(y|x)として予測するようにモデルを訓練する従来の教師付き学習とは異なり、プロンプトベースの学習は直接テキストの確率をモデル化する言語モデルに基づいている。
論文 参考訳(メタデータ) (2021-07-28T18:09:46Z) - Are Neural Language Models Good Plagiarists? A Benchmark for Neural
Paraphrase Detection [5.847824494580938]
トランスフォーマーアーキテクチャに基づく最近の言語モデルを用いたパラフレーズ記事からなるベンチマークを提案する。
我々の貢献は、パラフレーズ検出システムに関する将来的な研究を後押しし、大量の原文およびパラフレーズ文書のコレクションを提供する。
論文 参考訳(メタデータ) (2021-03-23T11:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。