論文の概要: A System for Automatic English Text Expansion
- arxiv url: http://arxiv.org/abs/2405.18350v1
- Date: Tue, 28 May 2024 16:48:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 17:40:27.901027
- Title: A System for Automatic English Text Expansion
- Title(参考訳): 英語テキスト自動拡張システム
- Authors: Silvia García Méndez, Milagros Fernández Gavilanes, Enrique Costa Montenegro, Jonathan Juncal Martínez, Francisco Javier González Castaño, Ehud Reiter,
- Abstract要約: 自動」とは、システムは最小限の単語集合から一貫性と正しい文を生成することができることを意味する。
英語では,高度に正確なaLexiE辞書を作成した。
システムは、レポートやニュース生成といった他のドメインにも適用できる。
- 参考スコア(独自算出の注目度): 10.475422682581115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an automatic text expansion system to generate English sentences, which performs automatic Natural Language Generation (NLG) by combining linguistic rules with statistical approaches. Here, "automatic" means that the system can generate coherent and correct sentences from a minimum set of words. From its inception, the design is modular and adaptable to other languages. This adaptability is one of its greatest advantages. For English, we have created the highly precise aLexiE lexicon with wide coverage, which represents a contribution on its own. We have evaluated the resulting NLG library in an Augmentative and Alternative Communication (AAC) proof of concept, both directly (by regenerating corpus sentences) and manually (from annotations) using a popular corpus in the NLG field. We performed a second analysis by comparing the quality of text expansion in English to Spanish, using an ad-hoc Spanish-English parallel corpus. The system might also be applied to other domains such as report and news generation.
- Abstract(参考訳): 本稿では,言語規則と統計的アプローチを組み合わせた自然言語生成(NLG)を行う,英語文を生成する自動テキスト拡張システムを提案する。
ここで「自動」とは、システムは最小限の単語集合から一貫性と正しい文を生成することができることを意味する。
当初から、この設計はモジュール化されており、他の言語にも適応できる。
この適応性はその最大の利点の1つだ。
英語では、高度に正確なaLexiEレキシコンを作成した。
我々は,NLG分野の一般的なコーパスを用いて,直接(コーパス文の再生)と手動(アノテーションによる)の両概念実証において,得られたNLGライブラリを評価した。
副次的なスペイン語-英語並列コーパスを用いて,英語とスペイン語のテキスト展開の質を比較して第2の分析を行った。
このシステムは、レポートやニュース生成といった他のドメインにも適用することができる。
関連論文リスト
- Predictability and Causality in Spanish and English Natural Language Generation [6.817247544942709]
本稿では,英語とスペイン語の因果関係と非因果関係を比較検討する。
この実験によると、スペイン語は非因果関係から英語よりも予測可能である。
これらの知見は、双方向トランスフォーマー言語モデルを用いたスペイン語におけるNLGのさらなる研究を支援する。
論文 参考訳(メタデータ) (2024-08-26T14:09:28Z) - A Library for Automatic Natural Language Generation of Spanish Texts [6.102700502396687]
本稿では,スペイン語文の自然言語生成システム(NLG)について,意味のある単語の最小セットから提案する。
システムは、ユーザが提示した主語セットから完全で一貫性があり、正しく綴られた文を生成することができる。
設計によって他の言語に容易に適応でき、広範囲のデジタルデバイスに統合することができる。
論文 参考訳(メタデータ) (2024-05-27T15:44:06Z) - TIPAA-SSL: Text Independent Phone-to-Audio Alignment based on Self-Supervised Learning and Knowledge Transfer [3.9981390090442694]
本稿では,音素認識,表現学習,知識伝達に基づくテキスト独立型音声アライメントのための新しいアプローチを提案する。
我々は、TIMITデータセットとSCRIBEデータセットの合成ネイティブデータを用いて、アメリカ英語とイギリス英語のモデルを評価する。
提案手法は,統計的指標における最先端(シャルシウ)よりも優れ,言語学習や音声処理システムに応用されている。
論文 参考訳(メタデータ) (2024-05-03T14:25:21Z) - Spanish Resource Grammar version 2023 [12.009437358109407]
スペイン資源文法(SRG)の最新バージョンについて紹介する。
このような文法は、文法に関する複雑な仮説の集合を符号化し、言語理論の実証的なテストのリソースとなる。
SRGのこのバージョンは、最新のFreeling形態を使っており、自動生成され、手動で検証された2,291文のツリーバンクと共にリリースされている。
論文 参考訳(メタデータ) (2023-09-23T09:24:05Z) - BiSync: A Bilingual Editor for Synchronized Monolingual Texts [2.0411082897313984]
BiSyncはバイリンガル・ライティング・アシスタントで、ユーザーは自由に2つの言語でテキストを作成できる。
本稿では,同期に使用するモデルアーキテクチャについて詳述し,計算資源が限られている場合に高い精度が得られることを示す。
論文 参考訳(メタデータ) (2023-06-01T07:03:47Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Linking Emergent and Natural Languages via Corpus Transfer [98.98724497178247]
創発言語と自然言語のコーパス転送によるリンクを確立する新しい方法を提案する。
このアプローチでは,言語モデリングとイメージキャプションという,2つの異なるタスクに対して,非自明な転送メリットを示す。
また,同一画像に基づく自然言語キャプションに創発的メッセージを翻訳することで,創発的言語の伝達可能性を予測する新しい指標を提案する。
論文 参考訳(メタデータ) (2022-03-24T21:24:54Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - "Listen, Understand and Translate": Triple Supervision Decouples
End-to-end Speech-to-text Translation [49.610188741500274]
エンドツーエンドの音声テキスト翻訳(ST)は、ソース言語で音声を取り、ターゲット言語でテキストを出力する。
既存の方法は並列コーパスの量によって制限される。
並列STコーパスで信号を完全に活用するシステムを構築した。
論文 参考訳(メタデータ) (2020-09-21T09:19:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。