論文の概要: Zur Darstellung eines mehrstufigen Prototypbegriffs in der
multilingualen automatischen Sprachgenerierung: vom Korpus \"uber word
embeddings bis hin zum automatischen W\"orterbuch
- arxiv url: http://arxiv.org/abs/2312.16311v1
- Date: Tue, 26 Dec 2023 19:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 20:02:45.697399
- Title: Zur Darstellung eines mehrstufigen Prototypbegriffs in der
multilingualen automatischen Sprachgenerierung: vom Korpus \"uber word
embeddings bis hin zum automatischen W\"orterbuch
- Title(参考訳): 多言語オートマトン・スプラヒゲネリェール語に就て : Vom Korpus \"uber word embeddeds bis hin zum Automaticischen W\"orterbuch
- Authors: Mar\'ia Jos\'e Dom\'inguez V\'azquez
- Abstract要約: 名詞 valency Portlex の多言語辞書は、Xera と Combinatoria を自動生成するきっかけとなったと考えられている。
両方のプロトタイプは、名詞句の自動生成に使用されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The multilingual dictionary of noun valency Portlex is considered to be the
trigger for the creation of the automatic language generators Xera and
Combinatoria, whose development and use is presented in this paper. Both
prototypes are used for the automatic generation of nominal phrases with their
mono- and bi-argumental valence slots, which could be used, among others, as
dictionary examples or as integrated components of future autonomous
E-Learning-Tools. As samples for new types of automatic valency dictionaries
including user interaction, we consider the language generators as we know them
today. In the specific methodological procedure for the development of the
language generators, the syntactic-semantic description of the noun slots turns
out to be the main focus from a syntagmatic and paradigmatic point of view.
Along with factors such as representativeness, grammatical correctness,
semantic coherence, frequency and the variety of lexical candidates, as well as
semantic classes and argument structures, which are fixed components of both
resources, a concept of a multi-sided prototype stands out. The combined
application of this prototype concept as well as of word embeddings together
with techniques from the field of automatic natural language processing and
generation (NLP and NLG) opens up a new way for the future development of
automatically generated plurilingual valency dictionaries. All things
considered, the paper depicts the language generators both from the point of
view of their development as well as from that of the users. The focus lies on
the role of the prototype concept within the development of the resources.
- Abstract(参考訳): 名詞のヴァレンシー・ポートレックスの多言語辞書は、自動言語生成器xeraとコンビネータの作成のきっかけであると考えられており、その開発と使用は本論文で提示されている。
両プロトタイプは、辞書の例や将来の自律型E-Learning-Toolsの統合コンポーネントとして使用可能な、単項と二項の価数スロットを持つ名詞句の自動生成に使用されている。
ユーザインタラクションを含む新しい種類の自動価辞書のサンプルとして、現在知られている言語生成器について考察する。
言語生成器の開発のための特定の方法論的手順において、名詞スロットの構文論的記述は、シンタガマ的およびパラダイム的観点からの主要な焦点であることが判明した。
表現性、文法的正しさ、意味的コヒーレンス、頻度、語彙的候補の多様性などの要因に加えて、両方のリソースの固定されたコンポーネントであるセマンティッククラスや引数構造とともに、多面的プロトタイプの概念が際立っている。
このプロトタイプの概念と単語埋め込みの併用により、自動自然言語処理と生成(NLPとNLG)の分野からの技法が組み合わさって、自動生成された多言語価辞書の新たな開発方法が開かれる。
あらゆることを考えると、この論文は、開発の観点から、またユーザの視点から、言語ジェネレータを描写している。
リソース開発におけるプロトタイプの概念の役割に焦点が当てられている。
関連論文リスト
- Contribuci\'on de la sem\'antica combinatoria al desarrollo de
herramientas digitales multiling\"ues [0.0]
本稿では、スペイン語、フランス語、ドイツ語の名詞句における引数パターンの自動生成のための3つのプロトタイプの設計に、コンビニアル・セマンティックスの分野がどのように貢献したかを述べる。
また、外国語の文脈における生産状況において、議論の構文・意味的インターフェースについて知ることが重要であることも示している。
論文 参考訳(メタデータ) (2023-12-26T19:32:05Z) - Generative Spoken Language Model based on continuous word-sized audio
tokens [52.081868603603844]
本稿では,単語サイズ連続評価音声埋め込みに基づく生成音声言語モデルを提案する。
結果として得られるモデルは、単語サイズの連続埋め込みに基づく最初の生成言語モデルである。
論文 参考訳(メタデータ) (2023-10-08T16:46:14Z) - Assisting Language Learners: Automated Trans-Lingual Definition
Generation via Contrastive Prompt Learning [25.851611353632926]
標準定義生成タスクは、モノリンガル定義を自動的に生成する必要がある。
本稿では,他言語で定義を生成することを目的としたTLDG(Trans-Lingual Definition Generation)を提案する。
論文 参考訳(メタデータ) (2023-06-09T17:32:45Z) - Multilingual Conceptual Coverage in Text-to-Image Models [98.80343331645626]
コンセプチュアル・カバー・アクロス言語(Conceptual Coverage Across Languages, CoCo-CroLa)とは、任意の生成的テキスト・画像システムにおいて、有形名詞の観点から学習言語に多言語対応を提供する程度をベンチマークする手法である。
各モデルについて、ソースコード中の一連の有形名詞に生成される画像の集団と、対象言語に翻訳された各名詞に生成された画像の集団とを比較することにより、ソース言語に対して与えられた対象言語の「概念的カバレッジ」を評価することができる。
論文 参考訳(メタデータ) (2023-06-02T17:59:09Z) - Tokenization Impacts Multilingual Language Modeling: Assessing
Vocabulary Allocation and Overlap Across Languages [3.716965622352967]
サブワードトークン化器で観測される語彙表現と語彙重複の質を評価するための新しい基準を提案する。
以上の結果から,言語間の語彙の重複は,特定の下流課題に支障を来す可能性があることが示唆された。
論文 参考訳(メタデータ) (2023-05-26T18:06:49Z) - Multilingual Generative Language Models for Zero-Shot Cross-Lingual
Event Argument Extraction [80.61458287741131]
ゼロショット言語間イベント引数抽出(EAE)における多言語事前学習型生成言語モデルの活用について検討する。
EAEを言語生成タスクとして定式化することにより、イベント構造を効果的にエンコードし、引数間の依存関係をキャプチャする。
提案するモデルでは,多言語事前学習型生成言語モデルを用いて,入力文から抽出した引数で言語に依存しないテンプレートを補う文を生成する。
論文 参考訳(メタデータ) (2022-03-15T23:00:32Z) - Generalising Multilingual Concept-to-Text NLG with Language Agnostic
Delexicalisation [0.40611352512781856]
概念からテキストへの自然言語生成は、自然言語で入力の意味を表現するタスクである。
多言語事前学習型埋め込みを用いた新しいデレクサライズ手法であるLanguage Agnostic Delexicalizationを提案する。
5つのデータセットと5つの言語で実験した結果、多言語モデルは概念対テキストで単言語モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-05-07T17:48:53Z) - Constrained Language Models Yield Few-Shot Semantic Parsers [73.50960967598654]
我々は,事前学習された大規模言語モデルの利用を,少ない意味論として検討する。
意味構文解析の目標は、自然言語入力によって構造化された意味表現を生成することである。
言語モデルを用いて、入力を英語に似た制御されたサブ言語にパラフレーズし、対象の意味表現に自動的にマッピングする。
論文 参考訳(メタデータ) (2021-04-18T08:13:06Z) - Revisiting Language Encoding in Learning Multilingual Representations [70.01772581545103]
言語埋め込みを置き換えるクロスリンガル言語投影(Cross-lingual Language Projection, XLP)と呼ばれる新しいアプローチを提案する。
XLPは単語埋め込みを言語固有の意味空間に投影し、投影された埋め込みはTransformerモデルに供給される。
実験により、xlpは広範囲の多言語ベンチマークデータセットのモデル性能を自由かつ著しく向上できることが示された。
論文 参考訳(メタデータ) (2021-02-16T18:47:10Z) - Generative latent neural models for automatic word alignment [0.0]
変分オートエンコーダは、最近、自然言語処理において、言語生成タスクに有用な教師なしの潜在表現を学習するために、様々な自然言語処理で使用されている。
本稿では,単語アライメント作業のためのこれらのモデルについて検討し,バニラ変分オートエンコーダのいくつかの進化について提案・評価する。
これらの手法は、Giza++と2つの言語ペアに対して強力なニューラルネットワークアライメントシステムに比較して、競争力のある結果が得られることを実証する。
論文 参考訳(メタデータ) (2020-09-28T07:54:09Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。