論文の概要: Spanish Abstract Meaning Representation: Annotation of a General Corpus
- arxiv url: http://arxiv.org/abs/2204.07663v1
- Date: Fri, 15 Apr 2022 22:26:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 14:32:20.100650
- Title: Spanish Abstract Meaning Representation: Annotation of a General Corpus
- Title(参考訳): スペイン語 Abstract Meaning Representation: Annotation of a General Corpus (英語)
- Authors: Shira Wein, Lucia Donatelli, Ethan Ricker, Calvin Engstrom, Alex
Nelson, Nathan Schneider
- Abstract要約: 我々は、スペイン語でAMRのアノテーションを提案した結果、架空のテキスト"The Little Prince"のために50のスペイン語のAMRアノテーションがリリースされた。
アノテーションへのアプローチは、AnCora-Net lexiconからのスペイン語のロールセットを利用し、スペイン語固有の意味的特徴を持つ英語のAMRを拡張します。
- 参考スコア(独自算出の注目度): 7.837003011850223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Abstract Meaning Representation (AMR) formalism, designed originally for
English, has been adapted to a number of languages. We build on previous work
proposing the annotation of AMR in Spanish, which resulted in the release of 50
Spanish AMR annotations for the fictional text "The Little Prince." In this
work, we present the first sizable, general annotation project for Spanish
Abstract Meaning Representation. Our approach to annotation makes use of
Spanish rolesets from the AnCora-Net lexicon and extends English AMR with
semantic features specific to Spanish. In addition to our guidelines, we
release an annotated corpus (586 annotations total, for 486 unique sentences)
of multiple genres of documents from the "Abstract Meaning Representation 2.0 -
Four Translations" sembank. This corpus is commonly used for evaluation of AMR
parsing and generation, but does not include gold AMRs; we hope that providing
gold annotations for this dataset can result in a more complete approach to
cross-lingual AMR parsing. Finally, we perform a disagreement analysis and
discuss the implications of our work on the adaptability of AMR to languages
other than English.
- Abstract(参考訳): AMR(Abstract Meaning Representation)形式は、もともと英語用に設計されたもので、多くの言語に適応している。
我々は、スペイン語でAMRのアノテーションを提案した結果、架空のテキスト"The Little Prince"のための50のスペイン語AMRアノテーションがリリースされた。
本稿では,スペイン語の抽象的意味表現のための,最初の拡張的な一般アノテーションプロジェクトを提案する。
アノテーションに対する我々のアプローチは、ancora-net lexiconのスペイン語ロールセットを使用し、英語のamrをスペイン語特有の意味的特徴で拡張する。
本ガイドラインに加えて,「抽象的意味表現2.04our Translations」セムバンクから,複数の文書ジャンルの注釈付きコーパス(全586注486注486節)を公表した。
このコーパスは、AMR解析と生成の評価に一般的に使用されるが、金のAMRは含まない。
最後に、不一致分析を行い、AMRの英語以外の言語への適応性に関する研究の意義について議論する。
関連論文リスト
- MASSIVE Multilingual Abstract Meaning Representation: A Dataset and Baselines for Hallucination Detection [3.6811136816751513]
84,000以上のテキスト・ツー・グラフアノテーションを持つデータセットであるMASSIVE-AMRを紹介する。
AMRグラフは、50以上の言語にマッピングされた1,685の情報検索発話を示す。
その結果、構造化解析のためのLLMを用いた永続的な問題に光を当てた。
論文 参考訳(メタデータ) (2024-05-29T17:17:22Z) - Analyzing the Role of Semantic Representations in the Era of Large Language Models [104.18157036880287]
大規模言語モデル(LLM)の時代における意味表現の役割について検討する。
本稿では, AMRCoT と呼ばれる AMR-driven chain-of- Thought prompting 法を提案する。
AMRのどの入力例が役に立つかは予測できないが,複数単語の表現でエラーが発生する傾向にある。
論文 参考訳(メタデータ) (2024-05-02T17:32:59Z) - "You Are An Expert Linguistic Annotator": Limits of LLMs as Analyzers of
Abstract Meaning Representation [60.863629647985526]
文意味構造の解析において, GPT-3, ChatGPT, および GPT-4 モデルの成功と限界について検討した。
モデルはAMRの基本形式を確実に再現でき、しばしばコアイベント、引数、修飾子構造をキャプチャできる。
全体としては,これらのモデルではセマンティック構造の側面を捉えることができるが,完全に正確なセマンティック解析や解析をサポートする能力には重要な制限が残されている。
論文 参考訳(メタデータ) (2023-10-26T21:47:59Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z) - Persian Abstract Meaning Representation [3.2689702143620147]
我々は,ペルシャの抽象的意味表現(PAMR)アノテーションの仕様について詳述し,ペルシャの「小プリンス」のペルシア語翻訳をペルシャのAMRの最初のゴールドスタンダードとして注釈づけした。
ペルシャ語固有の構文構造がAMRアノテーションにどのように影響するかを説明する。
論文 参考訳(メタデータ) (2022-05-16T14:25:43Z) - Smelting Gold and Silver for Improved Multilingual AMR-to-Text
Generation [55.117031558677674]
AMRアノテーションの自動生成技術について検討する。
我々のモデルは、生成した銀AMRを利用する銀(機械翻訳)文で金AMRを訓練した。
我々のモデルは、ドイツ、イタリア、スペイン、中国の芸術のこれまでの状態を大きく上回っている。
論文 参考訳(メタデータ) (2021-09-08T17:55:46Z) - Making Better Use of Bilingual Information for Cross-Lingual AMR Parsing [88.08581016329398]
概念の誤認は、英語のトークンとAMRの概念の関連性が高いためである、と我々は主張する。
モデルがより正確な概念を予測できるように、バイリンガル入力、すなわち翻訳されたテキストと非英語のテキストを導入します。
論文 参考訳(メタデータ) (2021-06-09T05:14:54Z) - Translate, then Parse! A strong baseline for Cross-Lingual AMR Parsing [10.495114898741205]
我々は,各言語からの文をAMRに投影し,それらの意味的構造を捉えるモデルを開発した。
本稿では,単純な2ステップベースラインを再検討し,強力なNMTシステムと強力なAMRで拡張する。
実験の結果,T+Pはすべてのテスト言語で最新の最先端システムより優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-08T17:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。