論文の概要: Persian Abstract Meaning Representation: Annotation Guidelines and Gold Standard Dataset
- arxiv url: http://arxiv.org/abs/2205.07712v2
- Date: Sat, 19 Apr 2025 02:51:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-01 05:29:35.149349
- Title: Persian Abstract Meaning Representation: Annotation Guidelines and Gold Standard Dataset
- Title(参考訳): ペルシアの抽象的意味表現:注釈ガイドラインと金標準データセット
- Authors: Reza Takhshid, Tara Azin, Razieh Shojaei, Mohammad Bahrani,
- Abstract要約: 本稿では,ペルシャ語文をAMRで注釈付けするための詳細なガイドであるペルシャ語抽象的意味表現(AMR)ガイドラインを紹介する。
ガイドラインに従って作成した1,562文からなるペルシャのAMRゴールド標準データセットの開発プロセスについて論じる。
- 参考スコア(独自算出の注目度): 0.7874708385247353
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper introduces the Persian Abstract Meaning Representation (AMR) guidelines, a detailed guide for annotating Persian sentences with AMR, focusing on the necessary adaptations to fit Persian's unique syntactic structures. We discuss the development process of a Persian AMR gold standard dataset consisting of 1,562 sentences created following the guidelines. By examining the language specifications and nuances that distinguish AMR annotations of a low-resource language like Persian, we shed light on the challenges and limitations of developing a universal meaning representation framework. The guidelines and the dataset introduced in this study highlight such challenges, aiming to advance the field.
- Abstract(参考訳): 本稿では,ペルシャ語文をAMRで注釈づけするための詳細なガイドラインであるペルシャ語抽象的意味表現(AMR)ガイドラインを紹介する。
ガイドラインに従って作成した1,562文からなるペルシャのAMRゴールド標準データセットの開発プロセスについて論じる。
ペルシャ語のような低リソース言語のAMRアノテーションを区別する言語仕様とニュアンスを調べることで、普遍的な意味表現フレームワークを開発する上での課題と限界に光を当てました。
本研究で導入されたガイドラインとデータセットは,この分野の進展を目指して,これらの課題を浮き彫りにしている。
関連論文リスト
- Refining Sentence Embedding Model through Ranking Sentences Generation with Large Language Models [60.00178316095646]
多くのNLPタスクには文の埋め込みが不可欠であり、NLIのようなデータセットを使用して強いパフォーマンスを達成する対照的な学習方法がある。
近年の研究では、大きな言語モデル(LLM)を利用して文ペアを生成し、アノテーション依存を減らしている。
本稿では,潜在空間におけるLLMの生成方向を制御する手法を提案する。
複数のベンチマークによる実験により,本手法は文合成に要するコストを最小限に抑えつつ,新たなSOTA性能を実現することを示した。
論文 参考訳(メタデータ) (2025-02-19T12:07:53Z) - Detecting Document-level Paraphrased Machine Generated Content: Mimicking Human Writing Style and Involving Discourse Features [57.34477506004105]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
人間の筆記スタイルをエミュレートするエンコーダデコーダモデルであるMhBARTを提案する。
また,PDTB前処理による談話解析を統合し,構造的特徴を符号化するモデルであるDTransformerを提案する。
論文 参考訳(メタデータ) (2024-12-17T08:47:41Z) - Guidelines for Fine-grained Sentence-level Arabic Readability Annotation [9.261022921574318]
Balanced Arabic Readability Evaluation Corpus (BAREC) プロジェクトは、さまざまな可読性レベルに対応する包括的なアラビア語リソースの必要性に対処するために設計されている。
Taha/Arabi21の可読性参照にインスパイアされたBARECは、19の異なるレベルにわたる文レベルのアラビア文字の可読性を評価するための標準化された参照を提供することを目指している。
本稿は,10,631文・フレーズ(113,651語)の分析を通じて,本ガイドラインに焦点をあてたものである。
論文 参考訳(メタデータ) (2024-10-11T09:59:46Z) - Empowering Persian LLMs for Instruction Following: A Novel Dataset and Training Approach [0.0]
FarsInstructは,大規模言語モデルの命令追従能力を高めるために設計されたデータセットである。
FarsInstructは21の異なるデータセットにわたる197のテンプレートで構成されています。
論文 参考訳(メタデータ) (2024-07-15T19:17:31Z) - "You Are An Expert Linguistic Annotator": Limits of LLMs as Analyzers of
Abstract Meaning Representation [60.863629647985526]
文意味構造の解析において, GPT-3, ChatGPT, および GPT-4 モデルの成功と限界について検討した。
モデルはAMRの基本形式を確実に再現でき、しばしばコアイベント、引数、修飾子構造をキャプチャできる。
全体としては,これらのモデルではセマンティック構造の側面を捉えることができるが,完全に正確なセマンティック解析や解析をサポートする能力には重要な制限が残されている。
論文 参考訳(メタデータ) (2023-10-26T21:47:59Z) - Widely Interpretable Semantic Representation: Frameless Meaning
Representation for Broader Applicability [10.710058244695128]
本稿では,抽象的意味表現 (AMR) の課題を克服する新しい意味表現 WISeR を提案する。
その強みにもかかわらず、AMRは事前に定義されたセマンティックフレームなしでは言語やドメインに簡単に適用できない。
WISeRとAMR WISeRの両方で1Kの英会話文の新たなコーパスを作成する。
論文 参考訳(メタデータ) (2023-09-12T17:44:40Z) - Natural Language Decompositions of Implicit Content Enable Better Text Representations [52.992875653864076]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z) - Chinese Discourse Annotation Reference Manual [9.367612782346207]
この文書は、中国語における修辞構造論(RST)の注釈に関する広範なガイドラインと例を提供している。
まず、RSTアノテーションのためのデータ準備のための前処理手順を紹介する。
第二に、テキストを初等談話単位(EDU)に分割するための統語的基準について議論する。
最後に、異なるジャンルにおける談話関係を定義し、区別する例を示す。
論文 参考訳(メタデータ) (2022-10-11T11:02:42Z) - How much of UCCA can be predicted from AMR? [0.0]
コーパスベースのアプローチを用いて、2つのグラフ書き換えシステム、決定論的および非決定論的システムを構築する。
ルール構築中に発見した評価とあいまいさについて紹介する。
論文 参考訳(メタデータ) (2022-07-25T13:13:34Z) - Spanish Abstract Meaning Representation: Annotation of a General Corpus [7.837003011850223]
我々は、スペイン語でAMRのアノテーションを提案した結果、架空のテキスト"The Little Prince"のために50のスペイン語のAMRアノテーションがリリースされた。
アノテーションへのアプローチは、AnCora-Net lexiconからのスペイン語のロールセットを利用し、スペイン語固有の意味的特徴を持つ英語のAMRを拡張します。
論文 参考訳(メタデータ) (2022-04-15T22:26:04Z) - ViraPart: A Text Refinement Framework for ASR and NLP Tasks in Persian [0.0]
テキストの明確化にParsBERTを組み込んだViraPartフレームワークを提案する。
最終的に、提案されたZWNJ認識モデル、句読点復元モデル、ペルシャ・エザフ構成モデルは、それぞれ96.90%、92.13%、98.50%の平均的なF1マクロスコアを実行する。
論文 参考訳(メタデータ) (2021-10-18T08:20:40Z) - Making Better Use of Bilingual Information for Cross-Lingual AMR Parsing [88.08581016329398]
概念の誤認は、英語のトークンとAMRの概念の関連性が高いためである、と我々は主張する。
モデルがより正確な概念を予測できるように、バイリンガル入力、すなわち翻訳されたテキストと非英語のテキストを導入します。
論文 参考訳(メタデータ) (2021-06-09T05:14:54Z) - A Differentiable Relaxation of Graph Segmentation and Alignment for AMR
Parsing [75.36126971685034]
我々は、アライメントとセグメンテーションをモデルの潜在変数として扱い、エンドツーエンドのトレーニングの一部としてそれらを誘導する。
また,AMRの個々の構造を扱うために手作りされたLyu2018AMRPAのセグメンテーションルールに依存するモデルにもアプローチした。
論文 参考訳(メタデータ) (2020-10-23T21:22:50Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Normalizing Compositional Structures Across Graphbanks [67.7047900945161]
本稿では,MR間の相違を組成レベルで正規化する手法を提案する。
我々の研究はMRの合成構造におけるマッチングを著しく向上させ、マルチタスク学習を改善する。
論文 参考訳(メタデータ) (2020-04-29T14:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。