論文の概要: Persian Rhetorical Structure Theory
- arxiv url: http://arxiv.org/abs/2106.13833v1
- Date: Fri, 25 Jun 2021 18:15:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 11:45:58.019104
- Title: Persian Rhetorical Structure Theory
- Title(参考訳): ペルシャの修辞構造理論
- Authors: Sara Shahmohammadi, Hadi Veisi, Ali Darzi
- Abstract要約: 我々は、修辞論の枠組みで構築されたペルシア語のための談話注釈コーパスを提示する。
私たちのコーパスは150のジャーナリストのテキストで構成されており、各テキストは平均約400語である。
テキストレベルの談話はゴールドセグメンテーションを用いて訓練されており,DPLP談話バンク上に構築されている。
- 参考スコア(独自算出の注目度): 2.610470075814367
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the past years, interest in discourse analysis and discourse parsing has
steadily grown, and many discourse-annotated corpora and, as a result,
discourse parsers have been built. In this paper, we present a
discourse-annotated corpus for the Persian language built in the framework of
Rhetorical Structure Theory as well as a discourse parser built upon the DPLP
parser, an open-source discourse parser. Our corpus consists of 150
journalistic texts, each text having an average of around 400 words. Corpus
texts were annotated using 18 discourse relations and based on the annotation
guideline of the English RST Discourse Treebank corpus. Our text-level
discourse parser is trained using gold segmentation and is built upon the DPLP
discourse parser, which uses a large-margin transition-based approach to solve
the problem of discourse parsing. The performance of our discourse parser in
span (S), nuclearity (N) and relation (R) detection is around 78%, 64%, 44%
respectively, in terms of F1 measure.
- Abstract(参考訳): 過去数年間、談話分析や談話解析への関心は着実に高まり、多くの談話注釈コーパスが作られ、結果として談話パーサーが作られた。
本稿では、レトリック構造理論の枠組みで構築されたペルシア語の言論注釈コーパスと、オープンソースの言論パーサであるDPLPパーサ上に構築された言論パーサについて述べる。
私たちのコーパスは150のジャーナリストのテキストで構成され、各テキストは平均約400語である。
コーパステキストは18の談話関係を用いて注釈付けされ、英語のrst談話ツリーバンクコーパスの注釈ガイドラインに基づいている。
テキストレベルの談話パーサは金セグメンテーションを用いて訓練され,DPLP談話パーサ上に構築されている。
スパン (s), 核性 (n), 関係性 (r) における我々の談話解析器の性能は, それぞれ78%, 64%, 44%であった。
関連論文リスト
- Llamipa: An Incremental Discourse Parser [6.9534924995446055]
本稿では,SDRT方式でコーパスを微調整した大規模言語モデルを用いた最初の談話解析実験について述べる。
ダウンストリームタスクにおける言論情報の最終的な使用に不可欠な言論データを処理することができる。
論文 参考訳(メタデータ) (2024-06-26T11:08:17Z) - Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech [8.550564152063522]
音声解析における2つの解析パラダイムの性能評価を目的とした一連の実験について報告する。
我々はこの評価をフランス語の大きな木バンクで行い、現実的な自発的な会話を特徴とする。
その結果, (i) グラフに基づく手法は, (ii) パラメータが30%少ないにもかかわらず, (ii) 音声から直接解析することで, パイプライン手法よりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-18T13:46:10Z) - SpeechAlign: a Framework for Speech Translation Alignment Evaluation [15.069228503777124]
SpeechAlignは、音声モデルにおけるソース・ターゲットアライメントの未探索領域を評価するために設計されたフレームワークである。
適切な評価データセットの欠如に対処するために,音声ゴールドアライメントデータセットを提案する。
また、音声アライメント誤り率(SAER)と時間重み付き音声アライメント誤り率(TW-SAER)の2つの新しい指標も導入する。
論文 参考訳(メタデータ) (2023-09-20T18:46:37Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - Cascading and Direct Approaches to Unsupervised Constituency Parsing on
Spoken Sentences [67.37544997614646]
本研究は,教師なし音声補聴における最初の研究である。
目的は, 音声文の階層的構文構造を, 選挙区解析木の形で決定することである。
正確なセグメンテーションだけでは、音声文を正確に解析するのに十分であることを示す。
論文 参考訳(メタデータ) (2023-03-15T17:57:22Z) - BLASER: A Text-Free Speech-to-Speech Translation Evaluation Metric [66.73705349465207]
エンドツーエンドの音声音声翻訳(S2ST)は、一般的にテキストベースのメトリクスで評価される。
本稿では,ASRシステムへの依存を回避するために,BLASERと呼ばれるエンドツーエンドS2STのテキストフリー評価指標を提案する。
論文 参考訳(メタデータ) (2022-12-16T14:00:26Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Discourse Analysis for Evaluating Coherence in Video Paragraph Captions [99.37090317971312]
ビデオ段落のコヒーレンスを評価するための,新しい談話に基づく枠組みを検討中である。
ビデオのコヒーレンスに条件付き段落のコヒーレンスをモデル化する上で,ビデオの談話表現が中心となる。
実験の結果,提案手法は,ビデオ段落のコヒーレンスをベースライン法よりも有意に向上させることがわかった。
論文 参考訳(メタデータ) (2022-01-17T04:23:08Z) - Penn-Helsinki Parsed Corpus of Early Modern English: First Parsing
Results and Analysis [2.8749014299466444]
本研究は,Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME) の最初の解析結果である。
PPCEMEの重要な特徴として,Penn Treebankよりも大きく,より多様な関数タグを含む,解析の難しさを挙げる。
論文 参考訳(メタデータ) (2021-12-15T23:56:21Z) - A Novel Corpus of Discourse Structure in Humans and Computers [55.74664144248097]
約27,000節からなる445の人文・コンピュータ生成文書からなる新しいコーパスを提示する。
コーパスは、フォーマルな言論と非公式な言論の両方をカバーし、微調整のGPT-2を用いて生成された文書を含んでいる。
論文 参考訳(メタデータ) (2021-11-10T20:56:08Z) - FT Speech: Danish Parliament Speech Corpus [21.190182627955817]
本稿では,デンマーク議会の会議記録から作成した音声コーパスであるFT Speechを紹介する。
コーパスには、合計434人の話者による1,800時間以上の音声の書き起こしが含まれている。
これは、デンマークの既存の公用語コーパスよりも、持続時間、語彙、自然発話の量において著しく大きい。
論文 参考訳(メタデータ) (2020-05-25T19:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。