論文の概要: Automated Evaluation of Meter and Rhyme in Russian Generative and Human-Authored Poetry
- arxiv url: http://arxiv.org/abs/2502.20931v1
- Date: Fri, 28 Feb 2025 10:39:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:42:30.631712
- Title: Automated Evaluation of Meter and Rhyme in Russian Generative and Human-Authored Poetry
- Title(参考訳): ロシア語生成・人文認証詩における韻律と韻律の自動評価
- Authors: Ilya Koziev,
- Abstract要約: 我々は,ロシア語詩におけるストレスマーク配置のためのロシア語詩スキャンツールライブラリを紹介する。
RIFMA - 様々なジャンルや形式にまたがる詩の断片のデータセット。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Generative poetry systems require effective tools for data engineering and automatic evaluation, particularly to assess how well a poem adheres to versification rules, such as the correct alternation of stressed and unstressed syllables and the presence of rhymes. In this work, we introduce the Russian Poetry Scansion Tool library designed for stress mark placement in Russian-language syllabo-tonic poetry, rhyme detection, and identification of defects of poeticness. Additionally, we release RIFMA -- a dataset of poem fragments spanning various genres and forms, annotated with stress marks. This dataset can be used to evaluate the capability of modern large language models to accurately place stress marks in poetic texts. The published resources provide valuable tools for researchers and practitioners in the field of creative generative AI, facilitating advancements in the development and evaluation of generative poetry systems.
- Abstract(参考訳): データエンジニアリングと自動評価のための効果的なツール、特に、ストレスのある音節や非ストレスのある音節の正しい交替や韻律の存在など、詩が翻訳規則にどの程度順応するかを評価するために、ジェネレーティブな詩システムが必要である。
本研究では,ロシア語のシラボ-トニック詩,韻律検出,詩文の欠陥の同定において,ストレスマークの配置のために設計されたロシア語の詩文スキャンツールライブラリを紹介する。
さらに、さまざまなジャンルや形式にまたがる詩の断片のデータセットであるRIFMAを、ストレスマークで注釈付けした形でリリースする。
このデータセットは、詩のテキストにストレスマークを正確に配置する現代の大規模言語モデルの能力を評価するために使用することができる。
出版された資料は、創造的生成AIの分野における研究者や実践者にとって貴重なツールを提供し、生成的詩システムの開発と評価の進歩を促進する。
関連論文リスト
- Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0040661953201475]
大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文 参考訳(メタデータ) (2024-06-27T05:36:53Z) - GPT Czech Poet: Generation of Czech Poetic Strophes with Language Models [0.4444634303550442]
チェコ語で詩を生成するための新しいモデルを提案する。
詩文中のストロフェパラメータを明示的に指定することで生成プロセスの指導がモデルの有効性を強く向上することを示す。
論文 参考訳(メタデータ) (2024-06-18T06:19:45Z) - Erato: Automatizing Poetry Evaluation [6.5990719141691825]
本稿では,詩の自動評価を容易にするための枠組みであるエラトについて紹介する。
エラトを用いて、人間が書いた詩と自動生成した詩とを比較し、対比する。
論文 参考訳(メタデータ) (2023-10-31T10:06:37Z) - A Computational Approach to Style in American Poetry [19.41186389974801]
我々は,アメリカの詩のスタイルを評価し,詩集を相互に視覚化する手法を開発した。
質的な詩批評は、様々な正書法、構文、音韻の特徴を分析するメトリクスの開発を導くのに役立ちました。
本手法は,テキストの学術研究,詩に対する直感的な個人的反応の研究,およびお気に入りの詩に基づいた読者への推薦に有効である。
論文 参考訳(メタデータ) (2023-10-13T18:49:14Z) - Boosting Punctuation Restoration with Data Generation and Reinforcement
Learning [70.26450819702728]
触覚回復は自動音声認識(ASR)における重要な課題である
テキストの句読点とASRテキストとの相違は、ASRテキストの句読点復元システムのトレーニングにおいて、テキストのユーザビリティを制限している。
本稿では,このギャップを埋めるために,話題内テキストを活用した強化学習手法と大規模事前学習型生成言語モデルの最近の進歩を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:22:04Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - PoeLM: A Meter- and Rhyme-Controllable Language Model for Unsupervised
Poetry Generation [42.12348554537587]
形式詩は詩の韻律や韻律に厳格な制約を課している。
この種の詩を創作する以前の作品のほとんどは、既存の詩を監督に用いている。
本稿では,任意の韻律や韻律に従って詩を生成するための教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-24T17:09:55Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Metrical Tagging in the Wild: Building and Annotating Poetry Corpora
with Rhythmic Features [0.0]
英語とドイツ語に大規模な詩コーパスを提供し,コーパス駆動ニューラルモデルを訓練するためのコーパスを小型化した韻律的特徴をアノテートする。
音節埋め込みを用いた BiLSTM-CRF モデルは, CRF ベースラインと異なるBERT ベースアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-17T16:38:57Z) - Generating Major Types of Chinese Classical Poetry in a Uniformed
Framework [88.57587722069239]
GPT-2に基づく漢詩の主要なタイプを生成するフレームワークを提案する。
予備的な結果は、この強化されたモデルが、形も内容も質の高い大型漢詩を生成できることを示している。
論文 参考訳(メタデータ) (2020-03-13T14:16:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。