論文の概要: Evaluating Diversity in Automatic Poetry Generation
- arxiv url: http://arxiv.org/abs/2406.15267v2
- Date: Fri, 08 Nov 2024 14:02:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:52:32.901783
- Title: Evaluating Diversity in Automatic Poetry Generation
- Title(参考訳): 自動詩生成における多様性の評価
- Authors: Yanran Chen, Hannes Gröner, Sina Zarrieß, Steffen Eger,
- Abstract要約: 我々は、構造的、語彙的、意味的、様式的な側面に沿って自動生成された詩の多様性を評価する。
現在の自動詩体系は,多次元にまたがってかなり過渡していることがわかった。
我々の特定された制限は、より真に多様な未来の詩生成モデルの基礎となるかもしれない。
- 参考スコア(独自算出の注目度): 25.53206868552533
- License:
- Abstract: Natural Language Generation (NLG), and more generally generative AI, are among the currently most impactful research fields. Creative NLG, such as automatic poetry generation, is a fascinating niche in this area. While most previous research has focused on forms of the Turing test when evaluating automatic poetry generation -- can humans distinguish between automatic and human generated poetry -- we evaluate the diversity of automatically generated poetry (with a focus on quatrains), by comparing distributions of generated poetry to distributions of human poetry along structural, lexical, semantic and stylistic dimensions, assessing different model types (word vs. character-level, general purpose LLMs vs. poetry-specific models), including the very recent LLaMA3-8B, and types of fine-tuning (conditioned vs. unconditioned). We find that current automatic poetry systems are considerably underdiverse along multiple dimensions -- they often do not rhyme sufficiently, are semantically too uniform and even do not match the length distribution of human poetry. Our experiments reveal, however, that style-conditioning and character-level modeling clearly increases diversity across virtually all dimensions we explore. Our identified limitations may serve as the basis for more genuinely diverse future poetry generation models.
- Abstract(参考訳): 自然言語生成(NLG)、より一般的には生成型AIは、現在最も影響力のある研究分野である。
自動詩生成のような創造的なNLGは、この分野では魅力的なニッチである。
従来の研究は、自動詩生成の評価においてチューリングテストの形式に重点を置いてきた -- 人間は自動詩と人文詩を区別できる -- 自動詩と人文詩の多様性を評価できる -- 、生成した詩の分布を、構造的、語彙的、意味的、スタイリスティックな次元に沿った人間の詩の分布と比較し、異なるモデルタイプ(単語対文字レベル、汎用LLM対詩特化モデル)を評価し、非常に最近のLLaMA3-8Bや微調整(条件付き対無条件)のタイプを含む。
現在の自動詩体系は、複数の次元に沿ってかなり多様であり、しばしば韻律が十分ではなく、意味的に不均一であり、人間の詩の長さ分布とさえ一致しない。
しかし,本実験により,スタイル条件とキャラクタレベルのモデリングにより,探索対象のほぼすべての次元における多様性が明らかに向上することが判明した。
我々の特定された制限は、より真に多様な未来の詩生成モデルの基礎となるかもしれない。
関連論文リスト
- Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0040661953201475]
大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文 参考訳(メタデータ) (2024-06-27T05:36:53Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - Generation of Chinese classical poetry based on pre-trained model [1.6114012813668934]
本稿では,主にBARTやその他の事前学習モデルを用いて,韻律的詩文を生成する。
一連のAI詩のチューリング問題を開発し、詩や詩を書く研究者のグループによってレビューされた。
著者が研究した詩文生成のモデルは、先進的な学者と区別できない作品を一般化している。
論文 参考訳(メタデータ) (2022-11-04T16:05:31Z) - BACON: Deep-Learning Powered AI for Poetry Generation with Author
Linguistic Style Transfer [91.3755431537592]
本稿では,BACONについて述べる。BACONは,著者の言語スタイルを伝達する自動詩生成器のプロトタイプである。
有限状態機械、確率モデル、人工ニューラルネットワーク、深層学習の概念と技法を組み合わせて、任意の著者のスタイルで豊かな美的品質でオリジナルの詩を書く。
論文 参考訳(メタデータ) (2021-12-14T00:08:36Z) - Don't Go Far Off: An Empirical Study on Neural Poetry Translation [13.194404923699782]
いくつかの側面から詩の翻訳を実証的に検討する。
複数言語対の詩翻訳の並列データセットをコントリビュートする。
その結果,詩文の多言語微調整は,35倍の大きさの非詩文の多言語微調整よりも優れていた。
論文 参考訳(メタデータ) (2021-09-07T10:00:44Z) - Lingxi: A Diversity-aware Chinese Modern Poetry Generation System [43.36560720793425]
リンギキ(Lingxi)は、中国における多様性を意識した現代詩生成システムである。
ランダム化ヘッド(NS-RH)アルゴリズムを用いた核サンプリングを提案する。
フィルタされた語彙の大部分がランダム化されている場合でも、実際に流動的な詩を生成することができる。
論文 参考訳(メタデータ) (2021-08-27T03:33:28Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - MixPoet: Diverse Poetry Generation via Learning Controllable Mixed
Latent Space [79.70053419040902]
多様な要素を吸収し,多様なスタイルを創出し,多様性を促進する新しいモデルであるMixPoetを提案する。
半教師付き変分オートエンコーダに基づいて、我々のモデルは潜在空間をいくつかの部分空間に切り離し、それぞれが敵の訓練によって1つの影響因子に条件付けされる。
中国詩の実験結果は、MixPoetが3つの最先端モデルに対して多様性と品質の両方を改善していることを示している。
論文 参考訳(メタデータ) (2020-03-13T03:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。