論文の概要: Lingxi: A Diversity-aware Chinese Modern Poetry Generation System
- arxiv url: http://arxiv.org/abs/2108.12108v1
- Date: Fri, 27 Aug 2021 03:33:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:19:38.206732
- Title: Lingxi: A Diversity-aware Chinese Modern Poetry Generation System
- Title(参考訳): Lingxi: 多様性を意識した中国の現代詩生成システム
- Authors: Xinran Zhang, Maosong Sun, Jiafeng Liu, Xiaobing Li
- Abstract要約: リンギキ(Lingxi)は、中国における多様性を意識した現代詩生成システムである。
ランダム化ヘッド(NS-RH)アルゴリズムを用いた核サンプリングを提案する。
フィルタされた語彙の大部分がランダム化されている場合でも、実際に流動的な詩を生成することができる。
- 参考スコア(独自算出の注目度): 43.36560720793425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Poetry generation has been a difficult task in natural language processing.
Unlike plain neural text generation tasks, poetry has a high requirement for
novelty, since an easily-understood sentence with too many high frequency words
might not be considered as poetic, while adequately ambiguous sentences with
low frequency words can possibly be novel and creative. Inspired by this, we
present Lingxi, a diversity-aware Chinese modern poetry generation system. We
propose nucleus sampling with randomized head (NS-RH) algorithm, which
randomizes the high frequency part ("head") of the predicted distribution, in
order to emphasize on the "comparatively low frequency" words. The proposed
algorithm can significantly increase the novelty of generated poetry compared
with traditional sampling methods. The permutation of distribution is
controllable by tuning the filtering parameter that determines the "head" to
permutate, achieving diversity-aware sampling. We find that even when a large
portion of filtered vocabulary is randomized, it can actually generate fluent
poetry but with notably higher novelty. We also propose a
semantic-similarity-based rejection sampling algorithm, which creates longer
and more informative context on the basis of the short input poetry title while
maintaining high semantic similarity to the title, alleviating the off-topic
issue.
- Abstract(参考訳): 詩生成は自然言語処理において難しい課題であった。
単純なニューラルテキスト生成タスクとは異なり、高頻度の単語が多すぎる容易に理解される文は詩的とはみなされないが、低頻度の単語を持つ適切にあいまいな文は新奇で創造的である可能性があるため、詩は新奇性を必要とする。
そこで本稿では,中国の現代詩生成システムlingxiについて紹介する。
本研究では,予測分布の高周波部(ヘッド)をランダム化するランダム化ヘッド(ns-rh)アルゴリズムを用いた核サンプリングを提案する。
提案アルゴリズムは,従来のサンプリング手法と比較して,生成した詩の新規性を著しく向上させることができる。
分布の置換は「頭部」を決定するフィルタリングパラメータを調整し、多様性対応サンプリングを達成することで制御可能である。
フィルタリングされた語彙の大部分がランダム化されている場合でも、実際に流麗な詩を生成できるが、特に目新しさは高い。
また,題名と高い意味的類似性を維持しつつ,短い入力詩題に基づいて,より長く,より情報に富んだ文脈を生成する意味的類似性に基づく拒否サンプリングアルゴリズムを提案する。
関連論文リスト
- Evaluating Diversity in Automatic Poetry Generation [25.53206868552533]
我々は、構造的、語彙的、意味的、様式的な側面に沿って自動生成された詩の多様性を評価する。
現在の自動詩体系は,多次元にまたがってかなり過渡していることがわかった。
我々の特定された制限は、より真に多様な未来の詩生成モデルの基礎となるかもしれない。
論文 参考訳(メタデータ) (2024-06-21T16:03:21Z) - On the Efficacy of Sampling Adapters [82.5941326570812]
サンプリングアダプタを理解するための統一的なフレームワークを提案する。
彼らが実施するシフトは、正確さとリコールの間のトレードオフと見なすことができる、と私たちは主張する。
いくつかの精度強調尺度は、サンプリングアダプタが真の分布とより整合した確率分布をもたらすことを確実に示している。
論文 参考訳(メタデータ) (2023-07-07T17:59:12Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - Typical Decoding for Natural Language Generation [76.69397802617064]
本稿は,高確率テキストが退屈あるいは反復的である理由について考察する。
典型的なサンプリングでは,品質面での競争性能が期待できる。
論文 参考訳(メタデータ) (2022-02-01T18:58:45Z) - A pattern recognition approach for distinguishing between prose and
poetry [0.8971132850029492]
本稿では,音韻特性とリズム特性のみに基づく詩文と散文を区別する自動手法を提案する。
抽出した特徴集合を用いて検討されたテキストの分類を行った結果,ニューラルネットワークを用いて得られた0.78の精度が得られた。
論文 参考訳(メタデータ) (2021-07-18T18:44:17Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Improving Diversity of Neural Text Generation via Inverse Probability
Weighting [43.36560720793425]
逆確率重み付けにインスパイアされたサンプリング手法を提案する。
繰り返しループに繋がる確率の高い,退屈な,あるいは反復的な候補も含んでいる可能性がある。
結果から,本アルゴリズムは,人文に近づきながら,生成したサンプルの多様性を効果的に向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-03-13T08:17:40Z) - There Once Was a Really Bad Poet, It Was Automated but You Didn't Know
It [31.951441780084345]
我々は,リメリック生成のための新しい完全自動化システムLimGenを紹介する。
limgenは最先端のニューラルネットワークベースの詩モデルを上回る。
結果として生じるリメリックは詩的制約を満たし、主題的に一貫性のあるストーリーラインを持つ。
論文 参考訳(メタデータ) (2021-03-05T16:03:55Z) - Compose Like Humans: Jointly Improving the Coherence and Novelty for
Modern Chinese Poetry Generation [13.709648635080828]
本稿では,コヒーレンスとノベルティを両立させるため,ジェネレーション-リトリーブ-then-refineパラダイムを提案する。
大規模な漢詩データセットを収集した実験結果から,提案手法はより一貫性のある詩を生成するだけでなく,多様性やノベルティも向上することが示された。
論文 参考訳(メタデータ) (2020-05-04T15:16:10Z) - MixPoet: Diverse Poetry Generation via Learning Controllable Mixed
Latent Space [79.70053419040902]
多様な要素を吸収し,多様なスタイルを創出し,多様性を促進する新しいモデルであるMixPoetを提案する。
半教師付き変分オートエンコーダに基づいて、我々のモデルは潜在空間をいくつかの部分空間に切り離し、それぞれが敵の訓練によって1つの影響因子に条件付けされる。
中国詩の実験結果は、MixPoetが3つの最先端モデルに対して多様性と品質の両方を改善していることを示している。
論文 参考訳(メタデータ) (2020-03-13T03:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。