論文の概要: Ashaar: Automatic Analysis and Generation of Arabic Poetry Using Deep
Learning Approaches
- arxiv url: http://arxiv.org/abs/2307.06218v1
- Date: Wed, 12 Jul 2023 15:07:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 12:42:07.496796
- Title: Ashaar: Automatic Analysis and Generation of Arabic Poetry Using Deep
Learning Approaches
- Title(参考訳): ashaar:深層学習によるアラビア語詩の自動分析と生成
- Authors: Zaid Alyafeai and Maged S. Al-Shaibani and Moataz Ahmed
- Abstract要約: 本稿では,アラビア詩の分析・生成に特化して設計されたデータセットと事前学習モデルの集合を含むtextitAshaar というフレームワークを紹介する。
提案手法で確立されたパイプラインは, メーター, テーマ, 年代分類など, 詩の様々な側面を包含する。
この取り組みの一環として、詩生成のためのデータセットと、診断のためのデータセットと、Arudiスタイルの予測のためのデータセットを4つ提供します。
- 参考スコア(独自算出の注目度): 7.021140304091526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Poetry holds immense significance within the cultural and traditional fabric
of any nation. It serves as a vehicle for poets to articulate their emotions,
preserve customs, and convey the essence of their culture. Arabic poetry is no
exception, having played a cherished role in the heritage of the Arabic
community throughout history and maintaining its relevance in the present era.
Typically, comprehending Arabic poetry necessitates the expertise of a linguist
who can analyze its content and assess its quality. This paper presents the
introduction of a framework called \textit{Ashaar}
https://github.com/ARBML/Ashaar, which encompasses a collection of datasets and
pre-trained models designed specifically for the analysis and generation of
Arabic poetry. The pipeline established within our proposed approach
encompasses various aspects of poetry, such as meter, theme, and era
classification. It also incorporates automatic poetry diacritization, enabling
more intricate analyses like automated extraction of the \textit{Arudi} style.
Additionally, we explore the feasibility of generating conditional poetry
through the pre-training of a character-based GPT model. Furthermore, as part
of this endeavor, we provide four datasets: one for poetry generation, another
for diacritization, and two for Arudi-style prediction. These datasets aim to
facilitate research and development in the field of Arabic poetry by enabling
researchers and enthusiasts to delve into the nuances of this rich literary
tradition.
- Abstract(参考訳): 詩はあらゆる国の文化や伝統の織物の中で非常に重要である。
詩人が感情を表現し、習慣を守り、文化の本質を伝えるための手段としての役割を担っている。
アラビア詩は例外ではなく、歴史を通じてアラビアのコミュニティの遺産に重要な役割を担い、現代においてもその関連性を維持した。
通常、アラビア語の詩を理解するには、その内容を分析して品質を評価することができる言語学者の専門知識が必要である。
本稿では,アラビア詩の分析と生成に特化したデータセットと事前学習されたモデルの集合を包含する, \textit{ashaar} https://github.com/arbml/ashaarというフレームワークを紹介する。
提案手法で確立されたパイプラインは,メータ,テーマ,時代分類など,詩のさまざまな側面を包含する。
また、自動的な詩のダイナクリゼーションも組み込まれており、より複雑な分析を可能にしている。
さらに,文字ベースGPTモデルの事前学習による条件付き詩生成の実現可能性についても検討する。
さらに、この取り組みの一環として、詩生成のためのデータセットと、ダイアクリティカル化のためのデータセットと、Arudiスタイルの予測のためのデータセットを4つ提供します。
これらのデータセットは、研究者や愛好家がこの豊かな文学的伝統のニュアンスを掘り下げることによって、アラビア詩の分野の研究と発展を促進することを目的としている。
関連論文リスト
- Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - A Computational Approach to Style in American Poetry [19.41186389974801]
我々は,アメリカの詩のスタイルを評価し,詩集を相互に視覚化する手法を開発した。
質的な詩批評は、様々な正書法、構文、音韻の特徴を分析するメトリクスの開発を導くのに役立ちました。
本手法は,テキストの学術研究,詩に対する直感的な個人的反応の研究,およびお気に入りの詩に基づいた読者への推薦に有効である。
論文 参考訳(メタデータ) (2023-10-13T18:49:14Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z) - Aesthetics of Sanskrit Poetry from the Perspective of Computational
Linguistics: A Case Study Analysis on Siksastaka [11.950202012146498]
本稿では,サンスクリット詩と計算言語学の交わりについて考察する。
本研究では,サンスクリット詩の質と特徴を分析し,分類するための解釈可能なフレームワークのロードマップを提案する。
我々は6つの著名なカヴィアシャストラの流派の観点から、サンスクリットの詩であるシカサタカを深く分析する。
論文 参考訳(メタデータ) (2023-08-14T11:26:25Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - Exploratory Data Analysis of Urdu Poetry [0.0]
本研究は、他の形態よりも人気を博し、賞賛されるウルドゥ・ガザルの主な特徴を探求する。
愛、自然、鳥、花などを表現する言葉の種類については、詳しく説明されている。
論文 参考訳(メタデータ) (2021-12-03T20:06:11Z) - Sentiment Analysis in Poems in Misurata Sub-dialect -- A Sentiment
Detection in an Arabic Sub-dialect [0.0]
この研究は、リビアで話されているミシュラタ・アラビア語サブ方言で書かれた詩の感情を検出することに焦点を当てた。
データセットから感情を検出するために使用されるツールは、SklearnとMazajak sentiment tool 1.1である。
論文 参考訳(メタデータ) (2021-09-15T10:42:39Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Generating Major Types of Chinese Classical Poetry in a Uniformed
Framework [88.57587722069239]
GPT-2に基づく漢詩の主要なタイプを生成するフレームワークを提案する。
予備的な結果は、この強化されたモデルが、形も内容も質の高い大型漢詩を生成できることを示している。
論文 参考訳(メタデータ) (2020-03-13T14:16:25Z) - MixPoet: Diverse Poetry Generation via Learning Controllable Mixed
Latent Space [79.70053419040902]
多様な要素を吸収し,多様なスタイルを創出し,多様性を促進する新しいモデルであるMixPoetを提案する。
半教師付き変分オートエンコーダに基づいて、我々のモデルは潜在空間をいくつかの部分空間に切り離し、それぞれが敵の訓練によって1つの影響因子に条件付けされる。
中国詩の実験結果は、MixPoetが3つの最先端モデルに対して多様性と品質の両方を改善していることを示している。
論文 参考訳(メタデータ) (2020-03-13T03:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。