論文の概要: RabindraNet, Creating Literary Works in the Style of Rabindranath Tagore
- arxiv url: http://arxiv.org/abs/2202.00481v1
- Date: Wed, 5 Jan 2022 16:23:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-06 13:03:11.104087
- Title: RabindraNet, Creating Literary Works in the Style of Rabindranath Tagore
- Title(参考訳): RabindraNet - Rabindranath Tagoreのスタイルによる文学作品の作成
- Authors: Asadullah Al Galib
- Abstract要約: ラビンドラネット(RabindraNet)は、ラビンドラナート・タゴア(Rabindranath Tagore)の作品に基づいて訓練された積み重ねLSTM層を持つ文字レベルRNNモデルである。
正確なオンラインソースからRabindranath Tagoreのデジタル化された作品をコンパイルすることで、広範なデータセットを作成します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bengali literature has a rich history of hundreds of years with luminary
figures such as Rabindranath Tagore and Kazi Nazrul Islam. However, analytical
works involving the most recent advancements in NLP have barely scratched the
surface utilizing the enormous volume of the collected works from the writers
of the language. In order to bring attention to the analytical study involving
the works of Bengali writers and spearhead the text generation endeavours in
the style of existing literature, we are introducing RabindraNet, a character
level RNN model with stacked-LSTM layers trained on the works of Rabindranath
Tagore to produce literary works in his style for multiple genres. We created
an extensive dataset as well by compiling the digitized works of Rabindranath
Tagore from authentic online sources and published as open source dataset on
data science platform Kaggle.
- Abstract(参考訳): ベンガル文学は数百年の歴史があり、ラビンドラナト・タゴールやカジ・ナズル・イスラムのような輝かしい人物がいる。
しかし、NLPの最新の進歩を含む分析研究は、言語作者の収集した膨大な量の著作物を利用して表面をほとんど傷つけていない。
ベンガルの作家の著作を扱った分析研究や、既存の文学スタイルにおけるテキスト生成の先駆者となるために、ラビンドラネット(rabindranet)を紹介し、ラビンドラナト・タゴール(rabindranath tagore)の著作に基づいて訓練されたスタック化されたlstm層を持つ文字レベルのrnnモデルを紹介し、多ジャンルの文学作品を生み出している。
私たちはまた、信頼できるオンラインソースからRabindranath Tagoreのデジタル化された作品をコンパイルして、広範なデータセットを作成しました。
関連論文リスト
- Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Style transfer and classification in hebrew news items [0.0]
ヘブライ語は形態学的な豊かな言語であり、そのモデリングは単純な言語よりも難しい。
トランスフォーマー(Transformers in general)やバート(Bert)のような最近の発展は、SOTAの結果に達するヘブライ語のモデルへの道を開いた。
オンラインアーカイブから収集したニュース記事に対して,スタイル転送,テキスト生成,分類を行う分野における最先端について検討する。
論文 参考訳(メタデータ) (2022-12-06T14:47:29Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - StoryTrans: Non-Parallel Story Author-Style Transfer with Discourse
Representations and Content Enhancing [73.81778485157234]
長文は通常、文よりも談話構造のような複雑な著者の言語的嗜好を含んでいる。
我々は、入力されたストーリーを特定の著者スタイルに転送する必要があるノン並列ストーリー作者スタイル転送のタスクを定式化する。
モデルが自動エンコーダに退化することを防ぐために,学習した談話表現からスタイル的特徴を引き離すための追加の学習目標を用いる。
論文 参考訳(メタデータ) (2022-08-29T08:47:49Z) - Two Decades of Bengali Handwritten Digit Recognition: A Survey [0.0]
手書きデジタル認識(DL)は、光学文字認識(OCR)分野において最も難しい課題の1つである。
手書きデジタル認識(DL)は、光学文字認識(OCR)分野において最も難しい課題の1つである。
論文 参考訳(メタデータ) (2022-06-05T18:20:41Z) - End-to-End Optical Character Recognition for Bengali Handwritten Words [0.0]
本稿では,Bengali言語のエンドツーエンドOCRシステムについて紹介する。
提案アーキテクチャは,手書きのベンガル語を手書きの単語画像から認識するエンド・ツー・エンド戦略を実装している。
論文 参考訳(メタデータ) (2021-05-09T20:48:56Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - Anubhuti -- An annotated dataset for emotional analysis of Bengali short
stories [2.3424047967193826]
アヌブティはベンガルの短編小説の著者が表現した感情を分析するための最初の、そして最大のテキストコーパスである。
本稿では,データ収集手法,手作業によるアノテーション処理,そして結果として生じるハイアノテータ間の合意について説明する。
我々は、ベースライン機械学習と感情分類のためのディープラーニングモデルを用いて、データセットの性能を検証した。
論文 参考訳(メタデータ) (2020-10-06T22:33:58Z) - Deep Learning for Hindi Text Classification: A Comparison [6.8629257716723]
デヴァナガリ文字で書かれた形態的に豊かで低資源のヒンディー語を分類する研究は、大きなラベル付きコーパスがないために限られている。
本研究では,CNN,LSTM,注意に基づくモデル評価のために,英文データセットの翻訳版を用いた。
また,本論文は,一般的なテキスト分類手法のチュートリアルとしても機能する。
論文 参考訳(メタデータ) (2020-01-19T09:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。