論文の概要: DISCO PAL: Diachronic Spanish Sonnet Corpus with Psychological and
Affective Labels
- arxiv url: http://arxiv.org/abs/2007.04626v3
- Date: Sun, 20 Jun 2021 19:19:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 04:16:16.006106
- Title: DISCO PAL: Diachronic Spanish Sonnet Corpus with Psychological and
Affective Labels
- Title(参考訳): DisCO PAL: 心理学的・感情的なラベルを持つダイアクロニック・スパニッシュ・ソネット
- Authors: Alberto Barbado, V\'ictor Fresno, \'Angeles Manjarr\'es Riesco,
Salvador Ros
- Abstract要約: 本稿では,スペイン語ソネットの注釈付きコーパスについて,GAMを予測するために個々の単語から特徴を構築できるかどうかを解析するために検討する。
使用したコーパスには、15世紀から19世紀にかけての様々な世紀の著者による274のスペイン語ソネットが含まれている。
これにより、ソネットのコーパスは、詩推薦システム、著者の人格テキストマイニング研究、治療目的の詩の使用など、様々な用途で利用することができる。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, there are many applications of text mining over corpora from
different languages. However, most of them are based on texts in prose, lacking
applications that work with poetry texts. An example of an application of text
mining in poetry is the usage of features derived from their individual words
in order to capture the lexical, sublexical and interlexical meaning, and infer
the General Affective Meaning (GAM) of the text. However, even though this
proposal has been proved as useful for poetry in some languages, there is a
lack of studies for both Spanish poetry and for highly-structured poetic
compositions such as sonnets. This article presents a study over an annotated
corpus of Spanish sonnets, in order to analyse if it is possible to build
features from their individual words for predicting their GAM. The purpose of
this is to model sonnets at an affective level. The article also analyses the
relationship between the GAM of the sonnets and the content itself. For this,
we consider the content from a psychological perspective, identifying with tags
when a sonnet is related to a specific term. Then, we study how GAM changes
according to each of those psychological terms.
The corpus used contains 274 Spanish sonnets from authors of different
centuries, from 15th to 19th. This corpus was annotated by different domain
experts. The experts annotated the poems with affective and lexico-semantic
features, as well as with domain concepts that belong to psychology. Thanks to
this, the corpus of sonnets can be used in different applications, such as
poetry recommender systems, personality text mining studies of the authors, or
the usage of poetry for therapeutic purposes.
- Abstract(参考訳): 今日では、様々な言語からのコーパスにテキストマイニングの応用が数多く存在する。
しかし、その多くは散文のテキストに基づいており、詩のテキストを扱うアプリケーションがない。
詩におけるテキストマイニングの応用例として、個々の単語から派生した特徴を用いて、語彙的、亜語彙的、インターレクシカルな意味を捉え、そのテキストの一般的な感情的意味(GAM)を推測することがある。
しかし、この提案はいくつかの言語で詩に有用であることが証明されているものの、スペイン語詩とソネットのような高度に構造化された詩作品の両方についての研究は欠如している。
本稿では,スペイン語ソネットの注釈付きコーパスについて,GAMを予測するために個々の単語から特徴を構築できるかどうかを解析するために検討する。
この目的は、感情レベルでソネットをモデル化することである。
この記事は、ソネットのGAMとコンテンツ自体との関係についても分析している。
そこで本稿では,ソネットが特定の用語に関連付けられている場合のタグを識別し,心理学的観点からその内容を考察する。
次に,GAMがそれぞれの心理的条件に応じてどのように変化するかを検討する。
このコーパスは、15世紀から19世紀にかけての異なる世紀の著者による274のスペインのソネットを含んでいる。
このコーパスは異なるドメインの専門家によって注釈付けされた。
専門家らは、詩に情緒的・語彙的特徴と、心理学に属する領域の概念を注釈した。
これにより、ソネットのコーパスは、詩推薦システム、著者のパーソナリティテキストマイニング研究、治療目的の詩の使用など、様々な用途で使用することができる。
関連論文リスト
- Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0040661953201475]
大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文 参考訳(メタデータ) (2024-06-27T05:36:53Z) - A Computational Approach to Style in American Poetry [19.41186389974801]
我々は,アメリカの詩のスタイルを評価し,詩集を相互に視覚化する手法を開発した。
質的な詩批評は、様々な正書法、構文、音韻の特徴を分析するメトリクスの開発を導くのに役立ちました。
本手法は,テキストの学術研究,詩に対する直感的な個人的反応の研究,およびお気に入りの詩に基づいた読者への推薦に有効である。
論文 参考訳(メタデータ) (2023-10-13T18:49:14Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - Information-Restricted Neural Language Models Reveal Different Brain
Regions' Sensitivity to Semantics, Syntax and Context [87.31930367845125]
テキストコーパスを用いて語彙言語モデルGloveと超語彙言語モデルGPT-2を訓練した。
そして、これらの情報制限されたモデルが、自然主義的テキストを聴く人間のfMRI信号の時間軸を予測することができるかを評価した。
分析の結果、言語に関わるほとんどの脳領域は、構文変数と意味変数の両方に敏感であるが、これらの影響の相対的な大きさは、これらの領域で大きく異なることがわかった。
論文 参考訳(メタデータ) (2023-02-28T08:16:18Z) - Textless Speech Emotion Conversion using Decomposed and Discrete
Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。
まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。
最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文 参考訳(メタデータ) (2021-11-14T18:16:42Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Metrical Tagging in the Wild: Building and Annotating Poetry Corpora
with Rhythmic Features [0.0]
英語とドイツ語に大規模な詩コーパスを提供し,コーパス駆動ニューラルモデルを訓練するためのコーパスを小型化した韻律的特徴をアノテートする。
音節埋め込みを用いた BiLSTM-CRF モデルは, CRF ベースラインと異なるBERT ベースアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-17T16:38:57Z) - Quasi Error-free Text Classification and Authorship Recognition in a
large Corpus of English Literature based on a Novel Feature Set [0.0]
GLECの準誤りのないテキスト分類とオーサシップ認識は,同一の5つのスタイルと5つのコンテンツ特徴を用いた手法で可能であることを示す。
我々のデータは、心理学を読むための文学や実験の、多くの未来の計算および実証的研究の道を開く。
論文 参考訳(メタデータ) (2020-10-21T07:39:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。