論文の概要: Decoding the Poetic Language of Emotion in Korean Modern Poetry: Insights from a Human-Labeled Dataset and AI Modeling
- arxiv url: http://arxiv.org/abs/2509.03932v1
- Date: Thu, 04 Sep 2025 06:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.074873
- Title: Decoding the Poetic Language of Emotion in Korean Modern Poetry: Insights from a Human-Labeled Dataset and AI Modeling
- Title(参考訳): 韓国現代詩における感情表現のデコード:人間ラベルデータセットとAIモデリングから
- Authors: Iro Lim, Haein Ji, Byungjun Kim,
- Abstract要約: KPoEMは、現代朝鮮詩における計算的感情分析のための新しいデータセットである。
このデータセットに微調整された、最先端の韓国語モデルでは、以前のモデルよりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 8.134647127691162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study introduces KPoEM (Korean Poetry Emotion Mapping) , a novel dataset for computational emotion analysis in modern Korean poetry. Despite remarkable progress in text-based emotion classification using large language models, poetry-particularly Korean poetry-remains underexplored due to its figurative language and cultural specificity. We built a multi-label emotion dataset of 7,662 entries, including 7,007 line-level entries from 483 poems and 615 work-level entries, annotated with 44 fine-grained emotion categories from five influential Korean poets. A state-of-the-art Korean language model fine-tuned on this dataset significantly outperformed previous models, achieving 0.60 F1-micro compared to 0.34 from models trained on general corpora. The KPoEM model, trained through sequential fine-tuning-first on general corpora and then on the KPoEM dataset-demonstrates not only an enhanced ability to identify temporally and culturally specific emotional expressions, but also a strong capacity to preserve the core sentiments of modern Korean poetry. This study bridges computational methods and literary analysis, presenting new possibilities for the quantitative exploration of poetic emotions through structured data that faithfully retains the emotional and cultural nuances of Korean literature.
- Abstract(参考訳): 本研究は,現代韓国詩における計算感情分析のための新しいデータセットであるKPoEM(Korean Poetry Emotion Mapping)を紹介する。
大規模な言語モデルを用いたテキストベースの感情分類の顕著な進歩にもかかわらず、その具体的言語と文化的特異性により、特に朝鮮詩は未発見であった。
我々は,483首の行レベルのエントリ7,007首と615首の作業レベルのエントリを含む,7,662首の多ラベル感情データセットを構築した。
このデータセットで微調整された最新の韓国語モデルは、一般的なコーパスで訓練されたモデルから0.34よりも0.60F1-microで、前モデルよりも大幅に性能が向上した。
KPoEMモデルは,時間的・文化的に特定の感情表現を識別する能力の強化だけでなく,現代朝鮮詩の中核的な感情を保存できる強力な能力も備えている。
本研究では,韓国文学の感情的・文化的ニュアンスを忠実に保持する構造化されたデータを通じて,詩的感情を定量的に探索する新たな可能性を示す。
関連論文リスト
- EmoBench-UA: A Benchmark Dataset for Emotion Detection in Ukrainian [60.61343989805093]
EmoBench-UAはウクライナのテキストで感情を検出するための最初の注釈付きデータセットである。
その結果,ウクライナ語のような非主流言語における感情分類の課題が浮き彫りになった。
論文 参考訳(メタデータ) (2025-05-29T09:49:57Z) - GlobalMood: A cross-cultural benchmark for music emotion recognition [10.490374578193773]
「GlobalMood」は59か国から1180曲をサンプリングした異文化間ベンチマークデータセットである。
文化的に特定の音楽関連感情用語を抽出するためのボトムアップ・参加者主導のアプローチを実装した。
論文 参考訳(メタデータ) (2025-05-14T16:32:45Z) - Emo Pillars: Knowledge Distillation to Support Fine-Grained Context-Aware and Context-Less Emotion Classification [56.974545305472304]
感情分析のためのほとんどのデータセットは、意見が表現された文脈を欠き、感情理解に不可欠であり、主にいくつかの感情カテゴリーによって制限される。
我々はLLMベースのデータ合成パイプラインを設計し、よりアクセスしやすい軽量BERT型エンコーダモデルのトレーニング例を生成するために、大規模モデルMistral-7bを利用する。
Emo Pillarsモデルは、GoEmotions、ISEAR、IEMOCAP、EmoContextといった特定のタスクに調整された場合、新しいドメインに対して高い適応性を示し、最初の3つでSOTAのパフォーマンスに達した。
論文 参考訳(メタデータ) (2025-04-23T16:23:17Z) - SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection [76.18321723846616]
タスクは7つの異なる言語ファミリーから30以上の言語をカバーしている。
データインスタンスは6つの感情クラスでマルチラベルされており、感情の強さに注釈を付けた11言語にデータセットが追加されている。
参加者は, (a) マルチラベル感情検出, (b) 感情強度スコア検出, (c) 言語間感情検出の3つのトラックでラベルの予測を依頼された。
論文 参考訳(メタデータ) (2025-03-10T12:49:31Z) - Emotion Rendering for Conversational Speech Synthesis with Heterogeneous
Graph-Based Context Modeling [50.99252242917458]
会話音声合成(CSS)は,会話環境の中で適切な韻律と感情のインフレクションで発話を正確に表現することを目的としている。
データ不足の問題に対処するため、私たちはカテゴリと強度の点で感情的なラベルを慎重に作成します。
我々のモデルは感情の理解と表現においてベースラインモデルよりも優れています。
論文 参考訳(メタデータ) (2023-12-19T08:47:50Z) - HAE-RAE Bench: Evaluation of Korean Knowledge in Language Models [0.0]
HAE-RAE Benchは,韓国の文化的・文脈的深度に欠けるモデルに挑戦するためのデータセットである。
このデータセットは、語彙、歴史、一般的な知識、読み理解の4つの領域にまたがる6つの下流タスクを含んでいる。
論文 参考訳(メタデータ) (2023-09-06T04:38:16Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - ArtELingo: A Million Emotion Annotations of WikiArt with Emphasis on
Diversity over Language and Culture [33.055579812262785]
ArtELingoは新しいベンチマークとデータセットで、言語や文化の多様性に関する作業を促進するように設計されている。
ArtEmisに続いて、ArtELingoは、アラビア語と中国語でさらに0.79万のアノテーションを追加し、スペイン語で4.8Kの“文化的な”パフォーマンスを評価する。
この多様性は、言語や文化の類似点や相違点を研究することを可能にする。
論文 参考訳(メタデータ) (2022-11-19T19:34:18Z) - User Guide for KOTE: Korean Online Comments Emotions Dataset [5.865500664175491]
ほとんどの韓国の感情コーパスはインスタンス数が少ないため、限られた範囲の感情をカバーしている。
KOTEには50k(250k)の韓国のオンラインコメントが含まれており、それぞれ43の感情ラベルまたは1つの特別なラベル(NO EMOTION)をクラウドソーシング(Ps = 3,048)によって手動でラベル付けされている。
43の感情の感情分類は、単語埋め込み空間に表現された韓国の感情概念のクラスタ分析によって体系的に確立される。
論文 参考訳(メタデータ) (2022-05-11T06:54:10Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - PO-EMO: Conceptualization, Annotation, and Modeling of Aesthetic
Emotions in German and English Poetry [26.172030802168752]
我々は、詩の中の感情を、文章で表現されるものや著者が意図するものよりも、読者に誘惑されるものとして考える。
我々は,読者の審美的評価を予測可能な審美感情の集合を概念化し,各行に複数ラベルの注釈を付けることで,その文脈内での混合感情を捉えることができる。
論文 参考訳(メタデータ) (2020-03-17T13:54:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。