論文の概要: Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features
- arxiv url: http://arxiv.org/abs/2410.02881v1
- Date: Thu, 3 Oct 2024 18:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-03 05:14:45.901962
- Title: Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features
- Title(参考訳): 芸術的吸気の計算的モデリング--言語的特徴と立体的特徴を用いた歌詞の美的嗜好の予測フレームワーク
- Authors: Gaurav Sahu, Olga Vechtomova,
- Abstract要約: 芸術的なインスピレーションは、観客に深く響く作品を作る上で重要な役割を担っている。
この研究は、異なる個人における芸術的嗜好を計算的にモデル化するための新しい枠組みを提案する。
我々のフレームワークは、最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
- 参考スコア(独自算出の注目度): 8.205321096201095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artistic inspiration remains one of the least understood aspects of the creative process. It plays a crucial role in producing works that resonate deeply with audiences, but the complexity and unpredictability of aesthetic stimuli that evoke inspiration have eluded systematic study. This work proposes a novel framework for computationally modeling artistic preferences in different individuals through key linguistic and stylistic properties, with a focus on lyrical content. In addition to the framework, we introduce \textit{EvocativeLines}, a dataset of annotated lyric lines, categorized as either "inspiring" or "not inspiring," to facilitate the evaluation of our framework across diverse preference profiles. Our computational model leverages the proposed linguistic and poetic features and applies a calibration network on top of it to accurately forecast artistic preferences among different creative individuals. Our experiments demonstrate that our framework outperforms an out-of-the-box LLaMA-3-70b, a state-of-the-art open-source language model, by nearly 18 points. Overall, this work contributes an interpretable and flexible framework that can be adapted to analyze any type of artistic preferences that are inherently subjective across a wide spectrum of skill levels.
- Abstract(参考訳): 芸術的なインスピレーションは、創造的プロセスの最も理解されていない側面の1つである。
オーディエンスと深く調和する作品の製作において重要な役割を担っているが、審美的刺激の複雑さと予測不可能さによって、インスピレーションを喚起し、体系的な研究が妨げられている。
本研究は,各個人における芸術的嗜好を,重要な言語的・文体的特性を通じて計算的にモデル化する新しい枠組みを提案する。
フレームワークに加えて,アノテーション付きリリックラインのデータセットである‘textit{EvocativeLines} を導入し,さまざまな好みプロファイルでフレームワークの評価を容易にするため,"インスピレーション" か "インスピレーション" のいずれかに分類した。
我々の計算モデルは,提案した言語的特徴と詩的特徴を活用し,その上にキャリブレーションネットワークを適用し,異なる創造的個人間の芸術的嗜好を正確に予測する。
我々の実験によると、我々のフレームワークは最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
全体として、この研究は解釈可能で柔軟なフレームワークを提供しており、様々なスキルレベルにおいて本質的に主観的な芸術的嗜好の分析に適応することができる。
関連論文リスト
- Advancing Comprehensive Aesthetic Insight with Multi-Scale Text-Guided Self-Supervised Learning [14.405750888492735]
Image Aesthetic Assessment (IAA) は、画像の美的価値を分析し評価する作業である。
IAAの伝統的な手法は、しばしば単一の美的タスクに集中し、ラベル付きデータセットが不十分である。
審美的洞察をニュアンス化した総合的審美的MLLMを提案する。
論文 参考訳(メタデータ) (2024-12-16T16:35:35Z) - Textual Aesthetics in Large Language Models [80.09790024030525]
美学研磨のためのパイプラインを導入し,テキスト美学データセットTexAesの構築を支援する。
そこで本研究では,TAPOと呼ばれる直接選好最適化に基づくテキスト美学を利用した微調整手法を提案する。
本実験は,テキスト美学データとTAPOファインチューニング法を用いて,美学のスコアを改善するだけでなく,一般的な評価データセットの性能を向上させることを実証した。
論文 参考訳(メタデータ) (2024-11-05T09:22:08Z) - Towards Visual Text Design Transfer Across Languages [49.78504488452978]
マルチモーダル・スタイル翻訳(MuST-Bench)の新たな課題について紹介する。
MuST-Benchは、視覚テキスト生成モデルが様々な書き込みシステム間で翻訳を行う能力を評価するために設計されたベンチマークである。
そこで我々は,スタイル記述の必要性を解消する多モーダルなスタイル翻訳フレームワークであるSIGILを紹介した。
論文 参考訳(メタデータ) (2024-10-24T15:15:01Z) - Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations [2.4374097382908477]
スタイルに基づくクラスタリングアートは、アートレコメンデーションやスタイルベースの検索、検索など、現実世界の多くのアプリケーションを提供できる。
スタイルに基づいたクラスタリングアートワークは,主に非適応的な問題である,と我々は主張する。
論文 参考訳(メタデータ) (2024-09-12T17:44:07Z) - MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerがLarge Language Models(LLM)を利用したアートタイポグラフィーのための変換フレームワークを導入
その基盤は、Pipeline、Glyph、Textureエージェントで構成されるマルチエージェントシステムであり、カスタマイズ可能なWordArtの作成をまとめてオーケストレーションしている。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - CreativeSynth: Creative Blending and Synthesis of Visual Arts based on
Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。
しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。
我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - Evaluating Large Language Model Creativity from a Literary Perspective [13.672268920902187]
本稿では,大規模言語モデルが創造的記述プロセスにおいて補助ツールとして機能する可能性を評価する。
我々は,背景記述をインターリーブする対話的かつ多声的なプロンプト戦略,構成を案内する指示,対象スタイルのテキストのサンプル,与えられたサンプルの批判的議論を開発する。
論文 参考訳(メタデータ) (2023-11-30T16:46:25Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - ALADIN-NST: Self-supervised disentangled representation learning of
artistic style through Neural Style Transfer [60.6863849241972]
我々は、画像に描かれた意味的内容から、より強く絡み合った視覚芸術スタイルの表現を学習する。
スタイルと内容の絡み合いに強く対処することで、スタイル固有のメトリクスが大きく向上することを示します。
論文 参考訳(メタデータ) (2023-04-12T10:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。