論文の概要: Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features
- arxiv url: http://arxiv.org/abs/2410.02881v1
- Date: Thu, 3 Oct 2024 18:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-03 05:14:45.901962
- Title: Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features
- Title(参考訳): 芸術的吸気の計算的モデリング--言語的特徴と立体的特徴を用いた歌詞の美的嗜好の予測フレームワーク
- Authors: Gaurav Sahu, Olga Vechtomova,
- Abstract要約: 芸術的なインスピレーションは、観客に深く響く作品を作る上で重要な役割を担っている。
この研究は、異なる個人における芸術的嗜好を計算的にモデル化するための新しい枠組みを提案する。
我々のフレームワークは、最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
- 参考スコア(独自算出の注目度): 8.205321096201095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artistic inspiration remains one of the least understood aspects of the creative process. It plays a crucial role in producing works that resonate deeply with audiences, but the complexity and unpredictability of aesthetic stimuli that evoke inspiration have eluded systematic study. This work proposes a novel framework for computationally modeling artistic preferences in different individuals through key linguistic and stylistic properties, with a focus on lyrical content. In addition to the framework, we introduce \textit{EvocativeLines}, a dataset of annotated lyric lines, categorized as either "inspiring" or "not inspiring," to facilitate the evaluation of our framework across diverse preference profiles. Our computational model leverages the proposed linguistic and poetic features and applies a calibration network on top of it to accurately forecast artistic preferences among different creative individuals. Our experiments demonstrate that our framework outperforms an out-of-the-box LLaMA-3-70b, a state-of-the-art open-source language model, by nearly 18 points. Overall, this work contributes an interpretable and flexible framework that can be adapted to analyze any type of artistic preferences that are inherently subjective across a wide spectrum of skill levels.
- Abstract(参考訳): 芸術的なインスピレーションは、創造的プロセスの最も理解されていない側面の1つである。
オーディエンスと深く調和する作品の製作において重要な役割を担っているが、審美的刺激の複雑さと予測不可能さによって、インスピレーションを喚起し、体系的な研究が妨げられている。
本研究は,各個人における芸術的嗜好を,重要な言語的・文体的特性を通じて計算的にモデル化する新しい枠組みを提案する。
フレームワークに加えて,アノテーション付きリリックラインのデータセットである‘textit{EvocativeLines} を導入し,さまざまな好みプロファイルでフレームワークの評価を容易にするため,"インスピレーション" か "インスピレーション" のいずれかに分類した。
我々の計算モデルは,提案した言語的特徴と詩的特徴を活用し,その上にキャリブレーションネットワークを適用し,異なる創造的個人間の芸術的嗜好を正確に予測する。
我々の実験によると、我々のフレームワークは最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
全体として、この研究は解釈可能で柔軟なフレームワークを提供しており、様々なスキルレベルにおいて本質的に主観的な芸術的嗜好の分析に適応することができる。
関連論文リスト
- Textual Aesthetics in Large Language Models [80.09790024030525]
美学研磨のためのパイプラインを導入し,テキスト美学データセットTexAesの構築を支援する。
そこで本研究では,TAPOと呼ばれる直接選好最適化に基づくテキスト美学を利用した微調整手法を提案する。
本実験は,テキスト美学データとTAPOファインチューニング法を用いて,美学のスコアを改善するだけでなく,一般的な評価データセットの性能を向上させることを実証した。
論文 参考訳(メタデータ) (2024-11-05T09:22:08Z) - Towards Visual Text Design Transfer Across Languages [49.78504488452978]
マルチモーダル・スタイル翻訳(MuST-Bench)の新たな課題について紹介する。
MuST-Benchは、視覚テキスト生成モデルが様々な書き込みシステム間で翻訳を行う能力を評価するために設計されたベンチマークである。
そこで我々は,スタイル記述の必要性を解消する多モーダルなスタイル翻訳フレームワークであるSIGILを紹介した。
論文 参考訳(メタデータ) (2024-10-24T15:15:01Z) - MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。
総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。
実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - ORACLE: Leveraging Mutual Information for Consistent Character Generation with LoRAs in Diffusion Models [3.7599363231894185]
単一テキストプロンプトから一貫した文字表現を生成するための新しいフレームワークを提案する。
我々のフレームワークは、一貫した視覚的アイデンティティを持つ文字を生成する既存の手法よりも優れています。
論文 参考訳(メタデータ) (2024-06-04T23:39:08Z) - CreativeSynth: Creative Blending and Synthesis of Visual Arts based on
Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。
しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。
我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - Evaluating Large Language Model Creativity from a Literary Perspective [13.672268920902187]
本稿では,大規模言語モデルが創造的記述プロセスにおいて補助ツールとして機能する可能性を評価する。
我々は,背景記述をインターリーブする対話的かつ多声的なプロンプト戦略,構成を案内する指示,対象スタイルのテキストのサンプル,与えられたサンプルの批判的議論を開発する。
論文 参考訳(メタデータ) (2023-11-30T16:46:25Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - ALADIN-NST: Self-supervised disentangled representation learning of
artistic style through Neural Style Transfer [60.6863849241972]
我々は、画像に描かれた意味的内容から、より強く絡み合った視覚芸術スタイルの表現を学習する。
スタイルと内容の絡み合いに強く対処することで、スタイル固有のメトリクスが大きく向上することを示します。
論文 参考訳(メタデータ) (2023-04-12T10:33:18Z) - Incorporating Stylistic Lexical Preferences in Generative Language
Models [10.62343151429147]
本稿では,著者の連続的な多次元語彙的嗜好を生成言語モデルに組み込むことにより,特定の著者属性を誘導する手法を提案する。
実験により,提案手法は,対象とする著者の語彙的スタイルと顕著に一致したテキストを生成することができることを示した。
論文 参考訳(メタデータ) (2020-10-22T09:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。