論文の概要: Interpreting Style Representations via Style-Eliciting Prompts
- arxiv url: http://arxiv.org/abs/2606.05716v1
- Date: Thu, 04 Jun 2026 05:17:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-06 06:55:34.636338
- Title: Interpreting Style Representations via Style-Eliciting Prompts
- Title(参考訳): スタイル抽出プロンプトによるスタイル表現の解釈
- Authors: Junghwan Kim, David Jurgens,
- Abstract要約: スタイル表現学習は、著者の分析とモデリングスタイルのための強力なツールである。
最近の研究は、入力テキストに条件付けされた大きな言語モデルで自然言語記述を生成することによって、これらの表現を説明しようと試みている。
そこで本研究では,スタイル選択プロンプトを通じてスタイル表現を解釈する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 33.42332250065166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Style representation learning is a powerful tool for authorship analysis and modeling writing style, yet the latent nature of learned representations makes them difficult to interpret. Recent work has attempted to explain these representations by generating natural language descriptions with large language models (LLMs) conditioned on input text. However, such descriptions are often prone to the LLM's biases and hallucinations, and they lack an explicit objective and practical utility. In this work, we propose a novel framework for interpreting style representations through style-eliciting prompts: natural language instructions designed to steer LLMs to generate text that reflects specific stylistic attributes. We curate 1,010 distinct style features spanning 26 stylistic categories and construct a dataset by prompting an LLM to generate text conditioned on these features. Using this data, we train a decoder to generate a style prompt from the style representation of the generated text. We evaluate our approach on three tasks: (1) recovering original style prompts from generated text, (2) generating text in the same style using the recovered prompts, and (3) steering LLM outputs to match the style of human-written texts. Experiments demonstrate that our method consistently outperforms strong baselines that directly prompt LLMs with target text, achieving superior performance in both style description and style imitation. These results highlight that style-eliciting prompts can provide a practical and interpretable interface to stylistic information encoded in style representations.
- Abstract(参考訳): スタイル表現学習は、著者分析と書記スタイルのモデリングのための強力なツールであるが、学習された表現の潜在性は、解釈を困難にしている。
最近の研究は、入力テキストに条件付けされた大きな言語モデル(LLM)で自然言語記述を生成することで、これらの表現を説明しようとしている。
しかし、そのような記述はLLMの偏見や幻覚に起因しがちであり、明確な目的と実用性は欠如している。
そこで本研究では,LLMを操り,特定のスタイル特性を反映したテキストを生成する自然言語記述法を提案する。
我々は、26のスタイルカテゴリにまたがる1,010の異なるスタイルの特徴をキュレートし、LLMにこれらの特徴を条件付けしたテキストを生成するよう促すことでデータセットを構築する。
このデータを用いてデコーダをトレーニングし、生成されたテキストのスタイル表現からスタイルプロンプトを生成する。
我々は,(1)生成したテキストから原文のプロンプトを復元すること,(2)復元したプロンプトを用いて同じスタイルのテキストを生成すること,(3)人文テキストのスタイルに合わせたLCM出力をステアリングすること,の3つのタスクに対してアプローチを評価した。
実験により,本手法は,LLMを目標テキストで直接刺激する強いベースラインを一貫して上回り,スタイル記述とスタイル模倣の両方において優れた性能を発揮することが示された。
これらの結果から,スタイル表現にエンコードされたスタイル情報に対する実践的で解釈可能なインタフェースを提供することが可能であることが示唆された。
関連論文リスト
- Interpretable Stylistic Variation in Human and LLM Writing Across Genres, Models, and Decoding Strategies [0.34202935599316525]
大規模言語モデル(LLM)は、高度に流動的で人間らしいテキストを生成することができる。
LLMは、多くのアプリケーションを可能にするだけでなく、大規模なスパム、フィッシング、学術的誤用といった懸念も引き起こす。
人文テキストと11 LLMの出力のスタイリスティックな変動を大規模に解析する。
論文 参考訳(メタデータ) (2026-04-15T17:31:21Z) - Personalized Image Generation from an Author Writing Style [0.29998889086656577]
ニュアンスでテキストで定義された著作スタイルを説得力のある視覚表現に変換することは、ジェネレーティブAIにおける新たな課題である。
本稿では,Large Language Model (LLM) への入力として Author Writing Sheets (AWS) を利用するパイプラインを提案する。
我々はRedditのデータから49の著者スタイルを用いてアプローチを評価し、人間の評価者が生成した画像のスタイリスティックなマッチングと視覚的特徴を評価した。
論文 参考訳(メタデータ) (2025-07-04T05:53:48Z) - Learning to Generate Text in Arbitrary Writing Styles [6.7308816341849695]
言語モデルは、潜在的に小さな文章サンプルに基づいて、著者固有のスタイルでテキストを作成することが望ましい。
本稿では,テクスチャ的特徴を捉えた対照的に訓練された表現を用いて,ターゲットスタイルのテキストを生成するための言語モデルを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:58:52Z) - Visual Captioning at Will: Describing Images and Videos Guided by a Few
Stylized Sentences [49.66987347397398]
Few-Shot Stylized Visual Captioningは,任意のスタイルでキャプションを生成することを目的としている。
本稿では,条件付きエンコーダ-デコーダ言語モデルとビジュアルプロジェクションモジュールを用いたFS-StyleCapというフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-31T04:26:01Z) - CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model [55.321010757641524]
CLIP4STRは,CLIPのイメージエンコーダとテキストエンコーダ上に構築された,シンプルで効果的なSTRメソッドである。
モデルサイズ、事前トレーニングデータ、トレーニングデータの観点からCLIP4STRをスケールし、13のSTRベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-05-23T12:51:20Z) - Learning Interpretable Style Embeddings via Prompting LLMs [46.74488355350601]
スタイル表現学習はテキストで著者スタイルのコンテンツに依存しない表現を構築する。
現在のスタイル表現学習では、ニューラルネットワークを使ってスタイルをコンテンツから切り離し、スタイルベクトルを作成する。
我々は、多くのテキストでスタイメトリーを実行し、合成データセットを作成し、人間の解釈可能なスタイル表現を訓練するために、プロンプトを使用する。
論文 参考訳(メタデータ) (2023-05-22T04:07:54Z) - Stylized Data-to-Text Generation: A Case Study in the E-Commerce Domain [53.22419717434372]
本稿では,特定のスタイルに従ってコヒーレントテキストを生成することを目的とした新しいタスク,すなわちスタイル化されたデータ・テキスト生成を提案する。
このタスクは、生成されたテキストのロジック、構造化されていないスタイル参照、バイアスのあるトレーニングサンプルという3つの課題のため、簡単ではない。
本稿では,論理計画型データ埋め込み,マスク型スタイル埋め込み,非バイアス型スタイリングテキスト生成の3つのコンポーネントからなる,新しいスタイル付きデータ・テキスト生成モデルであるStyleD2Tを提案する。
論文 参考訳(メタデータ) (2023-05-05T03:02:41Z) - StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized
Tokenizer of a Large-Scale Generative Model [64.26721402514957]
本論文では,自然言語を用いて抽象芸術スタイルを記述するスタイル転送手法であるStylerDALLEを提案する。
具体的には、非自己回帰的なトークンシーケンス変換として、言語誘導型転送タスクを定式化する。
スタイル情報を組み込むために,CLIPに基づく言語指導による強化学習戦略を提案する。
論文 参考訳(メタデータ) (2023-03-16T12:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。