論文の概要: Automatic Prompt Optimization for Dataset-Level Feature Discovery
- arxiv url: http://arxiv.org/abs/2601.13922v1
- Date: Tue, 20 Jan 2026 12:51:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.312172
- Title: Automatic Prompt Optimization for Dataset-Level Feature Discovery
- Title(参考訳): データセットレベル特徴発見のための自動プロンプト最適化
- Authors: Adrian Cosma, Oleg Szehr, David Kletz, Alessandro Antonucci, Olivier Pelletier,
- Abstract要約: 特徴発見をデータセットレベルのプロンプト最適化問題として定式化する。
本稿では,言語モデルエージェントが特徴定義を共同で提案し,特徴値を抽出し,特徴品質を評価するマルチエージェントプロンプト最適化フレームワークを提案する。
この定式化は、サンプルごとの監督に依存し、非構造化テキストからの自動特徴発見のための原則化されたメカニズムを提供する、事前のプロンプト最適化手法から逸脱する。
- 参考スコア(独自算出の注目度): 38.37728428959515
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Feature extraction from unstructured text is a critical step in many downstream classification pipelines, yet current approaches largely rely on hand-crafted prompts or fixed feature schemas. We formulate feature discovery as a dataset-level prompt optimization problem: given a labelled text corpus, the goal is to induce a global set of interpretable and discriminative feature definitions whose realizations optimize a downstream supervised learning objective. To this end, we propose a multi-agent prompt optimization framework in which language-model agents jointly propose feature definitions, extract feature values, and evaluate feature quality using dataset-level performance and interpretability feedback. Instruction prompts are iteratively refined based on this structured feedback, enabling optimization over prompts that induce shared feature sets rather than per-example predictions. This formulation departs from prior prompt optimization methods that rely on per-sample supervision and provides a principled mechanism for automatic feature discovery from unstructured text.
- Abstract(参考訳): 構造化されていないテキストから特徴抽出は、多くの下流分類パイプラインにおいて重要なステップであるが、現在のアプローチは手作りのプロンプトや固定された特徴スキーマに大きく依存している。
ラベル付きテキストコーパスが与えられた場合、目的は、下流の教師あり学習目標を最適化する解釈可能かつ識別可能な特徴定義のグローバルなセットを誘導することである。
この目的のために,言語モデルエージェントが特徴定義を共同で提案し,特徴値を抽出し,データセットレベルの性能と解釈可能性フィードバックを用いて特徴量を評価するマルチエージェントプロンプト最適化フレームワークを提案する。
命令プロンプトは、この構造化されたフィードバックに基づいて反復的に洗練され、サンプルごとの予測よりも共有機能セットを誘導するプロンプトよりも最適化できる。
この定式化は、サンプルごとの監督に依存し、非構造化テキストからの自動特徴発見のための原則化されたメカニズムを提供する、事前のプロンプト最適化手法から逸脱する。
関連論文リスト
- FeClustRE: Hierarchical Clustering and Semantic Tagging of App Features from User Reviews [0.0]
FeClustREは、ハイブリッド機能抽出、階層クラスタリング、自動チューニング、セマンティックラベリングを統合したフレームワークである。
FeClustREを,クラスタリングの品質,セマンティックコヒーレンス,解釈可能性に関するAIアシスタントアプリレビューのサンプル調査と,その正しさの抽出のための公開ベンチマークで評価した。
論文 参考訳(メタデータ) (2025-10-21T16:54:21Z) - CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。
トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。
また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文 参考訳(メタデータ) (2025-10-03T08:50:21Z) - AttriPrompt: Dynamic Prompt Composition Learning for CLIP [41.37140060183439]
AttriPromptは、テキストの意味表現を強化し洗練する新しいフレームワークである。
本稿では,提案するテキスト特徴量と非プロンプトテキスト特徴量の間に明示的な正規化制約を適用することで,自己正規化機構を導入する。
実験では、AttriPromptが最先端の手法よりも優れており、ベース・ツー・ノーベル・セッティングにおいて最大7.37%の改善が達成されている。
論文 参考訳(メタデータ) (2025-09-07T07:07:59Z) - Reflection-Enhanced Meta-Optimization Integrating TextGrad-style Prompt Optimization with Memory-Driven Self-Evolution [0.0]
本稿では,メモリ拡張リフレクションRetrievalRAGモジュールと自己適応型メタコントローラを統合するフレームワークを提案する。
REMOは、計算オーバーヘッドの増加にもかかわらず、より安定で堅牢なチューニングを実現する。
論文 参考訳(メタデータ) (2025-08-26T07:25:45Z) - PromptPrism: A Linguistically-Inspired Taxonomy for Prompts [13.169345040931857]
PromptPrismは言語にインスパイアされた分類であり、3つの階層レベルの素早い分析を可能にする。
3つのアプリケーションに適用することで,PromptPrismの実用性を示す。
論文 参考訳(メタデータ) (2025-05-19T01:08:26Z) - In-context Demonstration Matters: On Prompt Optimization for Pseudo-Supervision Refinement [71.60563181678323]
大規模言語モデル(LLM)は様々なタスクで大きな成功を収めており、生成品質をさらに向上させるためには微調整が必要である場合もある。
これらの課題に対処する直接的な解決策は、教師なしの下流タスクから高信頼のデータを生成することである。
本稿では,プロンプトと全体的な擬似スーパービジョンを両立させる新しい手法,擬似教師付きデモアライメント・アライメント・アライメント・プロンプト・最適化(PAPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-04T03:39:28Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。