Fugu-MT 論文翻訳(概要): Can We Predict the Effect of Prompts?

論文の概要: Can We Predict the Effect of Prompts?

arxiv url: http://arxiv.org/abs/2501.18883v1
Date: Fri, 31 Jan 2025 04:34:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-03 22:46:12.911111
Title: Can We Predict the Effect of Prompts?
Title（参考訳）: プロンプトの効果を予測できますか?
Authors: Jae Yong Lee, Sungmin Kang, Shin Yoo,
Abstract要約: 大規模言語モデル(LLM)は、以前困難なタスクを扱う能力のために広く採用されている機械学習モデルである。我々は、自動手法がプロンプトを素早く分析する「予測的プロンプト解析」が有用であると論じている。 SPA(Syntactic Prevalence Analyzer)を提案する。これはスパースオートエンコーダ(SAE)に基づく予測的プロンプト分析手法である。
参考スコア（独自算出の注目度）: 18.90591503793723
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) are machine learning models that have seen widespread adoption due to their capability of handling previously difficult tasks. LLMs, due to their training, are sensitive to how exactly a question is presented, also known as prompting. However, prompting well is challenging, as it has been difficult to uncover principles behind prompting -- generally, trial-and-error is the most common way of improving prompts, despite its significant computational cost. In this context, we argue it would be useful to perform `predictive prompt analysis', in which an automated technique would perform a quick analysis of a prompt and predict how the LLM would react to it, relative to a goal provided by the user. As a demonstration of the concept, we present Syntactic Prevalence Analyzer (SPA), a predictive prompt analysis approach based on sparse autoencoders (SAEs). SPA accurately predicted how often an LLM would generate target syntactic structures during code synthesis, with up to 0.994 Pearson correlation between the predicted and actual prevalence of the target structure. At the same time, SPA requires only 0.4\% of the time it takes to run the LLM on a benchmark. As LLMs are increasingly used during and integrated into modern software development, our proposed predictive prompt analysis concept has the potential to significantly ease the use of LLMs for both practitioners and researchers.
Abstract（参考訳）: 大規模言語モデル(LLM)は、以前困難なタスクを扱う能力のために広く採用されている機械学習モデルである。 LLMは、トレーニングのため、どのように質問が提示されるかに敏感であり、プロンプトとしても知られている。一般的に、試行錯誤は、計算コストがかなり高いにもかかわらず、プロンプトを改善する最も一般的な方法です。この文脈では、自動手法がプロンプトの迅速な解析を行い、ユーザが提供する目標に対してLDMがどう反応するかを予測する「予測的プロンプト解析」を行うのが有用である。この概念の実証として,スパースオートエンコーダ(SAE)に基づく予測的迅速分析手法であるSPA(Syntactic Prevalence Analyzer)を提案する。 SPAは、LLMがコード合成中にターゲット構文構造を生成する頻度を正確に予測した。同時に、SPAはベンチマークでLSMを実行するのに要する時間のわずか0.4 %しか必要としない。 LLMは現代のソフトウェア開発においてますます使われ、統合されつつあるので、我々の提案する予測的素早い分析概念は、実践者と研究者の両方にとってLLMの使用を著しく緩和する可能性がある。

関連論文リスト

Is More Context Always Better? Examining LLM Reasoning Capability for Time Interval Prediction [15.45305246863211]
大規模言語モデル(LLM)は、異なるドメインをまたいだ推論と予測において印象的な能力を示している。本稿では,LLMが繰り返しユーザの行動の時間間隔を予測できるかどうかを系統的に検討する。我々は、統計モデルと機械学習モデルの両方に対してゼロショット設定で最先端のLCMをベンチマークする。
論文参考訳（メタデータ） (2026-01-15T07:18:40Z)
Toward Reasoning-Centric Time-Series Analysis [25.125311368754527]
現実の環境では、効果的な分析は表面的な傾向を超えて、それらを動かす実際の力を明らかにする必要がある。近年のLarge Language Models (LLMs) は時系列分析を再考する新たな機会を提供する。本稿では,LLMを用いた時系列を因果構造と説明可能性の優先順位付け作業として再考する。
論文参考訳（メタデータ） (2025-10-14T22:59:07Z)
Mapping the Course for Prompt-based Structured Prediction [5.483149122038912]
本稿では,LLMの予測力と推論手法による構造的整合性を組み合わせることを提案する。構造的予測目標を用いたキャリブレーションと微調整が,課題に対する性能向上につながることを示す。
論文参考訳（メタデータ） (2025-08-20T22:00:28Z)
LLM-Prompt: Integrated Heterogeneous Prompts for Unlocking LLMs in Time Series Forecasting [4.881217428928315]
時系列予測は、変数間の時間的依存関係を将来の状態推論のためにモデル化することを目的としている。近年の研究では,大規模言語モデル (LLM) が時系列予測において有望な性能を達成することが示されている。マルチプロンプト情報とモーダル間セマンティックアライメントを組み合わせたLLMベースの時系列予測フレームワークLLM-Promptを提案する。
論文参考訳（メタデータ） (2025-06-21T08:22:25Z)
Language Bottleneck Models: A Framework for Interpretable Knowledge Tracing and Beyond [55.984684518346924]
我々は、知識追跡を逆問題として再考する: 過去の回答を説明できる最小限の自然言語要約を学習し、将来の回答を予測できる。我々のLanguage Bottleneck Model(LBM)は、解釈可能な知識要約を書くエンコーダLLMと、その要約テキストのみを使用して生徒の反応を再構成し予測しなければならないフリーズデコーダLLMで構成されている。合成算術ベンチマークと大規模Eediデータセットの実験により、LBMは最先端のKT法と直接LLM法の精度に匹敵する一方で、受講者軌道のオーダーを少なくすることを示した。
論文参考訳（メタデータ） (2025-06-20T13:21:14Z)
Large Language Models for Predictive Analysis: How Far Are They? [6.747160854665847]
大きな言語モデル(LLM)は、ニュアンスで知識集約的な会話を可能にする強力なツールとして登場した。我々は,8つの分野からなる44の実世界のデータセットから1130の高度な予測分析クエリを統合する textbfPredictiQ ベンチマークを導入する。 12の有名なLCMが評価され、予測分析における実践的利用に関する洞察を提供する。
論文参考訳（メタデータ） (2025-05-22T09:02:15Z)
Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms [0.0]
フィールドテストによるアイテムの難易度の推定は、しばしばリソース集約的で時間を要する。本研究は,大言語モデル(LLM)を用いて,K-5数学および読解評価項目の項目難易度を予測することの実現可能性について検討する。
論文参考訳（メタデータ） (2025-04-09T00:04:07Z)
Explainable Multi-modal Time Series Prediction with LLM-in-the-Loop [63.34626300024294]
TimeXLはプロトタイプベースの時系列エンコーダを統合するマルチモーダル予測フレームワークである。より正確な予測と解釈可能な説明を生成する。 4つの実世界のデータセットに対する実証的な評価は、TimeXLがAUCで最大8.9%の改善を達成していることを示している。
論文参考訳（メタデータ） (2025-03-02T20:40:53Z)
Semantic Consistency Regularization with Large Language Models for Semi-supervised Sentiment Analysis [20.503153899462323]
本稿では,半教師付き感情分析のためのフレームワークを提案する。テキストを意味的に拡張する2つのプロンプト戦略を導入する。実験により,従来の半教師付き手法よりも優れた性能が得られた。
論文参考訳（メタデータ） (2025-01-29T12:03:11Z)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文参考訳（メタデータ） (2024-10-24T17:56:08Z)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.332004960574004]
大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳（メタデータ） (2024-07-20T11:19:58Z)
LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.84181171987974]
我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文参考訳（メタデータ） (2024-05-21T15:13:12Z)
Mitigating Catastrophic Forgetting in Large Language Models with Self-Synthesized Rehearsal [49.24054920683246]
大規模言語モデル(LLM)は、連続学習中に破滅的な忘れ込みに悩まされる。自己合成リハーサル(Self-Synthesized Rehearsal, SSR)と呼ばれるフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-02T16:11:23Z)
Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models [54.21695754082441]
説明可能なストック予測を生成するために,LLM(Large Language Models)を教えるフレームワークを提案する。反射剤は自己推論によって過去の株価の動きを説明する方法を学ぶ一方、PPOトレーナーは最も可能性の高い説明を生成するためにモデルを訓練する。我々のフレームワークは従来のディープラーニング法とLLM法の両方を予測精度とマシューズ相関係数で上回ることができる。
論文参考訳（メタデータ） (2024-02-06T03:18:58Z)
Evaluating and Explaining Large Language Models for Code Using Syntactic Structures [74.93762031957883]
本稿では,コード用大規模言語モデルに特有の説明可能性手法であるASTxplainerを紹介する。その中核にあるASTxplainerは、トークン予測をASTノードに整合させる自動メソッドを提供する。私たちは、最も人気のあるGitHubプロジェクトのキュレートデータセットを使用して、コード用の12の人気のあるLLMに対して、実証的な評価を行います。
論文参考訳（メタデータ） (2023-08-07T18:50:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。