論文の概要: Large Language Models for Predictive Analysis: How Far Are They?
- arxiv url: http://arxiv.org/abs/2505.17149v1
- Date: Thu, 22 May 2025 09:02:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.612723
- Title: Large Language Models for Predictive Analysis: How Far Are They?
- Title(参考訳): 予測分析のための大規模言語モデル: どのくらい遠いか?
- Authors: Qin Chen, Yuanyi Ren, Xiaojun Ma, Yuyang Shi,
- Abstract要約: 大きな言語モデル(LLM)は、ニュアンスで知識集約的な会話を可能にする強力なツールとして登場した。
我々は,8つの分野からなる44の実世界のデータセットから1130の高度な予測分析クエリを統合する textbfPredictiQ ベンチマークを導入する。
12の有名なLCMが評価され、予測分析における実践的利用に関する洞察を提供する。
- 参考スコア(独自算出の注目度): 6.747160854665847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predictive analysis is a cornerstone of modern decision-making, with applications in various domains. Large Language Models (LLMs) have emerged as powerful tools in enabling nuanced, knowledge-intensive conversations, thus aiding in complex decision-making tasks. With the burgeoning expectation to harness LLMs for predictive analysis, there is an urgent need to systematically assess their capability in this domain. However, there is a lack of relevant evaluations in existing studies. To bridge this gap, we introduce the \textbf{PredictiQ} benchmark, which integrates 1130 sophisticated predictive analysis queries originating from 44 real-world datasets of 8 diverse fields. We design an evaluation protocol considering text analysis, code generation, and their alignment. Twelve renowned LLMs are evaluated, offering insights into their practical use in predictive analysis. Generally, we believe that existing LLMs still face considerable challenges in conducting predictive analysis. See \href{https://github.com/Cqkkkkkk/PredictiQ}{Github}.
- Abstract(参考訳): 予測分析は現代の意思決定の基盤であり、様々な領域で応用されている。
大規模言語モデル(LLM)は、曖昧で知識集約的な会話を可能にする強力なツールとして登場し、複雑な意思決定タスクを支援する。
予測分析にLLMを活用するという期待が高まっているため、この領域でそれらの能力を体系的に評価する必要がある。
しかし、既存の研究には関連する評価の欠如がある。
このギャップを埋めるために,8つの分野の44個の実世界のデータセットから1130個の高度な予測分析クエリを統合する,‘textbf{PredictiQ} ベンチマークを導入する。
テキスト解析,コード生成,アライメントを考慮した評価プロトコルを設計する。
12の有名なLCMが評価され、予測分析における実践的利用に関する洞察を提供する。
一般論として,既存のLCMは予測分析を行う上で大きな課題に直面している。
https://github.com/Cqkkkk/PredictiQ}{Github} を参照。
関連論文リスト
- Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework [61.38174427966444]
大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、より広く使われている。
従来の研究では、強力なプロプライエタリモデルの評価と判断を再現するために、オープンソースのLLMを微調整しようと試みてきた。
本稿では,評価基準を適応的に定式化し,テキストベースとコード駆動分析の両方を合成する新しい評価フレームワークARJudgeを提案する。
論文 参考訳(メタデータ) (2025-02-26T06:31:45Z) - Predictive Prompt Analysis [18.90591503793723]
大規模言語モデル(LLM)は、以前困難なタスクを扱う能力のために広く採用されている機械学習モデルである。
我々は、自動手法がプロンプトを素早く分析する「予測的プロンプト解析」が有用であると論じている。
SPA(Syntactic Prevalence Analyzer)を提案する。これはスパースオートエンコーダ(SAE)に基づく予測的プロンプト分析手法である。
論文 参考訳(メタデータ) (2025-01-31T04:34:43Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.84181171987974]
我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。
まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。
本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文 参考訳(メタデータ) (2024-05-21T15:13:12Z) - Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文 参考訳(メタデータ) (2023-05-24T10:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。