論文の概要: Research on Predicting Public Opinion Event Heat Levels Based on Large Language Models
- arxiv url: http://arxiv.org/abs/2409.18548v1
- Date: Fri, 27 Sep 2024 08:34:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-01 21:55:30.187489
- Title: Research on Predicting Public Opinion Event Heat Levels Based on Large Language Models
- Title(参考訳): 大規模言語モデルに基づくパブリックオピニオンイベントのヒートレベル予測に関する研究
- Authors: Yi Ren, Tianyi Zhang, Weibin Li, DuoMu Zhou, Chenhao Qin, FangCheng Dong,
- Abstract要約: 本研究では,世論イベントの熱レベル予測のための大規模言語モデルに基づく新しい手法を提案する。
我々は2022年7月から2023年12月までに収集された62,836の中国のホットイベントデータを前処理し分類した。
- 参考スコア(独自算出の注目度): 13.169955152764505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, with the rapid development of large language models, serval models such as GPT-4o have demonstrated extraordinary capabilities, surpassing human performance in various language tasks. As a result, many researchers have begun exploring their potential applications in the field of public opinion analysis. This study proposes a novel large-language-models-based method for public opinion event heat level prediction. First, we preprocessed and classified 62,836 Chinese hot event data collected between July 2022 and December 2023. Then, based on each event's online dissemination heat index, we used the MiniBatchKMeans algorithm to automatically cluster the events and categorize them into four heat levels (ranging from low heat to very high heat). Next, we randomly selected 250 events from each heat level, totalling 1,000 events, to build the evaluation dataset. During the evaluation process, we employed various large language models to assess their accuracy in predicting event heat levels in two scenarios: without reference cases and with similar case references. The results showed that GPT-4o and DeepseekV2 performed the best in the latter case, achieving prediction accuracies of 41.4% and 41.5%, respectively. Although the overall prediction accuracy remains relatively low, it is worth noting that for low-heat (Level 1) events, the prediction accuracies of these two models reached 73.6% and 70.4%, respectively. Additionally, the prediction accuracy showed a downward trend from Level 1 to Level 4, which correlates with the uneven distribution of data across the heat levels in the actual dataset. This suggests that with the more robust dataset, public opinion event heat level prediction based on large language models will have significant research potential for the future.
- Abstract(参考訳): 近年,大規模言語モデルの急速な発展に伴い,GPT-4oのようなサーボモデルは,様々な言語タスクにおいて人的性能を上回る異常な能力を示した。
その結果、多くの研究者が世論分析の分野でその可能性を探り始めた。
本研究では,世論イベントの熱レベル予測のための大規模言語モデルに基づく新しい手法を提案する。
まず、2022年7月から2023年12月までに収集された62,836の中国のホットイベントデータを前処理し分類した。
次に、各イベントのオンライン拡散熱指数に基づいて、MiniBatchKMeansアルゴリズムを使用して、イベントを自動的にクラスタ化し、4つの熱レベル(低い熱から非常に高い熱まで)に分類しました。
次に、各熱レベルからランダムに250のイベントを選択し、1000のイベントを合計し、評価データセットを構築しました。
評価過程において, 各種大規模言語モデルを用いて, 事象熱レベル予測の精度を2つのシナリオで評価した。
その結果、GPT-4oとDeepseekV2は、それぞれ41.4%と41.5%の予測精度を達成した。
全体的な予測精度は比較的低いが、低熱(レベル1)イベントの場合、これら2つのモデルの予測精度はそれぞれ73.6%と70.4%に達したことに注意する必要がある。
さらに、予測精度はレベル1からレベル4への下降傾向を示し、実際のデータセット内の熱レベルの不均一な分布と相関する。
これは、より堅牢なデータセットにより、大きな言語モデルに基づく公開世論イベントの熱レベル予測が、将来大きな研究可能性を持つことを示唆している。
関連論文リスト
- Machine learning-based probabilistic forecasting of solar irradiance in Chile [0.7067443325368975]
本研究はチリの第三地域及び第四地域における太陽放射の確率論的予測について検討する。
ニューラルネットワークを用いた後処理手法を提案し、8員のアンサンブル予測を改善した。
全ての予測は30か所の観測結果に対して評価され、後処理の予測技術は生のWRFアンサンブルと比較される。
論文 参考訳(メタデータ) (2024-11-17T13:22:05Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - Large Language Model Prediction Capabilities: Evidence from a Real-World
Forecasting Tournament [2.900810893770134]
我々は,OpenAIの最先端の大規模言語モデルであるGPT-4を,Metaculusプラットフォーム上で開催される3ヶ月の予測トーナメントに登録する。
GPT-4の確率予測は人混みの中央値よりもかなり精度が低いことを示す。
この過小評価の潜在的な説明は、現実の予測トーナメントでは、真の答えが予測された時点で真に未知であるということである。
論文 参考訳(メタデータ) (2023-10-17T17:58:17Z) - FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond
10 Days Lead [93.67314652898547]
人工知能(AI)に基づく高度データ駆動型中距離気象予報システムFengWuについて紹介する。
FengWuは大気力学を正確に再現し、0.25度緯度で37の垂直レベルで将来の陸と大気の状態を予測することができる。
その結果、FengWuは予測能力を大幅に向上させ、熟練した中距離気象予報を10.75日間のリードまで拡張できることがわかった。
論文 参考訳(メタデータ) (2023-04-06T09:16:39Z) - GraphCast: Learning skillful medium-range global weather forecasting [107.40054095223779]
我々は、再分析データから直接トレーニングできる「GraphCast」と呼ばれる機械学習ベースの手法を導入する。
全世界で10日以上、0.25度で、数百の気象変動を1分以内で予測する。
我々は,GraphCastが1380の検証対象の90%において,最も正確な運用決定システムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-24T18:15:39Z) - Accurate Long-term Air Temperature Prediction with a Fusion of
Artificial Intelligence and Data Reduction Techniques [7.831043335576775]
8月の第1および第2四半期の平均気温の予測は,前月の入力データを用いて検討した。
この実験は、パリとコルドバの3つの提案されたAIフレームワークにおいて、非常に優れた予測スキルを示している。
論文 参考訳(メタデータ) (2022-09-29T15:36:01Z) - Strict baselines for Covid-19 forecasting and ML perspective for USA and
Russia [105.54048699217668]
Covid-19は、2年間にわたって蓄積されたデータセットを収集し、予測分析に使用できるようにする。
本研究は、米国とロシアの2カ国の地域データに基づいて、Covid-19の拡散のダイナミクスを予測するための様々な種類の方法に関する一貫した研究結果である。
論文 参考訳(メタデータ) (2022-07-15T18:21:36Z) - Forecasting Future World Events with Neural Networks [68.43460909545063]
Autocastは数千の予測質問と付随するニュースコーパスを含むデータセットである。
ニュースコーパスは日付によって整理され、人間が過去の予測を行った条件を正確にシミュレートすることができる。
予測タスクで言語モデルをテストし、パフォーマンスが人間専門家のベースラインよりはるかに低いことを確認します。
論文 参考訳(メタデータ) (2022-06-30T17:59:14Z) - Backtesting the predictability of COVID-19 [0.0]
我々は,2020年1月22日から6月22日までの253地域でのCOVID-19感染の歴史的データを用いている。
パンデミックの初期段階では予測誤差が著しく高く、データ不足によるものである。
いずれにせよ国が示すような確認ケースが多ければ多いほど、将来の確認ケースを予想するエラーは少なくなる。
論文 参考訳(メタデータ) (2020-07-22T13:18:00Z) - A generative adversarial network approach to (ensemble) weather
prediction [91.3755431537592]
本研究では,500hPaの圧力レベル,2m温度,24時間の総降水量を予測するために,条件付き深部畳み込み生成対向ネットワークを用いた。
提案されたモデルは、2019年に関連する気象分野を予測することを目的として、2015年から2018年までの4年間のERA5の再分析データに基づいて訓練されている。
論文 参考訳(メタデータ) (2020-06-13T20:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。