論文の概要: BeamVQ: Beam Search with Vector Quantization to Mitigate Data Scarcity in Physical Spatiotemporal Forecasting
- arxiv url: http://arxiv.org/abs/2502.18925v1
- Date: Wed, 26 Feb 2025 08:27:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 15:24:46.427379
- Title: BeamVQ: Beam Search with Vector Quantization to Mitigate Data Scarcity in Physical Spatiotemporal Forecasting
- Title(参考訳): BeamVQ:物理時空間予測におけるデータスカシティ低減のためのベクトル量子化を用いたビームサーチ
- Authors: Weiyan Wang, Xingjian Shi, Ruiqi Shu, Yuan Gao, Rui Ray Chen, Kun Wang, Fan Xu, Jinbao Xue, Shuaipeng Li, Yangyu Tao, Di Wang, Hao Wu, Xiaomeng Huang,
- Abstract要約: 本稿では,新たな自己集合戦略で反復的自己学習を実現するための新しい確率的枠組みを提案する。
BeamVQは、予測MSE(最大39%)を継続的に削減し、極端なイベントの検出を強化し、データの不足を処理する効果を証明している。
- 参考スコア(独自算出の注目度): 24.61258747141722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In practice, physical spatiotemporal forecasting can suffer from data scarcity, because collecting large-scale data is non-trivial, especially for extreme events. Hence, we propose \method{}, a novel probabilistic framework to realize iterative self-training with new self-ensemble strategies, achieving better physical consistency and generalization on extreme events. Following any base forecasting model, we can encode its deterministic outputs into a latent space and retrieve multiple codebook entries to generate probabilistic outputs. Then BeamVQ extends the beam search from discrete spaces to the continuous state spaces in this field. We can further employ domain-specific metrics (e.g., Critical Success Index for extreme events) to filter out the top-k candidates and develop the new self-ensemble strategy by combining the high-quality candidates. The self-ensemble can not only improve the inference quality and robustness but also iteratively augment the training datasets during continuous self-training. Consequently, BeamVQ realizes the exploration of rare but critical phenomena beyond the original dataset. Comprehensive experiments on different benchmarks and backbones show that BeamVQ consistently reduces forecasting MSE (up to 39%), enhancing extreme events detection and proving its effectiveness in handling data scarcity.
- Abstract(参考訳): 実際には、物理的時空間予測はデータ不足に悩まされることがある。
そこで本稿では,新たな自己アンサンブル戦略による反復的自己学習を実現するための新しい確率的フレームワークである 'method{} を提案する。
基本予測モデルに従うと、決定論的出力を潜在空間にエンコードし、複数のコードブックエントリを検索して確率的出力を生成する。
その後、ビームVQは離散空間からこの場の連続状態空間へのビームサーチを拡張する。
ドメイン固有の指標(例えば、極端な出来事の臨界成功指標)を使って、トップk候補をフィルタリングし、高品質な候補を組み合わせることで、新たな自己組織化戦略を開発することができます。
自己アンサンブルは、推論品質と堅牢性を改善するだけでなく、継続的な自己学習中にトレーニングデータセットを反復的に増強する。
その結果、BeamVQは、元のデータセットを超えた稀だが重要な現象の探索を実現する。
異なるベンチマークとバックボーンに関する総合的な実験により、BeamVQは予測MSE(最大39%)を一貫して削減し、極端なイベント検出を強化し、データの不足を処理する上での有効性を証明している。
関連論文リスト
- Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [0.0]
ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文 参考訳(メタデータ) (2025-04-17T17:24:50Z) - Unified Uncertainty-Aware Diffusion for Multi-Agent Trajectory Modeling [13.993231805213354]
U2Diff(英語版)は、軌道の完備化を扱うために設計された、テキストを融合した拡散モデルである。
また、後処理にランクニューラルネットワークを導入し、生成されたモード毎にtextbferror の確率推定を可能にする。
本手法は,4つの挑戦的スポーツデータセットの軌跡完了と予測において,最先端のソリューションよりも優れる。
論文 参考訳(メタデータ) (2025-03-24T11:46:58Z) - Subsampling Graphs with GNN Performance Guarantees [34.32848091746629]
グラフデータセットに対する新しいサブサンプリング手法を提案する。
サブサンプルデータ上でのGNNのトレーニングは、完全なデータセットでのトレーニングと比較して、損失のバウンド増加をもたらすことを証明している。
論文 参考訳(メタデータ) (2025-02-23T20:21:16Z) - Towards Data-Efficient Pretraining for Atomic Property Prediction [51.660835328611626]
タスク関連データセットでの事前トレーニングは、大規模な事前トレーニングと一致するか、あるいは超える可能性があることを示す。
本稿では,コンピュータビジョンのFr'echet Inception Distanceにインスパイアされた,化学類似度指数(CSI)を紹介する。
論文 参考訳(メタデータ) (2025-02-16T11:46:23Z) - CleanSurvival: Automated data preprocessing for time-to-event models using reinforcement learning [0.0]
データ前処理は、機械学習の重要かつ頻繁に無視される側面である。
CleanSurvivalは、プレプロセスパイプラインを最適化するための強化学習ベースのソリューションである。
連続的および分類的変数を処理し、Q-learningを使用して、データ計算、外れ値検出、特徴抽出のどの組み合わせが最適なパフォーマンスを達成するかを選択できる。
論文 参考訳(メタデータ) (2025-02-06T10:33:37Z) - Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3299088915999295]
BayesNFは、階層的ベイズ推定と高容量推定のためのディープニューラルネットワークアーキテクチャを統合し、堅牢な予測の不確実性を実現する。
BayesNFは、数万の計測値を含む気候および公衆衛生データから予測問題を改善する。
論文 参考訳(メタデータ) (2024-03-12T13:47:50Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Continuous-time convolutions model of event sequences [46.3471121117337]
イベントシーケンスは不均一でスパースであり、従来のモデルは不適当である。
我々は、時間とともに一様でない事象の発生を処理するために設計された効率的な畳み込みニューラルネットワークに基づくCOTICを提案する。
COTICは、次のイベント時間とタイプを予測する際に既存のモデルよりも優れており、最も近いライバルの3.714と比較して平均1.5のランクに達している。
論文 参考訳(メタデータ) (2023-02-13T10:34:51Z) - SEPT: Towards Scalable and Efficient Visual Pre-Training [11.345844145289524]
自己教師付き事前トレーニングは、ダウンストリームタスクのパフォーマンスを改善するために大規模なラベルなしデータを活用する大きな可能性を示している。
タスク固有の自己教師型事前学習フレームワークを構築し,対象タスクに類似した分布を持つ未ラベルサンプルの事前学習が,大幅な性能向上をもたらすという単純な仮説に基づいて構築する。
論文 参考訳(メタデータ) (2022-12-11T11:02:11Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。