論文の概要: Temporal Generalization: A Reality Check
- arxiv url: http://arxiv.org/abs/2509.23487v1
- Date: Sat, 27 Sep 2025 20:20:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.257322
- Title: Temporal Generalization: A Reality Check
- Title(参考訳): 時間的一般化: 現実チェック
- Authors: Divyam Madaan, Sumit Chopra, Kyunghyun Cho,
- Abstract要約: 本研究では,過去のデータにのみ依存する場合に,モデルがそのような一般化を実現するための条件と条件について検討する。
本稿では,言語モデリング,ニュース要約,ニュースタグ予測,学術論文分類,衛星画像に基づく土地利用分類など,多様な時間的タスクのセットについて,これらのカテゴリ内のいくつかの手法をベンチマークする。
実験の結果,評価された手法のいずれも,最新のモデルパラメータをすべてのシナリオで使用した場合の単純なベースラインを一貫して上回りません。
- 参考スコア(独自算出の注目度): 43.81891375838308
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine learning (ML) models often struggle to maintain performance under distribution shifts, leading to inaccurate predictions on unseen future data. In this work, we investigate whether and under what conditions models can achieve such a generalization when relying solely on past data. We explore two primary approaches: convex combinations of past model parameters (\emph{parameter interpolation}) and explicit extrapolation beyond the convex hull of past parameters (\emph{parameter extrapolation}). We benchmark several methods within these categories on a diverse set of temporal tasks, including language modeling, news summarization, news tag prediction, academic paper categorization, satellite image-based land use classification over time, and historical yearbook photo gender prediction. Our empirical findings show that none of the evaluated methods consistently outperforms the simple baseline of using the latest available model parameters in all scenarios. In the absence of access to future data or robust assumptions about the underlying data-generating process, these results underscore the inherent difficulties of generalizing and extrapolating to future data and warrant caution when evaluating claims of such generalization.
- Abstract(参考訳): 機械学習(ML)モデルは、分散シフト下でのパフォーマンスを維持するのに苦労することが多い。
本研究では,過去のデータにのみ依存する場合に,モデルがそのような一般化を実現するための条件と条件について検討する。
本稿では, 過去のモデルパラメータの凸結合 (\emph{parameter interpolation}) と, 過去のパラメータの凸包を超えた明示的外挿 (\emph{parameter extrapolation}) の2つの主要なアプローチについて検討する。
本稿では,言語モデリング,ニュース要約,ニュースタグ予測,学術論文分類,衛星画像に基づく土地利用分類,歴史年鑑写真ジェンダー予測など,多様な時間的課題のセットについて,これらのカテゴリ内のいくつかの手法をベンチマークする。
実験の結果,評価された手法のいずれも,最新のモデルパラメータをすべてのシナリオで使用した場合の単純なベースラインを一貫して上回りません。
これらの結果は、将来のデータへのアクセスや、基礎となるデータ生成プロセスに関する堅固な仮定が欠如しているため、そのような一般化の主張を評価する際に、将来のデータへの一般化と外挿の固有の困難さを浮き彫りにしている。
関連論文リスト
- Deep Non-Parametric Time Series Forecaster [19.800783133682955]
提案手法は, 予測分布のパラメトリック形式を仮定せず, 学習可能な戦略に従って実験分布からサンプリングして予測を生成する。
提案手法のグローバルバージョンを開発し,複数の時系列にまたがる情報を活用することで,サンプリング戦略を自動的に学習する。
論文 参考訳(メタデータ) (2023-12-22T12:46:30Z) - Can LMs Generalize to Future Data? An Empirical Analysis on Text
Summarization [50.20034493626049]
最近の学習済み言語モデル(PLM)は、既存の抽象的な要約データセットにおいて有望な結果をもたらす。
既存の要約ベンチマークは、標準の事前学習コーパスと微調整データセットと時間的に重複する。
要約モデルに格納されたパラメトリック知識は、将来のデータに対する生成した要約の忠実度に大きく影響することを示す。
論文 参考訳(メタデータ) (2023-05-03T08:08:07Z) - Mixed moving average field guided learning for spatio-temporal data [0.0]
我々は,新しいベイズ時間埋め込みと理論誘導型機械学習アプローチを定義し,アンサンブル予測を行う。
リプシッツ予測器を用いて、バッチ学習環境における固定時間および任意の時間PACを決定する。
次に、線形予測器とOrnstein-Uhlenbeckプロセスからシミュレーションしたデータセットを用いて学習手法の性能を検証した。
論文 参考訳(メタデータ) (2023-01-02T16:11:05Z) - MRCLens: an MRC Dataset Bias Detection Toolkit [82.44296974850639]
MRCLensは,ユーザがフルモデルをトレーニングする前に,バイアスが存在するかどうかを検出するツールキットである。
ツールキットの導入の便宜のために,MDCにおける共通バイアスの分類も提供する。
論文 参考訳(メタデータ) (2022-07-18T21:05:39Z) - Identifying the Context Shift between Test Benchmarks and Production
Data [1.2259552039796024]
データセットベンチマークにおける機械学習モデルの精度と実運用データの間には、パフォーマンスのギャップがある。
分布変化とモデル予測誤差につながる文脈変化を同定する2つの手法を概説する。
本研究は,機械学習モデルに基づく暗黙の仮定を強調するケーススタディを2つ提示する。
論文 参考訳(メタデータ) (2022-07-03T14:54:54Z) - Studying Generalization Through Data Averaging [0.0]
本研究では,異なるデータセットのサンプルに対する差の平均から得られる一般化ギャップと,列車および試験性能について検討する。
我々はSGDノイズの関数として一般化ギャップとモデルトレインとテスト性能の相違についていくつかの側面を予測した。
論文 参考訳(メタデータ) (2022-06-28T00:03:40Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。