Fugu-MT 論文翻訳(概要): Hyperparameters in Continual Learning: a Reality Check

論文の概要: Hyperparameters in Continual Learning: a Reality Check

arxiv url: http://arxiv.org/abs/2403.09066v1
Date: Thu, 14 Mar 2024 03:13:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-15 21:57:10.124366
Title: Hyperparameters in Continual Learning: a Reality Check
Title（参考訳）: 連続学習におけるハイパーパラメータ:リアリティチェック
Authors: Sungmin Cha, Kyunghyun Cho,
Abstract要約: ベンチマークデータセットで構築されたCLシナリオ上で、CLアルゴリズムをトレーニングすることは一般的なプラクティスである。本稿では,この評価プロトコルは実用的でなく,CLアルゴリズムのCL能力を効果的に評価することができないことを主張する。
参考スコア（独自算出の注目度）: 53.30082523545212
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Various algorithms for continual learning (CL) have been designed with the goal of effectively alleviating the trade-off between stability and plasticity during the CL process. To achieve this goal, tuning appropriate hyperparameters for each algorithm is essential. As an evaluation protocol, it has been common practice to train a CL algorithm using diverse hyperparameter values on a CL scenario constructed with a benchmark dataset. Subsequently, the best performance attained with the optimal hyperparameter value serves as the criterion for evaluating the CL algorithm. In this paper, we contend that this evaluation protocol is not only impractical but also incapable of effectively assessing the CL capability of a CL algorithm. Returning to the fundamental principles of model evaluation in machine learning, we propose an evaluation protocol that involves Hyperparameter Tuning and Evaluation phases. Those phases consist of different datasets but share the same CL scenario. In the Hyperparameter Tuning phase, each algorithm is iteratively trained with different hyperparameter values to find the optimal hyperparameter values. Subsequently, in the Evaluation phase, the optimal hyperparameter values is directly applied for training each algorithm, and their performance in the Evaluation phase serves as the criterion for evaluating them. Through experiments on CIFAR-100 and ImageNet-100 based on the proposed protocol in class-incremental learning, we not only observed that the existing evaluation method fail to properly assess the CL capability of each algorithm but also observe that some recently proposed state-of-the-art algorithms, which reported superior performance, actually exhibit inferior performance compared to the previous algorithm.
Abstract（参考訳）: CLプロセスにおける安定性と可塑性のトレードオフを効果的に緩和する目的で,連続学習のための様々なアルゴリズムが設計されている。この目的を達成するために、各アルゴリズムに適切なハイパーパラメータをチューニングすることが不可欠である。評価プロトコルとして,ベンチマークデータセットで構築したCLシナリオ上で,多様なハイパーパラメータ値を用いたCLアルゴリズムのトレーニングが一般的である。その後、最適パラメータ値が得られた最高の性能は、CLアルゴリズムを評価するための基準となる。本稿では,この評価プロトコルは実用的でなく,CLアルゴリズムのCL能力を効果的に評価することができないことを主張する。機械学習におけるモデル評価の基本原理に回帰して,ハイパーパラメータチューニングと評価フェーズを含む評価プロトコルを提案する。これらのフェーズは異なるデータセットで構成されるが、同じCLシナリオを共有する。ハイパーパラメータチューニングフェーズでは、各アルゴリズムは最適なハイパーパラメータ値を見つけるために異なるハイパーパラメータ値で反復的に訓練される。その後、評価フェーズでは、各アルゴリズムのトレーニングに最適なハイパーパラメータ値が直接適用され、評価フェーズにおけるその性能が評価の基準となる。 CIFAR-100 と ImageNet-100 の実験を通じて,既存の評価手法が各アルゴリズムのCL能力を適切に評価できないだけでなく,最近提案された最先端のアルゴリズムが,従来のアルゴリズムと比較して性能が劣っていることを観察した。

関連論文リスト

CLoRA: Parameter-Efficient Continual Learning with Low-Rank Adaptation [14.2843647693986]
Low-Rank Adaptation (LoRA)は、クラスインクリメンタルセマンティックセグメンテーションのためのパラメータ効率の高い微調整法である。 CLoRAは、トレーニングのハードウェア要件を大幅に削減し、デプロイ後のリソース制約のある環境でのCLに適している。
論文参考訳（メタデータ） (2025-07-26T09:36:05Z)
ICL-TSVD: Bridging Theory and Practice in Continual Learning with Pre-trained Models [103.45785408116146]
連続学習(CL)は、連続的に提示される複数のタスクを解決できるモデルを訓練することを目的としている。最近のCLアプローチは、ダウンストリームタスクをうまく一般化する大規模な事前学習モデルを活用することで、強力なパフォーマンスを実現している。しかし、これらの手法には理論的保証がなく、予期せぬ失敗をしがちである。私たちは、経験的に強いアプローチを原則化されたフレームワークに統合することで、このギャップを埋めます。
論文参考訳（メタデータ） (2024-10-01T12:58:37Z)
CLAP4CLIP: Continual Learning with Probabilistic Finetuning for Vision-Language Models [23.398619576886375]
継続学習(CL)は、ディープラーニングが学習したものを保持しながら、新しい知識を学ぶのを支援することを目的としている。タスクごとの視覚誘導テキスト機能に対する確率的モデリングフレームワークであるCLAP(Continuous LeArning with Probabilistic Finetuning)を提案する。
論文参考訳（メタデータ） (2024-03-28T04:15:58Z)
Density Distribution-based Learning Framework for Addressing Online Continual Learning Challenges [4.715630709185073]
オンライン連続学習のための密度分布に基づく学習フレームワークを提案する。我々のフレームワークは、より優れた平均精度と時間空間効率を実現する。提案手法は, CL のアプローチにおいて, 有意な差で優れる。
論文参考訳（メタデータ） (2023-11-22T09:21:28Z)
Continual Learning with Dynamic Sparse Training: Exploring Algorithms for Effective Model Updates [13.983410740333788]
連続学習(英: Continual Learning, CL)とは、知的なシステムが、可能な限り計算オーバーヘッドの少ないデータストリームから、逐次的に知識を取得し、保持する能力である。ダイナミックスパーストレーニング(Dynamic Sparse Training, DST)は、これらのスパースネットワークを見つけ、タスクごとに分離する方法である。本論文は,CLパラダイムの下で異なるDST成分の効果を検証した最初の実証的研究である。
論文参考訳（メタデータ） (2023-08-28T18:31:09Z)
Ada-QPacknet -- adaptive pruning with bit width reduction as an efficient continual learning method without forgetting [0.8681331155356999]
この作業では、新しいアーキテクチャベースのアプローチであるAda-QPacknetについて説明する。タスクごとにサブネットワークを抽出するプルーニングが組み込まれている。その結果,提案手法はタスクおよびクラスインクリメンタルシナリオにおいてCL戦略の大部分を上回っていることがわかった。
論文参考訳（メタデータ） (2023-08-14T12:17:11Z)
Optimizing Hyperparameters with Conformal Quantile Regression [7.316604052864345]
本稿では,観測ノイズについて最小限の仮定を行う等化量子レグレッションを活用することを提案する。これは経験的ベンチマークでのHPO収束を早くすることを意味する。
論文参考訳（メタデータ） (2023-05-05T15:33:39Z)
Computationally Budgeted Continual Learning: What Does Matter? [128.0827987414154]
CL (Continuous Learning) は、新しいデータに適応しながら、以前の知識を保存し、分布の異なる入力データのストリーム上でモデルを逐次訓練することを目的としている。現在のCL文献では、以前のデータへのアクセス制限に焦点が当てられているが、トレーニングの計算予算に制約は課されていない。本稿では,この問題を大規模ベンチマークで再検討し,計算制約条件下での従来のCL手法の性能解析を行う。
論文参考訳（メタデータ） (2023-03-20T14:50:27Z)
From MNIST to ImageNet and Back: Benchmarking Continual Curriculum Learning [9.104068727716294]
継続学習(CL)は、機械学習研究で最も有望なトレンドの1つである。 6つの画像データセットから複数の異種タスクを含む2つの新しいCLベンチマークを導入する。さらに、タスクが複雑化と減少の順序で表されるように、ベンチマークを構造化します。
論文参考訳（メタデータ） (2023-03-16T18:11:19Z)
Real-Time Evaluation in Online Continual Learning: A New Hope [104.53052316526546]
計算コストに関して,現在の継続学習(CL)手法を評価した。簡単なベースラインは、この評価の下で最先端のCL法より優れている。これは、既存のCL文献の大部分は、実用的でない特定の種類のストリームに適合していることを驚くほど示唆している。
論文参考訳（メタデータ） (2023-02-02T12:21:10Z)
Do Pre-trained Models Benefit Equally in Continual Learning? [25.959813589169176]
既存の継続学習(CL)の研究は主に、ゼロから訓練されたモデルのアルゴリズムの開発に費やされている。コントリビュートベンチマークのパフォーマンスは高いが、これらのアルゴリズムは現実のシナリオで劇的なパフォーマンス低下を示す。本稿では,CLに対する事前学習の体系的導入を提唱する。
論文参考訳（メタデータ） (2022-10-27T18:03:37Z)
Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-07-19T05:55:02Z)
Using Representation Expressiveness and Learnability to Evaluate Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。 CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。 CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文参考訳（メタデータ） (2022-06-02T19:05:13Z)
The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文参考訳（メタデータ） (2022-01-17T09:09:09Z)
Continual Learning for Recurrent Neural Networks: a Review and Empirical Evaluation [12.27992745065497]
リカレントニューラルネットワークによる連続学習は、受信データが定常的でない多数のアプリケーションへの道を開くことができる。コントリビューションの分類とベンチマークのレビューを提供することで、シーケンシャルデータ処理のためのCLに関する文献を整理します。我々は既存のデータセットに基づくシーケンシャルデータを持つclの新しいベンチマークを2つ提案する。
論文参考訳（メタデータ） (2021-03-12T19:25:28Z)
Phase Retrieval using Expectation Consistent Signal Recovery Algorithm based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文参考訳（メタデータ） (2021-01-12T08:36:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。