Fugu-MT 論文翻訳(概要): An Investigation of the Weight Space to Monitor the Training Progress of Neural Networks

論文の概要: An Investigation of the Weight Space to Monitor the Training Progress of Neural Networks

arxiv url: http://arxiv.org/abs/2006.10424v2
Date: Wed, 17 Mar 2021 12:11:36 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-19 09:41:06.268114
Title: An Investigation of the Weight Space to Monitor the Training Progress of Neural Networks
Title（参考訳）: ニューラルネットワークの学習経過を監視するための重み空間の検討
Authors: Konstantin Sch\"urholt, Damian Borth
Abstract要約: 重量空間における一意な滑らかな軌道上でモデルが進化し、トレーニングの進捗を追跡できることを示す。モデルトラジェクトリを分離し,トラジェクトリのチェックポイントの順序を復元できることが,DNNモデルバージョニングへの第一歩となる可能性がある。
参考スコア（独自算出の注目度）: 1.7704011486040843
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Safe use of Deep Neural Networks (DNNs) requires careful testing. However, deployed models are often trained further to improve in performance. As rigorous testing and evaluation is expensive, triggers are in need to determine the degree of change of a model. In this paper we investigate the weight space of DNN models for structure that can be exploited to that end. Our results show that DNN models evolve on unique, smooth trajectories in weight space which can be used to track DNN training progress. We hypothesize that curvature and smoothness of the trajectories as well as step length along it may contain information on the state of training as well as potential domain shifts. We show that the model trajectories can be separated and the order of checkpoints on the trajectories recovered, which may serve as a first step towards DNN model versioning.
Abstract（参考訳）: ディープニューラルネットワーク(DNN)の安全な使用には、慎重にテストする必要がある。しかし、デプロイされたモデルはパフォーマンスを改善するためにさらに訓練されることが多い。厳密なテストと評価は高価であるため、トリガーはモデルの変更の度合いを決定する必要がある。本稿では,DNNモデルの重み空間について検討する。以上の結果から, DNNモデルは, DNNトレーニングの進行状況を追跡するために, ウェイト空間における特異な滑らかな軌道上で進化することが示唆された。我々は、軌道の曲率と滑らかさ、それに沿ったステップの長さが、トレーニングの状態や潜在的な領域シフトに関する情報を含むかもしれないと仮定する。モデルトラジェクトリを分離し,トラジェクトリのチェックポイントの順序を復元できることが,DNNモデルバージョニングへの第一歩となる可能性がある。

関連論文リスト

A Self-Ensemble Inspired Approach for Effective Training of Binary-Weight Spiking Neural Networks [66.80058515743468]
トレーニングスパイキングニューラルネットワーク(SNN)とバイナリニューラルネットワーク(BNN)は、差別化不可能なスパイク生成機能のために困難である。本稿では, バックプロパゲーションプロセスの解析を通じて, SNN の力学とBNN との密接な関係を考察する。具体的には、複数のショートカットの構造と知識蒸留に基づくトレーニング技術を活用し、(バイナリウェイト)SNNのトレーニングを改善する。
論文参考訳（メタデータ） (2025-08-18T04:11:06Z)
Synthetic Trajectory Generation Through Convolutional Neural Networks [6.717469146587211]
RTCT(Reversible Trajectory-to-CNN Transformation)を導入する。 RTCTは、軌跡をCNNベースのモデルに適したフォーマットに適合させる。我々は、RNNに基づく軌道GANに対して、その性能を評価する。
論文参考訳（メタデータ） (2024-07-24T02:16:52Z)
Online GNN Evaluation Under Test-time Graph Distribution Shifts [92.4376834462224]
オンラインGNN評価という新たな研究課題は、よく訓練されたGNNが現実世界の未ラベルグラフに一般化する能力について、貴重な洞察を提供することを目的としている。我々は、よく訓練されたGNNモデルのテスト時間一般化誤差を推定するために、LeBeDと呼ばれる効果的な学習行動不一致スコアを開発する。
論文参考訳（メタデータ） (2024-03-15T01:28:08Z)
Control-Theoretic Techniques for Online Adaptation of Deep Neural Networks in Dynamical Systems [0.0]
ディープニューラルネットワーク(DNN)は現在、現代の人工知能、機械学習、データサイエンスの主要なツールである。多くのアプリケーションでは、DNNは教師付き学習や強化学習を通じてオフラインでトレーニングされ、推論のためにオンラインにデプロイされる。制御理論からDNNパラメータをオンラインで更新する手法を提案する。
論文参考訳（メタデータ） (2024-02-01T16:51:11Z)
Towards Robust k-Nearest-Neighbor Machine Translation [72.9252395037097]
近年,k-Nearest-Neighbor Machine Translation (kNN-MT)がNMTの重要な研究方向となっている。その主なアイデアは、NMTモデルを更新することなく翻訳を変更するために、追加のデータストアから有用なキーと値のペアを取得することである。取り出したノイズペアはモデル性能を劇的に低下させる。ノイズの影響を軽減するために,頑健なトレーニングを施した信頼性向上kNN-MTモデルを提案する。
論文参考訳（メタデータ） (2022-10-17T07:43:39Z)
Human Trajectory Prediction via Neural Social Physics [63.62824628085961]
軌道予測は多くの分野において広く研究され、多くのモデルベースおよびモデルフリーな手法が研究されている。ニューラル微分方程式モデルに基づく新しい手法を提案する。我々の新しいモデル(ニューラル社会物理学またはNSP)は、学習可能なパラメータを持つ明示的な物理モデルを使用するディープニューラルネットワークである。
論文参考訳（メタデータ） (2022-07-21T12:11:18Z)
Fault-Aware Design and Training to Enhance DNNs Reliability with Zero-Overhead [67.87678914831477]
ディープニューラルネットワーク(DNN)は、幅広い技術的進歩を可能にする。最近の知見は、過渡的なハードウェア欠陥がモデル予測を劇的に損なう可能性があることを示唆している。本研究では,トレーニングとモデル設計の両面で信頼性の問題に取り組むことを提案する。
論文参考訳（メタデータ） (2022-05-28T13:09:30Z)
Toward Robust Spiking Neural Network Against Adversarial Perturbation [22.56553160359798]
スパイキングニューラルネットワーク(SNN)は、現実の効率クリティカルなアプリケーションにますます多くデプロイされている。研究者はすでに、SNNを敵の例で攻撃できることを実証している。我々の知る限りでは、これはSNNの堅牢なトレーニングに関する最初の分析である。
論文参考訳（メタデータ） (2022-04-12T21:26:49Z)
Testing Feedforward Neural Networks Training Programs [13.249453757295083]
ディープニューラルネットワークの動作の不整合を露呈するテストケースを生成するために、複数のテスト技術が提案されている。これらのテクニックは、トレーニングプログラムがバグフリーで適切に設定されていることを暗黙的に仮定する。本稿では,DNNトレーニングプログラムのエンドツーエンドなプロパティベースのデバッグ手法であるTheDeepCheckerを提案する。
論文参考訳（メタデータ） (2022-04-01T20:49:14Z)
Fully Spiking Variational Autoencoder [66.58310094608002]
スパイキングニューラルネットワーク(SNN)は、超高速で超低エネルギー消費のニューロモルフィックデバイス上で動作することができる。本研究では,SNNを用いた可変オートエンコーダ(VAE)を構築し,画像生成を実現する。
論文参考訳（メタデータ） (2021-09-26T06:10:14Z)
Generating Synthetic Training Data for Deep Learning-Based UAV Trajectory Prediction [11.241614693184323]
本稿では,無人航空機車(UAV)の合成軌道データを生成する手法を提案する。実世界のUAV追跡データセットにおいて,RNNに基づく予測モデルが従来の参照モデルより優れていることを示す。
論文参考訳（メタデータ） (2021-07-01T13:08:31Z)
Modeling from Features: a Mean-field Framework for Over-parameterized Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文参考訳（メタデータ） (2020-07-03T01:37:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。