論文の概要: Deep learning and the rate of approximation by flows
- arxiv url: http://arxiv.org/abs/2603.15363v1
- Date: Mon, 16 Mar 2026 14:39:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:58.492798
- Title: Deep learning and the rate of approximation by flows
- Title(参考訳): 流れによる深層学習と近似の速度
- Authors: Jingpu Cheng, Qianxiao Li, Ting Lin, Zuowei Shen,
- Abstract要約: 連続力学系設定における深部残差ネットワークの近似能力の深さ依存性について検討する。
この最小時間は微分同相写像の部分フィンスラー多様体上の測地距離と同一視できることを示す。
結果から, 深層学習における重要な近似機構, すなわち, 合成や力学による関数の近似は, 線形近似理論と根本的に異なることが示唆された。
- 参考スコア(独自算出の注目度): 28.121009909984163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate the dependence of the approximation capacity of deep residual networks on its depth in a continuous dynamical systems setting. This can be formulated as the general problem of quantifying the minimal time-horizon required to approximate a diffeomorphism by flows driven by a given family $\mathcal F$ of vector fields. We show that this minimal time can be identified as a geodesic distance on a sub-Finsler manifold of diffeomorphisms, where the local geometry is characterised by a variational principle involving $\mathcal F$. This connects the learning efficiency of target relationships to their compatibility with the learning architectural choice. Further, the results suggest that the key approximation mechanism in deep learning, namely the approximation of functions by composition or dynamics, differs in a fundamental way from linear approximation theory, where linear spaces and norm-based rate estimates are replaced by manifolds and geodesic distances.
- Abstract(参考訳): 連続力学系設定における深部残差ネットワークの近似能力の深さ依存性について検討する。
これは、与えられた族$\mathcal F$ のベクトル場によって駆動されるフローによって微分同相を近似するのに必要となる最小時間ホライゾンを定量化する一般的な問題として定式化することができる。
この最小時間は微分同相写像の部分フィンスラー多様体上の測地線距離と同一視でき、そこで局所幾何学は$\mathcal F$を含む変分原理によって特徴づけられる。
これは、ターゲット関係の学習効率と学習アーキテクチャの選択との互換性を結びつける。
さらに, 線形空間とノルムに基づく速度推定を多様体と測地線距離に置き換える線形近似理論とは, 合成や力学による関数の近似という, 深層学習における鍵近似機構が根本的に異なることが示唆された。
関連論文リスト
- GeoMM: On Geodesic Perspective for Multi-modal Learning [55.41612200877861]
本稿では,マルチモーダル学習における測地線距離を新しい距離測定基準として導入する。
我々のアプローチは、現在のマルチモーダル学習に測地距離を適用するための包括的な戦略を取り入れている。
論文 参考訳(メタデータ) (2025-05-16T13:12:41Z) - Approximating Latent Manifolds in Neural Networks via Vanishing Ideals [20.464009622419766]
我々は, 無限イデアルがディープネットワークの潜在多様体をいかに特徴付けるかを示すことによって, 多様体学習と計算代数学の関連性を確立する。
本稿では,中間層で事前学習されたネットワークを切断し,消滅するイデアルのジェネレータを介して各クラス多様体を近似するニューラルアーキテクチャを提案する。
得られたモデルは、トレーニング済みのベースラインよりも著しく少ないが、同等の精度を維持し、高いスループットを実現し、パラメータが少ない。
論文 参考訳(メタデータ) (2025-02-20T21:23:02Z) - Learning Discretized Neural Networks under Ricci Flow [48.47315844022283]
低精度重みとアクティベーションからなる離散ニューラルネットワーク(DNN)について検討する。
DNNは、訓練中に微分不可能な離散関数のために無限あるいはゼロの勾配に悩まされる。
論文 参考訳(メタデータ) (2023-02-07T10:51:53Z) - Structured Optimal Variational Inference for Dynamic Latent Space Models [16.531262817315696]
動的ネットワークの潜在空間モデルについて検討し、その目的は、ペアの内積と潜在位置のインターセプトを推定することである。
後部推論と計算スケーラビリティのバランスをとるために、構造的平均場変動推論フレームワークを検討する。
論文 参考訳(メタデータ) (2022-09-29T22:10:42Z) - Semi-supervised Learning of Partial Differential Operators and Dynamical
Flows [68.77595310155365]
本稿では,超ネットワーク解法とフーリエニューラル演算子アーキテクチャを組み合わせた新しい手法を提案する。
本手法は, 1次元, 2次元, 3次元の非線形流体を含む様々な時間発展PDEを用いて実験を行った。
その結果、新しい手法は、監督点の時点における学習精度を向上し、任意の中間時間にその解を補間できることを示した。
論文 参考訳(メタデータ) (2022-07-28T19:59:14Z) - Deep neural networks on diffeomorphism groups for optimal shape
reparameterization [44.99833362998488]
基本微分同相の合成による配向保存微分同相の近似を構成するアルゴリズムを提案する。
このアルゴリズムはPyTorchを用いて実装され、非パラメータ化された曲線と曲面の両方に適用できる。
論文 参考訳(メタデータ) (2022-07-22T15:25:59Z) - Mean-field Variational Inference via Wasserstein Gradient Flow [8.05603983337769]
平均場(MF)近似のような変分推論は、効率的な計算のためにある種の共役構造を必要とする。
We introduced a general computer framework to implement MFal inference for Bayesian model with or without latent variables, using the Wasserstein gradient flow (WGF)。
本稿では,ニューラルネットワークを用いた制約のない関数近似手法を提案する。
論文 参考訳(メタデータ) (2022-07-17T04:05:32Z) - Semi-Discrete Normalizing Flows through Differentiable Tessellation [31.474420819149724]
本稿では,連続空間上の量子化境界を正確に評価し,テッセルレーションに基づく手法を提案する。
これは、微分可能なボロノイ・テッセルレーションによってパラメータ化された凸多面体上の正規化フローを構築することによって行われる。
我々は,データモダリティの多様さにまたがる既存手法の改善を示すとともに,Voronoi混合をベースラインモデルに組み込むことで,大きな利益を得ることができることを見出した。
論文 参考訳(メタデータ) (2022-03-14T03:06:31Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - DiffPD: Differentiable Projective Dynamics with Contact [65.88720481593118]
DiffPDは、暗黙の時間積分を持つ効率的な微分可能なソフトボディシミュレータである。
我々はDiffPDの性能を評価し,様々な応用における標準ニュートン法と比較して4~19倍のスピードアップを観測した。
論文 参考訳(メタデータ) (2021-01-15T00:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。