論文の概要: Information theory and discriminative sampling for model discovery
- arxiv url: http://arxiv.org/abs/2512.16000v1
- Date: Wed, 17 Dec 2025 22:08:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.839915
- Title: Information theory and discriminative sampling for model discovery
- Title(参考訳): モデル発見のための情報理論と識別的サンプリング
- Authors: Yuxuan Bao, J. Nathan Kutz,
- Abstract要約: 我々は非線形力学(SINDy)をエミュレートするデータ駆動型フレームワークにおいて、Fisher Information Matrix(FIM)を活用する。
我々は、単一軌道と複数の初期条件の両方において、カオス系および非カオス系の情報パターンを可視化する。
- 参考スコア(独自算出の注目度): 2.47593085771929
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fisher information and Shannon entropy are fundamental tools for understanding and analyzing dynamical systems from complementary perspectives. They can characterize unknown parameters by quantifying the information contained in variables, or measure how different initial trajectories or temporal segments of a trajectory contribute to learning or inferring system dynamics. In this work, we leverage the Fisher Information Matrix (FIM) within the data-driven framework of {\em sparse identification of nonlinear dynamics} (SINDy). We visualize information patterns in chaotic and non-chaotic systems for both single trajectories and multiple initial conditions, demonstrating how information-based analysis can improve sampling efficiency and enhance model performance by prioritizing more informative data. The benefits of statistical bagging are further elucidated through spectral analysis of the FIM. We also illustrate how Fisher information and entropy metrics can promote data efficiency in three scenarios: when only a single trajectory is available, when a tunable control parameter exists, and when multiple trajectories can be freely initialized. As data-driven model discovery continues to gain prominence, principled sampling strategies guided by quantifiable information metrics offer a powerful approach for improving learning efficiency and reducing data requirements.
- Abstract(参考訳): フィッシャー情報とシャノンエントロピーは、相補的な観点から力学系を理解し解析するための基本的なツールである。
変数に含まれる情報を定量化することで未知のパラメータを特徴づけたり、初期の軌跡や時間セグメントの違いがシステムのダイナミクスの学習や推論にどのように貢献するかを測定することができる。
本研究では,非線形力学(SINDy)のスパース同定におけるデータ駆動型フレームワークとして,Fisher Information Matrix (FIM) を利用する。
単一軌道と複数の初期条件のカオス的および非カオス的なシステムにおける情報パターンを可視化し、情報に基づく解析がサンプリング効率を向上し、より情報性の高いデータを優先順位付けすることでモデル性能を向上させる方法を示す。
統計的バッジの利点は、FIMのスペクトル分析によってさらに解明される。
また、フィッシャー情報とエントロピーメトリクスがデータ効率を3つのシナリオで促進する方法について説明する。1つの軌道のみが利用可能である場合、調整可能な制御パラメータが存在する場合、複数の軌道を自由に初期化できる場合。
データ駆動型モデル発見が普及し続けている中、定量化情報メトリクスによって導かれる原則的なサンプリング戦略は、学習効率の向上とデータ要求の削減に強力なアプローチを提供する。
関連論文リスト
- Flexible Gravitational-Wave Parameter Estimation with Transformers [73.44614054040267]
本稿では,予測時間における多様な解析設定への適応を可能にする,フレキシブルトランスフォーマーベースのアーキテクチャをトレーニング戦略と組み合わせて導入する。
我々は、Dingo-T1と呼ばれる単一のフレキシブルモデルが、第3のLIGO-Virgo-KAGRA観測ランから48の重力波イベントを解析できることを実証した。
論文 参考訳(メタデータ) (2025-12-02T17:49:08Z) - Fisher information flow in artificial neural networks [3.0053910105391264]
本稿では,パラメータ推定タスクを実行するANNを通して,フィッシャー情報の流れをモニタリングする手法を提案する。
最適な推定性能はフィッシャー情報の最大伝送量に対応することを示す。
これにより、独立したバリデーションデータセットの必要性を解消するネットワークトレーニングのためのモデルフリーの停止基準が提供される。
論文 参考訳(メタデータ) (2025-09-02T15:17:42Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Dynamic Loss-Based Sample Reweighting for Improved Large Language Model Pretraining [55.262510814326035]
既存のリウェイト戦略は主にグループレベルのデータの重要性に焦点を当てている。
動的・インスタンスレベルのデータ再重み付けのための新しいアルゴリズムを提案する。
当社のフレームワークでは,冗長データや非形式データを優先的に再重み付けする戦略を考案することが可能です。
論文 参考訳(メタデータ) (2025-02-10T17:57:15Z) - Dynamic Importance Learning using Fisher Information Matrix (FIM) for Nonlinear Dynamic Mapping [0.2455468619225742]
本研究はブラックボックスモデルにおける妥当性スコアを動的に決定するための方法論を提案する。
提案手法は、勾配に基づくフレームワークを用いて、分散駆動機能の重要性を明らかにする。
このアプローチの実用性は、工業的なpH中和プロセスに適用することで示される。
論文 参考訳(メタデータ) (2024-06-08T08:12:41Z) - InVAErt networks: a data-driven framework for model synthesis and
identifiability analysis [0.0]
inVAErtは物理システムのデータ駆動分析と合成のためのフレームワークである。
これは、前方および逆写像を表す決定論的デコーダ、系の出力の確率分布を捉える正規化フロー、入力と出力の間の単射性の欠如についてコンパクトな潜在表現を学ぶ変分エンコーダを使用する。
論文 参考訳(メタデータ) (2023-07-24T07:58:18Z) - Neural FIM for learning Fisher Information Metrics from point cloud data [71.07939200676199]
我々は、ポイントクラウドデータからフィッシャー情報量(FIM)を計算するためのニューラルFIMを提案する。
本稿では,PHATE可視化手法のパラメータの選択と,IPSCリプログラミングとPBMC(免疫細胞)の2つの単一セルデータセットと,おもちゃデータセットの分岐点とクラスタセンターの埋め込みに関する情報を得る能力について述べる。
論文 参考訳(メタデータ) (2023-06-01T17:36:13Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。