論文の概要: Causal Theories and Structural Data Representations for Improving
Out-of-Distribution Classification
- arxiv url: http://arxiv.org/abs/2309.10211v1
- Date: Mon, 18 Sep 2023 23:49:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 17:09:01.957419
- Title: Causal Theories and Structural Data Representations for Improving
Out-of-Distribution Classification
- Title(参考訳): 分断分類を改善する因果理論と構造データ表現
- Authors: Donald Martin, Jr. and David Kinney
- Abstract要約: 我々は、複雑な分類タスクのためにニューラルネットワークをトレーニングする際のデータの表現を導くために、人間中心因果理論をどのように展開するかを検討する。
本研究では,疫病発生過程における構造的因果的特徴を明示するデータ表現を用いたニューラルネットワークのトレーニングにより,アウト・オブ・ディストリビューションの一般化性能が向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider how human-centered causal theories and tools from the dynamical
systems literature can be deployed to guide the representation of data when
training neural networks for complex classification tasks. Specifically, we use
simulated data to show that training a neural network with a data
representation that makes explicit the invariant structural causal features of
the data generating process of an epidemic system improves out-of-distribution
(OOD) generalization performance on a classification task as compared to a more
naive approach to data representation. We take these results to demonstrate
that using human-generated causal knowledge to reduce the epistemic uncertainty
of ML developers can lead to more well-specified ML pipelines. This, in turn,
points to the utility of a dynamical systems approach to the broader effort
aimed at improving the robustness and safety of machine learning systems via
improved ML system development practices.
- Abstract(参考訳): 複雑な分類タスクのためにニューラルネットワークをトレーニングする際に、人間の中心にある因果理論や動的システムからのツールがどのようにしてデータの表現を導くかを考察する。
具体的には,シミュレーションデータを用いて,パンデミックシステムのデータ生成過程の不変構造的因果特性を明示するデータ表現を用いたニューラルネットワークのトレーニングにより,データ表現に対するより自然なアプローチと比較して,分類タスクにおけるout-of-distribution(ood)一般化性能が向上することを示す。
これらの結果から,人為的な因果的知識を用いて,ML開発者の先天的不確実性を低減し,より明確に定義されたMLパイプラインを実現できることを示す。
これは、mlシステム開発プラクティスの改善を通じて、機械学習システムの堅牢性と安全性を改善することを目的とした、より広範な取り組みへの動的システムアプローチの有用性を示している。
関連論文リスト
- Machine learning for structural design models of continuous beam systems via influence zones [3.284878354988896]
この研究は、逆問題の観点から連続ビームシステムのための機械学習構造設計モデルを開発する。
本研究の目的は,任意のシステムサイズを持つ連続ビームシステムの断面積要求を予測できる非定常構造設計モデルを概念化することである。
論文 参考訳(メタデータ) (2024-03-14T14:53:18Z) - Neural Harmonium: An Interpretable Deep Structure for Nonlinear Dynamic
System Identification with Application to Audio Processing [4.599180419117645]
解釈可能性(Interpretability)は、モデルを一般化し、その限界を明らかにする能力を理解するのに役立ちます。
本稿では,動的システムモデリングのための因果解釈可能な深部構造を提案する。
提案モデルは,時間周波数領域におけるシステムモデリングによる調和解析を利用する。
論文 参考訳(メタデータ) (2023-10-10T21:32:15Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文 参考訳(メタデータ) (2022-03-29T21:00:39Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Soft Sensing Model Visualization: Fine-tuning Neural Network from What
Model Learned [5.182947614447375]
データ駆動型ソフトセンシングモデリングは、ウエハプロセスの診断においてより普及している。
深層学習は,高非線形・動的時系列データに有望な性能を有するソフトセンシングシステムで活用されている。
本稿では,高度不均衡データセットを用いた欠陥ウェハ検出のための深層学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-12T23:32:06Z) - Using scientific machine learning for experimental bifurcation analysis
of dynamic systems [2.204918347869259]
本研究は、極限サイクルを持つ物理非線形力学系に対する普遍微分方程式(UDE)モデルの訓練に焦点をあてる。
数値シミュレーションによりトレーニングデータを生成する例を考察するとともに,提案するモデリング概念を物理実験に適用する。
ニューラルネットワークとガウス過程の両方を、力学モデルと共に普遍近似器として使用し、UDEモデリングアプローチの正確性と堅牢性を批判的に評価する。
論文 参考訳(メタデータ) (2021-10-22T15:43:03Z) - Model discovery in the sparse sampling regime [0.0]
深層学習が部分微分方程式のモデル発見をいかに改善できるかを示す。
その結果、ディープラーニングに基づくモデル発見は、基礎となる方程式を復元することができる。
我々は合成集合と実験集合の両方について主張する。
論文 参考訳(メタデータ) (2021-05-02T06:27:05Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。