論文の概要: Causal-StoNet: Causal Inference for High-Dimensional Complex Data
- arxiv url: http://arxiv.org/abs/2403.18994v1
- Date: Wed, 27 Mar 2024 20:27:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 18:01:50.993352
- Title: Causal-StoNet: Causal Inference for High-Dimensional Complex Data
- Title(参考訳): Causal-StoNet:高次元複素データに対する因果推論
- Authors: Yaxin Fang, Faming Liang,
- Abstract要約: 本稿では,高次元複素データを扱うための新しい因果推論手法を提案する。
これは、疎いディープラーニング理論やニューラルネットワークなど、ディープラーニング技術に基づいている。
提案手法は、データセットに欠落した値が存在する場合にも使用できる。
- 参考スコア(独自算出の注目度): 7.648784748888187
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the advancement of data science, the collection of increasingly complex datasets has become commonplace. In such datasets, the data dimension can be extremely high, and the underlying data generation process can be unknown and highly nonlinear. As a result, the task of making causal inference with high-dimensional complex data has become a fundamental problem in many disciplines, such as medicine, econometrics, and social science. However, the existing methods for causal inference are frequently developed under the assumption that the data dimension is low or that the underlying data generation process is linear or approximately linear. To address these challenges, this paper proposes a novel causal inference approach for dealing with high-dimensional complex data. The proposed approach is based on deep learning techniques, including sparse deep learning theory and stochastic neural networks, that have been developed in recent literature. By using these techniques, the proposed approach can address both the high dimensionality and unknown data generation process in a coherent way. Furthermore, the proposed approach can also be used when missing values are present in the datasets. Extensive numerical studies indicate that the proposed approach outperforms existing ones.
- Abstract(参考訳): データサイエンスの進歩により、ますます複雑なデータセットの収集が一般的になっている。
このようなデータセットでは、データ次元は非常に高く、基礎となるデータ生成プロセスは未知であり、非常に非線形である。
その結果,高次元複雑データを用いた因果推論の課題は,医学,計量学,社会科学など,多くの分野において根本的な問題となっている。
しかし,既存の因果推論手法は,データ次元が低かったり,基礎となるデータ生成プロセスが線形であったり,概ね線形であったりする前提のもとに,しばしば開発される。
これらの課題に対処するために,高次元複素データを扱うための新しい因果推論手法を提案する。
提案手法は,近年研究されている疎深層学習理論や確率的ニューラルネットワークなどの深層学習技術に基づく。
これらの手法を用いることで、提案手法は高次元と未知のデータ生成プロセスの両方をコヒーレントな方法で扱うことができる。
さらに、データセットに欠落した値が存在する場合にも、提案手法が使用できる。
大規模な数値研究は、提案手法が既存の手法より優れていることを示唆している。
関連論文リスト
- Simultaneous Dimensionality Reduction for Extracting Useful Representations of Large Empirical Multimodal Datasets [0.0]
我々は,高次元データから低次元記述を得る手段として,次元減少の科学に焦点をあてる。
我々は,システム内の複雑な相互作用や高次元力学系など,従来の仮定に反する実世界のデータによって引き起こされる課題に対処する。
論文 参考訳(メタデータ) (2024-10-23T21:27:40Z) - A Survey on Data Synthesis and Augmentation for Large Language Models [35.59526251210408]
本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。
これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文 参考訳(メタデータ) (2024-10-16T16:12:39Z) - A Comprehensive Survey on Data Augmentation [55.355273602421384]
データ拡張(Data augmentation)は、既存のデータサンプルを操作することによって高品質な人工データを生成する技術である。
既存の文献調査では、特定のモダリティデータにのみ焦点が当てられている。
本稿では,異なる共通データモダリティのためのデータ拡張技術を含む,より啓蒙的な分類法を提案する。
論文 参考訳(メタデータ) (2024-05-15T11:58:08Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - TS-CausalNN: Learning Temporal Causal Relations from Non-linear Non-stationary Time Series Data [0.42156176975445486]
本稿では,時系列因果ニューラルネットワーク(TS-Causal Neural Network,TS-CausalNN)を提案する。
単純な並列設計に加えて、提案モデルの利点は、データの非定常性と非線形性を自然に扱うことである。
論文 参考訳(メタデータ) (2024-04-01T20:33:29Z) - A spectrum of physics-informed Gaussian processes for regression in
engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。
本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文 参考訳(メタデータ) (2023-09-19T14:39:03Z) - Boosting Synthetic Data Generation with Effective Nonlinear Causal
Discovery [11.81479419498206]
ソフトウェアテスト、データプライバシ、不均衡学習、人工知能の説明では、もっともらしいデータサンプルを生成することが不可欠である。
データ生成に広く使用されるアプローチの一般的な前提は、機能の独立性である。
本稿では,変数間の非線形因果関係を発見し,生成時に利用する合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2023-01-18T10:54:06Z) - Dataset Distillation: A Comprehensive Review [76.26276286545284]
データセット蒸留(DD)は、トレーニングされたモデルが元のデータセットでトレーニングされたデータセットに匹敵するパフォーマンスを得るために、合成サンプルを含むはるかに小さなデータセットを導出することを目的としている。
本稿ではDDの最近の進歩とその応用について概説する。
論文 参考訳(メタデータ) (2023-01-17T17:03:28Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。