論文の概要: The Structurally Complex with Additive Parent Causality (SCARY) Dataset
- arxiv url: http://arxiv.org/abs/2304.14109v1
- Date: Thu, 27 Apr 2023 11:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 13:38:39.541984
- Title: The Structurally Complex with Additive Parent Causality (SCARY) Dataset
- Title(参考訳): 付加的親因果性(scary)データセットを持つ構造的複雑度
- Authors: Jarry Chen, Haytham M.Fayek
- Abstract要約: 因果データセットは因果関係の分野を前進させる上で重要な役割を果たす。
既存のデータセットは、選択バイアス、不信のデータ、コンファウンディングといった現実世界の問題の複雑さを欠いていることが多い。
付加性paRent causality(SCary)を用いた新しい合成因果データセットを提案する。
データセットは40のシナリオで構成され、それぞれが3つの異なるシードで生成され、研究者はデータセットの関連するサブセットを活用することができる。
- 参考スコア(独自算出の注目度): 2.741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal datasets play a critical role in advancing the field of causality.
However, existing datasets often lack the complexity of real-world issues such
as selection bias, unfaithful data, and confounding. To address this gap, we
propose a new synthetic causal dataset, the Structurally Complex with Additive
paRent causalitY (SCARY) dataset, which includes the following features. The
dataset comprises 40 scenarios, each generated with three different seeds,
allowing researchers to leverage relevant subsets of the dataset. Additionally,
we use two different data generation mechanisms for generating the causal
relationship between parents and child nodes, including linear and mixed causal
mechanisms with multiple sub-types. Our dataset generator is inspired by the
Causal Discovery Toolbox and generates only additive models. The dataset has a
Varsortability of 0.5. Our SCARY dataset provides a valuable resource for
researchers to explore causal discovery under more realistic scenarios. The
dataset is available at https://github.com/JayJayc/SCARY.
- Abstract(参考訳): 因果データセットは因果関係の分野を進める上で重要な役割を果たす。
しかし、既存のデータセットは、選択バイアス、不適切なデータ、結合といった現実世界の問題の複雑さを欠いていることが多い。
このギャップに対処するために、以下の特徴を含む新しい合成因果データセット、Structurely Complex with Additive paRent causalitY (SCary) データセットを提案する。
データセットは40のシナリオで構成され、それぞれが3つの異なるシードで生成され、研究者はデータセットの関連するサブセットを活用することができる。
さらに,親と子ノードの因果関係を生成するために,複数のサブタイプと線形および混合因果機構を含む2つの異なるデータ生成機構を用いる。
データセットジェネレータはCausal Discovery Toolboxにインスパイアされ、追加モデルのみを生成する。
データセットのバラエティは0.5である。
われわれのSCARYデータセットは、研究者がより現実的なシナリオの下で因果発見を探求するための貴重なリソースを提供する。
データセットはhttps://github.com/JayJayc/SCARYで公開されている。
関連論文リスト
- Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - CausalPlayground: Addressing Data-Generation Requirements in Cutting-Edge Causality Research [2.7446241148152253]
CausalPlaygroundは、構造因果モデル(SCM)の生成、サンプリング、共有のための標準化されたプラットフォームを提供するPythonライブラリである。
CausalPlaygroundは、SCMの詳細な制御、介入、学習と定量的研究のためのSCMのデータセットの生成を提供する。
論文 参考訳(メタデータ) (2024-05-21T12:08:48Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - $\texttt{causalAssembly}$: Generating Realistic Production Data for
Benchmarking Causal Discovery [1.3048920509133808]
我々は、因果探索手法のベンチマークをサポートする半合成製造データを生成するシステムを構築した。
我々は、柔軟に推定し、条件分布を表すために分布ランダムな森林を用いる。
このライブラリを用いて、よく知られた因果探索アルゴリズムをベンチマークする方法を示す。
論文 参考訳(メタデータ) (2023-06-19T10:05:54Z) - Boosting Synthetic Data Generation with Effective Nonlinear Causal
Discovery [11.81479419498206]
ソフトウェアテスト、データプライバシ、不均衡学習、人工知能の説明では、もっともらしいデータサンプルを生成することが不可欠である。
データ生成に広く使用されるアプローチの一般的な前提は、機能の独立性である。
本稿では,変数間の非線形因果関係を発見し,生成時に利用する合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2023-01-18T10:54:06Z) - MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference,
Temporal, Causal, and Subevent Relation Extraction [78.61546292830081]
アノテーションを改良した大規模EREデータセットMAVEN-EREを構築した。
103,193個のイベント・コア・チェイン、1,216,217個の時間関係、57,992個の因果関係、15,841個の部分関係を含む。
実験の結果,MAVEN-ERE上でのEREは極めて困難であり,共同学習との相互関係を考慮すれば性能が向上することが示された。
論文 参考訳(メタデータ) (2022-11-14T13:34:49Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Causal-TGAN: Generating Tabular Data Using Causal Generative Adversarial
Networks [7.232789848964222]
因果モデルCausal Tabular Generative Neural Network (Causal-TGAN) を提案し,合成データを生成する。
シミュレーションデータセットと実データセットの両方の実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2021-04-21T17:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。