論文の概要: Detecting and Identifying Selection Structure in Sequential Data
- arxiv url: http://arxiv.org/abs/2407.00529v1
- Date: Sat, 29 Jun 2024 20:56:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 02:46:30.873717
- Title: Detecting and Identifying Selection Structure in Sequential Data
- Title(参考訳): シーケンスデータにおける選択構造の検出と同定
- Authors: Yujia Zheng, Zeyu Tang, Yiwen Qiu, Bernhard Schölkopf, Kun Zhang,
- Abstract要約: 我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 53.24493902162797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We argue that the selective inclusion of data points based on latent objectives is common in practical situations, such as music sequences. Since this selection process often distorts statistical analysis, previous work primarily views it as a bias to be corrected and proposes various methods to mitigate its effect. However, while controlling this bias is crucial, selection also offers an opportunity to provide a deeper insight into the hidden generation process, as it is a fundamental mechanism underlying what we observe. In particular, overlooking selection in sequential data can lead to an incomplete or overcomplicated inductive bias in modeling, such as assuming a universal autoregressive structure for all dependencies. Therefore, rather than merely viewing it as a bias, we explore the causal structure of selection in sequential data to delve deeper into the complete causal process. Specifically, we show that selection structure is identifiable without any parametric assumptions or interventional experiments. Moreover, even in cases where selection variables coexist with latent confounders, we still establish the nonparametric identifiability under appropriate structural conditions. Meanwhile, we also propose a provably correct algorithm to detect and identify selection structures as well as other types of dependencies. The framework has been validated empirically on both synthetic data and real-world music.
- Abstract(参考訳): 我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
この選択過程は統計解析を歪ませることが多いため、従来の研究は主に修正すべきバイアスとみなし、その効果を緩和するための様々な方法を提案する。
しかしながら、このバイアスを制御することは重要である一方で、選択は、私たちが観察するものの基礎となる基本的なメカニズムであるため、隠れた生成プロセスについてより深い洞察を与える機会を提供する。
特に、シーケンシャルデータの選択を見渡すことは、すべての依存に対して普遍的な自己回帰構造を仮定するなど、モデリングにおいて不完全または過剰に複雑化された帰納的バイアスをもたらす可能性がある。
したがって、単にバイアスとして見るのではなく、シーケンシャルデータにおける選択の因果構造を調べ、完全な因果過程を深く掘り下げる。
具体的には、パラメトリックな仮定や介入実験なしに選択構造が識別可能であることを示す。
さらに、選択変数が潜在共同創設者と共存する場合においても、適切な構造条件下での非パラメトリック識別性を確立する。
また,他の種類の依存関係だけでなく,選択構造を検出・識別するアルゴリズムも提案する。
このフレームワークは、合成データと実世界の音楽の両方で実証的に検証されている。
関連論文リスト
- Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Local Constraint-Based Causal Discovery under Selection Bias [8.465604845422238]
本稿では,独立制約選択バイアスから因果関係を発見することの問題点を考察する。
代わりに独立関係の局所的なパターンに注目し、背景知識を含む3変数のみの健全な手法は見つからない。
Y構造パターンは、サイクルが存在する可能性のある選択バイアス下のデータから因果関係を予測する際に、健全であることが示されている。
論文 参考訳(メタデータ) (2022-03-03T16:52:22Z) - Acquisition-invariant brain MRI segmentation with informative
uncertainties [3.46329153611365]
ポストホックな多地点補正法は存在するが、現実のシナリオではしばしば成立しない強い仮定を持つ。
この研究は、セグメンテーションタスクの文脈において、獲得の物理学に堅牢になるようなアルゴリズムを実証している。
提案手法は, ホールドアウトデータセットの完全化, セグメンテーション品質の維持だけでなく, サイト固有のシーケンス選択も考慮しながら, 一般化できることを実証する。
論文 参考訳(メタデータ) (2021-11-07T13:58:04Z) - Efficient Online Estimation of Causal Effects by Deciding What to
Observe [26.222870185443913]
確率モデル(例えば因果効果)の任意の機能(例えば、因果効果)を可能な限り効率的に推定し、どのデータソースを問合せするかを各タイミングで決定することを目的としている。
モーメント条件として構造的仮定を符号化するフレームワークであるオンラインモーメント選択(OMS)を提案する。
我々のアルゴリズムは、現在のモーメントの推定値から示唆される最良の行動を選択することで探索のバランスをとる。
論文 参考訳(メタデータ) (2021-08-20T17:00:56Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。