論文の概要: Causal Discovery using Compression-Complexity Measures
- arxiv url: http://arxiv.org/abs/2010.09336v3
- Date: Wed, 17 Mar 2021 10:45:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:22:47.958487
- Title: Causal Discovery using Compression-Complexity Measures
- Title(参考訳): 圧縮複雑度対策を用いた因果発見
- Authors: Pranay SY and Nithin Nagaraj
- Abstract要約: 観測された2つの離散記号列から因果方向を$X$と$Y$から推定する問題に対処する。
CCM(Compression-Complexity Measures) - Lempel-Ziv(LZ)複雑性とETC(Effort-To-Compress)の3つのモデルを提案する。
提案モデルでは,シーケンスペア間の因果情報交換を指向的に捉え,重要な問題に対処する新たな機会を提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Causal inference is one of the most fundamental problems across all domains
of science. We address the problem of inferring a causal direction from two
observed discrete symbolic sequences $X$ and $Y$. We present a framework which
relies on lossless compressors for inferring context-free grammars (CFGs) from
sequence pairs and quantifies the extent to which the grammar inferred from one
sequence compresses the other sequence. We infer $X$ causes $Y$ if the grammar
inferred from $X$ better compresses $Y$ than in the other direction. To put
this notion to practice, we propose three models that use the
Compression-Complexity Measures (CCMs) - Lempel-Ziv (LZ) complexity and
Effort-To-Compress (ETC) to infer CFGs and discover causal directions without
demanding temporal structures. We evaluate these models on synthetic and
real-world benchmarks and empirically observe performances competitive with
current state-of-the-art methods. Lastly, we present two unique applications of
the proposed models for causal inference directly from pairs of genome
sequences belonging to the SARS-CoV-2 virus. Using a large number of sequences,
we show that our models capture directed causal information exchange between
sequence pairs, presenting novel opportunities for addressing key issues such
as contact-tracing, motif discovery, evolution of virulence and pathogenicity
in future applications.
- Abstract(参考訳): 因果推論は科学のあらゆる領域において最も根本的な問題の1つである。
観測された2つの離散記号列から因果方向を$X$と$Y$から推定する問題に対処する。
本稿では、文脈自由文法(CFG)をシーケンス対から推論するための無損失圧縮機に依存し、あるシーケンスから推論された文法が他のシーケンスを圧縮する程度を定量化するフレームワークを提案する。
x$ から推論した文法が他の方向よりも$y$ 圧縮する場合、$x$ は$y$ を引き起こす。
本稿では,この概念を実践するために,CCM(Compression-Complexity Measures)とLZ(Lempel-Ziv)とETC(Effort-To-Compress)の3つのモデルを提案する。
我々は,これらのモデルを合成および実世界のベンチマークで評価し,現在の最先端手法と競合する性能を実証的に観察する。
最後に、SARS-CoV-2ウイルスに属する一対のゲノム配列から直接因果推論のための2つのユニークな応用について述べる。
多数のシークエンスを用いて,我々のモデルがシーケンスペア間の有向因果情報交換をキャプチャし,コンタクトトレーシング,モチーフ発見,病原性の進化など,今後の応用において重要な課題に対処する新たな機会を提示することを示した。
関連論文リスト
- Tangent Space Causal Inference: Leveraging Vector Fields for Causal Discovery in Dynamical Systems [0.8192907805418583]
本稿では,動的システムの因果性を検出するためのTangent Space Causal Inference (TSCI)法を提案する。
まず、TSCIアルゴリズムの基本バージョンを提示し、基本的なCCMアルゴリズムよりも効果的であることを示した。
また、潜在変数モデルとディープラーニングの表現力を利用するTSCIの拡張版も提示する。
論文 参考訳(メタデータ) (2024-10-30T23:08:12Z) - FiP: a Fixed-Point Approach for Causal Generative Modeling [20.88890689294816]
因果順序付き変数上の不動点問題を記述するのにDAGを必要としない新しい等価形式法を提案する。
トポロジカル秩序(TO)を考慮し,一意に回復できる3つの重要な症例を示す。
論文 参考訳(メタデータ) (2024-04-10T12:29:05Z) - ChainLM: Empowering Large Language Models with Improved Chain-of-Thought Prompting [124.69672273754144]
CoT(Chain-of-Thought)のプロンプトにより,大規模言語モデル(LLM)の推論能力が向上する
既存のCoTアプローチは通常、単純な推論タスクに重点を置いており、結果として低品質で一貫性のないCoTプロンプトをもたらす。
優れたCoTプロンプトの自動生成のための新しいフレームワークであるCoTGeniusを紹介する。
論文 参考訳(メタデータ) (2024-03-21T11:34:26Z) - Causal Discovery by Kernel Deviance Measures with Heterogeneous
Transforms [17.368146833023893]
本稿では,RKHS埋め込みの異種変換に基づく新しいスコア尺度を提案し,因果発見のための条件密度の高次モーメントを抽出する。
各仮説的原因影響方向のスコアを比較して推論を行う。
論文 参考訳(メタデータ) (2024-01-31T17:28:05Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - DynGFN: Towards Bayesian Inference of Gene Regulatory Networks with
GFlowNets [81.75973217676986]
遺伝子調節ネットワーク(GRN)は、遺伝子発現と細胞機能を制御する遺伝子とその産物間の相互作用を記述する。
既存の方法は、チャレンジ(1)、ダイナミックスから循環構造を識別すること、あるいはチャレンジ(2)、DAGよりも複雑なベイズ後部を学習することに焦点を当てるが、両方ではない。
本稿では、RNAベロシティ技術を用いて遺伝子発現の「速度」を推定できるという事実を活用し、両方の課題に対処するアプローチを開発する。
論文 参考訳(メタデータ) (2023-02-08T16:36:40Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Large-Scale Differentiable Causal Discovery of Factor Graphs [3.8015092217142223]
本稿では,非線形低ランク因果相互作用モデルへの探索空間の方法として,因子指向非巡回グラフ(f-DAG)の概念を導入する。
本稿では,f-DAG制約因果探索のスケーラブルな実装を提案する。
論文 参考訳(メタデータ) (2022-06-15T21:28:36Z) - Effect Identification in Cluster Causal Diagrams [51.42809552422494]
クラスタ因果図(略してC-DAG)と呼ばれる新しいタイプのグラフィカルモデルを導入する。
C-DAGは、限定された事前知識に基づいて変数間の関係を部分的に定義することができる。
我々はC-DAGに対する因果推論のための基礎と機械を開発する。
論文 参考訳(メタデータ) (2022-02-22T21:27:31Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。