論文の概要: Shaky Structures: The Wobbly World of Causal Graphs in Software Analytics
- arxiv url: http://arxiv.org/abs/2505.12554v1
- Date: Sun, 18 May 2025 21:56:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.306214
- Title: Shaky Structures: The Wobbly World of Causal Graphs in Software Analytics
- Title(参考訳): Shaky Structures: ソフトウェア分析における因果グラフの世界
- Authors: Jeremy Hulse, Nasir U. Eisty, Tim Menzies,
- Abstract要約: 因果グラフは、因果関係の文書化と探索にソフトウェア工学で広く使われている。
広く使われているが、非常に誤解を招くこともある。
本稿では,23データセットに適用した4つの因果グラフ生成器の因果グラフについて検討する。
- 参考スコア(独自算出の注目度): 9.935721360249014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal graphs are widely used in software engineering to document and explore causal relationships. Though widely used, they may also be wildly misleading. Causal structures generated from SE data can be highly variable. This instability is so significant that conclusions drawn from one graph may be totally reversed in another, even when both graphs are learned from the same or very similar project data. To document this problem, this paper examines causal graphs found by four causal graph generators (PC, FCI, GES, and LiNGAM) when applied to 23 data sets, relating to three different SE tasks: (a) learning how configuration options are selected for different properties; (b) understanding how management choices affect software projects; and (c) defect prediction. Graphs were compared between (a) different projects exploring the same task; (b) version i and i + 1 of a system; (c) different 90% samples of the data; and (d) small variations in the causal graph generator. Measured in terms of the Jaccard index of the number of edges shared by two different graphs, over half the edges were changed by these treatments. Hence, we conclude two things. Firstly, specific conclusions found by causal graph generators about how two specific variables affect each other may not generalize since those conclusions could be reversed by minor changes in how those graphs are generated. Secondly, before researchers can report supposedly general conclusions from causal graphs (e.g., "long functions cause more defects"), they should test that such conclusions hold over the numerous causal graphs that might be generated from the same data.
- Abstract(参考訳): 因果グラフは、因果関係の文書化と探索にソフトウェア工学で広く使われている。
広く使われているが、非常に誤解を招くこともある。
SEデータから生成された因果構造は高度に可変することができる。
この不安定性は非常に重要であり、同じまたは非常に類似したプロジェクトデータから両方のグラフが学習されたとしても、あるグラフから引き出された結論は別のグラフで完全に逆転する可能性がある。
そこで本研究では,4つの因果グラフ生成器(PC, FCI, GES, LiNGAM)が,3つのSEタスクに関連する23のデータセットに適用した場合の因果グラフについて検討する。
(a)異なるプロパティに対して設定オプションをどのように選択するかを学ぶ。
b)マネジメントの選択がソフトウェアプロジェクトにどのように影響するかを理解すること
(c)欠陥予測
グラフの比較
(a)同じタスクを探索する異なるプロジェクト
b) システムのバージョン i と i + 1
(c)データの90%の異なるサンプル、及び
(d)因果グラフ生成器の小さなバリエーション。
2つの異なるグラフで共有されるエッジ数のジャカード指数を用いて測定し、これらの処理によりエッジの半分以上が変更された。
したがって、我々は2つの結論を下す。
第一に、因果グラフ生成器によって発見された2つの特定の変数が互いにどのように影響するかに関する具体的な結論は、これらの結論がそれらのグラフの生成方法の微妙な変化によって逆転される可能性があるため、一般化されない。
第二に、研究者が因果グラフからの一般的な結論(例えば「長い関数がより多くの欠陥を引き起こす」)を報告する前に、同じデータから生成される可能性のある多数の因果グラフに対してそのような結論が成り立つことを検証すべきである。
関連論文リスト
- Measuring Similarity in Causal Graphs: A Framework for Semantic and Structural Analysis [0.7373617024876725]
因果グラフは一般に複雑なシステムを理解しモデル化するために用いられる。
研究者はしばしば異なる視点からこれらのグラフを構築し、同じ問題に対して大きなバリエーションをもたらす。
その重要性にもかかわらず、因果グラフ比較の研究は依然として少ない。
論文 参考訳(メタデータ) (2025-03-14T03:29:26Z) - Scalable and Flexible Causal Discovery with an Efficient Test for Adjacency [48.769884734826974]
因果グラフに2つの変数が隣接しているかどうかを評価するために,スケーラブルで柔軟な手法を構築した。
微分可能隣接テストは指数関数的な数のテストを、証明可能な等価な緩和問題に置き換える。
DAT, DAT-Graphに基づくグラフ学習手法も構築し, 介入したデータから学習する。
論文 参考訳(メタデータ) (2024-06-13T14:39:40Z) - Causal Discovery with Fewer Conditional Independence Tests [15.876392307650248]
我々の研究は、条件付き独立テストの数を減らすことで、基礎となる因果グラフについて何が学べるかを特徴づけることに重点を置いている。
隠れ因果グラフの粗い表現を多数のテストで学習できることを示す。
その結果,本研究では,多数のテストで真の因果グラフを復元するアルゴリズムを初めて提案した。
論文 参考訳(メタデータ) (2024-06-03T22:27:09Z) - CLEAR: Generative Counterfactual Explanations on Graphs [60.30009215290265]
グラフ上での対実的説明生成の問題について検討する。
グラフに関する反実的な説明を調査する研究はいくつかあるが、この問題の多くの課題はまだ十分に適応されていない。
本稿では,グラフレベルの予測モデルに対して,グラフ上の反実的説明を生成するための新しいフレームワークCLEARを提案する。
論文 参考訳(メタデータ) (2022-10-16T04:35:32Z) - Variational Graph Generator for Multi-View Graph Clustering [51.89092260088973]
マルチビューグラフクラスタリング(VGMGC)のための変分グラフ生成器を提案する。
この生成器は、複数のグラフに対する事前仮定に基づいて、信頼性のある変分コンセンサスグラフを推論する。
推論されたビュー共通グラフとビュー固有のグラフを機能と一緒に埋め込む。
論文 参考訳(メタデータ) (2022-10-13T13:19:51Z) - Inference Attacks Against Graph Neural Networks [33.19531086886817]
グラフの埋め込みは、グラフ分析問題を解決する強力なツールである。
グラフ埋め込みの共有は興味深いが、関連するプライバシーリスクは未調査だ。
3つの推論攻撃を組み込むことで,グラフ埋め込みの情報漏洩を系統的に調査する。
論文 参考訳(メタデータ) (2021-10-06T10:08:11Z) - ExplaGraphs: An Explanation Graph Generation Task for Structured
Commonsense Reasoning [65.15423587105472]
スタンス予測のための説明グラフ生成の新しい生成および構造化コモンセンスリゾニングタスク(および関連するデータセット)を紹介します。
具体的には、信念と議論が与えられた場合、モデルは、議論が信念を支持しているかどうかを予測し、予測されたスタンスに対する非自明で完全で曖昧な説明として機能する常識強化グラフを生成する必要がある。
グラフの83%は、様々な構造と推論深度を持つ外部のコモンセンスノードを含んでいる。
論文 参考訳(メタデータ) (2021-04-15T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。