論文の概要: Differential Subgroup Discovery: Characterizing Where Two Populations Differ, and Why
- arxiv url: http://arxiv.org/abs/2604.27741v1
- Date: Thu, 30 Apr 2026 11:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.066969
- Title: Differential Subgroup Discovery: Characterizing Where Two Populations Differ, and Why
- Title(参考訳): 異なるサブグループの発見:2つの集団の多様性と理由
- Authors: Sascha Xu, Jilles Vreeken,
- Abstract要約: 特徴空間内での2つの集団の相違点の理解について検討する。
異なる部分群は、人口レベルのギャップが最も顕著な特徴空間の領域を明らかにする。
- 参考スコア(独自算出の注目度): 36.94047915240195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of understanding where two populations differ within a feature space, which we formalize in the concept of a differential subgroup: a subset of individuals from both populations who, despite sharing similar characteristics, exhibit exceptional differences in a target outcome. Differential subgroups reveal the regions of the feature space where population-level gaps are most pronounced and can help practitioners identify the covariate combinations that are structurally responsible for these differences, e.g.~in clinical analysis, model diagnostics, or treatment-effect studies. We introduce a general optimization objective for discovering differential subgroups and establish conditions under which the resulting subgroups admit a causal interpretation of population differences. We propose DiffSub, a gradient-based approach that discovers interpretable differential subgroups in tabular data. Across synthetic benchmarks, medical case studies, model-error analyses, and treatment-effect settings, DiffSub identifies informative subgroups that reveal where population differences arise and why.
- Abstract(参考訳): 本研究では,2つの集団が特徴空間内でどのように異なるかという問題について検討し,差分部分群(差分部分群)という概念を定式化した。
異なるサブグループは、人口レベルのギャップが最も顕著な特徴空間の領域を明らかにし、臨床分析、モデル診断、治療効果研究などにおいて、これらの違いに構造的に責任を持つ共変量の組み合わせを特定するのに役立つ。
本稿では,差分部分群を発見するための汎用最適化目標を導入し,その結果,集団差の因果的解釈が認められる条件を確立する。
グラフデータ中の解釈可能な微分部分群を発見する勾配に基づくアプローチであるDiffSubを提案する。
総合ベンチマーク、医学ケーススタディ、モデルエラー分析、治療効果設定など、DiffSubは人口差の発生源と原因を明らかにする情報サブグループを特定している。
関連論文リスト
- Identifying latent disease factors differently expressed in patient subgroups using group factor analysis [54.67330718129736]
本稿では,サブグループ特異的およびサブグループ共通潜在因子を明らかにするための新しいアプローチを提案する。
提案手法は,正規化されたホースシュー先行群を用いたスパース群因子解析 (GFA) であり,確率計画法を用いて実装した。
論文 参考訳(メタデータ) (2024-10-10T13:12:14Z) - Group-specific discriminant analysis reveals statistically validated sex differences in lateralization of brain functional network [7.01314545449491]
Group-Specific Discriminant Analysis (GSDA) は1次分類のために開発された。
Group-Specific Discriminant Analysis (GSDA) は1次分類のために開発された。
論文 参考訳(メタデータ) (2024-04-08T16:36:07Z) - The Role of Subgroup Separability in Group-Fair Medical Image
Classification [18.29079361470428]
診断などの系統的バイアスを伴うデータを用いて, サブグループ分離性, サブグループ分離性, 性能劣化の関係について検討した。
私たちの発見は、モデルがどのように偏見を抱くかという問題に新たな光を当て、公正な医療画像AIの開発に重要な洞察を与えました。
論文 参考訳(メタデータ) (2023-07-06T06:06:47Z) - Picking on the Same Person: Does Algorithmic Monoculture lead to Outcome
Homogenization? [90.35044668396591]
機械学習における繰り返しのテーマはアルゴリズムによるモノカルチャーである。同じシステム、またはコンポーネントを共有するシステムは、複数の意思決定者によってデプロイされる。
意思決定者がトレーニングデータや特定のモデルなどのコンポーネントを共有すれば、より均一な結果が得られます。
我々はこの仮説をアルゴリズムフェアネスベンチマークで検証し、トレーニングデータの共有がホモジェナイゼーションを確実に悪化させることを示した。
結果の均質化に関する哲学的分析と社会的な課題を、デプロイされた機械学習システムに含めることに着目して結論付ける。
論文 参考訳(メタデータ) (2022-11-25T09:33:11Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z) - Post-discovery Analysis of Anomalous Subsets [6.118940071203314]
本稿では,差分出力の解析(発見ではなく)を提案し,反実数設定と同様な異常を定量化する。
提案手法を提示し,2019 MarketScan Commercial Claims および Medicare データによる評価結果から,さらなる洞察が得られたことを示す。
論文 参考訳(メタデータ) (2021-11-23T20:30:02Z) - Recommendations for Bayesian hierarchical model specifications for
case-control studies in mental health [0.0]
研究者は、すべての被験者が共通の集団から引き出されたと仮定するか、またはそれらを別の集団から派生したものとしてモデル化するかを選択する必要がある。
一般的に使用される帯域幅タスクから合成多群行動データに対する系統シミュレーションを行った。
適合群は,全ての条件において,最も正確かつ堅牢な推論を別々に提供した。
論文 参考訳(メタデータ) (2020-11-03T14:19:59Z) - LOGAN: Local Group Bias Detection by Clustering [86.38331353310114]
コーパスレベルでバイアスを評価することは、モデルにバイアスがどのように埋め込まれているかを理解するのに十分ではない、と我々は主張する。
クラスタリングに基づく新しいバイアス検出手法であるLOGANを提案する。
毒性分類および対象分類タスクの実験は、LOGANが局所領域のバイアスを特定することを示している。
論文 参考訳(メタデータ) (2020-10-06T16:42:51Z) - Robust Recursive Partitioning for Heterogeneous Treatment Effects with
Uncertainty Quantification [84.53697297858146]
治療効果のサブグループ分析は、医療から公共政策、レコメンデーターシステムへの応用において重要な役割を担っている。
サブグループ分析の現在の手法のほとんどは、個別化処理効果(ITE)を推定するための特定のアルゴリズムから始まる。
本稿では、これらの弱点に対処する新しい部分群解析法R2Pを開発する。
論文 参考訳(メタデータ) (2020-06-14T14:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。