論文の概要: Optimal Transport on Categorical Data for Counterfactuals using Compositional Data and Dirichlet Transport
- arxiv url: http://arxiv.org/abs/2501.15549v1
- Date: Sun, 26 Jan 2025 14:42:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:54:22.050115
- Title: Optimal Transport on Categorical Data for Counterfactuals using Compositional Data and Dirichlet Transport
- Title(参考訳): 組成データとディリクレ輸送を用いた対物カテゴリーデータの最適輸送
- Authors: Agathe Fernandes Machado, Arthur Charpentier, Ewen Gallic,
- Abstract要約: 最適輸送に基づくアプローチは、例えばアルゴリズムの識別を定量化するために反事実を導出するために注目を集めている。
本稿では,実データセットを用いて分類変数を輸送する手法を提案する。
- 参考スコア(独自算出の注目度): 0.3749861135832073
- License:
- Abstract: Recently, optimal transport-based approaches have gained attention for deriving counterfactuals, e.g., to quantify algorithmic discrimination. However, in the general multivariate setting, these methods are often opaque and difficult to interpret. To address this, alternative methodologies have been proposed, using causal graphs combined with iterative quantile regressions (Ple\v{c}ko and Meinshausen (2020)) or sequential transport (Fernandes Machado et al. (2025)) to examine fairness at the individual level, often referred to as ``counterfactual fairness.'' Despite these advancements, transporting categorical variables remains a significant challenge in practical applications with real datasets. In this paper, we propose a novel approach to address this issue. Our method involves (1) converting categorical variables into compositional data and (2) transporting these compositions within the probabilistic simplex of $\mathbb{R}^d$. We demonstrate the applicability and effectiveness of this approach through an illustration on real-world data, and discuss limitations.
- Abstract(参考訳): 近年, アルゴリズムの識別を定量化する手法として, 最適輸送方式が注目されている。
しかし、一般的な多変量集合では、これらの手法はしばしば不透明で解釈が難しい。
これを解決するために、因果グラフと反復的量子レグレッション(Ple\v{c}ko と Meinshausen (2020))または逐次輸送(Fernandes Machado et al (2025))を組み合わせた別の手法が提案されている。
このような進歩にもかかわらず、分類変数の転送は、実際のデータセットを使った実践的なアプリケーションにおいて、依然として大きな課題である。
本稿では,この問題に対処するための新しいアプローチを提案する。
本手法では,(1)分類変数を合成データに変換し,(2)$\mathbb{R}^d$の確率的単純度内でこれらの合成を輸送する。
本稿では,実世界のデータの図解を通じて,このアプローチの適用性と有効性を実証し,限界について論じる。
関連論文リスト
- Sequential Conditional Transport on Probabilistic Graphs for Interpretable Counterfactual Fairness [0.3749861135832073]
我々は,確率的グラフィカルモデルに "Knothe's rearrangement" と "triangular transport" を拡張した。
我々は、個別レベルでの公平性を議論するために、シーケンシャルトランスポート(Sequence transport)と呼ばれるこのカウンターファクトカルアプローチを使用する。
論文 参考訳(メタデータ) (2024-08-06T20:02:57Z) - Multimarginal generative modeling with stochastic interpolants [15.520853806024943]
確率密度のセットをK$とすると、密度を余剰値として回復する共同分布を学習するマルチマージ生成モデル問題を考える。
我々は補間フレームワークの一般化の中で,この課題に対するアプローチを定式化する。
我々の生成モデルは、単純なアルゴリズム目的の最小化要因として特徴づけられる速度とスコアフィールドによって定義される。
論文 参考訳(メタデータ) (2023-10-05T17:12:38Z) - Predicate Classification Using Optimal Transport Loss in Scene Graph
Generation [7.056402944499977]
本稿では,2つの確率分布を比較する尺度として最適輸送を用いたシーングラフを生成する手法を提案する。
実験により,提案手法はRecall@50,100の平均値で既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-19T08:46:18Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Practical Approaches for Fair Learning with Multitype and Multivariate
Sensitive Attributes [70.6326967720747]
現実世界に展開された機械学習アルゴリズムが不公平さや意図しない社会的結果をもたらすことはないことを保証することが重要である。
本稿では,カーネルHilbert Spacesの相互共分散演算子上に構築されたフェアネス尺度であるFairCOCCOを紹介する。
実世界のデータセットにおける予測能力と公正性のバランスをとる上で、最先端技術に対する一貫した改善を実証的に示す。
論文 参考訳(メタデータ) (2022-11-11T11:28:46Z) - Instance-Dependent Generalization Bounds via Optimal Transport [51.71650746285469]
既存の一般化境界は、現代のニューラルネットワークの一般化を促進する重要な要因を説明することができない。
データ空間における学習予測関数の局所リプシッツ正則性に依存するインスタンス依存の一般化境界を導出する。
ニューラルネットワークに対する一般化境界を実験的に解析し、有界値が有意義であることを示し、トレーニング中の一般的な正規化方法の効果を捉える。
論文 参考訳(メタデータ) (2022-11-02T16:39:42Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Unbalanced minibatch Optimal Transport; applications to Domain
Adaptation [8.889304968879163]
最適輸送距離は、非パラメトリック確率分布を比較するための機械学習の能力に多くの応用を見出した。
我々は、同じミニバッチ戦略と不均衡な最適輸送が組み合わさって、より堅牢な振る舞いをもたらすと論じる。
実験により, 領域適応に関する課題において, 不均衡な最適移動の利用は, 最近のベースラインと競合するか, はるかに良好な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2021-03-05T11:15:47Z) - Robust Correction of Sampling Bias Using Cumulative Distribution
Functions [19.551668880584973]
変数ドメインとバイアス付きデータセットは、トレーニングとターゲット分布の違いにつながる可能性がある。
これを緩和するための現在のアプローチは、しばしばトレーニングとターゲット確率密度関数の比率を推定することに依存する。
論文 参考訳(メタデータ) (2020-10-23T22:13:00Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。