論文の概要: Wasserstein Distances Made Explainable: Insights into Dataset Shifts and Transport Phenomena
- arxiv url: http://arxiv.org/abs/2505.06123v1
- Date: Fri, 09 May 2025 15:26:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.31644
- Title: Wasserstein Distances Made Explainable: Insights into Dataset Shifts and Transport Phenomena
- Title(参考訳): Wasserstein距離が説明可能になった:データセットのシフトと輸送現象
- Authors: Philip Naumann, Jacob Kauffmann, Grégoire Montavon,
- Abstract要約: Wassersteinの距離は、データ分散を比較するための強力なフレームワークを提供する。
我々は、様々なデータコンポーネントにWasserstein距離を効率的に正確に割り当てることのできる、Explainable AIに基づく新しいソリューションを提案する。
- 参考スコア(独自算出の注目度): 3.4991519098475843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wasserstein distances provide a powerful framework for comparing data distributions. They can be used to analyze processes over time or to detect inhomogeneities within data. However, simply calculating the Wasserstein distance or analyzing the corresponding transport map (or coupling) may not be sufficient for understanding what factors contribute to a high or low Wasserstein distance. In this work, we propose a novel solution based on Explainable AI that allows us to efficiently and accurately attribute Wasserstein distances to various data components, including data subgroups, input features, or interpretable subspaces. Our method achieves high accuracy across diverse datasets and Wasserstein distance specifications, and its practical utility is demonstrated in two use cases.
- Abstract(参考訳): Wassersteinの距離は、データ分散を比較するための強力なフレームワークを提供する。
これらは、時間とともにプロセスを分析したり、データ内の不均一性を検出するために使用することができる。
しかし、ワッサーシュタイン距離を単純に計算したり、対応する輸送写像(あるいは結合)を分析するだけでは、ワッサーシュタイン距離が高いか低いかにどの因子が寄与するかを理解するのに十分ではないかもしれない。
本研究では,データサブグループや入力機能,解釈可能な部分空間など,さまざまなデータコンポーネントに対して,Wasserstein距離を効率的に正確に推定することのできる,Explainable AIに基づく新しいソリューションを提案する。
本手法は,多種多様なデータセットおよびワッサーシュタイン距離仕様の高精度化を実現し,その実用性を2つのユースケースで示す。
関連論文リスト
- Fused Gromov-Wasserstein Variance Decomposition with Linear Optimal Transport [11.94799054956877]
2-ワッサーシュタイン空間における測度の集合のフレット分散の分解を行い、これらの測度のLOT埋め込みによって説明される分散の割合を計算する。
また, 組込みLOTの寸法, 分散率, 組込みデータに基づく機械学習分類器の分類精度との関係について検討した。
論文 参考訳(メタデータ) (2024-11-15T14:10:52Z) - Private Wasserstein Distance [6.015898117103069]
ワッサーシュタイン距離は、分散の観点からデータの分散を定量化するための鍵となる指標である。
本研究では、ワッサーシュタイン空間内の固有三角形の性質を探求し、新しい解であるトライアングルワッド(TriangleWad)を導いた。
論文 参考訳(メタデータ) (2024-04-10T06:58:58Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Wasserstein t-SNE [25.241296604908424]
本稿では,ワッサーシュタイン距離距離計を用いた階層的データセットの探索的解析手法を開発した。
対のワッサーシュタイン距離の行列に基づいて、t-SNEを用いて単位の2次元埋め込みを構築する。
論文 参考訳(メタデータ) (2022-05-16T09:09:24Z) - Partial Wasserstein Covering [10.52782170493037]
我々は、大規模なデータセットをエミュレートする目的で、部分的なWassersteinと呼ばれる一般的なタスクについて検討する。
この問題をワッサーシュタイン偏微分を目的関数とする離散最適化問題としてモデル化する。
我々は、シーンデータセットの駆動を含む部分的なワッサースタインの発散の観点から、2つのデータセットを効率的に作成できることを示します。
論文 参考訳(メタデータ) (2021-06-02T01:48:41Z) - Ranking the information content of distance measures [61.754016309475745]
2つの異なる距離測度を用いて保持する相対的情報を評価する統計的テストを導入する。
これにより、候補者のプールから最も情報に富んだ距離を測定することができる。
論文 参考訳(メタデータ) (2021-04-30T15:57:57Z) - Learning High Dimensional Wasserstein Geodesics [55.086626708837635]
高次元の2つの確率分布の間のワッサーシュタイン測地線を計算するための新しい定式化と学習戦略を提案する。
ラグランジュ乗算器の手法を最適輸送(OT)問題の動的定式化に適用することにより、サドル点がワッサーシュタイン測地線であるミニマックス問題を導出する。
次に、深層ニューラルネットワークによる関数のパラメータ化を行い、トレーニングのためのサンプルベースの双方向学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-02-05T04:25:28Z) - Two-sample Test using Projected Wasserstein Distance [18.46110328123008]
統計学と機械学習の基本的な問題である2サンプルテストのための予測されたワッサースタイン距離を開発する。
重要な貢献は、投影された確率分布の間のワッサーシュタイン距離を最大化する低次元線型写像を見つけるために最適射影を結合することである。
論文 参考訳(メタデータ) (2020-10-22T18:08:58Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - Augmented Sliced Wasserstein Distances [55.028065567756066]
拡張スライスされたワッサーシュタイン距離(ASWD)と呼ばれる新しい距離測定法を提案する。
ASWDは、ニューラルネットワークによってパラメータ化された高次元超曲面への最初のマッピングサンプルによって構成される。
数値的な結果から、ASWDは、合成問題と実世界の問題の両方において、他のワッサーシュタイン変種を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2020-06-15T23:00:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。