論文の概要: Partial Wasserstein Covering
- arxiv url: http://arxiv.org/abs/2106.00886v1
- Date: Wed, 2 Jun 2021 01:48:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 08:56:59.077763
- Title: Partial Wasserstein Covering
- Title(参考訳): 部分的ワッサースタイン被覆
- Authors: Keisuke Kawano, Satoshi Koide, Keisuke Otaki
- Abstract要約: 我々は、大規模なデータセットをエミュレートする目的で、部分的なWassersteinと呼ばれる一般的なタスクについて検討する。
この問題をワッサーシュタイン偏微分を目的関数とする離散最適化問題としてモデル化する。
我々は、シーンデータセットの駆動を含む部分的なワッサースタインの発散の観点から、2つのデータセットを効率的に作成できることを示します。
- 参考スコア(独自算出の注目度): 10.52782170493037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a general task called partial Wasserstein covering with the goal
of emulating a large dataset (e.g., application dataset) using a small dataset
(e.g., development dataset) in terms of the empirical distribution by selecting
a small subset from a candidate dataset and adding it to the small dataset. We
model this task as a discrete optimization problem with partial Wasserstein
divergence as an objective function. Although this problem is NP-hard, we prove
that it has the submodular property, allowing us to use a greedy algorithm with
a 0.63 approximation. However, the greedy algorithm is still inefficient
because it requires linear programming for each objective function evaluation.
To overcome this difficulty, we propose quasi-greedy algorithms for
acceleration, which consist of a series of techniques such as sensitivity
analysis based on strong duality and the so-called $C$-transform in the optimal
transport field. Experimentally, we demonstrate that we can efficiently make
two datasets similar in terms of partial Wasserstein divergence, including
driving scene datasets.
- Abstract(参考訳): 候補データセットから小さなサブセットを選択し、それを小さなデータセットに追加することで、経験的分布の観点から、小さなデータセット(例えば、開発データセット)を使用して大きなデータセット(例えば、アプリケーションデータセット)をエミュレートすることを目的として、partment wassersteinと呼ばれる一般的なタスクを検討する。
我々はこのタスクをワッサーシュタイン偏差を目的関数とする離散最適化問題としてモデル化する。
この問題はnp-hardであるが、亜モジュラー性を持つことを証明し、0.63近似のグリーディアルゴリズムを使うことができる。
しかし,目的関数評価ごとに線形計画が必要となるため,アルゴリズムの効率は低下する。
この難しさを克服するため,我々は,強い双対性に基づく感度解析や,最適移動場におけるいわゆる$c$-transformといった一連の手法からなる加速度アルゴリズムを提案する。
実験により,運転シーンデータセットを含む部分的なwassersteinダイバージェンスの観点から2つのデータセットを効率的に作成できることを実証した。
関連論文リスト
- Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Condensing Graphs via One-Step Gradient Matching [50.07587238142548]
ネットワーク重みを訓練せずに1ステップのみの勾配マッチングを行う1ステップ勾配マッチング方式を提案する。
我々の理論的分析は、この戦略が実際のグラフの分類損失を減少させる合成グラフを生成することができることを示している。
特に、元のパフォーマンスの最大98%を近似しながら、データセットサイズを90%削減することが可能です。
論文 参考訳(メタデータ) (2022-06-15T18:20:01Z) - Low Budget Active Learning via Wasserstein Distance: An Integer
Programming Approach [81.19737119343438]
アクティブラーニング(Active Learning)とは、ラベル付きデータプールのコアサブセットをラベルに選択することで、ラベル付きデータでモデルをトレーニングするプロセスである。
本稿では,未ラベルプールからワッサーシュタイン距離を最小化するコアセットを選択するための新しい整数最適化問題を提案する。
我々の戦略は、ラベルのないプールで教師なし学習によって得られる高品質な潜伏的特徴を必要とする。
論文 参考訳(メタデータ) (2021-06-05T21:25:03Z) - Projection Robust Wasserstein Barycenter [36.97843660480747]
ワッサースタイン・バリセンターの 近似は 次元の呪いのため 数値的に困難です
本稿では,次元の呪いを緩和するプロジェクションロバストなワッサーシュタインバリセンタ(PRWB)を提案する。
論文 参考訳(メタデータ) (2021-02-05T19:23:35Z) - Learning High Dimensional Wasserstein Geodesics [55.086626708837635]
高次元の2つの確率分布の間のワッサーシュタイン測地線を計算するための新しい定式化と学習戦略を提案する。
ラグランジュ乗算器の手法を最適輸送(OT)問題の動的定式化に適用することにより、サドル点がワッサーシュタイン測地線であるミニマックス問題を導出する。
次に、深層ニューラルネットワークによる関数のパラメータ化を行い、トレーニングのためのサンプルベースの双方向学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-02-05T04:25:28Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - A Riemannian Block Coordinate Descent Method for Computing the
Projection Robust Wasserstein Distance [36.97843660480747]
wasserstein距離は、機械学習とディープラーニングにおいてますます重要になっている。
最近提案された次元の呪いを和らげるためのアプローチは、サンプルデータを低次元の部分空間に投影し、それから投影されたデータ間のワッサーシュタイン距離を計算することである。
しかし、このアプローチは、実際には非常に難しいStiefel多様体上の最大分問題を解決する必要があります。
本研究では,Stiefel多様体上の正規化最大ミン問題の新たな再構成に基づく,この問題を解くための新しいブロック座標降下法(RBCD)を提案する。
論文 参考訳(メタデータ) (2020-12-09T17:47:56Z) - Wasserstein k-means with sparse simplex projection [20.661025590877774]
本稿では,ヒストグラムデータに対するより高速なワッサースタイン$k$-meansアルゴリズムを提案する。
我々はデータサンプル、セントロイド、地価行列を縮小する。
クラスタリング品質の劣化を低く保ちながら,スパース・シンプルックス・プロジェクションを利用する。
論文 参考訳(メタデータ) (2020-11-25T06:37:45Z) - Online Model Selection for Reinforcement Learning with Function
Approximation [50.008542459050155]
我々は、$tildeO(L5/6 T2/3)$ regretで最適な複雑性に適応するメタアルゴリズムを提案する。
また、メタアルゴリズムは、インスタンス依存の後悔境界を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-11-19T10:00:54Z) - Stochastic Optimization for Regularized Wasserstein Estimators [10.194798773447879]
ワッサーシュタイン推定器勾配の正規化版を、自然次元のサブ線形なステップ毎の時間で解くアルゴリズムを導入する。
このアルゴリズムは他のタスクにも拡張可能であることを示し、その中にはWasserstein Barycentersの推定も含まれる。
論文 参考訳(メタデータ) (2020-02-20T12:04:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。