論文の概要: Supervised Tree-Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2101.11520v1
- Date: Wed, 27 Jan 2021 16:24:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-01 19:23:21.643263
- Title: Supervised Tree-Wasserstein Distance
- Title(参考訳): supervised tree-wasserstein distance
- Authors: Yuki Takezawa, Ryoma Sato, Makoto Yamada
- Abstract要約: そこで本研究では,木メータに基づく高速かつ教師付きメトリック学習手法であるSupervised Tree-Wasserstein (STW) 距離を提案する。
我々はSTW距離を高速に計算できることを示し、文書分類タスクの精度を向上させる。
- 参考スコア(独自算出の注目度): 21.9998734051455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To measure the similarity of documents, the Wasserstein distance is a
powerful tool, but it requires a high computational cost. Recently, for fast
computation of the Wasserstein distance, methods for approximating the
Wasserstein distance using a tree metric have been proposed. These tree-based
methods allow fast comparisons of a large number of documents; however, they
are unsupervised and do not learn task-specific distances. In this work, we
propose the Supervised Tree-Wasserstein (STW) distance, a fast, supervised
metric learning method based on the tree metric. Specifically, we rewrite the
Wasserstein distance on the tree metric by the parent-child relationships of a
tree, and formulate it as a continuous optimization problem using a contrastive
loss. Experimentally, we show that the STW distance can be computed fast, and
improves the accuracy of document classification tasks. Furthermore, the STW
distance is formulated by matrix multiplications, runs on a GPU, and is
suitable for batch processing. Therefore, we show that the STW distance is
extremely efficient when comparing a large number of documents.
- Abstract(参考訳): 文書の類似性を測定するために、wasserstein距離は強力なツールであるが、高い計算コストを必要とする。
近年,wasserstein距離の高速計算のために,ツリーメトリックを用いたwasserstein距離近似法が提案されている。
これらの木ベースの手法は多数の文書を高速に比較することができるが、教師なしでありタスク固有の距離を学習しない。
本研究では,木距離に基づく高速で教師付きメトリック学習法であるSupervised Tree-Wasserstein (STW) 距離を提案する。
具体的には、ツリーの親子関係によって、ツリーメトリック上のWasserstein距離を書き換え、コントラスト損失を用いた連続最適化問題として定式化します。
実験により, stw距離を高速に計算できることを示し, 文書分類タスクの精度を向上させる。
さらに、stw距離は行列乗算によって定式化され、gpu上で動作し、バッチ処理に適している。
したがって,大量の文書を比較する場合,stw距離は極めて効率的であることを示す。
関連論文リスト
- Fast unsupervised ground metric learning with tree-Wasserstein distance [14.235762519615175]
教師なしの地上距離学習アプローチが導入されました
木にサンプルや特徴を埋め込むことでWSV法を強化し,木-ワッサーシュタイン距離(TWD)を計算することを提案する。
我々は、このアルゴリズムが最もよく知られた方法よりも完全なWSVアプローチの近似に収束し、$mathcalO(n3)$複雑さを持つことを理論的かつ経験的に実証する。
論文 参考訳(メタデータ) (2024-11-11T23:21:01Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - A Class of Topological Pseudodistances for Fast Comparison of
Persistence Diagrams [0.3968603035422276]
拡張トポロジカル擬似距離(ETD)という擬似距離のクラスを導入する。
ETDはチューナブルな複雑さを持ち、スライク距離と古典的なワッサーシュタイン距離を高複素度極大で近似することができる。
ETDがPSよりも精度が高く、計算複雑性の点でワッサースタインとスライスされたワッサースタイン距離より優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2024-02-22T12:27:35Z) - Tree Prompting: Efficient Task Adaptation without Fine-Tuning [112.71020326388029]
Tree Promptingはプロンプトの決定ツリーを構築し、複数のLMコールをリンクしてタスクを解決する。
分類データセットの実験により、Tree Promptingは競合するメソッドよりも精度が向上し、微調整と競合することが示された。
論文 参考訳(メタデータ) (2023-10-21T15:18:22Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Robust Multi-Object Tracking by Marginal Inference [92.48078680697311]
ビデオにおける多目的追跡は、隣接するフレーム内のオブジェクト間の1対1の割り当てに関する根本的な問題を解決する必要がある。
本稿では,各オブジェクトの限界確率をリアルタイムに計算する効率的な手法を提案する。
MOT17とMOT20ベンチマークで競合する結果を得る。
論文 参考訳(メタデータ) (2022-08-07T14:04:45Z) - Approximating 1-Wasserstein Distance with Trees [41.77145868123863]
Wasserstein distanceは、自然言語処理(NLP)とコンピュータビジョン(CV)の様々な用途で有効である。
ワッサースタイン距離を推定する際の課題の1つは、計算コストが高く、多くの分布比較タスクではうまくスケールしないことである。
樹木の縁の重みを学習するための,単純かつ効率的なL1正規化手法を提案する。
論文 参考訳(メタデータ) (2022-06-24T07:19:50Z) - Wasserstein Distances, Geodesics and Barycenters of Merge Trees [9.149293243237778]
本稿では, マージ木の距離, 測地線, バリセンタを推定するための統一的な計算枠組みを提案する。
我々は, 地磁気学とバリセンターの効率的な計算を可能にするために, マージツリー間のワッサーシュタイン距離という新しい測定基準を導入する。
論文 参考訳(メタデータ) (2021-07-16T09:27:49Z) - Metric Learning for Ordered Labeled Trees with pq-grams [11.284638114256712]
pq-gram を用いた木構造データに対する新しい計量学習手法を提案する。
pq-gram 距離は順序付きラベル付き木の距離であり、木編集距離よりも計算コストがはるかに低い。
提案手法は,最先端の編集距離に基づく手法を用いて,競合的な結果が得られることを実証的に示す。
論文 参考訳(メタデータ) (2020-03-09T08:04:47Z) - Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces [62.35667646858558]
本稿では, アンカー・エナジー (AE) とアンカー・ワッサースタイン (AW) 距離を紹介する。
我々の主な貢献は、素案実装が立方体となる対数四重項時間でAEを正確に計算するスイープラインアルゴリズムを提案することである。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
論文 参考訳(メタデータ) (2020-02-05T03:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。