論文の概要: A weighted angle distance on strings
- arxiv url: http://arxiv.org/abs/2604.20633v1
- Date: Wed, 22 Apr 2026 14:46:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.181381
- Title: A weighted angle distance on strings
- Title(参考訳): 弦上の重み付き角度距離
- Authors: Grant Molnar,
- Abstract要約: 指数重みが $n$ のすべての $n$-gram 数ベクトル間の角度を集約することにより、弦上のマルチスケール計量 $d_$ を定義する。
我々は、DBSCANクラスタリングにおける$d_$を編集と$n$-gramベースラインに対してベンチマークし、評価のための線形時間接尾辞木アルゴリズムを提供し、計量および安定性特性を証明し、イソメトリーを特徴づける。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We define a multi-scale metric $d_ρ$ on strings by aggregating angle distances between all $n$-gram count vectors with exponential weights $ρ^n$. We benchmark $d_ρ$ in DBSCAN clustering against edit and $n$-gram baselines, give a linear-time suffix-tree algorithm for evaluation, prove metric and stability properties (including robustness under tandem-repeat stutters), and characterize isometries.
- Abstract(参考訳): 指数重みが $ρ^n$ のすべての $n$-gram 数ベクトル間の角度距離を集約することにより、弦上でのマルチスケール計量 $d_ρ$ を定義する。
我々はDBSCANクラスタリングにおける$d_ρ$を、編集と$n$-gramのベースラインに対してベンチマークし、評価のための線形時間接尾辞木アルゴリズムを提供し、計量および安定性特性(タンデム・リピート・スタッターによるロバスト性を含む)を証明し、アイソメトリーを特徴づける。
関連論文リスト
- Infinity Search: Approximate Vector Search with Projections on q-Metric Spaces [94.12116458306916]
我々は、$q$の測度空間において、計量木は三角形の不等式のより強いバージョンを活用でき、正確な探索の比較を減らすことができることを示した。
任意の異方性測度を持つデータセットを$q$-metric空間に埋め込む新しい射影法を提案する。
論文 参考訳(メタデータ) (2025-06-06T22:09:44Z) - Fast unsupervised ground metric learning with tree-Wasserstein distance [14.235762519615175]
教師なしの地上距離学習アプローチが導入されました
一つの有望な選択肢はワッサーシュタイン特異ベクトル(WSV)であり、特徴量とサンプルの間の最適な輸送距離を同時に計算する際に現れる。
木にサンプルや特徴を埋め込むことでWSV法を強化し,木-ワッサーシュタイン距離(TWD)を計算することを提案する。
論文 参考訳(メタデータ) (2024-11-11T23:21:01Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Leverage Score Sampling for Tensor Product Matrices in Input Sparsity
Time [54.65688986250061]
我々は,$q$-foldカラムワイドテンソル積の$q$行列に対応するグラム行列を近似するための入力空間時間サンプリングアルゴリズムを提案する。
我々のサンプリング技術は、合計時間でデータセット$X$に同時に適用できる$q$部分相関ランダムプロジェクションのコレクションに依存している。
論文 参考訳(メタデータ) (2022-02-09T15:26:03Z) - Empirical complexity of comparator-based nearest neighbor descent [0.0]
K$-nearest 隣り合うアルゴリズムの Java 並列ストリームの実装を示す。
Kullback-Leiblerの発散比較器による実験は、$K$-nearest近くの更新ラウンドの数が直径の2倍を超えないという予測を支持している。
論文 参考訳(メタデータ) (2022-01-30T21:37:53Z) - FriendlyCore: Practical Differentially Private Aggregation [67.04951703461657]
我々は、制約のない(擬似)計量空間から点の集合を$cal D$として取り出す、単純で実用的なツールである$mathsfFriendlyCore$を提案する。
$cal D$ が有効直径 $r$ を持つとき、$mathsfFriendlyCore$ はすべての点を含む "stable" サブセット $cal D_Gsubseteq cal D$ を返す。
$mathsfFriendlyCore$は、プライベートに集約する前に入力を前処理するために使用することができる。
論文 参考訳(メタデータ) (2021-10-19T17:43:50Z) - On Frink's type metrization of weighted graphs [0.0]
我々は、アフィニティ重み付き無向グラフの頂点$x$と$y$の間の計量$d(x,y)$を生成するための明示的なアルゴリズムを提供し、テストし、比較する。
論文 参考訳(メタデータ) (2020-08-02T21:28:59Z) - A metric on directed graphs and Markov chains based on hitting
probabilities [0.0]
エルゴード的、有限状態、時間均質なマルコフ連鎖の状態空間に関する計量を導入する。
提案手法は,あるノードから別のノードへのランダムウォーカーの移動に伴う距離空間の近さを仮定して構築した。
特に、私たちのメトリクスは、最も短くて平均的な歩行距離に敏感であり、既存のメトリクスと比較して新しい情報を与えます。
論文 参考訳(メタデータ) (2020-06-25T15:25:05Z) - Stable and consistent density-based clustering via multiparameter persistence [49.1574468325115]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。