論文の概要: IsoScore: Measuring the Uniformity of Vector Space Utilization
- arxiv url: http://arxiv.org/abs/2108.07344v1
- Date: Mon, 16 Aug 2021 20:58:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 13:27:15.654501
- Title: IsoScore: Measuring the Uniformity of Vector Space Utilization
- Title(参考訳): isoscore: ベクトル空間利用の均一性を測定する
- Authors: William Rudman, Nate Gillman, Taylor Rayne, Carsten Eickhoff
- Abstract要約: 既存のメトリクスは脆弱であり、点雲の真の空間分布を難読化する傾向がある。
IsoScore は、点雲が周囲ベクトル空間を均一に利用する度合いを定量化する新しい計量である。
- 参考スコア(独自算出の注目度): 5.362258158646463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent success of distributed word representations has led to an
increased interest in analyzing the properties of their spatial distribution.
Current metrics suggest that contextualized word embedding models do not
uniformly utilize all dimensions when embedding tokens in vector space. Here we
argue that existing metrics are fragile and tend to obfuscate the true spatial
distribution of point clouds. To ameliorate this issue, we propose IsoScore: a
novel metric which quantifies the degree to which a point cloud uniformly
utilizes the ambient vector space. We demonstrate that IsoScore has several
desirable properties such as mean invariance and direct correspondence to the
number of dimensions used, which are properties that existing scores do not
possess. Furthermore, IsoScore is conceptually intuitive and computationally
efficient, making it well suited for analyzing the distribution of point clouds
in arbitrary vector spaces, not necessarily limited to those of word embeddings
alone. Additionally, we use IsoScore to demonstrate that a number of recent
conclusions in the NLP literature that have been derived using brittle metrics
of spatial distribution, such as average cosine similarity, may be incomplete
or altogether inaccurate.
- Abstract(参考訳): 最近の分散語表現の成功は、その空間分布の性質を分析することへの関心を高めた。
現在のメトリクスは、文脈化された単語埋め込みモデルは、ベクトル空間にトークンを埋め込むとき、すべての次元を均一に利用しないことを示唆している。
ここでは、既存の測度は脆弱であり、点雲の真の空間分布を難読化する傾向がある。
この問題を改善するため,我々は,点雲が空間ベクトル空間を均一に利用する程度を定量化する新しい計量isoscoreを提案する。
その結果,isoscoreは平均不変性や使用次元数との直接対応など,既存のスコアが持っていない性質として望ましい性質がいくつかあることが分かった。
さらに、isoscoreは概念的に直感的で計算効率が良く、任意のベクトル空間における点雲の分布を分析するのに適しており、必ずしも単語埋め込みのみに限定されるわけではない。
さらに、IsoScoreを用いて、平均コサイン類似性などの空間分布の脆度測定値を用いて導出された最近のNLP文献の結論が不完全あるいは完全に不正確であることを示す。
関連論文リスト
- Learning Continuous Implicit Field with Local Distance Indicator for
Arbitrary-Scale Point Cloud Upsampling [55.05706827963042]
点雲アップサンプリングは、疎点雲から密度が高く均一に分散した点集合を生成することを目的としている。
従来のメソッドは通常、スパースポイントクラウドをいくつかのローカルパッチ、アップサンプルパッチポイント、すべてのアップサンプルパッチにマージする。
そこで本研究では,点雲のアップサンプリングのために,局所的な先行者によって導かれる符号のない距離場を学習する手法を提案する。
論文 参考訳(メタデータ) (2023-12-23T01:52:14Z) - Quadric Representations for LiDAR Odometry, Mapping and Localization [93.24140840537912]
現在のLiDARオードメトリ、マッピング、ローカライズ手法は、3Dシーンのポイントワイズ表現を利用する。
3次元オブジェクトのよりコンパクトな表現である2次元曲面を用いたシーン記述法を提案する。
提案手法は低レイテンシとメモリの有効性を維持しつつ、競争力があり、しかも精度も優れている。
論文 参考訳(メタデータ) (2023-04-27T13:52:01Z) - Deep Graph-based Spatial Consistency for Robust Non-rigid Point Cloud
Registration [34.510680340166]
非剛点雲登録における外部対応プルーニングの問題点について検討する。
剛性登録では、空間整合性は、慣性器から外乱器を識別するために一般的に使用される基準である。
グラフベース空間整合性ネットワーク(GraphSCNet)を提案する。
論文 参考訳(メタデータ) (2023-03-17T13:15:03Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Rethinking Spatial Invariance of Convolutional Networks for Object
Counting [119.83017534355842]
局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
論文 参考訳(メタデータ) (2022-06-10T17:51:25Z) - Dimensionality Reduction for Categorical Data [0.9560980936110233]
FSketchを用いて、スパース分類データのスケッチを作成するとともに、ペアのハミング距離を推定する推定器を提案する。
FSketchは大幅に高速であり、そのスケッチを用いて得られる精度は、RMSE、クラスタリング、類似検索の標準的な教師なしタスクの上位にある。
論文 参考訳(メタデータ) (2021-12-01T09:20:28Z) - Elliptical Ordinal Embedding [0.0]
通常の埋め込みは、「item $j$ is close to item $i$ than item $k$」という形式の制約の集合からオブジェクトの低次元表現を見つけることを目的としている。
論文 参考訳(メタデータ) (2021-05-21T16:54:53Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - Spatial Transformer Point Convolution [47.993153127099895]
点雲上での異方性畳み込みフィルタを実現するための空間変圧器点畳み込み法を提案する。
暗黙的な幾何学的構造を捉え表現するために,特に空間方向辞書を導入する。
変換空間では、標準画像のような畳み込みを利用して異方性フィルタリングを生成することができる。
論文 参考訳(メタデータ) (2020-09-03T03:12:25Z) - A new effective and efficient measure for outlying aspect mining [9.208621189251337]
Outlying Aspect Mining (OAM)は、与えられたクエリが与えられたデータセットに対して外れ値となるサブスペースを見つけることを目的としている。
既存のOAMアルゴリズムでは、従来の距離/密度ベースのアウトリーチスコアを使用してサブスペースをランク付けする。
部分空間の次元に依存しないSiNNEという新しいスコアを導入する。
論文 参考訳(メタデータ) (2020-04-28T14:20:51Z) - Intrinsic Dimension Estimation via Nearest Constrained Subspace
Classifier [7.028302194243312]
教師付き分類や固有次元推定のために,新しい部分空間に基づく分類器を提案する。
各クラスのデータの分布は、特徴空間の有限個のファイン部分空間の和によってモデル化される。
The proposed method is a generalization of classical NN (Nearest Neighbor), NFL (Nearest Feature Line) and has a close relationship with NS (Nearest Subspace)。
推定次元パラメータが正確に推定された分類器は、一般に分類精度の点で競合より優れている。
論文 参考訳(メタデータ) (2020-02-08T20:54:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。