論文の概要: The Flag Median and FlagIRLS
- arxiv url: http://arxiv.org/abs/2203.04437v1
- Date: Tue, 8 Mar 2022 23:06:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 14:24:58.203093
- Title: The Flag Median and FlagIRLS
- Title(参考訳): 旗の中央値とフラガールは
- Authors: Nathan Mankovich, Emily King, Chris Peterson, Michael Kirby
- Abstract要約: 本研究は、フラグ中央値である新しいサブスペースプロトタイプを提案し、その計算にFragIRLSアルゴリズムを導入する。
我々は,旗の中央値が外れ値に対して頑健であり,Linde-Buzo-GreyLBGのようなアルゴリズムで効果的に使用できることを示す。
FlagIRLSを使ってフラグを中央値に計算すると、合成データセット上で4ドルに収まる。
- 参考スコア(独自算出の注目度): 1.5943398589344562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding prototypes (e.g., mean and median) for a dataset is central to a
number of common machine learning algorithms. Subspaces have been shown to
provide useful, robust representations for datasets of images, videos and more.
Since subspaces correspond to points on a Grassmann manifold, one is led to
consider the idea of a subspace prototype for a Grassmann-valued dataset. While
a number of different subspace prototypes have been described, the calculation
of some of these prototypes has proven to be computationally expensive while
other prototypes are affected by outliers and produce highly imperfect
clustering on noisy data. This work proposes a new subspace prototype, the flag
median, and introduces the FlagIRLS algorithm for its calculation. We provide
evidence that the flag median is robust to outliers and can be used effectively
in algorithms like Linde-Buzo-Grey (LBG) to produce improved clusterings on
Grassmannians. Numerical experiments include a synthetic dataset, the MNIST
handwritten digits dataset, the Mind's Eye video dataset and the UCF YouTube
action dataset. The flag median is compared the other leading algorithms for
computing prototypes on the Grassmannian, namely, the $\ell_2$-median and to
the flag mean. We find that using FlagIRLS to compute the flag median converges
in $4$ iterations on a synthetic dataset. We also see that Grassmannian LBG
with a codebook size of $20$ and using the flag median produces at least a
$10\%$ improvement in cluster purity over Grassmannian LBG using the flag mean
or $\ell_2$-median on the Mind's Eye dataset.
- Abstract(参考訳): データセットのプロトタイプ(平均と中央値)を見つけることは、多くの一般的な機械学習アルゴリズムの中心である。
サブスペースは、画像やビデオなどのデータセットに有用で堅牢な表現を提供することが示されている。
部分空間はグラスマン多様体上の点に対応するので、グラスマン値のデータセットに対する部分空間の原型を考えることが導かれる。
多くの異なるサブスペースのプロトタイプが説明されているが、これらのプロトタイプのいくつかは計算コストが高く、他のプロトタイプは外れ値の影響を受け、ノイズの多いデータに対して非常に不完全なクラスタリングを生成する。
本研究は、フラグ中央値である新しいサブスペースプロトタイプを提案し、その計算にFragIRLSアルゴリズムを導入する。
旗の中央値が外れ値に対して頑健であることを示す証拠を,Linde-Buzo-Grey (LBG) などのアルゴリズムで有効に使用して,グラスマン多様体上のクラスタリングを改善する。
数値実験には、合成データセット、MNIST手書き桁データセット、Mind's Eyeビデオデータセット、UCF YouTubeアクションデータセットが含まれる。
フラグ中央値は、グラスマンのプロトタイプを計算する他の主要なアルゴリズム、すなわち$\ell_2$-medianとフラグ平均と比較される。
FlagIRLSを使ってフラグを中央値に計算すると、合成データセット上で4ドルの反復で収束する。
また、コードブックサイズが20ドルで、フラグ中央値を使用すると、フラグの平均値またはMind's Eyeデータセットの$\ell_2$-medianを使用して、Grassmannian LBGに対するクラスタ純度が少なくとも10\%以上向上する。
関連論文リスト
- $G$-Mapper: Learning a Cover in the Mapper Construction [0.7852714805965528]
Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
我々のアルゴリズムは,アンダーソン・ダーリング試験を反復的に適用することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
論文 参考訳(メタデータ) (2023-09-12T22:51:16Z) - Efficiently Learning One-Hidden-Layer ReLU Networks via Schur
Polynomials [50.90125395570797]
正方形損失に関して、標準的なガウス分布の下での$k$ReLU活性化の線形結合をPAC学習する問題をmathbbRd$で検討する。
本研究の主な成果は,この学習課題に対して,サンプルおよび計算複雑性が$(dk/epsilon)O(k)$で,epsilon>0$が目標精度である。
論文 参考訳(メタデータ) (2023-07-24T14:37:22Z) - Chordal Averaging on Flag Manifolds and Its Applications [22.357999963733302]
本稿では, 弦韻法の下でのフラグ多様体上の点集合のフラグ平均とフラグ中間値を計算するための, 証明可能な新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-23T17:57:28Z) - Communication-Efficient Adam-Type Algorithms for Distributed Data Mining [93.50424502011626]
我々はスケッチを利用した新しい分散Adam型アルゴリズムのクラス(例:SketchedAMSGrad)を提案する。
我々の新しいアルゴリズムは、反復毎に$O(frac1sqrtnT + frac1(k/d)2 T)$の高速収束率を$O(k log(d))$の通信コストで達成する。
論文 参考訳(メタデータ) (2022-10-14T01:42:05Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Towards Meta-learned Algorithm Selection using Implicit Fidelity
Information [13.750624267664156]
IMFASは、計算コストの低い任意のメタ機能によって容易に豊かになる情報的ランドマークを生産する。
テスト期間中に、ほぼ半分の忠実度シーケンスでSuccessive Halvingを破ることができることを示す。
論文 参考訳(メタデータ) (2022-06-07T09:14:24Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Cluster Representatives Selection in Non-Metric Spaces for Nearest
Prototype Classification [4.176752121302988]
本稿では,オブジェクトの小さいが代表的なサブセットをクラスタのプロトタイプとして選択する新しい手法であるCRSを提案する。
NN-Descentアルゴリズムにより生成された各クラスタの類似度グラフ表現を活用することにより、代表者のメモリと計算効率のよい選択が可能となる。
CRSはグラフベースのアプローチのため、任意の計量空間や非計量空間で使用することができる。
論文 参考訳(メタデータ) (2021-07-03T04:51:07Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - The flag manifold as a tool for analyzing and comparing data sets [4.864283334686195]
データ雲の形状と配向は、パターン認識システムを見極める観測の多様性を反映している。
フラグ多様体を用いたネスト付き部分空間法は,そのような余剰要因にどう対処できるかを示す。
論文 参考訳(メタデータ) (2020-06-24T22:29:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。