論文の概要: Efficient Data Analytics on Augmented Similarity Triplets
- arxiv url: http://arxiv.org/abs/1912.12064v3
- Date: Sat, 18 Feb 2023 17:30:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-25 04:14:42.763343
- Title: Efficient Data Analytics on Augmented Similarity Triplets
- Title(参考訳): 拡張類似トリプレットの効率的なデータ分析
- Authors: Sarwan Ali, Muhammad Ahmad, Umair ul Hassan, Muhammad Asad Khan,
Shafiq Alam, Imdadullah Khan
- Abstract要約: 本稿では,既存のデータから隠された暗黙の情報を推測することで,三重項データを効率的に拡張する手法を提案する。
また,三重項に基づく共通データ解析タスクのための新しいアルゴリズムも提案する。
- 参考スコア(独自算出の注目度): 0.48933451909251774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data analysis require a pairwise proximity measure over objects. Recent work
has extended this to situations where the distance information between objects
is given as comparison results of distances between three objects (triplets).
Humans find the comparison tasks much easier than the exact distance
computation and such data can be easily obtained in big quantity via
crowd-sourcing. In this work, we propose triplets augmentation, an efficient
method to extend the triplets data by inferring the hidden implicit information
form the existing data. Triplets augmentation improves the quality of
kernel-based and kernel-free data analytics. We also propose a novel set of
algorithms for common data analysis tasks based on triplets. These methods work
directly with triplets and avoid kernel evaluations, thus are scalable to big
data. We demonstrate that our methods outperform the current best-known
techniques and are robust to noisy data.
- Abstract(参考訳): データ分析はオブジェクト上のペアワイズ近接測度を必要とする。
最近の研究は、物体間の距離情報を3つの物体(トリップレット)間の距離の比較結果として与える状況にまで拡張している。
人間は正確な距離計算よりも比較作業が容易であることに気付き、そのようなデータはクラウドソーシングによって大量に得ることができる。
本研究では,既存のデータから隠れた暗黙情報を推測することにより,トリプレットデータを拡張する効率的な手法であるトリプレット拡張を提案する。
triplets拡張により、カーネルベースおよびカーネルフリーのデータ分析の品質が向上する。
また,三重項に基づく共通データ解析タスクのための新しいアルゴリズムも提案する。
これらのメソッドはトリプレットと直接連携し、カーネル評価を避けるため、ビッグデータにスケーラブルである。
提案手法は,現在よく知られている手法より優れ,ノイズの多いデータに対して堅牢であることを示す。
関連論文リスト
- A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - TrueDeep: A systematic approach of crack detection with less data [0.0]
ドメイン知識をディープラーニングアーキテクチャと組み合わせることで、少ないデータで同様のパフォーマンスを実現することができることを示す。
我々のアルゴリズムは、全データの23%で開発され、テストデータ上でも同様の性能を持ち、複数の盲点データセット上では大幅に性能が向上した。
論文 参考訳(メタデータ) (2023-05-30T14:51:58Z) - Improving Few-Shot Generalization by Exploring and Exploiting Auxiliary
Data [100.33096338195723]
補助データを用いたFew-shot Learning(FLAD)に焦点を当てる。
FLADは、一般化を改善するために、数ショットの学習中に補助データへのアクセスを前提としている。
提案するアルゴリズムは EXP3-FLAD と UCB1-FLAD の2つである。
論文 参考訳(メタデータ) (2023-02-01T18:59:36Z) - Walk-and-Relate: A Random-Walk-based Algorithm for Representation
Learning on Sparse Knowledge Graphs [5.444459446244819]
本稿では,データ空間の問題に対処するため,三重項数を増加させる効率的な方法を提案する。
また,メタパスの集合から情報的メタパスを高精度かつ効率的に抽出する手法も提案する。
提案したアプローチはモデルに依存しず、拡張トレーニングデータセットは、任意のKG埋め込みアプローチを最初から使用することができる。
論文 参考訳(メタデータ) (2022-09-19T05:35:23Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Bridging the Reality Gap for Pose Estimation Networks using Sensor-Based
Domain Randomization [1.4290119665435117]
合成データに基づいて訓練された手法は、2Dの領域ランダム化をより発展させるため、2D画像を使用する。
提案手法では,3次元データをネットワークに統合し,ポーズ推定の精度を高める。
3つの大規模ポーズ推定ベンチマーク実験により, 提案手法は, 合成データを用いた従来手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2020-11-17T09:12:11Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - Succinct Trit-array Trie for Scalable Trajectory Similarity Search [3.2197141014728805]
膨大なトラジェクトリの集合の類似性探索は、これらのデータセットを知識に変えるのに不可欠である。
この問題に対処するため, トラジェクトリトアレイトリエ (tSTAT) のトラジェクトリ・インデクシングについて述べる。
tSTATは,最先端の類似性探索法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2020-05-21T21:42:30Z) - Active Sampling for Pairwise Comparisons via Approximate Message Passing
and Information Gain Maximization [5.771869590520189]
本稿では、近似メッセージパッシングと期待情報ゲインに基づくアクティブサンプリングアルゴリズムASAPを提案する。
既存の手法と比較して,ASAPは推定スコアの精度が最も高いことを示す。
論文 参考訳(メタデータ) (2020-04-12T20:48:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。