論文の概要: Multimodal Multi-User Surface Recognition with the Kernel Two-Sample
Test
- arxiv url: http://arxiv.org/abs/2303.04930v1
- Date: Wed, 8 Mar 2023 22:58:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-10 16:49:55.589259
- Title: Multimodal Multi-User Surface Recognition with the Kernel Two-Sample
Test
- Title(参考訳): カーネル2サンプルテストによるマルチモーダルマルチユーザ表面認識
- Authors: Behnam Khojasteh, Friedrich Solowjow, Sebastian Trimpe, Katherine J.
Kuchenbecker
- Abstract要約: 分類タスクに不均一なデータソースを扱えるフレームワークを提案する。
我々のデータ逆データアプローチは,高次元空間における分布の差分を自動的に定量化する。
我々は108のサーフェスクラスを持つ標準マルチユーザーデータセットで97.2%の精度を達成し、タスクのより難しいバージョンでは最先端の機械学習アルゴリズムを6%上回った。
- 参考スコア(独自算出の注目度): 15.051737123188174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning and deep learning have been used extensively to classify
physical surfaces through images and time-series contact data. However, these
methods rely on human expertise and entail the time-consuming processes of data
and parameter tuning. To overcome these challenges, we propose an easily
implemented framework that can directly handle heterogeneous data sources for
classification tasks. Our data-versus-data approach automatically quantifies
distinctive differences in distributions in a high-dimensional space via kernel
two-sample testing between two sets extracted from multimodal data (e.g.,
images, sounds, haptic signals). We demonstrate the effectiveness of our
technique by benchmarking against expertly engineered classifiers for
visual-audio-haptic surface recognition due to the industrial relevance,
difficulty, and competitive baselines of this application; ablation studies
confirm the utility of key components of our pipeline. As shown in our
open-source code, we achieve 97.2% accuracy on a standard multi-user dataset
with 108 surface classes, outperforming the state-of-the-art machine-learning
algorithm by 6% on a more difficult version of the task. The fact that our
classifier obtains this performance with minimal data processing in the
standard algorithm setting reinforces the powerful nature of kernel methods for
learning to recognize complex patterns.
- Abstract(参考訳): 機械学習とディープラーニングは、画像と時系列接触データを通じて物理的表面を分類するために広く使われている。
しかし、これらの手法は人間の専門知識に依存し、データとパラメータチューニングの時間を要する。
これらの課題を克服するため,我々は分類タスクにおいて異種データを直接処理できるフレームワークを提案する。
data-versus-dataアプローチは,マルチモーダルデータ(画像,音声,触覚信号など)から抽出した2セット間のカーネル2サンプルテストを通じて,高次元空間における分布の識別的な差異を自動的に定量化する。
本手法は,産業的妥当性,難易度,競合ベースラインによる視覚・触覚面認識のための高度に設計された分類器に対するベンチマークを行い,その効果を実証する。
オープンソースコードで示されているように、108のサーフェスクラスを持つ標準マルチユーザデータセットで97.2%の精度を実現し、タスクのより難しいバージョンでは最先端の機械学習アルゴリズムを6%上回った。
我々の分類器が最小限のデータ処理でこの性能を得るという事実は、複雑なパターンを認識するためのカーネルメソッドの強力な性質を補強する。
関連論文リスト
- Leveraging Mixture of Experts for Improved Speech Deepfake Detection [53.69740463004446]
スピーチのディープフェイクは、個人のセキュリティとコンテンツの信頼性に重大な脅威をもたらす。
本研究では,Mixture of Expertsアーキテクチャを用いた音声深度検出性能の向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T13:24:03Z) - Continual Learning for Multimodal Data Fusion of a Soft Gripper [1.0589208420411014]
あるデータモダリティに基づいてトレーニングされたモデルは、異なるモダリティでテストした場合、しばしば失敗する。
異なるデータモダリティを漸進的に学習できる連続学習アルゴリズムを提案する。
我々は、アルゴリズムの有効性を、挑戦的なカスタムマルチモーダルデータセット上で評価する。
論文 参考訳(メタデータ) (2024-09-20T09:53:27Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Learning from the Best: Active Learning for Wireless Communications [9.523381807291049]
アクティブな学習アルゴリズムは、ラベル付けされていないデータセットの中で最も重要で情報に富んだサンプルを特定し、完全なデータセットではなく、これらのサンプルのみをラベル付けする。
本稿では, ディープラーニングに基づくmmWaveビーム選択のケーススタディとして, 包括探索に基づく計算集約アルゴリズムを用いてラベル付けを行う。
この結果から,クラス不均衡データセットに対するアクティブな学習アルゴリズムを用いることで,データセットのラベル付けオーバーヘッドを最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-01-23T12:21:57Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Understanding learning from EEG data: Combining machine learning and
feature engineering based on hidden Markov models and mixed models [0.0]
前頭蓋振動は空間ナビゲーションや記憶において重要な役割を担っていると考えられている。
EEGデータセットは非常に複雑で、神経信号の変化を解釈しにくくする。
本稿では,脳波データから特徴を抽出するために隠れマルコフと線形混合効果モデルを提案する。
論文 参考訳(メタデータ) (2023-11-14T12:24:12Z) - A Dimensional Structure based Knowledge Distillation Method for
Cross-Modal Learning [15.544134849816528]
簡単な作業から抽出した特徴を解析・観察することで特徴識別性と次元構造(DS)の相関を見いだす。
クロスモーダル・ナレッジ・蒸留法 (CMKD) を提案し, 教師付きクロスモーダル・ラーニング (CML) の性能向上を図る。
提案手法は, チャネル的に独立して, 中間的な特徴を均一に分散させることで, その精度を高めるために, 難易度から意味的に無関係な特徴を学習する。
論文 参考訳(メタデータ) (2023-06-28T07:29:26Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Meta Two-Sample Testing: Learning Kernels for Testing with Limited Data [21.596650236820377]
メタ2サンプルテスト(M2ST)の問題点について紹介する。
M2STは、関連するタスクの補助的データを利用して、新しいターゲットタスクの強力なテストを素早く特定できるアルゴリズムを見つけることを目的としている。
提案するメタテスト方式は,少ない観察結果から直接,学習カーネルベースのテストより優れているという理論的正当性および実証的証拠を提供する。
論文 参考訳(メタデータ) (2021-06-14T17:52:50Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。