論文の概要: Topological data analysis of human vowels: Persistent homologies across
representation spaces
- arxiv url: http://arxiv.org/abs/2310.06508v1
- Date: Tue, 10 Oct 2023 10:37:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 15:58:08.653376
- Title: Topological data analysis of human vowels: Persistent homologies across
representation spaces
- Title(参考訳): ヒト母音のトポロジ的データ解析:表現空間にまたがる永続的ホモロジー
- Authors: Guillem Bonafos, Jean-Marc Freyermuth, Pierre Pudlo, Samuel
Tron\c{c}on, Arnaud Rey
- Abstract要約: トポロジカルデータ解析(TDA)は、信号/画像処理における様々なタスクに成功している。
本稿では,3つの異なる表現空間から抽出したトポロジカルシグネチャの識別情報の品質を評価する。
近年の2つの問題に対して,トポロジ的に増大したランダム林は,Mel-Frequency Cepstral Coefficients(MFCC)のみをベースとしたOOB(Out-of-Bag Error)を改善していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topological Data Analysis (TDA) has been successfully used for various tasks
in signal/image processing, from visualization to supervised/unsupervised
classification. Often, topological characteristics are obtained from persistent
homology theory. The standard TDA pipeline starts from the raw signal data or a
representation of it. Then, it consists in building a multiscale topological
structure on the top of the data using a pre-specified filtration, and finally
to compute the topological signature to be further exploited. The commonly used
topological signature is a persistent diagram (or transformations of it).
Current research discusses the consequences of the many ways to exploit
topological signatures, much less often the choice of the filtration, but to
the best of our knowledge, the choice of the representation of a signal has not
been the subject of any study yet. This paper attempts to provide some answers
on the latter problem. To this end, we collected real audio data and built a
comparative study to assess the quality of the discriminant information of the
topological signatures extracted from three different representation spaces.
Each audio signal is represented as i) an embedding of observed data in a
higher dimensional space using Taken's representation, ii) a spectrogram viewed
as a surface in a 3D ambient space, iii) the set of spectrogram's zeroes. From
vowel audio recordings, we use topological signature for three prediction
problems: speaker gender, vowel type, and individual. We show that
topologically-augmented random forest improves the Out-of-Bag Error (OOB) over
solely based Mel-Frequency Cepstral Coefficients (MFCC) for the last two
problems. Our results also suggest that the topological information extracted
from different signal representations is complementary, and that spectrogram's
zeros offers the best improvement for gender prediction.
- Abstract(参考訳): トポロジカルデータ分析(TDA)は、可視化から教師なし/教師なしの分類に至るまで、信号/画像処理における様々なタスクに成功している。
しばしば、位相的特性は永続ホモロジー理論から得られる。
標準tdaパイプラインは、生信号データまたはその表現から開始される。
そして、あらかじめ特定されたフィルタを用いてデータの上部にマルチスケールの位相構造を構築し、最終的にさらに活用されるようなトポロジ的シグネチャを計算する。
一般的に用いられるトポロジカルシグネチャは永続的なダイアグラム(あるいはその変換)である。
現在の研究では、トポロジカルなシグネチャを利用する多くの方法の結果について論じており、フィルターの選択はそれほど多くはないが、我々の知る限り、信号の表現の選択は、まだ研究の対象にはなっていない。
本稿では,後者の問題に対するいくつかの回答を提供する。
そこで我々は,3つの異なる表現空間から抽出したトポロジカルシグネチャの識別情報の品質を評価するために,実音声データを収集し,比較研究を行った。
各音声信号は、
i) take の表現を用いた高次元空間への観測データの埋め込み
二 三次元環境空間における表面と見なす分光図
三 分光器の零点の集合
母音音声記録から,話者性,母音タイプ,個人という3つの予測問題にトポロジ的シグネチャを用いた。
近年の2つの問題に対して,トポロジ的に増大したランダム林は,Mel-Frequency Cepstral Coefficients(MFCC)のみをベースとしたOOB(Out-of-Bag Error)を改善した。
また,異なる信号表現から抽出された位相情報は相補的であり,スペクトログラムのゼロは性予測に最適な改善をもたらすことが示唆された。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Mitigating Label Noise on Graph via Topological Sample Selection [72.86862597508077]
トポロジ情報を活用することで,グラフ内の情報的サンプル選択プロセスを促進できる$textitTopological Sample Selection$ (TSS)法を提案する。
提案手法は,対象のクリーン分布下での予測されるリスク上限の上限を最小化し,最先端のベースラインと比較して,提案手法の優位性を実験的に示す。
論文 参考訳(メタデータ) (2024-03-04T11:24:51Z) - Semi-supervised Segmentation of Histopathology Images with Noise-Aware Topological Consistency [11.783112213482632]
TopoSemiSegは、ラベルのない画像からトポロジカル表現を学習する最初の半教師付き手法である。
教師と学生モデルの表現を整合させるため,雑音を考慮したトポロジカル整合性損失を導入する。
病理組織像データセットを用いた実験により,本手法の優位性を示した。
論文 参考訳(メタデータ) (2023-11-28T03:04:35Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - Alleviating neighbor bias: augmenting graph self-supervise learning with
structural equivalent positive samples [1.0507062889290775]
グラフ表現学習のための信号駆動型自己教師方式を提案する。
トポロジカル情報誘導構造等価サンプリング戦略を用いる。
その結果,モデルの性能を効果的に改善できることが示唆された。
論文 参考訳(メタデータ) (2022-12-08T16:04:06Z) - Topological Data Analysis for Speech Processing [10.00176964652466]
このような特徴の上に構築された単純な線形分類器は、微調整された分類ヘッドよりも優れていることを示す。
また、トポロジカルな特徴は、音声トランスフォーマーヘッドの機能的役割を明らかにすることができることを示す。
論文 参考訳(メタデータ) (2022-11-30T18:22:37Z) - Spectral-Spatial Global Graph Reasoning for Hyperspectral Image
Classification [50.899576891296235]
畳み込みニューラルネットワークは、ハイパースペクトル画像分類に広く応用されている。
近年の手法は空間トポロジのグラフ畳み込みによってこの問題に対処しようとしている。
論文 参考訳(メタデータ) (2021-06-26T06:24:51Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z) - Topological Data Analysis in Text Classification: Extracting Features
with Additive Information [2.1410799064827226]
位相データ解析は高次元数値データに適用することが困難である。
トポロジカルな特徴は、従来のテキストマイニングでは捉えられていない独占的な情報を持っている。
アンサンブルモデルにおける従来の特徴に位相的特徴を加えることで、分類結果が改善される。
論文 参考訳(メタデータ) (2020-03-29T21:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。