論文の概要: GraFPrint: A GNN-Based Approach for Audio Identification
- arxiv url: http://arxiv.org/abs/2410.10994v1
- Date: Mon, 14 Oct 2024 18:20:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 13:03:16.164345
- Title: GraFPrint: A GNN-Based Approach for Audio Identification
- Title(参考訳): GraFPrint: 音声識別のためのGNNベースのアプローチ
- Authors: Aditya Bhattacharjee, Shubhr Singh, Emmanouil Benetos,
- Abstract要約: GraFPrintは、グラフニューラルネットワーク(GNN)の構造学習機能を活用して、堅牢なオーディオ指紋を作成するオーディオ識別フレームワークである。
GraFPrintは、さまざまなレベルの粒度の大規模データセット上での優れたパフォーマンスを示し、軽量かつスケーラブルであることを証明している。
- 参考スコア(独自算出の注目度): 11.71702857714935
- License:
- Abstract: This paper introduces GraFPrint, an audio identification framework that leverages the structural learning capabilities of Graph Neural Networks (GNNs) to create robust audio fingerprints. Our method constructs a k-nearest neighbor (k-NN) graph from time-frequency representations and applies max-relative graph convolutions to encode local and global information. The network is trained using a self-supervised contrastive approach, which enhances resilience to ambient distortions by optimizing feature representation. GraFPrint demonstrates superior performance on large-scale datasets at various levels of granularity, proving to be both lightweight and scalable, making it suitable for real-world applications with extensive reference databases.
- Abstract(参考訳): 本稿では,グラフニューラルネットワーク(GNN)の構造学習機能を活用し,堅牢な音声指紋を生成するGraFPrintについて紹介する。
提案手法は,k-nearest neighbor(k-NN)グラフを時間周波数表現から構築し,局所的および大域的情報を符号化するために最大相対グラフ畳み込みを適用する。
ネットワークは自己教師付きコントラスト的アプローチを用いて訓練され、特徴表現を最適化することで周囲の歪みに対するレジリエンスを高める。
GraFPrintは、さまざまなレベルの粒度の大規模データセット上での優れたパフォーマンスを示し、軽量かつスケーラブルであることを示し、広範な参照データベースを持つ現実世界のアプリケーションに適している。
関連論文リスト
- LHGNN: Local-Higher Order Graph Neural Networks For Audio Classification and Tagging [23.464493621300242]
この研究は、特徴理解を強化するグラフベースモデルであるLocal-Higher Order Graph Neural Network (LHGNN)を紹介する。
公開されている3つのオーディオデータセットに対するモデルの評価は、Transformerベースのモデルをすべてのベンチマークで上回っていることを示している。
論文 参考訳(メタデータ) (2025-01-07T01:45:39Z) - Tokenphormer: Structure-aware Multi-token Graph Transformer for Node Classification [9.967313792318606]
構造対応マルチトークングラフ変換器(Tokenphormer)を提案する。
複数のトークンを生成し、局所的および構造的な情報をキャプチャし、異なるレベルの粒度でグローバルな情報を探索する。
実験により,提案したTokenphormerのノード分類タスクにおける最先端性能を実現することができることを示した。
論文 参考訳(メタデータ) (2024-12-19T10:44:18Z) - FedRGL: Robust Federated Graph Learning for Label Noise [5.296582539751589]
Federated Graph Learning(FGL)は、グラフニューラルネットワークに基づく分散機械学習パラダイムである。
本稿では,FedRGLと呼ばれるラベルノイズを用いた頑健なグラフ学習手法を提案する。
FedRGLは、様々なノイズ率、タイプ、クライアント数で12のベースライン手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-28T04:37:04Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - Parameter-Efficient Tuning Large Language Models for Graph Representation Learning [62.26278815157628]
Graph-awareを導入します。
GPEFT - グラフ表現学習のための新しい手法。
グラフニューラルネットワーク(GNN)を用いて、隣接するノードからグラフプロンプトに構造情報をエンコードする。
我々は8つの異なるテキストリッチグラフで実施した総合的な実験を通じて,リンク予測評価において hit@1 と Mean Reciprocal Rank (MRR) の平均 2% の改善を観察し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-04-28T18:36:59Z) - Local Augmentation for Graph Neural Networks [78.48812244668017]
本稿では,局所的な部分グラフ構造によりノード特性を向上する局所拡張を提案する。
局所的な拡張に基づいて、プラグイン・アンド・プレイ方式で任意のGNNモデルに適用可能な、LA-GNNという新しいフレームワークをさらに設計する。
論文 参考訳(メタデータ) (2021-09-08T18:10:08Z) - GNNAutoScale: Scalable and Expressive Graph Neural Networks via
Historical Embeddings [51.82434518719011]
GNNAutoScale(GAS)は、任意のメッセージパスGNNを大規模グラフにスケールするためのフレームワークである。
ガスは、前回のトレーニングの繰り返しから過去の埋め込みを利用して計算グラフのサブツリー全体を掘り起こします。
ガスは大規模グラフ上で最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2021-06-10T09:26:56Z) - Robust Optimization as Data Augmentation for Large-scale Graphs [117.2376815614148]
学習中に勾配に基づく逆方向摂動を伴うノード特徴を反復的に拡張するFLAG(Free Large-scale Adversarial Augmentation on Graphs)を提案する。
FLAGはグラフデータに対する汎用的なアプローチであり、ノード分類、リンク予測、グラフ分類タスクで普遍的に機能する。
論文 参考訳(メタデータ) (2020-10-19T21:51:47Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。