Fugu-MT 論文翻訳(概要): Leveraging LLM Embeddings for Cross Dataset Label Alignment and Zero Shot Music Emotion Prediction

論文の概要: Leveraging LLM Embeddings for Cross Dataset Label Alignment and Zero Shot Music Emotion Prediction

arxiv url: http://arxiv.org/abs/2410.11522v2
Date: Thu, 17 Oct 2024 08:18:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:35.758602
Title: Leveraging LLM Embeddings for Cross Dataset Label Alignment and Zero Shot Music Emotion Prediction
Title（参考訳）: クロスデータセットラベルアライメントとゼロショット音楽感情予測のためのLLM埋め込みの活用
Authors: Renhang Liu, Abhinaba Roy, Dorien Herremans,
Abstract要約: 本稿では,複数データセットにまたがるラベルアライメントと,新たなカテゴリにおけるゼロショット予測にLarge Language Model (LLM)埋め込みを利用する音楽感情認識の新しい手法を提案する。我々は,新たなデータセットに対してゼロショット推論を行うことにより,新たなトレーニングを伴わずに,未知のラベルに一般化できることを示す。
参考スコア（独自算出の注目度）: 6.806050368211496
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this work, we present a novel method for music emotion recognition that leverages Large Language Model (LLM) embeddings for label alignment across multiple datasets and zero-shot prediction on novel categories. First, we compute LLM embeddings for emotion labels and apply non-parametric clustering to group similar labels, across multiple datasets containing disjoint labels. We use these cluster centers to map music features (MERT) to the LLM embedding space. To further enhance the model, we introduce an alignment regularization that enables dissociation of MERT embeddings from different clusters. This further enhances the model's ability to better adaptation to unseen datasets. We demonstrate the effectiveness of our approach by performing zero-shot inference on a new dataset, showcasing its ability to generalize to unseen labels without additional training.
Abstract（参考訳）: 本研究では,複数データセットにまたがるラベルアライメントと,新たなカテゴリにおけるゼロショット予測にLarge Language Model (LLM) 埋め込みを利用する音楽感情認識の新しい手法を提案する。まず、感情ラベルに対するLLM埋め込みを計算し、非パラメトリッククラスタリングを類似ラベル群に適用する。我々はこれらのクラスタセンターを用いて音楽特徴(MERT)をLLM埋め込み空間にマップする。モデルをさらに強化するために,異なるクラスタからのMERT埋め込みの解離を可能にするアライメント正規化を導入する。これにより、目に見えないデータセットへの適応性を向上するモデルの能力をさらに強化する。我々は,新たなデータセットに対してゼロショット推論を行うことにより,新たなトレーニングを伴わずに,未知のラベルに一般化できることを示す。

関連論文リスト

ESMC: MLLM-Based Embedding Selection for Explainable Multiple Clustering [79.69917150582633]
MLLM(Multi-modal large language model)は、ユーザ主導のクラスタリングを実現するために利用することができる。本手法はまず,MLLMのテキストトークンの隠蔽状態が対応する特徴と強く関連していることを明らかにする。また、擬似ラベル学習を付加した軽量クラスタリングヘッドを採用し、クラスタリング精度を大幅に向上させた。
論文参考訳（メタデータ） (2025-11-30T04:36:51Z)
Intent Clustering with Shared Pseudo-Labels [18.746184073913813]
インテントクラスタリングのための直感的で,トレーニングのない,ラベルのない手法を提案する。提案手法は,同一クラスタに属するテキストがより多くのラベルを共有できるという仮説に基づいている。 4つのベンチマークセットに対する評価は,本手法が最近のベースラインに匹敵する結果が得られることを示している。
論文参考訳（メタデータ） (2025-10-16T12:54:40Z)
Label Set Optimization via Activation Distribution Kurtosis for Zero-shot Classification with Generative Models [16.130133009174124]
In-context Learning (ICL) のパフォーマンスは、迅速な設計に非常に敏感である。ゼロショット分類におけるクラスラベルオプション(レキシコンやオーダーなど)は未定のままである。本研究では,大規模言語モデルを用いたゼロショットICLにおける最適なラベルセット選択手法であるLOADSを提案する。
論文参考訳（メタデータ） (2024-10-24T22:59:23Z)
On Unsupervised Prompt Learning for Classification with Black-box Language Models [71.60563181678323]
大規模言語モデル(LLM)は、テキスト形式学習問題において顕著な成功を収めた。 LLMは、熟練した人間のアノテータよりも品質の高いデータセットをラベル付けすることができる。本稿では,ブラックボックス LLM を用いた分類のための教師なしのプロンプト学習を提案する。
論文参考訳（メタデータ） (2024-10-04T03:39:28Z)
Text Clustering as Classification with LLMs [6.030435811868953]
本研究では,大規模言語モデル(LLM)の文脈内学習能力を効果的に活用する,テキストクラスタリングのための新しいフレームワークを提案する。そこで本研究では,テキストクラスタリングをLLMによる分類タスクに変換することを提案する。我々のフレームワークは、最先端のクラスタリング手法に匹敵する、あるいは優れた性能を達成できることが実験的に証明されている。
論文参考訳（メタデータ） (2024-09-30T16:57:34Z)
Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。 ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文参考訳（メタデータ） (2024-08-26T15:49:31Z)
Scalable Label Distribution Learning for Multi-Label Classification [43.52928088881866]
マルチラベル分類(MLC、Multi-label classification)とは、あるインスタンスに関連ラベルのセットをタグ付けする問題を指す。既存のMLC法の多くは、ラベルペア内の2つのラベルの相関が対称であるという仮定に基づいている。既存のほとんどの手法はラベル数に関連する学習プロセスを設計しており、大規模な出力空間にスケールアップする際の計算複雑性をボトルネックにしている。
論文参考訳（メタデータ） (2023-11-28T06:52:53Z)
Rethinking Pre-Training in Tabular Data: A Neighborhood Embedding Perspective [71.45945607871715]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。中心となる考え方は、データインスタンスを共有機能空間に埋め込むことで、各インスタンスは、近隣の固定数とそのラベルまでの距離で表現される。 101データセットの大規模な実験は、微調整の有無にかかわらず、分類タスクと回帰タスクの両方においてTabPTMの有効性を確認した。
論文参考訳（メタデータ） (2023-10-31T18:03:54Z)
Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文参考訳（メタデータ） (2023-04-04T14:00:59Z)
Ground Truth Inference for Weakly Supervised Entity Matching [76.6732856489872]
弱監督タスクのための単純だが強力なラベル付けモデルを提案する。次に、エンティティマッチングのタスクに特化してラベルモデルを調整します。その結果,従来の手法よりもF1スコアが9%高い結果が得られた。
論文参考訳（メタデータ） (2022-11-13T17:57:07Z)
Active Learning in Incomplete Label Multiple Instance Multiple Label Learning [17.5720245903743]
MIML設定におけるアクティブラーニングのための新しいバッグクラスペア方式を提案する。我々のアプローチは、効率的かつ正確な推論を伴う識別的グラフィカルモデルに基づいている。
論文参考訳（メタデータ） (2021-07-22T17:01:28Z)
Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文参考訳（メタデータ） (2021-03-23T07:57:39Z)
An Empirical Study on Large-Scale Multi-Label Text Classification Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。 Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。 BERTとLWANを組み合わせた最先端手法を提案する。
論文参考訳（メタデータ） (2020-10-04T18:55:47Z)
Generalized Label Enhancement with Sample Correlations [24.582764493585362]
サンプル相関付きラベル拡張(LESC)と、サンプル相関付きラベル拡張(gLESC)の2つの新しいラベル拡張手法を提案する。サンプル相関から,提案手法はラベル強化性能を向上させることができる。
論文参考訳（メタデータ） (2020-04-07T03:32:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。