論文の概要: Agent-Centric Personalized Multiple Clustering with Multi-Modal LLMs
- arxiv url: http://arxiv.org/abs/2503.22241v2
- Date: Mon, 31 Mar 2025 02:56:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 11:09:40.117861
- Title: Agent-Centric Personalized Multiple Clustering with Multi-Modal LLMs
- Title(参考訳): マルチモードLCMを用いたエージェント中心パーソナライズ多重クラスタリング
- Authors: Ziye Chen, Yiqun Duan, Riheng Zhu, Zhenbang Sun, Mingming Gong,
- Abstract要約: エージェント中心のパーソナライズされたクラスタリングフレームワークを提案する。
エージェントはリレーショナルグラフを横断して、ユーザの関心事に基づいてクラスタを検索する。
その結果,提案手法はカードオーダーとカードサイツのベンチマークで0.9667と0.9481のNMIスコアを得ることができた。
- 参考スコア(独自算出の注目度): 40.38930402847949
- License:
- Abstract: Personalized multiple clustering aims to generate diverse partitions of a dataset based on different user-specific aspects, rather than a single clustering. It has recently drawn research interest for accommodating varying user preferences. Recent approaches primarily use CLIP embeddings with proxy learning to extract representations biased toward user clustering preferences. However, CLIP primarily focuses on coarse image-text alignment, lacking a deep contextual understanding of user interests. To overcome these limitations, we propose an agent-centric personalized clustering framework that leverages multi-modal large language models (MLLMs) as agents to comprehensively traverse a relational graph to search for clusters based on user interests. Due to the advanced reasoning mechanism of MLLMs, the obtained clusters align more closely with user-defined criteria than those obtained from CLIP-based representations. To reduce computational overhead, we shorten the agents' traversal path by constructing a relational graph using user-interest-biased embeddings extracted by MLLMs. A large number of weakly connected edges can be filtered out based on embedding similarity, facilitating an efficient traversal search for agents. Experimental results show that the proposed method achieves NMI scores of 0.9667 and 0.9481 on the Card Order and Card Suits benchmarks, respectively, largely improving the SOTA model by over 140%.
- Abstract(参考訳): パーソナライズされた複数のクラスタリングは、単一のクラスタリングではなく、異なるユーザ固有の側面に基づいて、データセットのさまざまなパーティションを生成することを目的としている。
最近、様々なユーザー嗜好の調整に研究の関心を寄せている。
最近のアプローチでは、主にプロキシ学習を伴うCLIP埋め込みを使用して、ユーザのクラスタリングの好みに偏った表現を抽出している。
しかし、CLIPは主に粗いイメージテキストアライメントに重点を置いており、ユーザの関心事に対する深いコンテキスト理解が欠如している。
これらの制約を克服するために,マルチモーダルな大規模言語モデル(MLLM)をエージェントとして活用し,ユーザ興味に基づくクラスタ検索のために関係グラフを包括的にトラバースする,エージェント中心のパーソナライズされたクラスタリングフレームワークを提案する。
MLLMの高度な推論機構により、得られたクラスタは、CLIPベースの表現から得られるものよりも、ユーザ定義基準とより密に一致している。
計算オーバーヘッドを低減するため,MLLMによって抽出されたユーザ-関心バイアス埋め込みを用いて関係グラフを構築することにより,エージェントの移動経路を短縮する。
多数の弱結合エッジを埋め込み類似性に基づいてフィルタリングすることができ、エージェントの効率的なトラバース探索を容易にする。
実験の結果,提案手法はカードオーダーとカードサイツのベンチマークでそれぞれ0.9667と0.9481のNMIスコアを達成し,SOTAモデルを140%以上改善した。
関連論文リスト
- Personalized Clustering via Targeted Representation Learning [12.685373069492448]
クラスタリングは伝統的に、ラベルのないデータ内の自然なグループ構造を明らかにすることを目的としています。
ターゲット表現学習を明示的に行うパーソナライズされたクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-12-18T10:28:51Z) - Customized Multiple Clustering via Multi-Modal Subspace Proxy Learning [8.447067012487866]
我々は、マルチモーダルなサブスペースプロキシ学習フレームワークを組み込んだ、新しいエンドツーエンドのマルチクラスタリングアプローチであるMulti-Subを紹介する。
我々の手法は、視覚的多重クラスタリングタスクにおいて、幅広いデータセットの集合において、既存のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2024-11-06T15:14:27Z) - Improved Diversity-Promoting Collaborative Metric Learning for Recommendation [127.08043409083687]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T07:44:48Z) - Multi-Modal Proxy Learning Towards Personalized Visual Multiple Clustering [8.447067012487866]
マルチMaPは,マルチモーダルなプロキシ学習プロセスを用いた新しい手法である。
キーワードを通じてユーザの関心をキャプチャすると同時に、関連するクラスタリングの特定を容易にする。
実験の結果,Multi-MaPは全ベンチマークのマルチクラスタ・ビジョンタスクにおいて常に最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-04-24T05:20:42Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.972599673048582]
汎用データのためのエンドツーエンドのディープラーニングベースのMVCフレームワークを提案する。
我々のアプローチは、新しい置換に基づく正準相関目標を用いて有意義な融合データ表現を学習することである。
10つのMVCベンチマークデータセットを用いて、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z) - Large Language Models Enable Few-Shot Clustering [88.06276828752553]
大規模言語モデルは、クエリ効率が良く、数発のセミ教師付きテキストクラスタリングを可能にするために、専門家のガイダンスを増幅できることを示す。
最初の2つのステージにLSMを組み込むことで、クラスタの品質が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-07-02T09:17:11Z) - The Minority Matters: A Diversity-Promoting Collaborative Metric
Learning Algorithm [154.47590401735323]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-09-30T08:02:18Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。