論文の概要: Text-Guided Alternative Image Clustering
- arxiv url: http://arxiv.org/abs/2406.18589v1
- Date: Fri, 7 Jun 2024 08:37:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 05:40:31.441833
- Title: Text-Guided Alternative Image Clustering
- Title(参考訳): テキストガイドによる代替画像クラスタリング
- Authors: Andreas Stephan, Lukas Miklautz, Collin Leiber, Pedro Henrique Luz de Araujo, Dominik Répás, Claudia Plant, Benjamin Roth,
- Abstract要約: この研究は、代替画像クラスタリングを容易にするために、大きな視覚言語モデルの可能性を探るものである。
本稿では,ユーザの興味をプロンプトを通じて活用する新たなアプローチとして,テキストガイドによる代替イメージコンセンサスクラスタリング(TGAICC)を提案する。
TGAICCは、4つの代替イメージクラスタリングベンチマークデータセットで画像とテキストベースのベースラインを上回っている。
- 参考スコア(独自算出の注目度): 11.103514372355088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional image clustering techniques only find a single grouping within visual data. In particular, they do not provide a possibility to explicitly define multiple types of clustering. This work explores the potential of large vision-language models to facilitate alternative image clustering. We propose Text-Guided Alternative Image Consensus Clustering (TGAICC), a novel approach that leverages user-specified interests via prompts to guide the discovery of diverse clusterings. To achieve this, it generates a clustering for each prompt, groups them using hierarchical clustering, and then aggregates them using consensus clustering. TGAICC outperforms image- and text-based baselines on four alternative image clustering benchmark datasets. Furthermore, using count-based word statistics, we are able to obtain text-based explanations of the alternative clusterings. In conclusion, our research illustrates how contemporary large vision-language models can transform explanatory data analysis, enabling the generation of insightful, customizable, and diverse image clusterings.
- Abstract(参考訳): 従来の画像クラスタリング技術は、視覚データの中で単一のグループ化しか見つからない。
特に、複数のタイプのクラスタリングを明示的に定義する可能性は提供されていない。
この研究は、代替画像クラスタリングを容易にするために、大きな視覚言語モデルの可能性を探るものである。
我々は,多様なクラスタリングの発見を導くためのプロンプトを通じて,ユーザ指定の興味を生かした,テキストガイド型代替イメージコンセンサスクラスタリング(TGAICC)を提案する。
これを実現するために、各プロンプトのクラスタリングを生成し、階層的なクラスタリングを使用してグループ化し、コンセンサスクラスタリングを使用してそれらを集約する。
TGAICCは、4つの代替イメージクラスタリングベンチマークデータセットで画像とテキストベースのベースラインを上回っている。
さらに、カウントベースの単語統計を用いて、代替クラスタリングのテキストベースの説明を得ることができる。
結論として,現代の大規模視覚言語モデルが説明的データ分析を変換し,洞察に富んだ,カスタマイズ可能な,多様な画像クラスタリングの生成を可能にする方法について述べる。
関連論文リスト
- Organizing Unstructured Image Collections using Natural Language [37.16101036513514]
本稿では,大規模な画像コレクションからクラスタリング基準を自動的に検出することを目的としたタスクセマンティック・マルチクラスタリング(SMC)を紹介する。
当社のフレームワークであるText Driven Semantic Multiple Clustering (TeDeSC)は,テキストをプロキシとして使用して,大規模なイメージコレクションを同時に推論する。
偏見の発見やソーシャルメディア画像の人気分析など,さまざまな応用にTeDeSCを適用した。
論文 参考訳(メタデータ) (2024-10-07T17:21:46Z) - Text-Guided Image Clustering [15.217924518131268]
本稿では,画像キャプションと視覚質問応答(VQA)モデルを用いてテキストを生成するテキストガイド画像クラスタリングを提案する。
その結果,8種類の画像クラスタリングデータセットに対して,得られたテキスト表現が画像特徴より優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-05T13:34:21Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Image Clustering Conditioned on Text Criteria [14.704110575570166]
本稿では,ユーザが指定したテキスト基準に基づいて画像クラスタリングを行う手法を提案する。
テキスト基準に基づく画像クラスタリング条件 (IC|TC) と呼ぶ。
IC|TCは人間の介入を最小限かつ実用的に必要としており、ユーザーはクラスタリングの結果に対してかなりの制御を行うことができる。
論文 参考訳(メタデータ) (2023-10-27T17:35:01Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - CEIL: A General Classification-Enhanced Iterative Learning Framework for
Text Clustering [16.08402937918212]
短文クラスタリングのための新しい分類強化反復学習フレームワークを提案する。
各イテレーションにおいて、まず最初に言語モデルを採用して、初期テキスト表現を検索する。
厳密なデータフィルタリングと集約プロセスの後、クリーンなカテゴリラベルを持つサンプルが検索され、監督情報として機能する。
最後に、表現能力が改善された更新言語モデルを使用して、次のイテレーションでクラスタリングを強化する。
論文 参考訳(メタデータ) (2023-04-20T14:04:31Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Compositional Clustering: Applications to Multi-Label Object Recognition
and Speaker Identification [19.470445399577265]
本稿では,クラスタが構成的関係を持つことのできる,新たなクラスタリングタスクについて考察する。
サンプルをコヒーレントなグループに分割し,構成構造を推定できる3つの新しいアルゴリズムを提案する。
本研究は,複数話者からの同時発話によるオープンワールド多ラベル物体認識と話者識別・ダイアリゼーションへの応用について述べる。
論文 参考訳(メタデータ) (2021-09-09T10:42:14Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。