論文の概要: $\texttt{InfoHier}$: Hierarchical Information Extraction via Encoding and Embedding
- arxiv url: http://arxiv.org/abs/2501.08717v1
- Date: Wed, 15 Jan 2025 10:58:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:53:32.323798
- Title: $\texttt{InfoHier}$: Hierarchical Information Extraction via Encoding and Embedding
- Title(参考訳): $\texttt{InfoHier}$:エンコーディングと埋め込みによる階層的情報抽出
- Authors: Tianru Zhang, Li Ju, Prashant Singh, Salman Toor,
- Abstract要約: $texttInfoHier$は、堅牢な潜在表現と階層構造を学ぶためのフレームワークである。
適応的な表現を提供し、HCの複雑なパターンをキャプチャする能力を高める。
HCロスを統合してSSLトレーニングを洗練し、基盤となる情報階層に調整された表現をもたらす。
- 参考スコア(独自算出の注目度): 0.7499722271664147
- License:
- Abstract: Analyzing large-scale datasets, especially involving complex and high-dimensional data like images, is particularly challenging. While self-supervised learning (SSL) has proven effective for learning representations from unlabelled data, it typically focuses on flat, non-hierarchical structures, missing the multi-level relationships present in many real-world datasets. Hierarchical clustering (HC) can uncover these relationships by organizing data into a tree-like structure, but it often relies on rigid similarity metrics that struggle to capture the complexity of diverse data types. To address these we envision $\texttt{InfoHier}$, a framework that combines SSL with HC to jointly learn robust latent representations and hierarchical structures. This approach leverages SSL to provide adaptive representations, enhancing HC's ability to capture complex patterns. Simultaneously, it integrates HC loss to refine SSL training, resulting in representations that are more attuned to the underlying information hierarchy. $\texttt{InfoHier}$ has the potential to improve the expressiveness and performance of both clustering and representation learning, offering significant benefits for data analysis, management, and information retrieval.
- Abstract(参考訳): 特に画像のような複雑で高次元のデータを含む大規模なデータセットの分析は特に難しい。
自己教師付き学習(SSL)は、非階層データから表現を学習するのに有効であることが証明されているが、通常はフラットで非階層構造に焦点を合わせ、多くの実世界のデータセットに存在するマルチレベルな関係を欠いている。
階層的クラスタリング(HC)は、データをツリーのような構造に整理することでこれらの関係を明らかにすることができるが、多種多様なデータ型の複雑さを捉えるのに苦労する厳密な類似度メトリクスに依存することが多い。
これらの問題に対処するために、SSLとHCを組み合わせたフレームワークである$\texttt{InfoHier}$を構想し、堅牢な潜在表現と階層構造を共同で学習する。
このアプローチではSSLを活用して適応表現を提供し、複雑なパターンをキャプチャするHCの能力を向上する。
同時に、HC損失を統合してSSLトレーニングを洗練し、基礎となる情報階層に直感的な表現をもたらす。
$\texttt{InfoHier}$は、クラスタリングと表現学習の両方の表現力とパフォーマンスを向上させる可能性があり、データ分析、管理、情報検索に多大な利益をもたらす。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Structure-enhanced Contrastive Learning for Graph Clustering [4.6746630466993055]
ネットワーク構造を利用した構造強化コントラスト学習(SECL)を導入している。
SECLは、クロスビューコントラスト学習機構を使用して、精巧なデータ拡張なしにノード埋め込みを強化する。
6つのデータセットに対する大規模な実験により、SECLが現在の最先端手法よりも優れていることが確認された。
論文 参考訳(メタデータ) (2024-08-19T08:39:08Z) - Struct-X: Enhancing Large Language Models Reasoning with Structured Data [38.558614152006975]
構造Xは5つの重要なフェーズを通して動作する:read-model-fill-reflect-reason'
構造化データをグラフ埋め込みを用いて位相空間にエンコードする。
行方不明のエンティティ情報を知識検索モジュールで埋める。
最後のフェーズでは、選択したトークンでトポロジネットワークを構築する。
論文 参考訳(メタデータ) (2024-07-17T13:06:25Z) - SLRL: Structured Latent Representation Learning for Multi-view Clustering [24.333292079699554]
マルチビュークラスタリング(MVC)は、異なるビュー間の固有の一貫性と相補性を活用して、クラスタリングの結果を改善することを目的としている。
MVCでの広範な研究にもかかわらず、既存のほとんどのメソッドは、主にクラスタリングの有効性を高めるためにビューをまたいだ補完的な情報を活用することに重点を置いています。
本稿では,構造化潜在表現学習に基づくマルチビュークラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-07-11T09:43:57Z) - How Deep Networks Learn Sparse and Hierarchical Data: the Sparse Random Hierarchy Model [4.215221129670858]
生成的階層的データモデルに空間性を導入することで、スムーズな変換の離散バージョンである空間変換に対する非感受性を得ることを示す。
SRHMを学習するCNNのサンプルの複雑さが、タスクのスパーシリティと階層構造の両方に依存するかを定量化する。
論文 参考訳(メタデータ) (2024-04-16T17:01:27Z) - Scalable Incomplete Multi-View Clustering with Structure Alignment [71.62781659121092]
本稿では,新しいアンカーグラフ学習フレームワークを提案する。
ビュー固有のアンカーグラフを構築し、異なるビューから補完情報をキャプチャする。
提案したSIMVC-SAの時間と空間の複雑さはサンプル数と線形に相関していることが証明された。
論文 参考訳(メタデータ) (2023-08-31T08:30:26Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Learning Representations without Compositional Assumptions [79.12273403390311]
本稿では,特徴集合をグラフノードとして表現し,それらの関係を学習可能なエッジとして表現することで,特徴集合の依存関係を学習するデータ駆動型アプローチを提案する。
また,複数のビューから情報を動的に集約するために,より小さな潜在グラフを学習する新しい階層グラフオートエンコーダLEGATOを導入する。
論文 参考訳(メタデータ) (2023-05-31T10:36:10Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。