論文の概要: SEMASIA: A Large-Scale Dataset of Semantically Structured Latent Representations
- arxiv url: http://arxiv.org/abs/2605.09485v1
- Date: Sun, 10 May 2026 11:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.273321
- Title: SEMASIA: A Large-Scale Dataset of Semantically Structured Latent Representations
- Title(参考訳): SEMASIA: 意味的に構造化された潜在表現の大規模データセット
- Authors: Mario Edoardo Pandolfo, Enrico Grimaldi, Lorenzo Marinucci, Leonardo Di Nino, Simone Fiorellino, Sergio Barbarossa, Paolo Di Lorenzo,
- Abstract要約: 約1,700個の事前学習された視覚モデルから抽出した潜在表現の大規模コレクションであるSEMASIAを紹介する。
個々の潜在空間の概念的構造を解析し、一貫したプロトタイプのようなクラスタリングを示す。
プレトレーニングデータの複雑性,特殊化,伝達学習,拡張,モデルスケールが,埋め込みの幾何学的および探索的特性とどのように関係しているかを,大規模回帰分析により解析する。
- 参考スコア(独自算出の注目度): 12.185380843937196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latent representations learned by neural networks often exhibit semantic structure, where concept similarity is reflected by geometric proximity in embedding space. However, comparing such spaces across models remains difficult: changes in architecture, pretraining data, objective, or random seed can yield embeddings with similar content but incompatible geometry. This latent space alignment problem is central to interpretability, transfer and multimodal learning, federated systems, and semantic communication; however, progress remains limited by the lack of large-scale, model-diverse, and metadata-rich benchmarks. To address this gap, we introduce SEMASIA, a large-scale collection of latent representations extracted from approximately 1,700 pretrained vision models across eight standard image-classification benchmarks. SEMASIA pairs embeddings with structured metadata describing architectures, training regimes, pretraining sources, and model scale. We demonstrate three applications of the resource. First, we analyze the conceptual organization of individual latent spaces, showing consistent prototype-like clustering and hierarchical semantic neighborhoods across models and datasets. Second, we benchmark supervised alignment mappings between latent spaces using reconstruction error and downstream task performance. Third, we perform a large-scale regression analysis of how pretraining-data complexity, specialization, transfer learning, augmentation, and model scale relate to geometric and probing properties of embeddings. By coupling representational scale with standardized metadata, SEMASIA provides a reproducible foundation for studying latent geometry, evaluating alignment methods, and developing next-generation heterogeneous and interoperable AI systems.
- Abstract(参考訳): ニューラルネットワークによって学習された潜在表現は、しばしば意味構造を示し、概念の類似性は埋め込み空間における幾何学的近接によって反映される。
しかし、そのような空間をモデル間で比較することは困難である: アーキテクチャの変更、事前学習データ、目的、ランダムシードは、類似した内容を持つが相容れない幾何学的な埋め込みをもたらす。
この潜在空間アライメント問題は、解釈可能性、転送、マルチモーダル学習、フェデレーションシステム、セマンティックコミュニケーションの中心であるが、大規模、モデル多様性、メタデータに富むベンチマークが欠如しているため、進歩は依然として限られている。
このギャップに対処するために,約1,700の事前学習された視覚モデルから8つの標準画像分類ベンチマークから抽出した,大規模な潜在表現のコレクションであるSEMASIAを導入する。
SEMASIAはアーキテクチャ、トレーニングレシスタンス、事前トレーニングソース、モデルスケールを記述する構造化メタデータと組込む。
資源の3つの応用を実演する。
まず、個々の潜在空間の概念的構造を分析し、モデルとデータセットをまたいだ一貫したプロトタイプのようなクラスタリングと階層的なセマンティック・エリアを示す。
第2に、再構成誤りと下流タスク性能を用いた潜在空間間のアライメントマッピングをベンチマークした。
第3に,プレトレーニングデータの複雑性,特殊化,伝達学習,拡張,モデルスケールが,埋め込みの幾何学的および探索的特性とどのように関係しているかを,大規模回帰分析により解析する。
SEMASIAは、表現スケールと標準化されたメタデータを結合することにより、潜時幾何学の研究、アライメント手法の評価、次世代の不均一で相互運用可能なAIシステムの開発のための再現可能な基盤を提供する。
関連論文リスト
- Pair2Scene: Learning Local Object Relations for Procedural Scene Generation [10.247549170637418]
Pair2Sceneは、学習したローカルルールとシーン階層と物理ベースのアルゴリズムを統合する新しい手続き生成フレームワークである。
私たちのフレームワークは、トレーニングデータを超えた複雑な環境を生成する上で、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2026-04-13T17:59:55Z) - Tracing the Roots: A Multi-Agent Framework for Uncovering Data Lineage in Post-Training LLMs [81.43302841109349]
学習後のデータは、大規模言語モデル(LLM)の機能を形成する上で重要な役割を果たす
本稿では,データセット開発における進化グラフを再構築する自動マルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-12T06:24:07Z) - Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文 参考訳(メタデータ) (2025-09-22T07:23:07Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Connecting Neural Models Latent Geometries with Relative Geodesic Representations [21.71782603770616]
遅延構造を異なる潜在空間間で共有する場合、表現間の相対距離を歪みまで保存できることが示される。
異なるニューラルモデルは、ほぼ同じ基礎多様体をパラメータ化し、プルバック計量に基づく表現を導入すると仮定する。
本手法は,オートエンコーダと視覚基盤識別モデルを対象として,モデルの縫合と検索のタスクについて検証する。
論文 参考訳(メタデータ) (2025-06-02T12:34:55Z) - Learning Abstract World Models with a Group-Structured Latent Space [12.685414866379366]
学習された遷移モデルの表現多様体に幾何的事前を課すことができるかを示す。
実験により、これは完全な非構造的アプローチよりも潜伏遷移モデルのより良い予測に繋がることを示した。
論文 参考訳(メタデータ) (2025-06-02T10:43:18Z) - Interpretable deformable image registration: A geometric deep learning perspective [9.13809412085203]
解釈可能な登録フレームワークを設計するための理論的基盤を提示する。
粗い方法で変換を洗練するエンドツーエンドのプロセスを定式化します。
我々は、最先端のアプローチよりもパフォーマンスの指標が大幅に改善されたと結論付けている。
論文 参考訳(メタデータ) (2024-12-17T19:47:10Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - On Characterizing the Evolution of Embedding Space of Neural Networks
using Algebraic Topology [9.537910170141467]
特徴埋め込み空間のトポロジがベッチ数を介してよく訓練されたディープニューラルネットワーク(DNN)の層を通過するとき、どのように変化するかを検討する。
深度が増加するにつれて、トポロジカルに複雑なデータセットが単純なデータセットに変換され、ベッチ数はその最小値に達することが示される。
論文 参考訳(メタデータ) (2023-11-08T10:45:12Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。