論文の概要: A Large-Scale Sensitivity Analysis on Latent Embeddings and Dimensionality Reductions for Text Spatializations
- arxiv url: http://arxiv.org/abs/2407.17876v1
- Date: Thu, 25 Jul 2024 08:46:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 14:38:10.824699
- Title: A Large-Scale Sensitivity Analysis on Latent Embeddings and Dimensionality Reductions for Text Spatializations
- Title(参考訳): テキスト空間化のための潜伏埋め込みの大規模感度解析と次元化
- Authors: Daniel Atzberger, Tim Cech, Willy Scheibel, Jürgen Döllner, Michael Behrisch, Tobias Schreck,
- Abstract要約: テキストコーパスの文書間の意味的類似性は、地図のようなメタファーを用いて可視化することができる。
これらの散乱プロットレイアウトは、文書終端行列の次元的縮小や、潜伏埋め込み内の表現によって生じる。
本稿では,テキストコーパスの変化に関して,これらのレイアウトの安定性を解析する感度研究について述べる。
- 参考スコア(独自算出の注目度): 4.810926556822174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The semantic similarity between documents of a text corpus can be visualized using map-like metaphors based on two-dimensional scatterplot layouts. These layouts result from a dimensionality reduction on the document-term matrix or a representation within a latent embedding, including topic models. Thereby, the resulting layout depends on the input data and hyperparameters of the dimensionality reduction and is therefore affected by changes in them. Furthermore, the resulting layout is affected by changes in the input data and hyperparameters of the dimensionality reduction. However, such changes to the layout require additional cognitive efforts from the user. In this work, we present a sensitivity study that analyzes the stability of these layouts concerning (1) changes in the text corpora, (2) changes in the hyperparameter, and (3) randomness in the initialization. Our approach has two stages: data measurement and data analysis. First, we derived layouts for the combination of three text corpora and six text embeddings and a grid-search-inspired hyperparameter selection of the dimensionality reductions. Afterward, we quantified the similarity of the layouts through ten metrics, concerning local and global structures and class separation. Second, we analyzed the resulting 42817 tabular data points in a descriptive statistical analysis. From this, we derived guidelines for informed decisions on the layout algorithm and highlight specific hyperparameter settings. We provide our implementation as a Git repository at https://github.com/hpicgs/Topic-Models-and-Dimensionality-Reduction-Sensitivity-Study and results as Zenodo archive at https://doi.org/10.5281/zenodo.12772898.
- Abstract(参考訳): テキストコーパスの文書間のセマンティックな類似性は、2次元のスキャッタプロットレイアウトに基づいてマップのようなメタファを用いて可視化することができる。
これらのレイアウトは、文書終末行列の次元的縮小や、トピックモデルを含む潜在埋め込み内の表現から生じる。
これにより、結果のレイアウトは次元減少の入力データとハイパーパラメータに依存し、従ってそれらの変化に影響される。
さらに、結果のレイアウトは、入力データの変化と次元減少のハイパーパラメータの影響を受けます。
しかし、そのようなレイアウトの変更は、ユーザーによる追加の認知的努力を必要とする。
本研究では,(1)テキストコーパスの変化,(2)ハイパーパラメータの変化,(3)初期化におけるランダム性について,これらのレイアウトの安定性を解析する感度研究を提案する。
このアプローチには、データ計測とデータ分析という2つの段階があります。
まず,3つのテキストコーパスと6つのテキスト埋め込みの組み合わせと,グリッド探索による次元減少のハイパーパラメータ選択のレイアウトを導出した。
その後、局所的・大域的構造とクラス分離に関する10の指標を用いて、レイアウトの類似性を定量化した。
次に,得られた42817個の表データ点を記述的統計解析により解析した。
そこで我々は、レイアウトアルゴリズムに関する情報決定のためのガイドラインを導出し、特定のハイパーパラメータ設定をハイライトする。
https://github.com/hpicgs/Topic-Models-and-dimensionality-reduction-Sensitivity-StudyでGitリポジトリとして実装し、その結果をZenodo Archive at https://doi.org/10.5281/zenodo.12772898で公開しています。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - WorDepth: Variational Language Prior for Monocular Depth Estimation [47.614203035800735]
本研究は,2つの固有不明瞭なモダリティを併用して,メートル法スケールの再構成を行うことができるかどうかを考察する。
一つの画像から高密度深度マップを予測する問題である単眼深度推定に焦点をあてる。
我々のアプローチはテキストと画像の分岐を交互に訓練する。
論文 参考訳(メタデータ) (2024-04-04T17:54:33Z) - Dynamic Visual Semantic Sub-Embeddings and Fast Re-Ranking [0.5242869847419834]
情報エントロピーを低減するために動的ビジュアルセマンティックサブエンベッドディングフレームワーク(DVSE)を提案する。
生成した候補埋め込みに様々な意味的変動を捉えるよう促すため,混合分布を構築した。
3つのベンチマークデータセット上の4つの画像特徴エンコーダと2つのテキスト特徴エンコーダを用いて,既存のセットベース手法と比較した。
論文 参考訳(メタデータ) (2023-09-15T04:39:11Z) - A Parse-Then-Place Approach for Generating Graphic Layouts from Textual
Descriptions [50.469491454128246]
我々は、図形レイアウト、すなわちテキストからラベルへのレイアウトを作成するためのガイダンスとしてテキストを使用し、設計障壁を低くすることを目的としています。
テキストからラベルへの変換は、テキストからの暗黙的、複合的、不完全な制約を考慮する必要があるため、難しい作業である。
この問題に対処するための2段階のアプローチとして,パース・セイン・プレース(parse-then-place)を提案する。
論文 参考訳(メタデータ) (2023-08-24T10:37:00Z) - Large-Scale Evaluation of Topic Models and Dimensionality Reduction
Methods for 2D Text Spatialization [2.6034734004409303]
本稿では,テキストコーパスの構造を抽出する上で,解釈可能なトピックモデルが有用であることを示す。
トピックモデルと次元削減に基づくテキスト空間化の効果的な設計のためのガイドラインを提案する。
論文 参考訳(メタデータ) (2023-07-17T14:08:25Z) - Attention Map Guided Transformer Pruning for Edge Device [98.42178656762114]
視覚トランスフォーマー (ViT) は, 全体的かつ隠蔽された人物再識別 (Re-ID) タスクにおいて, 有望な成功を収めた。
本稿では、冗長なトークンとヘッドの両方を除去する新しいアテンションマップガイド(AMG)トランスフォーマープルーニング法を提案する。
Occluded DukeMTMC と Market-1501 に関する総合的な実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-04-04T01:51:53Z) - Changepoint Analysis of Topic Proportions in Temporal Text Data [1.8262547855491456]
トピック比の分布に変化点を規定する特化時間トピックモデルを構築した。
まず、サンプル分割を用いてトピックのポリトープを推定し、次に確率比統計を適用した。
歴史的に知られているいくつかの変化点を取得し、新しい変化点を発見する。
論文 参考訳(メタデータ) (2021-11-29T17:20:51Z) - Integrating Visuospatial, Linguistic and Commonsense Structure into
Story Visualization [81.26077816854449]
まず、構造的入力を符号化するための選挙区解析木の利用について検討する。
第二に、構造化されたインプットをコモンセンス情報で強化し、この外部知識が視覚的ストーリーの生成に与える影響について検討する。
第3に、境界ボックスと高密度キャプションによって視覚構造を組み込んで、生成された画像の文字やオブジェクトに関するフィードバックを提供する。
論文 参考訳(メタデータ) (2021-10-21T00:16:02Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。