論文の概要: An Image is Worth $K$ Topics: A Visual Structural Topic Model with Pretrained Image Embeddings
- arxiv url: http://arxiv.org/abs/2504.10004v1
- Date: Mon, 14 Apr 2025 09:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:55:32.485327
- Title: An Image is Worth $K$ Topics: A Visual Structural Topic Model with Pretrained Image Embeddings
- Title(参考訳): A Image is Worth $K$ Topics: A Visual Structure Topic Model with Pretrained Image Embeddings
- Authors: Matías Piqueras, Alexandra Segerberg, Matteo Magnani, Måns Magnusson, Nataša Sladoje,
- Abstract要約: 本稿では、事前学習した画像埋め込みと構造トピックモデルを組み合わせた視覚構造トピックモデル(vSTM)を提案する。
我々は、vSTMが、オンライン政治コミュニケーションの研究に、解釈可能で、一貫性があり、実質的に関係のあるトピックを特定できることを示した。
- 参考スコア(独自算出の注目度): 40.701557052493214
- License:
- Abstract: Political scientists are increasingly interested in analyzing visual content at scale. However, the existing computational toolbox is still in need of methods and models attuned to the specific challenges and goals of social and political inquiry. In this article, we introduce a visual Structural Topic Model (vSTM) that combines pretrained image embeddings with a structural topic model. This has important advantages compared to existing approaches. First, pretrained embeddings allow the model to capture the semantic complexity of images relevant to political contexts. Second, the structural topic model provides the ability to analyze how topics and covariates are related, while maintaining a nuanced representation of images as a mixture of multiple topics. In our empirical application, we show that the vSTM is able to identify topics that are interpretable, coherent, and substantively relevant to the study of online political communication.
- Abstract(参考訳): 政治学者は、視覚的コンテンツを大規模に分析することにますます関心を寄せている。
しかし、既存の計算ツールボックスは、社会的・政治的探究の特定の課題や目標に合わせた方法やモデルがまだ必要である。
本稿では、事前学習した画像埋め込みと構造トピックモデルを組み合わせた視覚構造トピックモデル(vSTM)を提案する。
これは既存のアプローチに比べて大きな利点があります。
まず、事前訓練された埋め込みにより、モデルは政治的文脈に関連する画像の意味的な複雑さを捉えることができる。
第二に、構造的トピックモデルは、複数のトピックの混合として、画像のニュアンスな表現を維持しながら、トピックと共変量がどのように関連しているかを分析する能力を提供する。
我々の経験的応用では、vSTMは、オンライン政治コミュニケーションの研究に解釈可能で、一貫性があり、実質的に関係のあるトピックを特定できることを示す。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - GINopic: Topic Modeling with Graph Isomorphism Network [0.8962460460173959]
本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。
本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文 参考訳(メタデータ) (2024-04-02T17:18:48Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog [12.034554338597067]
マルチストラクチャ・コモンセンス・ナレッジ(RMK)を用いた新しいモデルを提案する。
我々のモデルでは、外部知識は文レベルの事実とグラフレベルの事実で表される。
これらの多構造表現の上に、我々のモデルは関連する知識を捉え、それらを視覚と意味的特徴に組み込むことができる。
論文 参考訳(メタデータ) (2022-04-10T13:12:10Z) - Query-Driven Topic Model [23.07260625816975]
トピックモデルの望ましい特性の1つは、ユーザーがコーパスの特定の側面を記述するトピックを見つけることを可能にすることである。
本稿では,単語やフレーズで簡単なクエリを指定し,クエリ関連トピックを返却する,新しいクエリ駆動トピックモデルを提案する。
論文 参考訳(メタデータ) (2021-05-28T22:49:42Z) - Matching Visual Features to Hierarchical Semantic Topics for Image
Paragraph Captioning [50.08729005865331]
本稿では,階層的トピック誘導画像段落生成フレームワークを開発した。
複数の抽象レベルでの画像とテキストの相関をキャプチャするために、変分推論ネットワークを設計します。
段落生成を導くために、学習した階層的トピックと視覚的特徴を言語モデルに統合する。
論文 参考訳(メタデータ) (2021-05-10T06:55:39Z) - How Far are We from Effective Context Modeling? An Exploratory Study on
Semantic Parsing in Context [59.13515950353125]
文法に基づく意味解析を行い,その上に典型的な文脈モデリング手法を適用する。
我々は,2つの大きなクロスドメインデータセットに対して,13のコンテキストモデリング手法を評価した。
論文 参考訳(メタデータ) (2020-02-03T11:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。