論文の概要: Enhancing Visual Sentiment Analysis via Semiotic Isotopy-Guided Dataset Construction
- arxiv url: http://arxiv.org/abs/2512.14665v1
- Date: Tue, 16 Dec 2025 18:26:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.831971
- Title: Enhancing Visual Sentiment Analysis via Semiotic Isotopy-Guided Dataset Construction
- Title(参考訳): セミオティックなアイソトピー誘導型データセット構築による視覚知覚分析の強化
- Authors: Marco Blanchini, Giovanna Maria Dimitri, Benedetta Tondi, Tarcisio Lancioni, Mauro Barni,
- Abstract要約: 視覚知覚分析のための新しい大きなデータセットを作成する方法を示す。
これにより、イメージ要素の感情的な組み合わせに集中する能力が改善された新しいモデルのトレーニングが可能になる。
経験的評価は、我々の方法で生成されたデータセットでトレーニングされたモデルが、元のデータコレクションでトレーニングされたモデルよりも一貫して優れていることを示している。
- 参考スコア(独自算出の注目度): 15.18770071829755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Sentiment Analysis (VSA) is a challenging task due to the vast diversity of emotionally salient images and the inherent difficulty of acquiring sufficient data to capture this variability comprehensively. Key obstacles include building large-scale VSA datasets and developing effective methodologies that enable algorithms to identify emotionally significant elements within an image. These challenges are reflected in the limited generalization performance of VSA algorithms and models when trained and tested across different datasets. Starting from a pool of existing data collections, our approach enables the creation of a new larger dataset that not only contains a wider variety of images than the original ones, but also permits training new models with improved capability to focus on emotionally relevant combinations of image elements. This is achieved through the integration of the semiotic isotopy concept within the dataset creation process, providing deeper insights into the emotional content of images. Empirical evaluations show that models trained on a dataset generated with our method consistently outperform those trained on the original data collections, achieving superior generalization across major VSA benchmarks
- Abstract(参考訳): 視覚知覚分析(VSA)は、感情的に健全な画像の多様さと、この変動を包括的に捉えるのに十分なデータを取得することの難しさにより、困難な課題である。
主な障害は、大規模なVSAデータセットの構築と、アルゴリズムがイメージ内の感情的に重要な要素を識別できる効果的な方法論の開発である。
これらの課題は、異なるデータセット間でトレーニングおよびテストを行う場合、VSAアルゴリズムとモデルの限定的な一般化パフォーマンスに反映される。
既存のデータ収集のプールから始めて、我々のアプローチは、オリジナルのものよりも多様な画像を含むだけでなく、イメージ要素の感情的な組み合わせにフォーカスする能力を改善した新しいモデルのトレーニングを可能にする。
これは、データセット生成プロセスにセミオティックなアイソトピーの概念を統合することで実現され、画像の感情的内容に関する深い洞察を提供する。
経験的評価は、我々の方法で生成されたデータセットでトレーニングされたモデルは、元のデータコレクションでトレーニングされたモデルよりも一貫して優れており、主要なVSAベンチマークで優れた一般化を実現していることを示している。
関連論文リスト
- Navigating the Challenges of AI-Generated Image Detection in the Wild: What Truly Matters? [9.916527862912941]
我々は、主要なソーシャルメディアプラットフォームから収集された実画像とAI生成画像の新しいデータセットであるITW-SMを紹介する。
実世界のシナリオにおけるAID性能に影響を与える4つの要因を同定する。
我々の修正は、実環境下での様々なAIDモデルに対して平均26.87%のAUC改善をもたらす。
論文 参考訳(メタデータ) (2025-07-14T12:56:55Z) - Picking the Cream of the Crop: Visual-Centric Data Selection with Collaborative Agents [62.616106562146776]
textbfVisual-Centric textbfSelection approach by textbfAgents Collaboration (ViSA)を提案する。
提案手法は,(1)視覚エージェントの協調による画像情報定量化手法により,リッチな視覚情報を持つ画像を選択する方法,(2)高品質な画像に関連する高品質な画像を選択する視覚中心の指示品質評価手法からなる。
論文 参考訳(メタデータ) (2025-02-27T09:37:30Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。