論文の概要: An Adaptive Data-Resilient Multi-Modal Framework for Hierarchical Multi-Label Book Genre Identification
- arxiv url: http://arxiv.org/abs/2505.03839v1
- Date: Mon, 05 May 2025 05:25:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.862064
- Title: An Adaptive Data-Resilient Multi-Modal Framework for Hierarchical Multi-Label Book Genre Identification
- Title(参考訳): 階層型マルチラベルブックジェネレータ同定のための適応型データ回復型マルチモーダルフレームワーク
- Authors: Utsav Kumar Nareti, Soumi Chattopadhyay, Prolay Mallick, Suraj Kumar, Ayush Vikas Daga, Chandranath Adak, Adarsh Wase, Arjab Roy,
- Abstract要約: 本稿では,ジャンル分類の複雑さに対処するフレームワークであるIMAGINEを紹介する。
IMAGINEは複数のモーダルからロバストな特徴表現を抽出し、データ可用性に基づいて最も情報性の高い情報源を動的に選択する。
フレームワークの重要な特徴は、不完全データに対するレジリエンスであり、テキスト、画像、メタデータなどの特定のモダリティが欠落している場合や不完全である場合でも、正確な予測を可能にする。
- 参考スコア(独自算出の注目度): 0.3656826837859035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the finer details of a book's genres enhances user experience by enabling efficient book discovery and personalized recommendations, ultimately improving reader engagement and satisfaction. It also provides valuable insights into market trends and consumer preferences, allowing publishers and marketers to make data-driven decisions regarding book production and marketing strategies. While traditional book genre classification methods primarily rely on review data or textual analysis, incorporating additional modalities, such as book covers, blurbs, and metadata, can offer richer context and improve prediction accuracy. However, the presence of incomplete or noisy information across these modalities presents a significant challenge. This paper introduces IMAGINE (Intelligent Multi-modal Adaptive Genre Identification NEtwork), a framework designed to address these complexities. IMAGINE extracts robust feature representations from multiple modalities and dynamically selects the most informative sources based on data availability. It employs a hierarchical classification strategy to capture genre relationships and remains adaptable to varying input conditions. Additionally, we curate a hierarchical genre classification dataset that structures genres into a well-defined taxonomy, accommodating the diverse nature of literary works. IMAGINE integrates information from multiple sources and assigns multiple genre labels to each book, ensuring a more comprehensive classification. A key feature of our framework is its resilience to incomplete data, enabling accurate predictions even when certain modalities, such as text, images, or metadata, are missing or incomplete. Experimental results show that IMAGINE outperformed existing baselines in genre classification accuracy, particularly in scenarios with insufficient modality-specific data.
- Abstract(参考訳): 書籍ジャンルのより詳細な詳細を識別することは、効率的な書籍発見とパーソナライズされたレコメンデーションを可能にし、最終的に読者のエンゲージメントと満足度を向上させることによって、ユーザエクスペリエンスを向上させる。
また、市場の動向や消費者の嗜好に関する貴重な洞察を提供し、出版社やマーケッターは、本の生産とマーケティング戦略に関するデータ駆動的な決定をすることができる。
従来の書誌ジャンル分類法は、主にレビューデータやテキスト分析に頼っているが、書籍の表紙、ぼやけ、メタデータなどの追加のモダリティを取り入れることで、よりリッチなコンテキストを提供し、予測精度を向上させることができる。
しかし、これらのモダリティに不完全な情報や騒々しい情報が存在することは大きな課題である。
本稿では,これらの複雑さに対処するためのフレームワークであるIMAGINE(Intelligent Multi-modal Adaptive Genre Identification NEtwork)を紹介する。
IMAGINEは複数のモーダルからロバストな特徴表現を抽出し、データ可用性に基づいて最も情報性の高い情報源を動的に選択する。
ジャンル関係を捉えるために階層的な分類戦略を採用しており、様々な入力条件に適応可能である。
さらに、階層的なジャンル分類データセットを整理し、ジャンルを明確に定義された分類に分類し、文学作品の多様な性質を調節する。
IMAGINEは複数の情報源からの情報を統合し、各本に複数のジャンルのラベルを割り当て、より包括的な分類を確実にする。
フレームワークの重要な特徴は、不完全データに対するレジリエンスであり、テキスト、画像、メタデータなどの特定のモダリティが欠落している場合や不完全である場合でも、正確な予測を可能にする。
実験の結果,IMAGINEはジャンル分類の精度において,特にモダリティに特有なデータが不十分な場合において,既存のベースラインよりも優れていた。
関連論文リスト
- Generative Retrieval for Book search [106.67655212825025]
書籍検索のための効率的な生成検索フレームワークを提案する。
データ拡張とアウトライン指向の書籍エンコーディングの2つの主要コンポーネントがある。
プロプライエタリなBaiduデータセットの実験では、GBSが強力なベースラインを上回ることが示されている。
論文 参考訳(メタデータ) (2025-01-19T12:57:13Z) - NativE: Multi-modal Knowledge Graph Completion in the Wild [51.80447197290866]
本研究では,MMKGCを実現するための包括的フレームワークNativEを提案する。
NativEは、任意のモダリティに対して適応的な融合を可能にするリレーショナル誘導デュアルアダプティブフュージョンモジュールを提案する。
提案手法を評価するために,5つのデータセットを用いたWildKGCという新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-03-28T03:04:00Z) - Harnessing the Power of Beta Scoring in Deep Active Learning for
Multi-Label Text Classification [6.662167018900634]
本研究は,期待損失削減フレームワーク内の適切なスコアリングルールのベータファミリを活かした,新たなアクティブな学習戦略を提案する。
これはBeta Scoring Rulesを使って期待されるスコアの増加を計算し、次にサンプルベクトル表現に変換する。
合成データセットと実データセットの総合的な評価により,複数ラベルのテキスト分類において,確立された取得技術を上回る性能が得られた。
論文 参考訳(メタデータ) (2024-01-15T00:06:24Z) - Panel Transitions for Genre Analysis in Visual Narratives [1.320904960556043]
本稿では,漫画や漫画風のビジュアル・ナラティブに基づくジャンルのマルチモーダル分析を行うための新しいアプローチを提案する。
我々は、主観的ラベルをモデル化する際の既存の計算手法の限界と課題を強調した。
論文 参考訳(メタデータ) (2023-12-14T08:05:09Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Efficient Classification of Long Documents Using Transformers [13.927622630633344]
様々なベースラインと多様なデータセットに対して測定された相対的有効性を評価する。
結果として、より複雑なモデルは、単純なベースラインを上回り、データセット間で一貫性のないパフォーマンスを得ることができないことがしばしば示される。
論文 参考訳(メタデータ) (2022-03-21T18:36:18Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。