論文の概要: Blurb-Refined Inference from Crowdsourced Book Reviews using Hierarchical Genre Mining with Dual-Path Graph Convolutions
- arxiv url: http://arxiv.org/abs/2512.21076v1
- Date: Wed, 24 Dec 2025 09:49:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.749735
- Title: Blurb-Refined Inference from Crowdsourced Book Reviews using Hierarchical Genre Mining with Dual-Path Graph Convolutions
- Title(参考訳): Dual-Path Graph Convolutionsを用いた階層的ジェネラルマイニングによるクラウドソーシング書籍レビューからのBlurb-Refined推論
- Authors: Suraj Kumar, Utsav Kumar Nareti, Soumi Chattopadhyay, Chandranath Adak, Prolay Mallick,
- Abstract要約: HiGeMineは階層的なジャンルのマイニングフレームワークで、ユーザレビューと権威ある書籍の曖昧さをしっかりと統合している。
第1フェーズでは、HiGeMineはゼロショットセマンティックアライメント戦略を使用してレビューをフィルタリングし、対応するぼかしとセマンティックに一貫性のあるもののみを保持する。
第2フェーズでは、デュアルパス、2レベルグラフベースの分類アーキテクチャを導入する。
- 参考スコア(独自算出の注目度): 0.09851812512860349
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate book genre classification is fundamental to digital library organization, content discovery, and personalized recommendation. Existing approaches typically model genre prediction as a flat, single-label task, ignoring hierarchical genre structure and relying heavily on noisy, subjective user reviews, which often degrade classification reliability. We propose HiGeMine, a two-phase hierarchical genre mining framework that robustly integrates user reviews with authoritative book blurbs. In the first phase, HiGeMine employs a zero-shot semantic alignment strategy to filter reviews, retaining only those semantically consistent with the corresponding blurb, thereby mitigating noise, bias, and irrelevance. In the second phase, we introduce a dual-path, two-level graph-based classification architecture: a coarse-grained Level-1 binary classifier distinguishes fiction from non-fiction, followed by Level-2 multi-label classifiers for fine-grained genre prediction. Inter-genre dependencies are explicitly modeled using a label co-occurrence graph, while contextual representations are derived from pretrained language models applied to the filtered textual content. To facilitate systematic evaluation, we curate a new hierarchical book genre dataset. Extensive experiments demonstrate that HiGeMine consistently outperformed strong baselines across hierarchical genre classification tasks. The proposed framework offers a principled and effective solution for leveraging both structured and unstructured textual data in hierarchical book genre analysis.
- Abstract(参考訳): 正確な書籍ジャンル分類は、デジタル図書館の組織、コンテンツ発見、パーソナライズされたレコメンデーションに不可欠である。
既存のアプローチは、フラットでシングルラベルのタスクとしてジャンル予測をモデル化し、階層的なジャンル構造を無視し、ノイズの多い主観的なユーザーレビューに依存し、しばしば分類の信頼性を低下させる。
本稿では,2段階の階層的ジャンルマイニングフレームワークであるHiGeMineを提案する。
第1フェーズでは、HiGeMineはゼロショットセマンティックアライメント戦略を使用してレビューをフィルタリングし、対応するブラーブにセマンティックに一貫性のあるもののみを保持し、ノイズ、バイアス、無関係を緩和する。
粗いレベル1バイナリ分類器は、フィクションとノンフィクションを区別し、次いで、微粒なジャンル予測のためのレベル2マルチラベル分類器を用いる。
言語間依存関係はラベル共起グラフを用いて明示的にモデル化され、文脈表現はフィルタリングされたテキストコンテンツに適用された事前訓練された言語モデルから導かれる。
体系的な評価を容易にするため、我々は新しい階層型書籍ジャンルデータセットをキュレートする。
大規模な実験により、HiGeMineは階層的なジャンル分類タスクにおいて、強いベースラインを一貫して上回った。
提案するフレームワークは,階層的な書籍ジャンル分析において,構造化データと非構造化データの両方を活用するための,原則的かつ効果的なソリューションを提供する。
関連論文リスト
- ProtoSiTex: Learning Semi-Interpretable Prototypes for Multi-label Text Classification [0.7534418099163723]
ProtoSiTexは、細粒度マルチラベルテキスト分類用に設計された半解釈可能なフレームワークである。
適応型プロトタイプとマルチヘッドアテンションを使用して、重複と矛盾するセマンティクスをキャプチャする。
ProtoSiTexは、忠実でヒューマンアラインな説明を提供しながら、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-10-14T13:59:28Z) - Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification [89.20477310885731]
本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T10:42:19Z) - Hierarchical Query Classification in E-commerce Search [38.67034103433015]
電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
階層的問合せ分類の本質的な複雑さは,(1)支配的カテゴリに傾倒する顕著なクラス不均衡,(2)正確な分類を妨げる検索クエリの本質的簡潔さとあいまいさの2つの課題によって複雑化されている。
論文 参考訳(メタデータ) (2024-03-09T21:55:55Z) - Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics [3.89394670917253]
本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世の写本画像について述べる。
統合データセットの"ブリッジ"として機能する,より均一なラベルセットを作ることを目標としています。
ビジュアルインターフェースは、メタデータの総合計を超えるデータ間の関係について、専門家に概要を提供する。
論文 参考訳(メタデータ) (2022-08-20T10:59:33Z) - Weakly-supervised Action Localization via Hierarchical Mining [76.00021423700497]
弱教師付きアクションローカライゼーションは、ビデオレベルの分類ラベルだけで、与えられたビデオ内のアクションインスタンスを時間的にローカライズし、分類することを目的としている。
ビデオレベルおよびスニペットレベルでの階層的マイニング戦略,すなわち階層的監視と階層的一貫性マイニングを提案する。
我々は、HiM-NetがTHUMOS14とActivityNet1.3データセットの既存の手法よりも、階層的に監督と一貫性をマイニングすることで、大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-06-22T12:19:09Z) - Semi-Supervised Domain Generalization with Stochastic StyleMatch [90.98288822165482]
実世界のアプリケーションでは、アノテーションのコストが高いため、各ソースドメインから利用可能なラベルはわずかです。
本研究では,より現実的で実践的な半教師付き領域一般化について検討する。
提案手法であるStyleMatchは,擬似ラベルに基づく最先端の半教師付き学習手法であるFixMatchに着想を得たものである。
論文 参考訳(メタデータ) (2021-06-01T16:00:08Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Rank over Class: The Untapped Potential of Ranking in Natural Language
Processing [8.637110868126546]
我々は、現在分類を用いて対処されている多くのタスクが、実際には分類モールドに切り替わっていると論じる。
本稿では,一対のテキストシーケンスの表現を生成するトランスフォーマーネットワークからなる新しいエンドツーエンドランキング手法を提案する。
重く歪んだ感情分析データセットの実験では、ランキング結果を分類ラベルに変換すると、最先端のテキスト分類よりも約22%改善する。
論文 参考訳(メタデータ) (2020-09-10T22:18:57Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。