論文の概要: ProtoSiTex: Learning Semi-Interpretable Prototypes for Multi-label Text Classification
- arxiv url: http://arxiv.org/abs/2510.12534v1
- Date: Tue, 14 Oct 2025 13:59:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.340052
- Title: ProtoSiTex: Learning Semi-Interpretable Prototypes for Multi-label Text Classification
- Title(参考訳): ProtoSiTex:マルチラベルテキスト分類のための半解釈型プロトタイプの学習
- Authors: Utsav Kumar Nareti, Suraj Kumar, Soumya Pandey, Soumi Chattopadhyay, Chandranath Adak,
- Abstract要約: ProtoSiTexは、細粒度マルチラベルテキスト分類用に設計された半解釈可能なフレームワークである。
適応型プロトタイプとマルチヘッドアテンションを使用して、重複と矛盾するセマンティクスをキャプチャする。
ProtoSiTexは、忠実でヒューマンアラインな説明を提供しながら、最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 0.7534418099163723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The surge in user-generated reviews has amplified the need for interpretable models that can provide fine-grained insights. Existing prototype-based models offer intuitive explanations but typically operate at coarse granularity (sentence or document level) and fail to address the multi-label nature of real-world text classification. We propose ProtoSiTex, a semi-interpretable framework designed for fine-grained multi-label text classification. ProtoSiTex employs a dual-phase alternating training strategy: an unsupervised prototype discovery phase that learns semantically coherent and diverse prototypes, and a supervised classification phase that maps these prototypes to class labels. A hierarchical loss function enforces consistency across sub-sentence, sentence, and document levels, enhancing interpretability and alignment. Unlike prior approaches, ProtoSiTex captures overlapping and conflicting semantics using adaptive prototypes and multi-head attention. We also introduce a benchmark dataset of hotel reviews annotated at the sub-sentence level with multiple labels. Experiments on this dataset and two public benchmarks (binary and multi-class) show that ProtoSiTex achieves state-of-the-art performance while delivering faithful, human-aligned explanations, establishing it as a robust solution for semi-interpretable multi-label text classification.
- Abstract(参考訳): ユーザ生成レビューの急増により、詳細な洞察を提供するための解釈可能なモデルの必要性が高まっている。
既存のプロトタイプベースのモデルは直感的な説明を提供するが、典型的には粗い粒度(文や文書のレベル)で動作し、実世界のテキスト分類のマルチラベルの性質に対処できない。
細粒度多ラベルテキスト分類のための半解釈可能なフレームワークProtoSiTexを提案する。
ProtoSiTexは、意味的に一貫性があり多様なプロトタイプを学習する教師なしのプロトタイプ発見フェーズと、これらのプロトタイプをクラスラベルにマッピングする教師付き分類フェーズという、2段階交代訓練戦略を採用している。
階層的損失関数は、サブ文、文、文書レベルの一貫性を強制し、解釈可能性とアライメントを高める。
従来のアプローチとは異なり、ProtoSiTexはアダプティブプロトタイプとマルチヘッドアテンションを使用して重複と矛盾するセマンティクスをキャプチャする。
また,複数のラベルを持つサブ文レベルで注釈付けされたホテルレビューのベンチマークデータセットも導入した。
このデータセットと2つの公開ベンチマーク(バイナリとマルチクラス)の実験によると、ProtoSiTexは、忠実でヒューマンアラインな説明を提供しながら、最先端のパフォーマンスを実現し、半解釈可能なマルチラベルテキスト分類の堅牢なソリューションとして確立している。
関連論文リスト
- Label-template based Few-Shot Text Classification with Contrastive Learning [7.964862748983985]
本稿では,単純かつ効果的なテキスト分類フレームワークを提案する。
ラベルテンプレートは入力文に埋め込まれ、クラスラベルの潜在値を完全に活用する。
教師付きコントラスト学習を用いて、サポートサンプルとクエリサンプル間の相互作用情報をモデル化する。
論文 参考訳(メタデータ) (2024-12-13T12:51:50Z) - Advancing Interpretability in Text Classification through Prototype Learning [1.9526476410335776]
ProtoLensはプロトタイプベースのモデルで、テキスト分類のための詳細なサブ文レベルの解釈機能を提供する。
ProtoLensは、Prototype-aware Span extractモジュールを使用して、関連するテキストスパンを識別する。
ProtoLensは、競争精度を維持しながら解釈可能な予測を提供する。
論文 参考訳(メタデータ) (2024-10-23T03:53:46Z) - Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic
Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。
既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。
マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文 参考訳(メタデータ) (2023-10-29T13:18:00Z) - TAX: Tendency-and-Assignment Explainer for Semantic Segmentation with
Multi-Annotators [31.36818611460614]
Tendency-and-Assignment Explainer (TAX) はアノテータと割り当てレベルで解釈性を提供するように設計されている。
我々のTAXは、同等の性能を持つ最先端のネットワークアーキテクチャに適用可能であることを示す。
論文 参考訳(メタデータ) (2023-02-19T12:40:22Z) - Semi-supervised Semantic Segmentation with Prototype-based Consistency
Regularization [20.4183741427867]
半教師付きセマンティックセグメンテーションでは、制限された注釈付き画像からラベルなし画像へラベル情報を伝達する必要がある。
このようなピクセルごとの予測タスクの課題は、クラス内の大きなバリエーションである。
本稿では,ラベルの伝搬困難を緩和するために,クラス内特徴の分布を正規化するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-10-10T01:38:01Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - APANet: Adaptive Prototypes Alignment Network for Few-Shot Semantic
Segmentation [56.387647750094466]
Few-shotのセマンティックセマンティックセマンティクスは、指定されたクエリイメージに、ラベル付きサポートイメージのみで、新規クラスのオブジェクトをセグメントすることを目的としている。
ほとんどの高度なソリューションは、各クエリ機能を学習したクラス固有のプロトタイプにマッチさせることでセグメンテーションを実行するメトリクス学習フレームワークを利用している。
本稿では,クラス固有およびクラス非依存のプロトタイプを導入することで,適応型プロトタイプ表現を提案する。
論文 参考訳(メタデータ) (2021-11-24T04:38:37Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Generalized Funnelling: Ensemble Learning and Heterogeneous Document
Embeddings for Cross-Lingual Text Classification [78.83284164605473]
emphFunnelling (Fun)は、最近提案された言語間テキスト分類手法である。
Emph Generalized Funnelling (gFun) はFunの一般化である。
gFunは、Funや最先端のベースラインよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-09-17T23:33:04Z) - Prototypical Representation Learning for Relation Extraction [56.501332067073065]
本論文では, 遠隔ラベルデータから予測可能, 解釈可能, 堅牢な関係表現を学習することを目的とする。
文脈情報から各関係のプロトタイプを学習し,関係の本質的意味を最善に探求する。
いくつかの関係学習タスクの結果,本モデルが従来の関係モデルを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-03-22T08:11:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。