論文の概要: Learning Interpretable and Discrete Representations with Adversarial
Training for Unsupervised Text Classification
- arxiv url: http://arxiv.org/abs/2004.13255v1
- Date: Tue, 28 Apr 2020 02:53:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 22:34:55.889803
- Title: Learning Interpretable and Discrete Representations with Adversarial
Training for Unsupervised Text Classification
- Title(参考訳): 教師なしテキスト分類のための逆学習による解釈・離散表現の学習
- Authors: Yau-Shian Wang and Hung-Yi Lee and Yun-Nung Chen
- Abstract要約: TIGANは、テキストを離散コードと連続ノイズを含む2つの非絡み合った表現にエンコードすることを学ぶ。
抽出したトピックの単語は,TIGANが一貫性と高度に解釈可能なトピックを学習していることを示している。
- 参考スコア(独自算出の注目度): 87.28408260725138
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning continuous representations from unlabeled textual data has been
increasingly studied for benefiting semi-supervised learning. Although it is
relatively easier to interpret discrete representations, due to the difficulty
of training, learning discrete representations for unlabeled textual data has
not been widely explored. This work proposes TIGAN that learns to encode texts
into two disentangled representations, including a discrete code and a
continuous noise, where the discrete code represents interpretable topics, and
the noise controls the variance within the topics. The discrete code learned by
TIGAN can be used for unsupervised text classification. Compared to other
unsupervised baselines, the proposed TIGAN achieves superior performance on six
different corpora. Also, the performance is on par with a recently proposed
weakly-supervised text classification method. The extracted topical words for
representing latent topics show that TIGAN learns coherent and highly
interpretable topics.
- Abstract(参考訳): ラベルのないテキストデータからの連続表現の学習は、半教師なし学習の恩恵を受けるためにますます研究されている。
離散表現の解釈は比較的容易であるが、訓練が難しいため、ラベルのないテキストデータの離散表現の学習は広く研究されていない。
本研究は、離散符号と連続雑音を含む2つの不連続表現にテキストをエンコードすることを学び、離散符号が解釈可能なトピックを表し、雑音がトピック内のばらつきを制御するティガンを提案する。
TIGANが学習した離散コードは、教師なしテキスト分類に使用できる。
他の教師なしベースラインと比較して、提案したTIGANは6つの異なるコーパスにおいて優れた性能を発揮する。
また,最近提案された弱教師付きテキスト分類法と同等の性能を示した。
抽出した話題語は、TIGANが一貫性と高度に解釈可能なトピックを学ぶことを示す。
関連論文リスト
- XAI-CLASS: Explanation-Enhanced Text Classification with Extremely Weak
Supervision [6.406111099707549]
XAI-CLASSは、説明強化弱教師付きテキスト分類法である。
単語の正当性予測を補助タスクとして組み込む。
XAI-CLASSは、他の弱い教師付きテキスト分類法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-10-31T23:24:22Z) - TAX: Tendency-and-Assignment Explainer for Semantic Segmentation with
Multi-Annotators [31.36818611460614]
Tendency-and-Assignment Explainer (TAX) はアノテータと割り当てレベルで解釈性を提供するように設計されている。
我々のTAXは、同等の性能を持つ最先端のネットワークアーキテクチャに適用可能であることを示す。
論文 参考訳(メタデータ) (2023-02-19T12:40:22Z) - Deep Semi-supervised Learning with Double-Contrast of Features and
Semantics [2.2230089845369094]
本稿では,エンド・ツー・エンドの半教師あり学習における意味と特徴の二重コントラストを提案する。
我々は情報理論を活用し、意味論と特徴の二重コントラストの合理性を説明する。
論文 参考訳(メタデータ) (2022-11-28T09:08:19Z) - Context-based Virtual Adversarial Training for Text Classification with
Noisy Labels [1.9508698179748525]
本研究では,テキスト分類器が雑音ラベルに過度に収まらないよう,コンテキストベースの仮想対位訓練(ConVAT)を提案する。
従来の手法とは異なり,提案手法は入力よりも文脈レベルで逆学習を行う。
2種類のラベルノイズを持つ4つのテキスト分類データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-29T14:19:49Z) - Conditional Supervised Contrastive Learning for Fair Text Classification [59.813422435604025]
対照的な学習を通してテキスト分類のための等化オッズとして知られる公平性の概念を満たす学習公正表現について研究する。
具体的には、まず、公正性制約のある学習表現と条件付き教師付きコントラスト目的との間の関係を理論的に分析する。
論文 参考訳(メタデータ) (2022-05-23T17:38:30Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Towards Accurate Scene Text Recognition with Semantic Reasoning Networks [52.86058031919856]
本稿では,シーンテキスト認識のための意味推論ネットワーク(SRN)という,エンドツーエンドのトレーニング可能な新しいフレームワークを提案する。
GSRMはマルチウェイ並列伝送によってグローバルセマンティックコンテキストをキャプチャするために導入された。
正規テキスト,不規則テキスト,非ラテン語長文を含む7つの公開ベンチマークの結果,提案手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2020-03-27T09:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。