論文の概要: Measuring the Novelty of Natural Language Text Using the Conjunctive
Clauses of a Tsetlin Machine Text Classifier
- arxiv url: http://arxiv.org/abs/2011.08755v1
- Date: Tue, 17 Nov 2020 16:35:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 15:36:51.623400
- Title: Measuring the Novelty of Natural Language Text Using the Conjunctive
Clauses of a Tsetlin Machine Text Classifier
- Title(参考訳): tsetlinマシンテキスト分類器の連結節を用いた自然言語テキストの新規性の測定
- Authors: Bimal Bhattarai, Ole-Christoffer Granmo, Lei Jiao
- Abstract要約: ほとんどの教師付きテキスト分類手法は、訓練時にデータに存在するすべてのクラスを数えて、クローズドワールドを前提としている。
この仮定は、前例のない新しいクラスが現れても、操作中に予測不可能な振る舞いを引き起こす可能性がある。
我々は最近導入されたTsetlin Machine (TM) を新しいスコアリング機構で拡張する。
- 参考スコア(独自算出の注目度): 12.087658145293522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most supervised text classification approaches assume a closed world,
counting on all classes being present in the data at training time. This
assumption can lead to unpredictable behaviour during operation, whenever
novel, previously unseen, classes appear. Although deep learning-based methods
have recently been used for novelty detection, they are challenging to
interpret due to their black-box nature. This paper addresses
\emph{interpretable} open-world text classification, where the trained
classifier must deal with novel classes during operation. To this end, we
extend the recently introduced Tsetlin machine (TM) with a novelty scoring
mechanism. The mechanism uses the conjunctive clauses of the TM to measure to
what degree a text matches the classes covered by the training data. We
demonstrate that the clauses provide a succinct interpretable description of
known topics, and that our scoring mechanism makes it possible to discern novel
topics from the known ones. Empirically, our TM-based approach outperforms
seven other novelty detection schemes on three out of five datasets, and
performs second and third best on the remaining, with the added benefit of an
interpretable propositional logic-based representation.
- Abstract(参考訳): 教師付きテキスト分類のアプローチの多くはクローズドワールドを想定しており、トレーニング時にデータに存在するすべてのクラスを数えている。
この仮定は、新しいクラスが現れるたびに、操作中の予測不能な振る舞いを引き起こす可能性がある。
深層学習に基づく手法は近年,新規性検出に用いられているが,ブラックボックスの性質から解釈が困難である。
本稿では,訓練された分類器が操作中に新しいクラスを扱わなければならないオープンワールドテキスト分類のemph{interpretable}について述べる。
この目的のために、最近導入されたTsetlin Machine (TM) を新しいスコアリング機構で拡張する。
このメカニズムはtmの連結節を使用して、テキストがトレーニングデータでカバーされたクラスとどの程度一致しているかを測定する。
我々は,これらの節が既知のトピックの簡潔な解釈可能な記述を提供し,評価機構が既知のトピックと新しいトピックを区別できるようにすることを実証した。
経験的に、我々のTMベースのアプローチは、5つのデータセットのうち3つで他の7つの新規検出スキームより優れており、残りの3つでは2位と3位が最善である。
関連論文リスト
- A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - XAI-CLASS: Explanation-Enhanced Text Classification with Extremely Weak
Supervision [6.406111099707549]
XAI-CLASSは、説明強化弱教師付きテキスト分類法である。
単語の正当性予測を補助タスクとして組み込む。
XAI-CLASSは、他の弱い教師付きテキスト分類法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-10-31T23:24:22Z) - WOT-Class: Weakly Supervised Open-world Text Classification [41.77945049159303]
我々は、弱教師付きオープンワールドテキスト分類の新しい問題に取り組んでいる。
強い仮定を持ち上げる新しいフレームワーク WOT-Class を提案する。
7つの人気のあるテキスト分類データセットの実験は、WOT-Classが強いベースラインより優れていることを示している。
論文 参考訳(メタデータ) (2023-05-21T08:51:24Z) - Three ways to improve feature alignment for open vocabulary detection [88.65076922242184]
ゼロショットオープンボキャブラリ検出の鍵となる問題は、視覚的特徴とテキスト的特徴の整合性である。
以前のアプローチでは、特徴ピラミッドと検出ヘッドをゼロからトレーニングし、事前トレーニング中に確立された視覚テキストの特徴アライメントを壊す。
本稿では,これらの問題を緩和する3つの方法を提案する。まず,テキストの埋め込みを強化するための簡単なスキームを用いて,学習中に見られる少数のクラスへの過度な適合を防止する。
次に、特徴ピラミッドネットワークと検出ヘッドをトレーニング可能なショートカットを含むように変更する。
最後に、より大きなコーパスを活用するために、自己学習アプローチが使用される。
論文 参考訳(メタデータ) (2023-03-23T17:59:53Z) - Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic
Segmentation [40.09476732999614]
マスクの提案モデルは、ゼロショットセマンティックセグメンテーションの性能を大幅に改善した。
トレーニング中にバックグラウンドを埋め込むことは問題であり、結果として得られたモデルが過剰に学習し、正しいラベルではなく、すべての見えないクラスをバックグラウンドクラスとして割り当てる傾向がある。
本稿では,学習中の背景埋め込みの使用を回避し,テキスト埋め込みとマスク提案のセマンティックな関係を類似度スコアのランク付けにより活用する新しいクラス拡張損失を提案する。
論文 参考訳(メタデータ) (2023-01-18T06:55:02Z) - Task-Specific Embeddings for Ante-Hoc Explainable Text Classification [6.671252951387647]
テキストのタスク固有の埋め込みを学習する学習目標を提案する。
提案する目的は,同一のクラスラベルを共有するすべてのテキストが近接しているように埋め込みを学習することである。
本研究は, 総合的な分類精度において, アンテホックな説明可能性と漸進的な学習の利点が無コストで得られることを示す広範囲な実験である。
論文 参考訳(メタデータ) (2022-11-30T19:56:25Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - Semi-supervised New Event Type Induction and Description via Contrastive
Loss-Enforced Batch Attention [56.46649994444616]
マスク付きコントラスト損失を用いた半教師付き新しいイベント型誘導手法を提案する。
私たちは、発見したクラスタの型名を予測し、FrameNetフレームにリンクするという、2つの新しいタスクにアプローチを拡張しました。
論文 参考訳(メタデータ) (2022-02-12T00:32:22Z) - Word-level Human Interpretable Scoring Mechanism for Novel Text
Detection Using Tsetlin Machines [16.457778420360537]
新規性への貢献度に応じて個々の単語を評価するためのTsetlin マシンアーキテクチャを提案する。
本手法はtm節で捉えた言語パターンを用いて,新しい文書の記述を符号化する。
次に、この記述を採用し、単語がドキュメントの新規作成にどれだけ貢献しているかを測定します。
論文 参考訳(メタデータ) (2021-05-10T23:41:14Z) - Learning Interpretable and Discrete Representations with Adversarial
Training for Unsupervised Text Classification [87.28408260725138]
TIGANは、テキストを離散コードと連続ノイズを含む2つの非絡み合った表現にエンコードすることを学ぶ。
抽出したトピックの単語は,TIGANが一貫性と高度に解釈可能なトピックを学習していることを示している。
論文 参考訳(メタデータ) (2020-04-28T02:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。