論文の概要: Guided Semi-Supervised Non-negative Matrix Factorization on Legal
Documents
- arxiv url: http://arxiv.org/abs/2201.13324v1
- Date: Mon, 31 Jan 2022 16:21:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 15:44:57.394891
- Title: Guided Semi-Supervised Non-negative Matrix Factorization on Legal
Documents
- Title(参考訳): 法的文書の半監督的非負行列因子化
- Authors: Pengyu Li, Christine Tseng, Yaxuan Zheng, Joyce A. Chew, Longxiu
Huang, Benjamin Jarman, Deanna Needell
- Abstract要約: 本稿では,分類とトピックモデリングの両方を行う手法,すなわち,半教師付き非負行列因子分解法(GSSNMF)を提案する。
本稿では,カリフォルニア・インノシエンス・プロジェクト(California Innocence Project)が提供する法的文書への適用を通じて,本手法の性能を検証した。
- 参考スコア(独自算出の注目度): 12.213208807541895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification and topic modeling are popular techniques in machine learning
that extract information from large-scale datasets. By incorporating a priori
information such as labels or important features, methods have been developed
to perform classification and topic modeling tasks; however, most methods that
can perform both do not allow for guidance of the topics or features. In this
paper, we propose a method, namely Guided Semi-Supervised Non-negative Matrix
Factorization (GSSNMF), that performs both classification and topic modeling by
incorporating supervision from both pre-assigned document class labels and
user-designed seed words. We test the performance of this method through its
application to legal documents provided by the California Innocence Project, a
nonprofit that works to free innocent convicted persons and reform the justice
system. The results show that our proposed method improves both classification
accuracy and topic coherence in comparison to past methods like Semi-Supervised
Non-negative Matrix Factorization (SSNMF) and Guided Non-negative Matrix
Factorization (Guided NMF).
- Abstract(参考訳): 分類とトピックモデリングは、大規模なデータセットから情報を抽出する機械学習で一般的なテクニックである。
ラベルや重要な特徴などの事前情報を組み込むことによって、分類やトピックモデリングのタスクを実行する手法が開発されているが、どちらも実行可能なほとんどの手法はトピックや特徴のガイダンスを許さない。
本稿では,事前指定された文書クラスラベルとユーザ設計されたシードワードの両方の監督を取り入れて,分類とトピックモデリングを両立させる手法,GSSNMF(Guid Semi-Supervised Non- negative Matrix Factorization)を提案する。
我々は、無実の有罪判決を受けた人を解放し、司法制度を改革する非営利団体であるCalifornia Innocence Projectによって提供される法的文書に適用することで、この方法のパフォーマンスをテストする。
提案手法は,半監督非負行列因子化 (SSNMF) やガイド非負行列因子化 (Guided NMF) といった過去の手法と比較して,分類精度とトピックコヒーレンスを向上することを示した。
関連論文リスト
- Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - Document Provenance and Authentication through Authorship Classification [5.2545206693029884]
本稿では,単一文書と複数文書の分類のためのアンサンブルベースのテキスト処理フレームワークを提案する。
提案するフレームワークには,最先端のテキスト分類アルゴリズムがいくつか組み込まれている。
フレームワークは大規模なベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-02T12:26:03Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - A Framework for Auditing Multilevel Models using Explainability Methods [2.578242050187029]
回帰の技術的評価のための監査フレームワークを提案する。
焦点は3つの側面、モデル、差別、透明性と説明責任である。
SHAP や LIME などの一般的な説明可能性法は,これらのモデルを解釈する際には精度が低いことが示されている。
論文 参考訳(メタデータ) (2022-07-04T17:53:21Z) - Semi-supervised Nonnegative Matrix Factorization for Document
Classification [6.577559557980527]
文書分類のための半教師付き非負行列分解(SSNMF)モデルを提案する。
我々は,各新モデルに対して乗算的更新を用いたトレーニング手法を導出し,これらのモデルの単一ラベルおよび多ラベル文書分類への応用を実証する。
論文 参考訳(メタデータ) (2022-02-28T19:00:49Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Visualization of Supervised and Self-Supervised Neural Networks via
Attribution Guided Factorization [87.96102461221415]
クラスごとの説明性を提供するアルゴリズムを開発した。
実験の広範なバッテリーでは、クラス固有の可視化のための手法の能力を実証する。
論文 参考訳(メタデータ) (2020-12-03T18:48:39Z) - On a Guided Nonnegative Matrix Factorization [9.813862201223973]
本研究では,非負行列分解(NMF)モデルに基づく手法を提案する。
実験により,本モデルの可能性を実証し,極めて少ない監督情報しか持たない他の手法と競合することを示す。
論文 参考訳(メタデータ) (2020-10-22T01:06:17Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。