論文の概要: Semi-supervised Nonnegative Matrix Factorization for Document
Classification
- arxiv url: http://arxiv.org/abs/2203.03551v1
- Date: Mon, 28 Feb 2022 19:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-13 13:53:09.213894
- Title: Semi-supervised Nonnegative Matrix Factorization for Document
Classification
- Title(参考訳): 文書分類のための半教師付き非負行列分解
- Authors: Jamie Haddock, Lara Kassab, Sixian Li, Alona Kryshchenko, Rachel
Grotheer, Elena Sizikova, Chuntian Wang, Thomas Merkh, RWMA Madushani, Miju
Ahn, Deanna Needell, Kathryn Leonard
- Abstract要約: 文書分類のための半教師付き非負行列分解(SSNMF)モデルを提案する。
我々は,各新モデルに対して乗算的更新を用いたトレーニング手法を導出し,これらのモデルの単一ラベルおよび多ラベル文書分類への応用を実証する。
- 参考スコア(独自算出の注目度): 6.577559557980527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose new semi-supervised nonnegative matrix factorization (SSNMF)
models for document classification and provide motivation for these models as
maximum likelihood estimators. The proposed SSNMF models simultaneously provide
both a topic model and a model for classification, thereby offering highly
interpretable classification results. We derive training methods using
multiplicative updates for each new model, and demonstrate the application of
these models to single-label and multi-label document classification, although
the models are flexible to other supervised learning tasks such as regression.
We illustrate the promise of these models and training methods on document
classification datasets (e.g., 20 Newsgroups, Reuters).
- Abstract(参考訳): 本稿では,文書分類のための半教師付き非負行列分解(ssnmf)モデルを提案し,それらのモデルに対する最大確率推定器としての動機付けを提供する。
提案したSSNMFモデルはトピックモデルと分類モデルの両方を同時に提供し、高い解釈可能な分類結果を提供する。
我々は,各新モデルに対して乗算的更新を用いたトレーニング手法を導出し,回帰のような他の教師あり学習タスクに対して柔軟であるが,これらのモデルの単一ラベルおよび多ラベル文書分類への応用を実証する。
文書分類データセット(例えば20のニュースグループ、ロイター)におけるこれらのモデルの約束とトレーニング方法を説明する。
関連論文リスト
- Representer Point Selection for Explaining Regularized High-dimensional
Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。
私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。
提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-05-31T16:23:58Z) - Multidimensional Item Response Theory in the Style of Collaborative
Filtering [0.8057006406834467]
本稿では,多次元項目応答理論(MIRT)に対する機械学習手法を提案する。
協調フィルタリングに触発されて、多くのMIRTモデルを含むモデルの一般的なクラスを定義します。
本稿では, 個人モデルとクロスバリデーションを推定し, 最適動作モデルを選択するために, ペナル化結合最大度(JML)の使用について論じる。
論文 参考訳(メタデータ) (2023-01-03T00:56:27Z) - Federated Learning Aggregation: New Robust Algorithms with Guarantees [63.96013144017572]
エッジでの分散モデルトレーニングのために、フェデレートラーニングが最近提案されている。
本稿では,連合学習フレームワークにおける集約戦略を評価するために,完全な数学的収束解析を提案する。
損失の値に応じてクライアントのコントリビューションを差別化することで、モデルアーキテクチャを変更できる新しい集約アルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-05-22T16:37:53Z) - Training Experimentally Robust and Interpretable Binarized Regression
Models Using Mixed-Integer Programming [3.179831861897336]
マルチクラス分類タスクに対するロバストかつ解釈可能な二項化回帰モデルをトレーニングするためのモデルに基づくアプローチを提案する。
MIPモデルは、重み付けされた目的を用いて予測マージンとモデルサイズを最適化する。
MIPを用いた頑健かつ解釈可能な二項化回帰モデルのトレーニングの有効性を示す。
論文 参考訳(メタデータ) (2021-12-01T11:53:08Z) - Improving Label Quality by Jointly Modeling Items and Annotators [68.8204255655161]
雑音アノテータから基底真理ラベルを学習するための完全ベイズ的枠組みを提案する。
我々のフレームワークは、ラベル分布上の生成的ベイズソフトクラスタリングモデルを古典的なDavidとSkeneのジョイントアノテータデータモデルに分解することでスケーラビリティを保証する。
論文 参考訳(メタデータ) (2021-06-20T02:15:20Z) - Split Modeling for High-Dimensional Logistic Regression [0.2676349883103404]
短時間コンパイルしたアンサンブルロジスティック分類モデルに対して,新しい手法を提案する。
本手法は,予測精度に優れたバイアスオフの活用法を学習する。
提案手法を実装したオープンソースソフトウェアライブラリを議論する。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z) - On a Guided Nonnegative Matrix Factorization [9.813862201223973]
本研究では,非負行列分解(NMF)モデルに基づく手法を提案する。
実験により,本モデルの可能性を実証し,極めて少ない監督情報しか持たない他の手法と競合することを示す。
論文 参考訳(メタデータ) (2020-10-22T01:06:17Z) - Semi-supervised NMF Models for Topic Modeling in Learning Tasks [6.577559557980527]
半教師付き非負行列分解(SSNMF)のための新しいモデルを提案する。
本稿では,各新モデルに対する乗算的更新学習手法を提案し,これらのモデルの分類への応用を実証する。
論文 参考訳(メタデータ) (2020-10-15T18:03:46Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Explanation-Guided Training for Cross-Domain Few-Shot Classification [96.12873073444091]
クロスドメイン・ショット分類タスク(CD-FSC)は、データセットで表されるドメインをまたいで一般化する要件と、少数ショット分類を組み合わせたものである。
既存のFSCモデルに対する新しいトレーニング手法を提案する。
説明誘導学習はモデル一般化を効果的に改善することを示す。
論文 参考訳(メタデータ) (2020-07-17T07:28:08Z) - Document Ranking with a Pretrained Sequence-to-Sequence Model [56.44269917346376]
関連ラベルを「ターゲット語」として生成するためにシーケンス・ツー・シーケンス・モデルをどのように訓練するかを示す。
提案手法は,データポーラ方式におけるエンコーダのみのモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2020-03-14T22:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。