論文の概要: AutoMSC: Automatic Assignment of Mathematics Subject Classification
Labels
- arxiv url: http://arxiv.org/abs/2005.12099v2
- Date: Mon, 9 Nov 2020 07:12:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:31:27.223453
- Title: AutoMSC: Automatic Assignment of Mathematics Subject Classification
Labels
- Title(参考訳): AutoMSC:数学科目分類ラベルの自動割り当て
- Authors: Moritz Schubotz and Philipp Scharpf and Olaf Teschke and Andreas
Kuehnemund and Corinna Breitinger and Bela Gipp
- Abstract要約: 本研究では,数学科目分類方式を用いて,粗粒度一次分類を自動的に割り当てる可能性について検討する。
提案手法は, zbMATH と MR の一致に非常に近い 77% 以上の (F_1) スコアを実現する。
- 参考スコア(独自算出の注目度): 4.001125251113153
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Authors of research papers in the fields of mathematics, and other math-heavy
disciplines commonly employ the Mathematics Subject Classification (MSC) scheme
to search for relevant literature. The MSC is a hierarchical alphanumerical
classification scheme that allows librarians to specify one or multiple codes
for publications. Digital Libraries in Mathematics, as well as reviewing
services, such as zbMATH and Mathematical Reviews (MR) rely on these MSC labels
in their workflows to organize the abstracting and reviewing process.
Especially, the coarse-grained classification determines the subject editor who
is responsible for the actual reviewing process.
In this paper, we investigate the feasibility of automatically assigning a
coarse-grained primary classification using the MSC scheme, by regarding the
problem as a multi-class classification machine learning task. We find that our
method achieves an (F_1)-score of over 77%, which is remarkably close to the
agreement of zbMATH and MR ((F_1)-score of 81%). Moreover, we find that the
method's confidence score allows for reducing the effort by 86% compared to the
manual coarse-grained classification effort while maintaining a precision of
81% for automatically classified articles.
- Abstract(参考訳): 数学、その他の数学の分野の研究論文の著者は、一般的に関連する文献を検索するために数学の主題分類(MSC)方式を用いる。
MSCは、図書館員が出版物の1つまたは複数のコードを指定することができる階層的な数字分類スキームである。
数学におけるデジタルライブラリや、zbmathやmathematical reviews(mr)などのレビューサービスも、これらのmscラベルに依存しており、抽象化とレビューのプロセスを組織化している。
特に、粗粒度分類は、実際のレビュープロセスに責任を持つ被写体編集者を決定する。
本稿では,マルチクラス分類機械学習タスクとしての問題に関して,MSC方式を用いて粗粒度一次分類を自動的に割り当てる可能性を検討する。
本手法は,zbmath と mr ((f_1)-score の約 81% に非常に近い 77% 以上の (f_1)-score が得られることがわかった。
また,本手法の信頼度スコアは,自動分類記事の精度を81%維持しつつ,手作業による粗粒分類よりも86%削減できることがわかった。
関連論文リスト
- Prompt Tuned Embedding Classification for Multi-Label Industry Sector Allocation [2.024620791810963]
本研究では,マルチラベルテキスト分類のためのPrompt Tuningとベースラインの性能をベンチマークする。
企業を投資会社の独自産業分類に分類するために適用される。
このモデルのパフォーマンスは、よく知られた企業とあまり知られていない企業の両方で一貫していることを確認します。
論文 参考訳(メタデータ) (2023-09-21T13:45:32Z) - Pearson-Matthews correlation coefficients for binary and multinary
classification and hypothesis testing [6.974999794070285]
本論文の主眼はマルチナリー分類である。
我々は、textR_textK$ と MPC のメトリクスの両方が、分類結果の貧弱さを決定的に示さないという問題に悩まされていることを示す。
また,MSCの直接拡張とみなすことのできる,新たなマルチナリー分類指標も提示する。
論文 参考訳(メタデータ) (2023-05-10T08:32:36Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Document Provenance and Authentication through Authorship Classification [5.2545206693029884]
本稿では,単一文書と複数文書の分類のためのアンサンブルベースのテキスト処理フレームワークを提案する。
提案するフレームワークには,最先端のテキスト分類アルゴリズムがいくつか組み込まれている。
フレームワークは大規模なベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-02T12:26:03Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - Rank4Class: A Ranking Formulation for Multiclass Classification [26.47229268790206]
マルチクラス分類(MCC)は基本的な機械学習問題である。
ランキングのレンズを通した新しい定式化により,MCCの性能を向上させることは容易であることを示す。
論文 参考訳(メタデータ) (2021-12-17T19:22:37Z) - CLICKER: A Computational LInguistics Classification Scheme for
Educational Resources [47.48935730905393]
科学的主題の分類スキームは、その知識の体系の概要を与える。
計算言語学(CL)と自然言語処理(NLP)には、CCSや数学科目分類(MSC)のような包括的分類体系は存在しない。
そこで本研究では,77の大学におけるオンライン講義の分析に基づいて,CL/NLPのCLICKERを分類する手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T02:40:43Z) - Towards Math-Aware Automated Classification and Similarity Search of
Scientific Publications: Methods of Mathematical Content Representations [0.456877715768796]
STEM文書における自動分類と類似性検索に適した数学的内容表現について検討する。
これらの手法は、arXiv.org論文のサブセットにおいて、参照分類として数学対象分類(MSC)を用いて評価される。
論文 参考訳(メタデータ) (2021-10-08T11:27:40Z) - CoPHE: A Count-Preserving Hierarchical Evaluation Metric in Large-Scale
Multi-Label Text Classification [70.554573538777]
ニューラルLMTCモデルの予測の階層的評価について論じる。
先行技術における構造化ラベル空間の表現における構造的問題について述べる。
深度に基づく表現を用いた階層的評価のための指標セットを提案する。
論文 参考訳(メタデータ) (2021-09-10T13:09:12Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。