論文の概要: Key Phrase Classification in Complex Assignments
- arxiv url: http://arxiv.org/abs/2003.07019v1
- Date: Mon, 16 Mar 2020 04:25:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 02:37:49.618242
- Title: Key Phrase Classification in Complex Assignments
- Title(参考訳): 複合配置におけるキーフレーズ分類
- Authors: Manikandan Ravikiran
- Abstract要約: キーフレーズの分類作業は,人間レベルでは曖昧であり,新しいデータセット上でコーエンのカッパが0.77であることを示す。
事前訓練された言語モデルと単純なTFIDF SVM分類器の両方が、前者の生成平均0.6 F1が後者よりも高い結果を生成する。
- 参考スコア(独自算出の注目度): 5.067828201066184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Complex assignments typically consist of open-ended questions with large and
diverse content in the context of both classroom and online graduate programs.
With the sheer scale of these programs comes a variety of problems in peer and
expert feedback, including rogue reviews. As such with the hope of identifying
important contents needed for the review, in this work we present a very first
work on key phrase classification with a detailed empirical study on
traditional and most recent language modeling approaches. From this study, we
find that the task of classification of key phrases is ambiguous at a human
level producing Cohen's kappa of 0.77 on a new data set. Both pretrained
language models and simple TFIDF SVM classifiers produce similar results with a
former producing average of 0.6 F1 higher than the latter. We finally derive
practical advice from our extensive empirical and model interpretability
results for those interested in key phrase classification from educational
reports in the future.
- Abstract(参考訳): 複雑な課題は通常、教室とオンラインの大学院プログラムの両方の文脈で、大きく多様なコンテンツを持つオープンエンドの質問からなる。
これらのプログラムの規模が大きくなれば、査読や専門家からのフィードバックにはさまざまな問題がある。
レビューに必要な重要な内容を特定することを目的として,本研究は,従来の言語モデルアプローチおよび最新の言語モデリングアプローチに関する詳細な実証研究とともに,キーフレーズ分類に関する最初の研究を示す。
本研究では,キーフレーズの分類作業が,新しいデータセット上で0.77のコーエンのカッパを生成する人間レベルで曖昧であることを示す。
事前訓練された言語モデルと単純なtfidf svm分類器の両方が、前者の平均0.6 f1よりも高い結果を生成する。
今後の教育報告から重要なフレーズ分類に関心のある人々に対して、実験的およびモデル解釈可能性の結果から実践的アドバイスを導き出した。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Estimating Confidence of Predictions of Individual Classifiers and Their
Ensembles for the Genre Classification Task [0.0]
Genre IDは、非トピックテキスト分類のサブクラスである。
BERTやXLM-RoBERTaのような事前訓練されたトランスフォーマーに基づく神経モデルは、多くのNLPタスクにおいてSOTA結果を示す。
論文 参考訳(メタデータ) (2022-06-15T09:59:05Z) - Automated Speech Scoring System Under The Lens: Evaluating and
interpreting the linguistic cues for language proficiency [26.70127591966917]
従来の機械学習モデルを用いて、音声認識タスクを分類と回帰問題の両方として定式化する。
まず,5つのカテゴリー(頻度,発音,内容,文法,語彙,音響)で言語学の特徴を抽出し,応答を学習する。
比較すると,回帰に基づくモデルでは,分類法と同等かそれ以上の性能があることがわかった。
論文 参考訳(メタデータ) (2021-11-30T06:28:58Z) - A Multimodal Machine Learning Framework for Teacher Vocal Delivery
Evaluation [21.07429789279818]
本稿では,ペアワイズ比較とマルチモーダル・ハウジング・アルゴリズムを用いて,教師の声道伝達の客観評価結果を生成する機械学習手法を提案する。
論文 参考訳(メタデータ) (2021-07-15T05:09:39Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Finding Black Cat in a Coal Cellar -- Keyphrase Extraction &
Keyphrase-Rubric Relationship Classification from Complex Assignments [5.067828201066184]
本稿では,キーフレーズ抽出作業における教師あり教師なしアプローチの有効性を定量化することを目的とする。
i) 教師なしの MultiPartiteRank がキーフレーズ抽出に最適であることがわかった。
今後,これらの課題に関心のある人々に対して,包括的分析と有用な観察結果の導出を行う。
論文 参考訳(メタデータ) (2020-04-03T13:18:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。