論文の概要: Using Active Learning Methods to Strategically Select Essays for
Automated Scoring
- arxiv url: http://arxiv.org/abs/2301.00628v1
- Date: Mon, 2 Jan 2023 12:46:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 14:52:41.904959
- Title: Using Active Learning Methods to Strategically Select Essays for
Automated Scoring
- Title(参考訳): 自動スコアリングのためのエッセイを戦略的に選択するアクティブラーニング手法
- Authors: Tahereh Firoozi, Hamid Mohammadi, Mark J. Gierl
- Abstract要約: 本研究の目的は,3つのアクティブラーニング手法を記述し,評価することである。
3つのアクティブな学習方法は不確実性に基づく、トポロジに基づく、ハイブリッドな方法である。
これら3つの手法はいずれも強い結果をもたらし、トポロジカルな手法は最も効率的な分類を生み出した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Research on automated essay scoring has become increasing important because
it serves as a method for evaluating students' written-responses at scale.
Scalable methods for scoring written responses are needed as students migrate
to online learning environments resulting in the need to evaluate large numbers
of written-response assessments. The purpose of this study is to describe and
evaluate three active learning methods than can be used to minimize the number
of essays that must be scored by human raters while still providing the data
needed to train a modern automated essay scoring system. The three active
learning methods are the uncertainty-based, the topological-based, and the
hybrid method. These three methods were used to select essays included as part
of the Automated Student Assessment Prize competition that were then classified
using a scoring model that was training with the bidirectional encoder
representations from transformer language model. All three active learning
methods produced strong results, with the topological-based method producing
the most efficient classification. Growth rate accuracy was also evaluated. The
active learning methods produced different levels of efficiency under different
sample size allocations but, overall, all three methods were highly efficient
and produced classifications that were similar to one another.
- Abstract(参考訳): 自動エッセイスコアリングに関する研究は,学生の書面応答を大規模に評価する手段として重要になっている。
学生がオンライン学習環境に移行する際には,書面応答の評価を行うためのスケーラブルな手法が必要である。
本研究の目的は,近代的な自動エッセイ評価システムの訓練に必要なデータを提供しながら,人間による評価が必要なエッセイの数を最小限に抑えるために利用可能な3つのアクティブラーニング手法を記述し,評価することである。
3つのアクティブな学習方法は不確実性に基づく、トポロジに基づく、ハイブリッドな方法である。
これらの3つの手法は, トランスフォーマー言語モデルから双方向エンコーダ表現を訓練したスコアリングモデルを用いて分類された自動学生評価コンテストに含まれるエッセイを選択するために用いられた。
3つのアクティブラーニング手法はいずれも強い結果を示し、トポロジカルベース法が最も効率的な分類を生み出した。
成長率も評価された。
能動的学習法は, 異なるサンプルサイズ割り当ての下で異なるレベルの効率を創出するが, 全体としては3つの手法は極めて効率的であり, 互いに類似した分類が得られた。
関連論文リスト
- Likelihood as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
言語モデルの性能の効果的な指標としての可能性を示す。
提案手法は,より優れた性能をもたらすプロンプトの選択と構築のための尺度として,疑似可能性を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - Efficient Knowledge Distillation: Empowering Small Language Models with Teacher Model Insights [0.412484724941528]
そこで本研究では,小言語モデルの性能向上を目的とした,単純かつ効果的な知識蒸留手法を提案する。
提案手法では,約30億のパラメータを持つ教師モデルを用いて,意思決定プロセスにおいて最も影響力のあるトークンを同定する。
この方法は、4つの多様なデータセットでテストすることによって実証されたように、効果的であることが証明されている。
論文 参考訳(メタデータ) (2024-09-19T09:09:53Z) - Active Transfer Learning for Efficient Video-Specific Human Pose
Estimation [16.415080031134366]
ヒューマン・ポース(HP)推定は幅広い応用のために活発に研究されている。
本稿では,アクティブラーニング(AL)とトランスファーラーニング(TL)を組み合わせて,HP推定器を個々のビデオ領域に効率よく適応させる手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T21:56:29Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Saliency Cards: A Framework to Characterize and Compare Saliency Methods [34.38335172204263]
Saliencyメソッドは、各入力機能がモデルの出力に対してどれだけ重要かを計算する。
既存のアプローチでは、多様なユーザニーズを考慮しない唾液度メソッドに対して、普遍的なデシラタを仮定している。
サリエンシカード(Saliency Card)は、サリエンシメソッドの動作とパフォーマンスに関する構造化されたドキュメントである。
論文 参考訳(メタデータ) (2022-06-07T01:21:49Z) - Partner-Assisted Learning for Few-Shot Image Classification [54.66864961784989]
人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T22:46:19Z) - Automating Document Classification with Distant Supervision to Increase
the Efficiency of Systematic Reviews [18.33687903724145]
体系的なレビューは高価で、時間的需要があり、労働集約的です。
文書のレビュー作業を大幅に削減するための自動文書分類アプローチを提案します。
論文 参考訳(メタデータ) (2020-12-09T22:45:40Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - The World is Not Binary: Learning to Rank with Grayscale Data for
Dialogue Response Selection [55.390442067381755]
人間の努力なしに、グレースケールのデータを自動的に構築できることが示される。
本手法では,自動グレースケールデータ生成装置として,市販の応答検索モデルと応答生成モデルを用いる。
3つのベンチマークデータセットと4つの最先端マッチングモデルの実験は、提案手法が大幅に、一貫したパフォーマンス改善をもたらすことを示している。
論文 参考訳(メタデータ) (2020-04-06T06:34:54Z) - PONE: A Novel Automatic Evaluation Metric for Open-Domain Generative
Dialogue Systems [48.99561874529323]
オープンドメイン生成対話システムの評価には3つの方法がある。
体系的な比較が欠如しているため、どの指標がより効果的であるかは明らかでない。
本稿では,人間の判断との相関性を大幅に改善できる,新しい,実現可能な学習基準を提案する。
論文 参考訳(メタデータ) (2020-04-06T04:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。