論文の概要: A Keyword-Based Technique to Evaluate Broad Question Answer Script
- arxiv url: http://arxiv.org/abs/2506.21461v1
- Date: Thu, 26 Jun 2025 16:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.199674
- Title: A Keyword-Based Technique to Evaluate Broad Question Answer Script
- Title(参考訳): 広義問合せ文の評価のためのキーワードベース手法
- Authors: Tamim Al Mahmud, Md Gulzar Hussain, Sumaiya Kabir, Hasnain Ahmad, Mahmudus Sobhan,
- Abstract要約: 本稿では,主観的回答スクリプトを電子的に評価する効率的な方法を提案する。
この記事では、回答スクリプトからキーワードを見つけ出し、オープンドメインとクローズドドメインの両方から解析されたキーワードと比較する。
提案システムでは,100名の学生の回答スクリプトを用いて,精度スコア0.91。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluation is the method of assessing and determining the educational system through various techniques such as verbal or viva-voice test, subjective or objective written test. This paper presents an efficient solution to evaluate the subjective answer script electronically. In this paper, we proposed and implemented an integrated system that examines and evaluates the written answer script. This article focuses on finding the keywords from the answer script and then compares them with the keywords that have been parsed from both open and closed domain. The system also checks the grammatical and spelling errors in the answer script. Our proposed system tested with answer scripts of 100 students and gives precision score 0.91.
- Abstract(参考訳): 評価とは、言語またはヴィヴァ音声テスト、主観的または客観的な文章テストなどの様々な技術を用いて、教育システムを評価し、判定する方法である。
本稿では,主観的回答スクリプトを電子的に評価する効率的な方法を提案する。
本稿では,本文の回答スクリプトを検証し,評価する統合システムを提案し,実装した。
この記事では、回答スクリプトからキーワードを見つけ出し、オープンドメインとクローズドドメインの両方から解析されたキーワードと比較する。
システムは、回答スクリプトの文法的およびスペルエラーもチェックする。
提案システムでは,100名の学生の回答スクリプトを用いて,精度スコア0.91。
関連論文リスト
- Context Biasing for Pronunciations-Orthography Mismatch in Automatic Speech Recognition [56.972851337263755]
本稿では,置換誤りの訂正を可能とし,難解な単語の認識精度を向上させる手法を提案する。
この手法により, 単語誤り率の相対的な改善を最大11%に抑えつつ, 単語誤り率の競争力を維持することができることを示す。
論文 参考訳(メタデータ) (2025-06-23T14:42:03Z) - Towards an automatic method for generating topical vocabulary test forms for specific reading passages [2.76918316640399]
K-toolは、特定のテキストに関連する学生の背景知識を測定する、話題語彙テストを生成する自動化システムである。
このシステムは中高生の英語母語話者での使用を目的としている。
論文 参考訳(メタデータ) (2025-05-24T15:57:02Z) - Automated Generation of Multiple-Choice Cloze Questions for Assessing
English Vocabulary Using GPT-turbo 3.5 [5.525336037820985]
大規模言語モデル(LLM)を用いた複数質問の自動生成手法の評価を行った。
VocaTTエンジンはPythonで記述されており、ターゲット単語リストの事前処理、文と候補単語オプションの生成、最後に適切な単語オプションの選択という3つの基本的なステップで構成されている。
その結果、文が75%、単語が66.85%であることがわかった。
論文 参考訳(メタデータ) (2024-03-04T14:24:47Z) - TEMPERA: Test-Time Prompting via Reinforcement Learning [57.48657629588436]
強化学習(TEMPERA)を用いたテスト時間プロンプト編集を提案する。
従来のプロンプト生成手法とは対照的に、TEMPERAは事前知識を効率的に活用することができる。
本手法は従来の微調整法と比較して試料効率の平均改善率を5.33倍に向上させる。
論文 参考訳(メタデータ) (2022-11-21T22:38:20Z) - Handwriting recognition and automatic scoring for descriptive answers in
Japanese language tests [7.489722641968594]
本報告では, 大学入試試験における手書き記述回答の自動評価実験について述べる。
すべての答えは人間の検査官によって採点されているが、手書き文字はラベル付けされていない。
我々は、ラベル付き手書きデータセットで訓練されたディープニューラルネットワークベースの手書き文字認識器を、このラベル付き回答セットに適応させようと試みる。
論文 参考訳(メタデータ) (2022-01-10T08:47:52Z) - POSSCORE: A Simple Yet Effective Evaluation of Conversational Search
with Part of Speech Labelling [25.477834359694473]
Google AssistantやMicrosoft Cortanaのような会話型検索システムは、ユーザーが自然言語対話を通じて検索システムとの通信を許可する新しい検索パラダイムを提供する。
本稿では,会話検索のための簡易かつ効果的な自動評価手法POSSCOREを提案する。
我々の指標は人間の嗜好と相関し、最先端の基準指標よりも大幅に改善できることが示される。
論文 参考訳(メタデータ) (2021-09-07T12:31:29Z) - Text similarity analysis for evaluation of descriptive answers [0.0]
本論文では, テキスト解析に基づく自動評価手法を提案する。
このアーキテクチャでは、検査者は与えられた質問の集合に対するサンプル回答シートを作成する。
テキスト要約、テキスト意味論、キーワード要約の概念を使用して、各回答の最終スコアを計算します。
論文 参考訳(メタデータ) (2021-05-06T20:19:58Z) - Get It Scored Using AutoSAS -- An Automated System for Scoring Short
Answers [63.835172924290326]
SAS(Automatic Short Answer Scoring)への高速でスケーラブルで正確なアプローチを提示します。
SASのためのシステム、すなわちAutoSASの設計と開発を提案し、説明します。
AutoSASは最先端のパフォーマンスを示し、いくつかの質問のプロンプトで8%以上良い結果が得られる。
論文 参考訳(メタデータ) (2020-12-21T10:47:30Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z) - Differentiable Reasoning over a Virtual Knowledge Base [156.94984221342716]
コーパスを仮想知識ベース(KB)として,複雑なマルチホップ質問に答えるタスクについて検討する。
特に、コーパス内のエンティティの参照間の関係の経路をソフトに追従し、KBのようにテキストデータをトラバースするDrKITについて述べる。
DrKITは非常に効率的で、既存のマルチホップシステムよりも毎秒10-100倍のクエリを処理する。
論文 参考訳(メタデータ) (2020-02-25T03:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。