論文の概要: AI Knows Which Words Will Appear in Next Year's Korean CSAT
- arxiv url: http://arxiv.org/abs/2211.15426v2
- Date: Thu, 3 Aug 2023 00:40:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 17:25:10.089432
- Title: AI Knows Which Words Will Appear in Next Year's Korean CSAT
- Title(参考訳): AIは来年の韓国のCSATに現れる単語を知っている
- Authors: Byunghyun Ban, Jejong Lee, Hyeonmok Hwang
- Abstract要約: テキストマイニングに基づく単語クラス分類法とLSTMに基づく語彙パターン予測法を導入する。
まず,簡単なテキスト出現頻度分析に基づく事前処理手法について述べる。
また,語彙出現パターン予測法としてLSTM深層学習法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A text-mining-based word class categorization method and LSTM-based
vocabulary pattern prediction method are introduced in this paper. A
preprocessing method based on simple text appearance frequency analysis is
first described. This method was developed as a data screening tool but showed
4.35 ~ 6.21 times higher than previous works. An LSTM deep learning method is
also suggested for vocabulary appearance pattern prediction method. AI performs
a regression with various size of data window of previous exams to predict the
probabilities of word appearance in the next exam. Predicted values of AI over
various data windows are processed into a single score as a weighted sum, which
we call an "AI-Score", which represents the probability of word appearance in
next year's exam. Suggested method showed 100% accuracy at the range 100-score
area and showed only 1.7% error of prediction in the section where the scores
were over 60 points. All source codes are freely available at the authors' Git
Hub repository. (https://github.com/needleworm/bigdata_voca)
- Abstract(参考訳): 本稿では,テキストマイニングに基づく単語分類法とLSTMに基づく語彙パターン予測手法を提案する。
まず,簡単なテキスト出現頻度分析に基づく事前処理手法について述べる。
この方法はデータスクリーニングツールとして開発されたが、以前の作業よりも4.35 ~ 6.21 倍高い値を示した。
また,語彙出現パターン予測法としてLSTM深層学習法を提案する。
aiは、前の試験のさまざまなサイズのデータウィンドウで回帰を行い、次の試験で単語出現の確率を予測する。
各種データウィンドウ上のAIの予測値は、重み付け和として単一のスコアに処理され、これは、来年の試験における単語の出現確率を表す「AIスコア」と呼ばれる。
提案手法は100スコアの範囲で100%精度を示し,60点以上の区間では予測誤差が1.7%であった。
すべてのソースコードは、著者のgit hubリポジトリから無料で入手できる。
(https://github.com/needleworm/bigdata_voca)
関連論文リスト
- A Novel Word Pair-based Gaussian Sentence Similarity Algorithm For Bengali Extractive Text Summarization [1.3791394805787949]
本稿では,2つの文間の意味的関係を計算するために,ワードペアベースのガウス文類似性(WGSS)アルゴリズムを提案する。
単語平均化法で直面する文表現問題を補正する単語対単語ベースで2つの文を比較する。
提案手法は, 4つの異なるデータセットを用いて検証し, ROUGEの平均値に対して43.2%向上した。
論文 参考訳(メタデータ) (2024-11-26T07:42:16Z) - Reading ability detection using eye-tracking data with LSTM-based few-shot learning [0.27309692684728615]
提案手法は,Long Short Time Memory(LSTM)と軽量ニューラルネットワークを組み合わせることで,スコア予測のための回帰モデルを構築した。
実験により, 提案手法は, 数発の学習戦略により, 読み出し能力の検出における従来のスコア予測法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-09-13T13:06:01Z) - Contrastive Difference Predictive Coding [79.74052624853303]
本研究では、時系列データの断片を縫合して、将来の事象の予測を学習するために必要なデータの量を減少させるコントラッシブ予測符号化の時間差版を導入する。
目的条件付きRLの非政治アルゴリズムを導出するために,この表現学習手法を適用した。
論文 参考訳(メタデータ) (2023-10-31T03:16:32Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Accurate Prediction of Global Mean Temperature through Data
Transformation Techniques [0.0]
本稿では,複雑なMLアルゴリズムやディープラーニングニューラルネットワーク(Deep Learning Neural Networks, DNN)を直接利用するのではなく, 統計的, 簡便な機械学習手法の利点について検討する。
さまざまな単純なML手法は、最初のステップとして大規模なアルゴリズムの花束を試すことのメリットを示す、よく知られた手法よりも優れているか、あるいは優れている。
論文 参考訳(メタデータ) (2023-03-11T17:39:57Z) - M-Tuning: Prompt Tuning with Mitigated Label Bias in Open-Set Scenarios [103.6153593636399]
緩和ラベルバイアス(M-Tuning)を用いた視覚言語プロンプトチューニング手法を提案する。
これはWordNetからのオープンワードを導入し、クローズドセットラベルワードのみからもっと多くのプロンプトテキストを形成する単語の範囲を広げ、シミュレートされたオープンセットシナリオでプロンプトをチューニングする。
提案手法は,様々なスケールのデータセット上で最高の性能を達成し,広範囲にわたるアブレーション研究もその有効性を検証した。
論文 参考訳(メタデータ) (2023-03-09T09:05:47Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - $k$-Neighbor Based Curriculum Sampling for Sequence Prediction [22.631763991832862]
言語モデルにおける多段階予測は、トレーニングとテスト時間プロセスの相違により困難である。
教師方針を段階的に変更するカリキュラム学習に基づく手法であるtextitNearest-Neighbor Replacement Samplingを提案する。
本研究では, 2つの言語モデリングベンチマークについて報告し, スケジュールされたサンプリングと併用することで, 性能をさらに向上させる方法を提案する。
論文 参考訳(メタデータ) (2021-01-22T20:07:29Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。