論文の概要: Prob2Vec: Mathematical Semantic Embedding for Problem Retrieval in
Adaptive Tutoring
- arxiv url: http://arxiv.org/abs/2003.10838v1
- Date: Sat, 21 Mar 2020 00:16:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 12:49:34.144166
- Title: Prob2Vec: Mathematical Semantic Embedding for Problem Retrieval in
Adaptive Tutoring
- Title(参考訳): Prob2Vec:適応的チューニングにおける問題検索のための数学的意味埋め込み
- Authors: Du Su, Ali Yekkehkhany, Yi Lu, Wenmiao Lu
- Abstract要約: 人間が十分なトレーニングセットで一致した類似度スコアを決定するのは難しい。
本稿では,抽象化と組込みステップからなる階層型問題埋め込みアルゴリズムProb2Vecを提案する。
Prob2Vec 96.88%の精度で問題類似性テストを行った。
- 参考スコア(独自算出の注目度): 4.230510356675453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new application of embedding techniques for problem retrieval in
adaptive tutoring. The objective is to retrieve problems whose mathematical
concepts are similar. There are two challenges: First, like sentences, problems
helpful to tutoring are never exactly the same in terms of the underlying
concepts. Instead, good problems mix concepts in innovative ways, while still
displaying continuity in their relationships. Second, it is difficult for
humans to determine a similarity score that is consistent across a large enough
training set. We propose a hierarchical problem embedding algorithm, called
Prob2Vec, that consists of abstraction and embedding steps. Prob2Vec achieves
96.88\% accuracy on a problem similarity test, in contrast to 75\% from
directly applying state-of-the-art sentence embedding methods. It is
interesting that Prob2Vec is able to distinguish very fine-grained differences
among problems, an ability humans need time and effort to acquire. In addition,
the sub-problem of concept labeling with imbalanced training data set is
interesting in its own right. It is a multi-label problem suffering from
dimensionality explosion, which we propose ways to ameliorate. We propose the
novel negative pre-training algorithm that dramatically reduces false negative
and positive ratios for classification, using an imbalanced training data set.
- Abstract(参考訳): 適応学習における問題検索のための埋め込み手法の新たな応用を提案する。
目的は、数学的概念が類似した問題を解くことである。
第一に、文章のように、チュータリングに役立つ問題は、基礎となる概念に関して全く同じではない。
その代わり、良い問題は概念を革新的な方法で混合し、その関係の連続性を表示する。
第二に、人間が十分なトレーニングセットで一致した類似度スコアを決定することは困難である。
本稿では,抽象化と組込みステップからなる階層型問題埋め込みアルゴリズムProb2Vecを提案する。
prob2vecは問題類似性テストにおいて96.88\%の精度を達成している。
Prob2Vecは、人間が取得する時間と労力を必要とする問題と、非常にきめ細かい違いを区別できるのが興味深い。
さらに、不均衡なトレーニングデータセットを持つ概念ラベリングのサブ問題は、それ自体が興味深い。
次元の爆発に苦しむマルチラベル問題であり,その改善法を提案する。
不均衡なトレーニングデータセットを用いて、分類のための偽陰性および正の比率を劇的に低減する新しい負事前学習アルゴリズムを提案する。
関連論文リスト
- From Variance to Veracity: Unbundling and Mitigating Gradient Variance in Differentiable Bundle Adjustment Layers [10.784222655465264]
ロボット工学における様々なポーズ推定と追跡問題は、対応推定問題と重み付き最小二乗最適化問題に分解することができる。
近年の研究では、他方の出力に条件付きを反復的に精製することで2つの問題を結合させることで、ドメイン間でSOTA結果が得られることが示されている。
これらのモデルのトレーニングは難しいことが分かり、トレーニングを安定させ、スピードアップするためには、数多くのトリックが必要になることがわかりました。
論文 参考訳(メタデータ) (2024-06-12T00:41:25Z) - Semisupervised score based matching algorithm to evaluate the effect of public health interventions [3.221788913179251]
1対1のマッチングアルゴリズムでは、マッチする多数の"ペア"は、大きなサンプルからの情報と多数のタスクの両方を意味する可能性がある。
本稿では,2次スコア関数 $S_beta(x_i,x_j)= betaT (x_i-x_j)(x_i-x_j)T beta$ に基づく新しい1対1マッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-19T02:24:16Z) - Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-11T13:44:49Z) - Recovering Top-Two Answers and Confusion Probability in Multi-Choice
Crowdsourcing [10.508187462682308]
我々は,クラウドソーシングの課題を,基礎的真理だけでなく,最も紛らわしい回答と混乱確率の回復を目標として検討している。
本稿では,各タスクの上位2つの答えが,他の選択肢と区別されるモデルを提案する。
このモデルでは、上位2つの答えと混乱確率の両方を推測する2段階の推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-29T09:46:39Z) - Rebalanced Siamese Contrastive Mining for Long-Tailed Recognition [120.80038161330623]
教師付きコントラスト学習は、元のバッチレベルとシームズバッチレベルの両方において、二重クラス不均衡の問題に悩まされていることを示す。
コントラスト計算のための情報的ペアを抽出し,表現学習を改善するために,教師付き強正・負のペアマイニングを提案する。
論文 参考訳(メタデータ) (2022-03-22T07:30:38Z) - Deep Probabilistic Graph Matching [72.6690550634166]
本稿では,マッチング制約を伴わずに,元のQAPに適合する深層学習ベースのグラフマッチングフレームワークを提案する。
提案手法は,一般的な3つのベンチマーク(Pascal VOC,Wilow Object,SPair-71k)で評価され,すべてのベンチマークにおいて過去の最先端よりも優れていた。
論文 参考訳(メタデータ) (2022-01-05T13:37:27Z) - Simple Stochastic and Online Gradient DescentAlgorithms for Pairwise
Learning [65.54757265434465]
ペアワイズ学習(Pairwise learning)とは、損失関数がペアインスタンスに依存するタスクをいう。
オンライン降下(OGD)は、ペアワイズ学習でストリーミングデータを処理する一般的なアプローチである。
本稿では,ペアワイズ学習のための手法について,シンプルでオンラインな下降を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:10:48Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Iterative Weak Learnability and Multi-Class AdaBoost [0.0]
SAMMEに触発されたマルチクラス分類問題に対する効率的なアンサンブルアルゴリズムを構築する。
SAMMEとは対照的に、アルゴリズムの最終仮説は確率1の正しいラベルに収束する。
サンプルサイズのみに依存する訓練誤差と追加項の和は,適応ブースティングアルゴリズムとしてアルゴリズムの一般化誤差を限定する。
論文 参考訳(メタデータ) (2021-01-26T03:30:30Z) - Learning to Actively Learn: A Robust Approach [22.75298609290053]
本研究では,アクティブラーニングや純粋探索型マルチアームバンディットといった適応データ収集タスクのアルゴリズム設計手法を提案する。
我々の適応アルゴリズムは、情報理論の下界から導かれる問題の同値クラスに対する逆学習によって学習される。
我々は,訓練手順の安定性と有効性を正当化するための合成実験を行い,実データから導出される課題について評価する。
論文 参考訳(メタデータ) (2020-10-29T06:48:22Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。