論文の概要: DMCNet: Diversified Model Combination Network for Understanding
Engagement from Video Screengrabs
- arxiv url: http://arxiv.org/abs/2204.06454v1
- Date: Wed, 13 Apr 2022 15:24:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 13:20:26.198006
- Title: DMCNet: Diversified Model Combination Network for Understanding
Engagement from Video Screengrabs
- Title(参考訳): DMCNet:ビデオ画面からのエンゲージメント理解のための多様なモデル結合ネットワーク
- Authors: Sarthak Batra, Hewei Wang, Avishek Nag, Philippe Brodeur, Marianne
Checkley, Annette Klinkert, and Soumyabrata Dev
- Abstract要約: エンゲージメントは知的教育インタフェースの開発において重要な役割を果たしている。
非深さ学習モデルは、Histogram of Oriented Gradient(HOG)、SVM(Support Vector Machine)、SIFT(Scale Invariant Feature Transform)、SURF(Speeded Up Robust Features)といった一般的なアルゴリズムの組み合わせに基づいている。
ディープラーニングには、Densely Connected Convolutional Networks (DenseNet-121)、Residual Network (ResNet-18)、MobileNetV1がある。
- 参考スコア(独自算出の注目度): 0.4397520291340695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Engagement is an essential indicator of the Quality-of-Learning Experience
(QoLE) and plays a major role in developing intelligent educational interfaces.
The number of people learning through Massively Open Online Courses (MOOCs) and
other online resources has been increasing rapidly because they provide us with
the flexibility to learn from anywhere at any time. This provides a good
learning experience for the students. However, such learning interface requires
the ability to recognize the level of engagement of the students for a holistic
learning experience. This is useful for both students and educators alike.
However, understanding engagement is a challenging task, because of its
subjectivity and ability to collect data. In this paper, we propose a variety
of models that have been trained on an open-source dataset of video
screengrabs. Our non-deep learning models are based on the combination of
popular algorithms such as Histogram of Oriented Gradient (HOG), Support Vector
Machine (SVM), Scale Invariant Feature Transform (SIFT) and Speeded Up Robust
Features (SURF). The deep learning methods include Densely Connected
Convolutional Networks (DenseNet-121), Residual Network (ResNet-18) and
MobileNetV1. We show the performance of each models using a variety of metrics
such as the Gini Index, Adjusted F-Measure (AGF), and Area Under receiver
operating characteristic Curve (AUC). We use various dimensionality reduction
techniques such as Principal Component Analysis (PCA) and t-Distributed
Stochastic Neighbor Embedding (t-SNE) to understand the distribution of data in
the feature sub-space. Our work will thereby assist the educators and students
in obtaining a fruitful and efficient online learning experience.
- Abstract(参考訳): エンゲージメントはQoLE(Quality-of-Learning Experience)の重要な指標であり、インテリジェントな教育インターフェースの開発において重要な役割を果たしている。
大規模なオープンオンラインコース(moocs)やその他のオンラインリソースを通じて学ぶ人の数は、いつでもどこでも学べる柔軟性を提供するため、急速に増加している。
これは学生によい学習体験を提供する。
しかし、このような学習インタフェースには、総合的な学習体験のための学生の関与度レベルを認識する能力が必要である。
これは生徒にも教育者にも役に立つ。
しかし、主観性とデータ収集能力のため、エンゲージメントを理解することは難しい課題である。
本稿では,ビデオスクリーングラブのオープンソースデータセットに基づいて訓練された様々なモデルを提案する。
我々の非深層学習モデルは,Histogram of Oriented Gradient (HOG), Support Vector Machine (SVM), Scale Invariant Feature Transform (SIFT), Speeded Up Robust Features (SURF)といった一般的なアルゴリズムの組み合わせに基づいている。
ディープラーニングには、Densely Connected Convolutional Networks (DenseNet-121)、Residual Network (ResNet-18)、MobileNetV1がある。
本稿では、Gini Index、Adjusted F-Measure (AGF)、Area Under receiver operating characteristic Curve (AUC)といった様々な指標を用いて、各モデルの性能を示す。
我々は,主成分分析 (PCA) や t-Distributed Stochastic Neighbor Embedding (T-SNE) といった様々な次元削減手法を用いて,特徴空間内のデータの分布を理解する。
これにより、教育者や学生が実りある効率的なオンライン学習体験を得るのに役立ちます。
関連論文リスト
- Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - Pre-training Contextualized World Models with In-the-wild Videos for
Reinforcement Learning [54.67880602409801]
本稿では,視覚制御タスクの学習を効率的に行うために,Wild 動画を多用した事前学習型世界モデルの課題について検討する。
本稿では、コンテキストと動的モデリングを明確に分離したContextualized World Models(ContextWM)を紹介する。
実験により,ContextWMを内蔵したWildビデオ事前学習は,モデルベース強化学習のサンプル効率を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2023-05-29T14:29:12Z) - Exploring Effective Factors for Improving Visual In-Context Learning [56.14208975380607]
In-Context Learning(ICL)は、いくつかのデモ(別名プロンプト)を通じて新しいタスクを理解し、モデルをチューニングせずに新しい入力を予測することである。
本稿では,視覚的文脈学習の推論性能に直接的な影響を及ぼす要因として,迅速な選択と迅速な融合があげられる。
視覚的インコンテキスト学習のためのシンプルなフレームワークプロンプトSelFを提案する。
論文 参考訳(メタデータ) (2023-04-10T17:59:04Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - Learnable Graph Convolutional Network and Feature Fusion for Multi-view
Learning [30.74535386745822]
本稿では,Learningable Graph Convolutional Network and Feature Fusion (LGCN-FF) と呼ばれる統合ディープラーニングフレームワークを提案する。
特徴融合ネットワークと学習可能なグラフ畳み込みネットワークの2つのステージで構成されている。
提案したLGCN-FFは,多視点半教師付き分類において,様々な最先端手法よりも優れていることが検証された。
論文 参考訳(メタデータ) (2022-11-16T19:07:12Z) - X-Learner: Learning Cross Sources and Tasks for Universal Visual
Representation [71.51719469058666]
本稿では,X-Learnerという表現学習フレームワークを提案する。
X-Learnerは、様々なソースによって管理される複数の視覚タスクの普遍的な特徴を学習する。
X-Learnerは、追加のアノテーションやモダリティ、計算コストを使わずに、様々なタスクで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-16T17:23:26Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Student sentiment Analysis Using Classification With Feature Extraction
Techniques [0.0]
本稿では,Webベースの学習とその学生に対する効果について述べる。
私たちは、ロジスティック回帰(LR)、サポートベクトルマシン(SVM)、ナイーブベイズ(NB)、決定木(DT)といった機械学習手法をどのように研究した。
論文 参考訳(メタデータ) (2021-02-01T18:48:06Z) - Sense and Learn: Self-Supervision for Omnipresent Sensors [9.442811508809994]
我々は、生の知覚データから表現や特徴学習のためのSense and Learnというフレームワークを提案する。
これは、面倒なラベル付けプロセスに人間が関与することなく、注釈のないデータから、高レベルで広範囲に有用な特徴を学習できる補助的なタスクで構成されている。
提案手法は、教師付きアプローチと競合する結果を達成し、ネットワークを微調整し、ほとんどの場合、下流タスクを学習することでギャップを埋める。
論文 参考訳(メタデータ) (2020-09-28T11:57:43Z) - Analyzing Student Strategies In Blended Courses Using Clickstream Data [32.81171098036632]
パターンマイニングと、自然言語処理から借用したモデルを用いて、学生のインタラクションを理解します。
きめ細かいクリックストリームデータは、非商業的な教育支援システムであるDiderotを通じて収集される。
提案手法は,混合コースの低データ設定においても有意な洞察を得られることが示唆された。
論文 参考訳(メタデータ) (2020-05-31T03:01:00Z) - Efficient Crowd Counting via Structured Knowledge Transfer [122.30417437707759]
クラウドカウントはアプリケーション指向のタスクであり、その推論効率は現実世界のアプリケーションにとって不可欠である。
本稿では,学生ネットワークを軽量かつ高効率に構築する構造的知識伝達フレームワークを提案する。
我々のモデルはNvidia 1080 GPUで最低6.5$times$のスピードアップを取得し、最先端のパフォーマンスも達成しています。
論文 参考訳(メタデータ) (2020-03-23T08:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。