論文の概要: Quality Prediction of Open Educational Resources A Metadata-based
Approach
- arxiv url: http://arxiv.org/abs/2005.10542v3
- Date: Fri, 29 May 2020 15:26:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 03:50:04.799175
- Title: Quality Prediction of Open Educational Resources A Metadata-based
Approach
- Title(参考訳): オープン教育資源の品質予測 : メタデータに基づくアプローチ
- Authors: Mohammadreza Tavakoli, Mirette Elias, G\'abor Kismih\'ok, S\"oren Auer
- Abstract要約: メタデータは、レコメンデーションや検索といった高品質なサービスを提供する上で重要な役割を担います。
我々はOERメタデータスコアリングモデルを提案し,OERの品質を予測できるメタデータベースの予測モデルを構築した。
データとモデルに基づいて、F1スコア94.6%の高品質なOERを検出できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the recent decade, online learning environments have accumulated millions
of Open Educational Resources (OERs). However, for learners, finding relevant
and high quality OERs is a complicated and time-consuming activity.
Furthermore, metadata play a key role in offering high quality services such as
recommendation and search. Metadata can also be used for automatic OER quality
control as, in the light of the continuously increasing number of OERs, manual
quality control is getting more and more difficult. In this work, we collected
the metadata of 8,887 OERs to perform an exploratory data analysis to observe
the effect of quality control on metadata quality. Subsequently, we propose an
OER metadata scoring model, and build a metadata-based prediction model to
anticipate the quality of OERs. Based on our data and model, we were able to
detect high-quality OERs with the F1 score of 94.6%.
- Abstract(参考訳): 近年、オンライン学習環境は数百万のオープン教育資源(OER)を蓄積している。
しかし、学習者にとって、関連性があり高品質なOERを見つけることは、複雑で時間を要する活動である。
さらに、メタデータはレコメンデーションや検索といった高品質なサービスを提供する上で重要な役割を担います。
メタデータは、oersが継続的に増えていることから、手作業による品質管理がますます難しくなっているため、oerの品質管理の自動化にも利用できる。
本研究では,8,887 OERのメタデータを収集し,探索データ解析を行い,品質管理がメタデータの品質に与える影響を観察した。
その後,oerメタデータスコアリングモデルを提案し,oerの品質を予測するメタデータベースの予測モデルを構築する。
データとモデルに基づいて、F1スコア94.6%の高品質なOERを検出できた。
関連論文リスト
- Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - Towards augmented data quality management: Automation of Data Quality Rule Definition in Data Warehouses [0.0]
本研究では,大規模組織で一般的に使用されているデータリポジトリとして,データウェアハウス内のデータ品質管理を自動化する可能性について検討する。
レビューでは、さまざまなソースから151のツールが紹介され、現在のほとんどのツールは、データウェアハウスではなく、ドメイン固有のデータベースのクリーニングと修正に重点を置いていることが明らかになった。
データウェアハウスでこれを実装することは言うまでもなく、DQルールを検出する能力を示したのは、限られたツール、特に10ツールだけだった。
論文 参考訳(メタデータ) (2024-06-16T13:43:04Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Quality In / Quality Out: Assessing Data quality in an Anomaly Detection
Benchmark [0.13764085113103217]
同じベンチマークデータセット(異常検出のためのフローベースリアルタイムデータセットであるUGR'16)に対する比較的小さな変更は、考慮した機械学習技術よりも、モデルパフォーマンスに著しく影響することを示します。
この結果から,自律型ネットワークにおけるデータ品質評価と最適化技術に,より注意を払う必要があることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T12:03:12Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - RLBoost: Boosting Supervised Models using Deep Reinforcement Learning [0.0]
RLBoostは、深層強化学習戦略を用いて、特定のデータセットを評価し、新しいデータの品質を推定できるモデルを得るアルゴリズムである。
論文の結果から, このモデルでは, LOO, DataShapley, DVRLなどの最先端アルゴリズムよりも, より優れた, より安定した結果が得られることが示された。
論文 参考訳(メタデータ) (2023-05-23T14:38:33Z) - Core-set Selection Using Metrics-based Explanations (CSUME) for
multiclass ECG [2.0520503083305073]
高品質なデータを選択することで、ディープラーニングモデルの性能が向上することを示す。
実験の結果,9.67%,8.69%の精度とリコール改善が得られた。
論文 参考訳(メタデータ) (2022-05-28T19:36:28Z) - ZeroGen$^+$: Self-Guided High-Quality Data Generation in Efficient
Zero-Shot Learning [97.2907428983142]
ZeroGenは、純粋にPLMを使用してデータを生成し、タスク固有のアノテーションに頼ることなく、小さなモデルをトレーニングする。
金のデータを必要とせずに、サンプルごとの重み付けを学習できるノイズローバストなバイレベル再重み付けフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:38:48Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - Metadata Analysis of Open Educational Resources [0.0]
オープン教育資源(英語: Open Educational Resources, OER)は、オープンライセンスの教育資料であり、広く教育に利用されている。
この研究は8,887個のOERのメタデータを使用して、OERメタデータの探索データ解析を行う。
その結果,OERのメタデータとOERのコンテンツ品質は密接な関係にあり,高品質なOERを94.6%の精度で検出できた。
論文 参考訳(メタデータ) (2021-01-19T17:16:44Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。