論文の概要: Extracting Topics from Open Educational Resources
- arxiv url: http://arxiv.org/abs/2006.11109v1
- Date: Fri, 19 Jun 2020 12:50:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-13 11:22:11.009963
- Title: Extracting Topics from Open Educational Resources
- Title(参考訳): オープン教育資源からトピックを抽出する
- Authors: Mohammadreza Molavi, Mohammadreza Tavakoli, and G\'abor Kismih\'ok
- Abstract要約: 本稿では,テキストマイニング手法を適用したOERトピック抽出手法を提案し,トピック分布に関する高品質なOERメタデータを生成する。
1)データサイエンス関連のスキルの分野でCourseraとKhan Academyから123の講義を収集し、2)これらのスキルに関連する既存のトピックを抽出するためにLDA(Latent Dirichlet Allocation)を適用し、3)特定のOERがカバーするトピック分布を定義する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, Open Educational Resources (OERs) were earmarked as critical
when mitigating the increasing need for education globally. Obviously, OERs
have high-potential to satisfy learners in many different circumstances, as
they are available in a wide range of contexts. However, the low-quality of OER
metadata, in general, is one of the main reasons behind the lack of
personalised services such as search and recommendation. As a result, the
applicability of OERs remains limited. Nevertheless, OER metadata about covered
topics (subjects) is essentially required by learners to build effective
learning pathways towards their individual learning objectives. Therefore, in
this paper, we report on a work in progress project proposing an OER topic
extraction approach, applying text mining techniques, to generate high-quality
OER metadata about topic distribution. This is done by: 1) collecting 123
lectures from Coursera and Khan Academy in the area of data science related
skills, 2) applying Latent Dirichlet Allocation (LDA) on the collected
resources in order to extract existing topics related to these skills, and 3)
defining topic distributions covered by a particular OER. To evaluate our
model, we used the data-set of educational resources from Youtube, and compared
our topic distribution results with their manually defined target topics with
the help of 3 experts in the area of data science. As a result, our model
extracted topics with 79% of F1-score.
- Abstract(参考訳): 近年、グローバル教育の必要性の高まりを緩和する上で、オープン教育資源(oers)が重要視されている。
明らかに、OERは様々な状況において学習者を満足させる高い能力を持っている。
しかしながら、oerメタデータの低品質は、検索やレコメンデーションといったパーソナライズされたサービスが欠如している主な理由の1つです。
その結果、OERの適用性は制限されている。
それでも、カバーされたトピック(オブジェクト)に関するOERメタデータは、学習者が個々の学習目標に向けて効果的な学習経路を構築するために本質的に必要である。
そこで本稿では,OERトピック抽出手法をテキストマイニングに適用し,トピックの分散に関する高品質なOERメタデータを生成する,進行中のプロジェクトについて報告する。
これは次のとおりです
1)データサイエンス関連技術分野におけるCourseraとKhan Academyからの123の講義の収集
2)これらの技術に関連する既存の話題を抽出するために、収集資源に潜伏ディリクレ割当(LDA)を適用すること
3)特定のOERでカバーされるトピックの分布を定義する。
提案モデルを評価するために,Youtubeの教育資源のデータセットを用いて,対象トピックを手動で定義したトピックと比較し,データサイエンス分野の専門家3人の助けを借りた。
その結果,f1-scoreの79%のトピックを抽出した。
関連論文リスト
- Enriched BERT Embeddings for Scholarly Publication Classification [0.13654846342364302]
NSLP 2024 FoRC Task Iは、競争として組織されたこの課題に対処する。
目的は、ある論文に対する研究分野の分類法であるOpen Research Knowledge Graph (ORKG) から、123の事前定義されたクラスのうちの1つを予測することができる分類器を開発することである。
論文 参考訳(メタデータ) (2024-05-07T09:05:20Z) - ExaRanker-Open: Synthetic Explanation for IR using Open-Source LLMs [60.81649785463651]
ExaRanker-Openを導入し、オープンソース言語モデルを適用して、説明を生成する。
以上の結果から,LLMのサイズが大きくなるにつれて,説明の組み込みが神経ランク付けを継続的に促進することが明らかとなった。
論文 参考訳(メタデータ) (2024-02-09T11:23:14Z) - Query of CC: Unearthing Large Scale Domain-Specific Knowledge from
Public Corpora [104.16648246740543]
大規模言語モデルに基づく効率的なデータ収集手法を提案する。
この方法は、大きな言語モデルを通してシード情報をブートストラップし、公開コーパスから関連データを検索する。
特定のドメインに関する知識関連のデータを収集するだけでなく、潜在的な推論手順でデータを抽出する。
論文 参考訳(メタデータ) (2024-01-26T03:38:23Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Low-Resource Dense Retrieval for Open-Domain Question Answering: A
Comprehensive Survey [23.854086903936647]
低リソースDRの主流技術について概観する。
本手法は,(1)文書のみが必要であること,(2)文書と質問が必要であること,(3)文書と質問対が必要であること,の3つのカテゴリに分けられる。
いずれの手法も、その汎用アルゴリズムを導入し、オープンな問題と長所と短所を強調し、今後の研究の方向性を概説する。
論文 参考訳(メタデータ) (2022-08-05T14:35:03Z) - Information Extraction in Low-Resource Scenarios: Survey and Perspective [56.5556523013924]
情報抽出は構造化されていないテキストから構造化された情報を導き出そうとする。
本稿では,emphLLMおよびemphLLMに基づく低リソースIEに対するニューラルアプローチについて概説する。
論文 参考訳(メタデータ) (2022-02-16T13:44:00Z) - A Transfer Learning Pipeline for Educational Resource Discovery with
Application in Leading Paragraph Generation [71.92338855383238]
本稿では,新しいドメインに対するWebリソース発見を自動化するパイプラインを提案する。
パイプラインは2つの類似しているが新規なターゲットドメインで評価すると、F1スコアは0.94と0.82となる。
本研究は,サーベイジェネレーションのための各種Webリソースを考察した最初の研究である。
論文 参考訳(メタデータ) (2022-01-07T03:35:40Z) - Developing Open Source Educational Resources for Machine Learning and
Data Science [0.0]
機械学習(ML)とデータサイエンス(DS)におけるオープン教育資源(OER)の具体的要件について述べる。
オープンソース教育資源(OSER)に繋がるソースファイルを公開することが,これらの分野にとって特に重要である,と我々は主張する。
我々は、OSERがブレンドラーニングのシナリオにどのように使えるのかを概説し、大学教育における私たちの経験を共有する。
論文 参考訳(メタデータ) (2021-07-28T10:20:20Z) - Domain Generalization: A Survey [146.68420112164577]
ドメイン一般化(DG)は、モデル学習にソースドメインデータを使用するだけでOOD一般化を実現することを目的としています。
初めて、DGの10年の開発をまとめるために包括的な文献レビューが提供されます。
論文 参考訳(メタデータ) (2021-03-03T16:12:22Z) - OER Recommendations to Support Career Development [0.0]
オープン教育資源(OER)は、世界中の幅広い学習や職業の文脈で利用できるため、問題の緩和に寄与する可能性がある。
我々は,スキル開発目標とオープンラーニングコンテンツとをマッチングする,個人化されたOERレコメンデーション手法を提案する。
1)メタデータ,OERプロパティ,コンテンツに基づくOER品質予測モデル,2)実際の労働市場情報に基づいて個別のスキルターゲットを設定する学習支援,3)学習者が自身のスキルターゲットをマスターするためのパーソナライズされたOERレコメンデータを構築する。
論文 参考訳(メタデータ) (2020-05-30T21:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。