論文の概要: A Transfer Learning Pipeline for Educational Resource Discovery with
Application in Leading Paragraph Generation
- arxiv url: http://arxiv.org/abs/2201.02312v1
- Date: Fri, 7 Jan 2022 03:35:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-10 14:21:05.368310
- Title: A Transfer Learning Pipeline for Educational Resource Discovery with
Application in Leading Paragraph Generation
- Title(参考訳): 教育資源発見のための伝達学習パイプラインと先行パラグラフ生成への応用
- Authors: Irene Li, Thomas George, Alexander Fabbri, Tammy Liao, Benjamin Chen,
Rina Kawamura, Richard Zhou, Vanessa Yan, Swapnil Hingmire, Dragomir Radev
- Abstract要約: 本稿では,新しいドメインに対するWebリソース発見を自動化するパイプラインを提案する。
パイプラインは2つの類似しているが新規なターゲットドメインで評価すると、F1スコアは0.94と0.82となる。
本研究は,サーベイジェネレーションのための各種Webリソースを考察した最初の研究である。
- 参考スコア(独自算出の注目度): 71.92338855383238
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Effective human learning depends on a wide selection of educational materials
that align with the learner's current understanding of the topic. While the
Internet has revolutionized human learning or education, a substantial resource
accessibility barrier still exists. Namely, the excess of online information
can make it challenging to navigate and discover high-quality learning
materials. In this paper, we propose the educational resource discovery (ERD)
pipeline that automates web resource discovery for novel domains. The pipeline
consists of three main steps: data collection, feature extraction, and resource
classification. We start with a known source domain and conduct resource
discovery on two unseen target domains via transfer learning. We first collect
frequent queries from a set of seed documents and search on the web to obtain
candidate resources, such as lecture slides and introductory blog posts. Then
we introduce a novel pretrained information retrieval deep neural network
model, query-document masked language modeling (QD-MLM), to extract deep
features of these candidate resources. We apply a tree-based classifier to
decide whether the candidate is a positive learning resource. The pipeline
achieves F1 scores of 0.94 and 0.82 when evaluated on two similar but novel
target domains. Finally, we demonstrate how this pipeline can benefit an
application: leading paragraph generation for surveys. This is the first study
that considers various web resources for survey generation, to the best of our
knowledge. We also release a corpus of 39,728 manually labeled web resources
and 659 queries from NLP, Computer Vision (CV), and Statistics (STATS).
- Abstract(参考訳): 効果的なヒューマンラーニングは、学習者の現在のトピックに対する理解と一致した幅広い教材の選定に依存する。
インターネットは人間の学習や教育に革命をもたらしたが、資源のアクセシビリティの障壁は依然として残っている。
すなわち、オンライン情報の過剰は、高品質な学習教材の探索と発見を困難にしている。
本稿では,新しいドメインに対する Web リソース発見を自動化する教育資源探索 (ERD) パイプラインを提案する。
パイプラインは、データ収集、特徴抽出、リソース分類の3つの主要なステップで構成される。
既知のソースドメインから始めて、トランスファーラーニングを通じて、2つの未認識のターゲットドメインでリソース発見を行います。
まず,シード文書のセットから頻繁なクエリを収集し,web上で検索することで,講義スライドや紹介ブログ投稿などの候補リソースを得る。
次に,新しい事前学習情報検索深層ニューラルネットワークモデルであるクエリ文書マスク言語モデリング(qd-mlm)を導入し,これらの候補リソースの深い特徴を抽出する。
木に基づく分類器を用いて、候補が正の学習資源であるかどうかを判定する。
パイプラインは2つの類似しているが新規なターゲットドメインで評価すると、F1スコアは0.94と0.82となる。
最後に、このパイプラインがどのようにアプリケーションに利益をもたらすかを実証する。
調査生成のための様々なwebリソースについて、私たちの知識を最大限に活用する最初の研究です。
また、NLP、Computer Vision(CV)、Statistics(STATS)から、39,728のWebリソースと659のクエリを手動でラベル付けしたコーパスもリリースしました。
関連論文リスト
- A Survey on Deep Active Learning: Recent Advances and New Frontiers [27.07154361976248]
この研究は、ディープラーニングに基づくアクティブラーニング(DAL)の難しさを克服する上で、研究者にとって有用かつ迅速なガイドとなることを目的としている。
この手法は適用可能性の広さから人気が高まりつつあるが、特にディープラーニングに基づくアクティブラーニング(DAL)に関する調査論文は乏しいままである。
論文 参考訳(メタデータ) (2024-05-01T05:54:33Z) - A Knowledge Plug-and-Play Test Bed for Open-domain Dialogue Generation [51.31429493814664]
マルチソース対話知識の選択と応答生成を評価するために,ウィキペディアのマルチソースウィザードというベンチマークを示す。
本稿では,すでに訓練済みの対話モデルを用いて,未確認の情報源からの新たなサポート知識を利用するための新たな課題である対話知識プラグイン・アンド・プレイを提案する。
論文 参考訳(メタデータ) (2024-03-06T06:54:02Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Can We Trust AI-Generated Educational Content? Comparative Analysis of
Human and AI-Generated Learning Resources [4.528957284486784]
大規模言語モデル(LLMs)は、大規模に学習教材を迅速に作成する上で、有望なソリューションを提供するように見える。
学習指導活動の一環として,LLMが生み出す資源の質と学生が生み出す資源の質を比較した。
その結果、学生が認識するAI生成リソースの品質は、同僚が生成するリソースの品質と同等であることがわかった。
論文 参考訳(メタデータ) (2023-06-18T09:49:21Z) - Learning To Rank Resources with GNN [7.337247167823921]
本稿では,資源クエリと資源リソースの関係をモデル化可能なグラフニューラルネットワーク(GNN)に基づく学習からランクへのアプローチを提案する。
提案手法は,様々なパフォーマンス指標において,最先端の6.4%から42%を上回っている。
論文 参考訳(メタデータ) (2023-04-17T02:01:45Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Active Multi-Task Representation Learning [50.13453053304159]
本研究は,アクティブラーニングの手法を活用することで,資源タスクのサンプリングに関する最初の公式な研究を行う。
提案手法は, 対象タスクに対する各ソースタスクの関連性を反復的に推定し, その関連性に基づいて各ソースタスクからサンプルを抽出するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-02T08:23:24Z) - QA Dataset Explosion: A Taxonomy of NLP Resources for Question Answering
and Reading Comprehension [41.6087902739702]
この調査は、これまでで最大の調査である。
我々は、現在のリソースの様々なフォーマットとドメインの概要を述べ、将来の作業における現在のラグナを強調します。
また、英語に対する過剰な焦点付けの影響についても論じ、他の言語や多言語リソースに対する現在のモノリンガルリソースについて調査する。
論文 参考訳(メタデータ) (2021-07-27T10:09:13Z) - Low-Resource Domain Adaptation for Compositional Task-Oriented Semantic
Parsing [85.35582118010608]
タスク指向のセマンティックパーシングは仮想アシスタントの重要なコンポーネントである。
近年のディープラーニングの進歩は、より複雑なクエリを解析するいくつかのアプローチを可能にしている。
そこで本研究では,教師付きニューラルネットワークを10倍の精度で高速化する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T17:47:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。