論文の概要: Multi-source Data Mining for e-Learning
- arxiv url: http://arxiv.org/abs/2009.08791v1
- Date: Thu, 17 Sep 2020 15:39:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 11:54:53.112756
- Title: Multi-source Data Mining for e-Learning
- Title(参考訳): eラーニングのためのマルチソースデータマイニング
- Authors: Julie Bu Daher, Armelle Brun and Anne Boyer
- Abstract要約: パターンマイニングは、データから興味深い頻繁なパターンを抽出する。
データ量の増加に伴い、この領域では、マルチソースおよび異種データが新たな課題となっている。
この課題は、興味深い頻繁なパターンを抽出するために、マルチソースデータをマイニングする作業の中心となるものです。
- 参考スコア(独自算出の注目度): 3.8673630752805432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data mining is the task of discovering interesting, unexpected or valuable
structures in large datasets and transforming them into an understandable
structure for further use . Different approaches in the domain of data mining
have been proposed, among which pattern mining is the most important one.
Pattern mining mining involves extracting interesting frequent patterns from
data. Pattern mining has grown to be a topic of high interest where it is used
for different purposes, for example, recommendations. Some of the most common
challenges in this domain include reducing the complexity of the process and
avoiding the redundancy within the patterns. So far, pattern mining has mainly
focused on the mining of a single data source. However, with the increase in
the amount of data, in terms of volume, diversity of sources and nature of
data, mining multi-source and heterogeneous data has become an emerging
challenge in this domain. This challenge is the main focus of our work where we
propose to mine multi-source data in order to extract interesting frequent
patterns.
- Abstract(参考訳): データマイニングは,大規模なデータセットで興味深い,予期せぬ,あるいは価値のある構造を発見し,それを理解可能な構造に変換する作業だ。
データマイニング分野における様々なアプローチが提案されており、パターンマイニングが最も重要である。
パターンマイニングは、データから興味深い頻繁なパターンを抽出する。
パターンマイニングは、例えばレコメンデーションなど、異なる目的のために使用される、高い関心を持つトピックに成長した。
この領域で最も一般的な課題は、プロセスの複雑さの低減と、パターン内の冗長性の回避である。
これまでパターンマイニングは主に単一のデータソースのマイニングに重点を置いてきた。
しかし、データ量の増加とともに、データ量、ソースの多様性、データの性質が増すにつれ、この領域では、マルチソースおよび異種データのマイニングが新たな課題となっている。
この課題は、興味深い頻繁なパターンを抽出するために、マルチソースデータをマイニングする作業の中心となるものです。
関連論文リスト
- Maximizing Relation Extraction Potential: A Data-Centric Study to Unveil Challenges and Opportunities [3.8087810875611896]
本稿では,ニューラルリレーション抽出を阻害するデータ中心特性について検討する。
それは、文脈の曖昧さ、関係関係の関連、長い尾のデータ、きめ細かい関係の分布など、重要な問題を強調している。
これらの問題を緩和するための将来の方向性を示すマーカーをセットし、初心者や先進的な研究者にとって重要なリソースであることを証明している。
論文 参考訳(メタデータ) (2024-09-07T23:40:47Z) - Mining Weighted Sequential Patterns in Incremental Uncertain Databases [2.668038211242538]
我々は不確実なデータベースに頻繁なシーケンスをマイニングするアルゴリズムを開発した。
データベースがインクリメンタルな場合、マイニングのための2つの新しい手法を提案しました。
論文 参考訳(メタデータ) (2024-03-31T17:32:08Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - Approximate Network Motif Mining Via Graph Learning [4.2873412319680035]
ネットワークモチーフとしても知られる頻繁で構造的な部分グラフは、多くのグラフデータセットの貴重な特徴である。
任意のデータセットでモチーフ集合を特定するという高い計算複雑性は、多くの実世界のデータセットでの使用を制限している。
データセットの統計特性を自動で活用することで、機械学習のアプローチは複雑さのあるいくつかのタスクにおいて有望であることが示されている。
論文 参考訳(メタデータ) (2022-06-02T12:15:05Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Diversity Over Size: On the Effect of Sample and Topic Sizes for Topic-Dependent Argument Mining Datasets [49.65208986436848]
本研究では,アーギュメント・マイニング・データセットの構成が,少数・ゼロショット設定における影響について検討する。
実験結果から, モデル性能の達成には微調整が必須であるが, 慎重に構成したトレーニングサンプルを用いることで, トレーニングサンプルサイズを最大90%まで下げることで, 最大性能の95%を達成できることがわかった。
論文 参考訳(メタデータ) (2022-05-23T17:14:32Z) - Incremental Mining of Frequent Serial Episodes Considering Multiple
Occurrence [11.387440344044315]
基本的な研究方向の1つは、データストリーム上のシーケンシャルパターンをマイニングすることだ。
アイテムセットストリームのウィンドウ上のパターンとその複数の発生は、パターンの本質的な特徴を認識する追加の機能を提供する。
本稿では,探索空間を効率よく創出するための新しい戦略を持つ,効率の良いシーケンシャルマイニング手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T17:10:16Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Extracting Seasonal Gradual Patterns from Temporal Sequence Data Using
Periodic Patterns Mining [0.0]
季節的段階的パターンは「Xが増加/減少するとYが増加/減少する」という形で複雑な属性の共変を捉える
多くの時系列データにおいて、同じ時間間隔で定期的に現れる漸進的なパターンを抽出する手法は提案されていない。
本稿では,複数のシークエンスに共通する周期的パターンのマイニングに基づく抽出手法を提案する。
論文 参考訳(メタデータ) (2020-10-20T14:03:37Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。