論文の概要: Learn to Explore: on Bootstrapping Interactive Data Exploration with
Meta-learning
- arxiv url: http://arxiv.org/abs/2212.03423v1
- Date: Wed, 7 Dec 2022 03:12:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 16:41:34.910911
- Title: Learn to Explore: on Bootstrapping Interactive Data Exploration with
Meta-learning
- Title(参考訳): learn to explore: メタラーニングによるインタラクティブなデータ探索について
- Authors: Yukun Cao, Xike Xie, and Kexin Huang
- Abstract要約: 本稿ではメタ学習に基づく学習から発見までのフレームワークを提案し,メタタスクを自動生成した分類器の学習方法を学習する。
提案手法は,精度と効率の点で既存探索法よりも優れている。
- 参考スコア(独自算出の注目度): 8.92180350317399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive data exploration (IDE) is an effective way of comprehending big
data, whose volume and complexity are beyond human abilities. The main goal of
IDE is to discover user interest regions from a database through multi-rounds
of user labelling. Existing IDEs adopt active-learning framework, where users
iteratively discriminate or label the interestingness of selected tuples. The
process of data exploration can be viewed as the process of training a
classifier, which determines whether a database tuple is interesting to a user.
An efficient exploration thus takes very few iterations of user labelling to
reach the data region of interest. In this work, we consider the data
exploration as the process of few-shot learning, where the classifier is
learned with only a few training examples, or exploration iterations. To this
end, we propose a learning-to-explore framework, based on meta-learning, which
learns how to learn a classifier with automatically generated meta-tasks, so
that the exploration process can be much shortened. Extensive experiments on
real datasets show that our proposal outperforms existing explore-by-example
solutions in terms of accuracy and efficiency.
- Abstract(参考訳): インタラクティブデータ探索(IDE)は、人間の能力を超える量と複雑さを持つビッグデータを理解する効果的な方法である。
IDEの主な目標は、複数ラウンドのユーザラベリングを通じて、データベースからユーザ関心領域を見つけることである。
既存のIDEはアクティブラーニングフレームワークを採用しており、ユーザーは選択したタプルの面白さを反復的に識別またはラベル付けする。
データ探索のプロセスは、データベースタプルがユーザにとって興味深いかどうかを決定する分類器を訓練するプロセスと見なすことができる。
したがって、効率的な探索は、関心のあるデータ領域に到達するのに、ユーザラベリングのイテレーションをほんの数回必要とします。
本研究では,データ探索を,数回の学習例,あるいは探索イテレーションで分類器を学習する,マイトショット学習のプロセスとして捉えた。
そこで本研究では,自動生成したメタタスクを用いて分類器の学習方法を学習し,探索プロセスを大幅に短縮するメタラーニングに基づくラーニング・ツー・エクスプローラーフレームワークを提案する。
実データセットに関する広範囲な実験により,提案手法が既存の探索型ソリューションよりも精度と効率の面で優れていることが示された。
関連論文リスト
- LLM-assisted Explicit and Implicit Multi-interest Learning Framework for Sequential Recommendation [50.98046887582194]
本研究では,ユーザの興味を2つのレベル – 行動と意味論 – でモデル化する,明示的で暗黙的な多目的学習フレームワークを提案する。
提案するEIMFフレームワークは,小型モデルとLLMを効果的に組み合わせ,多目的モデリングの精度を向上させる。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Actively Discovering New Slots for Task-oriented Conversation [19.815466126158785]
本稿では,ループ内学習を実現するため,情報抽出方式で汎用的なスロットタスクを提案する。
我々は既存の言語ツールを活用し、対応するラベルが弱い監視信号として利用される値候補を抽出する。
いくつかの公開データセットに対して広範な実験を行い、競合するベースラインを多数比較して手法を実証する。
論文 参考訳(メタデータ) (2023-05-06T13:33:33Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - Active metric learning and classification using similarity queries [21.589707834542338]
本稿では、キーコンポーネントが類似性を反映したデータの表現を学習している問題に対して、新しい統合クエリフレームワークを適用することができることを示す。
提案手法の有効性を,アクティブなメトリック学習とアクティブな分類という2つの課題で実証する。
論文 参考訳(メタデータ) (2022-02-04T03:34:29Z) - AstronomicAL: An interactive dashboard for visualisation, integration
and classification of data using Active Learning [0.0]
Astronomicalは、人間とループで対話的なラベリングとトレーニングのダッシュボードである。
アクティブラーニングを使用して、信頼性の高いデータセットと堅牢な分類器を作成することができる。
ユーザーは異なるソースからデータを視覚化して統合することができる。
論文 参考訳(メタデータ) (2021-09-11T07:32:26Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。