論文の概要: Human-Machine Collaboration for Democratizing Data Science
- arxiv url: http://arxiv.org/abs/2004.11113v1
- Date: Thu, 23 Apr 2020 12:50:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 10:05:18.576240
- Title: Human-Machine Collaboration for Democratizing Data Science
- Title(参考訳): データサイエンスの民主化のためのヒューマンマシンコラボレーション
- Authors: Cl\'ement Gautrais, Yann Dauxais, Stefano Teso, Samuel Kolb, Gust
Verbruggen, Luc De Raedt
- Abstract要約: textscVisualSynthは、ユーザによって色付きスケッチ、すなわち、データサイエンスタスクを部分的に指定するために、スプレッドシートの一部の色付けを提供する。
データラングリング、データ選択、クラスタリング、制約学習、予測モデリング、自動補完など、さまざまなデータ分析タスクを実行する。
- 参考スコア(独自算出の注目度): 23.385646192087922
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Everybody wants to analyse their data, but only few posses the data science
expertise to to this. Motivated by this observation we introduce a novel
framework and system \textsc{VisualSynth} for human-machine collaboration in
data science.
It wants to democratize data science by allowing users to interact with
standard spreadsheet software in order to perform and automate various data
analysis tasks ranging from data wrangling, data selection, clustering,
constraint learning, predictive modeling and auto-completion.
\textsc{VisualSynth} relies on the user providing colored sketches, i.e.,
coloring parts of the spreadsheet, to partially specify data science tasks,
which are then determined and executed using artificial intelligence
techniques.
- Abstract(参考訳): 誰もが自分のデータを分析したいと思っているが、データサイエンスの専門知識はごくわずかだ。
データサイエンスにおける人間と機械の協調のための新しいフレームワークとシステム「textsc{VisualSynth}」を導入する。
データラウンジリング、データ選択、クラスタリング、制約学習、予測モデリング、自動補完など、さまざまなデータ分析タスクを実行し自動化するために、ユーザが標準的なスプレッドシートソフトウェアと対話できるようにすることで、データサイエンスを民主化したいと考えている。
\textsc{VisualSynth} は、スプレッドシートのカラー化といった色付きスケッチを提供するユーザに依存して、データサイエンスタスクを部分的に指定し、人工知能技術を用いて決定および実行する。
関連論文リスト
- SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - A Vision for Semantically Enriched Data Science [19.604667287258724]
ドメイン知識の活用やデータセマンティクスといった重要な分野は、ほとんど自動化されていない分野です。
データサイエンスの自動化のための新しいツールと組み合わせて、データに対する“セマンティック”な理解と推論を活用することが、一貫性と説明可能なデータ拡張と変換にどのように役立つか、私たちは考えています。
論文 参考訳(メタデータ) (2023-03-02T16:03:12Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Data+Shift: Supporting visual investigation of data distribution shifts
by data scientists [1.6311150636417262]
Data+Shiftは、データ機能のシフトの根底にある要因を調査するタスクにおいて、データサイエンティストをサポートするビジュアル分析ツールである。
我々は、データサイエンティストが不正検出のユースケースにこのツールを使用したシンクオード実験で、我々のアプローチを検証した。
論文 参考訳(メタデータ) (2022-04-29T11:50:25Z) - AutoDS: Towards Human-Centered Automation of Data Science [20.859067294445985]
本稿では,データサイエンスプロジェクトを支援する自動機械学習(AutoML)システムであるAutoDSを紹介する。
予想通り、autodsは生産性を向上させる。しかし驚くべきことに、autods groupが生成するモデルは品質が高く、エラーが少ないが、人間の信頼度スコアは低い。
論文 参考訳(メタデータ) (2021-01-13T08:35:14Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。