論文の概要: Fantastic Data and How to Query Them
- arxiv url: http://arxiv.org/abs/2201.05026v1
- Date: Thu, 13 Jan 2022 15:24:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 19:51:32.267710
- Title: Fantastic Data and How to Query Them
- Title(参考訳): 素晴らしいデータとそれらを照会する方法
- Authors: Trung-Kien Tran, Anh Le-Tuan, Manh Nguyen-Duc, Jicheng Yuan, Danh
Le-Phuoc
- Abstract要約: 異なるデータセットに対する統一されたフレームワークに関するビジョンを提示し、それらを統合し、簡単にクエリできるようにします。
我々は、コンピュータビジョンにおけるデータセットのためのフレームワークを作成し、その利点をさまざまなシナリオで示すために、現在進行中の作業でこれを実証しています。
- 参考スコア(独自算出の注目度): 3.464871689508835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is commonly acknowledged that the availability of the huge amount of
(training) data is one of the most important factors for many recent advances
in Artificial Intelligence (AI). However, datasets are often designed for
specific tasks in narrow AI sub areas and there is no unified way to manage and
access them. This not only creates unnecessary overheads when training or
deploying Machine Learning models but also limits the understanding of the
data, which is very important for data-centric AI. In this paper, we present
our vision about a unified framework for different datasets so that they can be
integrated and queried easily, e.g., using standard query languages. We
demonstrate this in our ongoing work to create a framework for datasets in
Computer Vision and show its advantages in different scenarios. Our
demonstration is available at https://vision.semkg.org.
- Abstract(参考訳): 膨大なデータ(トレーニング)が利用可能であることは、人工知能(AI)の最近の進歩において最も重要な要素の1つであることが一般に認識されている。
しかしデータセットは、狭いaiサブエリアで特定のタスク用に設計されることが多く、それらを管理およびアクセスするための統一的な方法がない。
これにより、機械学習モデルのトレーニングやデプロイ時に不要なオーバーヘッドが発生するだけでなく、データ中心のAIにとって非常に重要なデータ理解も制限される。
本稿では,様々なデータセットのための統一フレームワークについて,例えば標準クエリ言語を用いて,統合やクエリが容易になるようなビジョンを示す。
我々は、コンピュータビジョンにおけるデータセットのフレームワークを作成するために進行中の作業でこれを実証し、異なるシナリオでその利点を示します。
私たちのデモはhttps://vision.semkg.orgで公開されています。
関連論文リスト
- On Responsible Machine Learning Datasets with Fairness, Privacy, and
Regulatory Norms [58.93352076927003]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - An Unbiased Look at Datasets for Visuo-Motor Pre-Training [20.094244564603184]
データセットの選択は、このパラダイムの成功と同じくらい重要です。
従来の視覚データセットは、ビジュオモダ表現学習の驚くほど競争力のある選択肢である。
シミュレーションベンチマークは実世界のパフォーマンスの信頼できるプロキシではないことを示す。
論文 参考訳(メタデータ) (2023-10-13T17:59:02Z) - VisionKG: Unleashing the Power of Visual Datasets via Knowledge Graph [2.3143591448419074]
Vision Knowledge Graph (VisionKG)は、知識グラフとセマンティックWeb技術を介して視覚データセットを相互にリンクし、整理し、管理する新しいリソースである。
VisionKGには現在5億1900万のRDFトリプルがあり、約4000万のエンティティを記述している。
論文 参考訳(メタデータ) (2023-09-24T11:19:13Z) - Curriculum-Based Imitation of Versatile Skills [15.97723808124603]
模倣による学習スキルは、ロボットの直感的な教育にとって有望な概念である。
このようなスキルを学ぶ一般的な方法は、デモが与えられた可能性の最大化によってパラメトリックモデルを学ぶことである。
しかし、人間のデモンストレーションはしばしばマルチモーダルであり、同じタスクは複数の方法で解決される。
論文 参考訳(メタデータ) (2023-04-11T12:10:41Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Dataset Structural Index: Understanding a machine's perspective towards
visual data [0.0]
ビジュアルデータセット上でより多くの情報を取得し、それをデータ最適化に使用し、より優れたアーキテクチャを作成し、どのモデルが最もうまく機能するかを推測する能力を持つ、という2つのメタ値を示します。
論文では、DSIの多くの応用例を示し、その1つは、少ないデータ量でトレーニングされた同じモデルアーキテクチャで、同じレベルの精度を実現する方法である。
論文 参考訳(メタデータ) (2021-10-05T06:40:16Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。