論文の概要: Data-Copilot: Bridging Billions of Data and Humans with Autonomous
Workflow
- arxiv url: http://arxiv.org/abs/2306.07209v1
- Date: Mon, 12 Jun 2023 16:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 13:52:52.324067
- Title: Data-Copilot: Bridging Billions of Data and Humans with Autonomous
Workflow
- Title(参考訳): Data-Copilot: 自律ワークフローを備えた数十億のデータと人間
- Authors: Wenqi Zhang, Yongliang Shen, Weiming Lu, Yueting Zhuang
- Abstract要約: 大規模言語モデル(LLM)は意味理解と推論において有望な能力を示した。
我々は,一方の端にある多数のデータソースを接続し,他方の端にある多様な人的要求に対応するLLMベースのシステムであるData-Copilotを提案する。
Data-Copilotは、生データをユーザーの意図に最も合う視覚化結果に自律的に変換する。
- 参考スコア(独自算出の注目度): 44.703964214103856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various industries such as finance, meteorology, and energy generate vast
amounts of heterogeneous data every day. There is a natural demand for humans
to manage, process, and display data efficiently. However, it necessitates
labor-intensive efforts and a high level of expertise for these data-related
tasks. Considering that large language models (LLMs) have showcased promising
capabilities in semantic understanding and reasoning, we advocate that the
deployment of LLMs could autonomously manage and process massive amounts of
data while displaying and interacting in a human-friendly manner. Based on this
belief, we propose Data-Copilot, an LLM-based system that connects numerous
data sources on one end and caters to diverse human demands on the other end.
Acting like an experienced expert, Data-Copilot autonomously transforms raw
data into visualization results that best match the user's intent.
Specifically, Data-Copilot autonomously designs versatile interfaces (tools)
for data management, processing, prediction, and visualization. In real-time
response, it automatically deploys a concise workflow by invoking corresponding
interfaces step by step for the user's request. The interface design and
deployment processes are fully controlled by Data-Copilot itself, without human
assistance. Besides, we create a Data-Copilot demo that links abundant data
from different domains (stock, fund, company, economics, and live news) and
accurately respond to diverse requests, serving as a reliable AI assistant.
- Abstract(参考訳): 金融、気象学、エネルギーといった様々な産業が毎日大量の異種データを生み出している。
人間が効率的にデータを管理、処理、表示することが自然な要求である。
しかしそれは、労働集約的な努力と、これらのデータ関連タスクの高度な専門知識を必要とする。
大規模言語モデル(LLM)が意味理解と推論において有望な能力を誇示していることを考えると,LLMの展開は,人間に親しみやすい方法で表示・相互作用しながら,大量のデータを自律的に管理・処理できると主張している。
この信念に基づき,多種多様なデータソースを一方に接続し,他方の人間の要求に応える,llmベースのシステムであるdata-copilotを提案する。
経験豊富な専門家のように,Data-Copilotは,生データを視覚化結果に自動変換することで,ユーザの意図に最もマッチする。
具体的には、Data-Copilotはデータ管理、処理、予測、視覚化のための汎用インターフェース(ツール)を自律的に設計する。
リアルタイム応答では、ユーザの要求に対してステップバイステップで対応するインターフェースを呼び出すことで、簡潔なワークフローを自動的に展開する。
インターフェース設計とデプロイメントプロセスは、人間の支援なしに、データコパイロット自身によって完全に制御されます。
さらに、さまざまなドメイン(ストック、ファンド、企業、エコノミクス、ライブニュース)の豊富なデータをリンクし、信頼できるaiアシスタントとして、さまざまなリクエストに正確に応答するデータコパイロットのデモを作成します。
関連論文リスト
- AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [100.14685774661959]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - Making Large Language Models Better Data Creators [22.0882632635255]
大規模言語モデル(LLM)はNLPの最先端を著しく進歩させた。
ダウンストリームアプリケーションへのデプロイは、コスト、応答性、コントロール、プライバシとセキュリティに関する懸念のため、依然として難しい。
単一フォーマットの例のみを必要とする統一データ生成パイプラインを提案する。
論文 参考訳(メタデータ) (2023-10-31T01:08:34Z) - UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human
Generation [59.77275587857252]
総合的な人間のデータセットは、必然的に、局所的な部分についての不十分で低解像度な情報を持っている。
本稿では,高解像度な人為的生成モデルを共同で学習するために,様々な解像度画像を用いたマルチソースデータセットを提案する。
論文 参考訳(メタデータ) (2023-09-25T17:58:46Z) - Towards Lightweight Data Integration using Multi-workflow Provenance and
Data Observability [0.2517763905487249]
統合データ分析は、特に現在のAI時代において、科学的発見において重要な役割を果たす。
軽量ランタイム向けマルチワークフロー統合データ分析手法MIDAを提案する。
Summitスーパーコンピュータの1,680個のCPUコア上で,最大10000のタスクを実行するほぼゼロのオーバーヘッドを示す。
論文 参考訳(メタデータ) (2023-08-17T14:20:29Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - ChatGPT as your Personal Data Scientist [0.9689893038619583]
本稿では,ChatGPTを用いた対話型データサイエンスフレームワークについて紹介する。
データビジュアライゼーション、タスクの定式化、予測エンジニアリング、結果概要と勧告の4つのダイアログ状態を中心に、私たちのモデルが中心になっています。
要約して,会話データ科学の新たな概念が実現可能であることを証明するとともに,複雑なタスクを解く上でLLMが有効であることを示すエンド・ツー・エンド・エンド・システムを開発した。
論文 参考訳(メタデータ) (2023-05-23T04:00:16Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy [2.9005223064604078]
本稿では,自律飛行に適したスケーラブルなAerial Synthetic Data Augmentation (ASDA) フレームワークを提案する。
ASDAは、シーンとデータ拡張を自動的に実行する2つのスクリプト可能なパイプラインを備えた中央データ収集エンジンを拡張している。
多様なデータセットを自動生成する手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-11-10T04:37:41Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。