論文の概要: DataLab: A Unified Platform for LLM-Powered Business Intelligence
- arxiv url: http://arxiv.org/abs/2412.02205v2
- Date: Wed, 04 Dec 2024 16:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 11:47:17.024165
- Title: DataLab: A Unified Platform for LLM-Powered Business Intelligence
- Title(参考訳): DataLab: LLMベースのビジネスインテリジェンスのための統一プラットフォーム
- Authors: Luoxuan Weng, Yinghao Tang, Yingchaojie Feng, Zhuo Chang, Peng Chen, Ruiqin Chen, Haozhe Feng, Chen Hou, Danqing Huang, Yang Li, Huaming Rao, Haonan Wang, Canshi Wei, Xiaofeng Yang, Yuhui Zhang, Yifeng Zheng, Xiuqi Huang, Minfeng Zhu, Yuxin Ma, Bin Cui, Wei Chen,
- Abstract要約: 我々は,ワンストップLLMベースのエージェントフレームワークと拡張計算ノートブックインターフェースを統合した統合BIプラットフォームであるDataLabを紹介する。
DataLabは、LLMアシストとユーザカスタマイズを単一の環境内で組み合わせることで、さまざまなデータロールに対して幅広いBIタスクをサポートする。
大規模な実験により、DataLabは人気のある研究ベンチマークでさまざまなBIタスクの最先端のパフォーマンスを達成している。
- 参考スコア(独自算出の注目度): 41.21303493090702
- License:
- Abstract: Business intelligence (BI) transforms large volumes of data within modern organizations into actionable insights for informed decision-making. Recently, large language model (LLM)-based agents have streamlined the BI workflow by automatically performing task planning, reasoning, and actions in executable environments based on natural language (NL) queries. However, existing approaches primarily focus on individual BI tasks such as NL2SQL and NL2VIS. The fragmentation of tasks across different data roles and tools lead to inefficiencies and potential errors due to the iterative and collaborative nature of BI. In this paper, we introduce DataLab, a unified BI platform that integrates a one-stop LLM-based agent framework with an augmented computational notebook interface. DataLab supports a wide range of BI tasks for different data roles by seamlessly combining LLM assistance with user customization within a single environment. To achieve this unification, we design a domain knowledge incorporation module tailored for enterprise-specific BI tasks, an inter-agent communication mechanism to facilitate information sharing across the BI workflow, and a cell-based context management strategy to enhance context utilization efficiency in BI notebooks. Extensive experiments demonstrate that DataLab achieves state-of-the-art performance on various BI tasks across popular research benchmarks. Moreover, DataLab maintains high effectiveness and efficiency on real-world datasets from Tencent, achieving up to a 58.58% increase in accuracy and a 61.65% reduction in token cost on enterprise-specific BI tasks.
- Abstract(参考訳): ビジネスインテリジェンス(BI)は、現代的な組織内の大量のデータを、情報的意思決定のための実用的な洞察に変換する。
近年,大規模言語モデル(LLM)に基づくエージェントが,自然言語(NL)クエリに基づいたタスク計画,推論,実行環境におけるアクションを自動的に実行することにより,BIワークフローの合理化を実現している。
しかし、既存のアプローチは主にNL2SQLやNL2VISのような個々のBIタスクに焦点を当てている。
さまざまなデータロールやツールにまたがるタスクの断片化は、BIの反復的で協調的な性質による非効率性と潜在的なエラーにつながる。
本稿では,ワンストップのLCMベースのエージェントフレームワークと,拡張型計算ノートブックインターフェースを統合した統合BIプラットフォームであるDataLabを紹介する。
DataLabは、LLMアシストとユーザカスタマイズを単一の環境内でシームレスに組み合わせることで、さまざまなデータロールに対して幅広いBIタスクをサポートする。
この統合を実現するため、企業固有のBIタスクに適したドメイン知識組み込みモジュール、BIワークフロー間の情報共有を容易にするエージェント間コミュニケーション機構、BIノートのコンテキスト利用効率を高めるためのセルベースのコンテキスト管理戦略を設計する。
大規模な実験により、DataLabは人気のある研究ベンチマークでさまざまなBIタスクの最先端のパフォーマンスを達成している。
さらに、DataLabはTencentの実際のデータセットに対する高い有効性と効率を維持しており、企業固有のBIタスクにおいて58.58%の精度向上と61.65%のトークンコスト削減を実現している。
関連論文リスト
- Empowering Large Language Models in Wireless Communication: A Novel Dataset and Fine-Tuning Framework [81.29965270493238]
我々は,無線通信アプリケーションのための大規模言語モデル(LLM)の評価と微調整を目的とした,特殊なデータセットを開発した。
データセットには、真/偽と複数選択型を含む、さまざまなマルチホップ質問が含まれている。
本稿では,PVI(Pointwise V-Information)に基づく微調整手法を提案する。
論文 参考訳(メタデータ) (2025-01-16T16:19:53Z) - ROMAS: A Role-Based Multi-Agent System for Database monitoring and Planning [11.589862354606476]
本稿では,ローコード開発とワンクリック展開を実現しつつ,様々なシナリオに適応する役割ベースM ulti-A gentシステムであるROMASを提案する。
ROMAS は DB-GPT [Xue et al., 2023a, 2024b] に効果的にデプロイされている。
論文 参考訳(メタデータ) (2024-12-18T05:45:39Z) - Interactive-T2S: Multi-Turn Interactions for Text-to-SQL with Large Language Models [9.914489049993495]
本稿では,データベースとの直接対話を通じてクエリを生成するフレームワークであるInteractive-T2Sを紹介する。
フレームワーク内のステップワイズ推論プロセスを示すための詳細な例を開発してきた。
BIRD-Devデータセットを用いた実験により,本手法が最先端の成果を達成できたのは2つの例に過ぎなかった。
論文 参考訳(メタデータ) (2024-08-09T07:43:21Z) - AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning [93.96463520716759]
大規模言語モデル(LLM)エージェントは、精度と幻覚を高めるために外部ツールと知識を活用する際、印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供されたツールを効果的に活用し、与えられたタスクのパフォーマンスを向上させる新しい自動化フレームワークであるAvaTaRを紹介する。
論文 参考訳(メタデータ) (2024-06-17T04:20:02Z) - CMDBench: A Benchmark for Coarse-to-fine Multimodal Data Discovery in Compound AI Systems [10.71630696651595]
知識集約的なタスクを達成するエージェントとしてLLMを使用する複合AIシステム(CAS)は、データベースやAIコミュニティにおいて大きな関心を集めている。
マルチモーダルデータソースのサイロは、そのタスクを達成するための適切なデータソースを特定するのを困難にしている。
我々はエンタープライズデータプラットフォームの複雑さをモデル化したベンチマークであるCMDBenchを提案する。
論文 参考訳(メタデータ) (2024-06-02T01:10:41Z) - Collaborative business intelligence virtual assistant [1.9953434933575993]
本研究では、ユーザとCBI仮想アシスタントのインタラクションを通じて、分散仮想チームにおけるデータマイニングの応用に焦点を当てる。
CBIのための仮想アシスタントは、より広い範囲のユーザのためのデータ探索アクセシビリティを強化し、データ分析に必要な時間と労力を合理化するためのものである。
論文 参考訳(メタデータ) (2023-12-20T05:34:12Z) - Aggregating Intrinsic Information to Enhance BCI Performance through
Federated Learning [29.65566062475597]
不十分なデータは、高性能なディープラーニングモデルを構築するためのBCI(Brain-Computer Interface)にとって長年の課題である。
本稿では,この課題を克服するために,階層的に個別化したフェデレート学習脳波デコーディングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-14T08:59:44Z) - LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset,
Framework, and Benchmark [81.42376626294812]
本稿では,Language-Assisted Multi-Modalインストラクションチューニングデータセット,フレームワーク,ベンチマークを提案する。
我々の目標は、MLLMのトレーニングと評価のための成長するエコシステムとしてLAMMを確立することです。
本稿では,2次元および3次元視覚のための広範囲な視覚タスクをカバーする包括的データセットとベンチマークを提案する。
論文 参考訳(メタデータ) (2023-06-11T14:01:17Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。