論文の概要: LAMBDA: A Large Model Based Data Agent
- arxiv url: http://arxiv.org/abs/2407.17535v1
- Date: Wed, 24 Jul 2024 06:26:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 18:08:23.882844
- Title: LAMBDA: A Large Model Based Data Agent
- Title(参考訳): LAMBDA: 大規模モデルベースデータエージェント
- Authors: Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan, Jian Huang,
- Abstract要約: LAMBDAは、オープンソースのコードフリーマルチエージェントデータ分析システムである。
複雑なデータ駆動アプリケーションにおけるデータ分析の課題に対処するように設計されている。
LAMBDAは、さまざまな機械学習データセットで強力なパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 7.240586338370509
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce ``LAMBDA," a novel open-source, code-free multi-agent data analysis system that that harnesses the power of large models. LAMBDA is designed to address data analysis challenges in complex data-driven applications through the use of innovatively designed data agents that operate iteratively and generatively using natural language. At the core of LAMBDA are two key agent roles: the programmer and the inspector, which are engineered to work together seamlessly. Specifically, the programmer generates code based on the user's instructions and domain-specific knowledge, enhanced by advanced models. Meanwhile, the inspector debugs the code when necessary. To ensure robustness and handle adverse scenarios, LAMBDA features a user interface that allows direct user intervention in the operational loop. Additionally, LAMBDA can flexibly integrate external models and algorithms through our knowledge integration mechanism, catering to the needs of customized data analysis. LAMBDA has demonstrated strong performance on various machine learning datasets. It has the potential to enhance data science practice and analysis paradigm by seamlessly integrating human and artificial intelligence, making it more accessible, effective, and efficient for individuals from diverse backgrounds. The strong performance of LAMBDA in solving data science problems is demonstrated in several case studies, which are presented at \url{https://www.polyu.edu.hk/ama/cmfai/lambda.html}.
- Abstract(参考訳): 我々は,大規模モデルのパワーを利用する,新しいオープンソースのコードフリーマルチエージェントデータ分析システムである `LAMBDA を紹介する。
LAMBDAは、自然言語を用いて反復的で生成的に動作する革新的なデータエージェントを使用することによって、複雑なデータ駆動アプリケーションにおけるデータ分析の課題に対処するように設計されている。
LAMBDAの中核には、プログラマとインスペクタという、2つの重要なエージェントの役割がある。
具体的には、高度なモデルによって強化された、ユーザの指示とドメイン固有の知識に基づいて、プログラマがコードを生成する。
一方、インスペクタは必要に応じてコードをデバッグする。
堅牢性を確保し、有害なシナリオに対処するため、LAMBDAは運用ループに直接ユーザーを介入できるユーザインターフェースを備えている。
さらに、LAMBDAは知識統合機構を通じて、外部モデルとアルゴリズムを柔軟に統合することができ、カスタマイズされたデータ分析の必要性に対応できます。
LAMBDAは、さまざまな機械学習データセットで強力なパフォーマンスを示している。
それは、人間と人工知能をシームレスに統合することで、データサイエンスの実践と分析パラダイムを強化する可能性があり、多様なバックグラウンドを持つ個人にとってよりアクセスしやすく、効果的、効率的である。
データサイエンス問題の解決におけるLAMBDAの強い性能は、いくつかのケーススタディで実証され、これは \url{https://www.polyu.edu.hk/ama/cmfai/lambda.html} で示されている。
関連論文リスト
- AvaTaR: Optimizing LLM Agents for Tool-Assisted Knowledge Retrieval [93.96463520716759]
大言語モデル(LLM)エージェントは、外部のツールや知識を活用して精度を高め、幻覚を減らすという印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供するツールを効果的に利用し、与えられたタスク/ドメインの性能を向上させる新しいフレームワークであるAvaTaRを紹介する。
AvaTaRは、4つの課題にまたがる最先端のアプローチを一貫して上回り、新規事例に適用した場合に強力な一般化能力を示す。
論文 参考訳(メタデータ) (2024-06-17T04:20:02Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via
Code Generation [86.4326416303723]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Data Interpreter: An LLM Agent For Data Science [43.99482533437711]
Data Interpreterは、コードで解決するように設計されたソリューションである。
データサイエンスにおける問題解決を強化するための3つの重要なテクニックを強調している。
MATHデータセットは26%増加し、オープンなタスクは112%改善した。
論文 参考訳(メタデータ) (2024-02-28T19:49:55Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [100.14685774661959]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - Can Large Language Models Serve as Data Analysts? A Multi-Agent Assisted
Approach for Qualitative Data Analysis [6.592797748561459]
大規模言語モデル(LLM)は、ソフトウェア工学(SE)における協調的な人間とロボットの相互作用を可能にした
定性的な研究において,新たな拡張性と精度の次元を導入し,SEにおけるデータ解釈手法を変革する可能性がある。
論文 参考訳(メタデータ) (2024-02-02T13:10:46Z) - Collaborative business intelligence virtual assistant [1.9953434933575993]
本研究では、ユーザとCBI仮想アシスタントのインタラクションを通じて、分散仮想チームにおけるデータマイニングの応用に焦点を当てる。
CBIのための仮想アシスタントは、より広い範囲のユーザのためのデータ探索アクセシビリティを強化し、データ分析に必要な時間と労力を合理化するためのものである。
論文 参考訳(メタデータ) (2023-12-20T05:34:12Z) - SoTaNa: The Open-Source Software Development Assistant [81.86136560157266]
SoTaNaはオープンソースのソフトウェア開発アシスタントだ。
ソフトウェア工学の分野のための高品質な命令ベースのデータを生成する。
オープンソースの基盤モデルであるLLaMAを強化するためにパラメータ効率のよい微調整アプローチを採用している。
論文 参考訳(メタデータ) (2023-08-25T14:56:21Z) - Towards Lightweight Data Integration using Multi-workflow Provenance and
Data Observability [0.2517763905487249]
統合データ分析は、特に現在のAI時代において、科学的発見において重要な役割を果たす。
軽量ランタイム向けマルチワークフロー統合データ分析手法MIDAを提案する。
Summitスーパーコンピュータの1,680個のCPUコア上で,最大10000のタスクを実行するほぼゼロのオーバーヘッドを示す。
論文 参考訳(メタデータ) (2023-08-17T14:20:29Z) - Analytical Engines With Context-Rich Processing: Towards Efficient
Next-Generation Analytics [12.317930859033149]
我々は、文脈に富む分析を可能にするコンポーネントと協調して最適化された分析エンジンを構想する。
我々は、リレーショナルおよびモデルベース演算子間の総括的なパイプラインコストとルールベースの最適化を目指している。
論文 参考訳(メタデータ) (2022-12-14T21:46:33Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。