論文の概要: Towards automated data analysis: A guided framework for LLM-based risk estimation
- arxiv url: http://arxiv.org/abs/2603.04631v1
- Date: Wed, 04 Mar 2026 21:44:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:10.986523
- Title: Towards automated data analysis: A guided framework for LLM-based risk estimation
- Title(参考訳): 自動データ分析に向けて:LCMに基づくリスク推定のためのガイド付きフレームワーク
- Authors: Panteleimon Rodis,
- Abstract要約: 大規模言語モデル(LLM)は、ますます重要な意思決定パイプラインに統合されている。
この研究は、人間の指導と監督の下で生成AIを統合するデータセットリスク推定のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) are increasingly integrated into critical decision-making pipelines, a trend that raises the demand for robust and automated data analysis. Current approaches to dataset risk analysis are limited to manual auditing methods which involve time-consuming and complex tasks, whereas fully automated analysis based on Artificial Intelligence (AI) suffers from hallucinations and issues stemming from AI alignment. To this end, this work proposes a framework for dataset risk estimation that integrates Generative AI under human guidance and supervision, aiming to set the foundations for a future automated risk analysis paradigm. Our approach utilizes LLMs to identify semantic and structural properties in database schemata, subsequently propose clustering techniques, generate the code for them and finally interpret the produced results. The human supervisor guides the model on the desired analysis and ensures process integrity and alignment with the task's objectives. A proof of concept is presented to demonstrate the feasibility of the framework's utility in producing meaningful results in risk assessment tasks.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ロバストで自動化されたデータ分析の需要を増大させる傾向にある重要な意思決定パイプラインに、ますます統合されている。
データセットリスク分析への現在のアプローチは、時間と複雑なタスクを含む手動の監査方法に限られているが、人工知能(AI)に基づく完全に自動化された分析は、AIアライメントに起因する幻覚や問題に悩まされている。
この目的のために本研究では,ジェネレーティブAIを人間の指導と監督の下で統合する,データセットリスク推定のためのフレームワークを提案する。
提案手法では,LLMを用いてデータベーススキーマのセマンティックな特徴と構造を識別し,クラスタリング手法を提案し,それらのコードを生成し,最終的に結果の解釈を行う。
人間の監督者は、望ましい分析に基づいてモデルをガイドし、プロセスの整合性とタスクの目的との整合性を確保する。
リスク評価タスクにおいて有意義な結果を生み出す上で,フレームワークの実用性の実現可能性を示すために,概念実証を行う。
関連論文リスト
- Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - Toward Quantitative Modeling of Cybersecurity Risks Due to AI Misuse [50.87630846876635]
我々は9つの詳細なサイバーリスクモデルを開発する。
各モデルはMITRE ATT&CKフレームワークを使用して攻撃をステップに分解する。
個々の見積もりはモンテカルロシミュレーションによって集約される。
論文 参考訳(メタデータ) (2025-12-09T17:54:17Z) - AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation [192.53529928861818]
高リソースデータによる学習は人工知能(AI)において大きな成功を収めた
しかし、データアノテーションやモデルトレーニングに関連するコストは依然として大きい。
本調査では,低リソースデータからの学習に伴う一般化誤差とラベル複雑性を分析するために,アクティブサンプリング理論を用いた。
論文 参考訳(メタデータ) (2025-10-10T03:15:42Z) - FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction [92.7392863957204]
FutureXは、将来の予測のための最大かつ最も多様なライブベンチマークである。
リアルタイムの日次更新をサポートし、質問収集と回答収集のための自動パイプラインを通じてデータの汚染を取り除く。
推論,検索機能,外部ツールの統合などを含む25のLLM/エージェントモデルを評価した。
論文 参考訳(メタデータ) (2025-08-16T08:54:08Z) - I2I-STRADA -- Information to Insights via Structured Reasoning Agent for Data Analysis [0.0]
現実世界のデータ分析には一貫した認知ワークフローが必要です。
この推論プロセスの形式化を目的としたエージェントアーキテクチャであるI2I-STRADAを紹介する。
論文 参考訳(メタデータ) (2025-07-23T18:58:42Z) - VirtualXAI: A User-Centric Framework for Explainability Assessment Leveraging GPT-Generated Personas [0.07499722271664146]
eXplainable AI(XAI)の需要が増加し、AIモデルの解釈可能性、透明性、信頼性が向上した。
仮想ペルソナによる定量的ベンチマークと質的ユーザアセスメントを統合したフレームワークを提案する。
これにより、推定されたXAIスコアが得られ、与えられたシナリオに対して最適なAIモデルとXAIメソッドの両方にカスタマイズされたレコメンデーションが提供される。
論文 参考訳(メタデータ) (2025-03-06T09:44:18Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - Can Large Language Models Serve as Data Analysts? A Multi-Agent Assisted Approach for Qualitative Data Analysis [4.539569292151314]
大規模言語モデル(LLM)は、ソフトウェア工学(SE)における人間とロボットの協調を可能にする
本研究では,人間の意思決定支援をAIと相乗化して,さまざまな定性的データ分析手法を自動化するLLMベースのマルチエージェントシステムの設計と開発を行う。
論文 参考訳(メタデータ) (2024-02-02T13:10:46Z) - AI in Supply Chain Risk Assessment: A Systematic Literature Review and Bibliometric Analysis [0.0]
本研究では,Google Scholar and Web of Scienceの1,903項目をPRISMAガイドラインで選択した54項目について検討した。
その結果,ランダムフォレスト,XGBoost,ハイブリッドアプローチなどのMLモデルは,パンデミック後の文脈におけるリスク予測精度と適応性を大幅に向上させることがわかった。
この研究は、データ品質や解釈可能性といった課題に対処するために、動的な戦略、学際的なコラボレーション、継続的なモデル評価の必要性を強調している。
論文 参考訳(メタデータ) (2023-12-12T17:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。