論文の概要: AI-Powered Data Visualization Platform: An Intelligent Web Application for Automated Dataset Analysis
- arxiv url: http://arxiv.org/abs/2511.08363v1
- Date: Wed, 12 Nov 2025 01:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.779642
- Title: AI-Powered Data Visualization Platform: An Intelligent Web Application for Automated Dataset Analysis
- Title(参考訳): AIを活用したデータ可視化プラットフォーム: 自動データセット分析のためのインテリジェントWebアプリケーション
- Authors: Srihari R, Pallavi M, Tejaswini S, Vaishnavi R C,
- Abstract要約: このシステムは、データ駆動環境のコンテキストからAIベースの分析と可視化のプロセスを確立する。
主なコントリビューションは、自動的でインテリジェントなデータのクリーニング、欠落した値の計算、異常値の検出である。
最初の分析はデータセット上で10万行までリアルタイムに行われ、クラウドベースの需要プラットフォームは要求を満たすためにスケールした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An AI-powered data visualization platform that automates the entire data analysis process, from uploading a dataset to generating an interactive visualization. Advanced machine learning algorithms are employed to clean and preprocess the data, analyse its features, and automatically select appropriate visualizations. The system establishes the process of automating AI-based analysis and visualization from the context of data-driven environments, and eliminates the challenge of time-consuming manual data analysis. The combination of a Python Flask backend to access the dataset, paired with a React frontend, provides a robust platform that automatically interacts with Firebase Cloud Storage for numerous data processing and data analysis solutions and real-time sources. Key contributions include automatic and intelligent data cleaning, with imputation for missing values, and detection of outliers, via analysis of the data set. AI solutions to intelligently select features, using four different algorithms, and intelligent title generation and visualization are determined by the attributes of the dataset. These contributions were evaluated using two separate datasets to assess the platform's performance. In the process evaluation, the initial analysis was performed in real-time on datasets as large as 100000 rows, while the cloud-based demand platform scales to meet requests from multiple users and processes them simultaneously. In conclusion, the cloud-based data visualization application allowed for a significant reduction of manual inputs to the data analysis process while maintaining a high quality, impactful visual outputs, and user experiences
- Abstract(参考訳): AIを利用するデータ視覚化プラットフォームは、データセットのアップロードからインタラクティブな視覚化生成に至るまで、データ分析プロセス全体を自動化する。
高度な機械学習アルゴリズムは、データのクリーニングと前処理、その機能の分析、そして適切な視覚化を自動的に選択するために使用される。
このシステムは、AIベースの分析と可視化をデータ駆動環境のコンテキストから自動化するプロセスを確立し、手動データ分析に要する時間を省く。
Reactフロントエンドと組み合わせてデータセットにアクセスするPython Flaskバックエンドの組み合わせは、多数のデータ処理とデータ分析ソリューションとリアルタイムソースのためにFirebase Cloud Storageと自動的に対話する堅牢なプラットフォームを提供する。
主なコントリビューションは、自動的でインテリジェントなデータのクリーニング、欠落した値の計算、データセットの分析による外れ値の検出である。
4つの異なるアルゴリズムを使用して、インテリジェントに機能を選択するAIソリューションと、インテリジェントなタイトル生成と視覚化は、データセットの属性によって決定される。
これらのコントリビューションは、プラットフォームのパフォーマンスを評価するために、2つの別々のデータセットを使用して評価された。
プロセス評価では、最初の分析はデータセット上で10万行までリアルタイムに行われ、クラウドベースの需要プラットフォームは、複数のユーザからの要求に応えるためにスケールし、同時に処理する。
結論として、このクラウドベースのデータ可視化アプリケーションは、高品質でインパクトのある視覚出力とユーザエクスペリエンスを維持しながら、データ分析プロセスへの手動入力を著しく削減することができる。
関連論文リスト
- Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [83.65386456026441]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがる100以上のデータ処理オペレータがバックアップするデータ処理システムである。
データ分析、合成、アノテーション、基礎モデルのポストトレーニングなど、より重要なタスクをサポートする。
このシステムは公開されており、さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - Dataset Factory: A Toolchain For Generative Computer Vision Datasets [0.9013233848500058]
メタデータからサンプルの保存と処理を分離する「データセットファクトリ」を提案する。
これにより、機械学習チームや個々の研究者に対して、大規模にデータ中心の操作が可能になる。
論文 参考訳(メタデータ) (2023-09-20T19:43:37Z) - DataAssist: A Machine Learning Approach to Data Cleaning and Preparation [0.0]
DataAssistは、MLインフォームドメソッドを使用してデータセットの品質を向上させる自動データ準備およびクリーニングプラットフォームである。
我々のツールは、経済、ビジネス、予測アプリケーションなど、さまざまな分野に適用でき、データの浄化と準備に費やした時間の50%以上を節約できる。
論文 参考訳(メタデータ) (2023-07-14T01:50:53Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Automatic Curation of Large-Scale Datasets for Audio-Visual
Representation Learning [62.47593143542552]
本稿では,自動データセットキュレーションのためのサブセット最適化手法について述べる。
本研究では,高視聴覚対応の映像を抽出し,自己監視モデルが自動的に構築されているにもかかわらず,既存のスケールのビデオデータセットと類似したダウンストリームパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-01-26T14:27:47Z) - ARDA: Automatic Relational Data Augmentation for Machine Learning [23.570173866941612]
本稿では,データセットとデータレポジトリを入力とし,拡張データセットを出力するエンド・ツー・エンドシステムを提案する。
本システムは,(1)入力の様々な属性に基づいて,入力データとデータを検索し結合するフレームワークと,(2)入力データからノイズや不適切な特徴を抽出する効率的な特徴選択アルゴリズムの2つの特徴を有する。
論文 参考訳(メタデータ) (2020-03-21T21:55:22Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。