論文の概要: Visual Analytics For Machine Learning: A Data Perspective Survey
- arxiv url: http://arxiv.org/abs/2307.07712v1
- Date: Sat, 15 Jul 2023 05:13:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 18:19:06.938010
- Title: Visual Analytics For Machine Learning: A Data Perspective Survey
- Title(参考訳): 機械学習のためのビジュアル分析: データパースペクティブ調査
- Authors: Junpeng Wang, Shixia Liu, Wei Zhang
- Abstract要約: この調査は、データの観点からVIS4MLの作業を要約することに焦点を当てている。
MLモデルで処理される共通データを5つのタイプに分類し、各タイプのユニークな特徴を説明し、それらから学習できる対応するMLモデルを強調する。
第2に、多数のVIS4ML作業から、MLパイプラインのさまざまな段階でこの種のデータを操作する6つのタスクをティースして、MLモデルを理解し、診断し、洗練します。
- 参考スコア(独自算出の注目度): 17.19676876329529
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The past decade has witnessed a plethora of works that leverage the power of
visualization (VIS) to interpret machine learning (ML) models. The
corresponding research topic, VIS4ML, keeps growing at a fast pace. To better
organize the enormous works and shed light on the developing trend of VIS4ML,
we provide a systematic review of these works through this survey. Since data
quality greatly impacts the performance of ML models, our survey focuses
specifically on summarizing VIS4ML works from the data perspective. First, we
categorize the common data handled by ML models into five types, explain the
unique features of each type, and highlight the corresponding ML models that
are good at learning from them. Second, from the large number of VIS4ML works,
we tease out six tasks that operate on these types of data (i.e., data-centric
tasks) at different stages of the ML pipeline to understand, diagnose, and
refine ML models. Lastly, by studying the distribution of 143 surveyed papers
across the five data types, six data-centric tasks, and their intersections, we
analyze the prospective research directions and envision future research
trends.
- Abstract(参考訳): 過去10年間、可視化(VIS)の力を利用して機械学習(ML)モデルを解釈する、数多くの作品が見られた。
対応する研究トピックであるVIS4MLは、急速に成長を続けている。
膨大な作業の整理とVIS4MLの進展傾向を明らかにするため,本調査を通じてこれらの作業の体系的レビューを行う。
データ品質はMLモデルの性能に大きく影響するため、データの観点からのVIS4MLの動作の要約に特化しています。
まず、MLモデルで処理される共通データを5つのタイプに分類し、各タイプのユニークな特徴を説明し、それらから学習できる対応するMLモデルを強調する。
第2に、多数のVIS4ML作業から、この種のデータ(すなわちデータ中心タスク)をMLパイプラインのさまざまな段階で運用する6つのタスクをティースして、MLモデルを理解し、診断し、洗練する。
最後に,5つのデータタイプ,6つのデータ中心タスク,それらの交差点にまたがる143の論文の分布を調査し,今後の研究動向について考察する。
関連論文リスト
- MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs [97.94579295913606]
MLLM(Multimodal Large Language Models)は、産業と学術の両方から注目を集めている。
開発プロセスでは、モデルの改善に関する直感的なフィードバックとガイダンスを提供するため、評価が重要である。
この研究は、研究者に異なるニーズに応じてMLLMを効果的に評価する方法を簡単に把握し、より良い評価方法を促すことを目的としている。
論文 参考訳(メタデータ) (2024-11-22T18:59:54Z) - Empirical Insights on Fine-Tuning Large Language Models for Question-Answering [50.12622877002846]
大規模言語モデル(LLM)は、大量のデータセットの事前トレーニングを通じて、広範囲な世界の知識を符号化する。
我々は,事前学習したLLMが記憶する知識の量に基づいて,教師付き微調整(SFT)データを分類した。
実験の結果,SFTの段階では60個のデータポイントが事前学習中に符号化された知識を活性化することができ,LLMがQAタスクを実行できることがわかった。
論文 参考訳(メタデータ) (2024-09-24T07:38:38Z) - The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective [53.48484062444108]
モデルとデータの開発は2つの別々のパスではなく、むしろ相互接続であることがわかった。
一方,MLLMはデータ開発に役立てることができるため,MLLMの性能向上に寄与する。
MLLMコミュニティにおけるデータモデル共同開発を促進するために,データモデル共同開発の観点からMLLMに関連する既存の研究を体系的にレビューする。
論文 参考訳(メタデータ) (2024-07-11T15:08:11Z) - A Survey of Multimodal Large Language Model from A Data-centric Perspective [46.57232264950785]
マルチモーダル大言語モデル(MLLM)は、複数のモーダルからのデータの統合と処理によって、標準的な大言語モデルの能力を高める。
データはこれらのモデルの開発と改良において重要な役割を担います。
論文 参考訳(メタデータ) (2024-05-26T17:31:21Z) - MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.61052121715689]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。
MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文 参考訳(メタデータ) (2024-02-18T04:28:28Z) - Genixer: Empowering Multimodal Large Language Models as a Powerful Data Generator [63.762209407570715]
Genixerは4つの重要なステップからなる包括的なデータ生成パイプラインである。
LLaVA1.5でトレーニングされた合成VQAライクなデータセットは、12のマルチモーダルベンチマークのうち10のパフォーマンスを向上させる。
タスク固有のデータセットで訓練されたMLLMは、複雑な命令チューニングデータを生成する際に、GPT-4Vを超えることができる。
論文 参考訳(メタデータ) (2023-12-11T09:44:41Z) - Large Language Models as Data Preprocessors [9.99065004972981]
大規模言語モデル (LLM) は人工知能において大きな進歩を遂げている。
本研究では、データマイニングおよび分析アプリケーションにおいて重要な段階である、データ前処理におけるその可能性について検討する。
我々は,最先端のプロンプトエンジニアリング技術を統合したデータ前処理のためのLLMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-30T23:28:43Z) - Are We Closing the Loop Yet? Gaps in the Generalizability of VIS4ML
Research [26.829392755701843]
我々は、最近のVIS4ML論文を調査し、ヒトインザループMLの実現における研究貢献とクレームの一般化性を評価する。
以上の結果から,現在のVIS4ML研究範囲と実用化への期待との間には,潜在的なギャップがあることが示唆された。
論文 参考訳(メタデータ) (2023-08-10T21:44:48Z) - Measuring Progress in Fine-grained Vision-and-Language Understanding [23.377634283746698]
詳細なベンチマークにおいて、4つの競合する視覚・言語モデルについて検討する。
X-VLMは、他のベースラインよりも一貫して優れています。
細かなスキルを習得する上で,新たな損失と豊富なデータソースの両方の重要性を強調した。
論文 参考訳(メタデータ) (2023-05-12T15:34:20Z) - Towards Perspective-Based Specification of Machine Learning-Enabled
Systems [1.3406258114080236]
本稿では、ML対応システムを特定するための視点に基づくアプローチに向けた取り組みについて述べる。
このアプローチでは、目標、ユーザエクスペリエンス、インフラストラクチャ、モデル、データという5つの視点にグループ化された45のML関心事のセットを分析する。
本論文の主な貢献は、ML対応システムを特定するのに役立つ2つの新しいアーティファクトを提供することである。
論文 参考訳(メタデータ) (2022-06-20T13:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。