論文の概要: An Empirical Study of Bugs in Data Visualization Libraries
- arxiv url: http://arxiv.org/abs/2506.15084v1
- Date: Wed, 18 Jun 2025 02:49:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.532066
- Title: An Empirical Study of Bugs in Data Visualization Libraries
- Title(参考訳): データ可視化ライブラリにおけるバグの実証的研究
- Authors: Weiqi Lu, Yongqiang Tian, Xiaohan Zhong, Haoyang Ma, Zhenyang Xu, Shing-Chi Cheung, Chengnian Sun,
- Abstract要約: 本研究では,5つの広く使用されているライブラリから収集された564個のバグを調査し,DataVizライブラリのバグの包括的解析を行った。
その結果,DataVizライブラリでは誤り/不正確なプロットが広まっており,誤ったグラフィック計算が主な原因であることが判明した。
このようなバグをトリガーする8つの重要なステップと、DataVizライブラリ特有の2つのテストオラクルを特定しました。
- 参考スコア(独自算出の注目度): 7.75848222829394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data visualization (DataViz) libraries play a crucial role in presentation, data analysis, and application development, underscoring the importance of their accuracy in transforming data into visual representations. Incorrect visualizations can adversely impact user experience, distort information conveyance, and influence user perception and decision-making processes. Visual bugs in these libraries can be particularly insidious as they may not cause obvious errors like crashes, but instead mislead users of the underlying data graphically, resulting in wrong decision making. Consequently, a good understanding of the unique characteristics of bugs in DataViz libraries is essential for researchers and developers to detect and fix bugs in DataViz libraries. This study presents the first comprehensive analysis of bugs in DataViz libraries, examining 564 bugs collected from five widely-used libraries. Our study systematically analyzes their symptoms and root causes, and provides a detailed taxonomy. We found that incorrect/inaccurate plots are pervasive in DataViz libraries and incorrect graphic computation is the major root cause, which necessitates further automated testing methods for DataViz libraries. Moreover, we identified eight key steps to trigger such bugs and two test oracles specific to DataViz libraries, which may inspire future research in designing effective automated testing techniques. Furthermore, with the recent advancements in Vision Language Models (VLMs), we explored the feasibility of applying these models to detect incorrect/inaccurate plots. The results show that the effectiveness of VLMs in bug detection varies from 29% to 57%, depending on the prompts, and adding more information in prompts does not necessarily increase the effectiveness. More findings can be found in our manuscript.
- Abstract(参考訳): データビジュアライゼーション(DataViz)ライブラリは、プレゼンテーション、データ分析、アプリケーション開発において重要な役割を果たす。
誤った視覚化は、ユーザエクスペリエンスに悪影響を及ぼし、情報伝達を歪ませ、ユーザの認識と意思決定プロセスに影響を与える可能性がある。
これらのライブラリの視覚的なバグは、クラッシュのような明らかなエラーを起こさないかもしれないが、その代わりに、基盤となるデータのユーザをグラフィカルに誤解させ、誤った判断を下すため、特に厄介である。
そのため、DataVizライブラリのバグの特徴をよく理解することは、研究者や開発者がDataVizライブラリのバグを検出して修正することが不可欠である。
本研究では,5つの広く使用されているライブラリから収集された564個のバグを調査し,DataVizライブラリのバグの包括的解析を行った。
本研究は, その症状と根本原因を系統的に分析し, 詳細な分類法を提供する。
我々は,不正確なプロットがDataVizライブラリに広まっており,不正確なグラフィック計算が主要な根本原因であることを発見した。
さらに、このようなバグをトリガーする8つの重要なステップと、DataVizライブラリ特有の2つのテストオラクルを特定しました。
さらに、近年の視覚言語モデル(VLM)の進歩により、これらのモデルを用いて不正確なプロットを検出する可能性について検討した。
その結果、バグ検出におけるVLMの有効性は、プロンプトによって29%から57%に変化し、プロンプトにより多くの情報を追加することが必ずしも有効性を高めるとは限らないことがわかった。
私たちの原稿にさらに多くの発見がある。
関連論文リスト
- An Empirical Study of API Misuses of Data-Centric Libraries [9.667988837321943]
本稿では,データ処理,数値計算,機械学習,可視化などの分野をカバーする5つのデータ中心ライブラリのAPI誤用に関する実証的研究を行う。
Stack OverflowとGitHubのデータを分析することで、これらのライブラリの誤用を特定します。
論文 参考訳(メタデータ) (2024-08-28T15:15:52Z) - VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文 参考訳(メタデータ) (2024-06-19T11:09:16Z) - Software issues report for bug fixing process: An empirical study of
machine-learning libraries [0.0]
6つの機械学習ライブラリにおけるバグ修正プロセスにおける課題解決の有効性について検討した。
マシンラーニングライブラリで最も一般的な問題カテゴリは、バグ、ドキュメント、最適化、クラッシュ、拡張、新機能要求、ビルド/CI、サポート、パフォーマンスである。
本研究は,効率的な課題追跡プロセス,効果的なコミュニケーション,コラボレーションが,機械学習ライブラリの課題解決やバグ修正プロセスの効果的な解決に不可欠である,と結論付けている。
論文 参考訳(メタデータ) (2023-12-10T21:33:19Z) - On Using GUI Interaction Data to Improve Text Retrieval-based Bug
Localization [10.717184444794505]
エンドユーザー向けアプリケーションでは、バグレポート内の情報とGUIの情報とを結びつけることにより、既存のバグローカライゼーション技術を改善することができるという仮説を考察する。
当社は,Androidアプリの完全ローカライズおよび再現可能な真のバグに関する現在の最大のデータセットを,対応するバグレポートとともに公開しています。
論文 参考訳(メタデータ) (2023-10-12T07:14:22Z) - An Empirical Study on Bugs Inside PyTorch: A Replication Study [10.848682558737494]
私たちは、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けています。
私たちの結果は、PyTorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに近いことを強調しています。
論文 参考訳(メタデータ) (2023-07-25T19:23:55Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。