Fugu-MT 論文翻訳(概要): An Empirical Study of Bugs in Data Visualization Libraries

論文の概要: An Empirical Study of Bugs in Data Visualization Libraries

arxiv url: http://arxiv.org/abs/2506.15084v1
Date: Wed, 18 Jun 2025 02:49:09 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-19 19:35:51.532066
Title: An Empirical Study of Bugs in Data Visualization Libraries
Title（参考訳）: データ可視化ライブラリにおけるバグの実証的研究
Authors: Weiqi Lu, Yongqiang Tian, Xiaohan Zhong, Haoyang Ma, Zhenyang Xu, Shing-Chi Cheung, Chengnian Sun,
Abstract要約: 本研究では,5つの広く使用されているライブラリから収集された564個のバグを調査し,DataVizライブラリのバグの包括的解析を行った。その結果,DataVizライブラリでは誤り/不正確なプロットが広まっており,誤ったグラフィック計算が主な原因であることが判明した。このようなバグをトリガーする8つの重要なステップと、DataVizライブラリ特有の2つのテストオラクルを特定しました。
参考スコア（独自算出の注目度）: 7.75848222829394
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data visualization (DataViz) libraries play a crucial role in presentation, data analysis, and application development, underscoring the importance of their accuracy in transforming data into visual representations. Incorrect visualizations can adversely impact user experience, distort information conveyance, and influence user perception and decision-making processes. Visual bugs in these libraries can be particularly insidious as they may not cause obvious errors like crashes, but instead mislead users of the underlying data graphically, resulting in wrong decision making. Consequently, a good understanding of the unique characteristics of bugs in DataViz libraries is essential for researchers and developers to detect and fix bugs in DataViz libraries. This study presents the first comprehensive analysis of bugs in DataViz libraries, examining 564 bugs collected from five widely-used libraries. Our study systematically analyzes their symptoms and root causes, and provides a detailed taxonomy. We found that incorrect/inaccurate plots are pervasive in DataViz libraries and incorrect graphic computation is the major root cause, which necessitates further automated testing methods for DataViz libraries. Moreover, we identified eight key steps to trigger such bugs and two test oracles specific to DataViz libraries, which may inspire future research in designing effective automated testing techniques. Furthermore, with the recent advancements in Vision Language Models (VLMs), we explored the feasibility of applying these models to detect incorrect/inaccurate plots. The results show that the effectiveness of VLMs in bug detection varies from 29% to 57%, depending on the prompts, and adding more information in prompts does not necessarily increase the effectiveness. More findings can be found in our manuscript.
Abstract（参考訳）: データビジュアライゼーション(DataViz)ライブラリは、プレゼンテーション、データ分析、アプリケーション開発において重要な役割を果たす。誤った視覚化は、ユーザエクスペリエンスに悪影響を及ぼし、情報伝達を歪ませ、ユーザの認識と意思決定プロセスに影響を与える可能性がある。これらのライブラリの視覚的なバグは、クラッシュのような明らかなエラーを起こさないかもしれないが、その代わりに、基盤となるデータのユーザをグラフィカルに誤解させ、誤った判断を下すため、特に厄介である。そのため、DataVizライブラリのバグの特徴をよく理解することは、研究者や開発者がDataVizライブラリのバグを検出して修正することが不可欠である。本研究では,5つの広く使用されているライブラリから収集された564個のバグを調査し,DataVizライブラリのバグの包括的解析を行った。本研究は, その症状と根本原因を系統的に分析し, 詳細な分類法を提供する。我々は,不正確なプロットがDataVizライブラリに広まっており,不正確なグラフィック計算が主要な根本原因であることを発見した。さらに、このようなバグをトリガーする8つの重要なステップと、DataVizライブラリ特有の2つのテストオラクルを特定しました。さらに、近年の視覚言語モデル(VLM)の進歩により、これらのモデルを用いて不正確なプロットを検出する可能性について検討した。その結果、バグ検出におけるVLMの有効性は、プロンプトによって29%から57%に変化し、プロンプトにより多くの情報を追加することが必ずしも有効性を高めるとは限らないことがわかった。私たちの原稿にさらに多くの発見がある。

関連論文リスト

Human Uncertainty-Aware Data Selection and Automatic Labeling in Visual Question Answering [50.6117007117789]
HaDolaは4つの段階(識別、自己アノテーション、エラートリガー、トレーニング)で動作し、有害なサンプルを反復的に識別し、情報的なものを優先順位付けし、小さなシードセットからブートストラップする。提案手法は,高コストなHUアノテーションへの依存を大幅に低減し,VLMの精度と校正性を向上する。
論文参考訳（メタデータ） (2025-10-13T11:35:30Z)
Diagnosing Bottlenecks in Data Visualization Understanding by Vision-Language Models [25.564425023762045]
現在の視覚言語モデル(VLM)は、基本的なデータ可視化理解タスクに苦戦している。 VLMの失敗は、データビジュアライゼーションにおける視覚情報のエンコード方法、視覚と言語モジュール間の情報転送方法、言語モジュール内での情報処理方法の制限に起因するか? 我々は,データ可視化理解タスクのスイートであるFUGUを開発した。
論文参考訳（メタデータ） (2025-10-02T18:29:07Z)
Detecting and Fixing API Misuses of Data Science Libraries Using Large Language Models [0.6958509696068848]
本稿では,データサイエンスライブラリのAPI誤用を検出し,修正するためのLCMベースのアプローチであるDSCHECKERを紹介する。 APIの誤用の検出と修正に有用な2つの重要な情報、すなわちAPIディレクティブとデータ情報を特定します。ドシェッカー剤は48.65パーセントのF1スコアを検出でき、誤用の39.47パーセントを修正している。
論文参考訳（メタデータ） (2025-09-29T18:30:02Z)
Is this chart lying to me? Automating the detection of misleading visualizations [74.26574031329689]
誤解を招くビジュアライゼーションは、ソーシャルメディアやウェブ上での誤報の強力な原動力だ。 Misvizは、12種類のミスリーダーで注釈付けされた2,604の現実世界の視覚化のベンチマークである。 Misviz-synthは、Matplotlibを使って生成され、実世界のデータテーブルに基づいて81,814の可視化データからなる合成データセットである。
論文参考訳（メタデータ） (2025-08-29T14:36:45Z)
Subgraph-Oriented Testing for Deep Learning Libraries [9.78188667672054]
我々は,異なるハードウェアプラットフォーム上でディープラーニング(DL)ライブラリをテストするためのSORT(Subgraph-Oriented Realistic Testing)を提案する。 SORTは、テスト対象として、しばしばモデルグラフのサブグラフとして表現される、人気のあるAPIインタラクションパターンを採用している。 SORTは100%有効な入力生成率を実現し、既存のメソッドよりも精度の高いバグを検出し、シングルAPIテストで欠落したインタラクション関連のバグを明らかにする。
論文参考訳（メタデータ） (2024-12-09T12:10:48Z)
An Empirical Study of API Misuses of Data-Centric Libraries [9.667988837321943]
本稿では,データ処理,数値計算,機械学習,可視化などの分野をカバーする5つのデータ中心ライブラリのAPI誤用に関する実証的研究を行う。 Stack OverflowとGitHubのデータを分析することで、これらのライブラリの誤用を特定します。
論文参考訳（メタデータ） (2024-08-28T15:15:52Z)
VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。 Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。 6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文参考訳（メタデータ） (2024-06-19T11:09:16Z)
GraphGuard: Detecting and Counteracting Training Data Misuse in Graph Neural Networks [69.97213941893351]
グラフデータ分析におけるグラフニューラルネットワーク(GNN)の出現は、モデルトレーニング中のデータ誤用に関する重要な懸念を引き起こしている。既存の手法は、データ誤用検出または緩和のいずれかに対応しており、主にローカルGNNモデル用に設計されている。本稿では,これらの課題に対処するため,GraphGuardという先駆的なアプローチを導入する。
論文参考訳（メタデータ） (2023-12-13T02:59:37Z)
Software issues report for bug fixing process: An empirical study of machine-learning libraries [0.0]
6つの機械学習ライブラリにおけるバグ修正プロセスにおける課題解決の有効性について検討した。マシンラーニングライブラリで最も一般的な問題カテゴリは、バグ、ドキュメント、最適化、クラッシュ、拡張、新機能要求、ビルド/CI、サポート、パフォーマンスである。本研究は,効率的な課題追跡プロセス,効果的なコミュニケーション,コラボレーションが,機械学習ライブラリの課題解決やバグ修正プロセスの効果的な解決に不可欠である,と結論付けている。
論文参考訳（メタデータ） (2023-12-10T21:33:19Z)
On Using GUI Interaction Data to Improve Text Retrieval-based Bug Localization [10.717184444794505]
エンドユーザー向けアプリケーションでは、バグレポート内の情報とGUIの情報とを結びつけることにより、既存のバグローカライゼーション技術を改善することができるという仮説を考察する。当社は,Androidアプリの完全ローカライズおよび再現可能な真のバグに関する現在の最大のデータセットを,対応するバグレポートとともに公開しています。
論文参考訳（メタデータ） (2023-10-12T07:14:22Z)
An Empirical Study on Bugs Inside PyTorch: A Replication Study [10.848682558737494]
私たちは、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けています。私たちの結果は、PyTorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに近いことを強調しています。
論文参考訳（メタデータ） (2023-07-25T19:23:55Z)
Annotation Error Detection: Analyzing the Past and Present for a More Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文参考訳（メタデータ） (2022-06-05T22:31:45Z)
Understanding Factual Errors in Summarization: Errors, Summarizers, Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文参考訳（メタデータ） (2022-05-25T15:26:48Z)
DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文参考訳（メタデータ） (2022-01-14T00:16:57Z)
Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文参考訳（メタデータ） (2021-04-20T17:16:41Z)
Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文参考訳（メタデータ） (2021-04-17T21:34:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。