Fugu-MT 論文翻訳(概要): The Truth, the Whole Truth, and Nothing but the Truth: Automatic Visualization Evaluation from Reconstruction Quality

論文の概要: The Truth, the Whole Truth, and Nothing but the Truth: Automatic Visualization Evaluation from Reconstruction Quality

arxiv url: http://arxiv.org/abs/2603.16873v1
Date: Mon, 26 Jan 2026 19:36:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:42.348572
Title: The Truth, the Whole Truth, and Nothing but the Truth: Automatic Visualization Evaluation from Reconstruction Quality
Title（参考訳）: 真理・全理・無・真理-復元品質による自動可視化評価
Authors: Roxana Bujack, Li-Ta Lo, Ethan Stam, Ayan Biswas, David Rogers,
Abstract要約: 人間のラベル付きデータセットに頼らずに可視化品質を評価する自動メトリクスを提案する。具体的には、可視化自体から元のデータの再構成精度を評価することによって、可視化品質を測定する手法を提案する。この再構築ベースのメトリクスは、人間の完全な評価のための自律的でスケーラブルなプロキシを提供し、より効率的で信頼性の高いAI駆動の可視化を可能にします。
参考スコア（独自算出の注目度）: 2.014871953160343
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in AI enable the automatic generation of visualizations directly from textual prompts using agentic workflows. However, visualizations produced via one-shot generative methods often suffer from insufficient quality, typically requiring a human in the loop to refine the outputs. Human evaluation, though effective, is costly and impractical at scale. To alleviate this problem, we propose an automated metric that evaluates visualization quality without relying on extensive human-labeled datasets. Instead, our approach uses the original underlying data as implicit ground truth. Specifically, we introduce a method that measures visualization quality by assessing the reconstruction accuracy of the original data from the visualization itself. This reconstruction-based metric provides an autonomous and scalable proxy for thorough human evaluation, facilitating more efficient and reliable AI-driven visualization workflows.
Abstract（参考訳）: AIの最近の進歩は、エージェントワークフローを使用してテキストプロンプトから直接視覚化を自動的に生成することを可能にする。しかし、一発生成法によって生成される可視化は、しばしば品質の不足に悩まされ、典型的には、出力を洗練するためにループ内の人間を必要とする。人的評価は、効果はあるものの、大規模で費用がかかり、実用的ではない。この問題を軽減するために,広範囲な人間ラベル付きデータセットに頼ることなく,可視化品質を評価する自動メトリクスを提案する。その代わり、当社のアプローチでは、元の基盤となるデータを暗黙の土台真理として使用しています。具体的には、可視化自体から元のデータの再構成精度を評価することによって、可視化品質を測定する手法を提案する。この再構築ベースのメトリクスは、人間の完全な評価のための自律的でスケーラブルなプロキシを提供し、より効率的で信頼性の高いAI駆動の視覚化ワークフローを促進する。

関連論文リスト

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered [34.408989226550176]
このポジションペーパーでは、現代の視覚処理システムの評価は、主にシングルメトリック画像品質評価ベンチマークによって行われるべきではないと論じている。この論文は、メトリクスを完全に拒絶するのではなく、より人間中心でコンテキストを認識し、視覚モデルの結果を評価するためのきめ細かいアプローチを提唱する評価パラダイムの再バランスを訴える。
論文参考訳（メタデータ） (2026-02-28T13:24:34Z)
Transparent and Coherent Procedural Mistake Detection [30.540514590818265]
手続き的誤り検出(英: Procedural mis detection、PMD)は、人間がタスクをうまく実行したかどうかを分類する難しい問題である(手続き的テキストで特定)。我々は、意思決定に視覚的自己対話的合理性を生成するためにPMDを拡張した。近年のヴィジュアル・アンド・ランゲージモデル(VLM)で観察される印象的かつ成熟した画像理解能力を考えると、個々のフレームに基づいてPMDに適したベンチマークデータセットをキュレートする。
論文参考訳（メタデータ） (2024-12-16T16:13:55Z)
Model Reprogramming Outperforms Fine-tuning on Out-of-distribution Data in Text-Image Encoders [56.47577824219207]
本稿では,侵入的微調整技術に関連する隠れたコストを明らかにする。ファインチューニングのための新しいモデル再プログラミング手法を導入し、それをリプログラマと呼ぶ。我々の経験的証拠は、Re Programmerは侵入力が少なく、より優れた下流モデルが得られることを示している。
論文参考訳（メタデータ） (2024-03-16T04:19:48Z)
SelfEval: Leveraging the discriminative nature of generative models for evaluation [30.239717220862143]
テキストから画像への生成拡散モデルのテキストアライメントを自動評価する方法を提案する。提案手法はSelfEvalと呼ばれ,テキストプロンプトが与えられた実画像の確率を計算するために生成モデルを用いている。
論文参考訳（メタデータ） (2023-11-17T18:58:16Z)
QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。 QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文参考訳（メタデータ） (2023-11-06T00:21:44Z)
Rubric-Specific Approach to Automated Essay Scoring with Augmentation Training [0.1227734309612871]
本稿では,従来の研究で見過ごされた機能や特徴を学習するために,自動スコアリングモデルの訓練とテストを行う一連のデータ拡張操作を提案する。自動学生評価賞(Automated Students Assessment Prize)データセットにおいて,最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2023-09-06T05:51:19Z)
Intrinsic Self-Supervision for Data Quality Audits [35.69673085324971]
コンピュータビジョンにおけるベンチマークデータセットは、しばしば、オフトピック画像、ほぼ重複、ラベルエラーを含む。本稿では,データクリーニングの課題を再考し,ランキング問題やスコアリング問題として定式化する。文脈認識型自己教師型表現学習と距離に基づく指標の組み合わせは, 適応バイアスのない問題発見に有効であることがわかった。
論文参考訳（メタデータ） (2023-05-26T15:57:04Z)
STAR: Boosting Low-Resource Information Extraction by Structure-to-Text Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文参考訳（メタデータ） (2023-05-24T12:15:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。