Fugu-MT 論文翻訳(概要): GenLens: A Systematic Evaluation of Visual GenAI Model Outputs

論文の概要: GenLens: A Systematic Evaluation of Visual GenAI Model Outputs

arxiv url: http://arxiv.org/abs/2402.03700v1
Date: Tue, 6 Feb 2024 04:41:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-07 16:30:12.686536
Title: GenLens: A Systematic Evaluation of Visual GenAI Model Outputs
Title（参考訳）: GenLens: Visual GenAIモデル出力の体系的評価
Authors: Tica Lin, Hanspeter Pfister, Jui-Hsien Wang
Abstract要約: GenLensは、GenAIモデル出力の体系的評価のために設計されたビジュアル分析インタフェースである。モデル開発者によるユーザ調査によると、GenLensは、高い満足度で証明されたワークフローを効果的に強化する。
参考スコア（独自算出の注目度）: 33.93591473459988
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The rapid development of generative AI (GenAI) models in computer vision necessitates effective evaluation methods to ensure their quality and fairness. Existing tools primarily focus on dataset quality assurance and model explainability, leaving a significant gap in GenAI output evaluation during model development. Current practices often depend on developers' subjective visual assessments, which may lack scalability and generalizability. This paper bridges this gap by conducting a formative study with GenAI model developers in an industrial setting. Our findings led to the development of GenLens, a visual analytic interface designed for the systematic evaluation of GenAI model outputs during the early stages of model development. GenLens offers a quantifiable approach for overviewing and annotating failure cases, customizing issue tags and classifications, and aggregating annotations from multiple users to enhance collaboration. A user study with model developers reveals that GenLens effectively enhances their workflow, evidenced by high satisfaction rates and a strong intent to integrate it into their practices. This research underscores the importance of robust early-stage evaluation tools in GenAI development, contributing to the advancement of fair and high-quality GenAI models.
Abstract（参考訳）: コンピュータビジョンにおける生成AI(GenAI)モデルの迅速な開発は、その品質と公平性を保証するために効果的な評価方法を必要とする。既存のツールは、主にデータセットの品質保証とモデル説明可能性に焦点を当てており、モデル開発中にGenAI出力評価に大きなギャップを残しています。現在のプラクティスは、しばしば開発者の主観的な視覚的評価に依存します。本稿では、GenAIモデル開発者と産業環境で形式的な研究を行うことにより、このギャップを埋める。この結果から,モデル開発の初期段階におけるジェナイモデル出力の体系的評価を目的としたビジュアル解析インタフェースであるgenlensの開発に繋がった。 GenLensは、障害ケースの概要と注釈付け、イシュータグと分類のカスタマイズ、複数のユーザからのアノテーションの集約によるコラボレーション強化のための定量的なアプローチを提供する。モデル開発者によるユーザ調査によると、GenLensはワークフローを効果的に強化し、高い満足度と、それをプラクティスに統合する強い意図によって証明されている。本研究は、GenAI開発における堅牢な早期評価ツールの重要性を強調し、公正かつ高品質なGenAIモデルの進歩に寄与する。

関連論文リスト

Generative AI for Software Architecture. Applications, Trends, Challenges, and Future Directions [6.883775050854466]
我々は、ソフトウェアアーキテクチャにおけるGenAIの使用、合理化、コンテキスト、ユーザビリティ、および将来の課題を体系的に総合することを目指している。アーキテクチャ決定支援とアーキテクチャ再構築のためのGenAIの導入について検討した。
論文参考訳（メタデータ） (2025-03-17T15:49:30Z)
Computational Safety for Generative AI: A Signal Processing Perspective [65.268245109828]
計算安全性は、GenAIにおける安全性の定量的評価、定式化、研究を可能にする数学的枠組みである。ジェイルブレイクによる悪意のあるプロンプトを検出するために, 感度解析と損失景観解析がいかに有効かを示す。我々は、AIの安全性における信号処理の鍵となる研究課題、機会、そして重要な役割について論じる。
論文参考訳（メタデータ） (2025-02-18T02:26:50Z)
Benchmarking Generative AI Models for Deep Learning Test Input Generation [6.674615464230326]
テスト入力ジェネレータ(TIG)は、ディープラーニング(DL)画像分類器が、トレーニングやテストセットを超えて入力の正確な予測を提供する能力を評価するために不可欠である。ジェネレーティブAI(GenAI)モデルの最近の進歩は、合成画像の作成と操作のための強力なツールとなった。我々は、異なるGenAIモデルとTIGをベンチマークして組み合わせ、生成したテスト画像の有効性、効率、品質を評価する。
論文参考訳（メタデータ） (2024-12-23T15:30:42Z)
GenAIOps for GenAI Model-Agility [2.7396907658239424]
我々は、モデルプロバイダやバージョンと同じくらい多様な基礎モデルに柔軟に適応する準備が整った、いわゆるGenAI Model-agilityについて議論する。まず、生成AI特有の問題に対処するため、まずGenAIOpsとしてGenAIアプリケーションの開発と運用の方法論を定義し、基礎となる基盤モデルの変更によるアプリケーション品質劣化の問題を特定する。本稿では,この問題に対処する上で有望と思われるプロンプトチューニング技術について検討し,既存のツールを用いたケーススタディを通じて,その有効性と限界について考察する。
論文参考訳（メタデータ） (2024-12-19T03:29:03Z)
Dimensions of Generative AI Evaluation Design [51.541816010127256]
我々は、GenAI評価設計に関わる重要な選択を捉えるための一般的な次元のセットを提案する。これらの次元には、評価設定、タスクタイプ、入力ソース、インタラクションスタイル、期間、メトリックタイプ、スコアリング方法が含まれる。
論文参考訳（メタデータ） (2024-11-19T18:25:30Z)
Recommendation with Generative Models [35.029116616023586]
生成モデルは、統計分布から学習し、サンプリングすることで、データの新しいインスタンスを作成することができるAIモデルである。これらのモデルは、画像生成、テキスト合成、音楽合成など、様々な領域に応用されている。レコメンデーションシステムでは、Gen-RecSysと呼ばれる生成モデルは、レコメンデーションの正確性と多様性を改善する。
論文参考訳（メタデータ） (2024-09-18T18:29:15Z)
Case Study: Leveraging GenAI to Build AI-based Surrogates and Regressors for Modeling Radio Frequency Heating in Fusion Energy Science [30.658306142871602]
本稿では, 融合エネルギー研究におけるシミュレーションモデルのためのAIサロゲートの開発にGenerative AI(GenAI)を用いた詳細なケーススタディを提案する。このスコープには、モデル開発と最適化を支援するためにGenAIを使用する方法論、実装、結果が含まれている。
論文参考訳（メタデータ） (2024-09-10T00:22:19Z)
On the Limitations and Prospects of Machine Unlearning for Generative AI [7.795648142175443]
Generative AI(GenAI)は、潜伏変数やその他のデータモダリティから現実的で多様なデータサンプルを合成することを目的としている。 GenAIは自然言語、画像、オーディオ、グラフなど、さまざまな領域で顕著な成果を上げている。しかし、データプライバシ、セキュリティ、倫理に課題やリスクも生じている。
論文参考訳（メタデータ） (2024-08-01T08:35:40Z)
Model-based Maintenance and Evolution with GenAI: A Look into the Future [47.93555901495955]
我々は、モデルベースエンジニアリング(MBM&E)の限界に対処する手段として、生成人工知能(GenAI)を用いることができると論じる。我々は、エンジニアの学習曲線の削減、レコメンデーションによる効率の最大化、ドメイン問題を理解するための推論ツールとしてのGenAIの使用を提案する。
論文参考訳（メタデータ） (2024-07-09T23:13:26Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
Generative AI for Visualization: State of the Art and Future Directions [7.273704442256712]
本稿では,GenAIを活用した過去の可視化研究を振り返る。本稿では,世代別アルゴリズムとその応用と限界を要約することにより,今後のGenAI4VIS研究に有用な知見を提供する。
論文参考訳（メタデータ） (2024-04-28T11:27:30Z)
Generative AI and Process Systems Engineering: The Next Frontier [0.5937280131734116]
本稿では,大規模言語モデル (LLM) のような新しい生成人工知能(GenAI)モデルが,プロセスシステム工学 (PSE) におけるソリューション方法論をいかに拡張するかを考察する。これらの最先端のGenAIモデル、特にファンデーションモデル(FM)は、広範な汎用データセットで事前トレーニングされている。この記事では、マルチスケールモデリング、データ要件、評価指標とベンチマーク、信頼性と安全性など、PSE内でGenAIを完全に活用する上での潜在的な課題を特定し、議論する。
論文参考訳（メタデータ） (2024-02-15T18:20:42Z)
A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。 AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文参考訳（メタデータ） (2023-03-07T20:36:13Z)
Rethinking Generalization of Neural Models: A Named Entity Recognition Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文参考訳（メタデータ） (2020-01-12T04:33:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。