論文の概要: A Survey of Automatic Evaluation Methods on Text, Visual and Speech Generations
- arxiv url: http://arxiv.org/abs/2506.10019v1
- Date: Fri, 06 Jun 2025 11:09:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.310283
- Title: A Survey of Automatic Evaluation Methods on Text, Visual and Speech Generations
- Title(参考訳): テキスト・視覚・音声の自動評価手法の検討
- Authors: Tian Lan, Yang-Hao Zhou, Zi-Ao Ma, Fanshu Sun, Rui-Qing Sun, Junyu Luo, Rong-Cheng Tu, Heyan Huang, Chen Xu, Zhijing Wu, Xian-Ling Mao,
- Abstract要約: 本稿では,3つのモダリティすべてにまたがる生成コンテンツの自動評価手法の総合的なレビューと統合分類について述べる。
本分析は,最も成熟したテキスト生成手法の評価から開始する。
次に、このフレームワークを画像およびオーディオ生成に拡張し、その幅広い適用性を示す。
- 参考スコア(独自算出の注目度): 58.105900601078595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in deep learning have significantly enhanced generative AI capabilities across text, images, and audio. However, automatically evaluating the quality of these generated outputs presents ongoing challenges. Although numerous automatic evaluation methods exist, current research lacks a systematic framework that comprehensively organizes these methods across text, visual, and audio modalities. To address this issue, we present a comprehensive review and a unified taxonomy of automatic evaluation methods for generated content across all three modalities; We identify five fundamental paradigms that characterize existing evaluation approaches across these domains. Our analysis begins by examining evaluation methods for text generation, where techniques are most mature. We then extend this framework to image and audio generation, demonstrating its broad applicability. Finally, we discuss promising directions for future research in cross-modal evaluation methodologies.
- Abstract(参考訳): ディープラーニングの最近の進歩は、テキスト、画像、オーディオ間の生成AI能力を著しく向上させた。
しかし、これらの生成した出力の品質を自動評価することは、進行中の課題である。
多くの自動評価手法が存在するが、現在の研究は、これらの手法をテキスト、視覚、オーディオのモダリティにわたって包括的に整理する体系的な枠組みを欠いている。
この問題に対処するため,これらの領域にまたがる既存の評価手法を特徴付ける5つの基本パラダイムを同定する。
本分析は,最も成熟したテキスト生成手法の評価から開始する。
次に、このフレームワークを画像およびオーディオ生成に拡張し、その幅広い適用性を示す。
最後に,クロスモーダル評価手法の今後の研究の方向性について論じる。
関連論文リスト
- Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning [63.531262595858]
分数的・対数的アプローチは、総合的な評価タスクを局所的なスコアリングタスクに分割し、続いて最終的なグローバルアセスメントを行う。
局所的およびグローバルな評価の両面での性能を高めるために,人間のアノテーションを活用するハイブリッド・イン・コンテキスト・ラーニング・アプローチを導入する。
最後に,人間のアノテーションに対するデータサンプルを効率的に選択する不確実性に基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-05-26T16:39:41Z) - What Makes a Good Story and How Can We Measure It? A Comprehensive Survey of Story Evaluation [57.550045763103334]
ストーリーを評価することは、他の世代の評価タスクよりも難しい場合があります。
まず、テキスト・トゥ・テキスト、ビジュアル・トゥ・テキスト、テキスト・トゥ・ビジュアルといった既存のストーリーテリングタスクを要約する。
本研究では,これまで開発されてきた,あるいはストーリー評価に応用可能な評価指標を整理する分類法を提案する。
論文 参考訳(メタデータ) (2024-08-26T20:35:42Z) - Generative AI-Based Text Generation Methods Using Pre-Trained GPT-2 Model [2.6320841968362645]
この研究は自動テキスト生成の領域を掘り下げ、伝統的な決定論的アプローチからより近代的な手法まで様々な手法を探求した。
欲求探索、ビームサーチ、トップクサンプリング、トップpサンプリング、コントラスト探索、および局所的な典型探索の分析を通じて、この研究は各手法の強み、弱み、および潜在的な応用に関する貴重な洞察を与えてきた。
論文 参考訳(メタデータ) (2024-04-02T09:49:53Z) - A Systematic Review of Data-to-Text NLG [2.4769539696439677]
高品質なテキストを生成する手法を探索し、テキスト生成における幻覚の課題に対処する。
テキスト品質の進歩にもかかわらず、このレビューは低リソース言語における研究の重要性を強調している。
論文 参考訳(メタデータ) (2024-02-13T14:51:45Z) - Automatic assessment of text-based responses in post-secondary
education: A systematic review [0.0]
教育におけるテキストベースの反応の迅速な評価とフィードバックの自動化には大きな可能性がある。
近年,テキストによる自動評価システムがどのように開発され,教育に応用されているかを理解するために,三つの研究課題が検討されている。
この体系的なレビューは、テキストベースのアセスメントシステムの最近の教育応用の概要を提供する。
論文 参考訳(メタデータ) (2023-08-30T17:16:45Z) - Automated Audio Captioning: an Overview of Recent Progress and New
Challenges [56.98522404673527]
自動音声キャプションは、与えられた音声クリップの自然言語記述を生成することを目的とした、モーダル横断翻訳タスクである。
本稿では、既存の様々なアプローチから評価指標やデータセットまで、自動音声キャプションにおけるコントリビューションの総合的なレビューを行う。
論文 参考訳(メタデータ) (2022-05-12T08:36:35Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。