Fugu-MT 論文翻訳(概要): CAMERA: A Multimodal Dataset and Benchmark for Ad Text Generation

論文の概要: CAMERA: A Multimodal Dataset and Benchmark for Ad Text Generation

arxiv url: http://arxiv.org/abs/2309.12030v1
Date: Thu, 21 Sep 2023 12:51:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-22 15:17:21.121757
Title: CAMERA: A Multimodal Dataset and Benchmark for Ad Text Generation
Title（参考訳）: CAMERA: 広告テキスト生成のためのマルチモーダルデータセットとベンチマーク
Authors: Masato Mita, Soichiro Murakami, Akihiko Kato, Peinan Zhang
Abstract要約: 本稿では、再設計されたタスクを導入し、ベンチマークを構築することにより、自動広告テキスト生成(ATG)の分野を推し進めることを目的とする。我々は、ATGをインターネット広告の様々な側面を含むアプリケーション横断タスクとして定義する。コントリビューションの一環として、広告テキスト生成のためのCA Multimodal Evaluation for Ad Text GeneRAtion (CAMERA) という、最初のベンチマークデータセットを提案する。
参考スコア（独自算出の注目度）: 5.850906588469643
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In response to the limitations of manual online ad production, significant research has been conducted in the field of automatic ad text generation (ATG). However, comparing different methods has been challenging because of the lack of benchmarks encompassing the entire field and the absence of well-defined problem sets with clear model inputs and outputs. To address these challenges, this paper aims to advance the field of ATG by introducing a redesigned task and constructing a benchmark. Specifically, we defined ATG as a cross-application task encompassing various aspects of the Internet advertising. As part of our contribution, we propose a first benchmark dataset, CA Multimodal Evaluation for Ad Text GeneRAtion (CAMERA), carefully designed for ATG to be able to leverage multi-modal information and conduct an industry-wise evaluation. Furthermore, we demonstrate the usefulness of our proposed benchmark through evaluation experiments using multiple baseline models, which vary in terms of the type of pre-trained language model used and the incorporation of multi-modal information. We also discuss the current state of the task and the future challenges.
Abstract（参考訳）: 手動オンライン広告制作の限界に対応するため、自動広告テキスト生成(ATG)分野において重要な研究が行われている。しかし、フィールド全体を包含するベンチマークの欠如と、明確なモデル入力と出力を持つ明確な問題セットの欠如により、異なる手法の比較は困難である。これらの課題に対処するため,本論文では,再設計タスクを導入し,ベンチマークを構築することにより,ATGの分野を推し進めることを目的とする。具体的には、ATGをインターネット広告の様々な側面を含むアプリケーション横断タスクと定義した。本稿では,広告テキスト生成のためのCA Multimodal Evaluation for Ad Text GeneRAtion (CAMERA) というベンチマークデータセットを提案する。さらに,複数のベースラインモデルを用いた評価実験により,提案手法の有効性を実証した。また,課題の現状と今後の課題についても考察する。

関連論文リスト

AI-Generated Game Commentary: A Survey and a Datasheet Repository [4.396546075994102]
AIGGCの一般的なフレームワークを導入し、45の既存のゲームコメンタリーデータセットとメソッドの包括的調査を行う。将来の研究ベンチマークをサポートするため、構造化された付録も提供しています。
論文参考訳（メタデータ） (2025-06-17T07:04:51Z)
A Position Paper on the Automatic Generation of Machine Learning Leaderboards [12.736094044510224]
機械学習(ML)研究における重要な課題は、MLのリーダーボードを通じて実行される以前の作業を比較することである。この負担を軽減するために、研究者は研究論文からリーダーボードエントリを抽出する方法を開発した。しかし、事前の作業は、問題フレーミング、比較の複雑化、現実の応用可能性の制限などによって異なる。本稿では,ALGタスクの定義方法の標準化を目的とした,ALG統合概念フレームワークを提案する。
論文参考訳（メタデータ） (2025-05-23T04:46:10Z)
Towards Visual Text Grounding of Multimodal Large Language Model [88.0588924255417]
本稿では,テキストリッチな画像グラウンドのベンチマークを行うための命令データセットを新たに設計した新しいタスクであるTRIGを紹介する。具体的には,OCR-LLM-ヒューマンインタラクションパイプラインを提案し,800の注釈付き質問応答ペアをベンチマークとして作成する。提案したベンチマークによる各種MLLMの包括的評価は,テキストリッチな画像上でのグラウンド化能力の大幅な制限を明らかにする。
論文参考訳（メタデータ） (2025-04-07T12:01:59Z)
Movie2Story: A framework for understanding videos and telling stories in the form of novel text [0.0]
補助情報に富んだシナリオにおけるテキスト生成能力を評価するための新しいベンチマークを提案する。本研究は,高精度な補助情報の提供を確実にするための,革新的な自動データセット生成手法を提案する。本実験により, 提案した評価指標に基づいて, 現在のMLLM(Multi-modal Large Language Models)が準最適に動作していることが判明した。
論文参考訳（メタデータ） (2024-12-19T15:44:04Z)
Towards Better Open-Ended Text Generation: A Multicriteria Evaluation Framework [0.1979158763744267]
オープンエンドテキスト生成は自然言語処理において顕著な課題となっている。復号法は、いくつかの指標で優れ、他の指標では性能が劣ることが多い。本稿では,この多基準フレームワークにおける新たなランキング戦略を提案する。
論文参考訳（メタデータ） (2024-10-24T11:32:01Z)
Optimizing and Evaluating Enterprise Retrieval-Augmented Generation (RAG): A Content Design Perspective [0.0]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を使用して顧客支援の質問応答ソリューションを構築するための一般的なテクニックである。本稿では,モジュール性とモデルに依存しないソリューション戦略に焦点を当てる。
論文参考訳（メタデータ） (2024-10-01T03:54:45Z)
AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising [19.642481233488667]
我々は,複数の視点から広告テキストを評価する最初の公開ベンチマークであるAdTEC(Ad Text Evaluation Benchmark by CyberAgent)を提案する。 i)広告テキストの品質を評価するための5つのタスクを定義するとともに,通常社内に保管される広告代理店の業務経験に基づく日本語データセットを構築する。
論文参考訳（メタデータ） (2024-08-12T03:32:53Z)
Systematic Task Exploration with LLMs: A Study in Citation Text Generation [63.50597360948099]
大規模言語モデル(LLM)は、複雑な創造的自然言語生成(NLG)タスクの定義と実行において、前例のない柔軟性をもたらす。本稿では,系統的な入力操作,参照データ,出力測定からなる3成分研究フレームワークを提案する。我々はこのフレームワークを用いて引用テキスト生成を探索する。これは一般的なNLPタスクであり、タスク定義と評価基準に関するコンセンサスを欠いている。
論文参考訳（メタデータ） (2024-07-04T16:41:08Z)
Recent advances in text embedding: A Comprehensive Review of Top-Performing Methods on the MTEB Benchmark [0.0]
MTEB(Massive Text Embedding Benchmark)におけるテキスト埋め込みの最高性能に着目したユニバーサルテキスト埋め込みモデルの進歩について概説する。詳細な比較と分析を通じて、この分野における重要な貢献と限界を強調し、将来的な研究の方向性を示唆する。
論文参考訳（メタデータ） (2024-05-27T09:52:54Z)
Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文参考訳（メタデータ） (2024-02-16T13:53:26Z)
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文参考訳（メタデータ） (2024-01-30T14:25:32Z)
BLESS: Benchmarking Large Language Models on Sentence Simplification [55.461555829492866]
我々は、テキスト単純化(TS)タスク上で、最新の最先端の大規模言語モデル(LLM)のパフォーマンスベンチマークであるBLESSを紹介する。異なるドメイン(Wikipedia、ニュース、医療)の3つのテストセットに対して、サイズ、アーキテクチャ、事前学習方法、アクセシビリティの異なる44のモデルを評価する。評価の結果,最高のLSMはTSのトレーニングを受けていないにもかかわらず,最先端のTSベースラインと相容れない性能を示した。
論文参考訳（メタデータ） (2023-10-24T12:18:17Z)
Domain-Expanded ASTE: Rethinking Generalization in Aspect Sentiment Triplet Extraction [67.54420015049732]
Aspect Sentiment Triplet extract (ASTE) は感情分析における課題であり、人間の感情に対するきめ細かい洞察を提供することを目的としている。既存のベンチマークは2つのドメインに限定されており、目に見えないドメイン上でのモデルパフォーマンスを評価しない。各種ドメインのサンプルに注釈を付けることでドメイン拡張ベンチマークを導入し,ドメイン内設定とドメイン外設定の両方でモデルの評価を可能にする。
論文参考訳（メタデータ） (2023-05-23T18:01:49Z)
Improving Tagging Consistency and Entity Coverage for Chemical Identification in Full-text Articles [17.24298646089662]
本論文は,BioCreative VII Track 2 チャレンジの化学識別タスクに提案されたシステムに関する技術的報告である。タグの一貫性とエンティティカバレッジを様々な手法で改善することを目的としている。課題の公式評価では,ベースラインモデルを大幅に上回り,NERでは1位にランクインした。
論文参考訳（メタデータ） (2021-11-20T13:13:58Z)
Automatic Construction of Evaluation Suites for Natural Language Generation Datasets [17.13484629172643]
我々は、制御された摂動を生成し、テキストからスカラー、テキストからテキストへ、あるいはデータからテキストへ設定したサブセットを識別するフレームワークを開発する。 80個のチャレンジセットからなる評価スイートを提案し、現在の世代モデルの限界に光を当てることを可能にした分析の種類を実証する。
論文参考訳（メタデータ） (2021-06-16T18:20:58Z)
The GEM Benchmark: Natural Language Generation, its Evaluation and Metrics [66.96150429230035]
我々は、自然言語生成(NLG)のための生きたベンチマークであるGEM、その評価、およびメトリクスを紹介する。ベンチマークの定期的なアップデートにより、NLGの研究はより多言語化され、モデルとともに課題を進化させる。
論文参考訳（メタデータ） (2021-02-02T18:42:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。