論文の概要: FaithCAMERA: Construction of a Faithful Dataset for Ad Text Generation
- arxiv url: http://arxiv.org/abs/2410.03839v1
- Date: Fri, 4 Oct 2024 18:13:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 16:00:59.463190
- Title: FaithCAMERA: Construction of a Faithful Dataset for Ad Text Generation
- Title(参考訳): FaithCAMERA:広告テキスト生成のための忠実なデータセットの構築
- Authors: Akihiko Kato, Masato Mita, Soichiro Murakami, Ukyo Honda, Sho Hoshino, Peinan Zhang,
- Abstract要約: 我々は社内の広告クリエーターと協力して、FaithCAMERAという別のATG評価データセットを開発する。
実験の結果,不誠実なエンティティを含むトレーニングデータを削除することで,エンティティレベルでの忠実度や情報性が向上するが,文レベルでは両者を減少させることがわかった。
- 参考スコア(独自算出の注目度): 5.70971595730985
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In ad text generation (ATG), desirable ad text is both faithful and informative. That is, it should be faithful to the input document, while at the same time containing important information that appeals to potential customers. The existing evaluation data, CAMERA (arXiv:2309.12030), is suitable for evaluating informativeness, as it consists of reference ad texts created by ad creators. However, these references often include information unfaithful to the input, which is a notable obstacle in promoting ATG research. In this study, we collaborate with in-house ad creators to refine the CAMERA references and develop an alternative ATG evaluation dataset called FaithCAMERA, in which the faithfulness of references is guaranteed. Using FaithCAMERA, we can evaluate how well existing methods for improving faithfulness can generate informative ad text while maintaining faithfulness. Our experiments show that removing training data that contains unfaithful entities improves the faithfulness and informativeness at the entity level, but decreases both at the sentence level. This result suggests that for future ATG research, it is essential not only to scale the training data but also to ensure their faithfulness. Our dataset will be publicly available.
- Abstract(参考訳): 広告テキスト生成(ATG)では、望ましい広告テキストは忠実かつ情報的である。
つまり、入力文書に忠実であると同時に、潜在的な顧客にアピールする重要な情報を含んでいるべきである。
既存の評価データであるCAMERA(arXiv:2309.12030)は、広告クリエーターによって作成された参照広告テキストからなるので、情報量を評価するのに適している。
しかしながら、これらの参照には入力に不満足な情報が含まれており、ATG研究の推進において顕著な障害となっている。
本研究では、社内の広告制作者と協力して、CAMERA参照を洗練させ、FithCAMERAと呼ばれる別のATG評価データセットを開発し、参照の忠実性を保証する。
FaithCAMERAを用いて、忠実性を維持しながら、既存の忠実性を改善する方法が、いかに情報的広告テキストを生成できるかを評価することができる。
実験の結果,不誠実なエンティティを含むトレーニングデータを削除することで,エンティティレベルでの忠実度や情報性が向上するが,文レベルでは両者を減少させることがわかった。
この結果は、将来のATG研究にとって、トレーニングデータをスケールするだけでなく、その忠実性を確保することが不可欠であることを示唆している。
私たちのデータセットは公開されます。
関連論文リスト
- PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.20471076045916]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。
Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。
Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文 参考訳(メタデータ) (2024-09-19T06:28:18Z) - Towards Verifiable Text Generation with Evolving Memory and Self-Reflection [29.453251483492803]
検証可能なテキスト生成は、大規模な言語モデルに対して、精度検証のための引用付きコンテンツを生成するよう促す。
しかし、フォーカスシフト現象、クレームを正しい引用と整合させるために必要な複雑な推論、検索された文書の精度と幅の間のジレンマのため、検証可能なテキスト生成は簡単ではない。
本稿では、記憶と自己回帰を進化させる検証可能なテキスト生成のための革新的なフレームワークであるVTGを紹介する。
論文 参考訳(メタデータ) (2023-12-14T16:10:56Z) - HonestBait: Forward References for Attractive but Faithful Headline
Generation [13.456581900511873]
フォワード参照 (FR) は、クリックベイトによく使われる記述技法である。
自己検証プロセスは、急激な発明を避けるために訓練中に含まれる。
本稿では,疑似ニュースと疑似ニュースのペアを含む斬新なデータセットであるPANCO1について紹介する。
論文 参考訳(メタデータ) (2023-06-26T16:34:37Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Faithfulness-Aware Decoding Strategies for Abstractive Summarization [72.74188956905712]
本研究では,ビームサーチや核サンプリングなどの生成技術が抽象的な要約における忠実性に及ぼす影響について検討する。
本稿では,現在の生成技術よりも忠実性を高めるための2つの忠実度認識生成手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T16:49:27Z) - Models See Hallucinations: Evaluating the Factuality in Video Captioning [57.85548187177109]
ビデオキャプションにおける実感の人間による評価を行い、2つの注釈付き実感データセットを収集する。
モデル生成文の57.0%に事実誤りがあり、この分野では深刻な問題であることを示す。
本稿では,映像キャプションの事実性評価において,従来の指標より優れていたモデルベース事実性指標FactVCを提案する。
論文 参考訳(メタデータ) (2023-03-06T08:32:50Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - TSI: an Ad Text Strength Indicator using Text-to-CTR and
Semantic-Ad-Similarity [16.10904771281746]
i)入力広告テキストのクリックスルーレート(CTR)を予測し、(ii)類似の既存の広告をフェッチして入力広告の周辺に近づき、その周辺で予測されたCTRを比較して、入力広告が強いか弱いかを判断する。
広告テキストの改善の提案として、TSIは近隣の優れた広告(より高い予測CTR)の匿名化バージョンを示す。
論文 参考訳(メタデータ) (2021-08-18T16:24:40Z) - SRLF: A Stance-aware Reinforcement Learning Framework for Content-based
Rumor Detection on Social Media [15.985224010346593]
初期のコンテンツベースの方法は、噂の検出のためにテキストとユーザープロファイルから手がかりを見つけることに集中した。
近年の研究では、ユーザのコメントとニュースコンテンツを組み合わせて、真実と偽の噂の違いを捉えている。
本稿では,モデルトレーニングと噂検出のための高品質なラベル付き姿勢データを選択するための,SRLF(Stance-Aware Reinforcement Learning Framework)を提案する。
論文 参考訳(メタデータ) (2021-05-10T03:58:34Z) - Adversarial Watermarking Transformer: Towards Tracing Text Provenance
with Data Hiding [80.3811072650087]
自然言語の透かしを防御として研究し,テキストの出所の発見と追跡に役立てる。
本稿では,適応型透かし変換器(AWT)とエンコーダ・デコーダ・デコーダを併用した対向型透かし変換器(AWT)について述べる。
AWTは、テキストにデータを隠蔽する最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2020-09-07T11:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。