論文の概要: Book Cover Synthesis from the Summary
- arxiv url: http://arxiv.org/abs/2211.02138v1
- Date: Thu, 3 Nov 2022 20:43:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 16:45:12.750931
- Title: Book Cover Synthesis from the Summary
- Title(参考訳): 概要からの書籍表紙の合成
- Authors: Emdadul Haque, Md. Faraz Kabir Khan, Mohammad Imrul Jubair, Jarin
Anjum, Abrar Zahir Niloy
- Abstract要約: 本書の要約と表紙との間には関連性があることから,人工知能を用いて書籍の表紙を作成する方法について検討する。
既存の書籍の要約やそのカバーイメージを多数含む英語書籍のデータセットを構築した。
本論文では,要約から書籍の表紙を生成するために,異なるテキスト・画像合成技術を適用し,その結果を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The cover is the face of a book and is a point of attraction for the readers.
Designing book covers is an essential task in the publishing industry. One of
the main challenges in creating a book cover is representing the theme of the
book's content in a single image. In this research, we explore ways to produce
a book cover using artificial intelligence based on the fact that there exists
a relationship between the summary of the book and its cover. Our key
motivation is the application of text-to-image synthesis methods to generate
images from given text or captions. We explore several existing text-to-image
conversion techniques for this purpose and propose an approach to exploit these
frameworks for producing book covers from provided summaries. We construct a
dataset of English books that contains a large number of samples of summaries
of existing books and their cover images. In this paper, we describe our
approach to collecting, organizing, and pre-processing the dataset to use it
for training models. We apply different text-to-image synthesis techniques to
generate book covers from the summary and exhibit the results in this paper.
- Abstract(参考訳): 表紙は本の顔であり、読者にとって魅力の点である。
書籍の表紙のデザインは出版業界で欠かせない仕事だ。
本をカバーする上での大きな課題の1つは、本の内容のテーマを単一のイメージで表現することである。
本研究では,本書の要約と表紙の間には関係があるという事実に基づいて,人工知能を用いた書籍カバーの作成方法について検討する。
我々のモチベーションは、テキストから画像への合成手法を適用し、与えられたテキストやキャプションから画像を生成することである。
この目的のために,既存のテキスト・画像変換手法をいくつか検討し,提供された要約から本カバーを作成するための手法を提案する。
既存の書籍の要約とカバー画像の膨大なサンプルを含む英文書籍のデータセットを構築した。
本稿では,データセットをトレーニングモデルに使用するための収集,整理,前処理を行う手法について述べる。
本論文の要約から書籍の表紙を生成するために,異なるテキスト・画像合成技術を適用し,その結果を示す。
関連論文リスト
- Decoupled Textual Embeddings for Customized Image Generation [62.98933630971543]
カスタマイズされたテキスト・ツー・イメージ生成は、ユーザが指定した概念を少数の画像で学習することを目的としている。
既存の方法は、通常、過剰な問題に悩まされ、学習された概念と対象と無関係な情報を絡み合わせる。
フレキシブルなテキスト・ツー・イメージ生成のための不整合概念の埋め込みを学習する新しいアプローチであるDETEXを提案する。
論文 参考訳(メタデータ) (2023-12-19T03:32:10Z) - Interleaving GANs with knowledge graphs to support design creativity for
book covers [77.34726150561087]
本書のカバードメインにGAN(Generative Adversarial Networks)を適用する。
我々は、GANを知識グラフとインターリーブして入力タイトルを変更し、任意のタイトルに対して複数のオプションを得る。
最後に、トレーニング期間中に得られた判別器を用いて、新しいタイトルで生成された最良の画像を選択する。
論文 参考訳(メタデータ) (2023-08-03T08:56:56Z) - Break-A-Scene: Extracting Multiple Concepts from a Single Image [80.47666266017207]
テキストシーン分解の課題を紹介する。
本稿では,対象概念の存在を示すマスクを用いた入力画像の拡張を提案する。
次に、新しい2段階のカスタマイズプロセスを示す。
論文 参考訳(メタデータ) (2023-05-25T17:59:04Z) - Enhancing Textbooks with Visuals from the Web for Improved Learning [50.01434477801967]
本稿では,Webからの画像を用いた教科書を自動的に強化する視覚言語モデルの有効性について検討する。
数学、科学、社会科学、ビジネス分野における電子教科書のデータセットを収集します。
次に,テキスト画像マッチングタスクを設定し,テキスト画像の検索とテキストへの適切な割り当てを行う。
論文 参考訳(メタデータ) (2023-04-18T12:16:39Z) - Text-to-image Diffusion Models in Generative AI: A Survey [86.11421833017693]
本調査は,テキストから画像を生成する際の拡散モデルの進展を概観する。
ビデオなどの様々なモダリティのためのテキスト誘導生成や、テキスト誘導画像編集など、画像生成以外の応用について論じる。
論文 参考訳(メタデータ) (2023-03-14T13:49:54Z) - CREATIVESUMM: Shared Task on Automatic Summarization for Creative
Writing [90.58269243992318]
本稿では,複数の創作分野,すなわち文学テキスト,映画脚本,テレビ脚本を要約する作業について紹介する。
4つのサブタスクとその対応するデータセットを導入し、本、映画脚本、プライムタイムテレビ脚本、昼間のソープオペラ脚本の要約に焦点を当てた。
COING 2022でのCREATIVESUMMワークショップの一環として、共有タスクには合計18の応募が寄せられた。
論文 参考訳(メタデータ) (2022-11-10T21:31:03Z) - Towards Book Cover Design via Layout Graphs [18.028269880425455]
本稿では,手軽なレイアウトグラフに基づいて本のカバーを生成可能な生成ニューラルネットワークを提案する。
レイアウトグラフにはテキスト、自然なシーンオブジェクト、固い色空間などのオブジェクトが含まれている。
論文 参考訳(メタデータ) (2021-05-24T04:28:35Z) - Font Style that Fits an Image -- Font Generation Based on Image Context [7.646713951724013]
本論文では,書籍の表紙内のコンテキストに基づいて,書籍のタイトル画像を生成する手法を提案する。
本稿では,本表紙,目標位置マスク,所望の書籍タイトルを入力し,その表紙に適した文を出力するエンド・ツー・エンドニューラルネットワークを提案する。
提案手法は,定量的かつ定性的な結果によって,本文を効果的に生成できることを実証する。
論文 参考訳(メタデータ) (2021-05-19T01:53:04Z) - Deep multi-modal networks for book genre classification based on its
cover [0.0]
カバーベースの書籍分類問題を解決するために,マルチモーダルなディープラーニングフレームワークを提案する。
本手法では,本表紙からテキストを自動的に抽出することで,余分なモダリティを付加する。
その結果、マルチモーダル・フレームワークは現在の最先端画像ベース・モデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-11-15T23:27:43Z) - Evaluating image matching methods for book cover identification [0.0]
書籍の表紙識別のための特徴検出とマッチング手法について検討する。
これにより、ライブラリはカバーブック図に基づいてインタラクティブなサービスを開発することができる。
テストは、各本のカバーイメージの異なる変換を考慮して実施されている。
論文 参考訳(メタデータ) (2020-01-15T09:52:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。