論文の概要: Decomposing Generation Networks with Structure Prediction for Recipe
Generation
- arxiv url: http://arxiv.org/abs/2007.13374v2
- Date: Wed, 16 Feb 2022 07:03:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 08:36:34.358671
- Title: Decomposing Generation Networks with Structure Prediction for Recipe
Generation
- Title(参考訳): レシピ生成のための構造予測による生成ネットワークの分解
- Authors: Hao Wang, Guosheng Lin, Steven C. H. Hoi, Chunyan Miao
- Abstract要約: 本稿では,構造予測を伴うDGN(Decomposing Generation Networks)を提案する。
具体的には,調理指導を複数のフェーズに分割し,各フェーズに異なるサブジェネレータを割り当てる。
提案手法は, (i) 大域的構造予測成分を用いてレシピ構造を学習し, (ii) 予測された構造に基づいてサブジェネレータ出力成分でレシピ相を生成するという2つの新しいアイデアを含む。
- 参考スコア(独自算出の注目度): 142.047662926209
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recipe generation from food images and ingredients is a challenging task,
which requires the interpretation of the information from another modality.
Different from the image captioning task, where the captions usually have one
sentence, cooking instructions contain multiple sentences and have obvious
structures. To help the model capture the recipe structure and avoid missing
some cooking details, we propose a novel framework: Decomposing Generation
Networks (DGN) with structure prediction, to get more structured and complete
recipe generation outputs. Specifically, we split each cooking instruction into
several phases, and assign different sub-generators to each phase. Our approach
includes two novel ideas: (i) learning the recipe structures with the global
structure prediction component and (ii) producing recipe phases in the
sub-generator output component based on the predicted structure. Extensive
experiments on the challenging large-scale Recipe1M dataset validate the
effectiveness of our proposed model, which improves the performance over the
state-of-the-art results.
- Abstract(参考訳): 料理のイメージや食材からのレシピ生成は難しい課題であり、他のモダリティからの情報の解釈を必要とする。
画像キャプションタスクと異なり、キャプションは通常1つの文を含むが、料理の指示には複数の文が含まれ、明らかな構造を持つ。
モデルがレシピ構造を捉え、料理の詳細を欠くのを避けるために、構造予測を伴う生成ネットワーク(dgn)を分解し、より構造化され完全なレシピ生成アウトプットを得るという、新しい枠組みを提案する。
具体的には,各調理指導を複数の段階に分け,各段階に異なるサブジェネレータを割り当てる。
私たちのアプローチには2つの新しいアイデアがあります
(i)グローバル構造予測要素を用いてレシピ構造を学ぶこと、及び
(ii)予測した構造に基づいてサブジェネレータ出力成分のレシピフェーズを生成する。
大規模レシピ1mデータセットに対する広範囲な実験により,提案モデルの有効性が検証された。
関連論文リスト
- Retrieval Augmented Recipe Generation [96.43285670458803]
本稿では,レシピ生成のための拡張型大規模マルチモーダルモデルを提案する。
既存のデータストアからサプリメントとして、イメージにセマンティックに関連付けられたレシピを検索する。
生成したレシピ候補間の一貫性を計算し、異なる検索レシピを生成のコンテキストとして使用する。
論文 参考訳(メタデータ) (2024-11-13T15:58:50Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - Learning Structural Representations for Recipe Generation and Food
Retrieval [101.97397967958722]
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
提案モデルは高品質でコヒーレントなレシピを作成でき、ベンチマークRecipe1Mデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-10-04T06:36:31Z) - Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers
and Self-supervised Learning [17.42688184238741]
近年, 生活における食品の重要性から, クロスモーダルなレシピ検索が注目されている。
本稿では,テキストおよび画像のエンコーダの確立と高性能化に基づく,簡易なエンド・ツー・エンドモデルを提案する。
提案手法は,Recipe1Mデータセットのクロスモーダルレシピ検索タスクにおける最新性能を実現する。
論文 参考訳(メタデータ) (2021-03-24T10:17:09Z) - CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval [20.292467149387594]
本稿では,食品画像検索と検索タスクにおける画像とテキストの潜伏表現を協調的にモデル化する,新たなクロスモーダル学習フレームワークを提案する。
本研究では,効率的な木構造長短期記憶を計算クロスモーダル検索フレームワークのテキストエンコーダとして利用することにより,レシピ記述の主成分や調理動作を明示的な監督なしに識別できることを実証した。
論文 参考訳(メタデータ) (2021-02-04T11:24:34Z) - Structure-Aware Generation Network for Recipe Generation from Images [142.047662926209]
食品画像と材料のみに基づいて調理指導を行うオープン・リサーチ・タスクについて検討する。
ターゲットレシピは長い段落であり、構造情報に関する注釈を持たない。
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-02T10:54:25Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。