論文の概要: Towards Automated Recipe Genre Classification using Semi-Supervised
Learning
- arxiv url: http://arxiv.org/abs/2310.15693v1
- Date: Tue, 24 Oct 2023 10:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:20:27.185875
- Title: Towards Automated Recipe Genre Classification using Semi-Supervised
Learning
- Title(参考訳): 半教師付き学習によるレシピジャンルの自動分類
- Authors: Nazmus Sakib, G. M. Shahariar, Md. Mohsinul Kabir, Md. Kamrul Hasan
and Hasan Mahmud
- Abstract要約: Assorted, Archetypal, and Annotated 200 Million Extended (3A2M+ Cooking Recipe dataset")というデータセットを提示する。
このデータには、タイトル、NER、方向、拡張NERなどの様々な特徴と、パン屋、飲み物、非野菜、野菜、ファーストフード、穀物、食事、側面、融合などのジャンルを表す9つの異なるラベルが含まれている。
従来の機械学習、ディープラーニング、事前訓練された言語モデルを用いてレシピをそれぞれのジャンルに分類し、全体的な精度は98.6%に達した。
- 参考スコア(独自算出の注目度): 4.177122099296939
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Sharing cooking recipes is a great way to exchange culinary ideas and provide
instructions for food preparation. However, categorizing raw recipes found
online into appropriate food genres can be challenging due to a lack of
adequate labeled data. In this study, we present a dataset named the
``Assorted, Archetypal, and Annotated Two Million Extended (3A2M+) Cooking
Recipe Dataset" that contains two million culinary recipes labeled in
respective categories with extended named entities extracted from recipe
descriptions. This collection of data includes various features such as title,
NER, directions, and extended NER, as well as nine different labels
representing genres including bakery, drinks, non-veg, vegetables, fast food,
cereals, meals, sides, and fusions. The proposed pipeline named 3A2M+ extends
the size of the Named Entity Recognition (NER) list to address missing named
entities like heat, time or process from the recipe directions using two NER
extraction tools. 3A2M+ dataset provides a comprehensive solution to the
various challenging recipe-related tasks, including classification, named
entity recognition, and recipe generation. Furthermore, we have demonstrated
traditional machine learning, deep learning and pre-trained language models to
classify the recipes into their corresponding genre and achieved an overall
accuracy of 98.6\%. Our investigation indicates that the title feature played a
more significant role in classifying the genre.
- Abstract(参考訳): 料理のレシピを共有することは、料理のアイデアを交換し、料理の準備の指示を与えるのに最適な方法である。
しかし、適切なラベル付きデータがないため、オンラインの生レシピを適切な食品ジャンルに分類することは困難である。
本研究では,それぞれのカテゴリにラベル付けされた200万の料理レシピを含む「Assorted, Archetypal, and Annotated Two Million Extended (3A2M+) Cooking Recipe Dataset」というデータセットを提案する。
このデータには、タイトル、NER、方向、拡張NERなどの様々な特徴と、パン屋、飲み物、非野菜、野菜、ファーストフード、穀物、食事、側面、融合などのジャンルを表す9つの異なるラベルが含まれている。
提案されたパイプラインである3A2M+は、名前付きエンティティ認識(NER)リストのサイズを拡張して、2つのNER抽出ツールを使用してレシピの方向から、熱、時間、プロセスなどの名前のないエンティティに対処する。
3A2M+データセットは、分類、名前付きエンティティ認識、レシピ生成など、さまざまな困難なレシピ関連タスクに対する包括的なソリューションを提供する。
さらに、従来の機械学習、ディープラーニング、事前学習言語モデルを用いてレシピをそれぞれのジャンルに分類し、全体の精度98.6\%を達成した。
我々の調査は、タイトル機能はジャンルの分類においてより重要な役割を担ったことを示している。
関連論文リスト
- Enhancing Personalized Recipe Recommendation Through Multi-Class Classification [0.0]
問題領域にはレシピレコメンデーションが含まれており、関連分析や分類といった手法を利用している。
この論文は、レシピを推薦するだけでなく、正確でパーソナライズされたレコメンデーションを達成するためのプロセスを探究する。
論文 参考訳(メタデータ) (2024-09-16T13:21:09Z) - Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning [2.40907745415345]
それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
論文 参考訳(メタデータ) (2023-03-27T07:53:18Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - Cross-lingual Adaptation for Recipe Retrieval with Mixup [56.79360103639741]
近年,大規模なペアリングデータの提供により,クロスモーダルなレシピ検索が研究の注目を集めている。
本稿では,ソース領域とターゲット領域のレシピが異なる言語で作成される画像からレシピ検索のための教師なし領域適応について検討する。
2つの領域間の移動可能な埋め込み特徴を学習するために,新しいレシピ・ミックスアップ法を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:04:39Z) - A Rich Recipe Representation as Plan to Support Expressive Multi Modal
Queries on Recipe Content and Preparation Process [24.94173789568803]
機械理解可能なリッチレシピ表現(R3)の構築について論じる。
R3には、アレルゲンに関する情報や成分のイメージなどの追加の知識が注がれている。
また,レシピ検索ツールであるTREATをR3を用いて,レシピの内容に対するマルチモーダル推論を行う。
論文 参考訳(メタデータ) (2022-03-31T15:29:38Z) - A Large-Scale Benchmark for Food Image Segmentation [62.28029856051079]
我々は9,490枚の画像を含む新しい食品画像データセットFoodSeg103(およびその拡張FoodSeg154)を構築します。
これらの画像に154種類の成分を付加し,各画像は平均6つの成分ラベルと画素単位のマスクを有する。
ReLeMと呼ばれるマルチモダリティプリトレーニングアプローチを提案し、豊富なセマンティックな食品知識を持つセグメンテーションモデルを明確に装備します。
論文 参考訳(メタデータ) (2021-05-12T03:00:07Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - A Recipe for Creating Multimodal Aligned Datasets for Sequential Tasks [48.39191088844315]
調理領域では、ウェブは、同じ料理を作る方法を記述したテキストとビデオのレシピを多数提供している。
我々は、同じ料理の異なるレシピの指示間のペアワイズアライメントを学習する教師なしアライメントアルゴリズムを使用する。
次に、グラフアルゴリズムを用いて、同じ料理のための複数のテキストと複数のビデオレシピの協調的なアライメントを導出する。
論文 参考訳(メタデータ) (2020-05-19T17:27:00Z) - Classification of Cuisines from Sequentially Structured Recipes [8.696042114987966]
料理の特徴に基づく料理の分類は 際立った問題です。
我々は、RecipeDBデータセット上のこれらの情報を考慮し、様々な分類手法を実装した。
最先端のRoBERTaモデルは、様々な分類モデルの中で73.30%の精度を示した。
論文 参考訳(メタデータ) (2020-04-26T05:40:36Z) - A Named Entity Based Approach to Model Recipes [9.18959130745234]
本稿では,この一様構造におけるレシピの最良の表現を推論するパイプラインだけでなく,レシピを正確に表現できる構造を提案する。
レシピのingredientsセクションは通常、必要な材料と、量、温度、処理状態などの対応する属性をリストアップする。
指示部は、これらの器具や具材に調理技術や工程を適用する一連の事象を列挙する。
論文 参考訳(メタデータ) (2020-04-25T16:37:26Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。