論文の概要: Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning
- arxiv url: http://arxiv.org/abs/2303.16778v1
- Date: Mon, 27 Mar 2023 07:53:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-30 14:12:48.782386
- Title: Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning
- Title(参考訳): アクティブラーニングに基づくアソート・アルチェト・アノテート200万(3A2M)調理レシピデータセット
- Authors: Nazmus Sakib, G. M. Shahariar, Md. Mohsinul Kabir, Md. Kamrul Hasan
and Hasan Mahmud
- Abstract要約: それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
- 参考スコア(独自算出の注目度): 2.40907745415345
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cooking recipes allow individuals to exchange culinary ideas and provide food
preparation instructions. Due to a lack of adequate labeled data, categorizing
raw recipes found online to the appropriate food genres is a challenging task
in this domain. Utilizing the knowledge of domain experts to categorize recipes
could be a solution. In this study, we present a novel dataset of two million
culinary recipes labeled in respective categories leveraging the knowledge of
food experts and an active learning technique. To construct the dataset, we
collect the recipes from the RecipeNLG dataset. Then, we employ three human
experts whose trustworthiness score is higher than 86.667% to categorize 300K
recipe by their Named Entity Recognition (NER) and assign it to one of the nine
categories: bakery, drinks, non-veg, vegetables, fast food, cereals, meals,
sides and fusion. Finally, we categorize the remaining 1900K recipes using
Active Learning method with a blend of Query-by-Committee and Human In The Loop
(HITL) approaches. There are more than two million recipes in our dataset, each
of which is categorized and has a confidence score linked with it. For the 9
genres, the Fleiss Kappa score of this massive dataset is roughly 0.56026. We
believe that the research community can use this dataset to perform various
machine learning tasks such as recipe genre classification, recipe generation
of a specific genre, new recipe creation, etc. The dataset can also be used to
train and evaluate the performance of various NLP tasks such as named entity
recognition, part-of-speech tagging, semantic role labeling, and so on. The
dataset will be available upon publication: https://tinyurl.com/3zu4778y.
- Abstract(参考訳): 料理のレシピでは、料理のアイデアを交換し、調理の指示を与えることができる。
適切なラベル付きデータがないため、オンラインの生レシピを適切な食品ジャンルに分類することは、この領域では難しい課題である。
ドメインエキスパートの知識を使ってレシピを分類することは解決策になり得る。
本研究では,食品専門家の知識と積極的学習技術を活用した,各カテゴリーにラベル付けされた200万種類の料理レシピのデータセットを提案する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
次に、信頼度スコアが86.667%を超える3人の人間専門家を雇い、名前付きエンティティ認識(ner)によって300kレシピを分類し、パン屋、飲み物、ノンベグ、野菜、ファストフード、シリアル、食事、サイド、融合の9つのカテゴリの1つに割り当てる。
最後に,Human In The Loop (HITL) とQuery-by-Committeeを混合したActive Learning法を用いて,残りの1900Kレシピを分類した。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
9つのジャンルにおいて、この膨大なデータセットのFleiss Kappaスコアは約0.56026である。
我々は,このデータセットを用いて,レシピジャンル分類,特定のジャンルのレシピ生成,新しいレシピ作成など,さまざまな機械学習タスクを実行できると考えている。
このデータセットは、名前付きエンティティ認識、part-of-speech tagging、セマンティックロールラベリングなど、さまざまなnlpタスクのパフォーマンスをトレーニングおよび評価するためにも使用できる。
データセットは、https://tinyurl.com/3zu4778y.comで公開される。
関連論文リスト
- Towards Automated Recipe Genre Classification using Semi-Supervised
Learning [4.177122099296939]
Assorted, Archetypal, and Annotated 200 Million Extended (3A2M+ Cooking Recipe dataset")というデータセットを提示する。
このデータには、タイトル、NER、方向、拡張NERなどの様々な特徴と、パン屋、飲み物、非野菜、野菜、ファーストフード、穀物、食事、側面、融合などのジャンルを表す9つの異なるラベルが含まれている。
従来の機械学習、ディープラーニング、事前訓練された言語モデルを用いてレシピをそれぞれのジャンルに分類し、全体的な精度は98.6%に達した。
論文 参考訳(メタデータ) (2023-10-24T10:03:27Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - Cross-lingual Adaptation for Recipe Retrieval with Mixup [56.79360103639741]
近年,大規模なペアリングデータの提供により,クロスモーダルなレシピ検索が研究の注目を集めている。
本稿では,ソース領域とターゲット領域のレシピが異なる言語で作成される画像からレシピ検索のための教師なし領域適応について検討する。
2つの領域間の移動可能な埋め込み特徴を学習するために,新しいレシピ・ミックスアップ法を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:04:39Z) - TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark [1.0569625612398386]
NERモデルは、レシピの処理に役立つ様々なタイプのエンティティを発見または推測することが期待されている。
データセットは700のレシピで構成され、13,000以上のエンティティを抽出する。
私たちは、名前付きエンティティ認識モデルの最先端のベースラインをいくつか提供しています。
論文 参考訳(メタデータ) (2022-04-16T10:52:21Z) - Food Recipe Recommendation Based on Ingredients Detection Using Deep
Learning [0.0]
美味しい料理のレシピを作るために、どの材料を混ぜるかを知ることが不可欠である。
食品成分認識モデルを実装し,認識された成分に基づいてレシピを推薦するアルゴリズムを設計した。
精度は94%に達しました。
論文 参考訳(メタデータ) (2022-03-13T17:42:38Z) - A Large-Scale Benchmark for Food Image Segmentation [62.28029856051079]
我々は9,490枚の画像を含む新しい食品画像データセットFoodSeg103(およびその拡張FoodSeg154)を構築します。
これらの画像に154種類の成分を付加し,各画像は平均6つの成分ラベルと画素単位のマスクを有する。
ReLeMと呼ばれるマルチモダリティプリトレーニングアプローチを提案し、豊富なセマンティックな食品知識を持つセグメンテーションモデルを明確に装備します。
論文 参考訳(メタデータ) (2021-05-12T03:00:07Z) - Structure-Aware Generation Network for Recipe Generation from Images [142.047662926209]
食品画像と材料のみに基づいて調理指導を行うオープン・リサーチ・タスクについて検討する。
ターゲットレシピは長い段落であり、構造情報に関する注釈を持たない。
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-02T10:54:25Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - Classification of Cuisines from Sequentially Structured Recipes [8.696042114987966]
料理の特徴に基づく料理の分類は 際立った問題です。
我々は、RecipeDBデータセット上のこれらの情報を考慮し、様々な分類手法を実装した。
最先端のRoBERTaモデルは、様々な分類モデルの中で73.30%の精度を示した。
論文 参考訳(メタデータ) (2020-04-26T05:40:36Z) - A Named Entity Based Approach to Model Recipes [9.18959130745234]
本稿では,この一様構造におけるレシピの最良の表現を推論するパイプラインだけでなく,レシピを正確に表現できる構造を提案する。
レシピのingredientsセクションは通常、必要な材料と、量、温度、処理状態などの対応する属性をリストアップする。
指示部は、これらの器具や具材に調理技術や工程を適用する一連の事象を列挙する。
論文 参考訳(メタデータ) (2020-04-25T16:37:26Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。