論文の概要: TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark
- arxiv url: http://arxiv.org/abs/2204.07775v1
- Date: Sat, 16 Apr 2022 10:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 12:38:01.897959
- Title: TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark
- Title(参考訳): TASTEset -- レシピデータセットと食品エンティティ認識ベンチマーク
- Authors: Ania Wr\'oblewska, Agnieszka Kaliska, Maciej Paw{\l}owski, Dawid
Wi\'sniewski, Witold Sosnowski, Agnieszka {\L}awrynowicz
- Abstract要約: NERモデルは、レシピの処理に役立つ様々なタイプのエンティティを発見または推測することが期待されている。
データセットは700のレシピで構成され、13,000以上のエンティティを抽出する。
私たちは、名前付きエンティティ認識モデルの最先端のベースラインをいくつか提供しています。
- 参考スコア(独自算出の注目度): 1.0569625612398386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food Computing is currently a fast-growing field of research. Natural
language processing (NLP) is also increasingly essential in this field,
especially for recognising food entities. However, there are still only a few
well-defined tasks that serve as benchmarks for solutions in this area. We
introduce a new dataset -- called \textit{TASTEset} -- to bridge this gap. In
this dataset, Named Entity Recognition (NER) models are expected to find or
infer various types of entities helpful in processing recipes, e.g.~food
products, quantities and their units, names of cooking processes, physical
quality of ingredients, their purpose, taste.
The dataset consists of 700 recipes with more than 13,000 entities to
extract. We provide a few state-of-the-art baselines of named entity
recognition models, which show that our dataset poses a solid challenge to
existing models. The best model achieved, on average, 0.95 $F_1$ score,
depending on the entity type -- from 0.781 to 0.982. We share the dataset and
the task to encourage progress on more in-depth and complex information
extraction from recipes.
- Abstract(参考訳): フードコンピューティングは現在急速に成長している研究分野である。
自然言語処理(NLP)もこの分野において特に食品の認識に不可欠である。
しかし、この分野のソリューションのベンチマークとして機能するタスクは、まだごくわずかである。
このギャップを埋めるために、新しいデータセット --textit{TASTEset} を導入しました。
このデータセットでは、名前付きエンティティ認識(ner)モデルは、料理製品、量とその単位、調理プロセスの名前、食材の物理的品質、目的、味など、レシピの処理に有用な様々なエンティティを発見または推測することが期待される。
データセットは700のレシピで構成され、13,000以上のエンティティを抽出する。
私たちは、名前付きエンティティ認識モデルの最先端のベースラインをいくつか提供しています。
最高のモデルは平均0.95ドルF_1$スコアで、エンティティタイプによって-0.781から0.982まで。
レシピからのより深く複雑な情報抽出の進捗を促すために、データセットとタスクを共有します。
関連論文リスト
- RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.43285670458803]
Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-17T16:49:34Z) - Deep Learning Based Named Entity Recognition Models for Recipes [7.507956305171027]
名前付きエンティティ認識(NER)は、構造化されていない、または半構造化されていないデータから既知のラベルで情報を抽出する技術である。
私たちは26,445のフレーズを累積してデータセットを作成しました。
金本位レシピデータレポジトリRecipeDBの成分句を分析し,Stanford NERを用いて注釈した。
深層学習に基づく言語モデルの統計的、微調整を含むこれらのデータセットに対するNERアプローチの徹底的な調査は、深い洞察を与える。
論文 参考訳(メタデータ) (2024-02-27T12:03:56Z) - FoodLMM: A Versatile Food Assistant using Large Multi-modal Model [96.76271649854542]
大規模マルチモーダルモデル(LMM)は多くの視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,多機能なLMMに基づく多目的食品アシスタントであるFoodLMMを提案する。
本稿では,食品の栄養価と複数のセグメンテーションマスクを予測するために,一連の新しいタスク固有のトークンとヘッドを導入する。
論文 参考訳(メタデータ) (2023-12-22T11:56:22Z) - Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning [2.40907745415345]
それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
論文 参考訳(メタデータ) (2023-03-27T07:53:18Z) - Structured Vision-Language Pretraining for Computational Cooking [54.0571416522547]
Vision-Language PretrainingとFoundationモデルは、一般的なベンチマークでSoTAのパフォーマンスを達成するためのゴーツーレシピです。
本稿では,これらの手法を構造化テキストベースの計算料理タスクに活用することを提案する。
論文 参考訳(メタデータ) (2022-12-08T13:37:17Z) - Attention-based Ingredient Phrase Parser [3.499870393443268]
そこで本研究では,レシピの成分句を構造体にパースし,その属性を0.93F1スコア以上で解析できる新しい成分解析モデルを提案する。
実験の結果,AllRecipesとFood.comのデータセット上での最先端のパフォーマンスが得られた。
論文 参考訳(メタデータ) (2022-10-05T20:09:35Z) - Learning Structural Representations for Recipe Generation and Food
Retrieval [101.97397967958722]
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
提案モデルは高品質でコヒーレントなレシピを作成でき、ベンチマークRecipe1Mデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-10-04T06:36:31Z) - A Large-Scale Benchmark for Food Image Segmentation [62.28029856051079]
我々は9,490枚の画像を含む新しい食品画像データセットFoodSeg103(およびその拡張FoodSeg154)を構築します。
これらの画像に154種類の成分を付加し,各画像は平均6つの成分ラベルと画素単位のマスクを有する。
ReLeMと呼ばれるマルチモダリティプリトレーニングアプローチを提案し、豊富なセマンティックな食品知識を持つセグメンテーションモデルを明確に装備します。
論文 参考訳(メタデータ) (2021-05-12T03:00:07Z) - CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval [20.292467149387594]
本稿では,食品画像検索と検索タスクにおける画像とテキストの潜伏表現を協調的にモデル化する,新たなクロスモーダル学習フレームワークを提案する。
本研究では,効率的な木構造長短期記憶を計算クロスモーダル検索フレームワークのテキストエンコーダとして利用することにより,レシピ記述の主成分や調理動作を明示的な監督なしに識別できることを実証した。
論文 参考訳(メタデータ) (2021-02-04T11:24:34Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z) - A Named Entity Based Approach to Model Recipes [9.18959130745234]
本稿では,この一様構造におけるレシピの最良の表現を推論するパイプラインだけでなく,レシピを正確に表現できる構造を提案する。
レシピのingredientsセクションは通常、必要な材料と、量、温度、処理状態などの対応する属性をリストアップする。
指示部は、これらの器具や具材に調理技術や工程を適用する一連の事象を列挙する。
論文 参考訳(メタデータ) (2020-04-25T16:37:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。