論文の概要: Mining Discriminative Food Regions for Accurate Food Recognition
- arxiv url: http://arxiv.org/abs/2207.03692v1
- Date: Fri, 8 Jul 2022 05:09:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-11 13:37:41.317907
- Title: Mining Discriminative Food Regions for Accurate Food Recognition
- Title(参考訳): 正確な食品認識のためのマイニング判別食品領域
- Authors: Jianing Qiu, Frank P.-W. Lo, Yingnan Sun, Siyao Wang, Benny Lo
- Abstract要約: 本稿では,入力画像の分類の精度を一次ネットワークが維持する新しいネットワークアーキテクチャを提案する。
補助ネットワークは、識別食品地域を敵対的にマイニングし、地域ネットワークは、その結果のマイニング地域を分類する。
提案アーキテクチャは、PAR-Netと表現され、エンドツーエンドのトレーニングが可能で、オンライン方式で識別領域をハイライトする。
- 参考スコア(独自算出の注目度): 16.78437844398436
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automatic food recognition is the very first step towards passive dietary
monitoring. In this paper, we address the problem of food recognition by mining
discriminative food regions. Taking inspiration from Adversarial Erasing, a
strategy that progressively discovers discriminative object regions for weakly
supervised semantic segmentation, we propose a novel network architecture in
which a primary network maintains the base accuracy of classifying an input
image, an auxiliary network adversarially mines discriminative food regions,
and a region network classifies the resulting mined regions. The global (the
original input image) and the local (the mined regions) representations are
then integrated for the final prediction. The proposed architecture denoted as
PAR-Net is end-to-end trainable, and highlights discriminative regions in an
online fashion. In addition, we introduce a new fine-grained food dataset named
as Sushi-50, which consists of 50 different sushi categories. Extensive
experiments have been conducted to evaluate the proposed approach. On three
food datasets chosen (Food-101, Vireo-172, and Sushi-50), our approach performs
consistently and achieves state-of-the-art results (top-1 testing accuracy of
$90.4\%$, $90.2\%$, $92.0\%$, respectively) compared with other existing
approaches. Dataset and code are available at
https://github.com/Jianing-Qiu/PARNet
- Abstract(参考訳): 自動食品認識は受動的食事監視への第一歩である。
本稿では,判別的食品産地のマイニングによる食品認識の問題に対処する。
弱教師付きセマンティックセグメンテーションのための識別対象領域を段階的に発見する戦略であるAdversarial Erasing からインスピレーションを得て,プライマリネットワークが入力画像の分類精度を維持し,補助ネットワークが識別対象食品領域を敵対的にマイニングし,リージョンネットワークが結果のマイニング領域を分類する,新たなネットワークアーキテクチャを提案する。
グローバル(元の入力画像)とローカル(採掘された領域)の表現は最終予測のために統合される。
提案アーキテクチャは、PAR-Netと表現され、エンドツーエンドのトレーニングが可能であり、オンライン方式で識別領域を強調する。
また,50種類の寿司カテゴリからなる,sushi-50と呼ばれる新しい細粒食品データセットも紹介する。
提案手法を評価するための広範な実験が行われている。
選択した3つの食品データセット(food-101, vireo-172, sushi-50)では,既存のアプローチと比較して,最先端の成果(トップ1テスト精度90.4\%$,90.2\%$,92.0\%$,92.0\%$)を達成している。
データセットとコードはhttps://github.com/Jianing-Qiu/PARNetで入手できる。
関連論文リスト
- RAFA-Net: Region Attention Network For Food Items And Agricultural Stress Recognition [18.77864122988639]
本研究では、入力画像内の異なる領域間の相関関係を構築することにより、長距離依存をモデル化する領域アテンションスキームを提案する。
提案する食品の地域意識ネットワークとRAFA-Netと呼ばれる農業ストレス認識手法は,3つの食品データセットを用いて実験されている。
RAFA-Netの上位1つのアキュラシーは、それぞれUECFood-100、UECFood-256、MAFood-121データセットで91.69%、91.56%、96.97%である。
論文 参考訳(メタデータ) (2024-10-16T16:28:08Z) - Spatial Entity Resolution between Restaurant Locations and
Transportation Destinations in Southeast Asia [0.054390204258189995]
本稿では,POI(Points-of-Interest)とGrabFood(GrabFood)のデータベースから同一の場所エンティティを認識することを試みる。
POI-restaurant Matchはシンガポール、フィリピン、インドネシア、マレーシアで別々に実施された。
実験により、これらの国のレストランの35%以上で、一致するPOIが見つかることが示されている。
論文 参考訳(メタデータ) (2024-01-16T17:59:54Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - Food Ingredients Recognition through Multi-label Learning [0.0]
ダイエット自動評価システムにおいて, 食材中のさまざまな食材を識別する能力は重要な決定要因である。
我々は,料理画像中の任意の成分を検出するために,深層多ラベル学習アプローチを採用し,最先端のニューラルネットワークを評価した。
論文 参考訳(メタデータ) (2022-10-24T10:18:26Z) - Cross-lingual Adaptation for Recipe Retrieval with Mixup [56.79360103639741]
近年,大規模なペアリングデータの提供により,クロスモーダルなレシピ検索が研究の注目を集めている。
本稿では,ソース領域とターゲット領域のレシピが異なる言語で作成される画像からレシピ検索のための教師なし領域適応について検討する。
2つの領域間の移動可能な埋め込み特徴を学習するために,新しいレシピ・ミックスアップ法を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:04:39Z) - FoodLogoDet-1500: A Dataset for Large-Scale Food Logo Detection via
Multi-Scale Feature Decoupling Network [55.49022825759331]
高度な食品ロゴ検出アルゴリズムを開発するには、大規模な食品ロゴデータセットが緊急に必要である。
FoodLogoDet-1500は、1500のカテゴリ、約10万の画像、約15万個の手動で注釈付けされた食品ロゴオブジェクトを備えた、新しい大規模一般公開の食品ロゴデータセットである。
食品のロゴを識別する手法として,MFDNet(Multi-scale Feature Decoupling Network)を提案する。
論文 参考訳(メタデータ) (2021-08-10T12:47:04Z) - Visual Aware Hierarchy Based Food Recognition [10.194167945992938]
本稿では,コンボリューショナルニューラルネットワーク(CNN)をバックボーンアーキテクチャとして用いた2段階の食品認識システムを提案する。
食品ローカライゼーションのステップは、食品領域を識別するFaster R-CNN法の実装に基づいている。
食品分類工程では、視覚的に類似した食品カテゴリーを自動的にまとめて階層構造を生成することができる。
論文 参考訳(メタデータ) (2020-12-06T20:25:31Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。