論文の概要: Exploring PCA-based feature representations of image pixels via CNN to enhance food image segmentation
- arxiv url: http://arxiv.org/abs/2411.01469v2
- Date: Tue, 05 Nov 2024 01:59:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 10:38:40.651104
- Title: Exploring PCA-based feature representations of image pixels via CNN to enhance food image segmentation
- Title(参考訳): 食品画像のセグメンテーションを強化するためにCNNを用いたPCAによる画像画素の特徴表現の探索
- Authors: Ying Dai,
- Abstract要約: 本稿では、畳み込みニューラルネットワーク(CNN)を用いて、PCAに基づく画像画素の特徴表現を探索し、セグメンテーションを強化する手法を提案する。
シルエットスコアに基づく内部クラスタリング指標を定義し,様々な画素レベルの特徴表現のクラスタリング品質を評価する。
提案手法は食材ラベル付きデータセットFoodSeg103で良好に動作し、平均mIoUスコアが0.5423である。
- 参考スコア(独自算出の注目度): 2.1756081703276
- License:
- Abstract: For open vocabulary recognition of ingredients in food images, segmenting the ingredients is a crucial step. This paper proposes a novel approach that explores PCA-based feature representations of image pixels using a convolutional neural network (CNN) to enhance segmentation. An internal clustering metric based on the silhouette score is defined to evaluate the clustering quality of various pixel-level feature representations generated by different feature maps derived from various CNN backbones. Using this metric, the paper explores optimal feature representation selection and suitable clustering methods for ingredient segmentation. Additionally, it is found that principal component (PC) maps derived from concatenations of backbone feature maps improve the clustering quality of pixel-level feature representations, resulting in stable segmentation outcomes. Notably, the number of selected eigenvalues can be used as the number of clusters to achieve good segmentation results. The proposed method performs well on the ingredient-labeled dataset FoodSeg103, achieving a mean Intersection over Union (mIoU) score of 0.5423. Importantly, the proposed method is unsupervised, and pixel-level feature representations from backbones are not fine-tuned on specific datasets. This demonstrates the flexibility, generalizability, and interpretability of the proposed method, while reducing the need for extensive labeled datasets.
- Abstract(参考訳): 食品画像中の成分のオープンな語彙認識には,成分の区分けが不可欠である。
本稿では、畳み込みニューラルネットワーク(CNN)を用いて、PCAに基づく画像画素の特徴表現を探索し、セグメンテーションを強化する手法を提案する。
シルエットスコアに基づく内部クラスタリングメトリックを定義し,様々なCNNバックボーンから生成された様々な特徴マップから生成される様々な画素レベルの特徴表現のクラスタリング品質を評価する。
本稿では, 材料セグメンテーションのための最適な特徴表現選択とクラスタリング手法について検討する。
さらに、バックボーン特徴写像の連結から導かれる主成分(PC)マップは、画素レベルの特徴表現のクラスタリング品質を改善し、安定したセグメンテーション結果をもたらすことがわかった。
特に、選択された固有値の個数をクラスタの個数として使用して、良好なセグメンテーション結果が得られる。
提案手法は食材ラベル付きデータセットFoodSeg103で良好に動作し、平均mIoUスコアが0.5423である。
重要なことは、提案手法は教師なしであり、バックボーンからの画素レベルの特徴表現は特定のデータセットで微調整されない。
これは、提案手法の柔軟性、一般化可能性、解釈可能性を示し、広範なラベル付きデータセットの必要性を低減させる。
関連論文リスト
- Semi-supervised segmentation of land cover images using nonlinear
canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。
本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。
提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文 参考訳(メタデータ) (2024-01-22T17:56:07Z) - Pixel-Level Clustering Network for Unsupervised Image Segmentation [3.69853388955692]
画像の領域分割のためのピクセルレベルのクラスタリングフレームワークを,地上の真理アノテーションを使わずに提案する。
また、各スーパーピクセル間の一貫性、隣接するスーパーピクセル間の相似性/相似性、画像間の構造的類似性を利用したトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-10-24T23:06:29Z) - Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training
of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。
提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。
実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T13:02:32Z) - Mining Contextual Information Beyond Image for Semantic Segmentation [37.783233906684444]
セマンティックイメージセグメンテーションにおける文脈集約問題について検討する。
個々の画像以外の文脈情報をマイニングして、ピクセル表現をさらに強化することを提案する。
提案手法は,既存のセグメンテーションフレームワークに強制的に組み込むことができる。
論文 参考訳(メタデータ) (2021-08-26T14:34:23Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Visual Object Tracking by Segmentation with Graph Convolutional Network [7.729569666460712]
グラフ畳み込みネットワーク(GCN)モデルを用いて,スーパーピクセルベースのオブジェクトトラッキングを提案する。
提案モデルは,i)ラベル線形予測とi)各スーパーピクセルの構造認識特徴情報を統合した,汎用的なエンドツーエンドフレームワークを提供する。
論文 参考訳(メタデータ) (2020-09-05T12:43:21Z) - Weakly-Supervised Semantic Segmentation via Sub-category Exploration [73.03956876752868]
我々は、オブジェクトの他の部分に注意を払うために、ネットワークを強制する単純で効果的なアプローチを提案する。
具体的には、画像の特徴をクラスタリングして、アノテーション付き親クラスごとに擬似サブカテゴリラベルを生成する。
提案手法の有効性を検証し,提案手法が最先端手法に対して良好に機能することを示す。
論文 参考訳(メタデータ) (2020-08-03T20:48:31Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z) - Building Networks for Image Segmentation using Particle Competition and
Cooperation [0.0]
粒子競合と協調 (PCC) はグラフに基づく半教師あり学習手法である。
PCCを供給するための適切なネットワークの構築は、より良いセグメンテーション結果を達成するために不可欠である。
候補ネットワークを評価する指標を提案する。
論文 参考訳(メタデータ) (2020-02-14T12:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。