論文の概要: Masked Contrastive Graph Representation Learning for Age Estimation
- arxiv url: http://arxiv.org/abs/2306.17798v1
- Date: Fri, 16 Jun 2023 15:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-09 14:01:02.144677
- Title: Masked Contrastive Graph Representation Learning for Age Estimation
- Title(参考訳): 年齢推定のためのマスキングコントラストグラフ表現学習
- Authors: Yuntao Shou, Xiangyong Cao, Deyu Meng
- Abstract要約: 本稿では,画像冗長性情報を扱う上で,グラフ表現学習の特性を利用する。
年齢推定のためのMasked Contrastive Graph Representation Learning (MCGRL)法を提案する。
実世界の顔画像データセットに対する実験結果から,提案手法が他の最先端の年齢推定手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 44.96502862249276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Age estimation of face images is a crucial task with various practical
applications in areas such as video surveillance and Internet access control.
While deep learning-based age estimation frameworks, e.g., convolutional neural
network (CNN), multi-layer perceptrons (MLP), and transformers have shown
remarkable performance, they have limitations when modelling complex or
irregular objects in an image that contains a large amount of redundant
information. To address this issue, this paper utilizes the robustness property
of graph representation learning in dealing with image redundancy information
and proposes a novel Masked Contrastive Graph Representation Learning (MCGRL)
method for age estimation. Specifically, our approach first leverages CNN to
extract semantic features of the image, which are then partitioned into patches
that serve as nodes in the graph. Then, we use a masked graph convolutional
network (GCN) to derive image-based node representations that capture rich
structural information. Finally, we incorporate multiple losses to explore the
complementary relationship between structural information and semantic
features, which improves the feature representation capability of GCN.
Experimental results on real-world face image datasets demonstrate the
superiority of our proposed method over other state-of-the-art age estimation
approaches.
- Abstract(参考訳): 顔画像の年齢推定は,映像監視やインターネットアクセス制御など,様々な応用分野において重要な課題である。
深層学習に基づく年齢推定フレームワーク、例えば畳み込みニューラルネットワーク(CNN)、多層パーセプトロン(MLP)、トランスフォーマーは顕著な性能を示しているが、大量の冗長情報を含む画像において複雑なオブジェクトや不規則なオブジェクトをモデル化する際に制限がある。
本稿では,画像冗長性情報を扱う際のグラフ表現学習の堅牢性を活用し,年齢推定のための新しいMasked Contrastive Graph Representation Learning(MCGRL)法を提案する。
具体的には、まずcnnを利用して画像の意味的特徴を抽出し、次にグラフのノードとして機能するパッチに分割する。
次に、マスク付きグラフ畳み込みネットワーク(GCN)を用いて、リッチな構造情報を取得する画像ベースのノード表現を導出する。
最後に,構造情報と意味的特徴の相補的関係を探索するために,複数の損失を組み込むことにより,gcnの特徴表現能力を向上させる。
実世界の顔画像データセットの実験結果から,提案手法が他の最先端の年齢推定手法よりも優れていることを示す。
関連論文リスト
- A Multi-view Mask Contrastive Learning Graph Convolutional Neural Network for Age Estimation [13.197551708300345]
本稿では,年齢推定のためのマルチビューマスクコントラスト学習グラフ畳み込みニューラルネットワーク(MMCL-GCN)を提案する。
MMCL-GCNネットワークの全体構造は特徴抽出段階と年齢推定段階を含む。
MMCL-GCNは,ベンチマークデータセットの年齢推定誤差を効果的に低減できることを示す。
論文 参考訳(メタデータ) (2024-07-23T07:17:46Z) - Two Stream Scene Understanding on Graph Embedding [4.78180589767256]
本稿では,コンピュータビジョンにおけるシーン理解の促進を目的とした,新しい2ストリームネットワークアーキテクチャを提案する。
グラフ特徴ストリームネットワークは、セグメンテーション構造、シーングラフ生成、およびグラフ表現モジュールを含む。
ADE20Kデータセットで行った実験は、画像分類精度を向上させるために提案した2ストリームネットワークの有効性を示した。
論文 参考訳(メタデータ) (2023-11-12T05:57:56Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Unsupervised Image Semantic Segmentation through Superpixels and Graph
Neural Networks [6.123324869194195]
ラベル付きデータが不足している多くの実世界のシナリオでは、教師なしのイメージセグメンテーションが重要なタスクである。
本稿では,相互情報最大化(MIM),ニューラルスーパーピクセル,グラフニューラルネットワーク(GNN)をエンドツーエンドに組み合わせて,教師なし学習の最近の進歩を活用する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-10-21T08:35:18Z) - SR-GNN: Spatial Relation-aware Graph Neural Network for Fine-Grained
Image Categorization [24.286426387100423]
本稿では,最も関連性の高い画像領域からコンテキスト認識機能を集約することで,微妙な変化を捉える手法を提案する。
我々のアプローチは、近年の自己注意とグラフニューラルネットワーク(GNN)の発展にインスパイアされている。
これは、認識精度のかなりの差で最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2022-09-05T19:43:15Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - VisGraphNet: a complex network interpretation of convolutional neural
features [6.50413414010073]
ニューラルネットワークの特徴マップをモデル化するための可視性グラフの提案と検討を行う。
この研究は、元のデータよりもこれらのグラフによって提供される別の視点によって動機付けられている。
論文 参考訳(メタデータ) (2021-08-27T20:21:04Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。