論文の概要: PolygoNet: Leveraging Simplified Polygonal Representation for Effective Image Classification
- arxiv url: http://arxiv.org/abs/2504.01214v1
- Date: Tue, 01 Apr 2025 22:05:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:25:40.399092
- Title: PolygoNet: Leveraging Simplified Polygonal Representation for Effective Image Classification
- Title(参考訳): PolygoNet: 効率的な画像分類のための簡易多角形表現の活用
- Authors: Salim Khazem, Jeremy Fix, Cédric Pradalier,
- Abstract要約: 本稿では,優越点や輪郭座標を用いた画像の多角形表現を効果的に活用する手法を提案する。
本手法は, 計算要求を大幅に削減し, 訓練を加速し, 資源を保存する。
ベンチマークデータセットの実験は、複雑性を減らし、一般化を改善し、エッジコンピューティングアプリケーションを容易にするためのアプローチの有効性を検証する。
- 参考スコア(独自算出の注目度): 6.3286311412189304
- License:
- Abstract: Deep learning models have achieved significant success in various image related tasks. However, they often encounter challenges related to computational complexity and overfitting. In this paper, we propose an efficient approach that leverages polygonal representations of images using dominant points or contour coordinates. By transforming input images into these compact forms, our method significantly reduces computational requirements, accelerates training, and conserves resources making it suitable for real time and resource constrained applications. These representations inherently capture essential image features while filtering noise, providing a natural regularization effect that mitigates overfitting. The resulting lightweight models achieve performance comparable to state of the art methods using full resolution images while enabling deployment on edge devices. Extensive experiments on benchmark datasets validate the effectiveness of our approach in reducing complexity, improving generalization, and facilitating edge computing applications. This work demonstrates the potential of polygonal representations in advancing efficient and scalable deep learning solutions for real world scenarios. The code for the experiments of the paper is provided in https://github.com/salimkhazem/PolygoNet.
- Abstract(参考訳): ディープラーニングモデルは、様々な画像関連タスクで大きな成功を収めた。
しかし、それらはしばしば計算の複雑さと過度に適合する問題に遭遇する。
本稿では,優占点や輪郭座標を用いて画像の多角形表現を利用する効率的な手法を提案する。
入力画像をこれらのコンパクトな形式に変換することにより、計算要求を大幅に削減し、トレーニングを加速し、リアルタイムおよびリソース制約されたアプリケーションに適したリソースを保存する。
これらの表現は本質的に、ノイズをフィルタリングしながら重要な画像の特徴を捉え、過度な適合を緩和する自然な正規化効果を提供する。
その結果得られた軽量モデルは、エッジデバイスへのデプロイを可能にしながら、フル解像度画像を使用した最先端の手法に匹敵するパフォーマンスを実現する。
ベンチマークデータセットの大規模な実験は、複雑性を減らし、一般化を改善し、エッジコンピューティングアプリケーションを容易にするためのアプローチの有効性を検証する。
この研究は、実世界のシナリオに対する効率的でスケーラブルなディープラーニングソリューションの進化における多角形表現の可能性を示す。
論文の実験のコードはhttps://github.com/salimkhazem/PolygoNet.comで公開されている。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - One-Shot Image Restoration [0.0]
提案手法の適用性, 堅牢性, 計算効率を, 教師付き画像の劣化と超解像に応用できることを実験的に示す。
本結果は,学習モデルのサンプル効率,一般化,時間複雑性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2024-04-26T14:03:23Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - TopicFM+: Boosting Accuracy and Efficiency of Topic-Assisted Feature
Matching [8.314830611853168]
本研究は,異なるシーンや限られたテクスチャを持つシーンなど,難易度の高いシナリオにおける画像マッチングの課題に対処する。
従来の研究では、トランスフォーマーを用いてグローバルシーンコンテキストを符号化することで、この問題に対処しようと試みてきた。
本稿では、トピックモデリング戦略を利用して画像中の高レベルなコンテキストをキャプチャする新しい画像マッチング手法を提案する。
論文 参考訳(メタデータ) (2023-07-02T06:14:07Z) - A Novel Algorithm for Exact Concave Hull Extraction [0.0]
領域抽出は、自律運転における物体検出から細胞生物学における細胞内形態解析まで、幅広い用途で必要とされる。
2つの主要なアプローチがある: 凸殻抽出(convex hull extract)は、正確で効率的なアルゴリズムが存在し、実世界の形状を捉えるのに優れているが、単一の解を持たない。
本研究では,コンケーブ内包を最大分解能(ピクセル完全)で提供し,速度効率のトレードオフを調整可能な新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-23T05:26:48Z) - Efficient Textured Mesh Recovery from Multiple Views with Differentiable
Rendering [8.264851594332677]
マルチビュー画像からテクスチャメッシュを復元する手法を提案する。
学習ベース多視点ステレオアルゴリズムにより予測される深度との差を最小化することにより形状形状を最適化する。
形状や色に対する暗黙的なニューラル表現とは対照的に,物体の光と反射を共同で推定する物理ベース逆レンダリング方式を導入する。
論文 参考訳(メタデータ) (2022-05-25T03:33:55Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。