論文の概要: hYOLO Model: Enhancing Object Classification with Hierarchical Context in YOLOv8
- arxiv url: http://arxiv.org/abs/2510.23278v1
- Date: Mon, 27 Oct 2025 12:39:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.549746
- Title: hYOLO Model: Enhancing Object Classification with Hierarchical Context in YOLOv8
- Title(参考訳): hYOLOモデル: YOLOv8における階層的コンテキストによるオブジェクト分類の強化
- Authors: Veska Tsenkova, Peter Stanchev, Daniel Petrov, Deyan Lazarov,
- Abstract要約: 本稿では,YOLOモデルファミリ上に構築された画像の検出と分類のためのエンドツーエンド階層モデルを提案する。
モデルの階層性に合わせた,新しい階層アーキテクチャ,改良された損失関数,パフォーマンスメトリックを導入している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current convolution neural network (CNN) classification methods are predominantly focused on flat classification which aims solely to identify a specified object within an image. However, real-world objects often possess a natural hierarchical organization that can significantly help classification tasks. Capturing the presence of relations between objects enables better contextual understanding as well as control over the severity of mistakes. Considering these aspects, this paper proposes an end-to-end hierarchical model for image detection and classification built upon the YOLO model family. A novel hierarchical architecture, a modified loss function, and a performance metric tailored to the hierarchical nature of the model are introduced. The proposed model is trained and evaluated on two different hierarchical categorizations of the same dataset: a systematic categorization that disregards visual similarities between objects and a categorization accounting for common visual characteristics across classes. The results illustrate how the suggested methodology addresses the inherent hierarchical structure present in real-world objects, which conventional flat classification algorithms often overlook.
- Abstract(参考訳): 現在の畳み込みニューラルネットワーク(CNN)分類法は主に、画像内の特定の対象を特定することのみを目的とした平坦な分類に焦点を当てている。
しかし、現実世界のオブジェクトは、しばしば分類タスクを著しく支援できる自然な階層的な組織を持っている。
オブジェクト間の関係をキャプチャすることで、コンテキスト的理解が向上し、ミスの深刻度を制御できる。
そこで本研究では,YOLOモデルファミリ上に構築された画像検出と分類のためのエンドツーエンド階層モデルを提案する。
モデルの階層性に合わせた,新しい階層アーキテクチャ,改良された損失関数,パフォーマンスメトリックを導入している。
提案モデルは,オブジェクト間の視覚的類似性を無視した系統分類と,クラス間の共通的な視覚的特徴を考慮した分類という,同じデータセットの2つの異なる階層的分類に基づいて,訓練および評価を行う。
その結果、提案手法が現実世界のオブジェクトに存在する固有階層構造にどのように対処するかが示され、従来のフラットな分類アルゴリズムはしばしば見落としている。
関連論文リスト
- A class-driven hierarchical ResNet for classification of multispectral remote sensing images [12.282079123411947]
本稿では,異なる意味クラスレベルでのマルチスペクトル画像の時系列(TS)分類をモデル化するために,クラス駆動型階層型残留ニューラルネットワーク(ResNet)を提案する。
我々は、階層的なペナルティマップを利用して、分類の非一貫性な階層的遷移を阻止する。
センチネル2号画像の月12回の合成でアマゾン林の2つのタイルから得られた実験結果から,階層的アプローチの有効性が示された。
論文 参考訳(メタデータ) (2025-10-09T10:47:52Z) - A Semantics-Aware Hierarchical Self-Supervised Approach to Classification of Remote Sensing Images [12.282079123411947]
本稿では,階層的特徴と関係を学習するためのセマンティックス・アウェア・ヒエラルキー・コンセンサス(SAHC)手法を提案する。
SAHC法は、階層的な複雑さの異なる3つのベンチマークデータセットで評価される。
実験により,ネットワーク学習の指導における提案手法の有効性と,リモートセンシング画像分類タスクにおける階層的コンセンサスの有効性が示された。
論文 参考訳(メタデータ) (2025-10-06T15:30:39Z) - Feature Identification for Hierarchical Contrastive Learning [7.655211354400059]
本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文 参考訳(メタデータ) (2025-10-01T12:46:47Z) - How Deep Neural Networks Learn Compositional Data: The Random Hierarchy Model [47.617093812158366]
言語と画像の階層構造にインスパイアされた合成タスクのファミリーであるランダム階層モデルを紹介する。
深層ネットワークは、等価なグループを交換するために不変な内部表現を開発することでタスクを学習する。
この結果から, ネットワークは次元の呪いを克服し, 不変表現を構築できることが示唆された。
論文 参考訳(メタデータ) (2023-07-05T09:11:09Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Visual Ground Truth Construction as Faceted Classification [4.7590051176368915]
アプローチの主な新規性は、視覚的種分化を利用した視覚特性から分類階層を構築するという事実にある。
提案手法は、音楽実験のImageNet階層に関する一連の実験によって検証される。
論文 参考訳(メタデータ) (2022-02-17T08:35:23Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Learn Class Hierarchy using Convolutional Neural Networks [0.9569316316728905]
画像の階層的分類のための新しいアーキテクチャを提案し、クロスエントロピー損失関数と中心損失を組み合わせた深層線形層を導入する。
階層型分類器は,コンピュータビジョンタスクへの応用を見出す従来の分類手法の利点を示す。
論文 参考訳(メタデータ) (2020-05-18T12:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。