論文の概要: End-to-End Image Compression with Segmentation Guided Dual Coding for Wind Turbines
- arxiv url: http://arxiv.org/abs/2603.29927v1
- Date: Tue, 31 Mar 2026 16:01:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.780418
- Title: End-to-End Image Compression with Segmentation Guided Dual Coding for Wind Turbines
- Title(参考訳): 風車用分割誘導デュアル符号化によるエンド・ツー・エンド画像圧縮
- Authors: Raül Pérez-Gonzalo, Andreas Espersen, Søren Forchhammer, Antonio Agudo,
- Abstract要約: 本稿では,セグメント化と二重モード圧縮を共同で行うエンドツーエンドのディープラーニングフレームワークを提案する。
大規模な風力タービンデータセットの実験は、優れた圧縮性能と効率を示す。
- 参考スコア(独自算出の注目度): 18.228491632517024
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Transferring large volumes of high-resolution images during wind turbine inspections introduces a bottleneck in assessing and detecting severe defects. Efficient coding must preserve high fidelity in blade regions while aggressively compressing the background. In this work, we propose an end-to-end deep learning framework that jointly performs segmentation and dual-mode (lossy and lossless) compression. The segmentation module accurately identifies the blade region, after which our region-of-interest (ROI) compressor encodes it at superior quality compared to the rest of the image. Unlike conventional ROI schemes that merely allocate more bits to salient areas, our framework integrates: (i) a robust segmentation network (BU-Netv2+P) with a CRF-regularized loss for precise blade localization, (ii) a hyperprior-based autoencoder optimized for lossy compression, and (iii) an extended bits-back coder with hierarchical models for fully lossless blade reconstruction. Furthermore, our ROI framework removes the sequential dependency in bits-back coding by reusing background-coded bits, enabling parallelized and efficient dual-mode compression. To the best of our knowledge, this is the first fully integrated learning-based ROI codec combining segmentation, lossy, and lossless compression, ensuring that subsequent defect detection is not compromised. Experiments on a large-scale wind turbine dataset demonstrate superior compression performance and efficiency, offering a practical solution for automated inspections.
- Abstract(参考訳): 風力タービン検査中に大量の高解像度画像を転送することは、深刻な欠陥を評価し検出するボトルネックをもたらす。
効率的な符号化は、背景を積極的に圧縮しながら、ブレード領域の高忠実性を保たなければならない。
本研究では,セグメント化と二重モード圧縮(ロッキーでロスレス)を共同で行うエンドツーエンドのディープラーニングフレームワークを提案する。
セグメンテーションモジュールは、ブレード領域を正確に識別し、その後、我々の関心領域圧縮機(ROI)は、画像の他の部分よりも優れた品質でそれを符号化する。
正常な領域により多くのビットを割り当てる従来のROIスキームとは異なり、私たちのフレームワークは以下のようになります。
(i) CRF正則化ロスを用いたロバストセグメンテーションネットワーク(BU-Netv2+P)。
(II)損失圧縮に最適化されたハイパープライアベースオートエンコーダ、及び
三 完全無損刃復元のための階層モデル付き拡張ビットバックコーダ。
さらに、私たちのROIフレームワークは、バックグラウンド符号化されたビットを再利用することで、ビットバック符号化におけるシーケンシャルな依存性を排除し、並列化と効率的なデュアルモード圧縮を可能にします。
私たちの知る限りでは、セグメンテーション、損失、損失のない圧縮を組み合わせた、完全に統合された学習ベースのROIコーデックとしては、これが初めてです。
大規模な風力タービンデータセットの実験では、圧縮性能と効率が優れており、自動検査のための実用的なソリューションを提供する。
関連論文リスト
- D-Compress: Detail-Preserving LiDAR Range Image Compression for Real-Time Streaming on Resource-Constrained Robots [2.6111100616898852]
D-Compressは、リアルタイムストリーミングのための新しいディテール保存と高速レンジ画像圧縮フレームワークである。
最新技術 (SOTA) 圧縮法は, 幾何的精度と下流タスク性能の両方で優れる。
論文 参考訳(メタデータ) (2026-03-14T02:15:25Z) - ROI-Guided Point Cloud Geometry Compression Towards Human and Machine Vision [0.0]
本研究では,人間と機械の視界に対する新しい関心誘導ポイントクラウド幾何圧縮法(RPCGC)を提案する。
我々のフレームワークはデュアルブランチ並列構造を用いており、ベース層はポイントクラウドの簡易バージョンをエンコードしデコードする。
我々はこれらのマスクの詳細を、各点を歪み計算で重み付けしたRD(Rate-Distortion)最適化プロセスに適用する。
論文 参考訳(メタデータ) (2025-04-19T09:31:37Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。