論文の概要: Image Compression with Bubble-Aware Frame Rate Adaptation for Energy-Efficient Video Capsule Endoscopy
- arxiv url: http://arxiv.org/abs/2604.25464v1
- Date: Tue, 28 Apr 2026 10:09:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.814805
- Title: Image Compression with Bubble-Aware Frame Rate Adaptation for Energy-Efficient Video Capsule Endoscopy
- Title(参考訳): 気泡対応フレームレート適応による高効率ビデオカプセル内視鏡画像圧縮
- Authors: Oliver Bause, Jörg Gammerdinger, Julia Werner,
- Abstract要約: ビデオカプセル内視鏡(VCE)は小腸の検査を改善するための有望な方法である。
画像品質を保ちながら送信データを大幅に削減する画像圧縮パイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video Capsule Endoscopy (VCE) is a promising method for improving the medical examination of the small intestine in the gastrointestinal tract. A key challenge is their limited size, resulting in a short battery lifetime which conflicts with high energy consumption for image capturing and transmission to an on-body device. Thus, we propose an image compression pipeline that substantially reduces the transmitted data while preserving diagnostic image quality. Furthermore, we exploit characteristics of the compression process to identify frames with low diagnostic value mainly caused by bubbles, without requiring additional image analysis. For low-visibility frames, a dynamic bubble-aware frame rate adaptation strategy reduces image acquisition and transmission during these phases while preserving sensitivity to potential anomalies. The proposed compression and frame rate adaptation are evaluated on a RISC-V platform using the Kvasir-Capsule and Galar datasets. The compression method achieves a compression ratio of 5.748 (82.6%) at a peak signal-to-noise ratio of 40.3 dB, indicating negligible loss of visual quality. The compression accomplished a mean energy reduction of the whole system by 20.58%. Additionally, the proposed bubble-aware frame rate adaptation reduced the energy consumption by up to 40%. These results demonstrate the potential of our method to increase the applicability of VCE.
- Abstract(参考訳): Video Capsule Endoscopy (VCE) は消化管の小腸の検査を改善するための有望な方法である。
重要な課題は、そのサイズが限られていることであり、結果として、画像のキャプチャとオンボディデバイスへの送信のための高エネルギー消費と矛盾する、短いバッテリー寿命が生じる。
そこで本研究では,画像品質を保ちながら送信データを大幅に削減する画像圧縮パイプラインを提案する。
さらに, 圧縮過程の特徴を利用して, 付加的な画像解析を必要とせず, 主に気泡による診断値の低いフレームを同定する。
低視認性フレームに対して、動的バブル対応フレームレート適応戦略は、潜在的な異常に対する感受性を維持しながら、これらのフェーズ間の画像取得と伝送を減少させる。
Kvasir-Capsule と Galar のデータセットを用いて RISC-V プラットフォーム上で圧縮とフレームレートの適応性を評価する。
圧縮方法は、ピーク信号対雑音比が40.3dBの5.748(82.6%)の圧縮比を達成し、視覚品質の無視的な損失を示す。
圧縮はシステム全体の平均エネルギーを20.58%削減した。
さらに, バブル対応フレームレートの適応により, エネルギー消費量を最大40%削減した。
これらの結果は,VCEの適用性を高めるための手法の可能性を示している。
関連論文リスト
- MTC-VAE: Multi-Level Temporal Compression with Content Awareness [54.85288415164888]
Latent Video Diffusion Models (LVDMs) は可変オートエンコーダ (VAEs) を使ってビデオをコンパクトな遅延表現に圧縮する。
固定圧縮率VAEを多段階時間圧縮をサポートするモデルに変換する手法を提案する。
論文 参考訳(メタデータ) (2026-02-01T17:08:02Z) - Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-27T13:01:53Z) - GABIC: Graph-based Attention Block for Image Compression [14.04718553744466]
本研究は,k-Nearest Neighbors拡張アテンション機構に基づく特徴冗長性を低減するために,画像圧縮のためのグラフベースアテンションブロック(GABIC)を提案する。
実験の結果,GABICは圧縮性能を向上し,特に高ビットレートで同等の手法より優れていた。
論文 参考訳(メタデータ) (2024-10-03T20:45:23Z) - Implicit Neural Image Field for Biological Microscopy Image Compression [37.0218688308699]
Inlicit Neural Representation (INR) に基づく適応圧縮ワークフローを提案する。
このアプローチは、任意の形状の画像を圧縮し、任意のピクセル単位の圧縮が可能な、アプリケーション固有の圧縮目的を許容する。
我々は,我々のワークフローが高精細圧縮比を達成しただけでなく,下流解析に不可欠な詳細な情報も保存できることを,広範囲にわたる顕微鏡画像で実証した。
論文 参考訳(メタデータ) (2024-05-29T11:51:33Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Are Visual Recognition Models Robust to Image Compression? [23.280147529096908]
画像圧縮が視覚認知タスクに与える影響を解析する。
我々は、0.1ビットから2ビット/ピクセル(bpp)までの幅広い圧縮レベルについて検討する。
これら3つのタスクすべてにおいて,強い圧縮を使用する場合,認識能力に大きな影響があることが判明した。
論文 参考訳(メタデータ) (2023-04-10T11:30:11Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Denial-of-Service Attacks on Learned Image Compression [18.84898685880023]
画像圧縮システムのロバスト性について検討し、入力画像の知覚不能な摂動が圧縮された潜伏者の摂動を著しく増加させる可能性があることを示す。
注意モジュールと基本因子化エントロピーモデルを組み込んだ新しいモデルを提案し,PSNR/bpp比と敵攻撃に対する堅牢性との間に有望なトレードオフをもたらす。
論文 参考訳(メタデータ) (2022-05-26T09:46:07Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。