論文の概要: End-to-end optimized image compression for machines, a study
- arxiv url: http://arxiv.org/abs/2011.06409v1
- Date: Tue, 10 Nov 2020 20:10:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 08:06:02.008719
- Title: End-to-end optimized image compression for machines, a study
- Title(参考訳): 機械のエンドツーエンド最適化画像圧縮に関する研究
- Authors: Lahiru D. Chamain, Fabien Racap\'e, Jean B\'egaint, Akshay Pushparaja,
Simon Feltman
- Abstract要約: 画像とビデオのコンテンツのシェアは、人間が見るのではなく、機械によって分析される。
従来のコーディングツールは、もともと人間の知覚のために設計されたマシンタスクを専門化するのが難しい。
ニューラルネットワークベースのコーデックは、任意の畳み込みニューラルネットワーク(CNN)ベースのタスクモデルと、エンドツーエンドで共同でトレーニングすることができる。
- 参考スコア(独自算出の注目度): 3.0448872422956437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An increasing share of image and video content is analyzed by machines rather
than viewed by humans, and therefore it becomes relevant to optimize codecs for
such applications where the analysis is performed remotely. Unfortunately,
conventional coding tools are challenging to specialize for machine tasks as
they were originally designed for human perception. However, neural network
based codecs can be jointly trained end-to-end with any convolutional neural
network (CNN)-based task model. In this paper, we propose to study an
end-to-end framework enabling efficient image compression for remote machine
task analysis, using a chain composed of a compression module and a task
algorithm that can be optimized end-to-end. We show that it is possible to
significantly improve the task accuracy when fine-tuning jointly the codec and
the task networks, especially at low bit-rates. Depending on training or
deployment constraints, selective fine-tuning can be applied only on the
encoder, decoder or task network and still achieve rate-accuracy improvements
over an off-the-shelf codec and task network. Our results also demonstrate the
flexibility of end-to-end pipelines for practical applications.
- Abstract(参考訳): 画像と映像の共有度は、人間が見るのではなく機械によって分析されるため、リモートで解析を行うアプリケーションに対してコーデックを最適化することが重要となる。
残念なことに、従来のコーディングツールは、元々人間の知覚のために設計されたマシンタスクの専門化が難しい。
しかし、ニューラルネットワークベースのコーデックは、任意の畳み込みニューラルネットワーク(CNN)ベースのタスクモデルと共同でトレーニングすることができる。
本稿では、圧縮モジュールとエンドツーエンドに最適化可能なタスクアルゴリズムからなるチェーンを用いて、リモートマシンタスク分析のための効率的な画像圧縮を可能にするエンドツーエンドフレームワークを提案する。
コーデックとタスクネットワークを協調的に微調整する場合,特に低ビットレートでタスク精度を大幅に向上させることができることを示す。
トレーニングやデプロイメントの制約によっては、選択的な微調整はエンコーダ、デコーダ、タスクネットワークのみに適用でき、既製のコーデックやタスクネットワークよりもレート精度が向上する。
また,実用化に向けたエンドツーエンドパイプラインの柔軟性も実証した。
関連論文リスト
- Bridging the gap between image coding for machines and humans [20.017766644567036]
監視などの多くのユースケースでは、圧縮処理によって視覚的品質が劇的に劣化しないことが重要である。
ニューラルネットワーク(NN)ベースのICMコーデックの使用に関する最近の研究は、従来の手法に対して大きなコードゲインを示している。
ICMの視覚的品質を大幅に向上させるために, 対角訓練に基づく効果的なデコーダファインタニング手法を提案する。
論文 参考訳(メタデータ) (2024-01-19T14:49:56Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Preprocessing Enhanced Image Compression for Machine Vision [14.895698385236937]
本稿では,マシンビジョンタスクのための前処理による画像圧縮手法を提案する。
私たちのフレームワークは従来の非微分コーデックの上に構築されています。
実験の結果,提案手法は,約20%の節約により,ダウンストリームマシンビジョンタスクのコーディングと性能のトレードオフを向上することが示された。
論文 参考訳(メタデータ) (2022-06-12T03:36:38Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Video Coding for Machine: Compact Visual Representation Compression for
Intelligent Collaborative Analytics [101.35754364753409]
Video Coding for Machines (VCM) は、ビデオ/画像圧縮と特徴圧縮をある程度別々の研究トラックにブリッジすることを約束している。
本稿では,既存の学術・産業活動に基づくVCM方法論と哲学を要約する。
論文 参考訳(メタデータ) (2021-10-18T12:42:13Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - End-to-end optimized image compression for multiple machine tasks [3.8323580808203785]
我々は,圧縮コンテンツの直接変換を可能にするために,デコーダとタスクアルゴリズムの間に挿入される「コネクタ」を導入する。
画像分類とオブジェクトセグメンテーションの両方において高いレート精度向上を実現し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-03-06T19:09:05Z) - Enhanced Standard Compatible Image Compression Framework based on
Auxiliary Codec Networks [8.440333621142226]
Auxiliary Codec Networks (ACNs) に基づく新しい標準互換画像圧縮フレームワークを提案する。
ACNは、既存の画像劣化操作を模倣するように設計されており、コンパクトな表現ネットワークにより正確な勾配を提供する。
本稿では,JPEGおよび高効率ビデオ符号化(HEVC)標準に基づく提案フレームワークが,既存の画像圧縮アルゴリズムを標準互換性で大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-30T15:42:06Z) - Analytic Simplification of Neural Network based Intra-Prediction Modes
for Video Compression [10.08097582267397]
本稿では,学習モデルから簡易な予測法を導出する2つの方法を提案する。
これらの合理化技術は, 効率的な圧縮解に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T10:25:54Z) - End-to-End Facial Deep Learning Feature Compression with Teacher-Student
Enhancement [57.18801093608717]
本稿では,ディープニューラルネットワークの表現と学習能力を活用することで,エンドツーエンドの特徴圧縮手法を提案する。
特に、抽出した特徴量を、レート歪みコストを最適化することにより、エンドツーエンドでコンパクトに符号化する。
提案モデルの有効性を顔の特徴で検証し, 圧縮性能を高いレート精度で評価した。
論文 参考訳(メタデータ) (2020-02-10T10:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。