論文の概要: CompressAI-Vision: Open-source software to evaluate compression methods for computer vision tasks
- arxiv url: http://arxiv.org/abs/2509.20777v1
- Date: Thu, 25 Sep 2025 06:01:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.717424
- Title: CompressAI-Vision: Open-source software to evaluate compression methods for computer vision tasks
- Title(参考訳): CompressAI-Vision:コンピュータビジョンタスクの圧縮方法を評価するオープンソースソフトウェア
- Authors: Hyomin Choi, Heeji Han, Chris Rosewarne, Fabien Racapé,
- Abstract要約: 下流視覚タスクに最適化された圧縮手法の実装と評価には,統合されたプラットフォームが必要である。
CompressAI-Visionは、視覚ネットワークの入力を効率的に圧縮するために、新しいコーディングツールが競合する総合的な評価プラットフォームとして導入された。
この評価プラットフォームはオープンソースソフトウェアとして開発され、Moving Pictures Experts Groupによって採用されている。
- 参考スコア(独自算出の注目度): 4.608162684700302
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the increasing use of neural network (NN)-based computer vision applications that process image and video data as input, interest has emerged in video compression technology optimized for computer vision tasks. In fact, given the variety of vision tasks, associated NN models and datasets, a consolidated platform is needed as a common ground to implement and evaluate compression methods optimized for downstream vision tasks. CompressAI-Vision is introduced as a comprehensive evaluation platform where new coding tools compete to efficiently compress the input of vision network while retaining task accuracy in the context of two different inference scenarios: "remote" and "split" inferencing. Our study showcases various use cases of the evaluation platform incorporated with standard codecs (under development) by examining the compression gain on several datasets in terms of bit-rate versus task accuracy. This evaluation platform has been developed as open-source software and is adopted by the Moving Pictures Experts Group (MPEG) for the development the Feature Coding for Machines (FCM) standard. The software is available publicly at https://github.com/InterDigitalInc/CompressAI-Vision.
- Abstract(参考訳): 画像と映像データを入力として処理するニューラルネットワーク(NN)ベースのコンピュータビジョンアプリケーションの利用が増加し、コンピュータビジョンタスクに最適化されたビデオ圧縮技術への関心が高まっている。
実際、様々な視覚タスク、関連するNNモデル、データセットを考えると、下流視覚タスクに最適化された圧縮方法の実装と評価を行うための共通基盤として統合されたプラットフォームが必要である。
CompressAI-Visionは、新しいコーディングツールが視覚ネットワークの入力を効率よく圧縮し、「リモート」と「スプリット」という2つの異なる推論シナリオのコンテキストでタスクの精度を維持しながら、総合的な評価プラットフォームとして導入されている。
本研究は,ビットレートとタスクの精度の観点から,複数のデータセットの圧縮ゲインを検証し,標準コーデックに組み込んだ評価プラットフォームのさまざまなユースケースを示す。
この評価プラットフォームはオープンソースソフトウェアとして開発され、FCM(Feature Coding for Machines)標準の開発にMPEG(Moving Pictures Experts Group)が採用している。
このソフトウェアはhttps://github.com/InterDigitalInc/CompressAI-Vision.comで公開されている。
関連論文リスト
- Plug-and-Play Versatile Compressed Video Enhancement [57.62582951699999]
ビデオ圧縮はファイルのサイズを効果的に削減し、リアルタイムのクラウドコンピューティングを可能にする。
しかし、それは視覚的品質の犠牲となり、下流の視覚モデルの堅牢性に挑戦する。
本稿では,異なる圧縮条件下で動画を適応的に拡張する多言語対応拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-21T18:39:31Z) - DMVC: Multi-Camera Video Compression Network aimed at Improving Deep Learning Accuracy [22.871591373774802]
ユビキタスビデオデータの時代に適した最先端のビデオ圧縮フレームワークを提案する。
人間の視覚知覚を優先する従来の圧縮手法とは異なり、我々の革新的なアプローチは、深層学習の精度に重要な意味情報の保存に重点を置いている。
設計されたディープラーニングアルゴリズムに基づいて、冗長性から必然的に重要な情報を分離し、機械学習タスクに最も関連性の高いデータの供給を確実にする。
論文 参考訳(メタデータ) (2024-10-24T03:29:57Z) - The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine [49.16996486119006]
ディープラーニングは、ポイントクラウドコーディングの強力なツールとして登場した。
JPEGは先日、JPEG Pleno LearningベースのPoint Cloud Coding標準を確定した。
本稿ではJPEG PCC標準の完全な技術的記述を提供する。
論文 参考訳(メタデータ) (2024-09-12T15:20:23Z) - Deep Learning-based Compressed Domain Multimedia for Man and Machine: A
Taxonomy and Application to Point Cloud Classification [27.071264214506108]
本稿では,圧縮されたドメイン・コンピュータ・ビジョン・ソリューションを設計するための最初の分類法を提案する。
提案された分類のポテンシャルは、ポイントクラウド分類の特定のケースで示される。
論文 参考訳(メタデータ) (2023-10-28T23:38:30Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Video Coding for Machine: Compact Visual Representation Compression for
Intelligent Collaborative Analytics [101.35754364753409]
Video Coding for Machines (VCM) は、ビデオ/画像圧縮と特徴圧縮をある程度別々の研究トラックにブリッジすることを約束している。
本稿では,既存の学術・産業活動に基づくVCM方法論と哲学を要約する。
論文 参考訳(メタデータ) (2021-10-18T12:42:13Z) - Video Coding for Machines: A Paradigm of Collaborative Compression and
Intelligent Analytics [127.65410486227007]
フレーム全体を圧縮、再構成することを目的としたビデオ符号化と、最も重要な情報のみを保存し、送信する特徴圧縮は、スケールの2つの端に立つ。
最近のビデオ圧縮の急激なトレンド、例えばディープラーニングベースのコーディングツールやエンドツーエンドの画像/ビデオコーディング、MPEG-7のコンパクトな特徴記述子標準などの取り組みは、持続的かつ迅速な開発を促進する。
本稿では,新たな領域であるVCM(Video Coding for Machines)の探索を行う。
論文 参考訳(メタデータ) (2020-01-10T17:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。