論文の概要: A Decade of Research for Image Compression In Multimedia Laboratory
- arxiv url: http://arxiv.org/abs/2105.09281v1
- Date: Tue, 6 Apr 2021 18:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 06:10:55.368927
- Title: A Decade of Research for Image Compression In Multimedia Laboratory
- Title(参考訳): マルチメディア研究室における画像圧縮研究の10年
- Authors: Shahrokh Paravarzar, Javaneh Alavi
- Abstract要約: 可変解像度は、画像、ビデオ、および3Dモーションデータ圧縮に使用された。
本報告では, 上記の技術およびその他の研究について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the advancement of technology, we have supercomputers with high
processing power and affordable prices. In addition, using multimedia expanded
all around the world. This caused a vast use of images and videos in different
fields. As this kind of data consists of a large amount of information, there
is a need to use compression methods to store, manage or transfer them better
and faster. One effective technique, which was introduced is variable
resolution. This technique stimulates human vision and divides regions in
pictures into two different parts, including the area of interest that needs
more detail and periphery parts with less detail. This results in better
compression. The variable resolution was used for image, video, and 3D motion
data compression. This paper investigates the mentioned technique and some
other research in this regard.
- Abstract(参考訳): 技術の進歩により、我々は高処理能力と安価な価格のスーパーコンピュータを持っている。
さらに、マルチメディアの利用は世界中で拡大した。
これにより、様々な分野の画像やビデオが大量に利用された。
この種のデータは大量の情報で構成されているため、圧縮メソッドを使用して保存、管理、転送をより高速に行う必要がある。
1つの効果的な手法は可変分解能である。
この技術は人間の視覚を刺激し、画像内の領域を2つの異なる部分に分割する。
これにより圧縮性が向上する。
可変解像度は、画像、ビデオ、および3Dモーションデータ圧縮に使用された。
本稿では,上記の技法とその他の研究について検討する。
関連論文リスト
- Implicit Neural Image Field for Biological Microscopy Image Compression [37.0218688308699]
Inlicit Neural Representation (INR) に基づく適応圧縮ワークフローを提案する。
このアプローチは、任意の形状の画像を圧縮し、任意のピクセル単位の圧縮が可能な、アプリケーション固有の圧縮目的を許容する。
我々は,我々のワークフローが高精細圧縮比を達成しただけでなく,下流解析に不可欠な詳細な情報も保存できることを,広範囲にわたる顕微鏡画像で実証した。
論文 参考訳(メタデータ) (2024-05-29T11:51:33Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Deep learning based Image Compression for Microscopy Images: An
Empirical Study [3.915183869199319]
本研究では,古典的および深層学習に基づく画像圧縮法とその深層学習に基づく画像処理モデルへの影響について分析する。
このような所望の方法で画像を圧縮するには、複数の古典的損失画像圧縮技術と、複数のAIベースの圧縮モデルを比較する。
その結果、AIベースの圧縮技術は従来の圧縮技術よりも優れており、2Dケースでは下流のラベルなしタスクに最小限の影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:00:32Z) - Random-Access Neural Compression of Material Textures [1.2971248363246106]
材料テクスチャに特化して設計された新しいニューラル圧縮手法を提案する。
我々は低圧縮でさらに2つの詳細レベル、すなわち16倍のテクセルをアンロックする。
本手法では,ランダムアクセスによるオンデマンドリアルタイム圧縮が可能で,ディスクやメモリ上での圧縮が可能となる。
論文 参考訳(メタデータ) (2023-05-26T17:16:22Z) - Compressed Vision for Efficient Video Understanding [83.97689018324732]
本稿では,2時間ビデオの処理が可能なハードウェアを用いて,時間長動画の研究を可能にするフレームワークを提案する。
私たちは、JPEGなどの標準的なビデオ圧縮をニューラル圧縮に置き換え、圧縮されたビデオを通常のビデオネットワークへの入力として直接フィードできることを示します。
論文 参考訳(メタデータ) (2022-10-06T15:35:49Z) - Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and
Restoration [71.6879432974126]
本稿では,画像超解像のためのSwinIRの改良を目的とした小説Swin Transformer V2について検討する。
JPEG圧縮アーティファクトの除去,画像超解像(古典的および軽量),圧縮画像超解像の3つの代表的な課題について実験を行った。
実験の結果,Swin2SRはSwinIRのトレーニング収束と性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-09-22T23:25:08Z) - The First Principles of Deep Learning and Compression [4.797216015572358]
ディープラーニング手法の急速な普及により、消費者や組み込みアプリケーションでの利用が急速に増加した。
コンシューマおよび組み込みアプリケーションの1つの結果は、効率的なストレージとデータの送信を設計するために必要な、損失のあるマルチメディア圧縮である。
マルチメディア圧縮のディープラーニングアプローチは、Learned Multimedia Compressionと呼ばれ、エンコーダとデコーダのためのディープネットワークを用いて画像やビデオの圧縮表現を計算する。
論文 参考訳(メタデータ) (2022-04-04T18:24:25Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Learning-Driven Lossy Image Compression; A Comprehensive Survey [3.1761172592339375]
本稿では、機械学習(ML)アーキテクチャを用いて、画像圧縮の損失を主に生かした最近の技術について調査することを目的とする。
すべてのアルゴリズムをアーキテクチャに基づいて複数のグループに分けます。
研究者の様々な発見が強調され、研究者の今後の方向性が示唆されている。
論文 参考訳(メタデータ) (2022-01-23T12:11:31Z) - Towards Robust Data Hiding Against (JPEG) Compression: A
Pseudo-Differentiable Deep Learning Approach [78.05383266222285]
これらの圧縮に対抗できるデータ隠蔽の目標を達成することは、依然としてオープンな課題である。
ディープラーニングはデータの隠蔽に大きな成功を収めていますが、JPEGの非差別化性は、損失のある圧縮に対する堅牢性を改善するための深いパイプラインのトレーニングを困難にしています。
本稿では,上記の制約をすべて一度に解決するための,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-30T12:30:09Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。