論文の概要: GIMP-ML: Python Plugins for using Computer Vision Models in GIMP
- arxiv url: http://arxiv.org/abs/2004.13060v3
- Date: Mon, 26 Oct 2020 16:19:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:39:24.490250
- Title: GIMP-ML: Python Plugins for using Computer Vision Models in GIMP
- Title(参考訳): GIMP-ML: GIMPでコンピュータビジョンモデルを使用するPythonプラグイン
- Authors: Kritik Soman
- Abstract要約: 本稿では,広く普及している画像操作プログラム(GIMP)用のPythonプラグイン群であるGIMP-ML v1.1を紹介する。
これにより、コンピュータビジョンの最近の進歩を従来の画像編集パイプラインに利用することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces GIMP-ML v1.1, a set of Python plugins for the widely
popular GNU Image Manipulation Program (GIMP). It enables the use of recent
advances in computer vision to the conventional image editing pipeline.
Applications from deep learning such as monocular depth estimation, semantic
segmentation, mask generative adversarial networks, image super-resolution,
de-noising, de-hazing, matting, enlightening and coloring have been
incorporated with GIMP through Python-based plugins. Additionally, operations
on images such as k-means based color clustering have also been added. GIMP-ML
relies on standard Python packages such as numpy, pytorch, open-cv, scipy.
Apart from these, several image manipulation techniques using these plugins
have been compiled and demonstrated in the YouTube channel
(https://youtube.com/user/kritiksoman) with the objective of demonstrating the
use-cases for machine learning based image modification. In addition, GIMP-ML
also aims to bring the benefits of using deep learning networks used for
computer vision tasks to routine image processing workflows. The code and
installation procedure for configuring these plugins is available at
https://github.com/kritiksoman/GIMP-ML.
- Abstract(参考訳): 本稿では,GIMP(GNU Image Manipulation Program)用のPythonプラグイン群であるGIMP-ML v1.1を紹介する。
これにより、従来の画像編集パイプラインへのコンピュータビジョンの最近の進歩を利用することができる。
単眼深度推定、セマンティックセグメンテーション、マスク生成敵ネットワーク、画像超解像、ノイズ除去、脱ハージング、マットティング、照明、着色といったディープラーニングの応用が、Pythonベースのプラグインを通じてGIMPに組み込まれている。
さらに、k-meansベースのカラークラスタリングなどの画像の操作も追加されている。
GIMP-MLはnumpy、pytorch、open-cv、scipyなどの標準Pythonパッケージに依存している。
これとは別に、これらのプラグインを使ったいくつかの画像操作技術がyoutubeチャンネル(https://youtube.com/user/kritiksoman)でコンパイルされ、デモされている。
さらに、GIMP-MLは、コンピュータビジョンタスクに使用されるディープラーニングネットワークを、画像処理ワークフローのルーチンに活用することも目標としている。
これらのプラグインを構成するためのコードとインストール手順はhttps://github.com/kritiksoman/GIMP-ML.comで公開されている。
関連論文リスト
- Towards Open-Vocabulary Semantic Segmentation Without Semantic Labels [53.8817160001038]
画素レベルの理解にCLIP画像エンコーダを適用する新しい手法であるPixelCLIPを提案する。
セマンティックラベルを使わずにマスクを活用するという課題に対処するため,オンラインクラスタリングアルゴリズムを考案した。
PixelCLIPはCLIPよりも大幅にパフォーマンスが向上し、キャプション管理手法に比べて競合性が向上した。
論文 参考訳(メタデータ) (2024-09-30T01:13:03Z) - PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions [66.92809850624118]
PixWizardは、画像生成、操作、翻訳を自由言語命令に基づいて行うために設計されたイメージ・ツー・イメージのビジュアルアシスタントである。
我々は、様々な視覚タスクを統一された画像テキスト・画像生成フレームワークに取り組み、Omni Pixel-to-Pixel Instruction-Tuningデータセットをキュレートする。
我々の実験は、PixWizardが様々な解像度の画像に対して印象的な生成能力と理解能力を示すだけでなく、目に見えないタスクや人間の指示で有望な一般化能力を示すことを示した。
論文 参考訳(メタデータ) (2024-09-23T17:59:46Z) - Mini-Monkey: Alleviating the Semantic Sawtooth Effect for Lightweight MLLMs via Complementary Image Pyramid [87.09900996643516]
本稿では,高分解能画像処理における意味的不連続性を軽減するための補完画像ピラミッド(CIP)を提案する。
また、冗長な視覚トークンを圧縮することにより、計算オーバーヘッドを増大させるスケール圧縮機構(SCM)を導入する。
我々の実験は、CIPが様々なアーキテクチャで継続的に性能を向上できることを示した。
論文 参考訳(メタデータ) (2024-08-04T13:55:58Z) - Interactive Visualization of Protein RINs using NetworKit in the Cloud [57.780880387925954]
本稿では,タンパク質動態,特に残基相互作用ネットワーク(RIN)の例について考察する。
NetworKitを使ってクラウドベースの環境を構築しています。
このアプローチの汎用性を実証するために、私たちは、RIN視覚化のためのカスタムJupyterベースのウィジェットを構築するためにそれを使用します。
論文 参考訳(メタデータ) (2022-03-02T17:41:45Z) - SketchEdit: Mask-Free Local Image Manipulation with Partial Sketches [95.45728042499836]
マスクレス局所画像操作という,スケッチに基づく画像操作の新しいパラダイムを提案する。
本モデルでは,対象の修正領域を自動的に予測し,構造型ベクトルにエンコードする。
ジェネレータは、スタイルベクトルとスケッチに基づいて、新しいイメージコンテンツを合成する。
論文 参考訳(メタデータ) (2021-11-30T02:42:31Z) - Image Inpainting using Partial Convolution [0.3441021278275805]
本研究の目的は,部分的畳み込み層を用いた頑健な深層学習手法を用いて画像の塗り込みを行うことである。
様々な応用において、画像は、劣化した、失われた、または望ましくない情報の存在によって、しばしばノイズによって劣化する。
論文 参考訳(メタデータ) (2021-08-19T17:01:27Z) - PriorityCut: Occlusion-guided Regularization for Warp-based Image
Animation [0.0]
自己監視画像アニメーションアプローチは、駆動ビデオの動作に応じてソースイメージを警告し、塗り込みによりワーピングアーティファクトを復元する。
本稿では,ワープ画像のアニメーションに対するCutMixの効果について予備的検討を行う。
ワープ画像アニメーションを正規化するために、前景の上位Kパーセントの画素を使用する新しい拡張手法であるPriorityCutを提案する。
論文 参考訳(メタデータ) (2021-03-22T06:05:20Z) - PyMatting: A Python Library for Alpha Matting [0.4588028371034407]
我々はPython用のPyMattingパッケージを紹介し、アルファマッチング問題を解決するために様々なアプローチを実装している。
我々のツールボックスは、アルファマットを与えられた画像の前景を抽出することもできます。
論文 参考訳(メタデータ) (2020-03-25T18:46:23Z) - TorchIO: A Python library for efficient loading, preprocessing,
augmentation and patch-based sampling of medical images in deep learning [68.8204255655161]
我々はTorchIOというオープンソースのPythonライブラリを紹介し、ディープラーニングのための医療画像の効率的なロード、前処理、拡張、パッチベースのサンプリングを可能にする。
TorchIOはPyTorchのスタイルに従い、標準的な医用画像処理ライブラリを統合して、ニューラルネットワークのトレーニング中に画像を効率的に処理する。
Pythonを使わずに、画像ファイルに変換を適用できるコマンドラインインターフェースが含まれている。
論文 参考訳(メタデータ) (2020-03-09T13:36:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。