論文の概要: ImageEye: Batch Image Processing Using Program Synthesis
- arxiv url: http://arxiv.org/abs/2304.03253v3
- Date: Wed, 14 Jun 2023 17:28:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 01:26:40.593999
- Title: ImageEye: Batch Image Processing Using Program Synthesis
- Title(参考訳): ImageEye:プログラム合成を用いたバッチ画像処理
- Authors: Celeste Barnaby, Qiaochu Chen, Roopsha Samanta, Isil Dillig
- Abstract要約: 本稿では,バッチ画像処理のための新しい合成手法を提案する。
本手法は画像内の個々のオブジェクトに微細な編集を施すことができる。
提案手法をImageEyeと呼ばれるツールに実装し,50個の画像編集タスクで評価した。
- 参考スコア(独自算出の注目度): 7.111443975103331
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a new synthesis-based approach for batch image
processing. Unlike existing tools that can only apply global edits to the
entire image, our method can apply fine-grained edits to individual objects
within the image. For example, our method can selectively blur or crop specific
objects that have a certain property. To facilitate such fine-grained image
editing tasks, we propose a neuro-symbolic domain-specific language (DSL) that
combines pre-trained neural networks for image classification with other
language constructs that enable symbolic reasoning. Our method can
automatically learn programs in this DSL from user demonstrations by utilizing
a novel synthesis algorithm. We have implemented the proposed technique in a
tool called ImageEye and evaluated it on 50 image editing tasks. Our evaluation
shows that ImageEye is able to automate 96% of these tasks.
- Abstract(参考訳): 本稿では,バッチ画像処理のための新しい合成手法を提案する。
全画像にグローバル編集しか適用できない既存のツールとは異なり、この方法は画像内の個々のオブジェクトに対してきめ細かい編集を施すことができる。
例えば、特定の特性を持つ特定のオブジェクトを選択的にぼかしたり、収穫することができる。
このようなきめ細かい画像編集作業を容易にするために,事前学習したニューラルネットワークと記号推論を可能にする他の言語構造を組み合わせた,ニューロシンボリックドメイン固有言語(DSL)を提案する。
本手法は,新しい合成アルゴリズムを用いて,ユーザの実演から,このdslのプログラムを自動的に学習する。
提案手法をImageEyeと呼ばれるツールに実装し,50個の画像編集タスクで評価した。
評価の結果,ImageEyeはこれらのタスクの96%を自動化できることがわかった。
関連論文リスト
- WISE: Whitebox Image Stylization by Example-based Learning [0.22835610890984162]
画像に基づく芸術的レンダリングは、アルゴリズムによる画像フィルタリングを用いて様々な表現スタイルを合成することができる。
本稿では,多種多様なスタイリング手法を扱える実例に基づく画像処理システムを提案する。
本手法は,画像から画像への変換のために,スタイル・トランスファー・フレームワークで最適化したり,生成的・逆条件で学習することができる。
論文 参考訳(メタデータ) (2022-07-29T10:59:54Z) - FlexIT: Towards Flexible Semantic Image Translation [59.09398209706869]
我々は,任意の入力画像とユーザが定義したテキストを編集するための新しい方法であるFlexITを提案する。
まず、FlexITは入力画像とテキストをCLIPマルチモーダル埋め込み空間内の単一のターゲットポイントに結合する。
我々は、入力画像を目標点に向けて反復的に変換し、新しい正規化用語で一貫性と品質を確保する。
論文 参考訳(メタデータ) (2022-03-09T13:34:38Z) - Learning by Planning: Language-Guided Global Image Editing [53.72807421111136]
あいまいな編集言語要求を一連の編集操作にマッピングするテキスト・ツー・オペレーティング・モデルを開発した。
タスクの唯一の監督はターゲットイメージであり、シーケンシャルな決定の安定したトレーニングには不十分である。
本研究では,対象画像から可能な編集シーケンスを疑似基底真理として生成する,新たな操作計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-24T16:30:03Z) - RTIC: Residual Learning for Text and Image Composition using Graph
Convolutional Network [19.017377597937617]
画像検索のための画像とテキストの構成学習について検討する。
本稿では,グラフ畳み込みネットワーク(gcn)と既存の合成手法を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2021-04-07T09:41:52Z) - A Benchmark and Baseline for Language-Driven Image Editing [81.74863590492663]
まず,ローカル編集とグローバル編集の両方をサポートする新しい言語駆動画像編集データセットを提案する。
本手法では,各編集操作をサブモジュールとして扱い,演算パラメータを自動的に予測する。
ベンチマークとベースラインの両方を含む我々の研究は、画像編集領域をより汎用的で自由なレベルに進めると確信しています。
論文 参考訳(メタデータ) (2020-10-05T20:51:16Z) - Text as Neural Operator: Image Manipulation by Text Instruction [68.53181621741632]
本稿では、複雑なテキスト命令を用いて複数のオブジェクトで画像を編集し、オブジェクトの追加、削除、変更を可能にする設定について検討する。
タスクの入力は、(1)参照画像を含むマルチモーダルであり、(2)所望の修正を記述した自然言語の命令である。
提案モデルは,最近の3つの公開データセットの強いベースラインに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-08-11T07:07:10Z) - Semantic Photo Manipulation with a Generative Image Prior [86.01714863596347]
GANは、ユーザスケッチ、テキスト、セマンティックラベルなどの入力に条件付きイメージを合成することができる。
GANが入力画像を正確に再現することは困難である。
本稿では,GANが以前に学んだイメージを個々の画像の統計に適応させることにより,これらの問題に対処する。
提案手法は,入力画像の外観と一致して,入力画像を正確に再構成し,新たなコンテンツを合成することができる。
論文 参考訳(メタデータ) (2020-05-15T18:22:05Z) - Semantic Image Manipulation Using Scene Graphs [105.03614132953285]
本稿では,星座変更や画像編集を直接監督する必要のないシーングラフネットワークを提案する。
これにより、追加のアノテーションを使わずに、既存の実世界のデータセットからシステムをトレーニングすることができる。
論文 参考訳(メタデータ) (2020-04-07T20:02:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。