論文の概要: Visual representation of negation: Real world data analysis on comic
image design
- arxiv url: http://arxiv.org/abs/2105.10131v1
- Date: Fri, 21 May 2021 04:57:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 11:36:08.075677
- Title: Visual representation of negation: Real world data analysis on comic
image design
- Title(参考訳): 否定の視覚表現:コミックイメージデザインにおける実世界データ分析
- Authors: Yuri Sato, Koji Mineshima, Kazuhiro Ueda
- Abstract要約: 漫画(漫画)イラストのリアルな視覚表現を解析する。
いくつかの漫画のイラストは背景の知識を喚起し、純粋に視覚的な要素を持つ否定を描くことができる。
- 参考スコア(独自算出の注目度): 9.78013151037613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There has been a widely held view that visual representations (e.g.,
photographs and illustrations) do not depict negation, for example, one that
can be expressed by a sentence "the train is not coming". This view is
empirically challenged by analyzing the real-world visual representations of
comic (manga) illustrations. In the experiment using image captioning tasks, we
gave people comic illustrations and asked them to explain what they could read
from them. The collected data showed that some comic illustrations could depict
negation without any aid of sequences (multiple panels) or conventional devices
(special symbols). This type of comic illustrations was subjected to further
experiments, classifying images into those containing negation and those not
containing negation. While this image classification was easy for humans, it
was difficult for data-driven machines, i.e., deep learning models (CNN), to
achieve the same high performance. Given the findings, we argue that some comic
illustrations evoke background knowledge and thus can depict negation with
purely visual elements.
- Abstract(参考訳): 視覚表現(写真やイラストなど)は否定を描写しないという見解が広く支持されており、例えば「列車は来ない」という文で表現できる。
この見解は、マンガイラストの現実世界の視覚的表現を分析することで実証的に挑戦される。
画像キャプションタスクを用いた実験では,漫画イラストを配り,そこから何を読むことができるのか説明を依頼した。
収集されたデータによると、いくつかの漫画のイラストは、複数のパネルや一般的な装置(特別な記号)の助けなしに否定を表現できる。
この種の漫画のイラストはさらなる実験の対象となり、画像は否定を含むものと否定を含むものとに分類された。
この画像分類は人間にとって容易であったが、データ駆動型マシン、すなわちディープラーニングモデル(CNN)では、同じ高い性能を達成することは困難であった。
この結果から,背景知識を喚起し,純粋に視覚的な要素による否定を表現できる漫画イラストもある。
関連論文リスト
- See or Guess: Counterfactually Regularized Image Captioning [32.82695612178604]
本稿では、因果推論を利用して、既存のモデルを介入作業に役立てる汎用画像キャプションフレームワークを提案する。
本手法は幻覚を効果的に低減し,画像への忠実さを向上し,小型および大規模の画像・テキスト・モデル間で高い可搬性を示す。
論文 参考訳(メタデータ) (2024-08-29T17:59:57Z) - Addressing Image Hallucination in Text-to-Image Generation through Factual Image Retrieval [14.471150840618211]
本稿では,外部から取得した実写画像を用いて現実的な画像を生成する手法を提案する。
InstructPix2Pix や IP-Adapter といった既製の画像編集ツールを使って、検索した画像の事実情報を活用する。
論文 参考訳(メタデータ) (2024-07-15T12:59:03Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Comics for Everyone: Generating Accessible Text Descriptions for Comic
Strips [0.0]
我々は、視覚障害者のコミュニティにアクセス可能なコミックストリップの自然言語記述を作成します。
まず、コンピュータビジョン技術を用いて、コミック画像のパネル、文字、テキストに関する情報を抽出する。
我々は,人間の専門家が注釈付けした漫画のコレクション上で本手法を試行し,定量的および定性的な指標を用いてその性能を計測する。
論文 参考訳(メタデータ) (2023-10-01T15:13:48Z) - Paraphrasing Magritte's Observation [0.0]
本稿では,「Li et al., 2022」で使用される統計学習に適合したオリジナル漫画風画像を生成する手法を提案する。
学術的,非営利的な出版物において,表現(提案手法によって生成された刺激)と現実(実際の対象)との明確な区別は,生成した刺激の使用に関する最終的な問題を回避する。
論文 参考訳(メタデータ) (2022-02-11T00:20:04Z) - Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic [72.60554897161948]
最近のテキストと画像のマッチングモデルは、未修正画像と文の大きなコーパスに対してコントラスト学習を適用している。
本研究では、そのようなモデルを用いて、推論時に画像が与えられた記述テキストを生成する。
結果として得られたキャプションは、教師付きキャプション法によるキャプションよりもはるかに制限を受けない。
論文 参考訳(メタデータ) (2021-11-29T11:01:49Z) - Instance-wise Hard Negative Example Generation for Contrastive Learning
in Unpaired Image-to-Image Translation [102.99799162482283]
非ペア画像-画像翻訳(NEGCUT)におけるコントラスト学習のための例-wise hard Negative Example Generationを提案する。
具体的には、オンラインでネガティブな例を生成するようにジェネレータを訓練する。ジェネレータは、1)入力画像に基づいて生成されたサンプルをインスタンスワイズし、2)逆向きの損失で訓練されたので、強烈なネガティブな例を生成することができる。
論文 参考訳(メタデータ) (2021-08-10T09:44:59Z) - ArtEmis: Affective Language for Visual Art [46.643106054408285]
我々は視覚アートワークによって引き起こされる情緒体験に焦点を当てる。
ある画像に対して感じている支配的な感情を示すために、注釈を付けます。
これにより、目的コンテンツとイメージの感情的影響の両方に対して、リッチな信号セットが導かれる。
論文 参考訳(メタデータ) (2021-01-19T01:03:40Z) - This is not the Texture you are looking for! Introducing Novel
Counterfactual Explanations for Non-Experts using Generative Adversarial
Learning [59.17685450892182]
反実用説明システムは、入力画像を変更して反実用推論を可能にする。
本稿では, 対向画像から画像への変換技術に基づく, 対向画像の説明を新たに生成する手法を提案する。
その結果,我々のアプローチは,2つの最先端技術システムよりも,メンタルモデル,説明満足度,信頼度,感情,自己効力に関して有意に優れた結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-12-22T10:08:05Z) - Watching the World Go By: Representation Learning from Unlabeled Videos [78.22211989028585]
近年の単一画像教師なし表現学習技術は,様々なタスクにおいて顕著な成功を収めている。
本稿では,この自然な拡張を無償で提供することを論じる。
そこで本稿では,ビデオノイズコントラスト推定(Voice Noise Contrastive Estimation)を提案する。
論文 参考訳(メタデータ) (2020-03-18T00:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。