論文の概要: Discovering the Hidden Vocabulary of DALLE-2
- arxiv url: http://arxiv.org/abs/2206.00169v1
- Date: Wed, 1 Jun 2022 01:14:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 07:20:20.286943
- Title: Discovering the Hidden Vocabulary of DALLE-2
- Title(参考訳): DALLE-2の隠れ語彙の発見
- Authors: Giannis Daras and Alexandros G. Dimakis
- Abstract要約: DALLE-2は、不条理なプロンプトで画像を生成するために使用できる、隠れた語彙を持つように見える。
例えば、 textttApoploe vesrreaitais は鳥を意味し、 textttContarra ccetnxniams luryca tanniounons は虫や害虫を意味する。
- 参考スコア(独自算出の注目度): 96.19666636109729
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We discover that DALLE-2 seems to have a hidden vocabulary that can be used
to generate images with absurd prompts. For example, it seems that
\texttt{Apoploe vesrreaitais} means birds and \texttt{Contarra ccetnxniams
luryca tanniounons} (sometimes) means bugs or pests. We find that these prompts
are often consistent in isolation but also sometimes in combinations. We
present our black-box method to discover words that seem random but have some
correspondence to visual concepts. This creates important security and
interpretability challenges.
- Abstract(参考訳): dalle-2には隠された語彙があり、不条理なプロンプトで画像を生成することができる。
例えば、 \texttt{apoploe vesrreaitais} は鳥を意味し、 \texttt{contarra ccetnxniams luryca tanniounons} (時々) は虫や害虫を意味する。
これらのプロンプトは、しばしば分離されるが、時には結合される。
ランダムに思えるが、視覚的概念に対応する単語を見つけるためのブラックボックス方式を提案する。
これは重要なセキュリティと解釈可能性の課題を生み出します。
関連論文リスト
- From cart to truck: meaning shift through words in English in the last two centuries [0.0]
この擬似論的研究は、時間とともに異なる単語が同じ概念をどう表現するかを、ダイアクロニックな単語埋め込みを用いて調査する。
我々は、エネルギー、輸送、エンターテイメント、およびコンピューティング領域の変化を特定し、言語と社会的な変化の関連を明らかにする。
論文 参考訳(メタデータ) (2024-08-29T02:05:39Z) - Discovering Failure Modes of Text-guided Diffusion Models via
Adversarial Search [52.519433040005126]
テキスト誘導拡散モデル(TDM)は広く応用されているが、予期せず失敗することがある。
本研究は,TDMの障害モードについて,より詳細に研究し,理解することを目的としている。
本稿では,TDM上での最初の逆探索手法であるSAGEを提案する。
論文 参考訳(メタデータ) (2023-06-01T17:59:00Z) - Schr\"{o}dinger's Bat: Diffusion Models Sometimes Generate Polysemous
Words in Superposition [71.45263447328374]
近年の研究では、プロンプトが複数の意味を持つ単語を含む場合、テキストから画像への拡散モデルが奇妙な振る舞いを示すことが示されている。
2つの単語のエンコーディングの総和である入力を与えられた場合、このモデルは、この和に表される両方の概念を含む画像を生成することができることを示す。
次に,CLIPエンコーダを用いてプロンプトをエンコードし,意味の重ね合わせとして多文語をエンコードし,線形代数的手法を用いてこれらの表現を編集し,生成した画像に表される感覚に影響を与えることを示した。
論文 参考訳(メタデータ) (2022-11-23T16:26:49Z) - Detecting Euphemisms with Literal Descriptions and Visual Imagery [18.510509701709054]
本稿では,EMNLP 2022とともに第3回言語処理ワークショップが主催する,エフェミズム検出共有タスクのための2段階のシステムについて述べる。
第1段階では、入力テキストプロンプトにリテラル記述を組み込むことにより、このあいまいさを軽減することを目指しており、このような直接的な監督が目覚ましい性能向上をもたらすことが判明した。
第2段階では,テキスト・ツー・イメージ・モデルによって生成される2つの画像の集合である視覚的イメージを用いた視覚的監視を,用語や記述を入力として行うことで,視覚的監督が統計的に有意な性能向上をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-08T21:50:05Z) - Visual Keyword Spotting with Attention [82.79015266453533]
本稿では,2つのストリームを取り込み,ビデオの視覚的エンコーディング,キーワードの音声的エンコーディングを行うトランスフォーマーモデルについて検討する。
本研究では,従来の視覚的キーワードスポッティングや唇読解法よりも優れていることを示す。
我々は,手話ビデオにおいて,孤立した口づけの極端な条件下での単語の発見能力を示す。
論文 参考訳(メタデータ) (2021-10-29T17:59:04Z) - Towards Dark Jargon Interpretation in Underground Forums [37.15748678894555]
暗黒ジャーゴンを自動同定し,解釈するための新しい手法を提案する。
暗黒語から隠れた意味のない「クリーン」語へのマッピングとして問題を定式化する。
本手法は,共有語彙上の確率分布の形でダークワードとクリーンワードの解釈可能な表現を利用する。
論文 参考訳(メタデータ) (2020-11-05T18:08:32Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - On Vocabulary Reliance in Scene Text Recognition [79.21737876442253]
ボキャブラリ内の単語を持つ画像に対して、手法は良好に機能するが、ボキャブラリ外の単語を持つ画像にはあまり一般化しない。
私たちはこの現象を「語彙依存」と呼んでいる。
本研究では,2家族のモデルが協調的に学習できるようにするための,シンプルで効果的な相互学習戦略を提案する。
論文 参考訳(メタデータ) (2020-05-08T11:16:58Z) - Decomposing Word Embedding with the Capsule Network [23.294890047230584]
そこで本稿では,曖昧な単語の教師なし単語の埋め込みをコンテキスト固有のセンス埋め込みに分解するカプセルネットワーク方式を提案する。
注意操作により、CapsDecE2Sは単語コンテキストを統合し、複数の形態素様ベクトルをコンテキスト固有の感覚埋め込みに再構成する。
本手法では,感覚学習を二分分類に変換し,マッチングラベルと非マッチングによって感覚の関係を明示的に学習する。
論文 参考訳(メタデータ) (2020-04-07T06:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。