論文の概要: A Comparative Investigation of Compositional Syntax and Semantics in DALL-E 2
- arxiv url: http://arxiv.org/abs/2403.12294v1
- Date: Mon, 18 Mar 2024 22:33:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 18:02:18.190942
- Title: A Comparative Investigation of Compositional Syntax and Semantics in DALL-E 2
- Title(参考訳): DALL-E 2における合成構文と意味論の比較検討
- Authors: Elliot Murphy, Jill de Villiers, Sofia Lucero Morales,
- Abstract要約: 本研究は,幼児の理解テストにおいて,DALL-E 2が言語的指示の意味を視覚的にどのように表現するかを比較検討した。
結果,若年者(2歳)においても,DALL-E2生成画像が子どもの意味的正確性に合致する状況はみられなかった。
- 参考スコア(独自算出の注目度): 0.9217021281095907
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this study we compared how well DALL-E 2 visually represented the meaning of linguistic prompts also given to young children in comprehension tests. Sentences representing fundamental components of grammatical knowledge were selected from assessment tests used with several hundred English-speaking children aged 2-7 years for whom we had collected original item-level data. DALL-E 2 was given these prompts five times to generate 20 cartoons per item, for 9 adult judges to score. Results revealed no conditions in which DALL-E 2-generated images that matched the semantic accuracy of children, even at the youngest age (2 years). DALL-E 2 failed to assign the appropriate roles in reversible forms; it failed on negation despite an easier contrastive prompt than the children received; it often assigned the adjective to the wrong noun; it ignored implicit agents in passives. This work points to a clear absence of compositional sentence representations for DALL-E 2.
- Abstract(参考訳): 本研究は,DALL-E 2が,幼児の理解テストにおける言語指導の意味を視覚的にどう表現するかを比較検討した。
2~7歳の英語を話す数百人の子どもを対象にした評価試験から,文法知識の基本的構成要素を表す文を抽出した。
DALL-E 2は、大人9人の審査員が得点するために、これらのプロンプトを5回与え、アイテムごとに20の漫画を制作した。
その結果,若年者(2歳)においても,DALL-E2生成画像が子供の意味的精度に合致する状況はみられなかった。
DALL-E 2 は、可逆的な形で適切な役割を割り当てることに失敗した; 子どもが受け取っていたよりコントラストの強いプロンプトにもかかわらず否定することに失敗した; 間違った名詞に形容詞を割り当てることがしばしばあり、受身者の暗黙のエージェントを無視した。
この研究は、DALL-E 2の合成文表現が明らかに存在しないことを示唆している。
関連論文リスト
- Killing Two Flies with One Stone: An Attempt to Break LLMs Using English->Icelandic Idioms and Proper Names [0.7499722271664147]
本稿は,英語・アイスランド語翻訳における慣用的表現と固有名称について述べる。
まず、一般的な英語の慣用表現の翻訳におけるMTシステムの能力を評価する。
2つ目のテストスイートはアイスランドの地名に翻訳され、正しく入力される場所名で構成されている。
論文 参考訳(メタデータ) (2024-10-04T12:57:00Z) - The Causal Influence of Grammatical Gender on Distributional Semantics [87.8027818528463]
言語間のジェンダー割り当てがどの程度意味を持つかは、言語学と認知科学における研究の活発な領域である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
名詞の意味を制御した場合、文法的性別と形容詞的選択の関係は、ほぼゼロであり、無意味である。
論文 参考訳(メタデータ) (2023-11-30T13:58:13Z) - Building a Non-native Speech Corpus Featuring Chinese-English Bilingual
Children: Compilation and Rationale [3.924235219960689]
本稿では,5歳から6歳までの中英語児童の物語から成る非母語音声コーパスについて紹介する。
英語(L2)で物語理解テストを受ける子どもの合計6.5時間について,人格スコアや文法的・発音的誤りの注釈とともに紹介する。
子どもたちは中国語(L1)での並行MAIN試験も参照目的に完了した。
論文 参考訳(メタデータ) (2023-04-30T10:41:43Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - Detecting Euphemisms with Literal Descriptions and Visual Imagery [18.510509701709054]
本稿では,EMNLP 2022とともに第3回言語処理ワークショップが主催する,エフェミズム検出共有タスクのための2段階のシステムについて述べる。
第1段階では、入力テキストプロンプトにリテラル記述を組み込むことにより、このあいまいさを軽減することを目指しており、このような直接的な監督が目覚ましい性能向上をもたらすことが判明した。
第2段階では,テキスト・ツー・イメージ・モデルによって生成される2つの画像の集合である視覚的イメージを用いた視覚的監視を,用語や記述を入力として行うことで,視覚的監督が統計的に有意な性能向上をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-08T21:50:05Z) - Question-Interlocutor Scope Realized Graph Modeling over Key Utterances
for Dialogue Reading Comprehension [61.55950233402972]
本稿では,対話読解のためのキーワード抽出手法を提案する。
複数の連続した発話によって形成された単位に対して予測を行い、より多くの回答を含む発話を実現する。
発話のテキスト上に構築されたグラフとして,質問-対話者スコープ実現グラフ(QuISG)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-26T04:00:42Z) - DALL-E 2 Fails to Reliably Capture Common Syntactic Processes [0.0]
我々は,DALL-E2が構成性に関連する8つの文法的現象を捉える能力について分析した。
DALL-E 2は構文に整合した意味を確実に推測できないことを示す。
論文 参考訳(メタデータ) (2022-10-23T23:56:54Z) - Subject Verb Agreement Error Patterns in Meaningless Sentences: Humans
vs. BERT [64.40111510974957]
英語における主語数合意に意味が干渉するかどうかを検証する。
意味的によく形づくられた、意味のないアイテムを生成します。
BERTと人間はどちらも、セマンティックな操作に敏感である。
論文 参考訳(メタデータ) (2022-09-21T17:57:23Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - Assessing the Helpfulness of Learning Materials with Inference-Based
Learner-Like Agent [21.877314843300287]
本稿では,学習者の振る舞いを模倣し,優れた学習教材を識別する推論型学習エージェントを提案する。
実験結果から,提案エージェントは学習者の行動が良好であることがわかった。
ユーザスタディの結果から,提案するエージェントは,学生がより簡単かつ効率的に学習できるサンプル文を見つけることができることがわかった。
論文 参考訳(メタデータ) (2020-10-05T17:24:57Z) - Visually Grounded Compound PCFGs [65.04669567781634]
言語理解のための視覚的基盤の爆発は、最近多くの注目を集めている。
本研究では,視覚的な文法誘導について検討し,未ラベルテキストとその視覚的キャプションから選挙区を学習する。
論文 参考訳(メタデータ) (2020-09-25T19:07:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。