論文の概要: A Review of Winograd Schema Challenge Datasets and Approaches
- arxiv url: http://arxiv.org/abs/2004.13831v1
- Date: Thu, 23 Apr 2020 08:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 08:52:42.785652
- Title: A Review of Winograd Schema Challenge Datasets and Approaches
- Title(参考訳): Winograd Schema Challengeデータセットとアプローチのレビュー
- Authors: Vid Kocijan, Thomas Lukasiewicz, Ernest Davis, Gary Marcus, Leora
Morgenstern
- Abstract要約: ウィノグラードチャレンジ(Winograd Challenge)は、チューリングテストの代替として導入された常識的推論チャレンジである。
ウィノグラードスキーマ(ウィノグラードスキーマ、Winograd schema)は、1つまたは2つの単語で異なる一対の文で、非常にあいまいな代名詞を持ち、2つの文で異なる方法で解決される。
本稿では、導入以来発行されてきた既存のWinograd Challengeベンチマークデータセットとアプローチについてレビューする。
- 参考スコア(独自算出の注目度): 39.330793509288284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Winograd Schema Challenge is both a commonsense reasoning and natural
language understanding challenge, introduced as an alternative to the Turing
test. A Winograd schema is a pair of sentences differing in one or two words
with a highly ambiguous pronoun, resolved differently in the two sentences,
that appears to require commonsense knowledge to be resolved correctly. The
examples were designed to be easily solvable by humans but difficult for
machines, in principle requiring a deep understanding of the content of the
text and the situation it describes. This paper reviews existing Winograd
Schema Challenge benchmark datasets and approaches that have been published
since its introduction.
- Abstract(参考訳): Winograd Schema Challengeは、チューリングテストの代替として導入された、常識的推論と自然言語理解の課題である。
ウィノグラード・スキーマ(winograd schema)は、1つまたは2つの単語で区別される文のペアであり、非常にあいまいな代名詞を持ち、2つの文で異なる解決がなされている。
これらの例は、人間が容易に解けるように設計され、機械にとって困難であり、原則として、テキストの内容とそれが記述する状況について深く理解する必要がある。
本稿では、導入以来発行されてきた既存のWinograd Schema Challengeベンチマークデータセットとアプローチについてレビューする。
関連論文リスト
- Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge [5.326589324665934]
WinoVisは、マルチモーダルコンテキストにおける代名詞の曖昧さに関するテキスト・ツー・イメージ・モデルに特化して設計されたデータセットである。
連続したモデルバージョンの評価によると、段階的な進歩にもかかわらず、Stable Diffusion 2.0はWinoVisで56.7%の精度を達成した。
さらなるエラー分析は、複雑な視覚の世界を解釈し、相互作用する能力において、テキスト・ツー・イメージ・モデルを進めることを目的とした将来の研究にとって重要な領域を特定する。
論文 参考訳(メタデータ) (2024-05-25T15:28:22Z) - Experience and Prediction: A Metric of Hardness for a Novel Litmus Test [1.3053649021965603]
ウィノグラードチャレンジ(WSC)は、新しいリトマステストとして研究コミュニティの中心的な側面となっている。
WSC上で人間のアダルトパフォーマンスのベースラインを確立した文献から、すべてのスキーマが同じであるとは限らないことが示されている。
本稿では,機械学習(ML)に基づく新しいシステムを提案することにより,従来のどの手法よりも高速かつ高精度にWinogradスキーマの硬さを出力できることを示す。
論文 参考訳(メタデータ) (2023-09-05T19:03:26Z) - Generalised Winograd Schema and its Contextuality [0.0]
機械の知性を評価するために、2011年にレレスケが提案したウィノグラードチャレンジ(WSC)について検討する。
WSCは、ウィノグラードスキーマに従って構成された文の曖昧な代名詞を必要とする複数の選択質問の集合で構成されている。
オリジナルのWinogradは本質的に、文脈性を促進するには単純すぎる、と我々は主張する。
本稿では,Bell-CHSH測定シナリオに類似したスキーマを一般化するための新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2023-08-31T07:00:21Z) - Why is Winoground Hard? Investigating Failures in Visuolinguistic
Compositionality [32.930639437999275]
Winogroundデータセットは、ペア画像と英語のキャプションにマッチするモデルに挑戦する。
我々は、Winogroundタスクの解決には、構成言語理解だけでなく、他の多くの能力も必要であることを示す。
本分析は,視覚的およびテキスト的表現を融合させることで,視覚言語モデルにおける大きな課題が生じることを示唆している。
論文 参考訳(メタデータ) (2022-11-01T22:16:58Z) - Learning Semantic Correspondence with Sparse Annotations [66.37298464505261]
密接な意味的対応を見つけることは、コンピュータビジョンの基本的な問題である。
本研究では,高密度な擬似ラベルを生成するための教師学習パラダイムを提案する。
また、擬似ラベルを識別するための2つの新しい戦略も開発している。
論文 参考訳(メタデータ) (2022-08-15T02:24:18Z) - The Defeat of the Winograd Schema Challenge [39.330793509288284]
ウィノグラードチャレンジは2011年にヘクター・レヴェスクによって提案された。
本稿では,ウィノグラードチャレンジの歴史を概観し,その意義を評価する。
論文 参考訳(メタデータ) (2022-01-07T10:22:08Z) - Constructing Phrase-level Semantic Labels to Form Multi-Grained
Supervision for Image-Text Retrieval [48.20798265640068]
テキスト中のミスマッチしたユニットの識別をより良くするためのフレーズレベルの監視を導入する。
一致した文のテキストシーングラフを構築し,フレーズレベルのラベルとしてエンティティとトリプルを抽出する。
トレーニングでは,グローバルな視点とローカルな視点の両方から,マルチスケールのマッチング損失を提案する。
論文 参考訳(メタデータ) (2021-09-12T14:21:15Z) - A Brief Survey and Comparative Study of Recent Development of Pronoun
Coreference Resolution [55.39835612617972]
PCR(Pronoun Coreference Resolution)は、プロノミナルな表現を、それらが参照するすべての言及に対して解決するタスクである。
1つの重要な自然言語理解(NLU)コンポーネントとして、代名詞分解は多くの下流タスクにおいて不可欠であり、既存のモデルでは依然として困難である。
我々は、現在のモデルが標準評価セットで優れたパフォーマンスを達成しているにもかかわらず、実際のアプリケーションで使用する準備ができていないことを示すために、広範な実験を行っている。
論文 参考訳(メタデータ) (2020-09-27T01:40:01Z) - WinoWhy: A Deep Diagnosis of Essential Commonsense Knowledge for
Answering Winograd Schema Challenge [55.39835612617972]
ウィノグラードチャレンジ(WSC)に答えるために,本質的なコモンセンス知識の包括的分類を初めて提示する。
それぞれの質問に対して、まずアノテータを招待し、正しい判断をする理由を提供し、次にそれらを6つの主要な知識カテゴリに分類する。
我々はWinoWhyと呼ばれる新しいタスクを開発しています。これは、モデルがすべてのWSC質問に対して非常によく似ているが間違った理由から、もっともらしい理由を区別する必要があります。
論文 参考訳(メタデータ) (2020-05-12T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。