論文の概要: The Defeat of the Winograd Schema Challenge
- arxiv url: http://arxiv.org/abs/2201.02387v1
- Date: Fri, 7 Jan 2022 10:22:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-10 14:49:13.982144
- Title: The Defeat of the Winograd Schema Challenge
- Title(参考訳): winograd schema challengeの敗北
- Authors: Vid Kocijan, Ernest Davis, Thomas Lukasiewicz, Gary Marcus and Leora
Morgenstern
- Abstract要約: ウィノグラードチャレンジは2011年にヘクター・レヴェスクによって提案された。
本稿では,ウィノグラードチャレンジの歴史を概観し,その意義を評価する。
- 参考スコア(独自算出の注目度): 39.330793509288284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Winograd Schema Challenge -- a set of twin sentences involving pronoun
reference disambiguation that seem to require the use of commonsense knowledge
-- was proposed by Hector Levesque in 2011. By 2019, a number of AI systems,
based on large pre-trained transformer-based language models and fine-tuned on
these kinds of problems, achieved better than 90% accuracy. In this paper, we
review the history of the Winograd Schema Challenge and assess its
significance.
- Abstract(参考訳): 2011年にヘクター・レヴェスク(Hector Levesque)が提唱した「ウィノグラード・スキーマ・チャレンジ(Winograd Schema Challenge)」。
2019年までに、多くのAIシステムは、大きなトレーニング済みのトランスフォーマーベースの言語モデルに基づいて、この種の問題に微調整され、90%以上の精度で達成された。
本稿では,ウィノグラード・スキーマ・チャレンジの歴史を概観し,その意義を評価する。
関連論文リスト
- Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge [5.326589324665934]
WinoVisは、マルチモーダルコンテキストにおける代名詞の曖昧さに関するテキスト・ツー・イメージ・モデルに特化して設計されたデータセットである。
連続したモデルバージョンの評価によると、段階的な進歩にもかかわらず、Stable Diffusion 2.0はWinoVisで56.7%の精度を達成した。
さらなるエラー分析は、複雑な視覚の世界を解釈し、相互作用する能力において、テキスト・ツー・イメージ・モデルを進めることを目的とした将来の研究にとって重要な領域を特定する。
論文 参考訳(メタデータ) (2024-05-25T15:28:22Z) - Exploring Question Decomposition for Zero-Shot VQA [99.32466439254821]
視覚的質問応答のための質問分解戦略について検討する。
モデル記述分解の素早い適用は性能を損なう可能性があることを示す。
モデル駆動選択的分解手法を導入し,予測と誤りの訂正を行う。
論文 参考訳(メタデータ) (2023-10-25T23:23:57Z) - Experience and Prediction: A Metric of Hardness for a Novel Litmus Test [1.3053649021965603]
ウィノグラードチャレンジ(WSC)は、新しいリトマステストとして研究コミュニティの中心的な側面となっている。
WSC上で人間のアダルトパフォーマンスのベースラインを確立した文献から、すべてのスキーマが同じであるとは限らないことが示されている。
本稿では,機械学習(ML)に基づく新しいシステムを提案することにより,従来のどの手法よりも高速かつ高精度にWinogradスキーマの硬さを出力できることを示す。
論文 参考訳(メタデータ) (2023-09-05T19:03:26Z) - NICE: CVPR 2023 Challenge on Zero-shot Image Captioning [149.28330263581012]
NICEプロジェクトは、堅牢な画像キャプションモデルを開発するためにコンピュータビジョンコミュニティに挑戦するために設計されている。
レポートには、新たに提案されたNICEデータセット、評価方法、課題結果、トップレベルのエントリの技術的な詳細などが含まれている。
論文 参考訳(メタデータ) (2023-09-05T05:32:19Z) - Generalised Winograd Schema and its Contextuality [0.0]
機械の知性を評価するために、2011年にレレスケが提案したウィノグラードチャレンジ(WSC)について検討する。
WSCは、ウィノグラードスキーマに従って構成された文の曖昧な代名詞を必要とする複数の選択質問の集合で構成されている。
オリジナルのWinogradは本質的に、文脈性を促進するには単純すぎる、と我々は主張する。
本稿では,Bell-CHSH測定シナリオに類似したスキーマを一般化するための新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2023-08-31T07:00:21Z) - WinoWhy: A Deep Diagnosis of Essential Commonsense Knowledge for
Answering Winograd Schema Challenge [55.39835612617972]
ウィノグラードチャレンジ(WSC)に答えるために,本質的なコモンセンス知識の包括的分類を初めて提示する。
それぞれの質問に対して、まずアノテータを招待し、正しい判断をする理由を提供し、次にそれらを6つの主要な知識カテゴリに分類する。
我々はWinoWhyと呼ばれる新しいタスクを開発しています。これは、モデルがすべてのWSC質問に対して非常によく似ているが間違った理由から、もっともらしい理由を区別する必要があります。
論文 参考訳(メタデータ) (2020-05-12T13:40:06Z) - A Review of Winograd Schema Challenge Datasets and Approaches [39.330793509288284]
ウィノグラードチャレンジ(Winograd Challenge)は、チューリングテストの代替として導入された常識的推論チャレンジである。
ウィノグラードスキーマ(ウィノグラードスキーマ、Winograd schema)は、1つまたは2つの単語で異なる一対の文で、非常にあいまいな代名詞を持ち、2つの文で異なる方法で解決される。
本稿では、導入以来発行されてきた既存のWinograd Challengeベンチマークデータセットとアプローチについてレビューする。
論文 参考訳(メタデータ) (2020-04-23T08:40:11Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。