論文の概要: Generalised Winograd Schema and its Contextuality
- arxiv url: http://arxiv.org/abs/2308.16498v1
- Date: Thu, 31 Aug 2023 07:00:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 15:34:30.680956
- Title: Generalised Winograd Schema and its Contextuality
- Title(参考訳): 一般化ウィノグラードスキーマとその文脈性
- Authors: Kin Ian Lo (University College London, London, UK), Mehrnoosh
Sadrzadeh (University College London, London, UK), Shane Mansfield (Quandela,
Paris, France)
- Abstract要約: 機械の知性を評価するために、2011年にレレスケが提案したウィノグラードチャレンジ(WSC)について検討する。
WSCは、ウィノグラードスキーマに従って構成された文の曖昧な代名詞を必要とする複数の選択質問の集合で構成されている。
オリジナルのWinogradは本質的に、文脈性を促進するには単純すぎる、と我々は主張する。
本稿では,Bell-CHSH測定シナリオに類似したスキーマを一般化するための新しいメカニズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ambiguities in natural language give rise to probability distributions over
interpretations. The distributions are often over multiple ambiguous words at a
time; a multiplicity which makes them a suitable topic for sheaf-theoretic
models of quantum contextuality. Previous research showed that different
quantitative measures of contextuality correlate well with Psycholinguistic
research on lexical ambiguities. In this work, we focus on coreference
ambiguities and investigate the Winograd Schema Challenge (WSC), a test
proposed by Levesque in 2011 to evaluate the intelligence of machines. The WSC
consists of a collection of multiple-choice questions that require
disambiguating pronouns in sentences structured according to the Winograd
schema, in a way that makes it difficult for machines to determine the correct
referents but remains intuitive for human comprehension. In this study, we
propose an approach that analogously models the Winograd schema as an
experiment in quantum physics. However, we argue that the original Winograd
Schema is inherently too simplistic to facilitate contextuality. We introduce a
novel mechanism for generalising the schema, rendering it analogous to a
Bell-CHSH measurement scenario. We report an instance of this generalised
schema, complemented by the human judgements we gathered via a crowdsourcing
platform. The resulting model violates the Bell-CHSH inequality by 0.192, thus
exhibiting contextuality in a coreference resolution setting.
- Abstract(参考訳): 自然言語の曖昧さは解釈よりも確率分布をもたらす。
分布は一度に複数の曖昧な単語にまたがることが多く、この多重性は量子文脈性の層理論モデルに適した話題となる。
これまでの研究では、文脈性の異なる定量的尺度は、語彙的曖昧性に関する心理学的な研究とよく相関していた。
本研究では,2011年にレレスケが提案した機械の知性評価試験であるWinograd Schema Challenge (WSC) について検討する。
WSCは、ウィノグラードスキーマに従って構築された文で不明瞭な代名詞を必要とする複数の選択質問の集合で構成されており、機械が正しい参照を判断することが困難であるが、人間の理解には直感的である。
本研究では,量子物理学の実験としてウィノグラードスキーマを類似的にモデル化する手法を提案する。
しかし、元のWinograd Schemaは本来、文脈性を促進するには単純すぎると論じる。
スキーマを一般化するための新しいメカニズムを導入し,bell-chsh測定シナリオと類似させる。
クラウドソーシングプラットフォームを通じて収集した人間の判断を補完する,この汎用スキーマの例を報告する。
その結果、ベル=チェシュの不等式は0.192で破られ、コリファレンス解像度設定において文脈性を示す。
関連論文リスト
- Overview of PerpectiveArg2024: The First Shared Task on Perspective Argument Retrieval [56.66761232081188]
本稿では,社会における少数派・多数派を代表する年齢,性別,政治的態度など,人口・社会文化(社会)の多様性を包括する新しいデータセットを提案する。
パースペクティビズムを取り入れる上での重大な課題は、特に社会的なプロファイルを明示的に提供せずに、議論のテキストのみに基づくパーソナライズを目指す場合である。
パーソナライズと分極の低減を図るため, パーソナライズを最適化するためには, パーソナライズされた論証検索をブートストラップするが, さらなる研究が不可欠である。
論文 参考訳(メタデータ) (2024-07-29T03:14:57Z) - Categorical Syllogisms Revisited: A Review of the Logical Reasoning Abilities of LLMs for Analyzing Categorical Syllogism [62.571419297164645]
本稿では,分類的シロジズムを解析するための大規模言語モデルの論理的推論能力に関する先行研究を体系的に概説する。
まず、純粋に論理的な観点から分類的シロジズムの可能なバリエーションについて検討する。
次に、既存のデータセットでテストされた基本的な設定(ムードとフィギュア)を調べます。
論文 参考訳(メタデータ) (2024-06-26T21:17:20Z) - Experience and Prediction: A Metric of Hardness for a Novel Litmus Test [1.3053649021965603]
ウィノグラードチャレンジ(WSC)は、新しいリトマステストとして研究コミュニティの中心的な側面となっている。
WSC上で人間のアダルトパフォーマンスのベースラインを確立した文献から、すべてのスキーマが同じであるとは限らないことが示されている。
本稿では,機械学習(ML)に基づく新しいシステムを提案することにより,従来のどの手法よりも高速かつ高精度にWinogradスキーマの硬さを出力できることを示す。
論文 参考訳(メタデータ) (2023-09-05T19:03:26Z) - On the Efficacy of Sampling Adapters [82.5941326570812]
サンプリングアダプタを理解するための統一的なフレームワークを提案する。
彼らが実施するシフトは、正確さとリコールの間のトレードオフと見なすことができる、と私たちは主張する。
いくつかの精度強調尺度は、サンプリングアダプタが真の分布とより整合した確率分布をもたらすことを確実に示している。
論文 参考訳(メタデータ) (2023-07-07T17:59:12Z) - Causal interventions expose implicit situation models for commonsense
language understanding [3.290878132806227]
我々は、一つの文脈キューがあいまいな代名詞の解釈をシフトさせるWinograd Challengeのパフォーマンスを分析する。
我々は、コンテキストワードから情報を伝達する責任を負う注目ヘッドの回路を同定する。
これらの分析は、代名詞分解を導くために暗黙の状況モデルを構築する異なる経路を示唆している。
論文 参考訳(メタデータ) (2023-06-06T17:36:43Z) - The Defeat of the Winograd Schema Challenge [39.330793509288284]
ウィノグラードチャレンジは2011年にヘクター・レヴェスクによって提案された。
本稿では,ウィノグラードチャレンジの歴史を概観し,その意義を評価する。
論文 参考訳(メタデータ) (2022-01-07T10:22:08Z) - Schr\"odinger's Tree -- On Syntax and Neural Language Models [10.296219074343785]
言語モデルは、NLPのワークホースとして登場し、ますます流動的な生成能力を示している。
我々は、多くの次元にまたがる明瞭さの欠如を観察し、研究者が形成する仮説に影響を及ぼす。
本稿では,構文研究における様々な研究課題の意義について概説する。
論文 参考訳(メタデータ) (2021-10-17T18:25:23Z) - On the Faithfulness Measurements for Model Interpretations [100.2730234575114]
ポストホックな解釈は、自然言語処理(NLP)モデルがどのように予測を行うかを明らかにすることを目的とする。
これらの問題に取り組むために,我々は,削除基準,解釈の感度,解釈の安定性という3つの基準から始める。
これらの忠実性概念のデシデラタムに動機づけられ、敵対的領域からのテクニックを採用する新しい解釈方法のクラスを導入する。
論文 参考訳(メタデータ) (2021-04-18T09:19:44Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - Loss re-scaling VQA: Revisiting the LanguagePrior Problem from a
Class-imbalance View [129.392671317356]
本稿では,クラス不均衡の観点から,VQAにおける言語先行問題を理解することを提案する。
これは、なぜVQAモデルが頻繁に、そして明らかに間違った答えをもたらすのかを明確に示している。
また,顔認識や画像分類などの他のコンピュータビジョンタスクに対して,クラス不均衡解釈方式の有効性を正当化する。
論文 参考訳(メタデータ) (2020-10-30T00:57:17Z) - A Review of Winograd Schema Challenge Datasets and Approaches [39.330793509288284]
ウィノグラードチャレンジ(Winograd Challenge)は、チューリングテストの代替として導入された常識的推論チャレンジである。
ウィノグラードスキーマ(ウィノグラードスキーマ、Winograd schema)は、1つまたは2つの単語で異なる一対の文で、非常にあいまいな代名詞を持ち、2つの文で異なる方法で解決される。
本稿では、導入以来発行されてきた既存のWinograd Challengeベンチマークデータセットとアプローチについてレビューする。
論文 参考訳(メタデータ) (2020-04-23T08:40:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。