論文の概要: A Puzzle-Based Dataset for Natural Language Inference
- arxiv url: http://arxiv.org/abs/2112.05742v1
- Date: Fri, 10 Dec 2021 18:53:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 15:18:07.886502
- Title: A Puzzle-Based Dataset for Natural Language Inference
- Title(参考訳): 自然言語推論のためのパズルベースデータセット
- Authors: Roxana Szomiu and Adrian Groza
- Abstract要約: このデータセットには、パズル、ニー、ニーブ、ゼブラパズルという3つの領域の自然言語の論理パズルが含まれている。
それぞれのパズルは、テキストに現れる関係と個人に基づいて生成できるアトミックな質問の集合全体と関連付けられている。
- 参考スコア(独自算出の注目度): 0.9594432031144714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We provide here a dataset for tasks related to natural language understanding
and natural language inference. The dataset contains logical puzzles in natural
language from three domains: comparing puzzles, knighs and knaves, and zebra
puzzles. Each puzzle is associated with the entire set of atomic questions that
can be generated based on the relations and individuals occurring in the text.
For each question we provide the correct answer: entailment, contradiction or
ambiguity. The answer's correctness is verified against theorem provers. Good
puzzles have two properties: (i) each piece of information is necessary and
(ii) no unnecessary information is provided. These properties make puzzles
interesting candidates for machine comprehension tasks.
- Abstract(参考訳): ここでは自然言語理解と自然言語推論に関連するタスクのデータセットを提供する。
このデータセットには、パズル、ニー、ニーブ、ゼブラパズルという3つの領域の自然言語の論理パズルが含まれている。
各パズルは、テキスト内で発生した関係と個人に基づいて生成できる原子の質問のセットに関連付けられている。
各質問に対して、私たちは正しい答えを提供する: 細部、矛盾、曖昧さ。
答えの正しさは定理証明者に対して検証される。
良いパズルには2つの特性があります
i)各情報の断片が必要であり、かつ
(ii)不要な情報は提供されない。
これらの性質により、パズルは機械理解タスクの候補として興味深い。
関連論文リスト
- Space3D-Bench: Spatial 3D Question Answering Benchmark [49.259397521459114]
Space3D-Benchは、Replicaデータセットのシーンに関連する1000の一般的な空間的質問と回答の集合である。
本研究では,事前定義された接地真実解に基づいて,自然言語応答を評価評価するシステムを提案する。
最後に,基礎モデルの世界理解をリッチな文脈検索と統合したRAG3D-Chatというベースラインを導入する。
論文 参考訳(メタデータ) (2024-08-29T16:05:22Z) - Missed Connections: Lateral Thinking Puzzles for Large Language Models [2.1374208474242815]
ニューヨーク・タイムズが毎日発行するコネクショニオンパズルは、16ワードのバンクを4つのグループに分け、それぞれが共通のテーマに関連付けている。
自動AIシステムがConnectionsをプレイする能力について検討し、抽象的推論のための自動ベンチマークとしてゲームの可能性を探る。
論文 参考訳(メタデータ) (2024-04-17T20:31:05Z) - Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious
Challenges in Multimodal Reasoning [24.386388107656334]
本稿では,視覚的質問応答の文脈内での多モーダルパズル解決の新たな課題を紹介する。
本稿では,アルゴリズムパズルの解法におけるマルチモーダル言語モデルの能力に挑戦し,評価するための新しいデータセットAlgoVQAを提案する。
論文 参考訳(メタデータ) (2024-03-06T17:15:04Z) - Complex Reading Comprehension Through Question Decomposition [48.256818683923626]
本稿では,言語モデルによる難解なマルチホップ質問の理解を支援する新しい学習手法を提案する。
我々のモデルはまず、訓練可能な質問分解器によって、各マルチホップ質問をいくつかのサブクエストに分解することを学ぶ。
我々は,シーケンス・ツー・シーケンス方式で解答を予測するために,読解理解モデルを活用する。
論文 参考訳(メタデータ) (2022-11-07T02:54:04Z) - Down and Across: Introducing Crossword-Solving as a New NLP Benchmark [11.194615436370507]
25年にわたるニューヨーク・タイムズの日刊クロスワードから収集したクロスワードパズルのコーパスの仕様を公表する。
これらのパズルには、歴史的、事実的、単語の意味、同義語/匿名、補足語、略語、接頭辞/接頭辞、単語プレイ、言語横断の様々な手がかりが含まれている。
論文 参考訳(メタデータ) (2022-05-20T21:16:44Z) - Natural language understanding for logical games [0.9594432031144714]
自然言語の論理パズルを自動的に解けるシステムを開発した。
私たちのソリューションは推論モジュールと推論モジュールで構成されています。
また、各パズルに関連する自然言語に関する質問に対して、Yes/Noの回答を提供する能力を、ソフトウェアエージェントに提供します。
論文 参考訳(メタデータ) (2021-10-01T17:36:14Z) - BiRdQA: A Bilingual Dataset for Question Answering on Tricky Riddles [82.63394952538292]
バイリンガル質問応答データセットであるBiRdQAを導入する。
既存のモノリンガルQAモデルとマルチリンガルQAモデルは、我々のデータセットではうまく機能せず、機械が難解な謎を解くために人間を倒すには長い道のりがあることを示している。
論文 参考訳(メタデータ) (2021-09-23T00:46:47Z) - Programming Puzzles [31.797853936252594]
我々はPython Programming Puzzles (P3)のオープンソースデータセットをリリースしました。
パズルは、各パズルが検証子$f$のソースコードによって完全に指定されることで客観的である。
答えキーやインプット/アウトプットの例は必要ないし、自然言語の理解にも依存しない。
論文 参考訳(メタデータ) (2021-06-10T14:37:28Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - PuzzLing Machines: A Challenge on Learning From Small Data [64.513459448362]
我々は,高校生を対象としたLinguistic OlympiadsのRosetta StoneパズルからなるPuzzLing Machinesという,小さなデータから学ぶための課題を紹介した。
私たちのチャレンジには、81言語から幅広い言語現象をカバーする約100のパズルが含まれています。
単純な統計アルゴリズムと最先端のディープニューラルモデルの両方が、予想通り、この課題に対して不十分に実行可能であることを示す。
論文 参考訳(メタデータ) (2020-04-27T20:34:26Z) - VQA-LOL: Visual Question Answering under the Lens of Logic [58.30291671877342]
画像に関する疑問に答えるように訓練された視覚的質問応答システムが,複数の質問の論理的構成に答えられるかどうかを検討する。
本稿では,VQAデータセットをベンチマークとして拡張し,論理的構成や言語的変換を含む質問を行う。
本稿では,論理的結合性を理解するために質問注意と論理意図を用いたLOLモデルと,新しいFr'echet-Compatibility Lossを提案する。
論文 参考訳(メタデータ) (2020-02-19T17:57:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。