論文の概要: Sinhala Physical Common Sense Reasoning Dataset for Global PIQA
- arxiv url: http://arxiv.org/abs/2602.02207v1
- Date: Mon, 02 Feb 2026 15:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:34.244853
- Title: Sinhala Physical Common Sense Reasoning Dataset for Global PIQA
- Title(参考訳): グローバルPIQAのためのSinhala物理コモンセンス推論データセット
- Authors: Nisansa de Silva, Surangika Ranathunga,
- Abstract要約: 本論文は,Global PIQAの一部として作成したSinhala物理感覚推論データセットについて述べる。
110個の人によって作成され、検証されたデータサンプルが含まれており、各サンプルはプロンプト、対応する正しい回答、間違った回答で構成されている。
- 参考スコア(独自算出の注目度): 4.035515263193681
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the first-ever Sinhala physical common sense reasoning dataset created as part of Global PIQA. It contains 110 human-created and verified data samples, where each sample consists of a prompt, the corresponding correct answer, and a wrong answer. Most of the questions refer to the Sri Lankan context, where Sinhala is an official language.
- Abstract(参考訳): 本論文は,Global PIQAの一部として作成したSinhala物理感覚推論データセットについて述べる。
110個の人によって作成され、検証されたデータサンプルが含まれており、各サンプルはプロンプト、対応する正しい回答、間違った回答で構成されている。
ほとんどの質問は、シンハラが公用語であるスリランカの文脈に言及している。
関連論文リスト
- Prakriti200: A Questionnaire-Based Dataset of 200 Ayurvedic Prakriti Assessments [0.0]
このデータセットは、標準化されたバイリンガル(英ヒンディー語)のPrakriti Assessment Questionnaireへの応答を提供する。
アンケートは, 体の特徴, 食欲, 睡眠パターン, エネルギーレベル, 気質をカバーした24項目からなる。
すべての質問はバイアスを最小限にするために強制的で中立的に表現され、ドーシャラベル(Vata、Pitta、Kapha)は参加者から隠されている。
論文 参考訳(メタデータ) (2025-10-05T16:47:51Z) - TyDi QA-WANA: A Benchmark for Information-Seeking Question Answering in Languages of West Asia and North Africa [13.107551474252379]
アジア西部とアフリカ北部の10の言語品種に28K例からなる質問応答データセットTyDi QA-WANAを提示する。
データ収集プロセスは、情報検索の質問を引き出すように設計されている。
論文 参考訳(メタデータ) (2025-07-23T17:20:28Z) - PeerQA: A Scientific Question Answering Dataset from Peer Reviews [51.95579001315713]
実世界の科学的、文書レベルの質問回答データセットであるPeerQAを提示する。
データセットには208の学術論文から579のQAペアが含まれており、MLとNLPが多数を占めている。
収集したデータセットを詳細に分析し、3つのタスクのベースラインシステムを確立する実験を行う。
論文 参考訳(メタデータ) (2025-02-19T12:24:46Z) - To the Globe (TTG): Towards Language-Driven Guaranteed Travel Planning [54.9340658451129]
To the Globe(TTG)は、ユーザから自然言語要求を受け取り、それをシンボリックフォームに変換するリアルタイムのデモシステムである。
システム全体の応答に5秒を要し、保証されたイテナリでユーザ要求に応答する。
ユーザによる評価では、TTGは生成した繰り返しで35-40%のネットプロモータースコア(NPS)を一貫して達成する。
論文 参考訳(メタデータ) (2024-10-21T19:30:05Z) - MahaSQuAD: Bridging Linguistic Divides in Marathi Question-Answering [0.4194295877935868]
この研究は、低リソース言語における効率的なQnAデータセットの欠如のギャップを埋めようとしている。
118,516のトレーニング、11,873のバリデーション、11,803のテストサンプルからなる、Indic言語Marathiのための最初の完全なSQuADデータセットであるMahaSQuADを紹介した。
論文 参考訳(メタデータ) (2024-04-20T12:16:35Z) - Generalizable Neuro-symbolic Systems for Commonsense Question Answering [67.72218865519493]
この章では、言語理解に適したニューロシンボリックモデルが、下流タスクにおけるドメインの一般化性と堅牢性を実現する方法について説明する。
ニューラルネットワークモデルと知識グラフを統合するための様々な方法について議論する。
論文 参考訳(メタデータ) (2022-01-17T06:13:37Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - Question Answering over Knowledge Bases by Leveraging Semantic Parsing
and Neuro-Symbolic Reasoning [73.00049753292316]
本稿では,意味解析と推論に基づくニューロシンボリック質問回答システムを提案する。
NSQAはQALD-9とLC-QuAD 1.0で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-12-03T05:17:55Z) - A New Dataset for Natural Language Inference from Code-mixed
Conversations [17.172612406457752]
我々は,コード混合自然言語推論 (NLI) のための最初のデータセットを提示する。
我々はヒンディー語映画(ボリウッド)のデータを前提として、ヒンディー語と英語のバイリンガルからのクラウドソース仮説を用いている。
得られたデータセットでよく見られる言語現象を推定するために,広範な分析を行う。
論文 参考訳(メタデータ) (2020-04-10T14:32:01Z) - Asking and Answering Questions to Evaluate the Factual Consistency of
Summaries [80.65186293015135]
本稿では,QAGS (kags) と呼ばれる自動評価プロトコルを提案する。
QAGSは、要約とそのソースについて質問すると、要約が実際にソースと一致している場合、同様の回答が得られます。
QAGSは、使いやすく、現実的に一貫性のあるテキストを自動的に生成するための有望なツールであると考えています。
論文 参考訳(メタデータ) (2020-04-08T20:01:09Z) - TyDi QA: A Benchmark for Information-Seeking Question Answering in
Typologically Diverse Languages [27.588857710802113]
TyDi QAは、204Kの問合せ対を持つ11の類型的多様言語をカバーする質問応答データセットである。
本稿では,観測された言語現象のデータ品質と例レベルの定性言語分析について定量的に分析する。
論文 参考訳(メタデータ) (2020-03-10T21:11:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。