論文の概要: Persian Causality Corpus (PerCause) and the Causality Detection
Benchmark
- arxiv url: http://arxiv.org/abs/2106.14165v1
- Date: Sun, 27 Jun 2021 07:54:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:12:55.332447
- Title: Persian Causality Corpus (PerCause) and the Causality Detection
Benchmark
- Title(参考訳): ペルシャ因果性コーパス(原因)と因果性検出ベンチマーク
- Authors: Zeinab Rahimi, Mehrnoush ShamsFard
- Abstract要約: 我々はペルシャ語のための因果的人間注釈コーパスを準備している。
このコーパスは4446の文と5128の因果関係からなる。
我々はこのコーパスを用いて因果要素境界を検出するシステムの訓練を行っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing causal elements and causal relations in text is one of the
challenging issues in natural language processing; specifically, in low
resource languages such as Persian. In this research we prepare a causality
human annotated corpus for the Persian language which consists of 4446
sentences and 5128 causal relations and three labels of cause, effect and
causal mark -- if possibl -- are specified for each relation. We have used this
corpus to train a system for detecting causal elements boundaries. Also, we
present a causality detection benchmark for three machine learning methods and
two deep learning systems based on this corpus. Performance evaluations
indicate that our best total result is obtained through CRF classifier which
has F-measure of 0.76 and the best accuracy obtained through Bi-LSTM-CRF deep
learning method with Accuracy equal to %91.4.
- Abstract(参考訳): テキストにおける因果要素と因果関係を認識することは、自然言語処理において難しい問題の一つであり、特にペルシア語のような低資源言語では問題となる。
本研究では, 4446文と5128文の因果関係と, possibl の場合の因果関係, 効果, 因果関係の3つのラベルをそれぞれ指定したペルシア語用因果関係コーパスを作成する。
我々はこのコーパスを用いて因果要素境界を検出するシステムを訓練した。
また,このコーパスに基づく3つの機械学習手法と2つのディープラーニングシステムの因果検出ベンチマークを提案する。
評価結果から,F値0.76のCRF分類器と,精度%91.4のBi-LSTM-CRF深層学習法により得られた最良の精度が得られた。
関連論文リスト
- Exploring the Correlation between Human and Machine Evaluation of Simultaneous Speech Translation [0.9576327614980397]
本研究では,人間の評価と相関関係を解析することにより,同時解釈評価における自動メトリクスの信頼性を評価することを目的とする。
ベンチマークでは,言語専門家による人間の評価を用いて,文の埋め込みと大規模言語モデルとの相関性を評価する。
その結果, GPTモデル, 特に直接的プロンプトを用いた GPT-3.5 は, ソーステキストとターゲットテキストのセマンティックな類似性の観点から, 人間の判断と最強の相関を示すことが示唆された。
論文 参考訳(メタデータ) (2024-06-14T14:47:19Z) - Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data [89.2410799619405]
実世界のデータを用いた統計的および因果推論において,大規模言語モデルの能力を評価するために,データベンチマークを用いた定量的推論を導入する。
このベンチマークは、教科書、オンライン学習教材、学術論文のデータシートを伴う411の質問のデータセットで構成されている。
データとテキストに対するモデルの量的推論能力を比較するために、ベンチマークを290のテキストのみの質問、すなわちQRTextで強化する。
論文 参考訳(メタデータ) (2024-02-27T16:15:03Z) - Neural-Symbolic Inference for Robust Autoregressive Graph Parsing via
Compositional Uncertainty Quantification [28.084115398817016]
モデル信頼度から得られるニューラルシンボリック推論に対する構成性を考慮したアプローチについて検討する。
我々は,標準内ドメインと7つのOOD文法の多種多様なスイートにおける英語資源解析問題(ERG)のアプローチを実証的に検討した。
提案手法は, ニューラルネットワークおよび記号的アプローチに対して, 集約されたSグラマースコアの35.26%と35.60%の誤差を減少させ, ニューラルモデル上でのキーテール言語カテゴリーにおいて, 14%の絶対精度向上をもたらす。
論文 参考訳(メタデータ) (2023-01-26T23:11:03Z) - A transformer-based spelling error correction framework for Bangla and resource scarce Indic languages [2.5874041837241304]
スペル訂正(スペルりょう、英: Spelling error correction)は、テキスト中のミスペル語を識別し、修正するタスクである。
バングラ語と資源不足のIndic言語におけるスペルエラー訂正の取り組みは、ルールベース、統計、機械学習ベースの手法に重点を置いていた。
本稿では,従来の問題に対処し,デノナイジング変換器をベースとした新しい検出器-ピューリフィエータ-コレクタDPCを提案する。
論文 参考訳(メタデータ) (2022-11-07T17:59:05Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - G-DetKD: Towards General Distillation Framework for Object Detectors via
Contrastive and Semantic-guided Feature Imitation [49.421099172544196]
そこで本研究では,すべてのピラミッドレベルにまたがる特徴ペア間のソフトマッチングを自動的に行う,意味誘導型特徴模倣手法を提案する。
また,異なる特徴領域間の関係で符号化された情報を効果的に捉えるために,コントラスト蒸留を導入する。
本手法は,(1)フレームワークのコンポーネントを別々に使用した場合に,既存の検出KD技術よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-08-17T07:44:27Z) - An analysis of full-size Russian complexly NER labelled corpus of
Internet user reviews on the drugs based on deep learning and language neural
nets [94.37521840642141]
我々は、インターネットユーザーレビューのフルサイズのロシアの複雑なNERラベルコーパスを提示します。
高度なディープラーニングニューラルネットワークセットは、ロシアのテキストから薬理学的に有意義な実体を抽出するために使用される。
論文 参考訳(メタデータ) (2021-04-30T19:46:24Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z) - Fast and Robust Unsupervised Contextual Biasing for Speech Recognition [16.557586847398778]
明示的な文脈言語モデルを必要としない代替手法を提案する。
学習コーパスからシステム語彙の各単語に対するバイアススコアを導出する。
関連するコンテキストが利用できる場合,認識精度が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-05-04T17:29:59Z) - Text Complexity Classification Based on Linguistic Information:
Application to Intelligent Tutoring of ESL [0.0]
本研究の目的は、英語を第二言語(ESL)学習者として教える文脈の中で、テキストの複雑さを識別できる分類器を構築することである。
ESLの専門家によって既に3つの難易度に分類されていた6171テキストのコーパスを用いて、5つの機械学習アルゴリズムを用いて異なる実験を行った。
その結果, 言語学的特徴は, 総合的な分類性能に優れていた。
論文 参考訳(メタデータ) (2020-01-07T02:42:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。