論文の概要: Traditional Machine Learning and Deep Learning Models for Argumentation
Mining in Russian Texts
- arxiv url: http://arxiv.org/abs/2106.14438v1
- Date: Mon, 28 Jun 2021 07:44:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:11:34.532264
- Title: Traditional Machine Learning and Deep Learning Models for Argumentation
Mining in Russian Texts
- Title(参考訳): ロシアテキストの議論マイニングのための伝統的な機械学習とディープラーニングモデル
- Authors: Irina Fishcheva, Valeriya Goloviznina, Evgeny Kotelnikov
- Abstract要約: この領域におけるロシア語の研究の大きな障害は、注釈付きロシア語テキストコーパスの欠如である。
本稿では,ロシア語版Argumentative Micro Corpus(ArgMicro)を拡張したPersuasive Essays Corpus(PersEssays)の機械翻訳による議論の質向上の可能性を探る。
従来の機械学習技術(SVM, Bagging, XGBoost)とディープニューラルネットワークを用いて,議論的談話単位(ADU)を2つのクラス – "pro"(for)と"opp"(against)に分類する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Argumentation mining is a field of computational linguistics that is devoted
to extracting from texts and classifying arguments and relations between them,
as well as constructing an argumentative structure. A significant obstacle to
research in this area for the Russian language is the lack of annotated
Russian-language text corpora. This article explores the possibility of
improving the quality of argumentation mining using the extension of the
Russian-language version of the Argumentative Microtext Corpus (ArgMicro) based
on the machine translation of the Persuasive Essays Corpus (PersEssays). To
make it possible to use these two corpora combined, we propose a Joint Argument
Annotation Scheme based on the schemes used in ArgMicro and PersEssays. We
solve the problem of classifying argumentative discourse units (ADUs) into two
classes - "pro" ("for") and "opp" ("against") using traditional machine
learning techniques (SVM, Bagging and XGBoost) and a deep neural network (BERT
model). An ensemble of XGBoost and BERT models was proposed, which showed the
highest performance of ADUs classification for both corpora.
- Abstract(参考訳): 引数マイニング(英: Argumentation mining)は、テキストから抽出し、それらの間の議論と関係を分類し、議論構造を構築することに専念する計算言語学の分野である。
この領域におけるロシア語の研究の大きな障害は、注釈付きロシア語テキストコーパスの欠如である。
本稿では,ロシア語版Argumentative Microtext Corpus(ArgMicro)を拡張したPersuasive Essays Corpus(PersEssays)の機械翻訳による議論の質向上の可能性を検討する。
これら2つのコーパスを組み合わせるために、ArgMicro と PersEssays で使用されるスキームに基づいたジョイント引数アノテーションスキームを提案する。
本稿では、従来の機械学習技術(SVM, Bagging, XGBoost)とディープニューラルネットワーク(BERTモデル)を用いて、議論的談話単位(ADU)を「pro」(for)と「opp」(against)の2つのクラスに分類する。
XGBoostモデルとBERTモデルのアンサンブルが提案され、両コーパスのADUs分類の最高性能を示した。
関連論文リスト
- A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Automatic Summarization of Russian Texts: Comparison of Extractive and
Abstractive Methods [0.0]
ロシア語の議論文生成の鍵となる問題は、注釈付き議論コーパスの欠如である。
本稿では,Argumentative Microtext, Persuasive Essays および UKP Sentential corpora の翻訳版を詳細な RuBERT モデルに適用する。
その結果,従来の ruGPT-3 モデルと比較して,引数生成の精度は 20 ポイント以上向上した。
論文 参考訳(メタデータ) (2022-06-18T17:28:04Z) - Argumentative Text Generation in Economic Domain [0.11470070927586015]
ロシア語の議論文生成の鍵となる問題は、注釈付き議論コーパスの欠如である。
本稿では,Argumentative Microtext, Persuasive Essays および UKP Sentential corpora の翻訳版を詳細な RuBERT モデルに適用する。
その結果,従来の ruGPT-3 モデルと比較して,引数生成の精度は 20 ポイント以上向上した。
論文 参考訳(メタデータ) (2022-06-18T17:22:06Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Can Unsupervised Knowledge Transfer from Social Discussions Help
Argument Mining? [25.43442712037725]
本稿では,教師なし,議論型対話型知識の課題を克服するために,新しい伝達学習戦略を提案する。
本研究では,ChangeMyViewのサブレディットからの議論に富んだ社会的な議論を,教師なしの議論型知識の源泉として活用する。
本稿では,提案手法を補完する,コンポーネント間関係予測のための新しいプロンプトベースの戦略を提案する。
論文 参考訳(メタデータ) (2022-03-24T06:48:56Z) - SG-Net: Syntax Guided Transformer for Language Representation [58.35672033887343]
本稿では,言語的動機づけのある単語表現のための明示的な構文制約をアテンション機構に組み込むことにより,テキストモデリングの指導に構文を用いることを提案する。
詳細は、自己注意ネットワーク(SAN)が支援するTransformerベースのエンコーダについて、SANにSDOI設計の構文依存性を導入し、構文誘導型自己注意型SDOI-SANを形成する。
機械読解、自然言語推論、ニューラルネットワーク翻訳などの一般的なベンチマークタスクの実験は、提案したSG-Net設計の有効性を示している。
論文 参考訳(メタデータ) (2020-12-27T11:09:35Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z) - Exemplar-Controllable Paraphrasing and Translation using Bitext [57.92051459102902]
私たちは、バイリンガルテキスト(bitext)からのみ学ぶことができるように、以前の作業からモデルを適用する。
提案した1つのモデルでは、両言語で制御されたパラフレーズ生成と、両言語で制御された機械翻訳の4つのタスクを実行することができる。
論文 参考訳(メタデータ) (2020-10-12T17:02:50Z) - Automatically Ranked Russian Paraphrase Corpus for Text Generation [0.0]
この記事は、ロシア語のパラフレーズ生成のための大規模なコーパスの自動開発とランキングに焦点を当てている。
既存のロシア語の注釈付きパラフレーズデータセットは、小型のParaPhraser corpusとParaPlagに限られている。
論文 参考訳(メタデータ) (2020-06-17T08:40:52Z) - Commonsense Evidence Generation and Injection in Reading Comprehension [57.31927095547153]
本稿では,CEGI と命名された理解を読み取るためのコモンセンス・エビデンス・ジェネレーション・インジェクション・フレームワークを提案する。
この枠組みは、2種類の補助的コモンセンス証拠を包括的読解に注入し、機械に合理的思考能力を持たせる。
CosmosQAデータセットの実験では、提案されたCEGIモデルが現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-11T16:31:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。