論文の概要: Authorship attribution for Differences between Literary Texts by
Bilingual Russian-French and Non-Bilingual French Authors
- arxiv url: http://arxiv.org/abs/2303.13622v1
- Date: Wed, 1 Mar 2023 20:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 16:28:09.354434
- Title: Authorship attribution for Differences between Literary Texts by
Bilingual Russian-French and Non-Bilingual French Authors
- Title(参考訳): バイリンガルロシア語と非バイリンガルフランス語の著者による文学的文章の差異に対する著者の帰属
- Authors: Margarita Makarova
- Abstract要約: 本稿では,SVM (Support Vector Machine) やK$-Nearest Neighbors (KNN) などの著者帰属手法を適用し,これらの質問に答える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Do bilingual Russian-French authors of the end of the twentieth century such
as Andre\"i Makine, Val\'ery Afanassiev, Vladimir F\'edorovski, Iegor Gran,
Luba Jurgenson have common stylistic traits in the novels they wrote in French?
Can we distinguish between them and non-bilingual French writers' texts? Is the
phenomenon of interference observable in French texts of Russian authors? This
paper applies authorship attribution methods including Support Vector Machine
(SVM), $K$-Nearest Neighbors (KNN), Ridge classification, and Neural Network to
answer these questions.
- Abstract(参考訳): アンドレイ・マキネ、ヴァレリー・アファナシエフ、ウラジーミル・フェドロフスキ、イジェール・グラン、ルバ・ユルゲンソンといった20世紀末のバイリンガルなロシア・フランスの作家は、フランス語で書いた小説に共通のスタイル的特徴を持っているのだろうか。
バイリンガルでないフランス人作家の文章と区別できるだろうか。
干渉の現象は、ロシアの作家のフランス語文で観測可能であるか?
本稿では,支援ベクトルマシン (svm) や $k$-nearest neighbors (knn) ,リッジ分類 ( ridge classification) ,ニューラルネット (neural network) などの著者シップ帰属法を適用し,これらの質問に答える。
関連論文リスト
- Findings of the WMT 2023 Shared Task on Discourse-Level Literary
Translation: A Fresh Orb in the Cosmos of LLMs [80.05205710881789]
我々は、著作権と文書レベルの中国英語ウェブ小説コーパスをリリースする。
今年は7つのアカデミックチームと業界チームから14の応募を受け取りました。
システムの公式ランキングは、全体的な人間の判断に基づいている。
論文 参考訳(メタデータ) (2023-11-06T14:23:49Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - WEKA-Based: Key Features and Classifier for French of Five Countries [4.704992432252233]
本稿では,各地域の方言を適切に区別するフランス語方言認識システムについて述べる。
モナコ、フランス語を話すベルギー、フランス語を話すスイス、フランス語を話すカナダ、フランスという5つの地域からなるコーパス。
コーパスの内容は、食事、飲酒、睡眠、生活の4つのテーマと関連しており、これは大衆生活と密接に関連している。
論文 参考訳(メタデータ) (2022-11-10T10:35:34Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - Exploring Document-Level Literary Machine Translation with Parallel
Paragraphs from World Literature [35.1398797683712]
文献翻訳者は, 機械翻訳段落よりも, 84%の割合で人文翻訳を好んでいる。
我々は、通常のMT出力よりも出力が好ましい後編集モデルを専門家によって69%の速度で訓練する。
論文 参考訳(メタデータ) (2022-10-25T18:03:34Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Computational analyses of the topics, sentiments, literariness,
creativity and beauty of texts in a large Corpus of English Literature [0.0]
Gutenberg Literary English Corpus (GLEC)は、デジタル人文科学、計算言語学、神経認知詩学の研究のための豊富なテキストデータソースを提供する。
GLECの6つのテキストカテゴリのトピックと感情分析の結果を報告する。<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>3</i>,<i>3</i>,<i>3</i
論文 参考訳(メタデータ) (2022-01-12T08:16:52Z) - Traditional Machine Learning and Deep Learning Models for Argumentation
Mining in Russian Texts [0.0]
この領域におけるロシア語の研究の大きな障害は、注釈付きロシア語テキストコーパスの欠如である。
本稿では,ロシア語版Argumentative Micro Corpus(ArgMicro)を拡張したPersuasive Essays Corpus(PersEssays)の機械翻訳による議論の質向上の可能性を探る。
従来の機械学習技術(SVM, Bagging, XGBoost)とディープニューラルネットワークを用いて,議論的談話単位(ADU)を2つのクラス – "pro"(for)と"opp"(against)に分類する。
論文 参考訳(メタデータ) (2021-06-28T07:44:43Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - A frame semantics based approach to comparative study of digitized
corpus [0.0]
本論文は, デジタル化小説から作成された英語・アラビア語対応コーパスの形態的, 構文的, 意味的アノテーションプロセスに焦点を当てたものである。
本研究では,言語間での運動事象の概念化の違いを,フレーム構造とフレーム間関係で記述することができることを論じる。
論文 参考訳(メタデータ) (2020-05-29T22:56:25Z) - The Frankfurt Latin Lexicon: From Morphological Expansion and Word
Embeddings to SemioGraphs [97.8648124629697]
この記事は、古典的な機械学習と知的ポストコレクション、特に、基礎となる語彙資源のグラフ表現に基づく人間の解釈プロセスを含む、より包括的なレマティゼーションの理解を論じている。
論文 参考訳(メタデータ) (2020-05-21T17:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。