論文の概要: Authorship attribution for Differences between Literary Texts by
Bilingual Russian-French and Non-Bilingual French Authors
- arxiv url: http://arxiv.org/abs/2303.13622v1
- Date: Wed, 1 Mar 2023 20:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 16:28:09.354434
- Title: Authorship attribution for Differences between Literary Texts by
Bilingual Russian-French and Non-Bilingual French Authors
- Title(参考訳): バイリンガルロシア語と非バイリンガルフランス語の著者による文学的文章の差異に対する著者の帰属
- Authors: Margarita Makarova
- Abstract要約: 本稿では,SVM (Support Vector Machine) やK$-Nearest Neighbors (KNN) などの著者帰属手法を適用し,これらの質問に答える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Do bilingual Russian-French authors of the end of the twentieth century such
as Andre\"i Makine, Val\'ery Afanassiev, Vladimir F\'edorovski, Iegor Gran,
Luba Jurgenson have common stylistic traits in the novels they wrote in French?
Can we distinguish between them and non-bilingual French writers' texts? Is the
phenomenon of interference observable in French texts of Russian authors? This
paper applies authorship attribution methods including Support Vector Machine
(SVM), $K$-Nearest Neighbors (KNN), Ridge classification, and Neural Network to
answer these questions.
- Abstract(参考訳): アンドレイ・マキネ、ヴァレリー・アファナシエフ、ウラジーミル・フェドロフスキ、イジェール・グラン、ルバ・ユルゲンソンといった20世紀末のバイリンガルなロシア・フランスの作家は、フランス語で書いた小説に共通のスタイル的特徴を持っているのだろうか。
バイリンガルでないフランス人作家の文章と区別できるだろうか。
干渉の現象は、ロシアの作家のフランス語文で観測可能であるか?
本稿では,支援ベクトルマシン (svm) や $k$-nearest neighbors (knn) ,リッジ分類 ( ridge classification) ,ニューラルネット (neural network) などの著者シップ帰属法を適用し,これらの質問に答える。
関連論文リスト
- Latent Structures of Intertextuality in French Fiction [0.0]
本稿では、計算文学研究の分野が、テクスチュアリティの研究を行う上で理想的な場所であると論じる。
我々は18世紀、19世紀、20世紀初頭の12万以上のフランスのフィクションのコーパスについて紹介する。
論文 参考訳(メタデータ) (2024-10-23T10:50:40Z) - Dialectal and Low Resource Machine Translation for Aromanian [44.99833362998488]
ルーマニア語、英語、ルーマニア語を翻訳できるニューラルマシン翻訳システムを提案する。
BLEUスコアはテキストの方向やジャンルによって17から32まで様々である。
Aromanian-Romanian-Romanian bilingual corpus は 79k 個の清潔な文対から構成される。
論文 参考訳(メタデータ) (2024-10-23T10:00:23Z) - Automatic Translation Alignment Pipeline for Multilingual Digital Editions of Literary Works [0.0]
本稿では,アレッサンドロ・マンゾニのイタリア語小説「I promessi sposi」の多言語デジタル版(MDE)作成における翻訳アライメントアルゴリズムの適用について検討する。
我々は、MDEが読者体験と翻訳学習のサポートの両方を改善するための重要な要件を特定した。
本稿では,文語翻訳のアライメントを評価するための新しい指標を提案し,今後の分析のための可視化手法を提案する。
論文 参考訳(メタデータ) (2024-10-17T06:21:38Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [52.18246881218829]
本稿では,大言語モデル(LLM)をベースとした多エージェントフレームワークを,TransAgentsという企業として実装した。
本システムの有効性を評価するため,モノリンガル・ヒューマン・プライス(MHP)とバイリンガル・LLM・プライス(BLP)の2つの革新的な評価戦略を提案する。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Computational analyses of the topics, sentiments, literariness,
creativity and beauty of texts in a large Corpus of English Literature [0.0]
Gutenberg Literary English Corpus (GLEC)は、デジタル人文科学、計算言語学、神経認知詩学の研究のための豊富なテキストデータソースを提供する。
GLECの6つのテキストカテゴリのトピックと感情分析の結果を報告する。<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>100</i>,<i>3</i>,<i>3</i>,<i>3</i
論文 参考訳(メタデータ) (2022-01-12T08:16:52Z) - Traditional Machine Learning and Deep Learning Models for Argumentation
Mining in Russian Texts [0.0]
この領域におけるロシア語の研究の大きな障害は、注釈付きロシア語テキストコーパスの欠如である。
本稿では,ロシア語版Argumentative Micro Corpus(ArgMicro)を拡張したPersuasive Essays Corpus(PersEssays)の機械翻訳による議論の質向上の可能性を探る。
従来の機械学習技術(SVM, Bagging, XGBoost)とディープニューラルネットワークを用いて,議論的談話単位(ADU)を2つのクラス – "pro"(for)と"opp"(against)に分類する。
論文 参考訳(メタデータ) (2021-06-28T07:44:43Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。