Fugu-MT 論文翻訳(概要): A comparison of several AI techniques for authorship attribution on Romanian texts

論文の概要: A comparison of several AI techniques for authorship attribution on Romanian texts

arxiv url: http://arxiv.org/abs/2211.05180v1
Date: Wed, 9 Nov 2022 20:24:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-11 15:14:53.459026
Title: A comparison of several AI techniques for authorship attribution on Romanian texts
Title（参考訳）: ルーマニア語テキストにおける著者の帰属に関する複数のai技術の比較
Authors: Sanda Maria Avram and Mihai Oltean
Abstract要約: 複数の著者が書いた文章を分類するAI技術の比較を行う。また、ルーマニア語で書かれたテキストからなる新しいデータセットを導入し、アルゴリズムを実行した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Determining the author of a text is a difficult task. Here we compare multiple AI techniques for classifying literary texts written by multiple authors by taking into account a limited number of speech parts (prepositions, adverbs, and conjunctions). We also introduce a new dataset composed of texts written in the Romanian language on which we have run the algorithms. The compared methods are Artificial Neural Networks, Support Vector Machines, Multi Expression Programming, Decision Trees with C5.0, and k-Nearest Neighbour. Numerical experiments show, first of all, that the problem is difficult, but some algorithms are able to generate decent errors on the test set.
Abstract（参考訳）: テキストの著者を決定するのは難しい作業です。ここでは、複数の著者が書いた文章を限定された音声部分(述語、副詞、接続)を考慮して分類する複数のAI技術を比較する。また、ルーマニア語で書かれたテキストからなる新しいデータセットを導入し、アルゴリズムを実行した。比較方法は、ニューラルネットワーク、サポートベクトルマシン、マルチ表現プログラミング、C5.0による決定木、k-Nearest Neighbourである。数値実験では、まず問題は難しいが、いくつかのアルゴリズムはテストセット上で適切なエラーを生成することができる。

関連論文リスト

DETree: DEtecting Human-AI Collaborative Texts via Tree-Structured Hierarchical Representation Learning [31.444137536002955]
AIに関連するテキストを検出することは、誤情報、盗作、学術的不正行為と戦うために不可欠である。現在の手法はこれらのプロセスをかなり粗雑にモデル化し、主に二項分類を用いる。本稿では,異なるプロセス間の関係を階層的親和性木構造としてモデル化する新しいアプローチであるDETreeを提案する。
論文参考訳（メタデータ） (2025-10-20T12:41:44Z)
EditLens: Quantifying the Extent of AI Editing in Text [23.457378805409714]
AIで編集されたテキストは、人間が書いたテキストやAIで生成したテキストと区別可能であることを示す。テキスト内に存在するAI編集量を予測する回帰モデルをトレーニングする。 AIによって編集されたテキストが検出できるだけでなく、AIによる人間の文章への変化の度合いも検出できることを示す。
論文参考訳（メタデータ） (2025-10-03T16:27:48Z)
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2480439325792]
誤分類は、偽の盗作行為の告発や、オンラインコンテンツにおけるAIの普及に関する誤解を招く可能性がある。我々は、AI-Polished-Text Evaluationデータセットを用いて、最先端の11のAIテキスト検出を体系的に評価した。我々の発見によると、検出器は、最小限に磨き上げられたテキストをAI生成と誤分類し、AIの関与度を区別し、古いモデルと小さなモデルに偏見を示す。
論文参考訳（メタデータ） (2025-02-21T18:45:37Z)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.09665704993751]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文参考訳（メタデータ） (2025-02-06T21:58:48Z)
DeTeCtive: Detecting AI-generated Text via Multi-Level Contrastive Learning [24.99797253885887]
このタスクを達成するための鍵は、異なる著者のスタイルを区別することにある、と我々は主張する。 DeTeCtiveは,マルチタスクの補助的,マルチレベルのコントラスト学習フレームワークである。我々の手法はテキストエンコーダと互換性がある。
論文参考訳（メタデータ） (2024-10-28T12:34:49Z)
Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text [4.902089836908786]
WhosAIは、与えられた入力テキストが人間かAIによって生成されたかを予測するために設計された3重ネットワークコントラスト学習フレームワークである。提案するフレームワークは,チューリングテストとオーサリングの両タスクにおいて,優れた結果が得られることを示す。
論文参考訳（メタデータ） (2024-07-12T15:44:56Z)
Spotting AI's Touch: Identifying LLM-Paraphrased Spans in Text [61.22649031769564]
我々は、新しいフレームワーク、パラフレーズテキストスパン検出(PTD)を提案する。 PTDは、テキスト内でパラフレーズ付きテキストを識別することを目的としている。パラフレーズ付きテキストスパン検出のための専用データセットであるPASTEDを構築した。
論文参考訳（メタデータ） (2024-05-21T11:22:27Z)
Spot the bot: Coarse-Grained Partition of Semantic Paths for Bots and Humans [55.2480439325792]
本稿では,人書きテキストとボット生成テキストのセマンティックパスの粗粒度分割構造の比較に焦点をあてる。意味構造が言語によって異なる可能性があるため、ロシア語、英語、ドイツ語、ベトナム語を調査する。
論文参考訳（メタデータ） (2024-02-27T10:38:37Z)
Beyond Black Box AI-Generated Plagiarism Detection: From Sentence to Document Level [4.250876580245865]
既存のAI生成テキスト分類器は精度が限られており、しばしば偽陽性を生成する。自然言語処理(NLP)技術を用いた新しい手法を提案する。与えられた質問の複数のパラフレーズ付きバージョンを生成し、それを大きな言語モデルに入力し、回答を生成する。本研究では,コサイン類似度に基づくコントラスト的損失関数を用いて,生成文と学生の反応とをマッチングする。
論文参考訳（メタデータ） (2023-06-13T20:34:55Z)
MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文参考訳（メタデータ） (2023-05-22T17:13:29Z)
Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense [56.077252790310176]
本稿では,パラフレーズ生成モデル(DIPPER)を提案する。 DIPPERを使って3つの大きな言語モデル(GPT3.5-davinci-003)で生成されたテキストを言い換えると、透かしを含むいくつかの検出器を回避できた。我々は,言語モデルAPIプロバイダによって維持されなければならない,意味論的に類似した世代を検索するシンプルなディフェンスを導入する。
論文参考訳（メタデータ） (2023-03-23T16:29:27Z)
CORE-Text: Improving Scene Text Detection with Contrastive Relational Reasoning [65.57338873921168]
自然界におけるテキストインスタンスのローカライズは、コンピュータビジョンにおける根本的な課題であると考えられている。本研究では,サブテキスト問題を定量的に解析し,シンプルで効果的な設計であるContrastive Relation(CORE)モジュールを提案する。我々は、COREモジュールをMask R-CNNの2段階テキスト検出器に統合し、テキスト検出器CORE-Textを考案する。
論文参考訳（メタデータ） (2021-12-14T16:22:25Z)
Evaluating Various Tokenizers for Arabic Text Classification [4.110108749051656]
アラビア語に対する3つの新しいトークン化アルゴリズムを導入し、教師なし評価を用いて他の3つのベースラインと比較する。実験の結果,このようなトークン化アルゴリズムの性能は,データセットのサイズ,タスクの種類,データセットに存在する形態素量に依存することがわかった。
論文参考訳（メタデータ） (2021-06-14T16:05:58Z)
ARTH: Algorithm For Reading Text Handily -- An AI Aid for People having Word Processing Issues [0.0]
「ARTH」は、「テキストを楽に読み、理解する」必要性を満たすインテリジェントな方法であるアルゴリズムの自己学習セットです。技術「ARTH」は、語彙が苦手な人や単語処理の問題を持つ人々の間で読むことの喜びの復活に焦点を当てています。
論文参考訳（メタデータ） (2021-01-23T09:39:45Z)
TextScanner: Reading Characters in Order for Robust Scene Text Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文参考訳（メタデータ） (2019-12-28T07:52:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。