論文の概要: A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages
- arxiv url: http://arxiv.org/abs/2201.03423v1
- Date: Mon, 10 Jan 2022 16:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 16:40:28.428264
- Title: A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages
- Title(参考訳): プラジャリズム検出システムに関する調査研究--英語・フランス語・アラビア語を事例として
- Authors: Mehdi Abdelhamid, Faical Azouaou, Sofiane Batata
- Abstract要約: 本稿では,アラビア語,フランス語,英語の学術的・教育的な場面で使用するための盗作検知システムの概要について述べる。
また, 本研究の文脈において, 技術形態を詳細に検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In academia, plagiarism is certainly not an emerging concern, but it became
of a greater magnitude with the popularisation of the Internet and the ease of
access to a worldwide source of content, rendering human-only intervention
insufficient. Despite that, plagiarism is far from being an unaddressed
problem, as computer-assisted plagiarism detection is currently an active area
of research that falls within the field of Information Retrieval (IR) and
Natural Language Processing (NLP). Many software solutions emerged to help
fulfil this task, and this paper presents an overview of plagiarism detection
systems for use in Arabic, French, and English academic and educational
settings. The comparison was held between eight systems and was performed with
respect to their features, usability, technical aspects, as well as their
performance in detecting three levels of obfuscation from different sources:
verbatim, paraphrase, and cross-language plagiarism. An indepth examination of
technical forms of plagiarism was also performed in the context of this study.
In addition, a survey of plagiarism typologies and classifications proposed by
different authors is provided.
- Abstract(参考訳): アカデミアでは、プラジャリズムは、明らかに新興の関心事ではないが、インターネットの普及と世界中のコンテンツソースへのアクセスの容易化により、人間だけの介入が不十分になった。
しかし、情報検索(IR)と自然言語処理(NLP)の分野に該当するコンピュータ支援プラジャリズム検出は、現在活発な研究領域である。
そこで,本稿では,アラビア語,フランス語,英語の学歴・教育場面で使用されるプラジャリズム検出システムの概要について述べる。
この比較は8つのシステム間で行われ、それらの特徴、ユーザビリティ、技術的側面、および異なるソースから3つのレベルの難読化を検出するパフォーマンス(動詞、パラフレーズ、言語横断プラジャリズム)に関して行われた。
また,本研究の文脈において,技術形態の盗作を詳細に検討した。
また、異なる著者によって提唱された盗作の類型と分類について調査する。
関連論文リスト
- PaperCard for Reporting Machine Assistance in Academic Writing [48.33722012818687]
2022年11月にOpenAIが発表した質問応答システムChatGPTは,学術論文作成に活用可能な,さまざまな機能を実証した。
これは学術における著者概念に関する批判的な疑問を提起する。
我々は、人間の著者が記述プロセスにおけるAIの使用を透過的に宣言するための文書である"PaperCard"というフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-07T14:28:04Z) - Text Similarity from Image Contents using Statistical and Semantic
Analysis Techniques [0.0]
画像コンテンツプラジャリズム検出(ICPD)は,高度な画像コンテンツ処理を利用して,プラジャリズムの事例を特定することで重要になっている。
本稿では,図形,図形,表などの画像の盗作形態のコンテンツを検出するために実装されている。
JaccardやCosineといった統計アルゴリズムと共に、LSA、BERTのような意味論的アルゴリズムを導入し、WordNetは効率的で正確な盗作行為を検出するのに優れていた。
論文 参考訳(メタデータ) (2023-08-24T15:06:04Z) - A Corpus for Sentence-level Subjectivity Detection on English News
Articles [52.58681161666199]
文レベルで主観性検出のための新しいコーパスを提案する。
我々は,タスクのための新しいアノテーションガイドラインを開発し,それらを英語で新しいコーパスの作成に適用する。
この新たなリソースは、英語および他の言語で主観性検出のためのモデルを開発するための道を開く。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Verifying the Robustness of Automatic Credibility Assessment [79.08422736721764]
テキスト分類法は信頼性の低い内容を検出する手段として広く研究されている。
入力テキストの無意味な変更は、モデルを誤解させることがある。
偽情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAを紹介する。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - Hamtajoo: A Persian Plagiarism Checker for Academic Manuscripts [0.0]
ハムタホオ(Hamtajoo)は、ペルシアの学術写本の盗作検知システムである。
システム全体の構造と,各ステージで使用されるアルゴリズムについて述べる。
提案システムの性能を評価するために,PAN規格に準拠した盗作検出コーパスを用いた。
論文 参考訳(メタデータ) (2021-12-27T15:45:35Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - Analyzing Non-Textual Content Elements to Detect Academic Plagiarism [0.8490310884703459]
論文では、学術文書における非テクスト内容の分析という、異なる概念を実装する盗作検出アプローチを提案する。
非テキストとテキストをベースとした検出手法を組み合わせる利点を示すために、論文では、引用に基づく、画像に基づく、数学に基づく、テキストベースの文書類似性の分析を統合する最初のプラジャリズム検出システムを記述する。
論文 参考訳(メタデータ) (2021-06-10T14:11:52Z) - The Struggle with Academic Plagiarism: Approaches based on Semantic
Similarity [0.0]
本稿では, 盗作検知タスクにおいて意味的類似度をいかに活用できるかを報告する。
現在のソフトウェアは成功したことが証明されているが、パラフレーズや難解な盗作を識別する問題は未解決のままである。
論文 参考訳(メタデータ) (2021-06-02T20:00:33Z) - Taxonomy of academic plagiarism methods [0.0]
この論文は、盗作主義を定義し、この用語の起源と、盗作主義に関連する用語を説明する。
プラジャリズム領域の範囲を特定し、その後、文書のプラジャリズムサブドメインに焦点を当て、現在の分類の概要を示す。
本論では, 学際的盗作学の新しい分類法として, 盗作学の分類, 類型と分類, 盗作学のアプローチと段階, 盗作学の方法とアルゴリズムの分類について述べる。
論文 参考訳(メタデータ) (2021-05-25T16:49:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。