論文の概要: A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages
- arxiv url: http://arxiv.org/abs/2201.03423v1
- Date: Mon, 10 Jan 2022 16:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 16:40:28.428264
- Title: A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages
- Title(参考訳): プラジャリズム検出システムに関する調査研究--英語・フランス語・アラビア語を事例として
- Authors: Mehdi Abdelhamid, Faical Azouaou, Sofiane Batata
- Abstract要約: 本稿では,アラビア語,フランス語,英語の学術的・教育的な場面で使用するための盗作検知システムの概要について述べる。
また, 本研究の文脈において, 技術形態を詳細に検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In academia, plagiarism is certainly not an emerging concern, but it became
of a greater magnitude with the popularisation of the Internet and the ease of
access to a worldwide source of content, rendering human-only intervention
insufficient. Despite that, plagiarism is far from being an unaddressed
problem, as computer-assisted plagiarism detection is currently an active area
of research that falls within the field of Information Retrieval (IR) and
Natural Language Processing (NLP). Many software solutions emerged to help
fulfil this task, and this paper presents an overview of plagiarism detection
systems for use in Arabic, French, and English academic and educational
settings. The comparison was held between eight systems and was performed with
respect to their features, usability, technical aspects, as well as their
performance in detecting three levels of obfuscation from different sources:
verbatim, paraphrase, and cross-language plagiarism. An indepth examination of
technical forms of plagiarism was also performed in the context of this study.
In addition, a survey of plagiarism typologies and classifications proposed by
different authors is provided.
- Abstract(参考訳): アカデミアでは、プラジャリズムは、明らかに新興の関心事ではないが、インターネットの普及と世界中のコンテンツソースへのアクセスの容易化により、人間だけの介入が不十分になった。
しかし、情報検索(IR)と自然言語処理(NLP)の分野に該当するコンピュータ支援プラジャリズム検出は、現在活発な研究領域である。
そこで,本稿では,アラビア語,フランス語,英語の学歴・教育場面で使用されるプラジャリズム検出システムの概要について述べる。
この比較は8つのシステム間で行われ、それらの特徴、ユーザビリティ、技術的側面、および異なるソースから3つのレベルの難読化を検出するパフォーマンス(動詞、パラフレーズ、言語横断プラジャリズム)に関して行われた。
また,本研究の文脈において,技術形態の盗作を詳細に検討した。
また、異なる著者によって提唱された盗作の類型と分類について調査する。
関連論文リスト
- CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.00910067533982]
LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文 参考訳(メタデータ) (2024-07-09T17:58:18Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - PaperCard for Reporting Machine Assistance in Academic Writing [48.33722012818687]
2022年11月にOpenAIが発表した質問応答システムChatGPTは,学術論文作成に活用可能な,さまざまな機能を実証した。
これは学術における著者概念に関する批判的な疑問を提起する。
我々は、人間の著者が記述プロセスにおけるAIの使用を透過的に宣言するための文書である"PaperCard"というフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-07T14:28:04Z) - Text Similarity from Image Contents using Statistical and Semantic
Analysis Techniques [0.0]
画像コンテンツプラジャリズム検出(ICPD)は,高度な画像コンテンツ処理を利用して,プラジャリズムの事例を特定することで重要になっている。
本稿では,図形,図形,表などの画像の盗作形態のコンテンツを検出するために実装されている。
JaccardやCosineといった統計アルゴリズムと共に、LSA、BERTのような意味論的アルゴリズムを導入し、WordNetは効率的で正確な盗作行為を検出するのに優れていた。
論文 参考訳(メタデータ) (2023-08-24T15:06:04Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Hamtajoo: A Persian Plagiarism Checker for Academic Manuscripts [0.0]
ハムタホオ(Hamtajoo)は、ペルシアの学術写本の盗作検知システムである。
システム全体の構造と,各ステージで使用されるアルゴリズムについて述べる。
提案システムの性能を評価するために,PAN規格に準拠した盗作検出コーパスを用いた。
論文 参考訳(メタデータ) (2021-12-27T15:45:35Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - Analyzing Non-Textual Content Elements to Detect Academic Plagiarism [0.8490310884703459]
論文では、学術文書における非テクスト内容の分析という、異なる概念を実装する盗作検出アプローチを提案する。
非テキストとテキストをベースとした検出手法を組み合わせる利点を示すために、論文では、引用に基づく、画像に基づく、数学に基づく、テキストベースの文書類似性の分析を統合する最初のプラジャリズム検出システムを記述する。
論文 参考訳(メタデータ) (2021-06-10T14:11:52Z) - The Struggle with Academic Plagiarism: Approaches based on Semantic
Similarity [0.0]
本稿では, 盗作検知タスクにおいて意味的類似度をいかに活用できるかを報告する。
現在のソフトウェアは成功したことが証明されているが、パラフレーズや難解な盗作を識別する問題は未解決のままである。
論文 参考訳(メタデータ) (2021-06-02T20:00:33Z) - Taxonomy of academic plagiarism methods [0.0]
この論文は、盗作主義を定義し、この用語の起源と、盗作主義に関連する用語を説明する。
プラジャリズム領域の範囲を特定し、その後、文書のプラジャリズムサブドメインに焦点を当て、現在の分類の概要を示す。
本論では, 学際的盗作学の新しい分類法として, 盗作学の分類, 類型と分類, 盗作学のアプローチと段階, 盗作学の方法とアルゴリズムの分類について述べる。
論文 参考訳(メタデータ) (2021-05-25T16:49:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。