Fugu-MT 論文翻訳(概要): Analyzing Non-Textual Content Elements to Detect Academic Plagiarism

論文の概要: Analyzing Non-Textual Content Elements to Detect Academic Plagiarism

arxiv url: http://arxiv.org/abs/2106.05764v1
Date: Thu, 10 Jun 2021 14:11:52 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-11 14:09:47.114032
Title: Analyzing Non-Textual Content Elements to Detect Academic Plagiarism
Title（参考訳）: 学術プラジャリズム検出のための非テキストコンテンツ要素の解析
Authors: Norman Meuschke
Abstract要約: 論文では、学術文書における非テクスト内容の分析という、異なる概念を実装する盗作検出アプローチを提案する。非テキストとテキストをベースとした検出手法を組み合わせる利点を示すために、論文では、引用に基づく、画像に基づく、数学に基づく、テキストベースの文書類似性の分析を統合する最初のプラジャリズム検出システムを記述する。
参考スコア（独自算出の注目度）: 0.8490310884703459
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Identifying academic plagiarism is a pressing problem, among others, for research institutions, publishers, and funding organizations. Detection approaches proposed so far analyze lexical, syntactical, and semantic text similarity. These approaches find copied, moderately reworded, and literally translated text. However, reliably detecting disguised plagiarism, such as strong paraphrases, sense-for-sense translations, and the reuse of non-textual content and ideas, is an open research problem. The thesis addresses this problem by proposing plagiarism detection approaches that implement a different concept: analyzing non-textual content in academic documents, specifically citations, images, and mathematical content. To validate the effectiveness of the proposed detection approaches, the thesis presents five evaluations that use real cases of academic plagiarism and exploratory searches for unknown cases. The evaluation results show that non-textual content elements contain a high degree of semantic information, are language-independent, and largely immutable to the alterations that authors typically perform to conceal plagiarism. Analyzing non-textual content complements text-based detection approaches and increases the detection effectiveness, particularly for disguised forms of academic plagiarism. To demonstrate the benefit of combining non-textual and text-based detection methods, the thesis describes the first plagiarism detection system that integrates the analysis of citation-based, image-based, math-based, and text-based document similarity. The system's user interface employs visualizations that significantly reduce the effort and time users must invest in examining content similarity.
Abstract（参考訳）: 学術的盗作の特定は、特に研究機関、出版者、資金機関にとって差し迫った問題である。これまで提案されてきた検出手法は、語彙、構文、意味的テキスト類似性を解析する。これらのアプローチは、コピーされ、適度に書き直され、文字通り翻訳されたテキストを見つける。しかし、強い言い回し、センス・フォー・センス翻訳、非テキストコンテンツやアイデアの再利用など、確実に偽装された盗作を検知することは、オープンな研究課題である。この論文は、学術文書の非テクストコンテンツ、特に引用、画像、数学的内容を分析する、異なる概念を実装する盗作検出アプローチを提案することでこの問題に対処する。提案手法の有効性を検証するため,本論文では学術的盗用事例と未知事例の探索的探索を用いた5つの評価を行った。評価の結果、非テクストコンテンツ要素は、言語に依存しない高い意味情報を含み、一般的に著者が盗作を隠すために行う変更にほとんど不変であることが示された。非テキストコンテンツの分析は、テキストベースの検出アプローチを補完し、特に偽装された学術プラジャリズムに対する検出効率を高める。本論文は, 引用ベース, 画像ベース, 数学ベース, テキストベースの文書類似性の分析を統合した, 初歩的な盗作検出システムについて述べる。システムのユーザインタフェースでは、ユーザがコンテンツ類似性を調べる時間と労力を大幅に削減する視覚化を採用している。

関連論文リスト

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。 OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文参考訳（メタデータ） (2026-01-04T15:48:51Z)
Semantic Reconstruction of Adversarial Plagiarism: A Context-Aware Framework for Detecting and Restoring "Tortured Phrases" in Scientific Literature [4.905540561146363]
逆行性プラギアリズム(SRAP)のセマンティック再構築を提案する。 SRAPは、これらの異常を検出するだけでなく、元の用語を数学的に復元するために設計されたフレームワークである。我々は,(1)トークンレベルの擬似パープレキシティを用いたドメイン固有マスキング言語モデル(SciBERT)による統計的異常検出,(2)密度ベクトル検索(FAISS)と文レベルのアライメント(SBERT)を用いたソースベースセマンティック再構築という2段階アーキテクチャを用いている。
論文参考訳（メタデータ） (2025-12-11T08:53:25Z)
BERT-Enhanced Retrieval Tool for Homework Plagiarism Detection System [0.0]
GPT-3.5をベースとして,32,927対のテキストプラギアリズム検出データセットを生成する,プラギアライズされたテキストデータ生成手法を提案する。また,BERT を用いた Faiss に基づく盗作識別手法を提案する。このモデルの性能は, 98.86%, 98.90%, 98.86%, 0.9888, 精度, 精度, リコール, F1スコアなど, 様々な指標において他のモデルよりも優れていた。
論文参考訳（メタデータ） (2024-04-01T12:20:34Z)
DEMASQ: Unmasking the ChatGPT Wordsmith [63.8746084667206]
そこで本研究では,ChatGPT生成内容を正確に識別する効果的なChatGPT検出器DEMASQを提案する。提案手法は, 人為的, 機械的, 人為的, 人為的, 機械的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人
論文参考訳（メタデータ） (2023-11-08T21:13:05Z)
Text Similarity from Image Contents using Statistical and Semantic Analysis Techniques [0.0]
画像コンテンツプラジャリズム検出(ICPD)は,高度な画像コンテンツ処理を利用して,プラジャリズムの事例を特定することで重要になっている。本稿では,図形,図形,表などの画像の盗作形態のコンテンツを検出するために実装されている。 JaccardやCosineといった統計アルゴリズムと共に、LSA、BERTのような意味論的アルゴリズムを導入し、WordNetは効率的で正確な盗作行為を検出するのに優れていた。
論文参考訳（メタデータ） (2023-08-24T15:06:04Z)
Factually Consistent Summarization via Reinforcement Learning with Textual Entailment Feedback [57.816210168909286]
我々は,この問題を抽象的な要約システムで解くために,テキストエンテーメントモデルの最近の進歩を活用している。我々は、事実整合性を最適化するために、レファレンスフリーのテキストエンターメント報酬を用いた強化学習を用いる。自動測定と人的評価の両結果から,提案手法は生成した要約の忠実さ,サリエンス,簡潔さを著しく向上させることが示された。
論文参考訳（メタデータ） (2023-05-31T21:04:04Z)
Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文参考訳（メタデータ） (2023-03-14T16:11:47Z)
Textual Entailment Recognition with Semantic Features from Empirical Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文参考訳（メタデータ） (2022-10-18T10:03:51Z)
A Survey of Plagiarism Detection Systems: Case of Use with English, French and Arabic Languages [0.0]
本稿では,アラビア語,フランス語,英語の学術的・教育的な場面で使用するための盗作検知システムの概要について述べる。また, 本研究の文脈において, 技術形態を詳細に検討した。
論文参考訳（メタデータ） (2022-01-10T16:11:54Z)
Hamtajoo: A Persian Plagiarism Checker for Academic Manuscripts [0.0]
ハムタホオ(Hamtajoo)は、ペルシアの学術写本の盗作検知システムである。システム全体の構造と,各ステージで使用されるアルゴリズムについて述べる。提案システムの性能を評価するために,PAN規格に準拠した盗作検出コーパスを用いた。
論文参考訳（メタデータ） (2021-12-27T15:45:35Z)
Taxonomy of academic plagiarism methods [0.0]
この論文は、盗作主義を定義し、この用語の起源と、盗作主義に関連する用語を説明する。プラジャリズム領域の範囲を特定し、その後、文書のプラジャリズムサブドメインに焦点を当て、現在の分類の概要を示す。本論では, 学際的盗作学の新しい分類法として, 盗作学の分類, 類型と分類, 盗作学のアプローチと段階, 盗作学の方法とアルゴリズムの分類について述べる。
論文参考訳（メタデータ） (2021-05-25T16:49:08Z)
Semantic Analysis for Automated Evaluation of the Potential Impact of Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文参考訳（メタデータ） (2021-04-26T20:37:13Z)
Improving Machine Reading Comprehension with Contextualized Commonsense Knowledge [62.46091695615262]
我々は、機械読解の理解を改善するために、常識知識を抽出することを目指している。構造化知識を文脈内に配置することで,関係を暗黙的に表現することを提案する。我々は,教師の学習パラダイムを用いて,複数種類の文脈的知識を学生機械読取機に注入する。
論文参考訳（メタデータ） (2020-09-12T17:20:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。