論文の概要: Text Similarity from Image Contents using Statistical and Semantic
Analysis Techniques
- arxiv url: http://arxiv.org/abs/2308.12842v1
- Date: Thu, 24 Aug 2023 15:06:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 13:35:43.603667
- Title: Text Similarity from Image Contents using Statistical and Semantic
Analysis Techniques
- Title(参考訳): 統計的・意味的分析手法を用いた画像内容からのテキスト類似性
- Authors: Sagar Kulkarni, Sharvari Govilkar and Dhiraj Amin
- Abstract要約: 画像コンテンツプラジャリズム検出(ICPD)は,高度な画像コンテンツ処理を利用して,プラジャリズムの事例を特定することで重要になっている。
本稿では,図形,図形,表などの画像の盗作形態のコンテンツを検出するために実装されている。
JaccardやCosineといった統計アルゴリズムと共に、LSA、BERTのような意味論的アルゴリズムを導入し、WordNetは効率的で正確な盗作行為を検出するのに優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Plagiarism detection is one of the most researched areas among the Natural
Language Processing(NLP) community. A good plagiarism detection covers all the
NLP methods including semantics, named entities, paraphrases etc. and produces
detailed plagiarism reports. Detection of Cross Lingual Plagiarism requires
deep knowledge of various advanced methods and algorithms to perform effective
text similarity checking. Nowadays the plagiarists are also advancing
themselves from hiding the identity from being catch in such offense. The
plagiarists are bypassed from being detected with techniques like paraphrasing,
synonym replacement, mismatching citations, translating one language to
another. Image Content Plagiarism Detection (ICPD) has gained importance,
utilizing advanced image content processing to identify instances of plagiarism
to ensure the integrity of image content. The issue of plagiarism extends
beyond textual content, as images such as figures, graphs, and tables also have
the potential to be plagiarized. However, image content plagiarism detection
remains an unaddressed challenge. Therefore, there is a critical need to
develop methods and systems for detecting plagiarism in image content. In this
paper, the system has been implemented to detect plagiarism form contents of
Images such as Figures, Graphs, Tables etc. Along with statistical algorithms
such as Jaccard and Cosine, introducing semantic algorithms such as LSA, BERT,
WordNet outperformed in detecting efficient and accurate plagiarism.
- Abstract(参考訳): プラジャリズム検出は自然言語処理(nlp)コミュニティで最も研究されている分野の1つである。
優れたプラギアリズム検出は、意味論、名前付きエンティティ、パラフレーズなどを含む全てのNLPメソッドをカバーし、詳細なプラギアリズムレポートを生成する。
クロスLingual Plagiarismの検出には,効率的なテキスト類似性チェックを行うための高度な手法やアルゴリズムの深い知識が必要である。
今日では、盗賊たちが身元を隠して、そのような犯罪に遭うのを防いでいる。
プラジャリストは、言い換え、同義語置換、引用のミスマッチ、ある言語を別の言語に翻訳するといったテクニックによって検出されることを回避される。
画像コンテンツプラジャリズム検出(ICPD)は、高度な画像コンテンツ処理を利用して、画像コンテンツの完全性を確保するために、プラジャリズムのインスタンスを識別する。
盗作の問題は、図形、グラフ、テーブルなどの画像も盗作される可能性があるため、テクストコンテンツを超えて広がっている。
しかし、画像コンテンツの盗作検出は未解決の課題である。
したがって、画像コンテンツの盗作を検出する方法やシステムを開発する必要がある。
本稿では,図形,グラフ,表などの画像の内容の盗作を検出するシステムを実装した。
jaccardやcosineのような統計アルゴリズムとともに、lsa、bert、wordnetのようなセマンティックアルゴリズムの導入は、効率的で正確な盗作の検出に優れていた。
関連論文リスト
- CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.00910067533982]
LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文 参考訳(メタデータ) (2024-07-09T17:58:18Z) - BERT-Enhanced Retrieval Tool for Homework Plagiarism Detection System [0.0]
GPT-3.5をベースとして,32,927対のテキストプラギアリズム検出データセットを生成する,プラギアライズされたテキストデータ生成手法を提案する。
また,BERT を用いた Faiss に基づく盗作識別手法を提案する。
このモデルの性能は, 98.86%, 98.90%, 98.86%, 0.9888, 精度, 精度, リコール, F1スコアなど, 様々な指標において他のモデルよりも優れていた。
論文 参考訳(メタデータ) (2024-04-01T12:20:34Z) - A Dataset and Benchmark for Copyright Infringement Unlearning from Text-to-Image Diffusion Models [52.49582606341111]
著作権法は、クリエイティブ作品を再生、配布、収益化する排他的権利をクリエイターに与えている。
テキスト・ツー・イメージ・ジェネレーションの最近の進歩は、著作権の執行に重大な課題をもたらしている。
CLIP、ChatGPT、拡散モデルを調和させてデータセットをキュレートする新しいパイプラインを導入する。
論文 参考訳(メタデータ) (2024-01-04T11:14:01Z) - Knowledge Mining with Scene Text for Fine-Grained Recognition [53.74297368412834]
本研究では,シーンテキスト画像の背景にある暗黙的な文脈知識をマイニングする,エンドツーエンドのトレーニング可能なネットワークを提案する。
我々は,KnowBertを用いて意味表現の関連知識を検索し,それを画像特徴と組み合わせ,きめ細かい分類を行う。
本手法は,3.72%のmAPと5.39%のmAPをそれぞれ上回っている。
論文 参考訳(メタデータ) (2022-03-27T05:54:00Z) - A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages [0.0]
本稿では,アラビア語,フランス語,英語の学術的・教育的な場面で使用するための盗作検知システムの概要について述べる。
また, 本研究の文脈において, 技術形態を詳細に検討した。
論文 参考訳(メタデータ) (2022-01-10T16:11:54Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z) - Analyzing Non-Textual Content Elements to Detect Academic Plagiarism [0.8490310884703459]
論文では、学術文書における非テクスト内容の分析という、異なる概念を実装する盗作検出アプローチを提案する。
非テキストとテキストをベースとした検出手法を組み合わせる利点を示すために、論文では、引用に基づく、画像に基づく、数学に基づく、テキストベースの文書類似性の分析を統合する最初のプラジャリズム検出システムを記述する。
論文 参考訳(メタデータ) (2021-06-10T14:11:52Z) - The Struggle with Academic Plagiarism: Approaches based on Semantic
Similarity [0.0]
本稿では, 盗作検知タスクにおいて意味的類似度をいかに活用できるかを報告する。
現在のソフトウェアは成功したことが証明されているが、パラフレーズや難解な盗作を識別する問題は未解決のままである。
論文 参考訳(メタデータ) (2021-06-02T20:00:33Z) - Taxonomy of academic plagiarism methods [0.0]
この論文は、盗作主義を定義し、この用語の起源と、盗作主義に関連する用語を説明する。
プラジャリズム領域の範囲を特定し、その後、文書のプラジャリズムサブドメインに焦点を当て、現在の分類の概要を示す。
本論では, 学際的盗作学の新しい分類法として, 盗作学の分類, 類型と分類, 盗作学のアプローチと段階, 盗作学の方法とアルゴリズムの分類について述べる。
論文 参考訳(メタデータ) (2021-05-25T16:49:08Z) - NewsCLIPpings: Automatic Generation of Out-of-Context Multimodal Media [93.51739200834837]
画像とテキストの両方を操作できないが一致しないデータセットを提案する。
本稿では,字幕に適した画像の自動検索手法をいくつか紹介する。
当社の大規模自動生成NewsCLIPpingsデータセットは、両方のモダリティを共同分析するモデルを必要とします。
論文 参考訳(メタデータ) (2021-04-13T01:53:26Z) - News Image Steganography: A Novel Architecture Facilitates the Fake News
Identification [52.83247667841588]
フェイクニュースの大部分が、他の情報源からのアンスタンプ画像を引用している。
本稿では,GANに基づく画像ステガノグラフィによる不整合を明らかにするために,News Image Steganographyというアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-01-03T11:12:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。