論文の概要: Discovering and exploring cases of educational source code plagiarism
with Dolos
- arxiv url: http://arxiv.org/abs/2402.10853v1
- Date: Fri, 16 Feb 2024 17:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-19 14:50:32.039861
- Title: Discovering and exploring cases of educational source code plagiarism
with Dolos
- Title(参考訳): Dolosを用いた教育ソースコード盗作事件の発見と調査
- Authors: Rien Maertens, Maarten Van Neyghem, Maxiem Geldhof, Charlotte Van
Petegem, Niko Strijbol, Peter Dawyndt, Bart Mesuere
- Abstract要約: Dolosは、教育ソースコードの盗作行為を検出し予防するためのツールのエコシステムである。
教育者は、ブラウザで新しいWebアプリから、プラジャリズムパイプライン全体を実行できる。
新しいダッシュボードは、ソースファイルのコレクションが盗作の疑いのあるケースを含んでいるかどうかを即座に評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Source code plagiarism is a significant issue in educational practice, and
educators need user-friendly tools to cope with such academic dishonesty. This
article introduces the latest version of Dolos, a state-of-the-art ecosystem of
tools for detecting and preventing plagiarism in educational source code. In
this new version, the primary focus has been on enhancing the user experience.
Educators can now run the entire plagiarism detection pipeline from a new web
app in their browser, eliminating the need for any installation or
configuration. Completely redesigned analytics dashboards provide an instant
assessment of whether a collection of source files contains suspected cases of
plagiarism and how widespread plagiarism is within the collection. The
dashboards support hierarchically structured navigation to facilitate zooming
in and out of suspect cases. Clusters are an essential new component of the
dashboard design, reflecting the observation that plagiarism can occur among
larger groups of students. To meet various user needs, the Dolos software stack
for source code plagiarism detections now includes a web interface, a JSON
application programming interface (API), a command line interface (CLI), a
JavaScript library and a preconfigured Docker container. Clear documentation
and a free-to-use instance of the web app can be found at
https://dolos.ugent.be. The source code is also available on GitHub.
- Abstract(参考訳): ソースコードの盗作は教育実践において重要な問題であり、教育者はそのような学術的不正に対処するためにユーザーフレンドリーなツールを必要とする。
この記事では、教育ソースコードの盗作を検知し防止するツールの最先端エコシステムであるdolosの最新バージョンを紹介します。
新バージョンでは、ユーザエクスペリエンスの向上に重点が置かれている。
教育者は、ブラウザの新しいwebアプリからプラジャリズム検出パイプライン全体を実行できるようになり、インストールや設定は不要になった。
完全に再設計された分析ダッシュボードは、ソースファイルのコレクションが盗作の疑いのあるケースを含んでいるかどうかと、盗作がコレクション内にあるかどうかを即座に評価する。
ダッシュボードは階層的なナビゲーションをサポートし、疑わしいケースのズームインとアウトを容易にする。
クラスタはダッシュボード設計の不可欠な新しい要素であり、大規模な学生グループの間で盗作が起こりうるという観察を反映している。
さまざまなユーザニーズを満たすため、ソースコード盗作検出用のDolosソフトウェアスタックには、Webインターフェース、JSONアプリケーションプログラミングインターフェース(API)、コマンドラインインターフェース(CLI)、JavaScriptライブラリ、設定済みのDockerコンテナが含まれている。
Webアプリの明確なドキュメントと無償のインスタンスはhttps://dolos.ugent.be.comで見ることができる。
ソースコードもgithubで公開されている。
関連論文リスト
- LLMs Plagiarize: Ensuring Responsible Sourcing of Large Language Model Training Data Through Knowledge Graph Comparison [0.0]
本稿では,大規模言語モデルの訓練や微調整に知識源が用いられているかどうかを評価するための,新たなシステムであるプラジャリズム検出システムを提案する。
現在の手法とは異なり、我々はResource Description Framework(RDF)トリプルを使用して、ソースドキュメントとLLM継続の両方から知識グラフを作成するアプローチを利用する。
これらのグラフは、コサイン類似性を用いてコンテンツに関して分析され、また、同型度を示すグラフ編集距離の正規化版を用いて構造に関して分析される。
論文 参考訳(メタデータ) (2024-07-02T20:49:21Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - A Survey of Plagiarism Detection Systems: Case of Use with English,
French and Arabic Languages [0.0]
本稿では,アラビア語,フランス語,英語の学術的・教育的な場面で使用するための盗作検知システムの概要について述べる。
また, 本研究の文脈において, 技術形態を詳細に検討した。
論文 参考訳(メタデータ) (2022-01-10T16:11:54Z) - Hamtajoo: A Persian Plagiarism Checker for Academic Manuscripts [0.0]
ハムタホオ(Hamtajoo)は、ペルシアの学術写本の盗作検知システムである。
システム全体の構造と,各ステージで使用されるアルゴリズムについて述べる。
提案システムの性能を評価するために,PAN規格に準拠した盗作検出コーパスを用いた。
論文 参考訳(メタデータ) (2021-12-27T15:45:35Z) - The Struggle with Academic Plagiarism: Approaches based on Semantic
Similarity [0.0]
本稿では, 盗作検知タスクにおいて意味的類似度をいかに活用できるかを報告する。
現在のソフトウェアは成功したことが証明されているが、パラフレーズや難解な盗作を識別する問題は未解決のままである。
論文 参考訳(メタデータ) (2021-06-02T20:00:33Z) - COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。
COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文 参考訳(メタデータ) (2020-10-19T13:53:38Z) - Mossad: Defeating Software Plagiarism Detection [0.48225981108928456]
本稿では,一般的なソフトウェア盗作検出ツールを打ち破る完全自動プログラム変換手法であるMossadを提案する。
このフレームワークは、遺伝子プログラミングにインスパイアされた技法とドメイン固有の知識を結びつけて、盗作検知を効果的に弱める。
モスは高速かつ効果的であり、数分で検出から逃れる可能性のあるプログラムの修正版を生成することができる。
論文 参考訳(メタデータ) (2020-10-04T22:02:38Z) - Learning to map source code to software vulnerability using
code-as-a-graph [67.62847721118142]
セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
論文 参考訳(メタデータ) (2020-06-15T16:05:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。