論文の概要: Detecting Verbatim LLM Copy-Paste in Homework
- arxiv url: http://arxiv.org/abs/2605.16336v1
- Date: Thu, 07 May 2026 02:36:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.89235
- Title: Detecting Verbatim LLM Copy-Paste in Homework
- Title(参考訳): 宿題における Verbatim LLM Copy-Paste の検出
- Authors: Aizierjiang Aiersilan,
- Abstract要約: SteganoPromptは、任意の印刷可能なASCIIペイロードをUnicode Tagsブロックにエンコードする、シングルページのゼロ依存Webツールである。
エンコードされた文字列は、元のものと視覚的に同一であり、共通のコピーペーストチャネルを生き残る。
我々は,7つのLLMファミリーおよび教育コンテンツチャネルの代表的なセットに対するコンプライアンスを評価する。
- 参考スコア(独自算出の注目度): 5.584060970507507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have made fluent essay writing, code drafting, and quiz answering instantly available to students at every level, from secondary school through graduate study. Many educators do not object to LLM use \emph{per~se}; what they need to detect is the case in which a student pastes the assignment prompt into a chatbot and submits the model's reply verbatim, without engaging with the work. Existing post-hoc AI-text detectors remain unreliable and have been shown to penalise non-native English writers, while output-side watermarks require cooperation from the model provider. We propose an alternative that the educator controls directly: an input-side watermark in which an invisible instruction is embedded inside the visible assignment prompt itself. An LLM that ingests the prompt verbatim quietly reads the hidden instruction and writes a tell-tale signature into its reply, exposing the copy-and-paste pathway specifically. We describe SteganoPrompt, a single-page, zero-dependency web tool that encodes an arbitrary printable-ASCII payload into the deprecated Unicode Tags block (\texttt{U+E0000}--\texttt{U+E007F}). The encoded string is visually identical to the original, survives common copy-paste channels (Word, Google Docs, PDF, Markdown, Slack, e-mail, the major learning-management systems), and is reliably tokenized by frontier models. We evaluate compliance across seven LLM families and a representative set of educational content channels. The work is informed by my experience as a graduate teaching assistant for an undergraduate software engineering course at the George Washington University. The tool is released under the MIT licence at \url{https://ezharjan.github.io/SteganoPrompt/}.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、中等教育から大学院まで、あらゆるレベルの生徒に即時に利用できるエッセイ、コードドラフト、クイズを流用した。
多くの教育者は LLM では \emph{per~se} を使用せず、学生がタスクプロンプトをチャットボットに貼り付け、作業に関わらずにモデルの応答を動詞で送るケースを検知する必要がある。
既存のポストホックなAIテキスト検出装置は信頼できないままであり、非ネイティブなイングランド人作家を罰することが示されているが、出力側透かしはモデルプロバイダの協力を必要としている。
本稿では,教師が直接制御する代替手法を提案する。視覚的代入プロンプト自体の中に,目に見えない命令が埋め込まれた入力側透かしである。
プロンプト動詞を摂取するLDMは、隠された命令をひそかに読み、その応答に送信署名を書き、特にコピー・アンド・ペースト経路を露呈する。
SteganoPromptは、任意の印刷可能なASCIIペイロードを非推奨のUnicode Tagsブロック(\texttt{U+E0000}--\texttt{U+E007F})にエンコードする単一ページのゼロ依存Webツールである。
エンコードされた文字列はオリジナルのものと視覚的に同一であり、一般的なコピーペーストチャネル(Word、Google Docs、PDF、Markdown、Slack、電子メール、主要な学習管理システム)を生き残り、フロンティアモデルによって確実にトークン化されている。
我々は,7つのLLMファミリーおよび教育コンテンツチャネルの代表的なセットに対するコンプライアンスを評価する。
この仕事は、私がジョージ・ワシントン大学の大学院ソフトウェア工学コースで教鞭を執った経験から伝えられます。
このツールはMITライセンス下で,‘url{https://ezharjan.github.io/SteganoPrompt/}’で公開されている。
関連論文リスト
- PromptDecipher: Supporting AI Tutor Authoring Through Editable Simulated Interactions [1.9626565809424965]
私たちのフォーマティブな研究によると、学生にボットをデプロイする前に、体系的にボットをテストした人はほとんどいなかった。
本稿では,直接修正に基づくインタラクションのワークフローを再構築するシステムであるPromptDecipherを紹介する。
PromptDecipherは、教育者のためのAIコースにデプロイされ、数百人の高等教育インストラクターを登録する。
論文 参考訳(メタデータ) (2026-05-15T20:13:05Z) - Who Wrote the Book? Detecting and Attributing LLM Ghostwriters [35.478075071337784]
我々は著者属性のデータセットであるGhostWriteBenchを紹介する。
また,解釈可能かつ軽量な新しい指紋認証手法TRACEを提案する。
論文 参考訳(メタデータ) (2026-03-30T05:41:12Z) - In-Context Watermarks for Large Language Models [71.29952527565749]
In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。
粒度の異なる4つのICW戦略について検討した。
本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文 参考訳(メタデータ) (2025-05-22T17:24:51Z) - PostMark: A Robust Blackbox Watermark for Large Language Models [56.63560134428716]
モジュール式ポストホックウォーターマーキング手法であるPostMarkを開発した。
PostMarkはロジットアクセスを必要としないため、サードパーティによって実装することができる。
PostMarkは既存のウォーターマーキング手法よりも,攻撃を言い換える方が堅牢であることを示す。
論文 参考訳(メタデータ) (2024-06-20T17:27:14Z) - Large Language Models as Carriers of Hidden Messages [0.0]
単純な微調整は、隠されたテキストを大きな言語モデル(LLM)に埋め込むことができる。
我々の研究は、隠れたテキストを微調整で埋め込むことが、膨大な数のトリガーによって安全であるように見えるが、抽出に弱いことを実証している。
我々は,LLMの語彙からトークンを反復的に供給し,高いトークン確率を持つシーケンスを明らかにするunconditional Token Forcing (UTF)と呼ばれる抽出攻撃を導入し,隠れテキスト候補を示す。
論文 参考訳(メタデータ) (2024-06-04T16:49:06Z) - Peering into the Mind of Language Models: An Approach for Attribution in Contextual Question Answering [9.86691461253151]
大規模言語モデル(LLM)の隠れ状態表現を利用した文脈質問応答における帰属手法を提案する。
提案手法は,より詳細な属性を提供し,生成した回答の質を保ちながら,広範囲なモデル再訓練および検索モデルオーバーヘッドの必要性を回避している。
本稿では,LLM世代に対するトークンレベルのアノテーションを文脈質問応答設定に有する属性データセットであるVerifiability-granularを提案する。
論文 参考訳(メタデータ) (2024-05-28T09:12:44Z) - Learning to Watermark LLM-generated Text via Reinforcement Learning [16.61005372279407]
誤用追跡のためのLCM出力の透かしについて検討する。
出力に信号を埋め込むモデルレベルの透かしを設計する。
強化学習に基づく協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-13T03:43:39Z) - Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.86436777626959]
大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。
既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。
テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文 参考訳(メタデータ) (2023-07-29T14:11:15Z) - DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting [112.45423990924283]
DeepSolo++は単純なDETRライクなベースラインで、テキスト検出、認識、スクリプト識別を同時に行うために、明示的なポイントを持つ1つのデコーダを単独で使用することができる。
本手法は、英語のシーンだけでなく、複雑なフォント構造と中国語などの1000レベルの文字クラスで書き起こしを習得する。
論文 参考訳(メタデータ) (2023-05-31T15:44:00Z) - DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection [56.513637720967566]
大規模言語モデル(LLM)は、盗作、eコマースプラットフォームへの偽レビューの設置、炎症性偽ツイートなどの誤用のリスクを引き起こすテキストを生成することができる。
既存の高品質な検出手法では、本質的な特徴を抽出するために、モデルの内部にアクセスする必要がある。
ブラックボックスモデル生成テキストの深い内在特性を抽出する。
論文 参考訳(メタデータ) (2023-05-21T17:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。