論文の概要: Position: No Retroactive Cure for Infringement during Training
- arxiv url: http://arxiv.org/abs/2604.18649v1
- Date: Mon, 20 Apr 2026 04:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.384566
- Title: Position: No Retroactive Cure for Infringement during Training
- Title(参考訳): 位置:トレーニング中の侵害に対する反動的治療
- Authors: Satoru Utsunomiya, Masaru Isonuma, Junichiro Mori, Ichiro Sakata,
- Abstract要約: ホック後の緩和法は、不正な取得と訓練から負債を遡及的に解決することはできないと論じる。
我々は、ポストホック衛生化から検証済みのプロセスコンプライアンスへの移行を議論する。
- 参考スコア(独自算出の注目度): 16.11573653834177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As generative AI faces intensifying legal challenges, the machine learning community has increasingly relied on post-hoc mitigation -- especially machine unlearning and inference-time guardrails -- to argue for compliance. This paper argues that such post-hoc mitigation methods cannot retroactively cure liability from unlawful acquisition and training, because compliance hinges on data lineage, not the outputs. Our argument has three parts. First, unauthorized copying/ingestion can be a legally complete completed act, and model weights may operate as fixed copies that retain training-derived expressive value, making later filtering beside the point for infringement. Second, contract and tort/unfair-competition rules -- via licenses, terms of service, and anti-free-riding principles -- can independently restrict access and use, often bypassing copyright defenses (e.g., fair use or TDM exceptions). Third, since value from protected inputs can persist in weights, remedies such as unjust enrichment and disgorgement may require stripping gains and, in some cases, reaching the model itself. We therefore argue for a shift from Post-Hoc Sanitization to verifiable Ex-Ante Process Compliance.
- Abstract(参考訳): ジェネレーティブAIが法的課題の増大に直面する中、マシンラーニングコミュニティは、コンプライアンスを主張するために、ポストホック(特に機械学習と推論時のガードレール)の緩和にますます依存している。
本稿では,このようなポストホック緩和法は,不正な取得やトレーニングから負債を遡及的に解決することができない,と論じる。
私たちの議論には3つの部分がある。
第一に、不正コピー/入力は、法的に完了した行為であり、モデルの重みは、トレーニング由来の表現的価値を保持する固定されたコピーとして動作し、後に、侵害のポイントの横でフィルタリングされる。
第2に、ライセンス、サービス規約、および反フリーライディングの原則を通じて、契約と非公正競争ルールは、独立してアクセスと使用を制限し、しばしば著作権の保護(例えば、公正な使用またはTDM例外)を回避します。
第三に、保護された入力からの値が重みを保てるため、不正な豊かさやデゴージメントなどの改善には、ストリップゲインが必要であり、場合によってはモデル自体に到達する必要がある。
したがって、我々は、ポストホック衛生化から検証された元アンテプロセスコンプライアンスへの移行を主張している。
関連論文リスト
- Unleashing Implicit Rewards: Prefix-Value Learning for Distribution-Level Optimization [74.91418266859297]
インプシットプロセス報酬モデル(PRM)は、推論プロセスに沿ってきめ細かな報酬信号を提供する。
トレーニングはシーケンスレベルの集約のみを制限しますが、推論はローカルステップの品質を反映するためにトークンレベルのスコアが必要です。
本稿では,予測精度を推定するプレフィックス条件付き値関数を直接学習する新しいインプリシット・プレフィックス・バリュー・リワード・モデル(IPVRM)を提案する。
また,サンプルトークンと高確率候補トークンの両方に対してTDの利点を演算する分散レベルRL(DistRL)を提案する。
論文 参考訳(メタデータ) (2026-04-14T18:19:54Z) - Copyright Laundering Through the AI Ouroboros: Adapting the 'Fruit of the Poisonous Tree' Doctrine to Recursive AI Training [0.31061678033205636]
著作権の執行は明白な取引にかかっている。
マルチ世代パイプラインを通じてAIシステムがトレーニングされる場合、それは緊張する。
本条では,AI-FOPT標準を提案するために「有毒樹の果実(FOPT)」の原則を適用している。
論文 参考訳(メタデータ) (2026-01-06T01:02:50Z) - Certified Mitigation of Worst-Case LLM Copyright Infringement [46.571805194176825]
コピーライト・テイクダウン(copyright takedown)とは、著作権のあるものに近いコンテンツをモデルが生成するのを防ぐ手法である。
我々はBloomScrubを提案する。BloomScrubは極めてシンプルで、非常に効果的な推論時間アプローチであり、認証された著作権の削除を提供する。
本研究は,軽量な推論時間手法が著作権保護に驚くほど有効であることを示唆する。
論文 参考訳(メタデータ) (2025-04-22T17:16:53Z) - Investigating the Feasibility of Mitigating Potential Copyright Infringement via Large Language Model Unlearning [0.0]
LLM(Pre-trained Large Language Models)は、優れた能力を示すと同時に、著作権のある資料の学習と生成によるリスクも生んでいる。
本研究では,LLMから複数の時間ステップで著作権付きコンテンツを解放する新しいフレームワークであるSSU(Stable Sequential Unlearning)を提案する。
SSUは時に、未学習の有効性と汎用言語能力の効果的なトレードオフを達成し、既存のベースラインを上回ります。
論文 参考訳(メタデータ) (2024-12-16T20:01:06Z) - Copyright-Protected Language Generation via Adaptive Model Fusion [15.48692649098646]
copyright-Protecting Model Fusion (CP-Fuse) は、推論中に著作権物質の不連続なセットで訓練されたモデルを組み合わせる新しいアプローチである。
CP-Fuseは,テキストの品質やコード生成を損なうことなく,保護された素材の再生を著しく低減することを示す。
論文 参考訳(メタデータ) (2024-12-09T16:13:17Z) - Evaluating Copyright Takedown Methods for Language Models [100.38129820325497]
言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。
本稿では,LMの著作権削除の可能性と副作用を初めて評価する。
システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文 参考訳(メタデータ) (2024-06-26T18:09:46Z) - Foundation Models and Fair Use [96.04664748698103]
米国や他の国では、著作権のあるコンテンツは、公正な使用原理のために責任を負わずに基礎モデルを構築するために使われることがある。
本研究では,著作権コンテンツに基づく基礎モデルの開発と展開の潜在的なリスクについて調査する。
基礎モデルが公正な使用と一致し続けるのに役立つ技術的緩和について論じる。
論文 参考訳(メタデータ) (2023-03-28T03:58:40Z) - SaFormer: A Conditional Sequence Modeling Approach to Offline Safe
Reinforcement Learning [64.33956692265419]
オフラインセーフなRLは、現実世界のアプリケーションにエージェントをデプロイする上で、非常に実用的な関連性を持っています。
そこで我々は,SaFormerと呼ばれる新しいオフラインセーフなRLアプローチを提案する。
論文 参考訳(メタデータ) (2023-01-28T13:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。