論文の概要: The Ethical Need for Watermarks in Machine-Generated Language
- arxiv url: http://arxiv.org/abs/2209.03118v1
- Date: Wed, 7 Sep 2022 13:09:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 12:49:21.740251
- Title: The Ethical Need for Watermarks in Machine-Generated Language
- Title(参考訳): 機械生成言語における透かしの倫理的ニーズ
- Authors: Alexei Grinbaum and Laurynas Adomaitis
- Abstract要約: 透かしは、人間と機械が生成したテキストの区別を維持するために、AIシステムの自然言語出力に導入されるべきである。
等価な文字列に基づくコードの実装を提案する。
人間が書いたテキストにはそのようなコードは存在しないが、機械が生成したものは倫理上の理由から有効であることが証明される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Watermarks should be introduced in the natural language outputs of AI systems
in order to maintain the distinction between human and machine-generated text.
The ethical imperative to not blur this distinction arises from the asemantic
nature of large language models and from human projections of emotional and
cognitive states on machines, possibly leading to manipulation, spreading
falsehoods or emotional distress. Enforcing this distinction requires
unintrusive, yet easily accessible marks of the machine origin. We propose to
implement a code based on equidistant letter sequences. While no such code
exists in human-written texts, its appearance in machine-generated ones would
prove helpful for ethical reasons.
- Abstract(参考訳): ヒューマンテキストとマシン生成テキストの区別を維持するために、aiシステムの自然言語出力にウォーターマークを導入する必要がある。
この区別を曖昧にしない倫理的衝動は、大きな言語モデルの非現実的な性質と、マシン上の人間の感情的および認知的状態の予測から生じ、おそらくは操作、偽りの拡散、あるいは感情的苦痛を引き起こす。
この区別を強制するには邪魔にならないが容易にアクセスできる機械の原点が必要である。
等価な文字列に基づくコードの実装を提案する。
人間が書いたテキストにはそのようなコードは存在しないが、機械が生成したものには倫理的理由がある。
関連論文リスト
- LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection [87.43727192273772]
テキストが人間の書いたものなのか、機械で作られたものなのかを判断するのは、しばしば困難である。
細粒度検出のためのLLM-DetectAIveを提案する。
i) 人書き、ii) 機械生成、(iii) 機械書、次いで機械書、(iv) 人書き、そして機械ポリッシュの4つのカテゴリをサポートする。
論文 参考訳(メタデータ) (2024-08-08T07:43:17Z) - Authorship and the Politics and Ethics of LLM Watermarks [0.0]
本稿では,透かし方式の実践と活用の哲学的・政治的・倫理的影響について考察する。
背景として、LLM(LLM)と人間の両方を含む著者の定義が提案されている。
民間の透かしは、従来の著作者決定の基準とは相容れない、著作者決定のための徹底的な権利を民間企業に与える可能性があると論じられている。
論文 参考訳(メタデータ) (2024-03-11T10:37:39Z) - ACW: Enhancing Traceability of AI-Generated Codes Based on Watermarking [5.782554045290121]
コードの一部がAIによって生成されるのか、どのAIが創造者であるのかを知ることが望ましい。
ウォーターマーキングは広く有望なソリューションと考えられており、AI生成テキストの特定に成功している。
本稿では,AI生成コードの透かし手法であるACW(AI Code Watermarking)を提案する。
論文 参考訳(メタデータ) (2024-02-12T09:40:18Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - AuthentiGPT: Detecting Machine-Generated Text via Black-Box Language
Models Denoising [4.924903495092775]
大きな言語モデル(LLM)は、人間の文章を忠実に模倣するテキストを作成し、潜在的に誤用につながる可能性がある。
本稿では,機械生成テキストと人文テキストを区別する効率的な分類器であるAuthentiGPTを提案する。
ドメイン固有のデータセットの0.918 AUROCスコアで、AuthentiGPTは、他の商用アルゴリズムよりも有効であることを示した。
論文 参考訳(メタデータ) (2023-11-13T19:36:54Z) - Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。
最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。
本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - The Linguistic Blind Spot of Value-Aligned Agency, Natural and
Artificial [0.0]
言語コミュニケーション(自然言語)は、ロバストな価値アライメントに必要な条件である、と私は主張する。
この主張の真相は、AIシステムの価値アライメントを確実にする研究プログラムに当てはまるという結果について議論する。
論文 参考訳(メタデータ) (2022-07-02T15:47:33Z) - SG-Net: Syntax Guided Transformer for Language Representation [58.35672033887343]
本稿では,言語的動機づけのある単語表現のための明示的な構文制約をアテンション機構に組み込むことにより,テキストモデリングの指導に構文を用いることを提案する。
詳細は、自己注意ネットワーク(SAN)が支援するTransformerベースのエンコーダについて、SANにSDOI設計の構文依存性を導入し、構文誘導型自己注意型SDOI-SANを形成する。
機械読解、自然言語推論、ニューラルネットワーク翻訳などの一般的なベンチマークタスクの実験は、提案したSG-Net設計の有効性を示している。
論文 参考訳(メタデータ) (2020-12-27T11:09:35Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - Adversarial Watermarking Transformer: Towards Tracing Text Provenance
with Data Hiding [80.3811072650087]
自然言語の透かしを防御として研究し,テキストの出所の発見と追跡に役立てる。
本稿では,適応型透かし変換器(AWT)とエンコーダ・デコーダ・デコーダを併用した対向型透かし変換器(AWT)について述べる。
AWTは、テキストにデータを隠蔽する最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2020-09-07T11:01:24Z) - Machine Semiotics [0.0]
音声補助装置では、人間の発話の機械固有の意味の学習が十分であると考えられる。
認知的加熱装置の極めて自明な例を用いて、この過程を発話意味ペア(UMP)の強化学習として定式化することができることを示す。
論文 参考訳(メタデータ) (2020-08-24T15:49:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。