論文の概要: Seal2Real: Prompt Prior Learning on Diffusion Model for Unsupervised
Document Seal Data Generation and Realisation
- arxiv url: http://arxiv.org/abs/2310.00546v1
- Date: Sun, 1 Oct 2023 02:12:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 03:40:23.824627
- Title: Seal2Real: Prompt Prior Learning on Diffusion Model for Unsupervised
Document Seal Data Generation and Realisation
- Title(参考訳): Seal2Real: 教師なし文書シールデータ生成と実現のための拡散モデルによる事前学習
- Authors: Jiancheng Huang, Yifan Liu, Yi Huang, Shifeng Chen
- Abstract要約: 本研究では,大量のラベル付き文書シールデータを生成する生成手法を提案し,ラベル付き20K画像を含むSeal-DBデータセットを構築した。
現実的なシール生成能力は、実際のデータに対する下流シール関連タスクの実行を大幅に促進する。
- 参考スコア(独自算出の注目度): 18.252810739867247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In document processing, seal-related tasks have very large commercial
applications, such as seal segmentation, seal authenticity discrimination, seal
removal, and text recognition under seals. However, these seal-related tasks
are highly dependent on labelled document seal datasets, resulting in very
little work on these tasks. To address the lack of labelled datasets for these
seal-related tasks, we propose Seal2Real, a generative method that generates a
large amount of labelled document seal data, and construct a Seal-DB dataset
containing 20K images with labels. In Seal2Real, we propose a prompt prior
learning architecture based on a pre-trained Stable Diffusion Model that
migrates the prior generative power of to our seal generation task with
unsupervised training. The realistic seal generation capability greatly
facilitates the performance of downstream seal-related tasks on real data.
Experimental results on the Seal-DB dataset demonstrate the effectiveness of
Seal2Real.
- Abstract(参考訳): 文書処理において、シール関連タスクは、シール分割、シール認証識別、シール除去、シール下のテキスト認識など、非常に大きな商業用途を有する。
しかしながら、これらのシール関連タスクはラベル付き文書シールデータセットに大きく依存しているため、これらのタスクにはほとんど取り組んでいない。
これらのシール関連課題に対するラベル付きデータセットの欠如に対処するために,大量のラベル付き文書シールデータを生成する生成手法である seal2real を提案し,ラベル付き20k画像を含む seal-db データセットを構築する。
seal2realでは,事前学習済みの安定拡散モデルに基づき,教師なしの学習で先行生成能力をシール生成タスクに移行した,迅速な事前学習アーキテクチャを提案する。
現実的なシール生成能力は、実データ上の下流シール関連タスクの性能を大幅に向上させる。
seal-dbデータセットの実験結果は、 seal2realの有効性を示している。
関連論文リスト
- LLM for Barcodes: Generating Diverse Synthetic Data for Identity Documents [2.697503433221448]
我々は,LLMを用いた合成データ生成に新たなアプローチを導入し,事前定義されたフィールドに依存することなく,文脈的にリッチでリアルなデータを生成する。
我々のアプローチはデータセット作成のプロセスを単純化し、広範なドメイン知識の必要性を排除します。
このスケーラブルでプライバシ優先のソリューションは、自動文書処理とID認証のための機械学習の進歩の大きな一歩だ。
論文 参考訳(メタデータ) (2024-11-22T14:21:18Z) - Detecting Dataset Abuse in Fine-Tuning Stable Diffusion Models for Text-to-Image Synthesis [3.8809673918404246]
認証されていない使用とトレースデータのリークを検出するために設計されたデータセットの透かしフレームワーク。
我々は、不正使用やトレースデータ漏洩を検出するために設計されたデータセット透かしフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-27T16:34:48Z) - A Little Leak Will Sink a Great Ship: Survey of Transparency for Large Language Models from Start to Finish [47.3916421056009]
大規模言語モデル(LLM)は、大規模なウェブクローリングコーパスで訓練されている。
LLMは、トレーニングセットでそのようなデータが少ないにもかかわらず、ほとんどの場合、漏洩した情報を生成する。
自己検出法は既存の検出法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-24T13:21:58Z) - A Watermark-Conditioned Diffusion Model for IP Protection [31.969286898467985]
拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。
そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。
本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文 参考訳(メタデータ) (2024-03-16T11:08:15Z) - T2IW: Joint Text to Image & Watermark Generation [74.20148555503127]
画像と透かし(T2IW)への共同テキスト生成のための新しいタスクを提案する。
このT2IWスキームは、意味的特徴と透かし信号が画素内で互換性を持つように強制することにより、複合画像を生成する際に、画像品質に最小限のダメージを与える。
提案手法により,画像品質,透かしの可視性,透かしの堅牢性などの顕著な成果が得られた。
論文 参考訳(メタデータ) (2023-09-07T16:12:06Z) - Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Precise Zero-Shot Dense Retrieval without Relevance Labels [60.457378374671656]
仮説文書埋め込み(英: hypothetical Document Embeddings, HyDE)は、ゼロショット高密度検索システムである。
我々は,HyDEが最先端の非教師付き高密度検索器であるContrieverを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2022-12-20T18:09:52Z) - SealID: Saimaa ringed seal re-identification dataset [0.10555513406636087]
サイマーリングアザラシ(フィンランド語: Pusa hispida saimensis)は、フィンランドのサイマー湖で発見された絶滅危惧種である。
サイマーリングシール画像(SealID)データセット(N=57)を研究目的で公開しています。
論文 参考訳(メタデータ) (2022-06-05T20:35:32Z) - A Comparative Survey of Deep Active Learning [76.04825433362709]
Active Learning (AL)は、ラベル付けのための大きなラベル付けされていないデータプールからデータサンプルを順次選択することで、ラベル付けコストを削減するための一連のテクニックである。
ディープラーニング(DL)はデータハングリーであり、DLモデルのパフォーマンスは、より多くのトレーニングデータとともに単調にスケールする。
近年、Deep Active Learning (DAL) は、高価なラベリングコストを最小化しつつ、モデル性能を最大化するための実現可能なソリューションとして上昇している。
論文 参考訳(メタデータ) (2022-03-25T05:17:24Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。