論文の概要: Embedding Digital Signature into CSV Files Using Data Hiding
- arxiv url: http://arxiv.org/abs/2407.04959v1
- Date: Sat, 6 Jul 2024 04:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 21:47:42.827911
- Title: Embedding Digital Signature into CSV Files Using Data Hiding
- Title(参考訳): データハイディングを用いたCSVファイルへのデジタル署名の埋め込み
- Authors: Akinori Ito,
- Abstract要約: 本稿では,データ隠蔽技術を用いてデジタル署名をCSVファイルに埋め込む手法を提案する。
実験の結果、512ビットのシグネチャを実際のオープンデータCSVファイルに埋め込むことができた。
- 参考スコア(独自算出の注目度): 2.728575246952532
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Open data is an important basis for open science and evidence-based policymaking. Governments of many countries disclose government-related statistics as open data. Some of these data are provided as CSV files. However, since CSV files are plain texts, we cannot ensure the integrity of a downloaded CSV file. A popular way to prove the data's integrity is a digital signature; however, it is difficult to embed a signature into a CSV file. This paper proposes a method for embedding a digital signature into a CSV file using a data hiding technique. The proposed method exploits a redundancy of the CSV format related to the use of double quotes. The experiment revealed we could embed a 512-bit signature into actual open data CSV files.
- Abstract(参考訳): オープンデータは、オープンサイエンスとエビデンスベースの政策作成の重要な基盤である。
多くの国の政府は、政府関連統計を公開データとして公開している。
これらのデータの一部はCSVファイルとして提供される。
しかし、CSVファイルはプレーンテキストであるため、ダウンロードしたCSVファイルの整合性を保証することはできない。
データの完全性を証明する一般的な方法はデジタルシグネチャであるが、CSVファイルにシグネチャを埋め込むのは難しい。
本稿では,データ隠蔽技術を用いてデジタル署名をCSVファイルに埋め込む手法を提案する。
提案手法は、二重引用の使用に関連するCSVフォーマットの冗長性を利用する。
実験の結果、512ビットのシグネチャを実際のオープンデータCSVファイルに埋め込むことができた。
関連論文リスト
- Unifying Multimodal Retrieval via Document Screenshot Embedding [92.03571344075607]
Document Screenshot Embedding (DSE)は、文書のスクリーンショットを統一的な入力フォーマットとして扱う新しい検索パラダイムである。
まず、Wiki-SSというウィキペディアのウェブページのスクリーンショットをコーパスとして作成し、Natural Questionsデータセットからの質問に答える。
例えば、DSEは、BM25をトップ1検索精度で17ポイント上回り、さらにスライド検索の混合モダリティタスクでは、nDCG@10で15ポイント以上OCRテキスト検索手法を著しく上回ります。
論文 参考訳(メタデータ) (2024-06-17T06:27:35Z) - Explainable offline automatic signature verifier to support forensic handwriting examiners [8.07339686618121]
法医学的手書き検査者を支援するための新しい説明可能なオフライン自動署名検証器(ASV)を提案する。
我々のASVは、オフラインの署名画像から構築された普遍的背景モデル(UBM)に基づいている。
挑戦的な1対1の比較を考慮しても、最先端のASVと競合する性能を発揮する。
論文 参考訳(メタデータ) (2024-05-21T11:38:45Z) - The Software Heritage License Dataset (2022 Edition) [0.0]
データセットは690万のユニークなライセンスファイルで構成されている。出荷されたライセンスファイルに関する追加メタデータも提供されている。
このデータセットは、オープンソースライセンス、自動ライセンス暗号のトレーニング、法律テキストの自然言語処理(NLP)分析に関する実証的研究を行うために使用することができる。
論文 参考訳(メタデータ) (2023-08-22T08:01:07Z) - Document Layout Annotation: Database and Benchmark in the Domain of
Public Affairs [62.38140271294419]
レイアウトラベルの異なるデジタル文書を半自動アノテートする手法を提案する。
スペイン政府から24データソースの集合を用いて,行政領域におけるDLAの新しいデータベースを収集する。
実験の結果,提案したテキストラベリング手順を99%の精度で検証した。
論文 参考訳(メタデータ) (2023-06-12T08:21:50Z) - Stop Uploading Test Data in Plain Text: Practical Strategies for
Mitigating Data Contamination by Evaluation Benchmarks [70.39633252935445]
データ汚染は、大規模な自動クロールコーパスで事前訓練されたモデルの台頭によって、普及し、課題となっている。
クローズドモデルの場合、トレーニングデータはトレードシークレットになり、オープンモデルであっても汚染を検出するのは簡単ではない。
1)公開するテストデータを公開鍵で暗号化し,デリバティブ配信を許可する,(2)クローズドAPI保持者からの要求トレーニング排他的コントロールを許可する,(2)評価を拒否してテストデータを保護する,(3)インターネット上のソリューションで表示されるデータを避け,インターネット由来のWebページコンテキストを解放する,という3つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-17T12:23:38Z) - Secure Shapley Value for Cross-Silo Federated Learning (Technical Report) [14.539140693803601]
Shapley Value(SV)は、クロスサイロ・フェデレーション・ラーニング(クロスサイロFL)における貢献評価のための公平で原則化された指標である
既存のFLのSV計算方法は、サーバが生のFLモデルや公開テストデータにアクセスできると仮定する。
提案するSecSVは,以下の特徴を持つ効率的な2サーバプロトコルである。
論文 参考訳(メタデータ) (2022-09-11T13:10:29Z) - Toward the Detection of Polyglot Files [2.7402733069180996]
複数のファイルフォーマットで有効なファイルを作成することで、標準化されたファイルフォーマットを悪用することができる。
結果として生成されるポリグロット(多言語)ファイルは、ファイルフォーマットの識別を混乱させ、ファイルの要素が解析を回避できる。
これは、特徴抽出のためにファイルフォーマットの識別に依存するマルウェア検出システムにおいて特に問題となる。
論文 参考訳(メタデータ) (2022-03-14T23:48:22Z) - Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。
本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。
その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:04:10Z) - uTHCD: A New Benchmarking for Tamil Handwritten OCR [0.0]
データベースは約91000のサンプルからなり、156のクラスで600近いサンプルがある。
データベースは、オンラインとオフラインの両方のサンプルの統合コレクションである。
また,畳み込みニューラルネットワーク(cnn)のデータベースを用いて,試験データのベースライン精度88%の理想的な実験的な設定を行う。
論文 参考訳(メタデータ) (2021-03-13T10:34:08Z) - BeeTrace: A Unified Platform for Secure Contact Tracing that Breaks Data
Silos [73.84437456144994]
接触追跡は、新型コロナウイルスなどの感染症の拡散を制御する重要な方法である。
現在のソリューションでは、ビジネスデータベースや個々のデジタルデバイスに格納された大量のデータを利用できません。
データサイロを破り、プライバシーの目標を保証するために最先端の暗号化プロトコルをデプロイする統合プラットフォームであるBeeTraceを提案する。
論文 参考訳(メタデータ) (2020-07-05T10:33:45Z) - DC-BERT: Decoupling Question and Document for Efficient Contextual
Encoding [90.85913515409275]
近年のオープンドメイン質問応答は,BERT などの事前学習言語モデルを用いて顕著な性能向上を実現している。
本稿では,2つのBERTモデルを持つコンテキストエンコーディングフレームワークであるDC-BERTと,すべての文書を事前エンコードし,それらのエンコーディングをキャッシュするオフラインBERTを提案する。
SQuADオープンとNatural Questionsオープンデータセットでは、DC-BERTは文書検索の10倍のスピードアップを実現し、QAパフォーマンスのほとんど(約98%)を維持している。
論文 参考訳(メタデータ) (2020-02-28T08:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。