論文の概要: From Pixels to Nucleotides: End-to-End Token-Based Video Compression for DNA Storage
- arxiv url: http://arxiv.org/abs/2604.13667v1
- Date: Wed, 15 Apr 2026 09:35:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.473026
- Title: From Pixels to Nucleotides: End-to-End Token-Based Video Compression for DNA Storage
- Title(参考訳): カメラからヌクレオチドへ:DNA保存のためのエンド・ツー・エンドのTokenベースのビデオ圧縮
- Authors: Cihan Ruan, Lebin Zhou, Bingqing Zhao, Rongduo Han, Qiming Yuan, Chenchen Zhu, Linyi Han, Liang Yang, Wei Wang, Wei Jiang, Nam Ling,
- Abstract要約: 我々は、ビデオ圧縮とDNAエンコーディングを共同で最適化する最初のエンドツーエンドニューラルネットワークであるHELIXを提案する。
はじめて、学習した圧縮と分子貯蔵がトークン表現に自然に収束することを示した。
- 参考スコア(独自算出の注目度): 15.791243677921933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DNA-based storage has emerged as a promising approach to the global data crisis, offering molecular-scale density and millennial-scale stability at low maintenance cost. Over the past decade, substantial progress has been made in storing text, images, and files in DNA -- yet video remains an open challenge. The difficulty is not merely technical: effective video DNA storage requires co-designing compression and molecular encoding from the ground up, a challenge that sits at the intersection of two fields that have largely evolved independently. In this work, we present HELIX, the first end-to-end neural network jointly optimizing video compression and DNA encoding -- prior approaches treat the two stages independently, leaving biochemical constraints and compression objectives fundamentally misaligned. Our key insight: token-based representations naturally align with DNA's quaternary alphabet -- discrete semantic units map directly to ATCG bases. We introduce TK-SCONE (Token-Kronecker Structured Constraint-Optimized Neural Encoding), which achieves 1.91 bits per nucleotide through Kronecker-structured mixing that breaks spatial correlations and FSM-based mapping that guarantees biochemical constraints. Unlike two-stage approaches, HELIX learns token distributions simultaneously optimized for visual quality, prediction under masking, and DNA synthesis efficiency. This work demonstrates for the first time that learned compression and molecular storage converge naturally at token representations -- suggesting a new paradigm where neural video codecs are designed for biological substrates from the ground up.
- Abstract(参考訳): DNAベースのストレージは、低メンテナンスコストで分子スケール密度とミレニアルスケールの安定性を提供する、世界的なデータ危機に対する有望なアプローチとして現れています。
過去10年間で、テキストや画像、ファイルをDNAに保存する作業が大幅に進展してきたが、ビデオは依然としてオープンな課題だ。
効果的なビデオDNAストレージには、圧縮と分子エンコーディングをゼロから設計する必要がある。
本研究では、ビデオ圧縮とDNAエンコーディングを共同で最適化する最初のエンドツーエンドニューラルネットワークであるHELIXについて述べる。
トークンベースの表現は、自然にDNAの4番目のアルファベットと一致します。
我々は,空間相関を破るクロネッカー構造ミキシングと生化学的制約を保証するFSMマッピングにより,ヌクレオチドあたり1.91ビットのTK-SCONE(Token-Kronecker Structured Constraint-Optimized Neural Encoding)を導入する。
2段階のアプローチとは異なり、HELIXは視覚的品質、マスキングによる予測、DNA合成効率に最適化されたトークン分布を同時に学習する。
この研究は、圧縮と分子記憶がトークン表現で自然に収束したことを初めて実証した。
関連論文リスト
- End-to-End Training for Unified Tokenization and Latent Denoising [82.91537591286554]
統一トークン化と潜伏拡散のためのオートエンコーダアーキテクチャUNITEを提案する。
UNITEは、画像トークン化器と重量共有による潜伏ジェネレータの両方として機能するジェネレータで構成されている。
トークン化とスクラッチ生成の単一段階共同訓練が実現可能であることを示す。
論文 参考訳(メタデータ) (2026-03-23T17:59:49Z) - OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence [113.73007911004446]
OneVision-Encoderは、視覚構造を意味的な意味に圧縮することでビデオをエンコードする。
Codec-aligned, patch-level sparsityは基本的な原則であり、次世代のビジュアルジェネラリストのためのスケーラブルなエンジンとしてOV-Encoderを可能にする。
論文 参考訳(メタデータ) (2026-02-09T14:06:17Z) - SCONE: A Practical, Constraint-Aware Plug-in for Latent Encoding in Learned DNA Storage [11.92900213512492]
プラグインモジュールは遅延圧縮とDNAエンコーディングを1ステップに分解する。
SCONEは、DNA塩基内の潜伏空間を直接コードする4次演算を実行する。
設計は完全な可逆性を保ち、修正することなく、ハイパープライアモデルの学習した事前を活用できる。
論文 参考訳(メタデータ) (2026-02-05T19:54:13Z) - Rethinking Genomic Modeling Through Optical Character Recognition [23.555844091817956]
我々は、光学文字認識(OCR)スタイルの文書理解としてゲノムモデリングを再構成する視覚ベースのフレームワークであるOCRを提案する。
光DNAは構造化された視覚レイアウトにDNAをレンダリングし、OCR対応の視覚言語モデルをエンコーダとエンコーダで訓練し、そこでエンコーダは高速圧縮のためにコンパクトで再構成可能な視覚トークンを生成する。
論文 参考訳(メタデータ) (2026-02-02T12:12:00Z) - MergeDNA: Context-aware Genome Modeling with Dynamic Tokenization through Token Merging [65.07273789940116]
本稿では,動的ゲノミクストークンと潜在トランスフォーマーをコンテキスト対応事前学習タスクで協調的に最適化する階層型アーキテクチャを提案する。
MergeDNAは3つの人気のあるDNAベンチマークと、微調整やゼロショット評価を伴う複数のマルチオミクスタスクにおいて優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-11-17T19:27:41Z) - NEURODNAAI: Neural pipeline approaches for the advancing dna-based information storage as a sustainable digital medium using deep learning framework [0.17398560678845074]
NeuroDNAAIはバイナリデータストリームをシンボリックDNA配列にエンコードし、置換、挿入、削除を伴うノイズのあるチャネルを通して伝達し、高い忠実さでそれらを再構築する。
理論、ワークフロー、シミュレーションをひとつのパイプラインに統合することで、NeuroDNAAIはスケーラブルで生物学的に有効なアーカイブDNAストレージを可能にします。
論文 参考訳(メタデータ) (2025-10-02T15:11:04Z) - SemAI: Semantic Artificial Intelligence-enhanced DNA storage for Internet-of-Things [9.858497777817522]
本稿では,Semantic Artificial Intelligence-enhanced DNA Storage(SemAI-DNA)パラダイムを紹介する。
数値的な結果から,SemAI-DNAの有効性が示され,従来の深層学習アプローチよりも2.61dBピーク信号-雑音比(PSNR)が向上し,構造類似度指数(SSIM)が0.13改善した。
論文 参考訳(メタデータ) (2024-09-18T12:21:58Z) - Implicit Neural Multiple Description for DNA-based data storage [6.423239719448169]
DNAは、ストレージ密度と長期的な安定性のために、データストレージソリューションとして大きな可能性を秘めている。
しかし、この新素材の開発には、特に貯蔵や生物学的操作によるエラーに対処する上で、独自の課題が伴う。
我々は,DNAデータ記憶にニューラルネットワークを利用する,新しい圧縮手法と最先端の多重記述符号化(MDC)技術を開発した。
論文 参考訳(メタデータ) (2023-09-13T13:42:52Z) - COIN++: Data Agnostic Neural Compression [55.27113889737545]
COIN++は、幅広いデータモダリティをシームレスに扱うニューラルネットワーク圧縮フレームワークである。
様々なデータモダリティを圧縮することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-01-30T20:12:04Z) - Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning [49.3231734733112]
シミュレーションデータに基づいてトレーニングされたDeep Neural Networks(DNN)、Product(TP)ベースのエラー修正コード(ECC)、安全マージンを1つのコヒーレントパイプラインに組み合わせたモジュラーで総合的なアプローチを示す。
我々の研究は, 最大で x3200 の速度向上, 40%の精度向上により, 現在の指導的ソリューションの改善を実現し, 高雑音下では1ベースあたり1.6ビットのコードレートを提供する。
論文 参考訳(メタデータ) (2021-08-31T18:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。