Fugu-MT 論文翻訳(概要): Deep Extrapolation for Attribute-Enhanced Generation

論文の概要: Deep Extrapolation for Attribute-Enhanced Generation

arxiv url: http://arxiv.org/abs/2107.02968v1
Date: Wed, 7 Jul 2021 01:30:36 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-08 14:11:59.526246
Title: Deep Extrapolation for Attribute-Enhanced Generation
Title（参考訳）: 属性強化ジェネレーションのための深部外挿
Authors: Alvin Chan, Ali Madani, Ben Krause, Nikhil Naik
Abstract要約: 自然言語とタンパク質に着目した配列生成における外挿の新たな課題を定式化する。本稿では,学習された潜在空間を通じて属性を向上する生成フレームワークであるgenhanceを提案する。
参考スコア（独自算出の注目度）: 10.623015292814683
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Attribute extrapolation in sample generation is challenging for deep neural networks operating beyond the training distribution. We formulate a new task for extrapolation in sequence generation, focusing on natural language and proteins, and propose GENhance, a generative framework that enhances attributes through a learned latent space. Trained on movie reviews and a computed protein stability dataset, GENhance can generate strongly-positive text reviews and highly stable protein sequences without being exposed to similar data during training. We release our benchmark tasks and models to contribute to the study of generative modeling extrapolation and data-driven design in biology and chemistry.
Abstract（参考訳）: サンプル生成における属性の補間は、トレーニング分布を超えた深層ニューラルネットワークでは困難である。我々は,自然言語とタンパク質に着目し,配列生成における新たな外挿タスクを定式化し,学習された潜在空間を通じて属性を強化する生成フレームワークgenhanceを提案する。映画レビューと計算されたタンパク質安定性データセットで訓練されたgenhanceは、トレーニング中に同様のデータに晒されることなく、強い肯定的なテキストレビューと高度に安定したタンパク質配列を生成することができる。我々は,生物・化学における生成モデル外挿とデータ駆動設計の研究に寄与するベンチマークタスクとモデルをリリースする。

関連論文リスト

UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文参考訳（メタデータ） (2025-03-09T16:43:07Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-10-31T15:22:03Z)
Diffusion-Based Generation of Neural Activity from Disentangled Latent Codes [1.9544534628180867]
本稿では,条件付き生成モデリングの進歩を生かしたニューラルデータ解析手法を提案する。我々は,高情報付きコードに基づくニューラル・オブザーバ生成と呼ばれるモデルを時系列ニューラル・データに適用する。 VAEベースのシーケンシャルオートエンコーダと比較して、GNOCCHIは、鍵となる振る舞い変数に関してより明確に構造化され、よりゆがみのある高品質な潜在空間を学習する。
論文参考訳（メタデータ） (2024-07-30T21:07:09Z)
Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文参考訳（メタデータ） (2024-07-16T14:05:03Z)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳（メタデータ） (2024-07-03T10:31:30Z)
A Kernel-Based Neural Network Test for High-dimensional Sequencing Data Analysis [0.8221435109014762]
シーケンシングデータの複雑な関連解析のための新しいカーネルベースニューラルネットワーク(KNN)テストを導入する。 KNNに基づいて、高次元遺伝データの関心の表現型との結合性を評価するために、ウォルド型試験が導入された。
論文参考訳（メタデータ） (2023-12-05T16:06:23Z)
Target-aware Variational Auto-encoders for Ligand Generation with Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文参考訳（メタデータ） (2023-08-02T12:08:17Z)
SESNet: sequence-structure feature-integrated deep learning method for data-efficient protein engineering [6.216757583450049]
タンパク質変異体の適合度を予測するための教師付きディープラーニングモデルであるSESNetを開発した。 SESNetは,シーケンスと関数の関係を予測するための最先端モデルよりも優れていることを示す。我々のモデルは、タンパク質変異体の適合性の予測において、特に高次変異体に対して驚くほど高い精度を達成することができる。
論文参考訳（メタデータ） (2022-12-29T01:49:52Z)
Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文参考訳（メタデータ） (2022-02-01T17:11:13Z)
Towards Open-World Feature Extrapolation: An Inductive Graph Learning Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文参考訳（メタデータ） (2021-10-09T09:02:45Z)
Towards an Automatic Analysis of CHO-K1 Suspension Growth in Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文参考訳（メタデータ） (2020-10-20T08:36:51Z)
Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。我々はGumbel-Softmax法を利用して離散値列の分布を近似する。提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-09-18T03:52:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。