論文の概要: Factorization Machine with Quadratic-Optimization Annealing for RNA Inverse Folding and Evaluation of Binary-Integer Encoding and Nucleotide Assignment
- arxiv url: http://arxiv.org/abs/2602.16643v1
- Date: Wed, 18 Feb 2026 17:32:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.669816
- Title: Factorization Machine with Quadratic-Optimization Annealing for RNA Inverse Folding and Evaluation of Binary-Integer Encoding and Nucleotide Assignment
- Title(参考訳): RNA逆フォールディングのための擬似最適化アニーリングを用いた因子化装置と二項整数エンコーディングとヌクレオチドアサインメントの評価
- Authors: Shuta Kikuchi, Shu Tanaka,
- Abstract要約: 本研究では,FMQAの性能に及ぼす整数-ヌクレオチド代入とバイナリ-整数符号化の影響について検討した。
1ホットおよびドメインウォールエンコーディングは、正規化アンサンブル欠陥値の観点からバイナリおよびユニタリエンコーディングより優れる。
- 参考スコア(独自算出の注目度): 0.7519872646378835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The RNA inverse folding problem aims to identify nucleotide sequences that preferentially adopt a given target secondary structure. While various heuristic and machine learning-based approaches have been proposed, many require a large number of sequence evaluations, which limits their applicability when experimental validation is costly. We propose a method to solve the problem using a factorization machine with quadratic-optimization annealing (FMQA). FMQA is a discrete black-box optimization method reported to obtain high-quality solutions with a limited number of evaluations. Applying FMQA to the problem requires converting nucleotides into binary variables. However, the influence of integer-to-nucleotide assignments and binary-integer encoding on the performance of FMQA has not been thoroughly investigated, even though such choices determine the structure of the surrogate model and the search landscape, and thus can directly affect solution quality. Therefore, this study aims both to establish a novel FMQA framework for RNA inverse folding and to analyze the effects of these assignments and encoding methods. We evaluated all 24 possible assignments of the four nucleotides to the ordered integers (0-3), in combination with four binary-integer encoding methods. Our results demonstrated that one-hot and domain-wall encodings outperform binary and unary encodings in terms of the normalized ensemble defect value. In domain-wall encoding, nucleotides assigned to the boundary integers (0 and 3) appeared with higher frequency. In the RNA inverse folding problem, assigning guanine and cytosine to these boundary integers promoted their enrichment in stem regions, which led to more thermodynamically stable secondary structures than those obtained with one-hot encoding.
- Abstract(参考訳): RNA逆フォールディング問題は、与えられた標的二次構造を優先的に採用するヌクレオチド配列を同定することを目的としている。
様々なヒューリスティックな機械学習ベースのアプローチが提案されているが、その多くが多くのシーケンス評価を必要としており、実験的な検証が高価である場合に適用性を制限する。
本稿では,2次最適化アニーリング(FMQA)を用いた分解機を用いてこの問題を解決する手法を提案する。
FMQAは個々のブラックボックス最適化手法であり、限られた数の評価で高品質な解が得られる。
FMQAを問題に適用するには、ヌクレオチドをバイナリ変数に変換する必要がある。
しかし、FMQAの性能に対する整数-ヌクレオチド代入とバイナリ-整数符号化の影響は、サロゲートモデルと探索環境の構造を決定づけたとしても、完全には研究されていないため、解の質に直接影響を与える可能性がある。
そこで本研究では,RNA逆フォールディングのための新しいFMQAフレームワークの構築と,それらの課題と符号化方法の効果を解析することを目的としている。
4つのヌクレオチドの順序付き整数 (0-3) への割り当てを4つのバイナリ整数符号化法と組み合わせて評価した。
その結果,1ホットおよびドメインウォールの符号化は,正規化アンサンブル欠陥値において2値および1値の符号化よりも優れていた。
ドメインウォール符号化では、境界整数 (0, 3) に割り当てられたヌクレオチドは高い周波数で現れる。
RNA逆フォールディング問題では、これらの境界整数にグアニンとシトシンを割り当てることにより、幹細胞の濃縮が促進され、熱力学的に安定な二次構造となった。
関連論文リスト
- Effectiveness of Binary Autoencoders for QUBO-Based Optimization Problems [0.669087470775851]
ブラックボックス最適化では、客観的評価は高価であるため、高品質なソリューションは限られた予算の下で見つける必要がある。
最近の研究は、FMQAとバイナリオートエンコーダを組み合わせて、実現可能なソリューションからコンパクトなバイナリ潜在コードを学ぶ。
また,BAEは,同様の圧縮で手作業で設計したエンコーディングに比べて,ツアー距離と潜伏するハミング距離との整合性が良好であることを示す。
論文 参考訳(メタデータ) (2026-02-10T17:59:29Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Comparative Studies of Quantum Annealing, Digital Annealing, and Classical Solvers for Reaction Network Pathway Analysis and mRNA Codon Selection [0.0]
ディジタルアニールと量子アニールは最適化問題に対する準最適解を識別する可能性がある。
本研究は、最適化問題に対するQUBOソルバの有用性を評価するために、2つのユースケースをベンチマークする。
反応経路解析では、古典的なMIP/CPソルバが、妥当な時間枠で最適性の問題を解くために観察される。
論文 参考訳(メタデータ) (2025-09-11T21:22:50Z) - KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.56049319037421]
KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。
自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。
このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文 参考訳(メタデータ) (2025-03-04T19:17:36Z) - A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - A resource-efficient variational quantum algorithm for mRNA codon optimization [0.5120567378386615]
mRNAコドンの最適化は、特定の標的タンパク質の遺伝子発現に重要な影響を与える。
本研究は,ゲート型量子コンピュータ上での変分量子固有解法アルゴリズムを用いて,mRNAコドン最適化を実装するためのコドンを符号化する方法を提案する。
論文 参考訳(メタデータ) (2024-04-23T09:23:22Z) - Quantum Annealing Solutions for the Closest String Problem with D-Wave
Systems [0.0]
クローズストストリング問題(Closest String problem)は、生物情報学や符号化理論でよく見られるNP完全問題である。
2つのQUBOの定式化が提案されており、1つはもう1つに対してわずかに修正されている。
DWaveアナライザは、特定のプラットフォーム固有の関心事に対する最適なガイドラインを提供しながら使われてきた。
論文 参考訳(メタデータ) (2023-10-19T16:03:25Z) - Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective [63.3632827588974]
RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文 参考訳(メタデータ) (2022-12-02T16:34:56Z) - Fast Batch Nuclear-norm Maximization and Minimization for Robust Domain
Adaptation [154.2195491708548]
ランダムに選択されたデータバッチの分類出力行列の構造について検討し,予測可能性と多様性について検討した。
本稿では,目標出力行列上で核ノルムを行い,目標予測能力を向上するBatch Nuclear-norm Maximization and Minimizationを提案する。
実験により,本手法は3つの典型的なドメイン適応シナリオにおいて適応精度とロバスト性を高めることができることが示された。
論文 参考訳(メタデータ) (2021-07-13T15:08:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。