論文の概要: Extractive summarization on a CMOS Ising machine
- arxiv url: http://arxiv.org/abs/2601.11491v2
- Date: Fri, 23 Jan 2026 07:19:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.279767
- Title: Extractive summarization on a CMOS Ising machine
- Title(参考訳): CMOSイジングマシンにおける抽出的要約
- Authors: Ziqing Zeng, Abhimanyu Kumar, Ahmet Efe, Ruihong Yin, Chris H. Kim, Ulya R. Karpuzcu, Sachin S. Sapatnekar,
- Abstract要約: 抽出要約(ES)は、文書から文のサブセットを選択することで、簡潔な要約を生成することを目的としている。
現代のESシステムは典型的にCPUやGPUのインフラに依存しており、リソース制約のある環境でのリアルタイムの推論には適していない。
本稿では,局所場と結合項のスケール不均衡を低減するハードウェア対応Isingの定式化を提案する。
我々は,整数結合型Isingハードウェアのみを用いて,精度の低い高品質なサマリーを生成可能であることを示す。
- 参考スコア(独自算出の注目度): 4.420782119809922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extractive summarization (ES) aims to generate a concise summary by selecting a subset of sentences from a document while maximizing relevance and minimizing redundancy. Although modern ES systems achieve high accuracy using powerful neural models, their deployment typically relies on CPU or GPU infrastructures that are energy-intensive and poorly suited for real-time inference in resource-constrained environments. In this work, we explore the feasibility of implementing McDonald-style extractive summarization on a low-power CMOS coupled oscillator-based Ising machine (COBI) that supports integer-valued, all-to-all spin couplings. We first propose a hardware-aware Ising formulation that reduces the scale imbalance between local fields and coupling terms, thereby improving robustness to coefficient quantization: this method can be applied to any problem formulation that requires k of n variables to be chosen. We then develop a complete ES pipeline including (i) stochastic rounding and iterative refinement to compensate for precision loss, and (ii) a decomposition strategy that partitions a large ES problem into smaller Ising subproblems that can be efficiently solved on COBI and later combined. Experimental results on the CNN/DailyMail dataset show that our pipeline can produce high-quality summaries using only integer-coupled Ising hardware with limited precision. COBI achieves 3-4.5x runtime speedups compared to a brute-force method, which is comparable to software Tabu search, and two to three orders of magnitude reductions in energy, while maintaining competitive summary quality. These results highlight the potential of deploying CMOS Ising solvers for real-time, low-energy text summarization on edge devices.
- Abstract(参考訳): 抽出要約(ES)は、文書から文のサブセットを選択し、関連性を最大化し、冗長性を最小化することにより、簡潔な要約を生成することを目的としている。
現代のESシステムは強力なニューラルモデルを使用して高い精度を達成するが、そのデプロイメントは通常、リソース制約のある環境でのリアルタイム推論に適さないエネルギー集約型のCPUやGPUインフラストラクチャに依存している。
本研究では,低消費電力CMOS結合発振器を用いたIsing Machine (COBI) 上でマクドナルド式抽出要約の実現の可能性を検討する。
まず,局所場と結合項のスケール不均衡を低減し,係数量子化に対するロバスト性を向上させるハードウェア対応Ising式を提案する。
次に、完全なESパイプラインを開発します。
一 精度損失を補うための確率的丸め及び反復的洗練
二 大規模なES問題をCOBI上で効率的に解き、後に組み合わせることができるより小さなIsingサブプロブレムに分割する分解戦略。
CNN/DailyMailデータセットの実験結果から,我々のパイプラインは整数結合型Isingハードウェアのみを用いて,精度の低い高品質なサマリーを生成可能であることが示された。
COBIは、ソフトウェア Tabu 検索に匹敵するブルートフォース法と、競合するサマリ品質を維持しつつ、2~3桁のエネルギー削減を達成し、実行速度を3~4.5倍に向上させる。
これらの結果は、エッジデバイス上でリアルタイムで低エネルギーのテキスト要約を実現するためにCMOS Isingソルバをデプロイする可能性を強調している。
関連論文リスト
- MPQ-DMv2: Flexible Residual Mixed Precision Quantization for Low-Bit Diffusion Models with Temporal Distillation [74.34220141721231]
我々は,textbfMixed textbfPrecision textbfQuantizationフレームワークを改良したMPQ-DMv2を提案する。
論文 参考訳(メタデータ) (2025-07-06T08:16:50Z) - Scalable Exploration via Ensemble++ [29.871658730354437]
ランダムな線形結合を持つ新しい共有要素アンサンブルアーキテクチャを用いたスケーラブルな探索フレームワークを提案する。
線形帯域については、Ensemble++がThompson Samplingに匹敵する後悔を達成していることを示す理論的保証を提供する。
我々は、固定された特徴を学習可能なニューラル表現に置き換えることで、この理論の基礎を非線形報酬に拡張する。
論文 参考訳(メタデータ) (2024-07-18T06:16:09Z) - Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization [0.6445087473595953]
大規模言語モデル(LLM)は、機械学習における様々なタスクにおいて優れたパフォーマンスを示す。
LLM推論のデプロイは、高い計算とメモリ要求のために問題となる。
我々は,低精度でLLM推論を効率的に展開できるアルゴリズム-ハードウェア共設計ソリューションであるテンダーを提案する。
論文 参考訳(メタデータ) (2024-06-16T09:51:55Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。