論文の概要: Model-Aware Rate-Distortion Limits for Task-Oriented Source Coding
- arxiv url: http://arxiv.org/abs/2602.12866v1
- Date: Fri, 13 Feb 2026 12:15:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.941787
- Title: Model-Aware Rate-Distortion Limits for Task-Oriented Source Coding
- Title(参考訳): タスク指向音源符号化におけるモデル認識速度歪み限界
- Authors: Andriy Enttsel, Vincent Corlay,
- Abstract要約: Task-Oriented Source Coding (TOSC) は、機械中心の推論システムにおける効率的なビジュアルデータ通信のパラダイムとして登場した。
我々は、間接速度歪み理論のレンズを通して、単一TOSCの基本的限界を再考する。
本稿では,タスクモデルの最適度とアーキテクチャ制約を考慮に入れた,タスクモデルを考慮した速度歪み境界を提案する。
- 参考スコア(独自算出の注目度): 6.502899393249507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-Oriented Source Coding (TOSC) has emerged as a paradigm for efficient visual data communication in machine-centric inference systems, where bitrate, latency, and task performance must be jointly optimized under resource constraints. While recent works have proposed rate-distortion bounds for coding for machines, these results often rely on strong assumptions on task identifiability and neglect the impact of deployed task models. In this work, we revisit the fundamental limits of single-TOSC through the lens of indirect rate-distortion theory. We highlight the conditions under which existing rate-distortion bounds are achievable and show their limitations in realistic settings. We then introduce task model-aware rate-distortion bounds that account for task model suboptimality and architectural constraints. Experiments on standard classification benchmarks confirm that current learned TOSC schemes operate far from these limits, highlighting transmitter-side complexity as a key bottleneck.
- Abstract(参考訳): Task-Oriented Source Coding (TOSC)は、ビットレート、レイテンシ、タスクパフォーマンスがリソース制約の下で協調的に最適化されなければならない、マシン中心の推論システムにおける効率的なビジュアルデータ通信のパラダイムとして登場した。
近年の研究では、機械のコーディングの速度歪み境界が提案されているが、これらの結果は多くの場合、タスクの識別可能性に対する強い仮定に依存し、デプロイされたタスクモデルの影響を無視する。
本研究では、間接速度歪み理論のレンズを通して、単一TOSCの基本的限界を再考する。
我々は、既存のゆがみ境界が達成可能な条件を強調し、現実的な設定でそれらの制限を示す。
次に、タスクモデルの最適度とアーキテクチャ上の制約を考慮した、タスクモデルに注意する速度歪みバウンダリを導入する。
標準分類ベンチマークの実験では、現在の学習されたTOSCスキームはこれらの限界から遠く離れており、送信側の複雑さが鍵となるボトルネックとして強調されている。
関連論文リスト
- On the Paradoxical Interference between Instruction-Following and Task Solving [50.75960598434753]
次の命令は、大規模言語モデル(LLM)を、タスクの実行方法に関する明示的な制約を指定することで、人間の意図と整合させることを目的としている。
我々は,LLMのタスク解決能力にパラドックス的に干渉する命令に従うという,直感に反する現象を明らかにした。
本稿では,タスク解決に追従する命令の干渉を定量化する指標として,SUSTAINSCOREを提案する。
論文 参考訳(メタデータ) (2026-01-29T17:48:56Z) - Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning [52.03884701766989]
オフライン強化学習(RL)アルゴリズムは、通常、アクション選択に制約を課す。
本稿では,Bellmanターゲットにおける行動選択を,データセットアクションの近傍の結合に制限する新しい地区制約を提案する。
我々は,この制約を満たす目標動作を用いてQ学習を行うための,単純で効果的なアルゴリズムであるAdaptive Neighborhood-Constrained Q Learning(ANQ)を開発した。
論文 参考訳(メタデータ) (2025-11-04T13:42:05Z) - R-ConstraintBench: Evaluating LLMs on NP-Complete Scheduling [0.0]
R-ConstraintBenchは、資源制約計画スケジューリング問題(RCPSP)のモデルを評価するフレームワークである。
データセンターのマイグレーション設定でベンチマークをインスタンス化し、実行可能性とエラー分析を用いて複数のLCMを評価する。
実証的には、強いモデルは優先順位のみのDAGでほぼシーリングされるが、ダウンタイム、時間的ウィンドウ、および解離的制約が相互作用すると、実現可能性のパフォーマンスは低下する。
論文 参考訳(メタデータ) (2025-08-21T03:35:58Z) - GLAD: Generalizable Tuning for Vision-Language Models [41.071911050087586]
GLAD (Generalizable LoRA tuning with RegulArized GraDient) という,よりシンプルで汎用的なフレームワークを提案する。
我々は,LoRAを適用するだけで,現在の最先端のプロンプトベースの手法に匹敵するダウンストリームタスクのパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2025-07-17T12:58:15Z) - Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.57755931421285]
大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。
本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。
本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-16T08:42:16Z) - The Larger the Merrier? Efficient Large AI Model Inference in Wireless Edge Networks [56.37880529653111]
大規模計算モデル(LAIM)サービスの需要は、従来のクラウドベースの推論から、低レイテンシでプライバシ保護のアプリケーションのためのエッジベースの推論へのパラダイムシフトを推進している。
本稿では,事前学習したLAIMをデバイス上のサブモデルとサーバ上のサブモデルに分割して配置するLAIM推論方式について検討する。
論文 参考訳(メタデータ) (2025-05-14T08:18:55Z) - An unsupervised approach towards promptable defect segmentation in laser-based additive manufacturing by Segment Anything [7.188573079798082]
我々は、最先端のビジョントランスフォーマー(ViT)ベースのファンデーションモデルを用いて、画像セグメンテーションのためのフレームワークを構築する。
我々は、ラベル付きデータを使わずに高精度に学習し、迅速なチューニングプロセスを導出する。
我々は、現在のレーザー添加物製造プロセスに革命をもたらす可能性のある、リアルタイムな異常検出パイプラインの構築を構想する。
論文 参考訳(メタデータ) (2023-12-07T06:03:07Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。