論文の概要: Over-the-Air Semantic Alignment with Stacked Intelligent Metasurfaces
- arxiv url: http://arxiv.org/abs/2512.05657v1
- Date: Fri, 05 Dec 2025 12:05:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:57.012931
- Title: Over-the-Air Semantic Alignment with Stacked Intelligent Metasurfaces
- Title(参考訳): 積み重ねた知能メタサーフェスによる風上セマンティックアライメント
- Authors: Mario Edoardo Pandolfo, Kyriakos Stylianopoulos, George C. Alexandropoulos, Paolo Di Lorenzo,
- Abstract要約: 重畳されたインテリジェントなメタサーフェス(SIM)をベースとした,空気上における最初のセマンティックアライメントフレームワークについて紹介する。
SIMは教師付きセマンティックイコライザとゼロショットのセマンティックイコライザの両方を再現することができ、高い信号対雑音比(SNR)を持つレジームで最大90%のタスク精度を達成することができる。
ヘテロジニアス・ビジョン・トランスフォーマー(ViT)エンコーダを用いた実験では、SIMは教師付きセマンティック・イコライザーとゼロショット・セマンティック・イコライザーの両方を正確に再現でき、高い信号対雑音比(SNR)を持つレジームにおいて最大90%のタスク精度を達成できる。
- 参考スコア(独自算出の注目度): 34.75476728721597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic communication systems aim to transmit task-relevant information between devices capable of artificial intelligence, but their performance can degrade when heterogeneous transmitter-receiver models produce misaligned latent representations. Existing semantic alignment methods typically rely on additional digital processing at the transmitter or receiver, increasing overall device complexity. In this work, we introduce the first over-the-air semantic alignment framework based on stacked intelligent metasurfaces (SIM), which enables latent-space alignment directly in the wave domain, reducing substantially the computational burden at the device level. We model SIMs as trainable linear operators capable of emulating both supervised linear aligners and zero-shot Parseval-frame-based equalizers. To realize these operators physically, we develop a gradient-based optimization procedure that tailors the metasurface transfer function to a desired semantic mapping. Experiments with heterogeneous vision transformer (ViT) encoders show that SIMs can accurately reproduce both supervised and zero-shot semantic equalizers, achieving up to 90% task accuracy in regimes with high signal-to-noise ratio (SNR), while maintaining strong robustness even at low SNR values.
- Abstract(参考訳): セマンティック通信システムは、人工知能能力を持つデバイス間でタスク関連情報を伝達することを目的としているが、不均一な送信機受信機モデルが不整合潜時表現を生成すると、その性能は低下する可能性がある。
既存のセマンティックアライメント手法は通常、送信機や受信機で追加のデジタル処理に依存し、デバイス全体の複雑さを増大させる。
本研究では,階層型知的準曲面(SIM)をベースとして,波動領域内での遅延空間のアライメントを可能とし,デバイスレベルでの計算負担を大幅に軽減する,初めての航空上のセマンティックアライメントフレームワークを提案する。
我々はSIMを教師付き線形整合器とゼロショットParsevalフレームベースの等化器の両方をエミュレートできる訓練可能な線形演算子としてモデル化する。
これらの演算子を物理的に実現するために,準曲面伝達関数を所望のセマンティックマッピングに調整する勾配に基づく最適化手法を開発した。
ヘテロジニアス・ビジョン・トランスフォーマー(ViT)エンコーダを用いた実験では、SIMは教師付きセマンティック・イコライザとゼロショットのセマンティック・イコライザの両方を正確に再現でき、高い信号対雑音比(SNR)を持つレギュレータでは最大90%のタスク精度を達成できる。
関連論文リスト
- GITO: Graph-Informed Transformer Operator for Learning Complex Partial Differential Equations [0.0]
複素偏微分方程式系を学習するための新しいグラフインフォームド・トランスフォーマ演算子(GITO)アーキテクチャを提案する。
GITOは、HGT(Hybrid graph transformer)とTNO(Transformer Neural operator)の2つの主要モジュールから構成される。
ベンチマークPDEタスクの実験的結果は、GITOが既存のトランスフォーマーベースのニューラル演算子より優れていることを示している。
論文 参考訳(メタデータ) (2025-06-16T18:35:45Z) - SatelliteFormula: Multi-Modal Symbolic Regression from Remote Sensing Imagery for Physics Discovery [8.965479246496878]
リモートセンシング画像から直接物理的に解釈可能な表現を導出する新しい記号回帰フレームワークを提案する。
SatelliteFormulaは、空間スペクトル特徴抽出のためのVision Transformerベースのエンコーダと、物理誘導制約を組み合わせて、一貫性と解釈性を保証する。
論文 参考訳(メタデータ) (2025-06-06T15:39:54Z) - Progressive Inertial Poser: Progressive Real-Time Kinematic Chain Estimation for 3D Full-Body Pose from Three IMU Sensors [25.67875816218477]
スパース追跡信号からのフルボディポーズ推定は、環境条件や記録範囲によって制限されない。
従来の作業では、骨盤と下肢にセンサーを追加することや、キージョイントのグローバルな位置を得るために外部視覚センサーに頼ることが困難だった。
仮想現実技術の実用性を向上させるため,頭部と手首に装着した3つの慣性計測ユニット(IMU)センサから得られた慣性データのみを用いて,全身のポーズを推定した。
論文 参考訳(メタデータ) (2025-05-08T15:28:09Z) - Over-the-Air Edge Inference via End-to-End Metasurfaces-Integrated Artificial Neural Networks [29.28415364984592]
エッジ推論(EI)のための準曲面統合ニューラルネットワーク(MINN)の枠組みを提案する。
MINNは、EI要求を大幅に単純化し、トレーニングに比べて50ドル以下で、ほぼ最適性能を達成できる。
論文 参考訳(メタデータ) (2025-03-31T21:14:09Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Hierarchical Spherical CNNs with Lifting-based Adaptive Wavelets for
Pooling and Unpooling [101.72318949104627]
本稿では, 階層型畳み込みニューラルネットワーク(HS-CNN)の新たな枠組みを提案し, プールやアンプールのための適応球面ウェーブレットを学習する。
LiftHS-CNNは、画像レベルのタスクとピクセルレベルのタスクの両方において、より効率的な階層的特徴学習を実現する。
論文 参考訳(メタデータ) (2022-05-31T07:23:42Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。