論文の概要: Building The Ph(ysical)AI Layer Of Machine Intelligence
- arxiv url: http://arxiv.org/abs/2606.04106v1
- Date: Tue, 02 Jun 2026 18:11:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.311057
- Title: Building The Ph(ysical)AI Layer Of Machine Intelligence
- Title(参考訳): 機械学習のPh(ysical)AIレイヤの構築
- Authors: Ulbert Jose Botero, Liam Smith, Brooks Olney, Pooya Khorrami, Steven Kusiak, Watson Jia, Sage Trudeau, Daniel Capecci,
- Abstract要約: ファンデーションモデルは、多様なデータに対する大規模なトレーニングを通じて一般化を実現するが、ペアのトレーニングデータなしで真に見えないドメインに移行する制限がある。
本稿では,信号理論の原理を符号化する基礎モデルを提案する。
我々は、RFデータから学習した凍結表現のみを用いて、音声、画像、テキスト、ビデオへのクロスモーダル転送を実現し、ターゲットドメインに対するエンコーダの微調整を必要としない。
- 参考スコア(独自算出の注目度): 0.5621251909851629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models achieve generalization through massive-scale training on diverse data, but have limitations with transfer to truly unseen domains without paired training data. We propose principle-driven foundation models that encode signal-theoretic principles (Fourier decomposition, energy conservation, symmetry) rather than learn untethered statistical correlations. We hypothesize that domains differ not in fundamental physics, but in learnable transformations in time, frequency, magnitude, or phase. Training exclusively on radio-frequency (RF) data with co-designed architecture and losses incorporating these principles, we achieve cross-modal transfer to audio, images, text, and video using only frozen representations learned from RF data, requiring no fine-tuning of the encoder on target domains. Our 1.99M parameter frozen encoder achieves 77.7% average accuracy (91.9% top-3) across 15 diverse tasks via linear probing, with systematic variation: 84.5 on physically-grounded tasks (speaker recognition, seismology, RF fingerprinting) versus 70.0% on semantic tasks (music genre, language recognition). This reveals that principle-driven and scale-driven approaches offer complementary paths: physical principles enable efficient cross-modal transfer while naturally establishing the boundary between physical and semantic understanding.
- Abstract(参考訳): ファンデーションモデルは、多様なデータに対する大規模なトレーニングを通じて一般化を実現するが、ペアのトレーニングデータなしで真に見えないドメインに移行する制限がある。
本稿では,信号理論の原理(フーリエ分解,エネルギー保存,対称性)を符号化する原理駆動基礎モデルを提案する。
ドメインは基本的な物理学ではなく、時間、周波数、大きさ、位相の学習可能な変換において異なるという仮説を立てる。
RFデータから学習した凍結表現のみを用いて、無線周波数(RF)データのみを学習し、これらの原則を取り入れた損失を低減し、オーディオ、画像、テキスト、ビデオへのクロスモーダル転送を実現する。
我々の1.99Mパラメータフリードエンコーダは、線形探索により15種類のタスクの平均精度(91.9%トップ3)を77.7%達成し、物理的に座屈したタスク(話者認識、地震学、RFフィンガープリンティング)では84.5、意味論的タスクでは70.0%(音楽ジャンル、言語認識)で達成した。
物理的原理は、物理的理解と意味的理解の境界を自然に確立しながら、効率的な相互移動を可能にする。
関連論文リスト
- SourceNet: Interpretable Sim-to-Real Inference on Variable-Geometry Sensor Arrays for Earthquake Source Inversion [7.936803576241796]
SourceNetはTransformerベースのフレームワークで、任意のジオメトリをモデル化するためのフレキシブルなセットとしてセンサアレイを扱う。
10万の合成イベントを事前トレーニングし、2,000の現実世界イベントを微調整することで、SourceNetは保持された実データに対する最先端の精度を達成する。
論文 参考訳(メタデータ) (2026-01-09T21:42:28Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Domain Translation of a Soft Robotic Arm using Conditional Cycle Generative Adversarial Network [0.8624680612413766]
条件付きサイクル生成逆ネットワーク(CCGAN)に基づくドメイン翻訳フレームワークを提案する。
本モデルでは,両領域の対応する端点位置と向きを条件とした入力圧力信号から学習する。
論文 参考訳(メタデータ) (2025-08-16T15:47:35Z) - Employing Discrete Fourier Transform in Representational Learning [0.6629765271909505]
確立されたアプローチは、オートエンコーダを使用して、ネットワークの圧縮点における潜在表現を抽出することである。
入力の離散フーリエ変換(DFT)を用いて、別の学習目標を提案する。
我々は,CIFAR-10の52.8%の精度をResNet-50で達成し,従来のオートエンコーダを12.8ポイント上回る性能で検証した。
論文 参考訳(メタデータ) (2025-06-07T11:17:24Z) - IQFM A Wireless Foundational Model for I/Q Streams in AI-Native 6G [7.531126877550286]
本稿では,無線通信における最初のI/Q信号基礎モデルであるIQFMについて述べる。
IQFMは変調分類、AoA、ビーム予測、RFフィンガープリントといった様々なタスクをサポートする。
また、タスク対応強化戦略を導入し、変換をコア拡張に分類する。
論文 参考訳(メタデータ) (2025-06-07T09:01:38Z) - RF Challenge: The Data-Driven Radio Frequency Signal Separation Challenge [66.33067693672696]
本稿では、深層学習手法を利用したデータ駆動手法を用いて、高周波信号における干渉拒否の重大な問題に対処する。
本論文の主な貢献は、RF信号データセットであるRF Challengeの導入である。
論文 参考訳(メタデータ) (2024-09-13T13:53:41Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - HFedMS: Heterogeneous Federated Learning with Memorable Data Semantics
in Industrial Metaverse [49.1501082763252]
本稿では,新しい産業メタバースに実用FLを取り入れたHFEDMSを提案する。
動的グルーピングとトレーニングモード変換によってデータの均一性を低下させる。
そして、圧縮された履歴データセマンティクスを融合することで、忘れられた知識を補う。
ストリームされた非I.d.FEMNISTデータセットに対して,368個のシミュレーションデバイスを用いて実験を行った。
論文 参考訳(メタデータ) (2022-11-07T04:33:24Z) - Understanding Self-Training for Gradual Domain Adaptation [107.37869221297687]
段階的なドメイン適応は、対象領域へ徐々にシフトするラベルのないデータのみを与えられたソースドメインで訓練された初期分類器を適応させることが目的である。
目標領域への直接適応が非有界誤差をもたらすような設定下において、段階的なシフトを伴う自己学習の誤差に対する最初の非無空上界を証明した。
この理論解析はアルゴリズムの洞察を導き、無限のデータを持つ場合でも正規化とラベルのシャープ化が不可欠であることを強調し、より小さなワッサーシュタイン無限距離のシフトに対して自己学習が特にうまく働くことを示唆している。
論文 参考訳(メタデータ) (2020-02-26T08:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。