論文の概要: AEF-Econ: Toward Plug-and-Play Socioeconomic Foundation Embeddings from AlphaEarth for Urban Remote Sensing
- arxiv url: http://arxiv.org/abs/2606.20697v1
- Date: Mon, 15 Jun 2026 08:43:25 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:35:26.298025
- Title: AEF-Econ: Toward Plug-and-Play Socioeconomic Foundation Embeddings from AlphaEarth for Urban Remote Sensing
- Title(参考訳): AEF-Econ:AlphaEarthによる都市リモートセンシングのためのプラグイン・アンド・プレイ型社会経済財団への取り組み
- Authors: Shuyang Hou, Ziqi Liu, Haoyue Jiao, Lutong Xie, Yaxian Qing, Xiaopu Zhang, Qingyang Xu, Zhangyan Xu, Xuefeng Guan, Huayi Wu,
- Abstract要約: 8年間で36の都市で7つの異種データストリームを統合しました。
我々は3つのカテゴリに16のラベルを持つ社会経済ベンチマークCHN-Econを構築した。
我々は36都市8年で1440万ピクセルを推定し、128dと64dの圧縮版を含むAFF-Econをリリースする。
- 参考スコア(独自算出の注目度): 11.377452084318987
- License:
- Abstract: AlphaEarth Foundations (AEF) unify global remote sensing foundation embeddings through multimodal self-supervised learning, but their pretraining focuses on physical land-surface signals, limiting plug-and-play use in socioeconomic tasks. We integrate seven heterogeneous data streams across 36 Chinese cities over eight years - AEF embeddings, population, nighttime lights, remote sensing indices, points of interest (POIs), urban morphology, and cross-lingual text - and construct CHN-Econ, a socioeconomic benchmark with 16 labels in three categories. We conduct 31 controlled experiments along five axes: fusion architecture, self-supervised objective, text integration, embedding dimensionality, and normalization. Used alone as a linear probe, AEF achieves R2 values of only 0.301 for cross-region and 0.160 for cross-tier evaluation. The five-axis ablated backbone improves these scores to 0.832 and 0.671, respectively, but reveals that low-dimensional semantic streams are consistently suppressed by high-dimensional streams under shared reconstruction. To address this bottleneck, we propose Capacity-Adaptive Reconstruction (CAR), replacing shared reconstruction with per-stream decoders and stream-level losses to mitigate inter-stream capacity competition. CAR further raises cross-region and cross-tier R2 to 0.848 and 0.693, and restores collapsed labels from negative R2 to a stable range. Using CAR, we infer 14.4 million pixels across 36 cities and eight years and release AEF-Econ, including 128d and 64d compressed versions. Self-diagnostics and case studies show that AEF-Econ captures cross-city hierarchies and intra-urban spatial organization under unsupervised settings, providing a socioeconomic remote sensing foundation embedding complementary to AEF physical embeddings.
- Abstract(参考訳): AlphaEarth Foundations (AEF)は、マルチモーダルな自己教師付き学習を通じて、グローバルなリモートセンシング基盤を統合しているが、その事前訓練は、物理的な地上信号に焦点を当て、社会経済的なタスクにおけるプラグアンドプレイの使用を制限する。
AEF埋め込み、人口、夜間光、リモートセンシング指標、関心点(POI)、都市形態、言語間テキストなど、中国の36都市で8年間にわたって、異種データストリームを7つ統合し、3つのカテゴリに16のラベルを持つ社会経済ベンチマークであるCHN-Econを構築します。
我々は,融合アーキテクチャ,自己教師対象,テキスト統合,次元の埋め込み,正規化の5つの軸に沿って31個の制御実験を行った。
線形プローブとして単独で用いられるAEFは、クロスリージョンでは0.301、クロス層評価では0.160のR2値を達成している。
5軸短縮バックボーンはこれらのスコアを0.832と0.671に改善するが、低次元のセマンティックストリームは共有再構成下の高次元ストリームによって一貫して抑制される。
このボトルネックに対処するために、ストリーム間デコーダによる共有再構成とストリームレベルの損失を解消し、ストリーム間容量競争を緩和する容量適応再構成(CAR)を提案する。
CARはさらにクロスリージョンとクロスレベルR2を0.848と0.693に引き上げ、崩壊したラベルを負のR2から安定な範囲に復元する。
CARを用いて36都市8年間の1440万ピクセルを推定し、128dと64dの圧縮版を含むAFF-Econをリリースする。
自己診断とケーススタディは、AFF-Econが都市間階層と都市内空間組織を教師なしの環境下で捉え、AFF物理埋め込みを補完する社会経済的リモートセンシング基盤を提供することを示している。
関連論文リスト
- URDF Synthesis from RGB-D Sequences via Differentiable Joint Inference and Energy-Consistent Verification [2.538209532048867]
KinemaForgeは制約駆動のパイプラインで、短いRGB-Dシーケンスから部分レベルの形状、関節トポロジー、関節パラメータを推論する。
平均関節軸誤差は4.52度から2.83度(-37.4%)に減少する。
KinemaForgeは、クローズドループ操作の成功率がDittoよりも14.6ポイント向上したURDFを産出する。
論文 参考訳(メタデータ) (2026-06-17T09:42:25Z) - Slum Detection and Density Mapping with AlphaEarth Foundations: A Representation Learning Evaluation Across 12 Global Cities [9.982796078979648]
画素レベルのスラムマッピングは、長い間、限られた都市間一般化によって制約されてきた。
AlphaEarth Foundationsは、軽量スラムモニタリングのための新しい分析可能なベースを提供する。
我々は,12都市と69都市年対のスラム分類とサブピクセル密度推定についてAFFを評価した。
論文 参考訳(メタデータ) (2026-05-11T05:54:15Z) - SpatialFly: Geometry-Guided Representation Alignment for UAV Vision-and-Language Navigation in Urban Environments [49.966170814478915]
UAV VLNのための幾何学誘導空間表現フレームワークを提案する。
明示的な3次元再構成を伴わないRGB観測において、SpatialFlyは幾何学誘導2次元表示アライメント機構を導入する。
実験結果から、SpatialFlyは現状のUAV VLNベースラインを目に見える環境と見えない環境の両方で一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2026-03-22T03:56:58Z) - DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning [62.347535250646196]
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
論文 参考訳(メタデータ) (2026-03-16T02:02:38Z) - Physically Interpretable AlphaEarth Foundation Model Embeddings Enable LLM-Based Land Surface Intelligence [0.0]
環境変数26に対して,Google AlphaEarthの64次元埋め込みを包括的に解析する。
次に、FAISSによる1210万ベクトルの埋め込みデータベース上での検索拡張生成を実装するランドサーフェスインテリジェンスシステムを開発した。
論文 参考訳(メタデータ) (2026-02-10T22:58:50Z) - Democratizing planetary-scale analysis: An ultra-lightweight Earth embedding database for accurate and flexible global land monitoring [19.019853798955513]
ESDは、2000年から2024年までの25年間にわたる、超軽量で30mの地球埋め込みデータベースである。
データセットは、生のアーカイブと比較してデータボリュームが340倍に減少する。
頑丈な数発の学習能力と長手一貫性により、ESDは惑星スケールの研究を民主化するための汎用的な基盤を提供する。
論文 参考訳(メタデータ) (2026-01-16T10:59:43Z) - Fed-LDR: Federated Local Data-infused Graph Creation with Node-centric Model Refinement [6.518460105727812]
本稿では,ノード中心モデル再定義(Fed-LDR)アルゴリズムを用いたFederated Local Data-Infused Graph Creationを提案する。
Fed-LDR は FL と Graph Convolutional Networks (GCN) を活用し、都市環境における時空間データ分析を強化する。
その結果,Fed-LDRは平均絶対誤差(MAE)が20.15,17.30,Root Mean Square Error(RMSE)が32.30,27.15であった。
論文 参考訳(メタデータ) (2024-11-07T18:13:31Z) - Towards Label-free Scene Understanding by Vision Foundation Models [87.13117617056004]
ネットワークがラベル付きデータなしで2Dおよび3D世界を理解できるようにするためのビジョン基盤モデルの可能性について検討する。
本稿では,CLIPとSAMの強度を利用して2次元ネットワークと3次元ネットワークを同時に監視するクロスモダリティ・ノイズ・スーパービジョン(CNS)手法を提案する。
我々の2Dネットワークと3Dネットワークは、ScanNet上で28.4%と33.5%のmIoUでラベルなしセマンティックセグメンテーションを実現し、それぞれ4.7%と7.9%を改善した。
論文 参考訳(メタデータ) (2023-06-06T17:57:49Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。