論文の概要: Text-RSIR: A Text-Guided Framework for Efficient Remote Sensing Image Transmission and Reconstruction
- arxiv url: http://arxiv.org/abs/2605.15558v1
- Date: Fri, 15 May 2026 02:54:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.155005
- Title: Text-RSIR: A Text-Guided Framework for Efficient Remote Sensing Image Transmission and Reconstruction
- Title(参考訳): Text-RSIR:効率的なリモートセンシング画像伝送と再構成のためのテキストガイドフレームワーク
- Authors: Hao Yang, Xianping Ma, Peifeng Ma, Man-On Pun,
- Abstract要約: 高解像度リモートセンシング画像は, 環境モニタリング, 都市マッピング, 土地被覆解析に重要である。
従来のパイプラインは全解像度のピクセルデータを送信し、冗長で非効率な配信をもたらす。
本稿では,高解像度データをコンパクトなテキスト記述を伴う低解像度画像に置き換えるテキスト誘導型リモートセンシング画像伝送システムを提案する。
- 参考スコア(独自算出の注目度): 5.382246566026898
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: High-resolution remote sensing imagery is critical for environmental monitoring, urban mapping, and land cover analysis, but its transmission is often hindered by limited bandwidth and high communication costs. Conventional pipelines transmit full-resolution pixel data, resulting in redundant and inefficient delivery. This paper proposes a text-guided remote sensing image transmission system that replaces complete high-resolution data with low-resolution images accompanied by compact textual descriptions. An onboard text generator produces spatial and semantic summaries, reducing the transmitted data volume to approximately 2\% of the original size. For ground-based reconstruction, a text-conditioned image restoration model is introduced, which leverages cross-modal learning to recover fine spatial details and maintain semantic coherence. Experimental results on the Alsat-2B, UC Merced Land Use, and Aerial Image datasets demonstrate that the proposed framework achieves reconstruction PSNRs of 16.36 dB, 26.87 dB, and 27.41 dB, respectively, enabling efficient and information-preserving image transfer for remote sensing applications. The implementation will be made publicly available at \href{https://github.com/haoyangofficial/textrssr}{GitHub}.
- Abstract(参考訳): 高解像度リモートセンシング画像は、環境モニタリング、都市マッピング、土地被覆分析において重要であるが、その伝送は帯域幅や通信コストの制限によって妨げられることが多い。
従来のパイプラインは全解像度のピクセルデータを送信し、冗長で非効率な配信をもたらす。
本稿では,高解像度データをコンパクトなテキスト記述を伴う低解像度画像に置き換えるテキスト誘導型リモートセンシング画像伝送システムを提案する。
オンボードテキストジェネレータは、空間的および意味的な要約を生成し、送信されたデータ量を元のサイズの約2倍に削減する。
テキスト条件付き画像復元モデルを導入し, クロスモーダル学習を利用して細かな空間的詳細を復元し, セマンティック・コヒーレンスを維持する。
Alsat-2B, UC Merced Land Use, およびAerial Imageデータセットの実験結果から, 提案したフレームワークは, それぞれ16.36dB, 26.87dB, 27.41dBの再現PSNRを達成し, リモートセンシングアプリケーションにおける効率的な情報保存画像転送を実現する。
実装は \href{https://github.com/haoyangofficial/textrssr}{GitHub} で公開される。
関連論文リスト
- Hierarchy-Aware and Channel-Adaptive Semantic Communication for Bandwidth-Limited Data Fusion [27.049330099874396]
本稿では,帯域幅制限データ融合のための階層認識とチャネル適応型セマンティック通信手法を提案する。
超解像に必要な画像の全体構造情報と詳細の両方を保持するために階層的相関モジュールを提案する。
深い特徴と浅い特徴を動的に統合し,伝達するために,Transformerに基づくチャネル適応型アテンション機構を提案する。
論文 参考訳(メタデータ) (2025-03-22T14:02:52Z) - HoliSDiP: Image Super-Resolution via Holistic Semantics and Diffusion Prior [62.04939047885834]
本稿では,意味的セグメンテーションを活用するフレームワークであるHoliSDiPについて述べる。
本手法では, セグメンテーションマスクと空間CLIPマップを用いて, セグメンテーションガイダンスを導入しながら, セグメンテーションラベルを簡潔なテキストプロンプトとして利用する。
論文 参考訳(メタデータ) (2024-11-27T15:22:44Z) - Textual Inversion and Self-supervised Refinement for Radiology Report Generation [25.779160968864435]
放射線学レポート作成のためのテキスト・インバージョン・セルフ・教師付きリファインメント(TISR)を提案する。
TISRは、画像を擬似語として表現することで、テキストと画像を同じ空間に投影し、相互モデリングのギャップをなくす。
広範に利用されている2つの公開データセットの実験を行い、様々なベースラインで大幅に改善した。
論文 参考訳(メタデータ) (2024-05-31T03:47:44Z) - Robust Disaster Assessment from Aerial Imagery Using Text-to-Image Synthetic Data [66.49494950674402]
航空画像からの損傷評価のタスクのための大規模合成監視を作成する際に,新たなテキスト・画像生成モデルを活用する。
低リソース領域から何千ものポストディスアスター画像を生成するために、効率的でスケーラブルなパイプラインを構築しています。
我々は,xBDおよびSKAI画像のクロスジオグラフィー領域転送設定におけるフレームワークの強度を,単一ソースとマルチソースの両方で検証する。
論文 参考訳(メタデータ) (2024-05-22T16:07:05Z) - Image Super-Resolution with Text Prompt Diffusion [118.023531454099]
画像SRにテキストプロンプトを導入し、劣化前の情報を提供する。
PromptSRは、最新のマルチモーダル大言語モデル(MLLM)を利用して、低解像度画像からプロンプトを生成する。
実験により、テキストプロンプトをSRに導入すると、合成画像と実世界の画像の両方で印象的な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-11-24T05:11:35Z) - RSDiff: Remote Sensing Image Generation from Text Using Diffusion Model [0.8747606955991705]
本研究では,高解像度衛星画像をテキストプロンプトから合成するための2段階拡散モデル手法を提案する。
このパイプラインは、テキスト入力に基づいて初期画像を生成する低解像度拡散モデル(LRDM)と、これらの画像を高解像度出力に洗練する超解拡散モデル(SRDM)から構成される。
論文 参考訳(メタデータ) (2023-09-03T09:34:49Z) - Rethinking Super-Resolution as Text-Guided Details Generation [21.695227836312835]
テキストと画像のモダリティからの情報を有効に活用できるテキストガイド型超解法(TGSR)フレームワークを提案する。
提案したTGSRは、粗い処理によってテキスト記述と一致するHR画像の詳細を生成することができる。
論文 参考訳(メタデータ) (2022-07-14T01:46:38Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - TWIST-GAN: Towards Wavelet Transform and Transferred GAN for
Spatio-Temporal Single Image Super Resolution [4.622977798361014]
単一画像スーパーレゾリューション(sisr)は、空間解像度の低いリモートセンシング画像から、微細な空間解像度を持つ高解像度画像を生成する。
深層学習とGAN(Generative Adversarial Network)は、単一画像超解像(SISR)の課題を突破した。
論文 参考訳(メタデータ) (2021-04-20T22:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。