論文の概要: SMOL-MapSeg: Show Me One Label
- arxiv url: http://arxiv.org/abs/2508.05501v1
- Date: Thu, 07 Aug 2025 15:36:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.928279
- Title: SMOL-MapSeg: Show Me One Label
- Title(参考訳): SMOL-MapSeg: ラベルをひとつ見せてくれ
- Authors: Yunshuang Yuan, Frank Thiemann, Thorsten Dahms, Monika Sester,
- Abstract要約: SMOL-MapSegはOND知識によって定義されたクラスを正確にセグメント化できることを示す。
数ショットの微調整によって、目に見えないクラスにも適応できる。
平均セグメンテーション性能では、UNetベースのベースラインを上回っている。
- 参考スコア(独自算出の注目度): 0.4499833362998489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Historical maps are valuable for studying changes to the Earth's surface. With the rise of deep learning, models like UNet have been used to extract information from these maps through semantic segmentation. Recently, pre-trained foundation models have shown strong performance across domains such as autonomous driving, medical imaging, and industrial inspection. However, they struggle with historical maps. These models are trained on modern or domain-specific images, where patterns can be tied to predefined concepts through common sense or expert knowledge. Historical maps lack such consistency -- similar concepts can appear in vastly different shapes and styles. To address this, we propose On-Need Declarative (OND) knowledge-based prompting, which introduces explicit prompts to guide the model on what patterns correspond to which concepts. This allows users to specify the target concept and pattern during inference (on-need inference). We implement this by replacing the prompt encoder of the foundation model SAM with our OND prompting mechanism and fine-tune it on historical maps. The resulting model is called SMOL-MapSeg (Show Me One Label). Experiments show that SMOL-MapSeg can accurately segment classes defined by OND knowledge. It can also adapt to unseen classes through few-shot fine-tuning. Additionally, it outperforms a UNet-based baseline in average segmentation performance.
- Abstract(参考訳): 歴史的地図は地球表面の変化を研究するのに有用である。
ディープラーニングの台頭とともに、UNetのようなモデルは、セマンティックセグメンテーションを通じてこれらのマップから情報を抽出するために使われてきた。
近年, 自動運転, 医用画像, 産業検査などの分野において, 事前学習型基礎モデルの性能が向上している。
しかし、歴史地図に苦しむ。
これらのモデルは、共通の感覚や専門家の知識を通じて、事前に定義された概念にパターンを結び付けることができる、モダンまたはドメイン固有のイメージに基づいて訓練されている。
歴史的地図にはそのような一貫性が欠如しており、類似した概念が全く異なる形やスタイルに現れることがある。
そこで本研究では,どのパターンがどの概念に対応しているのかをモデルに導出するための明示的なプロンプトを導入する,OND(On-Need Declarative)ナレッジベースのプロンプトを提案する。
これにより、ユーザは推論中にターゲットのコンセプトとパターンを指定できる(オンデマンド推論)。
我々は,基礎モデルSAMのプロンプトエンコーダをONDプロンプト機構に置き換え,歴史地図上で微調整することで実装する。
結果のモデルはSMOL-MapSeg(Show Me One Label)と呼ばれる。
SMOL-MapSegはOND知識によって定義されたクラスを正確にセグメント化することができる。
数ショットの微調整によって、目に見えないクラスにも適応できる。
さらに、平均セグメンテーション性能において、UNetベースのベースラインを上回っている。
関連論文リスト
- DiffuMatch: Category-Agnostic Spectral Diffusion Priors for Robust Non-rigid Shape Matching [53.39693288324375]
ネットワーク内正規化と関数型マップトレーニングの両方をデータ駆動方式に置き換えることができることを示す。
まず、スコアベース生成モデルを用いてスペクトル領域における関数写像の生成モデルを訓練する。
次に、得られたモデルを利用して、新しい形状コレクション上の基底真理汎関数写像の構造的特性を促進する。
論文 参考訳(メタデータ) (2025-07-31T16:44:54Z) - Now you see me! A framework for obtaining class-relevant saliency maps [38.663697418404546]
ニューラルネットワークが特定の予測に使用する入力特徴を理解するために、サリエンシマップが開発された。
広く使われているが、これらの手法は、分類のきっかけとなった特定の情報を特定するのに失敗した、過度に一般的な衛生マップをもたらすことが多い。
我々は、クラス間の属性を組み込んで、実際にクラス関連情報をキャプチャする有給マップに到達できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-10T13:59:57Z) - Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map [0.4915744683251151]
深層学習に基づくセマンティックセグメンテーションを用いたデジタル化の自動化手法を提案する。
このプロセスにおける重要な課題は、ディープニューラルネットワークのトレーニングに必要な地味なアノテーションの欠如である。
モデル微調整のための弱教師付き年齢追跡戦略を導入する。
論文 参考訳(メタデータ) (2025-01-03T14:55:22Z) - A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [50.982315553104975]
セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:06:41Z) - TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model [15.803614800117781]
DiffMapは,マップセグメンテーションマスクの構造をモデル化する新しい手法である。
この手法を取り入れることで,既存のセマンティックセグメンテーション手法の性能を大幅に向上させることができる。
本モデルは,実世界の地図レイアウトをより正確に反映した結果を生成する上で,優れた習熟度を示す。
論文 参考訳(メタデータ) (2024-05-03T11:16:27Z) - Context-Aware Meta-Learning [52.09326317432577]
本研究では,大規模言語モデルのエミュレートを行うメタ学習アルゴリズムを提案する。
我々のアプローチは、11のメタラーニングベンチマークのうち8つで最先端のアルゴリズムであるP>M>Fを上回り、一致します。
論文 参考訳(メタデータ) (2023-10-17T03:35:27Z) - Neural Map Prior for Autonomous Driving [17.198729798817094]
高精細(HD)セマンティックマップは、自動運転車が都市環境をナビゲートするために不可欠である。
オフラインのHDマップを作成する従来の方法には、労働集約的な手動アノテーションプロセスが含まれる。
近年,オンラインセンサを用いた局所地図作成手法が提案されている。
本研究では,グローバルマップのニューラル表現であるニューラルマッププライオリティ(NMP)を提案する。
論文 参考訳(メタデータ) (2023-04-17T17:58:40Z) - Open-domain Visual Entity Recognition: Towards Recognizing Millions of
Wikipedia Entities [54.26896306906937]
我々はOVEN-Wikiを提示する。そこでは、テキストクエリに関して、モデルをウィキペディアのエンティティにリンクする必要がある。
私たちは、微調整中に見たことのないWikipediaのエンティティでも、PaLIベースの自動回帰視覚認識モデルが驚くほどうまく機能していることを示します。
PaLIベースのモデルでは全体的なパフォーマンスが向上するが、CLIPベースのモデルはテールエンティティを認識するのに優れている。
論文 参考訳(メタデータ) (2023-02-22T05:31:26Z) - Seeing the Un-Scene: Learning Amodal Semantic Maps for Room Navigation [143.6144560164782]
セマンティックマップを用いた室内ナビゲーションのための学習型アプローチを提案する。
我々は、部屋の位置、大きさ、形状の信念を示すアモーダルな意味的トップダウンマップを生成するためにモデルを訓練する。
次に、これらのマップを使用して、対象の部屋にある点を予測し、その点に向かうためのポリシーを訓練します。
論文 参考訳(メタデータ) (2020-07-20T02:19:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。