論文の概要: Self-training solutions for the ICCV 2023 GeoNet Challenge
- arxiv url: http://arxiv.org/abs/2311.16843v1
- Date: Tue, 28 Nov 2023 14:57:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 18:06:55.706471
- Title: Self-training solutions for the ICCV 2023 GeoNet Challenge
- Title(参考訳): ICCV 2023 GeoNet Challengeの自己学習ソリューション
- Authors: Lijun Sheng, Zhengbo Wang, and Jian Liang
- Abstract要約: 本ソリューションでは,Swin Transformerバックボーンを備えた2段階のソースフリードメイン適応フレームワークを用いて,米国からアジアドメインへの知識伝達を実現する。
提案手法は74.56%のHスコアを達成し,GeoUniDAチャレンジで1位となった。
GeoImNetとGeoPlacesの課題では、ソリューションはそれぞれ64.46%と51.23%というトップ3の精度に達した。
- 参考スコア(独自算出の注目度): 36.14210246051459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: GeoNet is a recently proposed domain adaptation benchmark consisting of three
challenges (i.e., GeoUniDA, GeoImNet, and GeoPlaces). Each challenge contains
images collected from the USA and Asia where there are huge geographical gaps.
Our solution adopts a two-stage source-free domain adaptation framework with a
Swin Transformer backbone to achieve knowledge transfer from the USA (source)
domain to Asia (target) domain. In the first stage, we train a source model
using labeled source data with a re-sampling strategy and two types of
cross-entropy loss. In the second stage, we generate pseudo labels for
unlabeled target data to fine-tune the model. Our method achieves an H-score of
74.56% and ultimately ranks 1st in the GeoUniDA challenge. In GeoImNet and
GeoPlaces challenges, our solution also reaches a top-3 accuracy of 64.46% and
51.23%, respectively.
- Abstract(参考訳): GeoNetは、最近提案された3つの課題(GeoUniDA、GeoImNet、GeoPlaces)からなるドメイン適応ベンチマークである。
それぞれのチャレンジには、大きな地理的ギャップがある米国とアジアから収集された画像が含まれている。
我々のソリューションでは,Swin Transformerバックボーンを備えた2段階のソースフリードメイン適応フレームワークを採用し,USAドメインからアジアドメインへの知識伝達を実現している。
最初の段階では、ラベル付きソースデータを用いて、再サンプリング戦略と2種類のクロスエントロピー損失を持つソースモデルを訓練する。
第2段階では、ラベルのないターゲットデータに対して擬似ラベルを生成し、モデルを微調整する。
本手法は74.56%のHスコアを達成し,GeoUniDAチャレンジで1位となった。
geoimnetとgeoplacesの課題では、ソリューションはそれぞれ64.46%と51.23%のtop-3精度に達している。
関連論文リスト
- CityGuessr: City-Level Video Geo-Localization on a Global Scale [54.371452373726584]
本稿では, 都市, 州, 国, 大陸を階層的に予測することを目的とした, グローバルな地平化の新たな課題を提案する。
この問題を解決するためのモデルをトレーニングするために、世界中をカバーした大規模なビデオデータセットは存在しない。
我々は、世界中の166都市から68,269の動画からなる新しいデータセット、CityGuessr68kを紹介した。
論文 参考訳(メタデータ) (2024-11-10T03:20:00Z) - G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models [40.69217368870192]
我々は、レトリーバル拡張世代(RAG)に基づく世界規模の地理的ローカライゼーションのための新しい枠組みを提案する。
G3は、ジオアライメント、ジオディバーシフィケーション、ジオビジュアライゼーションの3つのステップから構成される。
2つの確立されたデータセットの実験は、他の最先端手法と比較してG3の優位性を検証する。
論文 参考訳(メタデータ) (2024-05-23T15:37:06Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - PIGEON: Predicting Image Geolocations [44.99833362998488]
本稿では, セマンティックジオセル生成, マルチタスクコントラスト事前学習, 新たな損失関数を組み合わせた新しいジオローカライズシステムを提案する。
PIGEOTTOは、目に見えない場所に効果的に一般化する最初の画像ジオローカライズモデルである。
論文 参考訳(メタデータ) (2023-07-11T23:36:49Z) - Improving Toponym Resolution with Better Candidate Generation,
Transformer-based Reranking, and Two-Stage Resolution [30.855736793066406]
ジオコーディング(Geocoding)は、テキスト中の位置参照を地理空間意味論を符号化する構造化データに変換するタスクである。
我々はジオコーディングのための新しいアーキテクチャGeoNormを提案する。
提案手法は,複数データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-05-18T21:52:48Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z) - UnibucKernel: Geolocating Swiss-German Jodels Using Ensemble Learning [15.877673959068455]
我々は、スイスの約3万のドイツのジョデルからなるデータセットに基づいて、第2のサブタスクに焦点を当てる。
方言識別タスクは、試験サンプルの緯度と経度を正確に予測することです。
我々は、xgboostメタリーナーとさまざまな機械学習アプローチの結合パワーを用いて、タスクを二重回帰問題として構成する。
論文 参考訳(メタデータ) (2021-02-18T14:26:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。