Fugu-MT 論文翻訳(概要): Geographic Adaptation of Pretrained Language Models

論文の概要: Geographic Adaptation of Pretrained Language Models

arxiv url: http://arxiv.org/abs/2203.08565v3
Date: Sun, 28 Jan 2024 22:57:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-31 01:17:18.826982
Title: Geographic Adaptation of Pretrained Language Models
Title（参考訳）: 事前学習言語モデルの地理的適応
Authors: Valentin Hofmann, Goran Glava\v{s}, Nikola Ljube\v{s}i\'c, Janet B. Pierrehumbert, Hinrich Sch\"utze
Abstract要約: マルチタスク学習環境において,言語モデリングと位置情報予測を併用する中間学習ステップであるジオアダプテーションを導入する。ジオアダプテーションの有効性は、事前訓練された言語モデルの表現空間を地理的に再現する能力に起因していることを示す。
参考スコア（独自算出の注目度）: 29.81557992080902
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While pretrained language models (PLMs) have been shown to possess a plethora of linguistic knowledge, the existing body of research has largely neglected extralinguistic knowledge, which is generally difficult to obtain by pretraining on text alone. Here, we contribute to closing this gap by examining geolinguistic knowledge, i.e., knowledge about geographic variation in language. We introduce geoadaptation, an intermediate training step that couples language modeling with geolocation prediction in a multi-task learning setup. We geoadapt four PLMs, covering language groups from three geographic areas, and evaluate them on five different tasks: fine-tuned (i.e., supervised) geolocation prediction, zero-shot (i.e., unsupervised) geolocation prediction, fine-tuned language identification, zero-shot language identification, and zero-shot prediction of dialect features. Geoadaptation is very successful at injecting geolinguistic knowledge into the PLMs: the geoadapted PLMs consistently outperform PLMs adapted using only language modeling (by especially wide margins on zero-shot prediction tasks), and we obtain new state-of-the-art results on two benchmarks for geolocation prediction and language identification. Furthermore, we show that the effectiveness of geoadaptation stems from its ability to geographically retrofit the representation space of the PLMs.
Abstract（参考訳）: 事前学習された言語モデル(plm)は、多くの言語知識を持っていることが示されているが、既存の研究は言語外知識をほとんど無視している。ここでは,地理言語学的な知識,すなわち言語における地理的変動に関する知識を調べることにより,このギャップを解消する。マルチタスク学習環境において,言語モデルと位置情報予測を結合する中間学習ステップであるgeoadaptationを導入する。我々は,3つの地理的領域から言語群をカバーし,詳細な(教師なし)位置情報予測,ゼロショット(教師なし)位置情報予測,微調整言語識別,ゼロショット言語識別,方言特徴のゼロショット予測の5つのタスクで評価する。ジオアダプテーション(Geoadaptation, ジオアダプテーション)は, 言語モデルのみを用いて適用したPLM(特にゼロショット予測タスク)を一貫して上回り, 位置情報予測と言語識別のための2つのベンチマークで新たな最先端結果を得る。さらに, ジオアダプテーションの有効性は, PLMの表現空間を地理的に再現する能力に起因していることを示す。

関連論文リスト

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics [91.17301794848025]
本稿では,人間と密に推論し,詳細なアドレス結論を導出できるGeoAgentについて述べる。従来のRLベースの手法は、パフォーマンスと解釈可能性においてブレークスルーを達成したが、AI生成のチェーン・オブ・プリート(CoT)データとトレーニング戦略に依存しているため、依然として懸念が残っている。
論文参考訳（メタデータ） (2026-02-13T04:48:05Z)
GeoSR: Cognitive-Agentic Framework for Probing Geospatial Knowledge Boundaries via Iterative Self-Refinement [4.026524042818433]
GeoSRは自己修正型のエージェント推論フレームワークで、コア地理的原則を反復予測ループに組み込む。物理世界特性推定から社会経済予測に至るまでのタスクにおけるGeoSRの検証を行う。
論文参考訳（メタデータ） (2025-08-06T04:45:34Z)
OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。地理空間応用に適したMLLM(OmniGeo)を提案する。自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文参考訳（メタデータ） (2025-03-20T16:45:48Z)
Comparative Performance of Advanced NLP Models and LLMs in Multilingual Geo-Entity Detection [0.0]
本稿では,主要なNLPモデルの包括的評価を行う。精度,精度,リコール,F1スコアなどの指標を用いて,これらのモデルの性能について検討する。この実験から得られた結論は、より高度で包括的なNLPツールの強化と作成を指向することを目的としている。
論文参考訳（メタデータ） (2024-12-29T09:47:14Z)
GeoReasoner: Reasoning On Geospatially Grounded Context For Natural Language Understanding [0.32885740436059047]
GeoReasonerは、地理的に接地された自然言語を推論できる言語モデルである。まず、Large Language Modelsを利用して、言語推論と距離情報に基づく総合的な位置記述を生成する。また、方向と距離の情報を擬似文として扱うことで空間埋め込みに符号化する。
論文参考訳（メタデータ） (2024-08-21T06:35:21Z)
Leveraging Large Language Models to Geolocate Linguistic Variations in Social Media Posts [0.0]
大きな言語モデル(LLM)を活用することで、イタリア語で書かれたツイートをジオローカライズするという課題に対処する。我々のアプローチは、これらの地理的局在化の側面を同時に予測するために、訓練済みのLLMを微調整することである。この研究は、バーティノロ国際スプリングスクール2024のLarge Language Modelsコースの一部として実施されている。
論文参考訳（メタデータ） (2024-07-22T20:54:35Z)
GeoLM: Empowering Language Models for Geospatially Grounded Language Understanding [45.36562604939258]
本稿では,自然言語におけるジオテリティーの理解を深める言語モデルGeoLMを紹介する。また、GeoLMは、トポノニム認識、トポノニムリンク、関係抽出、ジオエンタリティタイピングをサポートする有望な能力を示すことを示した。
論文参考訳（メタデータ） (2023-10-23T01:20:01Z)
GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文参考訳（メタデータ） (2023-10-10T00:03:23Z)
Are Large Language Models Geospatially Knowledgeable? [21.401931052512595]
本稿では,Large Language Models (LLM) で符号化された地理空間的知識,認識,推論能力の程度について検討する。自己回帰言語モデルに焦点をあて, (i) 地理座標系におけるLLMの探索と地理空間知識の評価, (ii) 地理空間的および非地理空間的前置法を用いて地理空間的意識を測定する, (iii) 多次元スケーリング(MDS) 実験を用いて, モデルの地理空間的推論能力を評価する, 実験手法を考案した。
論文参考訳（メタデータ） (2023-10-09T17:20:11Z)
Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文参考訳（メタデータ） (2023-09-04T13:44:50Z)
K2: A Foundation Language Model for Geoscience Knowledge Understanding and Utilization [105.89544876731942]
大規模言語モデル(LLM)は自然言語処理の一般分野において大きな成功を収めている。我々は、地球科学におけるLLM研究をさらに促進するために開発された一連の資源とともに、地球科学における最初のLLMであるK2を提示する。
論文参考訳（メタデータ） (2023-06-08T09:29:05Z)
GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文参考訳（メタデータ） (2023-05-11T03:21:56Z)
PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文参考訳（メタデータ） (2020-11-25T11:03:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。