論文の概要: ATD-Trans: A Geographically Grounded Japanese-English Travelogue Translation Dataset
- arxiv url: http://arxiv.org/abs/2605.12933v1
- Date: Wed, 13 May 2026 03:11:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.778757
- Title: ATD-Trans: A Geographically Grounded Japanese-English Travelogue Translation Dataset
- Title(参考訳): ATD-Trans: 地理的に接地された日英旅行語翻訳データセット
- Authors: Shohei Higashiyama, Hiroki Ouchi, Atsushi Fujita, Masao Utiyama,
- Abstract要約: ATD-Trans(ATD-Trans)は、日英旅行語翻訳データセットである。
既存の言語モデルに対する実験では、言語焦点と地理的領域の2つの要因について検討した。
その結果,旅行ブログに記載されている地域空間を翻訳する上で,日本語の強化モデルの利点と難易度が浮き彫りになった。
- 参考スコア(独自算出の注目度): 15.376955467627726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Geographic text, or textual data rich in geographic (geo-) information is a valuable source for various geographic applications, e.g., tourism management. Making such information accessible to speakers of other languages further enhances its utility; thus, accurate machine translation (MT) is essential for equity in multilingual geo-information access. To facilitate in-depth analysis for geographic text, we introduce ATD-Trans, a geographically grounded Japanese--English travelogue translation dataset, which enables evaluation of MT quality at both the overall and geo-entity levels across domestic (within Japan) and overseas regions. Our experiments on existing language models examine two factors: model language focus and geographic regions. The results highlight advantages of Japanese-enhanced models and greater difficulty in translating domestic-region geo-entities mentioned in travel blogs.
- Abstract(参考訳): 地理的テキスト(Geo-)情報に富んだテキストデータ(Geo-)は、観光管理など、様々な地理的応用にとって貴重な情報源である。
このような情報を他の言語の話者に届けることにより、その実用性はさらに向上し、多言語ジオ情報アクセスにおいて、正確な機械翻訳(MT)はエクイティにとって不可欠である。
地理的テキストの詳細な分析を容易にするため,国内(日本を含む)および海外地域におけるMT品質の評価を可能にする,地理的基盤を持つ日本語・英語の旅行言語翻訳データセットであるATD-Transを導入する。
既存の言語モデルに対する実験では、言語焦点と地理的領域の2つの要因について検討した。
この結果は,旅行ブログに記載されている地域空間を翻訳する上で,日本語の強化モデルの利点と困難さを浮き彫りにしている。
関連論文リスト
- OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - FRMT: A Benchmark for Few-Shot Region-Aware Machine Translation [64.9546787488337]
本稿では、Few-shot Region-aware Machine Translationのための新しいデータセットと評価ベンチマークFRMTを提案する。
このデータセットは、英語からポルトガル語と中国語の2つの地域変種へのプロの翻訳で構成されている。
論文 参考訳(メタデータ) (2022-10-01T05:02:04Z) - Geographic Adaptation of Pretrained Language Models [29.81557992080902]
マルチタスク学習環境において,言語モデリングと位置情報予測を併用する中間学習ステップであるジオアダプテーションを導入する。
ジオアダプテーションの有効性は、事前訓練された言語モデルの表現空間を地理的に再現する能力に起因していることを示す。
論文 参考訳(メタデータ) (2022-03-16T11:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。