論文の概要: When Meaning Isn't Literal: Exploring Idiomatic Meaning Across Languages and Modalities
- arxiv url: http://arxiv.org/abs/2604.10787v1
- Date: Sun, 12 Apr 2026 19:36:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.216149
- Title: When Meaning Isn't Literal: Exploring Idiomatic Meaning Across Languages and Modalities
- Title(参考訳): 意味がリテラルでないとき - 言語とモダリティを横断する慣用的な意味を探る
- Authors: Sarmistha Das, Shreyas Guha, Suvrayan Bandyopadhyay, Salisa Phosit, Kitsuchart Pasupa, Sriparna Saha,
- Abstract要約: 比喩的推論は比喩と文化に深く絡み合っており、現代言語モデルの盲点として残されている。
我々は,3,533人のヒンディー語,ベンガル語,タイ語のイディオムからなる多言語・多モーダルコーパス「メディオム」を提示する。
我々は,大規模言語モデル (テキスト推論) と視覚言語モデル (図示的曖昧さ) の両方をメディオム上でベンチマークし,メタファの理解において系統的失敗を明らかにする。
- 参考スコア(独自算出の注目度): 27.883451560702284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Idiomatic reasoning, deeply intertwined with metaphor and culture, remains a blind spot for contemporary language models, whose progress skews toward surface-level lexical and semantic cues. For instance, the Bengali idiom \textit{\foreignlanguage{bengali}{\char"0986\char"0999\char"09CD\char"0997\char"09C1 \char"09B0 \char"09AB\char"09B2 \char"099F\char"0995}} (angur fol tok, ``grapes are sour''): it encodes denial-driven rationalization, yet naive models latch onto the literal fox-and-grape imagery. Addressing this oversight, we present ``Mediom,'' a multilingual, multimodal idiom corpus of 3,533 Hindi, Bengali, and Thai idioms, each paired with gold-standard explanations, cross-lingual translations, and carefully aligned text--image representations. We benchmark both large language models (textual reasoning) and vision-language models (figurative disambiguation) on Mediom, exposing systematic failures in metaphor comprehension. To mitigate these gaps, we propose ``HIDE,'' a Hinting-based Idiom Explanation framework that leverages error-feedback retrieval and targeted diagnostic cues for iterative reasoning refinement. Collectively, Mediom and HIDE establish a rigorous test bed and methodology for culturally grounded, multimodal idiom understanding embedded with reasoning hints in next-generation AI systems.
- Abstract(参考訳): 慣用的推論は比喩と文化に深く絡み合っており、現代言語モデルにとって盲点であり、その進歩は表面的な語彙的・意味的な手がかりへと向けられている。
例えば、Bengali idiom \textit{\foreign Language{bengali}{\char"0986\char"0999\char"09CD\char"0997\char"09C1 \char"09B0 \char"09AB\char"09B2 \char"099F\char"0995}} (angur fol tok, ``grapes are sour')は、否定駆動の合理化を符号化するが、リテラルキッド・アンド・グレープのイメージにナイーブなモデルラッチを付加する。
この見落としに対処するため、我々は、3,533人のヒンディー語、ベンガル語、タイ語のイディオムからなる多言語多用なイディオムコーパスである ``Mediom,' を示し、それぞれにゴールドスタンダードの説明、クロスランガル翻訳、注意深く整列されたテキストイメージ表現を組み合わせた。
我々は,大規模言語モデル (テキスト推論) と視覚言語モデル (図示的曖昧さ) の両方をメディオム上でベンチマークし,メタファの理解において系統的失敗を明らかにする。
これらのギャップを軽減するため,Hinting ベースの Idiom Explanation フレームワークである `HIDE' を提案する。
まとめると、MediomとHIDEは、文化的基盤を持つマルチモーダルイディオム理解のための厳格なテストベッドと方法論を確立し、次世代AIシステムに推論のヒントを埋め込んだ。
関連論文リスト
- IDIOLEX: Unified and Continuous Representations for Idiolectal and Stylistic Variation [88.98544786373212]
既存の文表現は主に、その表現方法ではなく、ある文が何を言っているかを符号化する。
本研究は,意味内容から分離したスタイルと方言をキャプチャする文表現を開発する。
IDIOLEX(IDIOLEX)は,文の証明から文の内容の言語的特徴までを統括するモデルを訓練するためのフレームワークである。
論文 参考訳(メタデータ) (2026-04-06T14:17:24Z) - When Words Don't Mean What They Say: Figurative Understanding in Bengali Idioms [1.5840067220859924]
大規模言語モデル(LLM)にとって、図形言語理解は依然として重要な課題である。
我々は,10,361個のベンガルイディオムからなる大規模かつ文化的基盤を持つ新しいイディオムデータセットを導入する。
各イディオムは、包括的な19フィールドスキーマの下で注釈付けされ、熟考専門家の合意プロセスを通じて確立され、洗練される。
図形的意味を推定する作業において,30の最先端の多言語言語と命令調整型LLMを評価した。
論文 参考訳(メタデータ) (2026-02-13T13:26:11Z) - "Newspaper Eat" Means "Not Tasty": A Taxonomy and Benchmark for Coded Languages in Real-World Chinese Online Reviews [14.361987265496042]
本稿では,7,744の中国語Googleマップレビューと,コード付き言語のスパンレベルアノテーションを用いたデータセットであるCodedLangを紹介する。
音声学、正書法、言語間置換を含む共通符号化戦略を捉える7クラス分類法を開発した。
結果は、強力なモデルでさえ、コード化された言語を識別または理解できないことを示している。
論文 参考訳(メタデータ) (2026-01-12T08:03:37Z) - X-MuTeST: A Multilingual Benchmark for Explainable Hate Speech Detection and A Novel LLM-consulted Explanation Framework [3.3141746520662103]
本稿では,ヘイトスピーチ検出のための説明可能性誘導学習フレームワークX-MuTeSTを提案する。
我々はこの研究を英語とともにヒンディー語とテルグ語に拡張し、人間の注釈付き論理のベンチマークを提供する。
トレーニング中に人間の合理性を活用することで、分類性能と説明可能性の両方が向上することを示す。
論文 参考訳(メタデータ) (2026-01-06T17:16:45Z) - Lost without translation -- Can transformer (language models) understand mood states? [3.640688858400333]
方法:11言語にまたがる4つの気分状態について247のユニークなフレーズを収集した。
適応ランダム指数, 正規化相互情報, 均一性, 完全性に基づく総合スコアを用いて, 評価を行った。
論文 参考訳(メタデータ) (2025-11-29T01:55:11Z) - Graph-Assisted Culturally Adaptable Idiomatic Translation for Indic Languages [3.2498796510544636]
マルチワード式(MWE)とイディオムの翻訳には、ソース言語とターゲット言語の両方を深く理解する必要がある。
従来の静的知識グラフ(KG)とプロンプトベースのアプローチは、これらの複雑な関係を捉えるのに苦労する。
慣用的表現間の複雑なマッピングを学習する適応グラフニューラルネットワーク(GNN)に基づく手法を提案する。
論文 参考訳(メタデータ) (2025-05-28T03:42:16Z) - Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context? [64.38544995251642]
我々は、源泉に存在している意味的あいまいさ(本研究における英語)について研究する。
我々は、リテラルと図形の両方にオープンなイディオムに焦点を当てている。
現在のMTモデルは、たとえ文脈が比喩的解釈を示しているとしても、英語のイディオムを文字通りに翻訳する。
論文 参考訳(メタデータ) (2023-10-23T06:38:49Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - Language Models are Multilingual Chain-of-Thought Reasoners [83.37148309771378]
本稿では,250の小学校数学問題を10の類型的多言語に手動で翻訳することで,多言語学級数学のベンチマークを導入する。
MGSM問題をチェーン・オブ・ソートにより解く能力は,モデルスケールの増大とともに出現する。
言語モデルの多言語推論能力は他のタスクにも及んでいることを示す。
論文 参考訳(メタデータ) (2022-10-06T17:03:34Z) - Provable Limitations of Acquiring Meaning from Ungrounded Form: What
will Future Language Models Understand? [87.20342701232869]
未知のシステムが意味を習得する能力について検討する。
アサーションによってシステムが等価性のような意味関係を保存する表現をエミュレートできるかどうか検討する。
言語内のすべての表現が参照的に透明であれば,アサーションによってセマンティックエミュレーションが可能になる。
しかし、言語が変数バインディングのような非透過的なパターンを使用する場合、エミュレーションは計算不能な問題になる可能性がある。
論文 参考訳(メタデータ) (2021-04-22T01:00:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。