論文の概要: Navigating the Conceptual Multiverse
- arxiv url: http://arxiv.org/abs/2604.17815v1
- Date: Mon, 20 Apr 2026 05:12:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.702114
- Title: Navigating the Conceptual Multiverse
- Title(参考訳): 概念的多バースをナビゲートする
- Authors: Andre Ye, Jenny Y. Huang, Alicia Guo, Rose Novick, Tamara Broderick, Mitchell L. Gordon,
- Abstract要約: 我々は,概念決定を表す対話型システムである概念的多元性を構築し,評価する。
優れた決定構造の性質を強制する一般的な検証フレームワークを開発する。
3つの校正された領域にまたがって、概念的マルチバースは、参加者が問題のワーキングマップを開発するのに役立った。
- 参考スコア(独自算出の注目度): 8.506067537110214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When language models answer open-ended problems, they implicitly make hidden decisions that shape their outputs, leaving users with uncontextualized answers rather than a working map of the problem; drawing on multiverse analysis from statistics, we build and evaluate the conceptual multiverse, an interactive system that represents conceptual decisions such as how to frame a question or what to value as a space users can transparently inspect, intervenably change, and check against principled domain reasoning; for this structure to be worth navigating rather than misleading, it must be rigorous and checkable against domain reasoning norms, so we develop a general verification framework that enforces properties of good decision structures like unambiguity and completeness calibrated by expert-level reasoning; across three domains, the conceptual multiverse helped participants develop a working map of the problem, with philosophy students rewriting essays with sharper framings and reversed theses, alignment annotators moving from surface preferences to reasoning about user intent and harm, and poets identifying compositional patterns that clarified their taste.
- Abstract(参考訳): 言語モデルがオープンエンドな問題に答えるとき、彼らは暗黙的に、そのアウトプットを形作るような隠れた決定をし、問題の作業地図ではなく、ユーザを非コンテクスチュアルな回答として残し、統計から多元的分析に基づいて、概念的多元的システムを構築し、評価する。これは、質問のフレーム化や、空間としての価値をどう表現するかといった概念的な決定を表現する対話システムである。ユーザーは、透過的に検査し、相互に変化し、原則化されたドメイン推論に対してチェックすることができる;この構造は、誤解を招くよりもナビゲートする価値がある。
関連論文リスト
- Seeing but Not Thinking: Routing Distraction in Multimodal Mixture-of-Experts [58.86896791968143]
MoE(Multimodal Mixture-of-Experts)モデルは視覚言語タスクにおいて顕著なパフォーマンスを実現している。
モデルは画像の内容が正確に知覚されるが、その後の推論では失敗する。
本稿では,視覚的な入力を処理する際に,タスク関連推論の専門家を適切に活性化できないという,ルーティング・ディトラクションの仮説を提案する。
論文 参考訳(メタデータ) (2026-04-09T17:59:44Z) - Which Concepts to Forget and How to Refuse? Decomposing Concepts for Continual Unlearning in Large Vision-Language Models [35.42746849116121]
連続的アンラーニングは、大規模な視覚言語モデルにおいて、シーケンシャルな削除要求に応じて、特定の画像命令ペアを選択的に拒否することを可能にする。
本稿では,視覚的・テキスト的概念を削除対象から詳細に記述した上での拒否行動に基づく,新たな非学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-23T02:07:40Z) - Deconstructing Multimodal Mathematical Reasoning: Towards a Unified Perception-Alignment-Reasoning Paradigm [82.57296908195654]
MMR(Multimodal Mathematical Reasoning)は、テキストと視覚の両方のモダリティを含む数学的問題を解く能力に注目が集まっている。
現在のモデルは、実世界の視覚数学のタスクにおいて大きな課題に直面している。
論文 参考訳(メタデータ) (2026-03-09T12:11:00Z) - Analyzing Reasoning Consistency in Large Multimodal Models under Cross-Modal Conflicts [74.47786985522762]
テキスト慣性(textual inertia)と呼ばれる重要な障害モードを特定し、矛盾する視覚的証拠を無視しながら、モデルは間違ったテキストに盲目的に固執する傾向がある。
本稿では,多種多様なLMMの推論連鎖に摂動を構造的に注入するLogicGraph摂動プロトコルを提案する。
その結果,10%未満の症例で自己修正が成功し,主に視覚的テキスト誤りの伝播に寄与することが判明した。
論文 参考訳(メタデータ) (2026-01-07T16:39:34Z) - Figure It Out: Improve the Frontier of Reasoning with Executable Visual States [53.77871196174248]
複雑な推論問題はしばしば、テキストに明示的にエンコードされていない暗黙の空間的および幾何学的関係を含む。
FIGRを導入し、エンドツーエンドの強化学習を通じて、実行可能な視覚構成を多ターン推論に統合する。
8つの挑戦的な数学ベンチマークの実験により、FIGRは強いテキストのみのチェーン・オブ・シークレット・ベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-12-30T15:39:11Z) - Artemis: Structured Visual Reasoning for Perception Policy Learning [64.57381337070616]
経験的観察は、純粋に言語的な中間的推論が知覚タスクのパフォーマンスを低下させることを示している。
本稿では,構造化提案に基づく推論を行う認知政治学習フレームワークであるArtemisを紹介する。
論文 参考訳(メタデータ) (2025-12-01T18:45:30Z) - A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs [3.2228025627337864]
本稿では,視覚言語モデル(VLM)における知覚推論インタフェースを識別するための構造化評価フレームワークを提案する。
本稿では,人間の問題解決戦略を反映した3つの評価パラダイムを提案する。
このフレームワークを適用したCAは、リッチで独立に生成された記述を推論するために強力な言語モデルを活用し、新しい最先端(SOTA)パフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2025-01-23T12:42:42Z) - Divide and Conquer: Answering Questions with Object Factorization and
Compositional Reasoning [30.392986232906107]
本稿では,基本的対象分解法とニューラルモジュールネットワークからなる統合フレームワークを提案する。
本手法は, 対象物の特徴に基づいて分解し, 幅広い対象物を表すプロトタイプを自動的に導出する。
これらのプロトタイプにより、提案するネットワークは、共通意味空間上でオブジェクトの類似性を測定することによって、オブジェクトを関連付ける。
トレーニング中の可利用性に関わらず、多様なオブジェクトで質問に答えることができ、偏りのある質問応答分布の問題を克服することができる。
論文 参考訳(メタデータ) (2023-03-18T19:37:28Z) - Visual Superordinate Abstraction for Robust Concept Learning [80.15940996821541]
概念学習は言語意味論と結びついた視覚表現を構成する。
視覚概念の本質的な意味的階層を探索する失敗のボトルネックについて説明する。
本稿では,意味認識型視覚サブ空間を明示的にモデル化するビジュアル・スーパーオーディネート・抽象化・フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-28T14:27:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。