論文の概要: Mechanistic Interpretability for Learning Assurance of a Vision-Based Landing System
- arxiv url: http://arxiv.org/abs/2605.20607v1
- Date: Wed, 20 May 2026 01:49:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.428722
- Title: Mechanistic Interpretability for Learning Assurance of a Vision-Based Landing System
- Title(参考訳): 視覚に基づく着陸システムの学習保証のための機械論的解釈可能性
- Authors: Romeo Valentin, Olivia Beyer Bruvik, Marc R. Schlichting, Mykel J. Kochenderfer,
- Abstract要約: EASAの学習保証ガイダンスでは、データ駆動型航空システムが自身の状況表現を構築し、監視する必要がある。
最小限の保証可能なモデルは、少なくとも自身の状況表現において、スタイルからコンテンツを切り離すために示さなければならない。
- 参考スコア(独自算出の注目度): 21.666726162280696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: EASA's learning-assurance guidance requires data-driven aviation systems to build and monitor their own situation representation, yet for neural networks the technical means to provide such evidence remain an open problem. We address this gap for a vision-based aircraft landing system: we propose that a minimally assurable model must at least be shown to separate content from style in its own situation representation. Showing that the model's predictions then rely largely on the contentful representation components leads to a concrete assurance path. To demonstrate this assurance path on a concrete model we train a vision transformer model for runway keypoint regression on the LARDv2 dataset. The model, which acts as the subject for our assurance demonstration, produces per-patch embeddings that we decompose into interpretable atoms via K-SVD sparse dictionary learning. A qualitative visualization confirms that contentful atoms track task-relevant runway structure and stylistic atoms track domain-specific appearance, and the regression head is shown to place almost all of its linear weight on contentful atoms. We further build on the content/style separation and define out-of-model-scope (OOMS) detection, a novel runtime assurance approach directly monitoring the model's situation representation. OOMS monitoring is complementary to operational design domain and output-space out-of-distribution monitoring and addresses concrete requirements of the recent EASA guidance. By directly analyzing a model's situation representation both at test time and runtime, this work delivers the first concrete piece of the representation-level evidence that EASA learning-assurance guidance demands, and points to mechanistic interpretability as a practical building block of future aviation safety cases.
- Abstract(参考訳): EASAの学習保証ガイダンスは、データ駆動型航空システムに対して、自身の状況表現の構築と監視を要求するが、ニューラルネットワークでは、そのような証拠を提供する技術的手段が未解決のままである。
我々は、このギャップを視覚に基づく航空機着陸システムに対処し、最小限の保証可能なモデルは、少なくとも自身の状況表現において、スタイルからコンテンツを切り離すために示さなければならないと提案する。
モデルの予測が満足度の高い表現要素に大きく依存していることを示すと、具体的な保証パスにつながる。
具体的なモデル上でのこの保証パスを示すために、LARDv2データセット上でランウェイキーポイント回帰のためのビジョントランスフォーマーモデルを訓練する。
このモデルは、我々の保証実証の主題として機能し、K-SVDスパース辞書学習によって解釈可能な原子に分解されるパッチごとの埋め込みを生成する。
質的な可視化により、満足度の高い原子はタスク関連滑走路構造を追跡し、スタイリスティックな原子はドメイン固有の外観を追跡し、回帰ヘッドは、その線形重みのほとんど全てを満足度の高い原子に配置していることが示された。
さらに、コンテント/スタイル分離に基づいて、モデルの状態表現を直接監視する新しいランタイム保証アプローチであるOOMS(Out-of-model-scope)検出を定義します。
OOMSモニタリングは運用設計ドメインとアウト・オブ・ディストリビューションのアウト・オブ・ディストリビューション・モニタリングを補完し、最近のEASAガイダンスの具体的な要件に対処する。
本研究は,テスト時と実行時の両方でモデルの状況表現を直接解析することにより,EASA学習保証ガイダンスが要求する表現レベル証拠の最初の具体的部分を提供し,将来の航空安全事例の実用的な構築ブロックとしての機械的解釈性を示す。
関連論文リスト
- Monitoring the Internal Monologue: Probe Trajectories Reveal Reasoning Dynamics [42.27928681606673]
大規模推論モデル (LRM) は, 思考の連鎖 (CoT) 推論を通じて, 安全監視のための新たな機会を導入する。
本研究では,LRMの隠れ表現について検討し,今後の挙動をプロンプトおよびCoT表現から予測できるかどうかを検証した。
将来のモデル行動は, 単一の静的予測より, 完全な軌道上での検証において, より区別し易いことが判明した。
論文 参考訳(メタデータ) (2026-05-18T15:29:04Z) - Large Vision-Language Models Get Lost in Attention [51.851592109135716]
本稿では,情報理論と幾何に基づく統合フレームワークを提案し,残差更新の幾何的およびエントロピー的性質を定量化する。
注意は再設定に焦点を当てたサブスペース言語演算子として機能し、FFNはセマンティックイノベーションを駆動するサブスペース言語演算子として機能します。
論文 参考訳(メタデータ) (2026-05-07T04:45:52Z) - Perception-Aware Multimodal Spatial Reasoning from Monocular Images [57.42071289037214]
単眼画像からの空間的推論は 自律運転には不可欠です
現在のヴィジュアルランゲージモデル(VLM)は、微粒な幾何学的知覚に苦慮している。
本稿では,VLMを明示的な対象中心の接地能力を持つ知覚認識型マルチモーダル推論フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-07T02:05:12Z) - Vision and language: Novel Representations and Artificial intelligence for Driving Scene Safety Assessment and Autonomous Vehicle Planning [2.1379801460200416]
視覚言語モデル(VLM)は、視覚観察を自然言語の概念と整合させる強力な表現学習システムとして登場した。
本稿では、視覚言語表現が、認識、予測、計画パイプラインに統合された場合、シーンの安全性評価と意思決定をどのようにサポートするかを検討する。
論文 参考訳(メタデータ) (2026-02-07T20:04:21Z) - Reshaping Action Error Distributions for Reliable Vision-Language-Action Models [69.38615670891038]
ロボット操作において、視覚言語アクション(VLA)モデルは、一般化可能でスケーラブルなロボットポリシーを学ぶための有望なパラダイムとして登場した。
連続動作型VLAモデルに焦点をあて、トレーニング中の動作誤差分布を再構成することにより、従来のMSEベースの回帰を超越する。
複数の代表的VLAアーキテクチャ上で、標準、少数ショット、ノイズの多い設定にまたがるアプローチを評価します。
論文 参考訳(メタデータ) (2026-02-04T05:37:09Z) - Exploring Multimodal AI Reasoning for Meteorological Forecasting from Skew-T Diagrams [4.036372578802888]
VLM(Vision-Language Models)は、他の科学領域でも有望であるが、気象図解釈への応用はほとんど未発見である。
我々は,スキューT図を小型言語モデル (LM) と人間の予測器をエミュレートする小型VLMを用いた軽量AIアシスタントを提案する。
論文 参考訳(メタデータ) (2025-08-17T01:36:31Z) - Context-Informed Grounding Supervision [102.11698329887226]
コンテキストインフォームド・グラウンド(Context-Informed Grounding Supervision, CINGS)は、モデルが応答に先立って関連するコンテキストでトレーニングされる訓練後の監督である。
実験により, CINGSで訓練したモデルでは, テキスト領域と視覚領域の両方において, より強い基底が示されることがわかった。
論文 参考訳(メタデータ) (2025-06-18T14:13:56Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Distribution-aware Goal Prediction and Conformant Model-based Planning
for Safe Autonomous Driving [16.654299927694716]
本研究では,学習から学習までのタスクを,障害物認識と接地,分布認識の目標予測,モデルベース計画として再構築する。
CARLAシミュレータでは,CARNOVELベンチマークの最先端結果を報告する。
論文 参考訳(メタデータ) (2022-12-16T21:51:51Z) - Large Language Models with Controllable Working Memory [64.71038763708161]
大規模言語モデル(LLM)は、自然言語処理(NLP)の一連のブレークスルーをもたらした。
これらのモデルをさらに切り離すのは、事前訓練中に内在する膨大な量の世界的知識だ。
モデルの世界知識が、文脈で提示された事実情報とどのように相互作用するかは、まだ解明されていない。
論文 参考訳(メタデータ) (2022-11-09T18:58:29Z) - Uncertainty-aware Perception Models for Off-road Autonomous Unmanned
Ground Vehicles [6.2574402913714575]
オフロード自律無人地上車両(UGV)は、遠隔地で重要な物資を供給するために軍用および商業用途のために開発されている。
現在のデータセットは、季節、場所、セマンティッククラス、および日時における多様性の欠如に対する、オフロード自律ナビゲーションのための知覚モデルのトレーニングに使用されています。
本研究では,複数のデータセットを組み合わせてセグメンテーションに基づく環境認識モデルを学習する方法について検討する。
我々は,不確実性を捉えるためにモデルをトレーニングすることで,モデルの性能を著しく向上させることができることを示した。
論文 参考訳(メタデータ) (2022-09-22T15:59:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。