Fugu-MT 論文翻訳(概要): Images in Discrete Choice Modeling: Addressing Data Isomorphism in Multi-Modality Inputs

論文の概要: Images in Discrete Choice Modeling: Addressing Data Isomorphism in Multi-Modality Inputs

arxiv url: http://arxiv.org/abs/2312.14724v1
Date: Fri, 22 Dec 2023 14:33:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-25 14:55:27.979337
Title: Images in Discrete Choice Modeling: Addressing Data Isomorphism in Multi-Modality Inputs
Title（参考訳）: 離散選択モデルにおける画像:多モード入力におけるデータ同型対応
Authors: Brian Sifringer, Alexandre Alahi
Abstract要約: 本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
参考スコア（独自算出の注目度）: 77.54052164713394
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper explores the intersection of Discrete Choice Modeling (DCM) and machine learning, focusing on the integration of image data into DCM's utility functions and its impact on model interpretability. We investigate the consequences of embedding high-dimensional image data that shares isomorphic information with traditional tabular inputs within a DCM framework. Our study reveals that neural network (NN) components learn and replicate tabular variable representations from images when co-occurrences exist, thereby compromising the interpretability of DCM parameters. We propose and benchmark two methodologies to address this challenge: architectural design adjustments to segregate redundant information, and isomorphic information mitigation through source information masking and inpainting. Our experiments, conducted on a semi-synthetic dataset, demonstrate that while architectural modifications prove inconclusive, direct mitigation at the data source shows to be a more effective strategy in maintaining the integrity of DCM's interpretable parameters. The paper concludes with insights into the applicability of our findings in real-world settings and discusses the implications for future research in hybrid modeling that combines complex data modalities. Full control of tabular and image data congruence is attained by using the MIT moral machine dataset, and both inputs are merged into a choice model by deploying the Learning Multinomial Logit (L-MNL) framework.
Abstract（参考訳）: 本稿では,dcm(離散選択モデリング)と機械学習の交点について検討し,dcmの実用機能への画像データの統合とそのモデル解釈性への影響について考察する。本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。ニューラルネットワーク(NN)コンポーネントは、共起が存在するときの画像から表層変数表現を学習し、複製することにより、DCMパラメータの解釈可能性を向上させる。我々は,冗長な情報を分離するためのアーキテクチャ設計調整と,ソース情報マスキングとインパインティングによる同型情報緩和の2つの手法を提案する。半合成データセットを用いて行った実験により, 設計上の変更が不決定性を示す一方で, データソースの直接緩和はDCMの解釈可能なパラメータの整合性を維持する上で, より効果的な戦略であることが示された。本稿は,実世界における知見の適用可能性について考察し,複雑なデータモダリティを結合したハイブリッドモデリングにおける今後の研究の意義について考察する。 MITのモラルマシンデータセットを用いて表と画像データの整合性を完全に制御し、Learning Multinomial Logit(L-MNL)フレームワークをデプロイすることにより、両方の入力を選択モデルにマージする。

関連論文リスト

CrossModalityDiffusion: Multi-Modal Novel View Synthesis with Unified Intermediate Representation [0.5242869847419834]
CrossModalityDiffusion(クロスモダリティ・ディフュージョン)は、シーン幾何学の知識を必要とせず、様々なモダリティにまたがる画像を生成するために設計されたモジュラーフレームワークである。異なるモジュールを共同でトレーニングすることで、フレームワーク内のすべてのモダリティに対して一貫した幾何学的理解が保証されることを示す。合成ShapeNet車のデータセット上でのCrossModalityDiffusionの機能を検証する。
論文参考訳（メタデータ） (2025-01-16T20:56:32Z)
Code and Pixels: Multi-Modal Contrastive Pre-training for Enhanced Tabular Data Analysis [3.640521552987694]
MT-CMTM(Multi-task Contrastive Masked Tabular Modeling)を提案する。これらのデータモーダル間の相乗効果を最適化し、コントラスト学習とマスク付き表形式モデリングを組み合わせた二重戦略を用いる。我々のアプローチの中心は、残差接続と注意機構を備えた1次元畳み込みニューラルネットワーク(1D-ResNet-CBAM)である。
論文参考訳（メタデータ） (2025-01-13T13:12:18Z)
Amortized Inference of Causal Models via Conditional Fixed-Point Iterations [17.427722515310606]
本研究では,異なるSCMからサンプリングした複数のデータセットに対して,単一モデルをトレーニングすることにより,構造因果モデル(SCM)の補正推定を提案する。まず、まず、データセット埋め込みのアモータイズ学習にトランスフォーマーベースのアーキテクチャを使用し、次にFixed-Point Approach(FiP)を拡張して、データセット埋め込みに条件付きSCMを推論する。副産物として,本手法はパラメータを更新することなく,新しいSCMから観測データや介入データを生成することができる。
論文参考訳（メタデータ） (2024-10-08T15:31:33Z)
Knowledge-Aware Reasoning over Multimodal Semi-structured Tables [85.24395216111462]
本研究では、現在のAIモデルがマルチモーダルな構造化データに基づいて知識を考慮した推論を行うことができるかどうかを検討する。この目的のために設計された新しいデータセットであるMMTabQAを紹介する。我々の実験は、複数のテキストと画像の入力を効果的に統合し解釈する上で、現在のAIモデルに対する重大な課題を浮き彫りにしている。
論文参考訳（メタデータ） (2024-08-25T15:17:43Z)
Unifying Visual and Semantic Feature Spaces with Diffusion Models for Enhanced Cross-Modal Alignment [20.902935570581207]
本稿では,マルチモーダルアライメント・アンド・リコンストラクション・ネットワーク(MARNet)を導入し,視覚ノイズに対するモデルの耐性を高める。 MARNetは、異なるドメイン間で情報をスムーズかつ安定的にブレンドする、クロスモーダル拡散再構成モジュールを含んでいる。 2つのベンチマークデータセットであるVireo-Food172とIngredient-101で実施された実験は、MARNetがモデルによって抽出された画像情報の品質を効果的に改善することを示した。
論文参考訳（メタデータ） (2024-07-26T16:30:18Z)
Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.5703963908242198]
本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文参考訳（メタデータ） (2024-04-03T13:35:51Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文参考訳（メタデータ） (2023-06-12T17:56:01Z)
RDA-INR: Riemannian Diffeomorphic Autoencoding via Implicit Neural Representations [3.9858496473361402]
本研究では,ニューラルネットワークに基づくアトラス構築の限界と統計的潜在モデリング手法に焦点をあてる。我々は、解像度非依存の暗黙的ニューラル表現に基づく新しいエンコーダを設計することで、この制限を克服する。
論文参考訳（メタデータ） (2023-05-22T09:27:17Z)
Mixed Effects Neural ODE: A Variational Approximation for Analyzing the Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文参考訳（メタデータ） (2022-02-18T22:41:51Z)
Learning Deformable Image Registration from Optimization: Perspective, Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文参考訳（メタデータ） (2020-04-30T03:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。