論文の概要: Information-driven design of imaging systems
- arxiv url: http://arxiv.org/abs/2405.20559v5
- Date: Thu, 06 Nov 2025 17:33:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 22:27:39.529418
- Title: Information-driven design of imaging systems
- Title(参考訳): 画像システムの情報駆動設計
- Authors: Henry Pinkard, Leyla Kabuli, Eric Markley, Tiffany Chien, Jiantao Jiao, Laura Waller,
- Abstract要約: 従来のイメージングシステムは、人間の眼を模倣し、視覚的に解釈可能な測定を行うように設計されてきた。
現代のイメージングシステムは人間の視界の前後で生計測を計算処理する。
計測情報の内容の重要性にもかかわらず、イメージングシステムの性能を評価するための現在のアプローチは、それを定量化していない。
- 参考スコア(独自算出の注目度): 13.123408596169172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imaging systems have traditionally been designed to mimic the human eye and produce visually interpretable measurements. Modern imaging systems, however, process raw measurements computationally before or instead of human viewing. As a result, the information content of raw measurements matters more than their visual interpretability. Despite the importance of measurement information content, current approaches for evaluating imaging system performance do not quantify it: they instead either use alternative metrics that assess specific aspects of measurement quality or assess measurements indirectly with performance on secondary tasks. We developed the theoretical foundations and a practical method to directly quantify mutual information between noisy measurements and unknown objects. By fitting probabilistic models to measurements and their noise characteristics, our method estimates information by upper bounding its true value. By applying gradient-based optimization to these estimates, we also developed a technique for designing imaging systems called Information-Driven Encoder Analysis Learning (IDEAL). Our information estimates accurately captured system performance differences across four imaging domains (color photography, radio astronomy, lensless imaging, and microscopy). Systems designed with IDEAL matched the performance of those designed with end-to-end optimization, the prevailing approach that jointly optimizes hardware and image processing algorithms. These results establish mutual information as a universal performance metric for imaging systems that enables both computationally efficient design optimization and evaluation in real-world conditions. A video summarizing this work can be found at: https://waller-lab.github.io/EncodingInformationWebsite/
- Abstract(参考訳): 従来のイメージングシステムは、人間の眼を模倣し、視覚的に解釈可能な測定を行うように設計されてきた。
しかし、現代のイメージングシステムは人間の視界の前後で生の計測を計算的に処理している。
その結果, 生計測情報の内容は, 視覚的解釈可能性よりも重要であることがわかった。
計測情報の内容の重要性にもかかわらず、イメージングシステムの性能を評価するための現在のアプローチでは、測定品質の特定の側面を評価する代替指標を使うか、二次タスクのパフォーマンスを間接的に評価する。
ノイズ測定と未知物体の相互情報を直接定量化するための理論的基礎と実践的手法を開発した。
本手法は,確率モデルを測定値とその雑音特性に適合させることで,その真値の上限値によって情報を推定する。
また,これらの推定値に勾配に基づく最適化を適用し,情報駆動型エンコーダ解析学習(IDEAL)と呼ばれる画像システムの設計手法を開発した。
我々の情報では、4つの画像領域(カラー写真、電波天文学、レンズレスイメージング、顕微鏡)のシステム性能の違いを正確に推定しています。
IDEALで設計されたシステムは、ハードウェアと画像処理アルゴリズムを共同で最適化する一般的なアプローチであるエンドツーエンドの最適化で設計されたシステムのパフォーマンスと一致した。
これらの結果は、実世界の条件下での計算効率の良い設計最適化と評価を可能にする、イメージングシステムの普遍的な性能指標として相互情報を確立する。
この作業を要約したビデオは、https://waller-lab.github.io/EncodingInformationWebsite/にある。
関連論文リスト
- A Comparative Study of Scanpath Models in Graph-Based Visualization [7.592272924252313]
アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文 参考訳(メタデータ) (2025-03-31T14:43:42Z) - Picking the Cream of the Crop: Visual-Centric Data Selection with Collaborative Agents [62.616106562146776]
textbfVisual-Centric textbfSelection approach by textbfAgents Collaboration (ViSA)を提案する。
提案手法は,(1)視覚エージェントの協調による画像情報定量化手法により,リッチな視覚情報を持つ画像を選択する方法,(2)高品質な画像に関連する高品質な画像を選択する視覚中心の指示品質評価手法からなる。
論文 参考訳(メタデータ) (2025-02-27T09:37:30Z) - Rewards-based image analysis in microscopy [2.906546126874626]
イメージングとハイパースペクトルデータの分析は、生物学、医学、化学、物理学などの科学分野において重要である。
現在、このタスクは、認知、空間サンプリング、キーポイント検出、特徴生成、クラスタリング、次元減少、物理に基づく非畳み込みといった複雑な人間設計の反復的なステップに依存している。
過去10年間の機械学習の導入により、教師なし学習によるイメージセグメンテーションやオブジェクト検出、教師なし手法による次元削減といったタスクが加速した。
ここでは、専門家による意思決定の原則を採用し、強い伝達学習を示す報酬ベースの進歩について論じる。
論文 参考訳(メタデータ) (2025-02-23T19:19:38Z) - IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.07859467542664]
画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。
従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。
IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文 参考訳(メタデータ) (2024-12-16T18:52:56Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Combining Variational Autoencoders and Physical Bias for Improved
Microscopy Data Analysis [0.0]
本稿では,データ内の変数の因子を分散させる物理拡張機械学習手法を提案する。
本手法はNiO-LSMO, BiFeO3, グラフェンなど様々な材料に適用される。
その結果,大量の画像データから有意な情報を抽出する手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-08T17:35:38Z) - Monocular Depth Estimation Using Cues Inspired by Biological Vision
Systems [22.539300644593936]
単眼深度推定(MDE)は、シーンのRGB画像を同じカメラビューから画素幅の深度マップに変換することを目的としている。
MDEタスクの一部は、画像内のどの視覚的手がかりを深度推定に使用できるか、どのように使うかを学ぶことである。
モデルに視覚的キュー情報を明示的に注入することは深度推定に有用であることを示す。
論文 参考訳(メタデータ) (2022-04-21T19:42:36Z) - A workflow for segmenting soil and plant X-ray CT images with deep
learning in Googles Colaboratory [45.99558884106628]
我々はX線マイクロCT画像に畳み込みニューラルネットワークを適用するためのモジュラーワークフローを開発した。
クルミの葉, アーモンドの花芽, 土壌集合体のサンプルスキャンを用いて, 最適な結果を得るために, パラメータを最適化する方法を示す。
論文 参考訳(メタデータ) (2022-03-18T00:47:32Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - A Survey on Deep Learning Methods for Semantic Image Segmentation in
Real-Time [0.0]
ロボット工学や自動運転車など、多くの分野において、セマンティックイメージのセグメンテーションが不可欠である。
診断と治療の成功は、検討中のデータの極めて正確な理解に依存している。
近年のディープラーニングの進歩は、この問題に効果的かつ高精度に対処するためのツールを多数提供してきた。
論文 参考訳(メタデータ) (2020-09-27T20:30:10Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z) - Online Graph Completion: Multivariate Signal Recovery in Computer Vision [29.89364298411089]
グラフ上で定義された「完了」問題について検討し、追加測定の要求を順次行う必要がある。
グラフのフーリエ領域における最適化モデルを設計し、適応的な部分モジュラー性に基づくアイデアが実際にうまく機能するアルゴリズムをどう提供するかを記述する。
Imgurから収集した大量の画像では、分類が難しい画像について有望な結果が得られます。
論文 参考訳(メタデータ) (2020-08-12T01:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。