論文の概要: Designing across domains with declarative thinking: Insights from the 96-Eyes ptychographic imager project
- arxiv url: http://arxiv.org/abs/2508.18512v2
- Date: Sat, 30 Aug 2025 17:31:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-03 12:29:36.786051
- Title: Designing across domains with declarative thinking: Insights from the 96-Eyes ptychographic imager project
- Title(参考訳): 宣言的思考によるドメイン横断設計:96-Eyes ptychographic imagerプロジェクトからの考察
- Authors: Antony C Chan,
- Abstract要約: 本稿では,デノボイメージングシステム設計における5世代問題定式化言語(5GL)の適用に関する実践者の考察を紹介する。
ハードウェア制約からライフサイエンスまで、プロジェクト要件が、さまざまなドメインステークホルダーからのミッションクリティカルなインプットを維持するために、マシン可読な問題ステートメントにどのようにフォーマル化できるかを説明します。
この宣言的アプローチは透明性を高め、設計のトレーサビリティを保証し、光学的、アルゴリズム的、ハードウェアアクセラレーションされた計算、ライフサイエンスチーム間でコストのかかるミスアライメントを最小限にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This article presents a practitioner's reflection on applying declarative, 5th generation, problem formulation language (5GL) to de novo imaging system design, informed by experiences across the interdisciplinary research in academia and cross-functional product development within the private sector. Using the 96-Eyes project: 96-camera parallel multi-modal imager for high-throughput drug discovery as a representative case, I illustrate how project requirements, ranging from hardware constraints to life sciences needs, can be formalized into machine-readable problem statements to preserve mission-critical input from diverse domain stakeholders. This declarative approach enhances transparency, ensures design traceability, and minimizes costly misalignment across optical, algorithmic, hardware-accelerated compute, and life sciences teams. Alongside the technical discussion of 5GL with real-world code examples, I reflect on the practical barriers to adopting 5GL in environments where imperative, 3rd-generation languages (3GL) remain the default medium for inter-team collaboration. Rather than offering an one-size-fits-all solution, these learned lessons highlight how programming paradigms implicitly shapes research workflows through existing domain hierarchies. The discussion aims to invite further explorations into how declarative problem formulations can facilitate innovation in settings where concurrent R\&{}D workflows are gaining traction, as opposed to environments where sequential, phase-driven workflows remain the norm.
- Abstract(参考訳): 本稿では,第5世代の宣言的問題定式化言語(5GL)をデ・ノボ・イメージング・システム設計に適用した実践者の考察を,学際的な学術研究と民間部門におけるクロスファンクショナル製品開発の経験から紹介する。
96-Eyesプロジェクトを用いて、96-camera parallel multi-modal imager for high-throughput drug discoveryを代表事例として、ハードウェア制約からライフサイエンスまで、プロジェクト要件をマシン可読な問題ステートメントに形式化し、多様なドメイン利害関係者からのミッションクリティカルな入力を保存する方法について説明する。
この宣言的アプローチは透明性を高め、設計のトレーサビリティを保証し、光学的、アルゴリズム的、ハードウェアアクセラレーションされた計算、ライフサイエンスチーム間でコストのかかるミスアライメントを最小限にする。
実世界のコード例による5GLの技術的な議論に加えて、命令型で第3世代の言語(3GL)がチーム間のコラボレーションのデフォルトの媒体である環境で5GLを採用するための実践的な障壁についても考えています。
これらの学んだ教訓は、オールサイズのソリューションを提供するのではなく、プログラミングパラダイムが既存のドメイン階層を通じて研究ワークフローを暗黙的に形作る方法を強調している。
この議論は、逐次的でフェーズ駆動のワークフローが標準のままである環境とは対照的に、同時R\&{}Dワークフローが勢いを増している環境で、宣言的問題定式化がイノベーションを促進する方法について、さらなる調査を行うことを目的としている。
関連論文リスト
- Large Language Models as Visualization Agents for Immersive Binary Reverse Engineering [0.0]
没入型バーチャルリアリティ(VR)は、バイナリリバースエンジニアリング(RE)における認知的複雑さを軽減できる余裕を提供する
我々はこのプラットフォームを,バイナリ解析ツールをクエリし,没入型3Dビジュアライゼーションを生成するLLMエージェントで拡張する。
論文 参考訳(メタデータ) (2025-08-19T00:24:01Z) - AI-Guided Exploration of Large-Scale Codebases [0.0]
大きな言語モデル(LLM)は、コードの探索を強化する新しい機会を提供する。
大規模言語モデル(LLM)の最近の進歩は、コードの探索を強化する新しい機会を提供する。
この研究は、リバースエンジニアリングとLLM誘導型、意図認識型視覚探索を統合するハイブリッドアプローチを導入している。
論文 参考訳(メタデータ) (2025-08-07T19:15:37Z) - Toward Knowledge-Guided AI for Inverse Design in Manufacturing: A Perspective on Domain, Physics, and Human-AI Synergy [0.8399688944263844]
AIは製造における逆設計を再構築し、材料、製品、プロセスにおける高性能な発見を可能にしている。
しかし、純粋にデータ駆動のアプローチは、スパースデータ、高次元の設計空間、複雑な制約によって特徴づけられる現実的な製造環境に苦しむことが多い。
この視点は、3つの補完的な柱の上に構築された統合フレームワークを提案する: 物理的に意味のある目的と制約を確立するためのドメイン知識と、限定的または偏りのあるデータに基づく一般化を強化する物理インフォームド機械学習、直感的で人間中心のインタラクションをサポートするための大規模言語モデルベースのインターフェイス。
論文 参考訳(メタデータ) (2025-05-29T08:15:27Z) - Agentic 3D Scene Generation with Spatially Contextualized VLMs [67.31920821192323]
本稿では,複雑な3D環境の生成,理解,編集を可能にする新しいパラダイムを提案する。
我々は,VLMが空間コンテキストから反復的に読み取って更新するエージェント型3Dシーン生成パイプラインを開発した。
その結果,我々のフレームワークは多様かつ困難な入力を処理でき,事前の作業では観測できないような一般化のレベルを達成することができることがわかった。
論文 参考訳(メタデータ) (2025-05-26T15:28:17Z) - Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision [49.073964142139495]
マルチモーダル融合法と視覚言語モデルの適用と進歩を体系的に検討する。
セマンティックシーン理解タスクでは、エンコーダデコーダフレームワーク、アテンションベースアーキテクチャ、グラフニューラルネットワークに融合アプローチを分類する。
クロスモーダルアライメント、効率的な融合、リアルタイムデプロイメント、ドメイン適応など、現在の研究における重要な課題を特定します。
論文 参考訳(メタデータ) (2025-04-03T10:53:07Z) - Language Models for Code Optimization: Survey, Challenges and Future Directions [7.928856221466083]
ディープニューラルネットワーク(DNN)上に構築された言語モデル(LM)は、先日、ソフトウェアエンジニアリングタスクにおいて、画期的な効果を実証した。
本研究は、この急速に発展する分野において、研究者と実践者の両方に実行可能な洞察と参照を提供することを目的としている。
論文 参考訳(メタデータ) (2025-01-02T14:20:36Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - LEGENT: Open Platform for Embodied Agents [60.71847900126832]
LEGENTはLarge Language Models (LLM) とLarge Multimodal Models (LMM) を用いたエンボディエージェントを開発するためのオープンでスケーラブルなプラットフォームである。
LEGENTはリッチでインタラクティブな3D環境を提供し、コミュニケーション可能でアクション可能なエージェントをユーザフレンドリーなインターフェースと組み合わせている。
実験では、EGENT生成データに基づいて訓練された胚性視覚言語モデルが、エンボディタスクにおいてGPT-4Vを超える。
論文 参考訳(メタデータ) (2024-04-28T16:50:12Z) - A Survey on Large Language Models from Concept to Implementation [4.219910716090213]
近年のLarge Language Models (LLM) の進歩により、自然言語処理(NLP)アプリケーションの範囲が拡大している。
本稿では,これらのモデルの多面的応用について検討し,GPTシリーズに着目した。
この調査は、コーディングや問題解決といった従来のタスクに革命をもたらす人工知能(AI)駆動ツールの変革的な影響に焦点を当てている。
論文 参考訳(メタデータ) (2024-03-27T19:35:41Z) - Towards More Unified In-context Visual Understanding [74.55332581979292]
マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。
まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。
次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文 参考訳(メタデータ) (2023-12-05T06:02:21Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。