MMOU: A Massive Multi-Task Omni Understanding and Reasoning Benchmark for Long and Complex Real-World Videos [118.6] MMOUは、15,000の慎重にキュレートされた質問と9038のウェブコレクトビデオからなる。
ベンチマークには13の基本的なスキルカテゴリが含まれており、いずれもモダリティと時間にまたがるエビデンスを統合する必要がある。
我々は、MMOU上で20以上の最先端のオープンソースおよびプロプライエタリなマルチモーダルモデルを評価する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 22:28:38 GMT)
AD-Copilot: A Vision-Language Assistant for Industrial Anomaly Detection via Visual In-context Comparison [89.1] 産業異常検出(IAD)に特化した対話型MLLMAD-Copilotを提案する。
我々はまず,少ないラベル付き産業画像から検査知識を抽出するために,新しいデータパイプラインを設計する。
次に、キャプション、VQA、欠陥局所化の正確なサンプルを生成し、IADのセマンティック信号に富んだ大規模マルチモーダル比較-ADを生成する。
実験の結果、AD-CopilotはMMADベンチマークで82.3%の精度を達成し、データ漏洩のない他のモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:14:44 GMT)
Enhancing Eye Feature Estimation from Event Data Streams through Adaptive Inference State Space Modeling [68.1] イベントベースのデータストリームから目の特徴抽出を効率的かつ低エネルギーで行うことができる。
本稿では,特徴抽出のための新しいアーキテクチャである強調型推論状態空間モデル(AISSM)を紹介する。
また、トレーニング効率を向上させる新しい学習手法を開発・評価する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:47:08 GMT)
The Python Simulations of Chemistry Framework: 10 years of an open-source quantum chemistry project [64.7] Pythonベースのシミュレーション・オブ・ケミカル・フレームワーク(PySCF)は、電子構造理論と量子化学法開発のために広く使われているオープンソースのプラットフォームとして発展してきた。
この記事では、2020年の以前の概要から、新しいモジュールと方法論、インフラストラクチャの変更、パフォーマンスベンチマークなど、大きな進歩についてレビューする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:42:43 GMT)
Towards Generalizable Deepfake Detection via Real Distribution Bias Correction [62.9] 本稿では,2つの主要コンポーネントからなるReal Distribution Bias Correction(RDBC)フレームワークを紹介する。
RDBCは、ドメイン内およびクロスドメインのディープフェイク検出の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:11:00 GMT)
MotionCFG: Boosting Motion Dynamics via Stochastic Concept Perturbation [60.5] MotionCFGは、ターゲットコンセプトとノイズブレーブの概念を対比することにより、モーションダイナミクスを強化するフレームワークである。
明示的な否定とは異なり、このアプローチはグローバルな意味的アイデンティティをシフトすることなく暗黙的な否定的なガイダンスを促進する。
MotionCFGは、最先端のT2Vフレームワーク間のモーションダイナミクスを一貫して改善する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:39:37 GMT)
EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation [58.8] EvoDriveVLAは、新しい協調認識計画フレームワークである。
自己認識の知覚的制約とオラクル誘導軌道最適化を統合している。
EvoDriveVLAはオープンループ評価におけるSOTA性能を実現し,クローズドループ評価における性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:54:24 GMT)
vla-eval: A Unified Evaluation Harness for Vision-Language-Action Models [58.6] VLAモデルは一般的に、各モデルリポジトリによって独立して維持されるベンチマークスクリプト毎に評価される。
本稿では、ベンチマーク実行からモデル推論を分離するオープンソースの評価ハーネスであるvla evalを紹介する。
完全な評価では、vla eval serveとvla eval runの2つのコマンドしか必要としない。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:38:53 GMT)
A Hyperbolic Perspective on Hierarchical Structure in Object-Centric Scene Representations [58.1] 双曲空間のローレンツ双曲体にユークリッドスロット埋め込みを投影する簡単なパイプラインを提案する。
スロットアテンションマスクから直接5段階の視覚階層を構築する。
双曲的プロジェクションは、一貫したシーンレベルをオブジェクトレベル組織に公開する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:53:59 GMT)
CIPHER: Culvert Inspection through Pairwise Frame Selection and High-Efficiency Reconstruction [53.9] 視覚的に反復的な環境下でのカルバート様構造に対する効率的なRGBベースの3次元再構成パイプラインを提案する。
提案手法は,まず情報フレームペアを選択し,適切な対応性を確保しつつ,視点の多様性を最大化する。
実験により,本手法は正確な3次元再構成と深度マップを効果的に生成し,人間の介入を最小限に抑えながら探傷効率を向上することを示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:00:19 GMT)
TransCurriculum: Multi-Dimensional Curriculum Learning for Fast & Stable Locomotion [50.5] TransCurriculumは、アジャイル四足歩行のためのトランスフォーマーベースの多次元カリキュラム学習アプローチである。
シミュレーションでは,Unitree Go1ロボットに対するアプローチを検証し,Go1ハードウェア上でゼロショットでデプロイする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:44:42 GMT)
Causal Tracing of Audio-Text Fusion in Large Audio Language Models [48.8] 我々は、音声理解におけるLALMの内部情報の流れを調べるために因果追跡を適用した。
DeSTA,Qwen,Voxtralを横断的に層状およびトークン的に解析することにより,個々の隠れ状態の因果効果を評価する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:40:59 GMT)
LiveWeb-IE: A Benchmark For Online Web Information Extraction [48.8] Web情報抽出(WIE)は、Webページから自動的にデータを抽出するタスクであり、様々なアプリケーションに高いユーティリティを提供する。
ライブWebサイトに対して,WIEシステムを直接評価するための新しいベンチマークである,データセットを導入する。
また,Webページコンテンツを視覚的に絞り込み,所望の情報を抽出することで,人間の認知過程を模倣する新しい多段階エージェントフレームワークであるVisual Grounding Scraper (VGS)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:55:11 GMT)
Noticing the Watcher: LLM Agents Can Infer CoT Monitoring from Blocking Feedback [48.4] 言語モデルエージェントの内部推論を監督する手法として,Chain-of-Thought(CoT)モニタリングを提案する。
我々は、推論エージェントが彼らのプライベートなCoTが監視下にあると自律的に推測できるかどうかを尋ねる。
フェデラーモデルでは、フィードバックをブロックすることで、このモニターの存在を純粋に推測することができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:12:14 GMT)
TDMM-LM: Bridging Facial Understanding and Animation via Language Models [46.8] 基礎生成モデルを利用して、顔の挙動のバランスの取れた大きなコーパスを合成する。
我々は、感情と頭部の動きをカバーするプロンプトスイートを設計し、複数のジェネレータで約80時間の顔ビデオを生成し、フレームごとの顔パラメータを適合させる。
このデータセットに基づいて、2つの相補的なタスクを通して、顔の動きに対する双方向能力のための言語モデルを探索する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:57:53 GMT)
OmniCompliance-100K: A Multi-Domain, Rule-Grounded, Real-World Safety Compliance Dataset [46.7] コンプライアンスの観点から、包括的な安全データセットを構築します。
データセットは、広範囲にわたる74の規則とポリシーにまたがる。
分析の結果,ルールとそれに対応する事例との間に強い整合性があることが確認された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:04:55 GMT)
URDF-Anything+: Autoregressive Articulated 3D Models Generation for Physical Simulation [45.5] 本稿では,視覚的観察から実行可能なオブジェクトモデルを直接生成する,エンドツーエンドの自動回帰フレームワークを提案する。
視覚的観察から構築された高忠実度デジタル双生児は、シミュレーションで訓練されたポリシーを、オンライン適応なしで実際のロボットに転送することができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:23:44 GMT)
Routing Channel-Patch Dependencies in Time Series Forecasting with Graph Spectral Decomposition [44.8] 本稿では, グラフスペクトル分解の観点から, チャネルパッチ依存性を適応的にモデル化できる汎用プラグインxCPDを提案する。
xCPDは既存のCIおよびCD予測モデルの上にシームレスに統合することができ、ベンチマーク間の精度と一般化を一貫して強化することができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:18:17 GMT)
A Theory of Appropriateness That Accounts for Norms of Rationality [43.7] 本稿では,個人が予測パターン補完を通じて行動を生成する規範的適切性の社会第一理論を提案する。
この感覚形成メカニズムは、人間の規範の重要な特徴の同義的な説明を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:41:18 GMT)
Knowledge Distillation for Large Language Models [42.6] 我々は、英語のDolly-15k、スペイン語のDolly-15k、コードBugNetおよびPyTorrentデータセットに知識蒸留を適用する。
教師の能力は70%から91%、スペイン語では95%、コードでは93.5%である。
これらの結果から, 知識蒸留と連鎖指導型強化学習を組み合わせることで, 資源制約条件下での展開に適した, コンパクトで効率的なモデルが作成できることが示唆された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:28:26 GMT)
Improving Visual Reasoning with Iterative Evidence Refinement [41.2] 視覚言語モデル(VLM)は、画像の上に推論する能力がますます高まっている。
しかし、堅牢な視覚的推論は、基礎となる視覚的証拠において、しばしば中間的なステップを再定義する必要がある。
本稿では、内部表現による画像証拠の再挿入をモデルに訓練するエンド・ツー・エンドのセルフリビジョン・フレームワークであるSIEVEを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:08:21 GMT)
CONFETTY: A Tool for Enforcement and Data Confidentiality on Blockchain-Based Processes [39.9] 本研究は,パブリックブロックチェーンベースのプロセス実行プラットフォームであるCONFETTYオープンソースWebアプリケーションを紹介する。
スマートコントラクトを使用して、公開インタラクションを実施、強制、保存しています。
機密情報へのきめ細かいアクセスに属性ベースの暗号化技術を採用する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:27:21 GMT)
Beyond Explicit Edges: Robust Reasoning over Noisy and Sparse Knowledge Graphs [39.7] INSESは明示的なエッジを超えて推論するために設計された動的フレームワークである。
LLM誘導航法はノイズやステアリングを誘発し、埋め込みベースの類似性拡張と組み合わせている。
複数のベンチマークでSOTA RAGとGraphRAGのベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:16:47 GMT)
TheraAgent: Multi-Agent Framework with Self-Evolving Memory and Evidence-Calibrated Reasoning for PET Theranostics [39.4] TheraAgentは、PET Theranosticsの最初のエージェント・フレームワークであり、3つのコア・イノベーションがある。
TheraAgentは、実際の患者で75.7%、合成ケースで87.0%、MDAgentsとMedAgent-Proを20%以上上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:50:10 GMT)
Sirens' Whisper: Inaudible Near-Ultrasonic Jailbreaks of Speech-Driven LLMs [38.4] 音声駆動型大規模言語モデル(LLM)は音声インタフェースを通じてアクセスされ、オープンアコースティックチャネルを介して新たなセキュリティリスクがもたらされる。
本稿では,Sirens' Whisperについて紹介する。
SWhisperは、任意のベースバンドオーディオを含む、長い、構造化されたプロンプトオン・コモディティデバイスを、頑丈で、不明瞭に配信することを可能にする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:01:48 GMT)
Shapes are not enough: CONSERVAttack and its use for finding vulnerabilities and uncertainties in machine learning applications [38.3] 本稿では,シミュレーションとデータ間の仮定的偏差の残りの空間を活用するために,新たな敵攻撃を提案する。
結果として生じる逆の摂動は不確実性境界内で一貫したものであり、基礎となるモデルをうまく騙すことができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:53:50 GMT)
SK-Adapter: Skeleton-Based Structural Control for Native 3D Generation [37.9] SK-Adapterは、ネイティブな3D生成のための正確な骨格操作をアンロックするフレームワークである。
本手法は,基礎モデルの形状とテクスチャの質を保ちながら,頑健な構造制御を実現する。
この機能をローカルな3D編集に拡張し、既存の資産を骨格的ガイダンスで地域固有の編集を可能にする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:21:38 GMT)
Geo-ID: Test-Time Geometric Consensus for Cross-View Consistent Intrinsics [37.6] 内在的な画像分解は、画像からアルベド、粗さ、および金属性などの物理ベースのレンダリングパラメータを推定することを目的としている。
ビデオベースのモデルは、クロスフレームの一貫性を改善することができるが、高密度で順序付けられたシーケンスと相当な計算を必要とする。
クロスビュー一貫した分解を生成するために,未学習の単視点予測器を本質的に再利用する新しいテストタイムフレームワークであるGeo-IDを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:36:27 GMT)
Diffusion Reinforcement Learning via Centered Reward Distillation [36.0] フォワードプロセス微細チューニング上に構築されたKL正規化報酬モデルから導出した拡散RLフレームワークである textbf Reward Distillation (CRD) を提案する。
信頼性の高いテキスト・画像の微調整を可能にするため,分布のドリフトを明示的に制御する手法を提案する。
textttGenEval と textttOCR rewards によるテキスト・ツー・イメージのポストトレーニング実験では、競合する SOTA の報酬最適化が高速収束と報酬ハッキングの好みの低減をもたらすことが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:29:33 GMT)
Learning through Creation: A Hash-Free Framework for On-the-Fly Category Discovery [35.5] OCDは、推論中に新しいカテゴリーを同時に発見しながら、既知のクラスを認識することを目的としている。
限定ラベル付きデータに最適化されたモデルが、推論中に定性的に異なる発見目標を実行することを期待するのは理にかなっている。
オフライン学習に直接新規カテゴリ認識を注入する,完全機能ベースかつハッシュフリーなフレームワークであるLearning Through Creation (LTC)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:35:31 GMT)
Seeing Through the PRISM: Compound & Controllable Restoration of Scientific Images [35.4] PRISMは、混合劣化に対する複合認識の監督と、原始体とそれらの混合物を潜伏空間で整列させる重み付きコントラスト的非絡み合いの目的を組み合わせた条件拡散フレームワークである。
PRISMは顕微鏡、野生生物の監視、リモートセンシング、都市気象のデータセット全体にわたって、訓練中に見えないゼロショット混合物を含む複雑な化合物の劣化に対する最先端のベースラインを上回っている。
これらの結果は、科学的効用が優先される領域において、PRISMを高忠実性回復のための一般化可能かつ制御可能なフレームワークとして確立する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:04:02 GMT)
A Multi-Agent Perception-Action Alliance for Efficient Long Video Reasoning [35.3] A4VLは、VLMエージェントの選択を伴うマルチラウンドの知覚-行動探索ループで動作する。
知覚行動探索によるマルチエージェントアライアンスの統合と、イベント駆動パーティショニングとキュー誘導ブロックアライメントの併用により、A4VLは現実の長いビデオに効果的にスケールすることができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:43:53 GMT)
ST-VLA: Enabling 4D-Aware Spatiotemporal Understanding for General Robot Manipulation [33.9] 本稿では,3D-4Dの統一表現を用いた3D-4D表現を提案する。
STHumanは,14,300kエピソード,注釈付き2D,3D,4Dコンテキストを備えた大規模ヒューマン操作データセットである。
RLBenchと実世界の操作タスクの実験は、手法が最先端のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:36:48 GMT)
Domain-Specialized Tree of Thought through Plug-and-Play Predictors [32.2] 本稿では,ToT検索プロセスのガイドとして,軽量かつ教師付きで適応可能なプラグアンドプレイ予測器であるDSTを紹介する。
我々の予測器は動的でコンテキスト対応のプルーニングを可能にし、より単純な推論ステップで探索をほぼ効率よく進めることができる。
我々の研究は、木に基づく推論における精度-効率のトレードオフを効果的に解決し、ToTをLLMにおける複雑な問題解決のためのスケーラブルで実践的なパラダイムに変換する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:22:01 GMT)
KoopmanFlow: Spectrally Decoupled Generative Control Policy via Koopman Structural Bias [31.5] Generative Control Policies(GCP)は、ロボット操作において大きな可能性を秘めているが、安定なグローバルモーションと高周波局所補正を同時にモデル化するのに苦労している。
クープマンに着想を得た構造的帰納バイアスによって導かれるパラメータ効率の良い生成ポリシーであるクープマンフローを紹介する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:23:07 GMT)
ArrayTac: A tactile display for simultaneous rendering of shape, stiffness and friction [31.4] ArrayTacは圧電駆動型触覚ディスプレイで、形状、剛性、摩擦を同時にレンダリングしてリアルな触覚信号を再現することができる。
このシステムは、物体の形状、剛性、摩擦を同時にレンダリングする前例のない能力を導入することで、高忠実な触覚フィードバックのための新しい経路を開拓した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:23:26 GMT)
PA-Net: Precipitation-Adaptive Mixture-of-Experts for Long-Tail Rainfall Nowcasting [30.9] 洪水警報、農業管理、緊急対応には降水量計が不可欠である。
降雨強度によって計算予算が明示的に制御される変圧器フレームワークである降雨適応ネットワーク(PA-Net)を提案する。
ERA5の実験では、最先端のベースラインよりも一貫した改善が示され、強風と暴風雨の状況が著しく向上した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:02:07 GMT)
Building Explicit World Model for Zero-Shot Open-World Object Manipulation [30.0] オープンワールド操作のための明示的世界モデルベースのフレームワークを提案する。
このフレームワークは、オープンセットの認識、デジタル双対再構築、インタラクション戦略のサンプリングと評価を統合している。
提案するフレームワークは,タスク固有の動作デモを伴わずに,複数のオープンセット操作タスクを実行できる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:13:32 GMT)
Coding with Eyes: Visual Feedback Unlocks Reliable GUI Code Generating and Debugging [29.7] インタラクションロジックと視覚構造の両方を詳細に評価するための新しいベンチマークであるInteractGUI Benchを紹介する。
次に、GUIコードをデバッグするためのビジョンフィードバックベースのマルチエージェントシステムであるVF-Coderを提案する。
InteractGUI Benchでは、我々のVF-Coderアプローチは、Gemini-3-Flashの成功率を21.68%から28.29%に引き上げ、ビジュアルスコアを0.4284から0.5584に上げる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:40:30 GMT)
Robust Self-Training with Closed-loop Label Correction for Learning from Noisy Labels [29.7] ノイズの多いラベルでディープニューラルネットワークをトレーニングすることは、依然として大きな課題である。
分離二段階最適化を用いた自己学習ラベル補正フレームワークを提案する。
提案手法は, 地中構造を伝達するために, ノイズのある後部シミュレーションと中間特徴を用いる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:10:17 GMT)
Look Where It Matters: High-Resolution Crops Retrieval for Efficient VLMs [28.9] 視覚言語モデル(VLM)は、通常、ネイティブの高解像度の画像を処理し、精度と計算効率のトレードオフを強制する。
AwaResは、低解像度のグローバルビューで動作し、ツールコールを使用して、所定のクエリに必要な高解像度セグメントのみを検索するフレームワークである。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:11:32 GMT)
Readout-induced degradation of transmon lifetimes: interplay of TLSs and qubit spectral reshaping [28.5] 測定バックアクションは、控えめな駆動強度でも超伝導量子ビットの分散読み出しを低下させる。
そこで本研究では、デチュレートされた2レベルシステムと駆動非正規化量子ビットスペクトルとの相互作用から、それがどのように引き起こされるかを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:35:25 GMT)
OrigamiBench: An Interactive Environment to Synthesize Flat-Foldable Origamis [28.5] 物理的な世界で計画し、行動し、創造できるAIシステムを構築するには、パターン認識以上のものが必要です。
このようなシステムは、シーケンシャルな決定を導くために、物理的プロセスを管理する因果的メカニズムや制約を理解する必要がある。
この能力は、内部言語モデルに類似した内部表現に依存しており、観察、行動、その結果の環境変化を関連づけている。
モデルが折り畳みを反復的に提案し,対象設定と物理的妥当性および類似性に関するフィードバックを受け取る,インタラクティブなベンチマークであるOrigamiBenchを紹介する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:33:29 GMT)
Advancing Cancer Prognosis with Hierarchical Fusion of Genomic, Proteomic and Pathology Imaging Data from a Systems Biology Perspective [28.4] システム生物学の観点から,遺伝子からタンパク質への生物学的進化をモデル化する階層的融合フレームワークであるHFGPIを提案する。
具体的には、遺伝子やタンパク質の生物学的情報表現を構築するために、アイデンティティ埋め込みと表現プロファイルを統合する分子エンコーディング戦略である、分子トケナイザーを紹介する。
次に、構造タンパク質アライメントにグラフ認識のクロスアテンションを用いて、遺伝子保存制御関係を明示的にモデル化し、遺伝子制御タンパク質表現を生成する遺伝子制御タンパク質融合(GRPF)を開発した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:30:51 GMT)
When Visual Privacy Protection Meets Multimodal Large Language Models [28.1] 本稿では,視覚的プライバシとMLLMの性能のトレードオフを改善するための新しいフレームワークを提案する。
我々の手法は異なるベンチマークで有効である。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:15:32 GMT)
Step-CoT: Stepwise Visual Chain-of-Thought for Medical Visual Question Answering [28.1] チェーン・オブ・シークレット(CoT)推論は高度な医用視覚質問応答(VQA)を持つ
既存のCoTの合理性の多くは自由形であり、臨床医が実際に追従する構造的推論過程を捉えていない。
臨床診断に適合した多段階CoTを用いた大規模医療推論データセットであるStep-CoTを紹介する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:23:43 GMT)
Garments2Look: A Multi-Reference Dataset for High-Fidelity Outfit-Level Virtual Try-On with Clothing and Accessories [27.6] Garments2Lookは、衣装レベルのVTONのための最初の大規模マルチモーダルデータセットである。
40のカテゴリーにまたがる80万の多目的対と300以上の細かなサブカテゴリから構成される。
信頼性と多様性のバランスをとるために,我々は合成パイプラインを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:30:32 GMT)
LLM-Guided Reinforcement Learning for Audio-Visual Speech Enhancement [27.0] 本研究では,Large Language Model (LLM)に基づく解釈可能な報酬モデルを用いた強化学習に基づくAVSEフレームワークを提案する。
音声LLMは、強調音声の自然言語記述を生成し、感情分析モデルにより、事前訓練されたAVSEモデルを微調整するためのPPO報酬として機能する1-5レーティングスコアに変換する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:01:45 GMT)
Revisiting the Perception-Distortion Trade-off with Spatial-Semantic Guided Super-Resolution [25.9] SpaSemSRは2つの補完的なガイダンスを持つ空間意味誘導拡散フレームワークである。
第一に、空間的接地されたテキストガイダンスは、オブジェクトレベルの空間的手がかりを意味的なプロンプトと統合し、テキスト構造と視覚構造を整列させて歪みを低減する。
第二に、マルチエンコーダ設計とセマンティック劣化制約によるセマンティックエンハンスドビジュアルガイダンスは、多モーダルなセマンティック事前を統一し、重度劣化下での知覚リアリズムを改善する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:41:27 GMT)
CT-Conditioned Diffusion Prior with Physics-Constrained Sampling for PET Super-Resolution [25.8] 不均一なシステム構成下でPET超解像を後部推論として定式化する。
物理制約付きサンプリングによるCT条件拡散フレームワークを提案する。
標準およびOOD設定の両方において、提案手法は実験指標と病変レベル臨床関連指標を一貫して改善する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:28:23 GMT)
EI-Part: Explode for Completion and Implode for Refinement [24.7] EI-Partは,コンポーネントによる高品質な3D形状の生成に特化して設計された,新しいフレームワークである。
本稿では,各段階における異なる表現の活用について提案する。
部品間の構造コヒーレンスを維持するために、爆発した状態と実装された状態の両方に自己保持機構が組み込まれている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:49:37 GMT)
MeTok: An Efficient Meteorological Tokenization with Hyper-Aligned Group Learning for Precipitation Nowcasting [24.5] 本稿では,降水処理の課題に焦点をあて,効率的な分布中心気象トークン化手法を開発した。
我々は2つの重要な改良を加えたHyper-Aligned Grouping Transformer (HyAGTransformer)を紹介した。
ERA5データセットを用いた6時間予測実験では, 他の手法と比較して, IoU測定値が少なくとも8.2%改善した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:55:49 GMT)
Not All Latent Spaces Are Flat: Hyperbolic Concept Control [24.5] 我々は,概念のより表現的かつ安定した操作を実現するために,意味的に整合した双曲表現空間を利用する並列輸送に基づく新しい制御機構である双曲制御(HyCon)を導入する。
HyConは4つの安全ベンチマークと4つのT2Iバックボーンで最先端の結果を達成し、ハイパーボリックステアリングはより信頼性の高いT2I生成のための実用的で柔軟なアプローチであることを示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:34:50 GMT)
Learning Generalizable 3D Medical Image Representations from Mask-Guided Self-Supervision [24.4] MASS(MAsk-guided Self-Supervised Learning)は、汎用的な医用画像表現を学習するためのプレテキストタスクとして、コンテキスト内のセグメンテーションを扱う。
解剖学的構造と病理所見にまたがる何千もの多様なマスクの提案を訓練することにより、MASSは意味論的に医療構造を定義するものを学ぶ。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:06:18 GMT)
Node Role-Guided LLMs for Dynamic Graph Clustering [24.2] 動的グラフクラスタリングは、動的グラフ内の時間変化クラスタを検出し、追跡することを目的としている。
既存の手法は主にブラックボックスモデルである。
本稿では,連続グラフ埋め込みを個別の意味概念にマッピングするエンドツーエンドの解釈可能なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:14:53 GMT)
REFINE-DP: Diffusion Policy Fine-tuning for Humanoid Loco-manipulation via Reinforcement Learning [23.1] 本稿では,DP高レベルプランナとRLに基づく低レベルロコ操作制御を協調的に最適化する階層型フレームワークであるREFINE-DPを提案する。
REFINE-DPは、事前訓練されたデータに見られない配布外ケースであっても、シミュレーションで90%以上の成功率を達成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:21:19 GMT)
PhysAlign: Physics-Coherent Image-to-Video Generation through Feature and 3D Representation Alignment [23.1] ビデオモデル(VDM)は、動的なシーンや環境をシミュレートするための有望なアプローチを提供する。
既存のモデルは、しばしば基本的な物理的直観に反する時間的に一貫性のないコンテンツを生成する。
物理コヒーレントな画像対ビデオI(2V)生成のための効率的なフレームワークであるPhysAlignを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:44:18 GMT)
AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation [22.8] 本稿では、フロンティアAIリスク評価のための自動化フレームワークであるAutoControl Arenaを紹介する。
私たちは柔軟性を維持しながら幻覚を緩和します。
この原則は3エージェントフレームワークを通じてインスタンス化され、既存のシミュレータよりも98%以上のエンドツーエンドの成功と60%の人間の好みを達成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:28:02 GMT)
What Counts as Real? Speech Restoration and Voice Quality Conversion Pose New Challenges to Deepfake Detection [22.7] 音素修正音声変換と音声復元は, アウト・オブ・ディストリビューションとして扱われることを示す。
マルチクラス問題としてのアンチスプーフィングは、スプーフィング検出を保存しながら、良性シフトに対する堅牢性を向上する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:15:31 GMT)
UAV traffic scene understanding: A regulation embedded multi-modal network and a unified benchmark [22.2] 無人航空機(UAV)プラットフォームからの交通状況の理解は、インテリジェント輸送システムにとって不可欠である。
既存の手法は、光学画像に大きく依存しているため、現実世界の監視において重大な課題に直面している。
本稿では,UAVトラフィックシーン理解のための新しいマルチモーダルトラフィック認知ネットワーク(MTCNet)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:04:56 GMT)
PhyGaP: Physically-Grounded Gaussians with Polarization Cues [22.1] 3次元ガウス散乱(3DGS)は反射型3次元物体のモデリングと反射(DR)による環境との相互作用において大きな成功を収めた。
既存の手法は、アルベドやリフレクタンスなどの物理的特性を正しく再構築するのにしばしば苦労するため、リライティングをサポートしない。
偏光を利用した物理地上3DGS法であるPhyGaPを開発した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:03:19 GMT)
Few Batches or Little Memory, But Not Both: Simultaneous Space and Adaptivity Constraints in Stochastic Bandits [21.8] 空間と適応性に制約を同時に与えたマルチアームバンディットについて検討する。
我々は、$W$-bitメモリ制約を持つアルゴリズムは、少なくとも$(K/W)$バッチを使用して、最小限の後悔である$widetildeO(sqrtKT)$を達成する必要があることを証明している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:02:50 GMT)
Retrieval-Feedback-Driven Distillation and Preference Alignment for Efficient LLM-based Query Expansion [21.0] 強力な教師モデルからコンパクトな学生モデルに検索フレンドリーな拡張行動を伝達するために,検索フィードバック駆動のフレームワークを提案する。
次に、nDCG@10差分に応じて、選択/退避展開ペアを自動生成する検索メトリック駆動戦略を導入する。
TREC DL19/20/21 と MIRACL-zh の実験により,提案手法は推論コストを大幅に削減しつつ,高い検索効率を保っていることが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:59:12 GMT)
ToMPC: Task-oriented Model Predictive Control via ADMM for Safe Robotic Manipulation [20.8] このフレームワークは、衝突のない動きとロボット環境の相互作用を統一し、多様なシナリオに対処する。
また、運動の冗長性を活用して障害物環境の操作効率を高めるタスク指向の障害物回避も導入している。
その結果, フレームワークはリアルタイムに動きや力の軌跡を計画し, 障害物を避けながら操作範囲を最大化し, 安全に関する厳密な制約に固執できることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:35:24 GMT)
Fronto-parietal and fronto-temporal EEG coherence as predictive neuromarkers of transcutaneous auricular vagus nerve stimulation response in treatment-resistant schizophrenia: A machine learning study [20.2] 統合失調症(TRS)の陰性症状に対する経皮的迷走神経刺激(taVNS)の臨床効果についての検討
本研究の目的は,脳波を用いた機械学習モデルを構築し,個人の反応を予測し,関連する神経生理学的メカニズムを探索することであった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:12:37 GMT)
Can We Trust LLMs on Memristors? Diving into Reasoning Ability under Non-Ideality [19.9] 本稿では,言語モデル(LLM)推論における内在的非理想性の影響について検討する。
我々は,思考モード,コンテキスト内学習,モジュール冗長性の3つのトレーニングフリー戦略を評価した。
本研究は,LLM推論における非理想的および実践的手法によるロバスト性向上のための新たな知見を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:02:15 GMT)
$τ$-Voice: Benchmarking Full-Duplex Voice Agents on Real-World Domains [19.0] $$-voiceは、現実の複雑なタスクで音声を評価するためのベンチマークである。
$-voiceは、音声エージェントへの進捗を測定する再現可能なテストベッドを提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:46:52 GMT)
OpenCOOD-Air: Prompting Heterogeneous Ground-Air Collaborative Perception with Spatial Conversion and Offset Prediction [19.0] 我々は,UAVをプラットフォームとして統合した新しいフレームワークであるOpenCOOD-Airを提案する。
地上領域の空隙とデータ空間との勾配干渉を緩和するため、我々はUAV重みを微調整するための移動学習戦略を採用した。
我々は、V2VからVehicle-to-UAVへの移行を検証するために、OPV2V-Airベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:20:19 GMT)
Conditioning on a Volatility Proxy Compresses the Apparent Timescale of Collective Market Correlation [18.9] VIXを結合したOrnstein-Uhlenbeckモデルは、効果的な緩和時間を298ドルから611ドルに短縮する。
分解サンプルでは、$log(mathrmVIX)$の情報残余は、その利得のほとんどを保持します。
また、観測されたスローダイナミクスの条件付けは、見かけのスローダイナミクスの大部分を吸収することを示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:37:40 GMT)
InterventionLens: A Multi-Agent Framework for Detecting ASD Intervention Strategies in Parent-Child Shared Reading [18.2] InterventionLensは、共有読書ビデオから介護者介入戦略を自動的に検出し、時間的に分断するエンドツーエンドのマルチエージェントシステムである。
ASD-HIデータセットの実験により、InterventionLensはF1スコア全体の79.44%を獲得し、ベースラインを19.72%上回る結果となった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:24:47 GMT)
TableMark: A Multi-bit Watermark for Synthetic Tabular Data [17.7] 電子透かしを合成表データにエンコードするマルチビット透かし方式TableMarkを設計する。
ここでは,TableMarkが多数のユーザを効果的に追跡し,攻撃に対して耐性を持ち,高いユーティリティを保っていることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:01:00 GMT)
PDE-SSM: A Spectral State Space Approach to Spatial Mixing in Diffusion Transformers [17.6] 本研究では,空間的状態空間ブロックであるPDE-SSMを提案する。
この結果から,SSMが注目する1次元設定と類似して,多次元PDE演算子が次世代視覚モデルに対して効率的かつ誘導バイアスに富んだ基礎を提供することを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:16:10 GMT)
High-speed Imaging through Turbulence with Event-based Light Fields [17.3] この研究は、高速に動く非剛体物体を高フレーム速度で強大な大気乱流を通して撮像できる最初のシステムを紹介し、実証する。
イベントカメラは、毎秒数千フレームの高速画像を推定できる新しいセンシングアーキテクチャである。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:54:35 GMT)
Missing Mass for Differentially Private Domain Discovery [17.2] 我々は,各ユーザが共有されているが未知のドメインからの項目のサブセットを保持する,差分プライベートドメイン発見におけるいくつかの問題について検討する。
集合和に対して、単純ベースラインのガウス重み付け機構 (WGM) がほぼ最適の $ell_infty$ の質量保証を欠いていることを示す。
次に、WGMを、プライベートのトップ$k$および$k$-hitting集合に対する既存の既知のドメインアルゴリズムのドメイン発見前駆体として適用し、未知のドメイン変種に対する新しいユーティリティ保証を得る。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:42:46 GMT)
SecDTD: Dynamic Token Drop for Secure Transformers Inference [16.5] SecDTDは、セキュアなTransformer推論に適した動的トークンドロップスキームである。
最大中心正規化(Max-Centric Normalization)とOMSel(OMSel)の2つのコア技術を紹介する。
SecDTDは精度を低下させることなく、エンドツーエンドの推論アクセラレーションの4.47倍を達成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:37:35 GMT)
Sparse-Dense Mixture of Experts Adapter for Multi-Modal Tracking [16.1] 本稿では,PEFTに基づくマルチモーダルトラッキングのためのSparse-Dense Mixture of Experts Adapter (SDMoEA) フレームワークを提案する。
マルチレベル多モード核融合における高次相関のモデル化における既存の追跡手法の限界を克服するため,Gram-based Semantic Alignment Hypergraph Fusion (GSAHF)モジュールを提案する。
提案手法は,複数のマルチモーダルトラッキングベンチマークにおいて,他のPEFT手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:51:10 GMT)
How do Role Models Shape Collective Morality? Exemplar-Driven Moral Learning in Multi-Agent Simulation [15.9] 大規模言語モデルを用いたマルチエージェントシミュレーションを構築した。
我々は模倣の鍵となる要因を特定するために動機付け的アブレーション研究を行っている。
結果は、アイデンティティ駆動の整合性は、初期配置を強力にオーバーライドできることを示している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:23:29 GMT)
U-Face: An Efficient and Generalizable Framework for Unsupervised Facial Attribute Editing via Subspace Learning [15.4] 本稿では,教師なしの顔属性編集において,効果的かつ適応的なソリューションを提供するための新しいフレームワークを提案する。
提案手法は意味的ベクトル学習を部分空間学習問題とみなし,潜在ベクトルを意味的ベクトル行列で表される下位次元の意味的部分空間内で近似する。
意味的ベクトルに非負の制約を導入し, 属性境界ベクトルを組み込んで学習方向の絡み合いを低減する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:09:56 GMT)
Multi-Grained Vision-Language Alignment for Domain Generalized Person Re-Identification [15.3] 一般人物再識別(DG Re-ID)は、モデルがソースドメインでトレーニングされるが、見えないターゲットドメインでテストされる、困難なタスクである。
近年,視覚言語モデル (VLM) は様々な視覚的応用において優れた一般化能力を示す。
本稿では,CLIPに基づく多粒度視覚言語アライメントフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:33:12 GMT)
Dense Dynamic Scene Reconstruction and Camera Pose Estimation from Multi-View Videos [14.8] 本稿では,複数のカメラから高密度ダイナミックシーン再構成とカメラポーズ推定を行う際の課題に対処する。
本稿では,タスクの頑健なカメラ追跡と深度を分離する2段階最適化フレームワークを提案する。
提案手法は, 合成および実世界のベンチマークにおいて, 最先端のフィードフォワードモデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:48:41 GMT)
Beyond Medical Diagnostics: How Medical Multimodal Large Language Models Think in Space [14.7] 本稿では,空間的視覚的質問応答データを自律的に合成するエージェントパイプラインを提案する。
本研究では,医療MLLMにおける3次元空間インテリジェンス評価のための総合的なベンチマークであるSpatialMedを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:17:45 GMT)
TransDex: Pre-training Visuo-Tactile Policy with Point Cloud Reconstruction for Dexterous Manipulation of Transparent Objects [14.6] 有害な操作は複雑なタスクを可能にするが、透明物体を操作する際には、自己閉塞性、深度ノイズ、深度情報損失に悩まされる。
本稿では,3次元ビジュオ触覚融合モータポリシーであるTransDexを提案する。
実際のロボットシステムで行われた透明な物体操作実験の結果、TransDexは既存のベースライン法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:59:34 GMT)
LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments [14.5] 本稿では、縦型T1強調脳MRIを読み取る3次元視覚言語モデルの訓練用パイプラインであるLoV3Dを提案する。
パイプラインは、ラベル一貫性、縦コヒーレンス、生物学的妥当性を強制することで最終的な診断を下す。
被験者レベルのADNIテストセットでは、LoV3Dは3クラスの診断精度が93.7%に達する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:50:43 GMT)
Your Vision-Language-Action Model Already Has Attention Heads For Path Deviation Detection [14.1] VLA(Vision-Language-Action)モデルは、ナビゲーションタスクにおけるセマンティックアクションを予測する強力な可能性を示している。
それらは基本的に、軌跡のずれにつながる視覚的な幻覚によって妨げられている。
凍結VLAモデル内の注意点数を監視することで,余分な計算オーバーヘッドを伴わずに経路偏差を正確に検出できることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:26:11 GMT)
AgriChat: A Multimodal Large Language Model for Agriculture Image Understanding [13.7] 我々は、数千の農業階級にまたがる幅広い知識を提示し、説明付きの詳細な農業評価を提供する専門的なMLLMであるAgriChatを紹介する。
その結果、視覚的詳細をWebで検証された知識と組み合わせて保存することは、堅牢で信頼性の高い農業用AIへの信頼できる経路であることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:49:05 GMT)
Toward Scalable Co-located Practical Learning: Assisting with Computer Vision and Multimodal Analytics [13.6] 本研究では,天井に装着した1台のカメラを用いて,協調学習における微粒な学習行動を捉えることができるかを検討した。
大学生の看護シミュレーションでは、教師はまず7つの観察可能な行動カテゴリーを特定し、その後、YOLOベースの検出器のトレーニングに使用された。
ビデオデータは52セッションから収集され、Scenario Bよりも行動の変化が大きいため、Scenario Aを中心に分析された。
この研究は、単一カメラのコンピュータビジョンアプローチが、ウェアラブルセンサーに頼ることなく、対面の実践的学習におけるチームワークとタスクエンゲージメントの分析を支援することを示している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:04:58 GMT)
A Benchmark for Multi-Party Negotiation Games from Real Negotiation Data [13.6] 複数政党の交渉はしばしば、単一の最終結果ではなく、束縛の順序、行動レベルのコミットメントとして展開される。
本稿では、インセンティブアライメント、ゴール複雑性、ペイオフ分布などの重要な構造特性を網羅するゲームジェネレータを特徴とする、未研究のシステムに対するベンチマークを紹介する。
我々は3つの値関数近似(筋力報酬、楽観的な上界、悲観的な下界)をテストし、取引評価においてバイアスレンズとして機能する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:12:06 GMT)
DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models [13.4] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのための動的量子化フレームワークであるDyQ-VLAを提案する。
具体的には、感度対応スイッチング戦略は、リアルタイムキネマティックプロキシを利用してビット幅スイッチをトリガーし、キネマティック誘導モジュールは最適なビット幅を動的に割り当てる。
実験の結果、DyQ-VLAは元のメモリフットプリントの30.9%しか必要とせず、元のパフォーマンスの99.5%を維持し、シミュレーションは1.49倍、実世界のスピードアップは1.43倍であることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:30:13 GMT)
ImagiNav: Scalable Embodied Navigation via Generative Visual Prediction and Inverse Dynamics [13.4] Vision-Language Navigationは、高価なエンボディメント固有のロボットデータに基づいて訓練されたエンドツーエンドのポリシーに依存している。
ロボットの動作から視覚計画を切り離す新しいモジュラーパラダイムであるImagiNavを提案する。
ImagiNavは、ロボットのデモを必要とせずに、ロボットナビゲーションへの強力なゼロショット転送をデモする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:34:02 GMT)
sebis at ArchEHR-QA 2026: How Much Can You Do Locally? Evaluating Grounded EHR QA on a Single Notebook [13.4] 一つのノートブックに制限された場合,EHR質問応答がどこまでプッシュできるかを検討する。
その結果,共有タスクリーダボード上での競争性能が向上することが示された。
これらの結果は、完全ローカルで動作するプライバシー保護型EHR QAシステムは、現在のモデルとコモディティハードウェアで実現可能であることを示唆している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:17:55 GMT)
Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models [13.3] 事前学習されたLarge Language Model (LLM) は幅広い能力を示すが、特定のタスクやドメインに対して、より正確で信頼性の高い推論の達成は、一般的にポストトレーニングに依存する。
近年の理論的・実証的な展開は, スーパービジョンファインチューニング (SFT) と強化学習 (RL) が密接に結びついていることを示している。
本研究は,SFTおよびRLを用いたLLMポストトレーニングにおける総合的かつ統一的な視点を示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:24:38 GMT)
LLM-MINE: Large Language Model based Alzheimer's Disease and Related Dementias Phenotypes Mining from Clinical Notes [13.2] 本稿では,アルツハイマー病および認知症関連表現型の自動抽出のための大規模言語モデルに基づく表現型マイニングフレームワークを提案する。
専門家が定義した2つの表現型リストを用いて,コホート間の統計的意義と,教師なし疾患のステージングに対する有用性を検討することにより,抽出した表現型を評価する。
LLMをベースとした表現型抽出は,非構造化音符から臨床的に有意なADRD信号を検出する上で有望なツールであることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:45:23 GMT)
GroupGuard: A Framework for Modeling and Defending Collusive Attacks in Multi-Agent Systems [12.2] グループガード(GroupGuard)は、多層防御戦略を用いて、癒着剤の識別と分離を行う、トレーニングフリーの防衛フレームワークである。
GroupGuardは、高い検出精度(最大88%)を一貫して達成し、協調的なパフォーマンスを効果的に回復する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:19:13 GMT)
Multimodal Emotion Regression with Multi-Objective Optimization and VAD-Aware Audio Modeling for the 10th ABAW EMI Track [11.8] 本稿では,Hum-Vidmimic2データセット上での情動的ミミトリインテンシティ(EMI)推定トラックに焦点を当てる。
それは、賞賛、面白さ、決定、共感の痛み、引用、ジョイの6つの連続した感情の次元を予測することを目的としている。
本フレームワークは、結合に基づく多モード融合、共有6次元回帰ヘッド、MSEによる多目的最適化、ピアソン相関、補助分岐監督、パラメータ安定化のためのEMA、音響分岐に先立ってVADにインスパイアされた潜水器を統合する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:17:06 GMT)
Level Up: Defining and Exploiting Transitional Problems for Curriculum Learning [11.8] 本稿では,与えられたモデルの能力に対して,個々の問題インスタンスの難易度を直接測定する新しい手法を提案する。
より簡単からより難しいトランザクショナルな問題まで"レベルアップ"するカリキュラムでのトレーニングは、モデルを次のレベルの能力レベルに最も効率的に改善します。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:17:45 GMT)
SmoothVLA: Aligning Vision-Language-Action Models with Physical Constraints via Intrinsic Smoothness Optimization [11.7] VLA(Vision-Language-Action)モデルは、ロボット操作の強力なパラダイムとして登場した。
SmoothVLAは,タスク性能と動作のスムーズさを相乗的に最適化する,新しい強化学習ファインチューニングフレームワークである。
我々の研究は、本質的な報酬最適化を通じて、VLAモデルと物理世界の制約を整合させるスケーラブルなアプローチを提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:47:04 GMT)
Artificial intelligence-driven improvement of hospital logistics management resilience: a practical exploration based on H Hospital [11.4] 病院の物流管理は、内部の業務や外部の緊急事態からのプレッシャーに直面している。
病院のロジスティクスは適応管理システムと構造的継続的改善に依存している。
ターゲット戦略はAI駆動のクローズドループレジリエンスメカニズムを形成するために提案されている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:57:52 GMT)
Sub-Band Spectral Matching with Localized Score Aggregation for Robust Anomalous Sound Detection [11.3] 一般的な訓練不要な異常音検出パイプラインは、フレームレベルの表現をバンド保存特徴ベクトルに時間的にプールし、異常をスコアする。
1つのグローバルな隣人はすべてのバンドに同じ基準を共有するよう強制し、バンドレベルのミスマッチが増加する。
本稿では,時間的にプールされたサブバンドベクトルをメモリバンクに格納し,サブバンド毎の隣人を検索し,スコアを均一に集約して正規スコアの変動を低減し,識別性を向上させるBEAMを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:38:41 GMT)
IdentityGuard: Context-Aware Restriction and Provenance for Personalized Synthesis [11.1] 私たちの研究は、セキュリティは脅威そのものと同じくらいコンテキストに意識すべきであり、本質的にパーソナライズされた概念に結びついている、という原則に基づいています。
本稿では,パーソナライズされたアイデンティティと組み合わせることで,有害コンテンツをブロックする条件付き制約により,この原則を実現するIDENTITYGUARDを提案する。
実験により、我々のアプローチはモデルの実用性を維持しながら誤用を防ぎ、堅牢なトレーサビリティを実現する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:38:47 GMT)
DPxFin: Adaptive Differential Privacy for Anti-Money Laundering Detection via Reputation-Weighted Federated Learning [11.0] DPxFinは、評判誘導型適応微分プライバシーを統合する新しいフレームワークである。
提案手法は, 局所学習モデルとグローバルモデルとの整合性を評価することによって, クライアントの評判を計算する。
マルチ層パーセプトロン(MLP)を用いたIDおよび非IID設定下でのアンチモニー洗浄データセット上でのDPxFinの検証を行った。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:34:39 GMT)
EyeWorld: A Generative World Model of Ocular State and Dynamics [10.7] EyeWorld(アイワールド)は、臨床画像に基礎を置く部分的に観察されたダイナミックなシステムとして、眼を概念化する生成的世界モデルである。
観察可能な潜伏眼状態を学び、微粒なパーシングを統一し、構造保存された相互モダリティ翻訳と品質汚染の強化を行う。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:19:57 GMT)
APEX-Searcher: Augmenting LLMs' Search Capabilities through Agentic Planning and Execution [10.6] APEX-Searcherは、大規模言語モデル(LLM)検索能力を増強する新しいエージェントプランニングおよび実行フレームワークである。
戦略計画の最適化のために、まずRLを分解特異的な報酬として採用する。
その後、高品質なマルチホップ軌道の教師付き微調整を適用し、ロバストな反復的なサブタスク実行能力を持つモデルに装備する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:17:12 GMT)
VAD4Space: Visual Anomaly Detection for Planetary Surface Imagery [10.6] 惑星探査における自動発見の枠組みとして視覚異常検出について検討する。
実際の惑星画像に対する最新の特徴量に基づくVAD手法の実証評価を行った。
この研究は実践的なベンチマークを確立し、様々なミッションクリティカルなアプリケーションをサポートするためのオープンワールド認識システムの可能性を強調している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:42:17 GMT)
Clinician input steers frontier AI models toward both accurate and harmful decisions [10.6] 8つのフロンティアモデルにまたがる21の言語モデル (LLM) を, 差分診断生成と次のステップ勧告に基づいて評価した。
専門的な文脈は、21モデル全体にわたる正しい最終診断の包含を著しく改善した。
GPT-4o 実験では, 臨床症状の明確な不確実性信号により, 対側的文脈での診断性能が向上した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:47:53 GMT)
Power Term Polynomial Algebra for Boolean Logic [10.5] 直交正規形(CNF)と代数正規形(ANF)を橋渡しするために設計されたブール公式の表現言語であるパワー項代数を導入する。
直接CNF->ANF変換は、式が小さな断片に分解されない限り指数的な爆発を引き起こす。
我々のフレームワークは、CNF節を直接表現しながら、モノミアルの構造化されたファミリーをコンパクトに符号化する、表現自体におけるこのミスマッチに対処する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:22:52 GMT)
UniVid: Pyramid Diffusion Model for High Quality Video Generation [10.3] 拡散に基づくテキスト・ツー・ビデオ生成(T2V)や画像・ツー・ビデオ生成(I2V)が注目されている。
テキストプロンプトと参照画像のハイブリッド条件を用いた統合ビデオ生成モデル(UniVid)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:51:16 GMT)
Zero-Forgetting CISS via Dual-Phase Cognitive Cascades [10.3] 連続的セマンティックセグメンテーション(CSS)は、多くのダウンストリームアプリケーションを可能にするコンピュータビジョンの基盤となるタスクである。
認知カスケード(CogCaS)は,CISS設定におけるCSSタスクのための新しい二相カスケード形式である。
最先端の手法と比較して, 様々な難解なシナリオ, 特に長い段階的なタスクをこなすシナリオにおいて, 大幅な改善が見られた。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:09:32 GMT)
GradMem: Learning to Write Context into Memory with Test-Time Gradient Descent [10.2] サンプルごとのテスト時間最適化を通じてコンテキストをメモリに書き込むGradMemを紹介します。
GradMemは、モデルレベルの自己教師付きコンテキスト再構築損失を明示的に最適化する。
bAbIやSQuADなど、自然言語タスクの競合的な結果が得られる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:17:33 GMT)
TMPDiff: Temporal Mixed-Precision for Diffusion Models [10.1] TMPDiffは拡散モデルのための時間混合精度フレームワークである。
異なる数値の精度を異なる識別タイムステップに割り当てる。
一致したスピードアップで一様精度のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:06:46 GMT)
LPV-MPC for Lateral Control in Full-Scale Autonomous Racing [10.0] 本稿では横方向制御のための線形変数モデル予測制御器(LPV-MPC)を提案する。
本稿では, コントローラ設計, モデルパラメータ抽出手法, システムレベルおよび実装の重要事項について詳述する。
最終レースの結果を報告し、総合的な車両動力学分析を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:39:07 GMT)
Human-like Object Grouping in Self-supervised Vision Transformers [9.9] 本稿では,自然主義的な場面における点対に対する同一・異なる対象判断を行う行動ベンチマークを提案する。
我々は、被験者の反応時間を予測するために、その表現からの単純な読み出しを用いて、多様な視覚モデルをテストする。
自己教師型視覚モデルでは, 物体の構造を人間の行動的に捉え, グラム行列構造が知覚的アライメントを駆動する役割を担っていることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:43:10 GMT)
SGR-OCC: Evolving Monocular Priors for Embodied 3D Occupancy Prediction via Soft-Gating Lifting and Semantic-Adaptive Geometric Refinement [9.9] 3Dセマンティック占有予測は、具現化されたAIの基盤である。
我々は,SGR-OCC(Soft-Gating and Ray-Refinement Occupancy)を提案する。
局所予測タスクでは、SGR-OCCは58.55$%の完了IoUと49.89$%のセマンティックmIoUを達成し、それぞれ3.65$%と3.69$%の前のベストメソッドであるEmbodiedOcc++を上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:45:03 GMT)
Deep Learning for Virtual Reality User Identification: A Benchmark [9.6] VRヘッドセットとコントローラーのモーショントラッキングデータが、強力な行動バイオメトリックとして登場した。
We benchmark user identification performance across the large-scale Who is Alyx VR dataset, collect data from 71 users playing the Half-Life:Alyx game。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:46:00 GMT)
Effective Sparsity: A Unified Framework via Normalized Entropy and the Effective Number of Nonzeros [9.5] 我々は、正規化エントロピーベース正規化器の統一クラスである非ゼロ有効数(ENZ)を導入する。
ENZは、無視できない摂動に敏感な有効空間の安定かつ連続的な尺度を提供することを示す。
数値実験により、この効果的な疎水性フレームワークは、ロバスト性および精度において従来の濃度に基づく手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:20:29 GMT)
IGU-LoRA: Adaptive Rank Allocation via Integrated Gradients and Uncertainty-Aware Scoring [9.3] IGU-LoRAは、階層内統合勾配(IG)の感度を計算し、それらをランク割り当てのための階層レベルスコアに集約する適応ランクLoRAである。
IGU-LoRAは、一致したパラメータ予算でPEFTベースラインを一貫して上回り、下流の精度とロバスト性を改善している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:45:54 GMT)
SeqTG: Scalable Combinatorial Test Generation via Sequential Integer Linear Programming [9.1] 複雑な制約下での最小限のカバレッジ配列は、未解決のNPハードチャレンジのままである。
現在の強欲なアルゴリズムは、非常に欲求的だが、深刻なリターンの低下に苦しむ。それらは、初期相互作用を効率的にカバーするが、最後のいくつかの困難なペアをまとめるのに苦労するときに、肥大した冗長なテストスイートを生成する。
シークエンシャル線形プログラミング(ILP)に基づくスケーラブルなフレームワークであるSeqTGを紹介する。
本稿では,SeqTGが最新の肥大を効果的に根絶し,最先端のテストスイートのコンパクト性と厳密な制約順守を実現していることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:18:43 GMT)
VID-AD: A Dataset for Image-Level Logical Anomaly Detection under Vision-Induced Distraction [9.0] VID-ADは、視覚誘発障害下での論理的異常検出のためのデータセットである。
10の製造シナリオと5つの捕獲条件で構成され、合計50の1級タスクと10,395のイメージで構成されている。
正規画像から生成されたテキスト記述のみに依存する言語ベースの異常検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:21:37 GMT)
Location Aware Embedding for Geotargeting in Sponsored Search Advertising [8.8] 我々は,ユーザのクエリとその場所を表す,シンプルで強力なニューラル埋め込みベースのフレームワークを開発する。
この表現は、ユーザのクエリインテントとクエリ/物理位置との間の微妙な相互作用をキャプチャできることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:58:39 GMT)
Towards Stable Self-Supervised Object Representations in Unconstrained Egocentric Video [8.6] 本研究では,非ラベル付きエゴセントリックビデオから安定したオブジェクト表現を学習するための統合ビジョントランスフォーマーフレームワークを提案する。
EgoViTは「プロトオブジェクト」を共同で発見・安定化することでこの学習プロセスをブートストラップする
EgoViTは、教師なしオブジェクト発見における+8.0%のCorLoc改善と、セマンティックセグメンテーションにおける+4.8%のmIoU改善を実現している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:00:55 GMT)
MLFCIL: A Multi-Level Forgetting Mitigation Framework for Federated Class-Incremental Learning in LEO Satellites [8.6] Federated Class-Incremental Learning (FCIL)は、生データを共有せずに、分散インクリメンタルな学習を可能にする。
本稿では,破滅的な忘れを3つのソースに分解する多段階的忘れ軽減フレームワークMLFCILを提案する。
MLFCILは、リソースオーバーヘッドを最小限に抑えながら、精度と緩和の両面でベースラインを著しく上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:44:36 GMT)
Memory-Driven Role-Playing: Evaluation and Enhancement of Persona Knowledge Utilization in LLMs [8.4] メモリ駆動型ロールプレイングパラダイムを提案する。
スタニスラフスキーの「感情記憶」行動理論に触発されたこのパラダイムは、LLMの内部メモリストアとしてのペルソナの知識を基盤としている。
MREvalは4つのメモリ駆動能力を評価する詳細な評価フレームワークであり、MRPromptは構造化メモリ検索と応答生成を導くプロンプトアーキテクチャであり、MRBenchは細粒度診断のためのバイリンガルベンチマークである。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:12:42 GMT)
On Interpolation Formulas Describing Neural Network Generalization [8.2] 連続時間拡散により決定論的バージョンを拡張する勾配カーネルを導入する。
トレーニングサンプルは、損失依存の重み付けと軌道に沿った勾配アライメントを通じて寄与することを明らかにする。
次に、勾配カーネルによって誘導される積分作用素の零空間に一般化誤差をリンクする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:03:29 GMT)
QuarkMedBench: A Real-World Scenario Driven Benchmark for Evaluating Large Language Models [8.1] LLM(Large Language Models)は、標準化された医療試験に優れるが、高いスコアは、現実世界の医療クエリに対する高品質な応答に変換できないことが多い。
実世界の医療LCM評価に適した生態学的に有効なベンチマークであるQuarkMedBenchを紹介する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:51:43 GMT)
Revisited Quantification of the Resource Theory of Imaginarity [8.0] 3つの典型的な量子チャネルの下で、任意の1量子ビットの純初期状態に対する3つの虚弱関連メトリクスの減衰挙動について検討する。
上記の2量子チャネルの下でのいくつかの重要な2量子状態に対する上記の虚視度測定値の減衰傾向を調べることにより,解析を高次元システムに拡張する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:18:31 GMT)
DCP-CLIP:A Coarse-to-Fine Framework for Open-Vocabulary Semantic Segmentation with Dual Interaction [7.9] 本稿では,意味的セグメンテーションのための新しい粗粒度フレームワーク DCP-CLIP について述べる。
私たちはまず、CLIPのオープン語彙認識機能を利用して、画像コンテキストに関連するセマンティックなカテゴリを識別する。
テキストガイダンスから視覚表現に意味情報を相互に統合することで,粗いセグメンテーションを行う。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:58:56 GMT)
Research Paradigm of Materials Science Tetrahedra with Artificial Intelligence [7.8] 我々は、データ駆動型とAI強化型の研究を刺激する2つの新しい研究パラダイムを提案する。
1つは、物質科学のためのAIに焦点を当て、マター・データ・ポテンシャル・アジェント図を考える。
もうひとつは、データ-アーキテクチャ-推論-推論の関係について議論することで、AI研究を実証する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:30:03 GMT)
Fine-tuning is Not Enough: A Parallel Framework for Collaborative Imitation and Reinforcement Learning in End-to-end Autonomous Driving [7.7] PaIR-Driveは、エンドツーエンドの自動運転における協調および強化学習のための一般的なフレームワークである。
トレーニング中、PaIR-DriveはILとRLを2つの並列ブランチに分離する。
PaIR-Driveは既存のRLファインチューニング法を一貫して上回り、人間の専門家の準最適動作を補正する可能性さえある。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:53:47 GMT)
Path-conditioned Reinforcement Learning-based Local Planning for Long-Range Navigation [7.7] 長距離ナビゲーションは、グローバルプランナーが経路を生成し、ウェイポイントに分解し、続いてローカルプランナーが続く階層的なパイプラインを通して一般的に対処される。
これらのシステムはグローバルパスの品質に敏感であり、不正確なリモートセンシングデータによって局所的に不可能な経路ポイントが発生し、局所的な実行が低下する可能性がある。
本稿では,経路情報を文脈ガイダンスとして活用する強化学習に基づくローカルナビゲーションポリシーを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:56:14 GMT)
Every Error has Its Magnitude: Asymmetric Mistake Severity Training for Multiclass Multiple Instance Learning [7.6] マルチインスタンス学習(MIL)は、WSI(Whole Slide Image)診断において有望なパラダイムとして登場した。
本稿では,診断クラスを階層構造に整理する誤り重大度対応学習手法を提案する。
既存の方法と比較して,本手法はMIL診断における致命的誤りを著しく軽減することが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:36:12 GMT)
Unsupervised Adaptation from FDG to PSMA PET/CT for 3D Lesion Detection under Label Shift [7.5] ラベル付きFDG PET/CTでトレーニングされた検出器をラベル付きPSMA PET/CTに適応させる3次元病変検出のための教師なし領域適応フレームワークを提案する。
このラベルシフトを明示的にモデル化し,補償する2つのメカニズムによる自己学習を導入する。
AutoPET 2024では、501ラベルのFDG研究から369ドルの18ドルF-PSMA研究に適応し、提案手法はソースのみのベースラインよりもAPとFROCの両方を改善する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:25:29 GMT)
GenLie: A Global-Enhanced Lie Detection Network under Sparsity and Semantic Interference [7.5] 我々は,グローバル監視の下で局所的特徴モデリングを行うGlobal-Enhanced Lie Detection NetworkであるGenLieを提案する。
具体的には、緩やかで微妙な騙しの手がかりを地域レベルで捉え、グローバルな監督と最適化によって、堅牢で差別的な表現が保証される。
ハイテイクシナリオとローテイクシナリオの両方をカバーする3つの公開データセットの実験は、GenLieが一貫して最先端のメソッドを上回っていることを示している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:08:57 GMT)
An Interpretable and Stable Framework for Sparse Principal Component Analysis [7.3] スパース主成分分析(SPCA)は、高次元データにおける解釈容易性と可変冗長性に対処する。
本研究では,規則化フレームワークに単一平衡パラメータを導入し,可変ペナルティを適応的に調整するSP-SPCAを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:27:05 GMT)
Ego-1K -- A Large-Scale Multiview Video Dataset for Egocentric Vision [7.3] Egohugging-1Kは、時間同期型エゴセントリックなマルチビュービデオの大規模なコレクションである。
このデータセットには、ユーザーが装着する4カメラVRヘッドセットを取り囲む12台の同期カメラを備えたカスタムリグで撮影した1000本近い短い自撮りビデオが含まれている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:00:26 GMT)
MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers [7.2] 私たちは10言語で多言語匿名化ベンチマークを作成します。
2,500以上の個人情報のアノテーションを用いたベンチマークは、多くのアプリケーションで使用できます。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:02:43 GMT)
Sovereign-OS: A Charter-Governed Operating System for Autonomous AI Agents with Verifiable Fiscal Discipline [7.2] Sovereign-OSはガバナンスファーストのオペレーティングシステムで、すべてのエージェントアクションを憲法上の管理下に置く。
CEO(ストラテジスト)は、目標を依存性を認識したタスクDAGに分解する。
CFOは、オークションベースの入札エンジンを介して、予算上限、日々の燃焼制限、収益性フロアに対して各支出をゲートする。
労働者は、動的TrustScoreが管理する有給オートノミーの下で活動する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:25:31 GMT)
Multi-Robot Coordination for Planning under Context Uncertainty [7.2] 現実のロボットは、目的の優先順位が下層の操作状況に依存するような環境で運用されることが多い。
我々は,この問題をMR-CUSSP(Multi-Robot Context-Uncertain Shortest Path)として定式化する。
CIMOP (Coordinated Inference for Multi-Objective Planning) は,ロボットを情報的ランドマークへ誘導し,現実の文脈を効率的に推測する計画と,LCBS (Lexicographic Conflict-Based Search) の2段階からなる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:38:22 GMT)
TSDCRF: Balancing Privacy and Multi-Object Tracking via Time-Series CRF and Normalized Control Penalty [7.2] ビデオにおける多目的追跡は、しばしば、繊細なアイデンティティ情報を明らかにするための外観や位置の手がかりを必要とする。
3つのコンポーネントを組み合わせることで、プライバシとトラッキングのバランスをとるプラグイン改良フレームワークであるTSDCRFを提案する。
その結果、TSDCRFはホワイトノイズや先行手法よりもプライバシーとユーティリティのトレードオフが優れていることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:27:12 GMT)
REAEDP: Entropy-Calibrated Differentially Private Data Release with Formal Guarantees and Attack-Based Evaluation [7.2] 本稿では,エントロピーキャリブレーションしたヒストグラムリリース,合成データリリース機構,アタックベース評価を組み合わせた差分プライバシーフレームワークを提案する。
理論側では、隣接するヒストグラムデータセットに対してシャノンエントロピーとレニエントロピーに拡張された明示的な感度を導出する。
本稿では,合成データ機構がパラメータ条件下での正式な差分プライバシー保証を満たすことを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:23:55 GMT)
Bodhi VLM: Privacy-Alignment Modeling for Hierarchical Visual Representations in Vision Backbones and VLM Encoders via Bottom-Up and Top-Down Feature Search [7.2] emphBodhi VLMは、エンフィエラルな神経表現のためのエンフィバシーアライメント・モデリング・フレームワークである。
NCPやMDAVベースのクラスタリングを通じて、センシティブな概念を階層的にグループ化する。
マルチスケール表現に対するボトムアップ(BUA)とトップダウン(TDA)戦略を使用して、センシティブな特徴領域を特定する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:11:31 GMT)
ComFree-Sim: A GPU-Parallelized Analytical Contact Physics Engine for Scalable Contact-Rich Robotics Simulation and Control [7.1] 相補性のない接触モデリングに基づくGPU並列解析用接触物理エンジンを提案する。
ComFree-Simは、クーロン摩擦の二重錐におけるインピーダンススタイルの予測-補正更新を通じて、接触インパルスを閉じた形で計算する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:49:49 GMT)
Scribe Verification in Chinese manuscripts using Siamese, Triplet, and Vision Transformer Neural Networks [7.1] Tsinghua Bamboo SlipsデータセットとMulti-Attribute Chinese calligraphyデータセットのサブセットの2つのデータセットが使用された。
SiameseとTripletのニューラルネットワークアーキテクチャは、畳み込みとTransformerベースのモデルを含む実装されている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:23:35 GMT)
Hierarchy of extreme-event predictability in turbulence revealed by machine learning [7.0] 乱流における極端変動予測可能性は強い状態依存である。
これらの結果から,コヒーレント-構造持続性は乱流極度の予測可能性の制御機構であることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:39:29 GMT)
Self-Supervised Uncertainty Estimation For Super-Resolution of Satellite Images [6.9] 超高解像度衛星画像は、ペアの低解像度/高解像度データがないため、困難である。
近年の自己監督型SR法は、バースト観測における時間的冗長性を利用してこの制限を克服している。
画像の超解像における不確かさを、地上の高解像データにアクセスすることなく推定できる新たな自己監督的損失を導入する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:41:43 GMT)
Robust Regularized Policy Iteration under Transition Uncertainty [6.7] 我々は、オフラインRLをロバストなポリシー最適化として定式化し、遷移カーネルを不確実性集合内の決定変数として扱う。
本稿では、抽出可能な最大最小二レベル目標を、抽出可能なKL正規化サロゲートに置き換えるロバスト正規化ポリシーイテレーション(RRPI)を提案する。
D4RLベンチマークの実験では、RRPIは高い平均性能を示し、最近のベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:41:04 GMT)
Computation and Communication Efficient Federated Unlearning via On-server Gradient Conflict Mitigation and Expression [6.7] フェデレート・アンラーニング(FUL)は、訓練されたフェデレート・ラーニングモデルから特定の参加者のデータコントリビューションを取り除くことを目的としている。
2つの重要な段階からなる新しいフレームワークであるFederated On-server Unlearning (FOUL)を提案する。
FOULは、通信コストと計算コストを低く抑えながら、目標までの時間を大幅に削減し、競争力や優れた結果を達成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:02:22 GMT)
Greedy Information Projection for LLM Data Selection [6.7] textscGIPは、サンプルのサブセットとタスク固有のクエリ信号の間の相互情報の最大化として選択をキャストする。
textscGIPは、少数の例を使用しながら、フルデータの微調整にマッチする小さなサブセットを選択する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:42:20 GMT)
LegacyTranslate: LLM-based Multi-Agent Method for Legacy Code Translation [6.6] LegacyTranslateは、API対応コード翻訳のためのマルチエージェントフレームワークである。
Initial Translation Agentは、検索したインコンテキストの例を使って、初期Java翻訳を生成する。
API Grounding Agentは、API知識ベースから関連するエントリを取得することで、コードを既存のAPIと整合させる。
Refinement Agentは、コンパイラフィードバックとAPI提案を使用して出力を反復的に洗練し、正確性を改善する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:51:07 GMT)
The Taxonomies, Training, and Applications of Event Stream Modelling for Electronic Health Records [6.6] EHRは、医療における人工知能の変革的ポテンシャルを提供する。
従来のモデリングアプローチは、実世界の臨床データの本質的にの空間性と不規則性に対応するのに苦労することが多い。
研究は、患者の記録を連続的なシーケンスとして扱うイベントストリーム表現に移行した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:08:30 GMT)
Evaluation of Visual Place Recognition Methods for Image Pair Retrieval in 3D Vision and Robotics [6.6] 登録パイプラインのための画像ペア検索フロントエンドとして,視覚的位置認識(VPR)について検討する。
我々は,3つの挑戦的データセットを用いて,最先端のVPRファミリーを比較検討した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:16:31 GMT)
USIS-PGM: Photometric Gaussian Mixtures for Underwater Salient Instance Segmentation [6.5] 水中の塩分インスタンスセグメンテーション(USIS)は海洋ロボットシステムにとって不可欠である。
本稿では,USISの単一ステージフレームワークであるUSIS-PGMを提案する。
実験により提案したUSIS-PGMモデルの優位性と実用性を示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:16:32 GMT)
Stiffness Copilot: An Impedance Policy for Contact-Rich Teleoperation [6.4] Stiffness Copilotは、オペレーターがロボットのポーズを指示し、ポリシーがロボットのインピーダンスをオンラインで調整する、共有制御遠隔操作のためのビジョンベースのポリシーである。
人体実験において、剛性コパイロットは、一定の低剛性を使用しながら、一定の高剛性を使用する効率と同等の安全性を達成した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:23:00 GMT)
Generative Inverse Design of Cold Metals for Low-Power Electronics [6.4] 本稿では,MatterGPTとSLICESを用いて3次元冷間金属を生成する逆設計ワークフローを提案する。
熱力学的安定性を目標とした特性条件付き生成と50-500 meV帯縁距離は148,506個のユニークな候補を生成する。
材料プロジェクトデータベースでは,50~500mVのFermi準位付近で,257個のコールドメタルが新規であることが確認された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:24:24 GMT)
SHAMISA: SHAped Modeling of Implicit Structural Associations for Self-supervised No-Reference Image Quality Assessment [6.2] No-Reference Image Quality Assessment (NR-IQA) は、素質の基準画像にアクセスすることなく知覚品質を推定することを目的としている。
本研究では,非コントラストな自己監督型フレームワークであるSHAMISAを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:37:26 GMT)
Investigating Lipkin-Meshkov-Glick Model and Criticality-Enhanced Metrology in a Coherent Ising Machine [6.1] コヒーレントイジングマシン(CIM)を用いたLipkin-Meshkov-Glickモデル(LMG)のシミュレーション手法を提案する。
本研究では,LMGモデルのスピン変数をDOPOパルスの位相にマッピングし,全結合によりスピン-スピン相互作用を実現する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:35:50 GMT)
ST-ResGAT: Explainable Spatio-Temporal Graph Neural Network for Road Condition Prediction and Priority-Driven Maintenance [5.9] 気候にやさしい道路網は、反応性のある固定修理から予測的で意思決定可能なメンテナンスへとパラダイムシフトする必要がある。
本稿では,時空間残差グラフ注意ネットワークST-ResGATを紹介する。
残グラフアテンション符号化とGNN時間アグリゲーションを融合し、舗装劣化を予測する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:24:32 GMT)
OasisSimp: An Open-source Asian-English Sentence Simplification Dataset [5.8] OasisSimpは、英語、シンハラ語、タミル語、パシュト語、タイ語で文レベルの単純化のためのデータセットである。
タイ、パシュト、タミルでは以前のデータセットは存在せず、シンハラでは限られたデータしか利用できない。
我々は,OasisSimpデータセットを用いて,オープンウェイトな多言語大言語モデル(LLM)を8つ評価した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:37:21 GMT)
Probing neural audio codecs for distinctions among English nuclear tunes [5.8] 我々は、Cole et al. (2023) のラベル付き音声データを用いて、英語の句末節(核)を国歌に特徴付けるピッチ軌跡が、これらのパターンに含まれるかどうかを訓練する。
線形プローブは、音韻的に特定された8つの核音と単調ピッチのアクセントを区別する際に、未定量の潜伏語またはいくつかのコードワードで訓練された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:17:35 GMT)
Implicit Maximum Likelihood Estimation for Real-time Generative Model Predictive Control [5.7] Implicit Maximum Likelihood Estimation (IMLE) は、計画のための新たな生成モデリング手法である。
本結果は,IMLEが標準オフライン強化学習ベンチマーク上での競合性能を実証するものである。
さらに, 動的環境下での高速かつ適応的な計画生成を実現する方法を示すとともに, リアルタイムに動作するクローズドループヒューマンナビゲーションシナリオにおけるIMLEの検証を行った。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:39:31 GMT)
Generate Then Correct: Single Shot Global Correction for Aspect Sentiment Quad Prediction [5.4] ABSAの主な課題はアスペクト感情クワッド予測(ASQP)で、4つの要素を識別する必要がある。
本稿では,1ショットのシーケンスレベルの大域的補正を行うジェネレータであるGenerate-then-Correct (G2C)を提案する。
Rest15とRest16データセットでは、G2Cは強力なベースラインモデルを上回っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:11:27 GMT)
Projection-Free Evolution Strategies for Continuous Prompt Search [5.2] 連続プロンプト探索は、自然言語処理タスクにおける従来のパラメータチューニングに代わる計算効率の良い代替手段を提供する。
既存の手法は、ランダムに投影された低次元部分空間への探索を制限することで、これらの課題を軽減するのが一般的である。
本稿では,進化戦略に基づくプロジェクションフリーなプロンプト探索手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:27:14 GMT)
Scene Generation at Absolute Scale: Utilizing Semantic and Geometric Guidance From Text for Accurate and Interpretable 3D Indoor Scene Generation [5.2] GuidedSceneGenは、メートル法的に正確で、一貫した、意味的に解釈可能な屋内シーンを生成する。
我々のアプローチは、生成プロセス全体を通して絶対的な世界座標フレームを維持します。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:46:27 GMT)
PMIScore: An Unsupervised Approach to Quantify Dialogue Engagement [4.9] エンゲージメントの信頼性は、大きな言語モデルをベンチマークしたり、人間とコンピュータの相互作用の有効性を高めたり、個人のコミュニケーションスキルを向上させるのに役立つ。
本稿では,対話エンゲージメントの定量化に有効な非教師なし手法PMIScoreを提案する。
これは、会話履歴に基づいて応答条件を生成する確率であるポイントワイド相互情報(PMI)を使用する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:05:24 GMT)
Scorio.jl: A Julia package for ranking stochastic responses [4.8] Scorio.jlはJuliaパッケージで、共有タスクへの繰り返し応答からシステムの評価とランキングを行う。
直接スコアベース、ペアワイド、サイコメトリック、投票、グラフ、リストワイドメソッドのための共通のテンソルベースのインターフェースを提供するので、同じベンチマークを複数のランク付け仮定の下で分析することができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:12:56 GMT)
Formal Abductive Explanations for Navigating Mental Health Help-Seeking and Diversity in Tech Workplaces [4.6] この研究は、IT職場環境でのメンタルヘルスの助けを求めるAI予測の理論的根拠を体系的に解明するために設計された、正式な帰納的説明フレームワークを提案する。
モデル出力に対する厳密な正当化を計算することにより、異なる精神医学的プロファイルに適したモデルの原則的な選択を可能にし、倫理的に堅牢なリコース計画の基盤となる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:17:02 GMT)
Pixel-level Scene Understanding in One Token: Visual States Need What-is-Where Composition [4.5] 実効的な視覚状態は、シーン要素とその空間的位置のセマンティックなアイデンティティを共同で符号化することで、どこにでも捉えなければならない、と我々は主張する。
我々は,グローバル・ローカルな再構築目標に基づく視覚状態表現学習フレームワークであるCroBoを提案する。
我々はCroBoを多種多様な視覚に基づくロボットポリシー学習ベンチマークで評価し、最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:32:02 GMT)
SAATT Nav: a Socially Aware Autonomous Transparent Transportation Navigation Framework for Wheelchairs [4.5] 本研究は、車いすのための社会認識自律透明交通(SAATT)ナビゲーションフレームワークを潜在的な解決策として提案する。
ユーザ意図を知らせるLarge Language Model (LLM)を実装し、ローカルコントローラの意思決定者として他人の意図を予測する。
全体として、SAATT Navは、ほとんどの社会的状況で優れており、残りの指標では同等かわずかに劣っている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:13:58 GMT)
Higher order Magnus expansions for two-level quantum dynamics [4.5] 単軸駆動下での時間依存型2レベルシステムに対するMagnusの拡張について検討する。
リー環 (mathfraksu(2)) により、拡大は可換形式に分解される。
本稿では、適切な画像変換の実施方法と、基礎となるモデルの対称性の実施方法について述べる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:12:04 GMT)
Vision-guided Autonomous Dual-arm Extraction Robot for Bell Pepper Harvesting [4.4] 本稿では,屋外環境下でのベルペッパーの自律収穫に特化して設計されたデュアルアーム移動操作システムであるVADERについて述べる。
実生100秒未満の果実の収穫成功率を60%以上とし, 実生実環境下での試験により, システムの有効性を検証した。
頑健な知覚を支援するために,屋内領域と屋外領域にまたがる3,200以上の画像からなる階層的なデータセットを構築した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:25:35 GMT)
Is Seeing Believing? Evaluating Human Sensitivity to Synthetic Video [4.4] 機械学習の進歩により、Deepfakesとして知られるリアルな合成ビデオが作成できるようになった。
ディープフェイクの普及に伴い、偽情報の急速な拡散や大衆の認識の操作に関する懸念が高まっている。
本稿では,映像の視覚的・聴覚的歪みに対する人間の反応と,深層的な視覚的・ナレーションの差を狭めることを目的とする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:00:52 GMT)
Iterative Semantic Reasoning from Individual to Group Interests for Generative Recommendation with LLMs [4.4] 勧告システムは、過去の行動からユーザの興味を学習し、関連するアイテムを提供することを目的としている。
生成レコメンデーションのための反復意味推論フレームワークを提案する。
Sports, Beauty, Toysデータセットの実験では、ISRFが最先端のベースラインより優れていることが示されている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:05:49 GMT)
Fast Uncertainty Quantification for Kernel-Based Estimators in Large-Scale Causal Inference [4.2] Bootstrapは不確実性定量化の標準ツールです。
カーネル法はサンプルサイズではあまりスケールしないことが知られている。
カーネルベースの推定器に対するブートストラップに基づく推論は、大規模設定で計算不能になる可能性がある。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:08:15 GMT)
The Reasoning Bottleneck in Graph-RAG: Structured Prompting and Context Compression for Multi-Hop QA [4.2] グラフRAGシステムは、文書を知識グラフにインデックス化することで、強力なマルチホップ質問応答を実現するが、強力な検索は強力な回答を保証しない。
検索された文脈では77%から91%の質問が金の答えを持っているが、精度は35%から78%に過ぎず、エラーの73%から84%が失敗の原因となっている。
i) SPARQLチェーン・オブ・シークレット・プロンプトは,質問をエンティティ・リレーショナル・コンテキストと整合したトリプル・パターンのクエリに分解し,(ii)グラフウォーク圧縮を行う。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:29:13 GMT)
Preconditioned Test-Time Adaptation for Out-of-Distribution Debiasing in Narrative Generation [4.2] CAP-TTAは、コンテキスト対応のLoRA更新を実行するテスト時適応フレームワークである。
また,SOTAの脱バイアス効果と同等の脱バイアス効果を保ちながら,SOTAの脱バイアス効果を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:37:23 GMT)
An Alternative Trajectory for Generative AI [4.2] 本稿では,ドメイン固有超知能に基づく代替トラジェクトリを提案する。
1つの巨大なジェネラリストモデルではなく、我々は「DSSモデルの社会」を想定する。
このパラダイムは、能力をサイズから切り離して、インテリジェンスをエネルギー集約型データセンタから、セキュアなオンデバイスエキスパートに移行することを可能にする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 22:33:28 GMT)
Understanding the Emergence of Seemingly Useless Features in Next-Token Predictors [4.1] 次点予測対象からの勾配信号のどの成分が、この現象を引き起こすかを同定する。
本稿では,これらの成分が特定の特徴の出現に与える影響を推定する手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:20:42 GMT)
Millimeter Wave Readout of a Superconducting Qubit [4.0] 本研究では,ミリ波光子と従来のトランペット量子ビットの相互作用について検討する。
我々は、1000ドル(約1万1000円)の駆動光子と100ドル(約1万1000円)以上の光子で量子ビット状態を読み出し、量子制限増幅器を使わずに99%以上の測定忠実性を達成するため、共鳴状態の遷移を計測しない。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:45:33 GMT)
Robust Sim-to-Real Cloth Untangling through Reduced-Resolution Observations via Adaptive Force-Difference Quantization [4.0] ロボット布の取り外しは、引抜き動作を接触条件や張力条件に適応させることにより、徐々に引き離される布地を必要とする。
本稿では,適応力差量子化(adaptive Force-Difference Quantization,ADQ)を提案する。
シミュレーションと実世界の布のアンハングリングの両方の実験により、ADQは生力入力を用いたポリシーよりも高い成功率を達成し、sim-to-real転送の堅牢性を示すことが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:27:07 GMT)
Analysis of Hydrogen Contamination in Al/AlOx/Al Josephson Junctions [4.0] ジョセフソン接合における水素汚染は、超伝導量子ビットにおけるデバイス間の可変性と2レベル系の損失の潜在的な原因である。
本研究では, 分子動力学シミュレーションと原子論的量子輸送計算を組み合わせることで, 酸化アルミニウムバリア中の水素について検討する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:52:13 GMT)
Front-End Ethics for Sensor-Fused Health Conversational Agents: An Ethical Design Space for Biometrics [3.9] センサデータによって提供される「客観性のイリュージョン」は、AI幻覚のリスクを増幅する。
本稿では,生体情報開示,テンポラリティモニタリング,解釈フレーム,AIスタンス,テスト可能性の5つの側面からなる設計空間を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:31:16 GMT)
Intrinsic Tolerance in C-Arm Imaging: How Extrinsic Re-optimization Preserves 3D Reconstruction Accuracy [3.9] C-arm fluoroscopyの3D再構成は、正確な内因性校正に依存している。
本研究は,外因性パラメータを再最適化することにより,高精度な復元精度を確保する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:12:05 GMT)
Exploration-assisted Bottleneck Transition Toward Robust and Data-efficient Deformable Object Manipulation [3.9] 模倣学習はロボット操作において顕著な結果を示したが、アウト・オブ・ディストリビューション(OOD)状態では失敗している。
この制限はDeformable Object Manipulation(DOM)において特に重要である。
本稿では,OOD問題に対処する新しいフレームワークであるExploration-assisted Bottleneck Transition for Deformable Object Manipulation (ExBot)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:09:53 GMT)
LDHP: Library-Driven Hierarchical Planning for Non-prehensile Dexterous Manipulation [3.8] 非包括的操作は、非構造化設定で、細く、大きく、または、その他の非移植不可能なオブジェクトを扱うのに不可欠である。
事前の計画と探索に基づく手法は、しばしばアドホックな手動設計に依存するか、物理的に実現不可能な動作を生成する。
本稿では,ライブラリ駆動型階層型プランナ(LDHP)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:54:49 GMT)
Sky2Ground: A Benchmark for Site Modeling under Varying Altitude [3.5] 高度カメラのローカライゼーション、対応学習、再構築のための3ビューデータセットであるSky2Groundを紹介した。
このデータセットは、構造化された合成画像と実際の内蔵画像を組み合わせることで、制御された多視点幾何学と現実的なシーンノイズの両方を提供する。
我々は,MASt3R,DUSt3R,Map Anything,VGGTといったアートポーズ推定モデルの状態をベンチマークし,衛星画像の使用が性能を劣化させることをよく観察する。
本研究では,衛星画像とカリキュラムベースのトレーニング戦略を組み込む際に,視界の整合性を高めるモデルであるSkyNetを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:59:19 GMT)
EVNextTrade: Learning-to-Rank-Based Recommendation of Next Charging Nodes for EV-EV Energy Trading [3.5] 電気自動車(EV)間のピアツーピアエネルギー取引は、サプライサイドレジリエンスを改善するための有望なソリューションとして、ますます研究されている。
そこで本稿では,大規模都市EVモビリティデータセットに適用した教師付きランキングフレームワークを提案する。
我々は、候補充電ノードに富んだEV走行記録に基づいて、LightGBMを含む勾配ブースト学習 to ランクモデルの評価を行った。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:33:33 GMT)
Hidden Risks of Unmonitored GPUs in Intelligent Transportation Systems [3.4] グラフィクス処理ユニット(GPU)は、多くのインテリジェントトランスポートシステム(ITS)と自動運転アプリケーションを動かすが、安全とセキュリティのためにほとんど監視されていない。
この記事では、GPUの誤用を重大な盲点として取り上げ、アンマネージドなGPUワークロードがリアルタイムのパフォーマンスを静かに低下させる様子を示しています。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:49:46 GMT)
Folding-Free Zero-Noise Extrapolation by Layout-induced Noise Diversity [3.2] ゼロノイズ外挿法(ゼロノイズ外挿法、ZNE)は、厳密な誤差境界に欠ける、広く使われているがバイアスのある誤差緩和法である。
本稿ではFolding Free Zero Noise Extrapolation (FF-ZNE)を導入する。
133キュービットのIBM量子デバイスの実験では、FF-ZNEは6%と4.5%の偏差で緩和された期待値を得ることを示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:54:42 GMT)
Effective Feature Learning for 3D Medical Registration via Domain-Specialized DINO Pretraining [3.2] 本研究は,DINO型自己教師型プレトレーニングを3次元医用画像データで直接検討する。
我々のドメイン特化事前学習は、大規模な自然画像の収集に基づいて訓練されたDINOv2モデルよりも優れています。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:14:18 GMT)
Exploiting temporal parallelism for LSTM Autoencoder acceleration on FPGA [3.2] 長期記憶オートエンコーダ(LSTM-AE)は時系列データにおける教師なし異常検出に特に有効である。
本稿では,時間並列性を利用するデータフローアーキテクチャを用いたFPGAベースの新しいアクセラレータを提案する。
当社のアクセラレータは、レイテンシのスピードアップを最大79.6倍、CPUが最大18.2倍、CPUが最大1722倍、GPUが最大59.3倍に向上します。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:23:17 GMT)
Early Rug Pull Warning for BSC Meme Tokens via Multi-Granularity Wash-Trading Pattern Profiling [3.1] 分散型金融(DeFi)におけるミームトークンの高頻度発行と短サイクル投機は、ルーグプルリスクを著しく増幅した。
既存のアプローチは、わずかな異常、不完全なラベル、限定的な解釈可能性の下で安定した早期警告を提供するのに依然として苦労している。
この問題に対処するために、データセットの構築とラベル付け、ハッシュトレーディングパターンの特徴モデリング、リスク予測、エラー解析の4段階からなるBSCミームトークンに対して、エンドツーエンドの警告フレームワークが提案されている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:25:42 GMT)
Multi-Modal Character Localization and Extraction for Chinese Text Recognition [3.0] 本稿では,各文字を明示的に分離し,文字を独立に認識するLERという新しい手法を提案する。
LERは、中国語の複雑な内部構造を考慮し、テキスト予測結果を提供する。
6つの英語のベンチマークとUnion14Mベンチマークで実施された実験は、LERによる英語のテキスト認識において印象的な結果を示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:53:47 GMT)
FLUX: Data Worth Training On [3.0] FLUXは、厳格な品質管理を行いながらトークン保持を最大化するように設計された、Webスケールのデータ前処理パイプラインである。
60BトークンでFLUXでトレーニングされたモデルは32.14%のMMLU精度を達成し、以前の最先端パイプラインDCLM (31.98%) を上回り、FineWeb (29.88%) をはるかに上回っている。
FLUX-Baseは192Bのトークンを出力し、FineWebの170Bを超える。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:56:52 GMT)
GRPO and Reflection Reward for Mathematical Reasoning in Large Language Models [2.9] 本研究では,グループ相対政策最適化とリフレクション報酬機構を統合し,自己回帰能力を高める4段階のフレームワークを提案する。
実験の結果,リフレクション強化トレーニングによるGRPOの最先端性能を実証し,リフレクション報酬が重要な役割を担っていることを確認した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:24:13 GMT)
Audo-Sight: AI-driven Ambient Perception Across Edge-Cloud for Blind and Low Vision Users [2.9] Audo-Sightは、BlindとLow-Vision(BLV)の個人が音声による対話を通じて周囲を知覚できるAI駆動の補助システムである。
Audo-Sightは専門家と汎用AIエージェントのセットを採用しており、それぞれがエッジとクラウドに分散した専用の処理パイプラインによってサポートされている。
Response Fusion Engineは、高速エッジ応答をより正確なクラウド出力と融合し、BLVユーザにタイムリーかつ高精度な応答を保証する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:30:04 GMT)
GelSphere: An Omnidirectional Rolling Vision-Based Tactile Sensor for Online 3D Reconstruction and Normal Force Estimation [2.8] 本稿では,球面型触覚センサであるGelSphereについて紹介する。
従来の視覚ベースの触覚センサーは、局所的にしか感知できず、表面を横切ると損傷を受けます。
センサーはWi-Fi経由で触覚画像をストリームする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:22:52 GMT)
When Should Humans Step In? Optimal Human Dispatching in AI-Assisted Decisions [2.8] 我々は,人間-AI協調のための一般的な意思決定理論の枠組みを提案する。
我々は、AIアセスメントを要因レベルの信号として扱い、人間の判断を、選択的に取得できるコストの高い情報として扱う。
当社のフレームワークをAI支援ピアレビューに適用する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:47:38 GMT)
ToolFlood: Beyond Selection -- Hiding Valid Tools from LLM Agents via Semantic Covering [2.7] 本稿では,ツール拡張型Large Language Model (LLM)エージェントに対する検索層攻撃であるToolFloodを紹介する。
検索後にどのツールが選択されるかを変更するのではなく、ToolFloodは、いくつかのアタッカー制御ツールを注入することで、検索自体を圧倒する。
ToolFloodは、95%のアタック成功率と低インジェクション率を実現している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:54:49 GMT)
NVRNet: Deep Learning Model for Fast Nitrogen Vacancy Characterization under Room Temperature [2.6] NVRNetは物理インフォームド・シミュレーション・トゥ・リアリティー・パイプラインである。
これは、ノイズの多いラムゼイ光発光跡の高速な取得をノイズ化された波形にマッピングする。
これは超微細結合を環境中の13mathrmC$スピンに推定する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 22:20:57 GMT)
D-Compress: Detail-Preserving LiDAR Range Image Compression for Real-Time Streaming on Resource-Constrained Robots [2.6] D-Compressは、リアルタイムストリーミングのための新しいディテール保存と高速レンジ画像圧縮フレームワークである。
最新技術 (SOTA) 圧縮法は, 幾何的精度と下流タスク性能の両方で優れる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:15:25 GMT)
The Phenomenology of Hallucinations [2.6] 言語モデルが幻覚の原因となるのは、不確実性の検出に失敗するだけでなく、出力生成への統合に失敗するためである。
アーキテクチャ全体では、不確実な入力が確実に特定され、2-3$timesの高次元領域を実数入力の本質的な次元として占有する。
しかし、この内部信号は出力層と弱い結合であり、不確実性は低感度な部分空間に移行し、幾何学的に増幅されるが機能的にサイレントになる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:55:55 GMT)
R3-REC: Reasoning-Driven Recommendation via Retrieval-Augmented LLMs over Multi-Granular Interest Signals [2.5] 本稿では,R3-REC(Reasoning-Retrieval-Recommendation)を提案する。これは,ユーザインテント推論,アイテムセマンティック抽出,ロングショート興味極性マイニング,類似ユーザコラボレーションの強化,およびReasoningに基づく関心マッチングとスコアリングを統一する,プロンプト中心のフレームワークである。
ML-1M、Games、 Bundleの他、R3-RECは強力なニューラルネットワークとLLMベースラインを一貫して越え、管理可能なエンドツーエンドレイテンシで+10.2%(HR@1)と+6.4%(HR@5)の改善を実現している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:14:36 GMT)
MICRO: A Lightweight Middleware for Optimizing Cross-store Cross-model Graph-Relation Joins [Technical Report] [2.4] 本稿では,グラフストアとリレーショナルストア間のクロスモデル結合クエリのクラスを正式に定義する。
MICROの中核であるCMLeroは、正確なコスト見積を必要とせずに効率的な実行計画を選択する学習からランクベースのクエリである。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:41:40 GMT)
H-RINS: Hierarchical Tightly-coupled Radar-Inertial Navigation via Smoothing and Mapping [2.4] ミリ波レーダーは、視覚的に劣化した環境で堅牢な知覚を提供する。
レーダー慣性状態推定は本質的にドリフトの影響を受けやすい。
本稿では,密結合型階層型レーダ慣性係数グラフフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:30:49 GMT)
LineMaster Pro: A Low-Cost Intelligent Line Following Robot with PID Control and Ultrasonic Obstacle Avoidance for Educational Robotics [2.3] LineMaster ProはArduino Nanoプラットフォーム上で実装された、インテリジェントで低コストなラインフォローロボットである。
PIDの実装は従来のオンオフ制御よりも43%改善されている。
LineMaster Proは商用版に比べて94%のコスト削減を実現している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:42:48 GMT)
Evaluating Semantic Fragility in Text-to-Audio Generation Systems Under Controlled Prompt Perturbations [2.3] 小さな言語的変化は、生成された音声にかなりの変化をもたらし、実用的な使用における信頼性への懸念を引き起こす可能性がある。
制御された即時摂動下でのテキスト・音声システムの意味的不安定性を評価する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:12:40 GMT)
Gated Graph Attention Networks for Predicting Duration of Large Scale Power Outages Induced by Natural Disasters [2.1] グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Unit)を統合し,複雑な空間特性を捉えるグラフベースニューラルネットワークモデルを開発した。
本研究では,米国南東部の6大ハリケーンの大規模停電データを用いて,誘導学習の手法の評価を行った。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:24:24 GMT)
NepTam: A Nepali-Tamang Parallel Corpus and Baseline Machine Translation Experiments [2.1] この研究は、20Kの金標準パラレルコーパスであるNepTam20Kと80Kの合成ネパール・タングパラレルコーパスであるNepTam80Kを開発した。
データセットはネパールのニュースやオンラインソースからのデータスクレーピングを含むパイプラインを通じて作成された。
このデータセットは、農業、健康、教育と技術、文化、一般コミュニケーションの5つの領域をカバーしている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:48:00 GMT)
QTrack: Query-Driven Reasoning for Multi-modal MOT [2.0] マルチオブジェクトトラッキング(MOT)は、伝統的に、ユーザーが特定したターゲットを選択的に推論することなく、ビデオ内のすべてのオブジェクトを推定することに重点を置いてきた。
本稿では,自然言語クエリに規定された時間的推論問題としてトラッキングを定式化する,クエリ駆動型トラッキングパラダイムを提案する。
本稿では、マルチモーダル推論とトラッキング指向のローカライゼーションを統合した、エンドツーエンドの視覚言語モデルQTrackを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:11:36 GMT)
Unlinkability and History Preserving Bisimilarity [2.0] 本稿では,攻撃者によって区別できない行為を同一視する関係を用いて,「リンク不能」なプライバシ特性について検討する。
我々は、分岐時間同値を用いて観測可能な攻撃を見逃すことでトレース等価性が知られているプロトコルに焦点を当てる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:41:38 GMT)
Align Forward, Adapt Backward: Closing the Discretization Gap in Logic Gate Networks [1.9] ニューラルネットワークモデルでは、固定された候補コンポーネント(ロジックゲートやサブネットワークなど)のソフトミックスが、安定した最適化のためのトレーニングにしばしば使用される。
適応性からフォワードパス構成(ハードセレクション対ソフトミックス)を分離することにより、このギャップを解析する(ガンベルノイズなしで)。
Gumbel-STはトレーニングが成功するとほぼゼロのギャップを達成できるが、低温では精度が低下する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:45:00 GMT)
EchoLVFM: One-Step Video Generation via Latent Flow Matching for Echocardiogram Synthesis [1.7] 本稿では,1段階の遅延ビデオフローマッチングフレームワークであるEchoLVFMを紹介する。
潜時空間で動作するEchoLVFMは、時間的にコヒーレントなビデオを単一の推論ステップで合成する。
その結果、競争力のあるビデオ品質、強いEFの定着、および専門医による57.9%の識別精度が示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:39:09 GMT)
Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks [1.7] 単純なトリガー条件の計算は、必ずしもソフトマックス自己注意モデルにおけるシンクを誘導する。
確率的単純性に対する正規化は、デフォルトの状態を実現するために、安定なアンカーに注意を向ける必要がある。
また、非正規化ReLU注意がシンクなしで同じ課題を解決できることを証明し、正規化制約がシンク動作の基本的な要因であることを確認した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:59:57 GMT)
Ransomware and Artificial Intelligence: A Comprehensive Systematic Review of Reviews [1.7] この研究は、AIがランサムウェアの検出、予防、緩和戦略をどのように変えているかについての洞察を集める。
この結果は、複数の分析手法を組み合わせたハイブリッドモデルの有効性を浮き彫りにした。
ランサムウェア防衛における重要な課題として、AI駆動検出システムを欺くように設計されたテクニックなどを検討する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:39:39 GMT)
Testing with AI Agents: An Empirical Study of Test Generation Frequency, Quality, and Coverage [1.7] 本研究では,AIDevデータセットを用いたエージェントベースコーディングツールによるテスト生成の実験的検討を行った。
テスト関連変更を含む2,232件のコミットを抽出し,テスト追加頻度,生成したテストの構造特性,コードカバレッジへの影響の3つの側面を検討した。
その結果,(i)AIは,実世界のリポジトリにテストを追加するコミットの16.4%を作成した。(ii)AI生成テストメソッドは,より長いコードと高いアサーション密度を特徴とする構造パターンを示し,(iii)AI生成テストは,人手によるテストに匹敵するコードカバレッジに寄与していることがわかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:01:44 GMT)
Data-driven Progressive Discovery of Physical Laws [1.6] シンボリック回帰の連鎖 (Chain of Symbolic Regression, CoSR) は、物理法則の発見を象徴的知識の連鎖としてモデル化する新しい枠組みである。
CoSRはケプラーの第3法則から古典力学における普遍重力法則への進歩的な発見経路を完全に再カプセル化する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:03:49 GMT)
Block-QAOA-Aware Detection with Parameter Transfer for Large-Scale MIMO [1.6] 本稿では,Block-QAOA-Aware MIMO Detector (BQA-MD)を提案する。
特に、BQA-MDは、QRドメインにおけるブロックQAOA対応プリプロセッシング、標準一貫性のブロックワイド5G NR Gray-HUBOインタフェース、MMSEによる動的正規化ブロックワイド目的を組み合わせている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:24:20 GMT)
Low-Field Magnetic Resonance Image Quality Enhancement using Undersampled k-Space and Out-of-Distribution Generalisation [1.4] アンサンプされた低磁場MRIk空間から直接高磁場MRI像を再構成する新しい枠組みを提案する。
この研究は、低磁場MR画像再構成、アンダーサンプルk空間による品質向上、統一されたフレームワークにおける不確実な定量化を組み込んだ最初のものの一つである。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:11:30 GMT)
FMS$^2$: Unified Flow Matching for Segmentation and Synthesis of Thin Structures [1.3] 2つのモジュールを持つフローマッチングフレームワークであるFMS$2$を提案する。
SegFlowは標準的なエンコーダ/デコーダのバックボーン上に構築された2.96Mパラメータセグメンテーションモデルである。
SynFlowはマスク付きマスク$rightarrow$イメージジェネレータで、ピクセル対応の合成イメージマスクペアを生成する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:04:25 GMT)
Bootstrapped Physically-Primed Neural Networks for Robust T2 Distribution Estimation in Low-SNR Pancreatic MRI [1.3] 本稿では,ロバストな分布T2推定のためのブートストラップに基づく推論フレームワークを提案する。
提案手法では, 推定時間ブートストレッピングを用いて, ノイズアーティファクトの滑らか化と, 基礎となる緩和分布への忠実度の向上を図る。
これらの結果から,低SNR腹部造影像における定量的T2緩和法の有用性が示唆された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:10:46 GMT)
Low-Field Magnetic Resonance Image Enhancement using Undersampled k-Space [1.3] 超解像低磁場MR画像に対して,k空間で直接動作するU-Net変種に基づく新しいディープラーニングフレームワークを提案する。
本結果から, アンサンプ付きk空間再構成は, 完全k空間獲得に匹敵する品質を実現することが示された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:25:46 GMT)
MapReplay: Trace-Driven Benchmark Generation for Java HashMap [1.2] アプリケーションベンチマークのリアリズムとマイクロベンチマークの効率を組み合わせたベンチマーク手法であるMapReplayを提案する。
MapReplayをDaCapo-ChopinとRenaissanceに適用すると、結果のスイートであるMapReplayBenchがアプリケーションレベルのパフォーマンストレンドを再現する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:46:09 GMT)
DualSwinFusionSeg: Multimodal Martian Landslide Segmentation via Dual Swin Transformer with Multi-Scale Fusion and UNet++ [1.2] モーダリティ固有の特徴抽出を分離し,マルチスケールのクロスモーダル融合を行うマルチモーダルセグメンテーションアーキテクチャであるDualSwinFusionSegを提案する。
このモデルは2つの並列Swin Transformer V2エンコーダを使用して、RGBと補助的な物理入力を独立に処理し、階層的な特徴表現を生成する。
PBVS 2026 Mars-LS ChallengeによるMMLSv2データセットの実験では、モダリティ固有のエンコーダと単純な結合に基づく融合により、限られた訓練データの下でのセグメンテーション精度が向上した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:42:14 GMT)
Collapse or Preserve: Data-Dependent Temporal Aggregation for Spiking Neural Network Acceleration [1.2] スパイク空間は、GPUハードウェア上で効率的なスパイクニューラルネットワーク(SNN)推論を可能にすると広く信じられている。
SIMDアーキテクチャは2進スパイクの微細で非構造的な空間を利用できない。
本稿では、畳み込み線形性を利用して1回の畳み込みコールの前に$K$スパイクフレームをプリアグリゲートする時間的集約畳み込み(TAC)を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:30:22 GMT)
Concisely Explaining the Doubt: Minimum-Size Abductive Explanations for Linear Models with a Reject Option [1.1] 医療やファイナンスといった重要な領域では、証拠が不十分な場合にモデルを棄却するオプションがある。
これらの設定では、説明は解釈可能であるだけでなく、基礎となるモデルに忠実でなければならない。
本研究では,線形モデルに対する最小サイズの帰納的説明をリジェクションオプションで計算することで,これらの研究の行を橋渡しする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:45:37 GMT)
Quantum-Enhanced Vision Transformer for Flood Detection using Remote Sensing Imagery [1.1] 本稿では,量子コンピューティングの表現的特徴抽出機能と変換器のグローバルな文脈認識性を相乗化する新しい量子拡張ビジョン変換器(ViT)を提案する。
リモートセンシング画像を用いて、並列経路、ViTバックボーン、量子分岐を介して入力を処理するハイブリッドアーキテクチャを開発した。
その結果、提案されたハイブリッドモデルは古典的なViTベースラインを大きく上回り、全体的な精度は84.48%から94.47%に向上し、F1スコアは0.841から0.944に向上した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:48:45 GMT)
Facial beauty prediction fusing transfer learning and broad learning system [1.1] 顔の美しさ予測(FBP)は、コンピュータビジョンと機械学習の分野で重要かつ困難な問題である。
FBP の精度は E-BLS と ER-BLS により向上し, 提案手法の有効性と優位性を示した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:59:17 GMT)
Fusion Learning from Dynamic Functional Connectivity: Combining the Amplitude and Phase of fMRI Signals to Identify Brain Disorders [1.0] 静止状態磁気共鳴画像(fMRI)から誘導される動的機能接続(dFC)は脳科学研究で広く利用されている。
本稿では,fMRI信号の振幅情報と位相情報を統合して脳疾患の検出を改善する手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:57:17 GMT)
Towards Agentic Honeynet Configuration [0.9] ハニーポット(Honeypots)は、脅威情報を集めるために脆弱なサービスをエミュレートする詐欺システムである。
実践的ネットワークと計算資源では、露出可能なハニーポットの数を制限する。
この研究は、進行中の攻撃に対して、ハニーポットの露光を自律的に管理するAI駆動のエージェントアーキテクチャを調査する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:15:49 GMT)
Brain Tumor Classification from 3D MRI Using Persistent Homology and Betti Features: A Topological Data Analysis Approach on BraTS2020 [0.8] トポロジカルデータ解析に基づく脳腫瘍分類のためのトポロジ駆動フレームワークを提案する。
我々はBraTS 2020データセットからFLAIR(Fluid Attenuated Inversion Recovery)の画像を分析した。
脳腫瘍構造の基礎となるトポロジを要約した100のトポロジ的特徴のコンパクトなセットを導出する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:44:38 GMT)
Close to Reality: Interpretable and Feasible Data Augmentation for Imbalanced Learning [0.8] データ拡張のための決定述語グラフ(DPG-da)は,学習モデルから解釈可能な決定述語を抽出するフレームワークである。
合成および実世界のベンチマークデータセットの実験では、DSG-daは従来のオーバーサンプリング手法よりも常に分類性能を改善している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:53:18 GMT)
Dual-Strategy Improvement of YOLOv11n for Multi-Scale Object Detection in Remote Sensing Images [0.8] 本稿では,リモートセンシング画像におけるYOLOv11nモデルの検出精度の低下に対処する2つの改善手法を提案する。
金-YOLO構造をネックネットワークに組み込んでマルチスケールな特徴融合を実現する。
マルチSEAMヘッド検出ヘッドを組み合わせることで、小型・マルチスケールオブジェクトの表現と検出能力をさらに強化する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:24:32 GMT)
Bidirectional Cross-Attention Fusion of High-Res RGB and Low-Res HSI for Multimodal Automated Waste Sorting [0.7] 本稿では,高分解能なRGBと低分解能なHSIを,局所的,双方向なクロスアテンションを介してネイティブグリッドで整列させるBi Cross-Attention Fusion (BCAF)を提案する。
BCAFは31画像/sで76.4% mIoU、55画像/sで75.4% mIoUの最先端性能を達成した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:21:36 GMT)
Distributed Acoustic Sensing for Urban Traffic Monitoring: Spatio-Temporal Attention in Recurrent Neural Networks [0.7] 本研究では,スペイン・グラナダで実世界のDASによる交通監視実験を行った。
リカレントニューラルネットワーク(RNN)は、イベント内およびイベント間の時間依存性をモデル化するために使用される。
アテンション・ヒートマップは、情報的空間的位置と時間的セグメントを強調することによって、物理的に意味のある解釈を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:30:39 GMT)
MSNet and LS-Net: Scalable Multi-Scale Multi-Representation Networks for Time Series Classification [0.7] 時系列分類(TSC)のパフォーマンスは、アーキテクチャ設計だけでなく、入力表現の多様性にも依存する。
構造化多表現入力を体系的に統合するスケーラブルなマルチスケール畳み込みフレームワークを提案する。
我々は、ロバスト性とキャリブレーションに最適化された階層型マルチスケール畳み込みネットワークであるMSNetと、効率を意識したデプロイメント用に設計された軽量なLS-Netの2つのアーキテクチャを紹介する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:51:01 GMT)
Solving physics-constrained inverse problems with conditional flow matching [0.7] 本稿では,物理制約付き逆問題に対する条件付きフローマッチングフレームワークを提案する。
ニューラルネットワークは、確率フロー常微分方程式の速度場を学習するために訓練される。
オーバートレーニングは生成した条件分布の振る舞いを誘導できることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:43:48 GMT)
Quantum electrometry in a silicon carbide power device [0.5] SiCのシリコン空孔(Vsi)は、高バイアスSiCデバイス内の様々な方向に印加された電界を検出するのに優れた特性を有する。
Vsiは、電場成分(Epara)と垂直(Eperp)にc軸に平行な反応を示す。
キャリヤ濃度が典型的である4H-SiCの破壊電界の90%にあたる2.3 MV/cmの高電界検出を確認した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:44:28 GMT)
Enhancing Mental Health Classification with Layer-Attentive Residuals and Contrastive Feature Learning [0.5] メンタルヘルスの分類を改善するための表現に焦点を当てた新しい枠組みを提案する。
textbf74.36%のスコアで、提案手法はSWMHベンチマークで最高のパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:42:51 GMT)
CMHL: Contrastive Multi-Head Learning for Emotionally Consistent Text Classification [0.5] CMHLは、感情の論理構造を明示的にモデル化する新しい単一モデルアーキテクチャである。
125Mのパラメータで、このモデルは56倍のLLMとsLMのアンサンブルより優れています。
我々の研究は、アーキテクチャインテリジェンス(パラメータカウントではない)がテキスト感情分類の進歩を促進することを証明している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:47:44 GMT)
UVLM: A Universal Vision-Language Model Loader for Reproducible Multimodal Benchmarking [0.4] 本稿では、Google ColabベースのフレームワークであるUVLMを紹介し、カスタム画像解析タスク上でVLMアーキテクチャをロード、数値、ベンチマークするための統一インターフェースを提供する。
UVLMはLLaVA-NeXTとQwen2.5-VLという2つの主要なモデルファミリをサポートしている。
主な機能として、4つのレスポンスタイプをサポートするマルチタスクプロンプトビルダー、多数決に基づくコンセンサス検証機構、フレキシブルトークン予算、ベンチマーク用のチェーンオブシンク参照モードがある。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:07:42 GMT)
AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision [0.4] 複数のチームが独立してフィールドデータセットを収集する、データ中心の競争フレームワークであるAgrI Challengeを紹介します。
個別に収集したデータセット間のクロスドメイン一般化を体系的に評価するために,クロスチーム検証(CTV)を提案する。
CTVには、単一ソースの一般化を測定するTrain-on-One-Team-Only(TOTO)と、協調的なマルチソーストレーニングを評価するLeave-One-Team-Out(LOTO)の2つの補完プロトコルが含まれている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 23:10:50 GMT)
Collective Nuclear Polaritons with Coherent and Tunable Excitation Dynamics [0.4] 本研究では,229Th核アンサンブルと4波混合により発生する真空紫外キャビティモードを混成した集合核偏光子を提案する。
強い結合状態において、システムは真空のラビ振動を示し、空洞光子と核励起のハイブリッド化を示す。
本研究は, キャビティ媒介核偏光子により, 核系における決定論的寿命工学とコヒーレント量子記憶が可能となることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:46:44 GMT)
Is the reconstruction loss culprit? An attempt to outperform JEPA [0.4] 我々は,JEPAスタイルの予測表現学習と再構成に基づくオートエンコーダを比較検討した。
予測可能なコンポーネントを選択することを学ぶゲート付き予測オートエンコーダを導入する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:39:56 GMT)
Practical Limits to Single-Mode Vacuum Squeezing in a SNAIL Parametric Amplifier [0.4] 縮退パラメトリック増幅器におけるカー誘起歪み制限のスクイーズ化に対する事前の期待により、我々は外部フラックスとポンプパワーを変化させ、カーの非線形性が理論的に最小となる操作点を探索した。
その結果,スキューズ周波数が固定された実用アプリケーションでは,Kerrは2倍程度可変であり,達成可能なスキューズはKerrに有意な依存を示さなかった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:22:24 GMT)
FedPBS: Proximal-Balanced Scaling Federated Learning Model for Robust Personalized Training for Non-IID Data [0.3] フェデレートラーニング(FL)は、分散クライアントのセットで、機械学習モデルを共同でトレーニングすることを可能にする。
我々はこれらの課題に対処するために、FedBSとFedProxの相補的なアイデアを結合するFLアルゴリズムであるFedPBSを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:44:27 GMT)
Leveraging a Statistical Shape Model for Efficient Generation of Annotated Training Data: A Case Study on Liver Landmarks Segmentation [0.2] 本稿では,手動でラベル付けされた平均形状に基づいて,統計的形状モデル(SSM)を用いて,大規模な注釈付きデータセットを作成するための新しい戦略を提案する。
専門的なディープラーニングネットワークは、SSMによって生成される8,800個の注釈付き肝臓形状で訓練された。
ネットワークの性能は500個の見当たらない合成SSM形状で評価され、平均91.4%のインターセクションが得られた。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 14:49:55 GMT)
A Highly Sensitive Diamond NV Magnetometer Using Ramsey Interferometry with a Short Sensor-to-Sample Distance [0.2] 本研究では,センサ間距離が短いラムゼー干渉計を用いたダイヤモンド量子磁気センサを開発した。
この開発はラムゼー干渉法に基づく実用的生体磁気応用に不可欠である。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:03:07 GMT)
Locally Linear Continual Learning for Time Series based on VC-Theoretical Generalization Bounds [0.2] SyMPLERは、非定常環境での時系列予測のための説明可能なモデルである。
他の局所線型モデルとは異なり、SyMPLERは統計学習理論からの有界一般化を使用して、新しい局所モデルを追加するタイミングを自動的に決定する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:48:02 GMT)
Switching Coordinator: An SDN Application for Flexible QKD-Networks [0.2] スイッチング機能を備えたQKDネットワークの監視・制御フレームワークを開発した。
QKDモジュールのスイッチング機能、QKDリンクのバッファキューに格納されるキー数、キーの生成と消費率など、重要なデータを抽出する。
一方、ソフトウェア定義のネットワークアプリケーションは、収集した情報で動作し、ネットワークの暗号的ニーズに対処することができる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:35:04 GMT)
Multifidelity Surrogate Modeling of Depressurized Loss of Forced Cooling in High-temperature Gas Reactors [0.2] 多忠実サロゲートモデルは、様々な解像度のシミュレーションからの情報を組み合わせることでコスト削減のアプローチを提供する。
CFDモデルがアンシスフルエントで開発され、各忠実度レベルで1000のシミュレーションサンプルが生成される。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 22:20:05 GMT)
Schrödinger Bridge Over A Compact Connected Lie Group [0.1] この研究は、コンパクト連結リー群上のキネマティック方程式に対するシュルディンガー橋問題を研究する。
我々は、リー群の基底となる幾何学的構造を尊重するこの最適制御問題の座標自由な定式化を開発する。
この結果は、リー群上で支持される確率密度を最適に補間する幾何学的コントローラを導出する構成的である。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:40:59 GMT)
GreCon3: Mitigating High Resource Utilization of GreCon Algorithms for Boolean Matrix Factorization [0.1] 形式的概念分析(FCA)はBMFとアルゴリズムの設計に不可欠な洞察を与えてくれる。
GreConとGreCon2のアルゴリズムは、高メモリ消費と長時間実行のコストで、高品質な因数分解を提供する。
我々はこれらのアルゴリズムの大幅な改訂であるGreCon3を導入し、計算効率とメモリ使用量の両方を大幅に改善した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 05:47:56 GMT)
GhanaNLP Parallel Corpora: Comprehensive Multilingual Resources for Low-Resource Ghanaian Languages [0.1] ガーナのイニシアチブは、Twi、Fante、Ewe、Ga、Kusaal言語向けに41,513のパラレル文ペアを開発し、キュレートした。
これらのコーパスは、機械翻訳、音声技術、言語保存を含む研究、教育、商業的応用を支援するように設計されている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:49:05 GMT)
The GELATO Dataset for Legislative NER [0.1] 本稿では、第118議会の下院および上院法案のデータセットであるGELATOを紹介する。
我々は、このデータセット上で異なるアーキテクチャとサイズを持つ変換器ベースモデル(BERT、RoBERTa)をファーストレベルの予測のために微調整する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:32:36 GMT)
When the Loop Closes: Architectural Limits of In-Context Isolation, Metacognitive Co-option, and the Two-Target Design Problem in Human-LLM Systems [0.0] マルチモーダル・プロンプト・エンジニアリング・システムを利用する単体物体の詳細なオートエスノグラフィーケーススタディを報告する。
システム完了から48時間以内に、観測可能な行動変化のカスケードが発生した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:06:57 GMT)
True 4-Bit Quantized Convolutional Neural Network Training on CPU: Achieving Full-Precision Parity [0.0] 本稿では,コモディティCPU上での標準PyTorch演算を用いて,真の4ビット精度で畳み込みニューラルネットワークを訓練する方法を提案する。
本稿では, 対称量子化, 動的層間スケーリング, ストレートスルー推定器と組み合わせて, 安定収束と競争精度を実現する, タンフベースのソフトウェイトクリッピング手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:03:11 GMT)
Traffic and weather driven hybrid digital twin for bridge monitoring [0.0] 既存の交通カメラと天気予報APIを用いたブリッジ条件監視のためのハイブリッドデジタルツインフレームワークが提案されている。
このフレームワークは3つのほぼリアルタイムストリームを融合させる。ブリッジデッキカメラからのYOLOv8コンピュータビジョンは、車両数、交通密度、ロードプロキシを推定する。
このフレームワークは、過酷な気候下での老朽化した高交通量橋の費用対効果予測維持に既存のインフラを活用することを実証している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:03:30 GMT)
The Institutional Scaling Law: Non-Monotonic Fitness, Capability-Trust Divergence, and Symbiogenetic Scaling in Generative AI [0.0] 環境依存的最適N*(エプシロン)を用いたモデルスケールにおける施設適合性は非単調であることを示す。
我々は、ドメイン固有モデルの編成されたシステムがフロンティア・ジェネラリストを上回る性能を発揮することを示すシンビオジェネティック・スケーリングの補正を導出する。
機関スケーリング法(Institutional Scaling Law)は、次のフェーズ移行は、より大きなモデルではなく、特定の機関ニッチに適合するドメイン固有モデルのより整合したシステムによって行われると予測している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:25:48 GMT)
Spectral Edge Dynamics of Training Trajectories: Signal--Noise Geometry Across Scales [0.0] 本稿では,この構造を測定するためにEmphSpectral Edge Dynamics (SED)を導入する。
共同作業では、同じスペクトル幾何学がグラッキングの早期警戒信号を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:46:05 GMT)
Soft Mean Expected Calibration Error (SMECE): A Calibration Metric for Probabilistic Labels [0.0] 予測エラー(ece)は機械学習における主要なキャリブレーション指標である。
smeceはラベルがバイナリであるときに正確にEceに還元するので、厳密な一般化になる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:33:53 GMT)
Six Interventions for the Responsible and Ethical Implementation of Medical AI Agents [0.0] 大規模言語モデル(LLM)ベースのAIエージェントは、すぐに、制限された、あるいはリアルタイムな人間の監視なしに、医療的な意思決定に参加するかもしれない。
このシフトは、臨床責任が自律システムにまで及ぶ場合に、医療倫理の中核となる原則をどのように支持できるかという根本的な疑問を提起する。
本稿では,6つの実践的介入からなる医療AIエージェントのための倫理設計フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:28:59 GMT)
Sharpness Aware Surrogate Training for Spiking Neural Networks [0.0] サロゲート勾配はスパイキングニューラルネットワーク(SNN)を訓練するための標準ツールである
しかし、従来のハードフォワードまたはサロゲート後方トレーニングは、偏りのある推定器を備えた非滑らかなフォワードモデルである。
後方プロパゲーションにより訓練した前方SNNに対して,シャープネス・アウェア・サロゲート・トレーニング(SAST)を適用し,シャープネス・アウェア・サロゲート・トレーニング(SAM)を適用した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:26:26 GMT)
Script-to-Slide Grounding: Grounding Script Sentences to Slide Objects for Automatic Instructional Video Generation [0.0] 本稿では,S2SG(Script-to-Slide Grounding)を提案する。
最初のステップとして,大言語モデル(LLM)を用いてテキストオブジェクトのグラウンド処理を行う「Text-S2SG」を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:39:01 GMT)
Sat-JEPA-Diff: Bridging Self-Supervised Learning and Generative Diffusion for Remote Sensing [0.0] Sat-JEPA-Diffは自己監督学習(SSL)と隠れ拡散モデル(LDM)を組み合わせる
IJEPAモジュールは安定したセマンティック表現を予測し、凍結した安定拡散バックボーンを軽量なクロスアテンションアダプタを介してルーティングする。
グローバルなSentinel-2データセットに基づいて評価されたSat-JEPA-Diffは、シャープな境界の解決に優れている。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:30:49 GMT)
SVD Contextual Sparsity Predictors for Fast LLM Inference [0.0] 本稿では,大規模言語モデル(LLM)におけるReGLUベースのフィードフォワードネットワーク(FFN)の推論を高速化するためのフレームワークを提案する。
実験では、複雑な数学やコード生成を含むタスクにおけるベンチマークスコアの1%未満の劣化を維持しながら、エンドツーエンドのデコーディング時間を1.8倍に削減した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:36:13 GMT)
ReqToCode: Embedding Requirements Traceability as a Structural Property of the Codebase [0.0] 本稿では,トレース可能なシステム要素を直接システムに埋め込むことによって,トレースの劣化を防止する手法であるReqToCodeを紹介する。
アプローチ、アーキテクチャ原則、トレーサブルライフサイクルを説明し、要求定義、アーティファクト生成、コード統合、ビルド時の検証を対象とする一般的な例で説明します。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:00:09 GMT)
Repetition Without Exclusivity: Scale Sensitivity of Referential Mechanisms in Child-Scale Language Models [0.0] 子ども指向音声で訓練された言語モデルにおいて、相互排他性は参照抑制として機能する。
子指向音声における分布学習は、語彙的排他性よりも反復に基づく参照追跡を生成する。
我々は、参照グラウンドディングは、ナチビストではなく、必要な入力構造に関する実証的な主張であるMEにとって必要な要素であるかもしれないと論じる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:59:50 GMT)
RSEdit: Text-Guided Image Editing for Remote Sensing [0.0] 一般ドメインのテキスト誘導画像エディタは、強力なフォトリアリズムを実現するが、アーティファクトを導入し、幻覚オブジェクトを導入し、リモートセンシング(RS)画像の正書法的制約を破る。
本稿では、事前訓練されたテキスト・画像拡散モデルを命令追従RSエディタに適応させる統合フレームワークRSEditを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:22:02 GMT)
Quotient Geometry and Persistence-Stable Metrics for Swarm Configurations [0.0] 群と星座再構成は、周囲空間における無秩序な点構成の運動と見なすことができる。
マルチエージェント構成データの比較とモニタリングを行うために、永続安定な対称性不変幾何表現を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:47:16 GMT)
Quantum Dynamical Entropy and non-Markovianity: a collisional model perspective [0.0] 多重時間相関は量子過程の理論とAlicki-Lindblad-Fannes動的エントロピー(略してALFエントロピー)の基礎を形成する
有限レベル系の散逸ダイナミクスが無限古典スピン鎖への結合によって得られる衝突モデルの場合、ALFエントロピーは明示的に計算できる。
環境の統計的性質を特徴づけるパラメータに依存することが判明し、オープン量子系におけるメモリ効果の活性化とスーパーアクティベーションに関連があることが判明した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:39:38 GMT)
Quantum Dynamical Entropy and Dissipative Information Flows [0.0] Alicki-Lindblad-Fannes dynamical (ALF)エントロピーは、量子系に関する新しい情報が収集される速度を測定する。
本研究では,環境からの情報のバックフローの指標として,ALFエントロピーの量子力学への拡張を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:55:57 GMT)
Quantum Correlations and Entanglement in Generalized Dicke-Ising Models [0.0] 高Qキャビティ内の量子システムは、光によって誘起される創発対称性の制御に優れたテストベッドを提供する。
新たに開発したLight-Matter DMRGアルゴリズムを用いて,創発的スーパーラジアントモードの特性について検討する。
長距離秩序とマグノン対を持つ量子スピンネマティック状態は、超ラジアント相への遷移が起こると現れる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:54:15 GMT)
Precautionary Governance of Autonomous AI: Legal Personhood as Functional Instrument [0.0] 記事は、高度なAIシステムのための機能的なガバナンス手段として、限定的な法的人格を推進している。
このアーキテクチャでは、AIシステムが人間制御の保持構造内に埋め込まれた目的に縛られたオペレーティング企業を介して運用される2層企業アーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:38:19 GMT)
Phononic Bragg Reflectors for Thermal Insulation of Scalable Cryogenic Control Electronics from Qubits [0.0] 本稿では, ブロードバンド型分散ブラッグリフレクタを低温電子回路と量子ビットチップ間の熱バリアとして利用する, 冷凍パッケージングの概念を提案する。
10Ta/SiO$$2層からなる600nmのDBRでは,1.5Kから100mKまでの1mW/cm2$以下の熱伝導が得られる。
センチメートル規模のアーキテクチャでは、この分離レベルは近くの電子機器のワットレベルの冷却電力と互換性があり、市販の希釈冷凍機で約100mKの量子温度を維持している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:02:34 GMT)
Optimal Distillation of Non-Markovianity: Bounds, Multi-Copy Gain, and the Weak-to-Essential Transition [0.0] 量子チャネルは、情報の伝達と処理を制限する量子状態の識別性を低下させる。
以前の研究では、特定の量子チャネルの動作後の状態の識別可能性を高めるプロトコルが導入された。
本手法により,最大識別可能性の獲得を体系的に決定する方法を示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 02:31:34 GMT)
On the First Computer Science Research Paper in an Indian Language and the Future of Science in Indian Languages [0.0] 私は、最初のオリジナルで近代的なコンピュータサイエンスの研究論文を、完全にインド語で表現した経験について説明する。
論文は、約1億人の話者を持つ言語であるTeluguにある。
私は、Indic言語におけるあらゆるレベルで科学的な文章の状態を改善する方法のビジョンを定めています。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:33:49 GMT)
On secret sharing from extended norm-trace curves [0.0] ランプ秘密共有スキームは、高い相対重みの分析を必要とする対象である。
拡張ノルムトレース曲線から一点代数的符号から定義されるスキームが良いパラメータを持つだけでなく、[11]の線に沿って第2層のセキュリティを持つことを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:21:30 GMT)
Microservice Architecture Patterns for Scalable Machine Learning Systems [0.0] マイクロサービスアーキテクチャは、複雑な機械学習システムを独立した小さなパーツに分割し、自分で構築、更新、スケールすることができる。
Netflix、Uber、Googleといった大手企業が、トレーニング、デプロイメント、監視といった機械学習タスクにどのように取り組んでいるのかをレビューします。
このようなシステムの設計に関わる主な課題について論じ、大規模アプリケーション、特にレコメンデーションシステムにどのように適合するかを考察する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 00:44:58 GMT)
Large Language Models Reproduce Racial Stereotypes When Used for Text Annotation [0.0] テキストに微妙なアイデンティティの手がかりが、人種的ステレオタイプを反映する方法で、体系的に偏見アノテーションの結果に埋め込まれていることが示される。
名前に基づく実験では、黒人個人に関連付けられた名前を含むテキストは、19モデル中18モデルより攻撃的であると評価され、19モデル中18モデルよりゴシップが多いと評価されている。
アラブ人の名は、対人的評価とともに認知の高揚を招き、全ての4つの少数民族は一貫して、より独学的でないと評価されている。
特筆すべき例外は、名前に基づく雇用力であり、微調整は過度に正しく、体系的に少数派の名前の応募者を好んでいるように見える。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:58:22 GMT)
Kirkwood-Dirac classical states based on discrete Fourier transform: Representation with directed graph [0.0] 量子状態が KD-古典的であれば、KD-準確率分布が2つの与えられた基底に対して有効な古典的確率分布を形成し、そうでなければ KD-古典的でない。
2つの正則基底間の遷移行列が離散フーリエ変換行列の形をとるとき、KD-古典状態集合の構造的特性について検討する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:44:07 GMT)
JointFM-0.1: A Foundation Model for Multi-Target Joint Distributional Prediction [0.0] 微分方程式(SDE)のパラダイムを逆転する基盤モデルであるJointFMを紹介する。
データにSDEを適合させる代わりに、合成SDEの無限ストリームをサンプリングし、将来の関節確率分布を直接予測するために、ジェネリックモデルを訓練する。
ジョイントFMは、目に見えない合成SDEによって生じるオラクルの関節分布を回復する際に、最強のベースラインに対してエネルギー損失を14.2%削減する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:50:29 GMT)
Intrinsic Error Thresholds in Nearly Critical Toric Codes [0.0] ほぼクリティカルなトポロジカル量子符号における情報の保護について検討する。
基底状態多様体に符号化された情報を不可逆的に破壊するためには、パウリのデコヒーレンスの有限強度が依然として必要であることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:59:15 GMT)
Intelligent Materials Modelling: Large Language Models Versus Partial Least Squares Regression for Predicting Polysulfone Membrane Mechanical Performance [0.0] 本研究では, 4つの大言語モデル(LLM)を用いて, 部分最小二乗回帰(PLS)に対する知識駆動推論のベンチマークを行った。
LLMはブートストラップ不安定下での非線形で制約に敏感な特性に優れる。
実証された相補性は、解釈可能なフレームワーク内でLLM符号化された知識を活用するハイブリッドアーキテクチャは、小さなデータ素材の発見を最適化する可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:36:28 GMT)
Implementation and discussion of the Pith Estimation on Rough Log End Images using Local Fourier Spectrum Analysis method [0.0] 本稿では,Rudolf Schraml と Andreas Uhl による局所フーリエスペクトル解析(Local Fourier Spectrum Analysis)による粗いログ終端画像のパターン推定手法のPythonによる実装と提案を行う。
アルゴリズムは2つのデータセットでテストされる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:27:22 GMT)
Imaging Harmonic Generation of Magnons [0.0] この研究は理論と実験を組み合わせて、マグノンの調和生成の基礎となるメカニズムを研究する。
Ni$_81$Fe$_19$/Ptマイクロストリップにおいて、非線形光の高調波発生と直接類似した非線形スピン波フレームワークを開発し、走査型窒素空洞中心磁力計(NV)と組み合わせて、高調波発生を画像化し定量化する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:05:35 GMT)
Graph Neural Network-Based DDoS Protection for Data Center Infrastructure [0.0] 著者らはグラフネットワーク(GNN)ベースの検出システムを開発し、グラフU-Netを利用してDDoSトラフィックを自動分類し緩和する。
各種オープンソースデータセットで評価した結果,F1スコアは95%以上となった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 01:57:12 GMT)
Generalized Inverses of Quantum Channels: a categorical perspective [0.0] 量子チャネルは、完全に正の(CP)とトレース保存(TP)と定義される
量子チャネルの一般化された逆は、それ自体が量子チャネルではないかもしれない。
ユニタリ量子チャネルの場合、ムーア-ペンローズ逆はTPとユニタリの両方であることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:41:16 GMT)
Finite-Time Braiding Dynamics within Topological Nanowire Qubits [0.0] 我々は、アダバティックな体制で知られていることを拡張し、さらなる量子ビットおよびアルゴリズムモデリングのための時間依存ゲート要素を提供する。
これらの貢献は、次世代のqubit実装における現実的な実験的なセットアップの洞察を与える。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 18:09:19 GMT)
Finite path integrals on stochastic branched structures [0.0] 分岐多様体に整理された経路の有限集合に基づく時空の統計モデルを提案する。
分岐多様体の各構成について、シャノンエントロピーを定義する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:54:51 GMT)
Faithful or Just Plausible? Evaluating the Faithfulness of Closed-Source LLMs in Medical Reasoning [0.0] 我々は,広く使用されている3つの大規模言語モデルの中で,医学的推論における忠実度を体系的に評価する。
CoT推論のステップは、しばしば予測を因果的に駆動せず、モデルは、認識せずに容易に外部ヒントを組み込む。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:30:53 GMT)
Exploring the Dimensions of a Variational Neuron [0.0] 本稿では,局所確率計算単位として定式化された変分分布ニューロンであるEVEを紹介する。
Eveには内部診断と制約があり、有効KL、m2の標的バンド、帯域外分数、ドリフトと崩壊の指標がある。
本論文は, 変動ニューロンによって開放された設計空間を, 実験的に基礎づけた第1のマップとして提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 09:09:13 GMT)
Experimental Evaluation of Security Attacks on Self-Driving Car Platforms [0.0] 自動運転車のディープラーニングに基づく知覚パイプラインは、敵の操作とネットワーク層破壊の両方に対して脆弱である。
FGSM,PGD,man-in-the-middle (MitM), denial-of-service (DoS), ファントム攻撃の5つの攻撃クラスについて,系統的,オンハードウェア,実験的評価を行った。
我々の分析では、異なる攻撃クラスがこれらの次元にわたって一貫した、分離可能な「フィンガープリント」を生成することが明らかとなった。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:23:10 GMT)
Evidence of Uncollapsed Quantum Amplitudes After Consecutive Measurements [0.0] 量子測定の最も一般的な解釈の2つは、測定後の量子振幅の運命について一致しない。
この2つの理論が、同じ量子系上で3つ以上の連続的な測定を行った場合、異なる予測を行うことを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:04:39 GMT)
Evaluating Four FPGA-accelerated Space Use Cases based on Neural Network Algorithms for On-board Inference [0.0] この研究は、AMD ZCU104ボード上の4つの空間ユースケースにわたるニューラルネットワーク(NN)のFPGAアクセラレーションを評価する。
Vitis AI(AMD DPU)とVitis HLSを使用して推論を実装し、スループットとエネルギを定量化し、デプロイメントに関連するツールチェーンとアーキテクチャ制約を公開する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:32:33 GMT)
Entropy Maximization and Weak Gibbsianity of Quasi-Free Fermionic States [0.0] 1972年、ランフォードとロビンソンは格子フェルミオンのゲージ不変準自由状態が、固定二点函数を持つすべての翻訳不変状態の間のエントロピーを最大化することを示した。
特異性問題は、そのような準自由状態が弱いギブス状態であるかどうかという問題とともに再燃した。
運動量空間の 2-点関数が$widehat C$$0widehat C(k)1$ で、ブリルアンゾーンのウィナー代数に属する状態のクラス内の両方の問題に対して正の答えを与える。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:46:50 GMT)
Electrometry of extremely-low frequencies from kHz to sub-Hz with a Rydberg-atom sensor [0.0] 我々は、VLF、ULF、SLF、ELF、サブELFの周波数帯域にRydberg原子センサーの範囲を広げる。
819$V/cm/$sqrttextHz$ for 1 Hz, 33$V/cm/$sqrttextHz$ for 10 Hz, 10$V/cm/$sqrttextHz$ for 100 Hz, 2$V/cm/$sqr
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:20:35 GMT)
Efficient Semi-Automated Material Microstructure Analysis Using Deep Learning: A Case Study in Additive Manufacturing [0.0] 本稿では,U-Netに基づく畳み込みニューラルネットワークと対話型ユーザアノテーションと修正インタフェースを統合した,半自動能動学習に基づくセグメンテーションを提案する。
提案フレームワークは,スケーラビリティとロバスト性を維持しながらラベリングの労力を削減し,多様な材料システムにまたがる画像解析に広く適用可能である。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 08:28:00 GMT)
Dynamical Simulations of Schrödinger's Equation via Rank-Adaptive Tensor Decompositions [0.0] ランク適応テンソル分解技術は、量子コンピューティングシステムの指数的スケーリングを緩和するために用いられる。
低ランク表現をサポートするテンソルトレインとタッカーテンソル分解に注目した。
テンソル分解法の有効性は、代表時間非依存および時間依存ハミルトンモデルで評価される。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:34:24 GMT)
Do AI Agents Really Improve Code Readability? [0.0] 不適切な可読性は、開発時間を拡張し、バグを引き起こすリスクを高め、技術的負債に寄与する。
大規模言語モデルの急速な進歩により、AIエージェントベースのアプローチは複雑なタスクを自動分解するための有望なパラダイムとして登場した。
本研究では,AIエージェントによるコードの可読性向上効果について検討する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 03:01:10 GMT)
Discriminative Flow Matching Via Local Generative Predictors [0.0] 条件付き輸送プロセスとして分類と対象検出を再構成する枠組みを提案する。
本手法では,複数の独立フロー予測器を共有バックボーンにアタッチする。
このアーキテクチャは、アクティベーションメモリを最小化するために、あるいは異なるハードウェア制約に適合するために、ブロックを順次更新する柔軟性を提供する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 12:56:29 GMT)
Directly estimating the fidelity of measurement-based quantum computation [0.0] 測定に基づく量子計算(MBQC)では、量子回路は絡み合った資源状態の適応的な測定によって実装される。
実際には、資源状態は常に何らかのノイズで準備され、このノイズがMBQCの動作に与える影響を理解することが不可欠である。
我々は,MBQC出力状態の平均忠実度を,ノイズのある資源状態に基づいて評価した特定の相関関数に近似する式を導出する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 04:59:05 GMT)
Demand-Driven Context: A Methodology for Building Enterprise Knowledge Bases Through Agent Failure [0.0] ドメインの知識をキュレートするための主要なシグナルとしてエージェントの失敗を利用する問題優先の方法論であるDemand-Driven Contextを紹介します。
テスト駆動開発にインスパイアされたDDCは、エージェントに本当の問題を与え、必要なコンテキストを要求し、成功に必要な最小限の知識だけをキュレートする。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:58:56 GMT)
DeepFix: Debugging and Fixing Machine Learning Workflow using Agentic AI [0.0] DeepFixはエージェントAIフレームワークを使用して、マシンラーニングパイプライン全体を自動テストするツールである。
私たちのテストアプローチは、まずDeepchecksを活用して、潜在的なバグに対するMLソフトウェアのテストを行い、その後、エージェントAIベースのアプローチを使用して詳細なバグレポートを生成する。
これには、見つかったバグの深刻度に基づくランキングと、その説明が含まれており、非データサイエンスの専門家によって容易に解釈できる。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 20:00:16 GMT)
DeceptGuard :A Constitutional Oversight Framework For Detecting Deception in LLM Agents [0.0] 3つの監視体制を体系的に比較する統合フレームワークであるDECEPTGUARDを紹介する。
提案するDECEPTSYNTHは,偽陽性および偽陰性なエージェントトラジェクトリを生成する,スケーラブルな合成パイプラインである。
モニタは4,800個の合成軌道に最適化され、DeceptArenaの9,200個のホールドアウトサンプルで評価された。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 06:45:43 GMT)
Data-Driven Autoregressive Power Prediction for GTernal Robots in the Robotarium [0.0] マルチロボットシステムのためのエネルギー認識アルゴリズムは、正確な消費電力モデルを必要とする。
ジョージア工科大学ロボット館に配備されたGTernalモバイルロボットプラットフォームに対して,軽量な自己回帰予測器を提案する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 11:43:42 GMT)
Closed-time-path approach to the optomechanical back-reaction problem [0.0] 移動鏡の動特性を効果的に制御し, キャビティフィールドの全バックリアクションを取り入れた動作を導出する。
鏡に作用する光学的バック反応力によって放出される機械的エネルギーと、現場で生成した粒子によって運ばれるエネルギーとの間のエネルギー収支を検証した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 13:04:11 GMT)
Benchmarking the Energy Cost of Assurance in Neuromorphic Edge Robotics [0.0] 本稿では,事象駆動型ニューロモルフィックシステムにおける保証のエネルギーコストを定量化する。
従来のディープラーニングのディフェンスとは異なり、ロバスト性を高めて効率を著しく低下させる場合が多いが、提案アーキテクチャのイベント駆動性は優れたトレードオフを実現する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 10:31:01 GMT)
Benchmarking Open-Source PPG Foundation Models for Biological Age Prediction [0.0] 212,231人の英国バイオバンク患者を対象にトレーニングされたタスク固有モデルでは、PSG(AI-vascular Age)から年齢を予測できない。
PPGに基づく生物学的年齢予測において、なぜこれが起こっているのか、また何を意味するのかを考察する。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 17:11:38 GMT)
Aumann-SHAP: The Geometry of Counterfactual Interaction Explanations in Machine Learning [0.0] 対物遷移を分解する相互作用を意識したフレームワークであるAumann-Shapleyを紹介する。
我々は,Aumann-LESが反ファクト移行時の標準Shapley値よりも頑健な結果とより良い説明をもたらすことを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 16:38:34 GMT)
Adaptive quantum metrology with large dynamic range using short one-axis twists [0.0] 最近提案された位相推定スキームは、このグローバルな環境でのハイゼンベルクスケーリングにアプローチする。
まず,非ガウス的特徴を持つ状態においても,プローブのスクイーズ増加のパターンが適用可能であることを示す。
これらの状態は位相推定スキームでの使用に適していることを示し、$17/9$と$53/27$を達成するためのプロトコルを強調した。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 19:43:39 GMT)
ALTIS: Automated Loss Triage and Impact Scoring from Sentinel-1 SAR for Property-Level Flood Damage Assessment [0.0] ALTIS: 生のSentinel-1 GRDおよびSLC画像を洪水ピークから数時間以内に特性レベルの衝撃スコアに変換する5段階パイプラインを提案する。
24-48のバイナリ出力の画素レベルのマップを生成する以前のアプローチとは異なり、ALTISはクレームプラットフォームで消費可能な信頼マーク付きトリアージリストを提供する。
予備的な分析によると、ALTISは高重度要求の90%のリコールで約0.52のIRRを達成するように設計されており、不要なディスパッチの半分以上を排除している可能性がある。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 07:22:43 GMT)
A Systematic Evaluation Protocol of Graph-Derived Signals for Tabular Machine Learning [0.0] 本稿では,グラフ由来信号のどのカテゴリが統計的に有意かつ頑健な性能向上をもたらすかを評価する統一的かつ再現可能な評価プロトコルを提案する。
本稿では,大規模かつ不均衡な暗号通貨不正検出データセットの広範なケーススタディを通じて,このプロトコルを実証する。
これらの知見は, 不正検出の実用的有用性を示し, 提案手法が他のアプリケーション領域にも適用可能であることを示す。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 15:59:50 GMT)
A Grammar of Machine Learning Workflows [0.0] 本稿では、教師付き学習ライフサイクルを8つのカーネルプリミティブに分解し、型付き有向非巡回グラフ(DAG)で連結する構造的救済法を提案する。
文法のコアコントリビューションはターミナルアセスメントの制約であり、テストセットの繰り返し評価は、名目上異なるエビデンス型のガードによって拒否される。
論文参考訳(メタデータ) (Sat, 14 Mar 2026 21:18:09 GMT)