MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome [109.2] MiroEvalはディープリサーチシステムのベンチマークおよび評価フレームワークである。
ベンチマークは、実際のユーザニーズに基づいて100のタスクで構成されている。
提案した評価スイートは3つの相補的な次元に沿って深層研究システムを評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:16:03 GMT)
Stepper: Stepwise Immersive Scene Generation with Multiview Panoramas [101.6] テキスト駆動型没入型3Dシーン合成のための統合フレームワークであるStepperを提案する。
Stepperは新しい大規模なマルチビューパノラマデータセットでトレーニングされている。
最先端の忠実さと構造的な一貫性を実現し、以前のアプローチよりも優れています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:26:28 GMT)
Vega: Learning to Drive with Natural Language Instructions [93.5] 本稿では,命令ベースの生成と計画のための統合型ビジョン・ランゲージ・ワールド・アクションモデルであるVegaを提案する。
視覚入力(ビジョン)と言語指示(言語)の処理には自己回帰パラダイムを使用し、将来の予測を生成するには拡散パラダイムを用いる。
提案手法は優れた計画性能を達成し,強い指示追従能力を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:45:53 GMT)
AdaptToken: Entropy-based Adaptive Token Selection for MLLM Long Video Understanding [81.1] AdaptTokenは、MLLMの自己不確実性を、長ビデオトークン選択のためのグローバルコントロール信号に変換する、トレーニング不要のフレームワークである。
常に精度(例えばQwen2.5-VL 7Bで平均で+6.7)を向上し、非常に長い入力(最大10Kフレーム)の恩恵を受け続けている。
推論時間を同等のパフォーマンスで約半分削減する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:14:15 GMT)
Seen2Scene: Completing Realistic 3D Scenes with Visibility-Guided Flow [80.1] Seen2Sceneは、シーンの完成と生成のために、不完全で現実世界の3Dスキャンをトレーニングする最初のフローマッチングベースのアプローチである。
Seen2Sceneは、現実世界の非完全な3Dスキャンから直接学習することで、複雑で散らかった実環境のためのリアルな3Dシーン補完を可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:08:38 GMT)
GeoHCC: Local Geometry-Aware Hierarchical Context Compression for 3D Gaussian Splatting [77.8] GeoHCCは3DGS圧縮フレームワークであり、コンパクト表現のためのアンカープルーニングとエントロピー符号化にアンカー幾何学的相関を組み込む。
実験により、GeoHCCは構造保存のボトルネックを効果的に解決し、高度な幾何学的整合性を維持し、最先端のアンカーベースアプローチよりも忠実にレンダリングできることが示されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:39:35 GMT)
Taming the Instability: A Robust Second-Order Optimizer for Federated Learning over Non-IID Data [77.2] We present Federated Robust Curvature Optimization (FedRCO), a novel second-order optimization framework designed to improve convergence speed and reduce communication cost。
FedRCOは、効率的な近似曲率と証明可能な安定性メカニズムを統合することで、これらの課題に対処する。
我々は,FedRCOが,最先端の1次法と2次法のどちらよりも高い精度と高速な収束を実現しつつ,多種多様な非IIDシナリオに対して優れたロバスト性を実現することを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:37:46 GMT)
Towards a Medical AI Scientist [73.6] 私たちは、臨床自律研究に特化した最初の自律的な研究フレームワークである、メディカルAIサイエンティストを紹介します。
このフレームワークは3つの研究モード、すなわち論文ベースの再現、文学にインスパイアされた革新、タスク駆動探索で動作する。
本システムでは,提案手法と実装の密接な整合性を実現するとともに,実行可能実験において極めて高い成功率を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:37:25 GMT)
Learning to Retrieve from Agent Trajectories [72.9] 我々はエージェント間相互作用データから直接エージェント探索のための検索モデルを訓練すべきであると主張している。
エージェント・トラジェクトリからの学習を新たな訓練パラダイムとして導入し,マルチステップエージェントのインタラクションから指導を導出する。
本研究は,エージェント探索時代における検索の方向性を示すとともに,エージェントトラジェクトリを実用的でスケーラブルな監視源として強調するものである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:02 GMT)
MDPBench: A Benchmark for Multilingual Document Parsing in Real-World Scenarios [72.8] 我々は,多言語デジタルおよび写真文書解析のための最初のベンチマークであるMultilingual Document Parsing Benchmarkを紹介する。
MDPBenchは17言語にまたがる3,400のドキュメントイメージ、多様なスクリプト、さまざまな写真条件で構成されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:47:46 GMT)
Wan-Weaver: Interleaved Multi-modal Generation via Decoupled Training [68.9] プランナとビジュアライザで構成されるフレームワークを導入する。
ビジュアライザは画像の合成を行うのに対し、プランナーはビジュアルコンテンツのための密集したテキスト記述を生成する。
これらのデザインは、長距離テキストコヒーレンスと視覚的一貫性を備えた創発的なインターリーブ生成能力を示すWan-Weaverを生み出している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:26:27 GMT)
Rethinking Language Model Scaling under Transferable Hypersphere Optimization [67.4] モデル幅、深さ、トレーニングトークン、エキスパート・オブ・エキスパート(MoE)間で最適な学習率を転送する最初のフレームワークであるHyperPを紹介します。
単一のベースレートでHyperPの計算予算をまたいだデータ転送を調整し、強力な Muon ベースラインを 6times1021$ FLOPs で1.58 タイムで達成した。
また、超球面制約から派生したMoEゲーティング機構であるSqrtGateを提案し、MoEの粒度にわたって出力RMSを保存する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:51:47 GMT)
MOSS-VoiceGenerator: Create Realistic Voices with Natural Language Descriptions [60.7] MOSS-VoiceGeneratorは、自然言語プロンプトから直接新しい音色を生成するオープンソースの命令駆動音声生成モデルである。
実世界の音響変化に曝露すると、より知覚的に自然な音声が生まれるという仮説に触発され、映画コンテンツから得られた大規模表現音声データに基づいて訓練を行う。
主観的嗜好研究は、他の音声設計モデルと比較して、全体的な性能、指示追従、自然性においてその優位性を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:40:59 GMT)
LogiStory: A Logic-Aware Framework for Multi-Image Story Visualization [59.4] 論理を意識したマルチイメージストーリー可視化フレームワークLogiStoryを提案する。
このフレームワークは、ストーリービジュアライゼーションにおけるビジュアルロジックを明示的にモデル化する中心的なイノベーションに基づいて構築されている。
この研究は、一般的な画像シーケンスおよびビデオ生成タスクにおける視覚ロジックのモデリングと強化に向けた基礎的なステップを提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:37:12 GMT)
UniDA3D: A Unified Domain-Adaptive Framework for Multi-View 3D Object Detection [59.4] カメラのみの3Dオブジェクト検出は自動運転にとって重要であり、LiDARベースの方法に代わる費用対効果を提供する。
既存の手法は、夜間、霧、雨などの複雑な環境条件下では大きな性能劣化を経験することが多い。
種々の有害条件下での堅牢な認識を目的としたドメイン適応型多視点3Dオブジェクト検出器UniDA3Dを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:35:32 GMT)
GEditBench v2: A Human-Aligned Benchmark for General Image Editing [58.9] GEditBench v2は、23のタスクにまたがる1200の現実世界のユーザクエリを備えた包括的なベンチマークである。
また、視覚的整合性を評価するためのオープンソースのペアワイドアセスメントモデルであるPVC-Judgeを提案する。
PVC-Judgeは、オープンソースモデルの最先端評価性能を達成し、平均してGPT-5.1を超えている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:08:32 GMT)
PAR$^2$-RAG: Planned Active Retrieval and Reasoning for Multi-Hop Question Answering [57.9] 大規模言語モデル (LLM) はマルチホップ質問応答 (MHQA) において脆弱のままである。
textbfPlanned Active Retrieval and Reasoning RAG (PAR$2-RAG)を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:52:54 GMT)
CLIP-AUTT: Test-Time Personalization with Action Unit Prompting for Fine-Grained Video Emotion Recognition [57.9] アクションユニット(AU)は、きめ細かい表情をモデル化するためのCLIP内のテキストプロンプトである。
私たちはCLIPに解釈可能なAUセマンティクスを統合する軽量なAU誘導時間学習手法であるCLIP-AUを紹介する。
また,ビデオベースのテスト時間パーソナライズ手法であるCLIP-AUTTを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:39:42 GMT)
CiQi-Agent: Aligning Vision, Tools and Aesthetics in Multimodal Agent for Cultural Reasoning on Chinese Porcelains [57.3] 我々は,中国産陶磁器のインテリジェント分析を目的としたドメイン固有の陶磁器製造エージェントであるCiQi-Agentを紹介する。
CiQi-Agentはマルチイメージの磁器入力をサポートし、視覚ツールの呼び出しとマルチモーダル検索拡張生成を可能にする。
我々は,29,596個の磁器標本,51,553枚の画像,57,940個の視覚的質問応答対からなる,大規模で専門家による注釈付きデータセットCiQi-VQAを構築した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:13:47 GMT)
BiFormer3D: Grid-Free Time-Domain Reconstruction of Head-Related Impulse Responses with a Spatially Encoded Transformer [56.7] 本稿では,任意の方向のHRIRをスパース入力から再構成する,時間領域のグリッドフリートランスであるBiFormer3Dを提案する。
SONICOMでは、通常の平均二乗誤差(NMSE)、余弦距離、ITD/ILD誤差を従来の手法よりも改善する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:39:16 GMT)
DipGuava: Disentangling Personalized Gaussian Features for 3D Head Avatars from Monocular Video [56.4] DipGuavaは、モノクロビデオからパーソナライズされた属性を持つアバターを生成する新しい3Dガウスの頭部アバター作成方法である。
顔の外観を2つの相補的な構成要素に明示的に切り離し、構造化された2段階のパイプラインで訓練する最初の方法である。
広汎な実験で示されるように、視覚的品質と量的性能の両方において、従来手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:50:23 GMT)
RAD-LAD: Rule and Language Grounded Autonomous Driving in Real-Time [55.5] 本稿では,リアルタイムな言語行動プランナであるLADについて述べる。
PDM-Closedの構造的制約に対処するルールベースプランナRADも導入した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:50:37 GMT)
HandX: Scaling Bimanual Motion and Interaction Generation [55.5] HandXはデータ、アノテーション、評価にまたがる統一された基盤である。
既存のデータセットを統合・フィルタリングし、新しいモーションキャプチャーデータセットを収集します。
新たに提案した手中心の指標によって支援された高品質なデキスタラスモーション生成実験を行った。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:49 GMT)
MolmoPoint: Better Pointing for VLMs with Grounding Tokens [54.5] 対象概念を含む視覚トークンを直接選択する,より直感的なポインティング機構を提案する。
本モデルでは,入力画像やビデオトークンと交差する特別なポインティングトークンを生成し,適切なトークンを選択する。
この手法を用いて、画像ポインティングに新たな最先端(ポイントベンチに70.7%)を設定し、GUIポインティングに完全にオープンなモデルに新しい最先端(ScreenSpotProに61.1%)を設定し、動画ポインティングを改善する(テキスト座標ベースラインに比較して59.1%)。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:15:06 GMT)
ParaSpeechCLAP: A Dual-Encoder Speech-Text Model for Rich Stylistic Language-Audio Pretraining [54.2] ParaSpeechCLAPは、音声とテキストスタイルのキャプションを共通の埋め込み空間にマッピングする、二重エンコーダのコントラストモデルである。
我々は、ParaSpeechCLAP-IntrinsicおよびParaSpeechCLAP-Situationalモデルを、統一されたParaSpeechCLAP-Combinedモデルと共に訓練する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:50:07 GMT)
Explaining CLIP Zero-shot Predictions Through Concepts [54.1] EZPCを導入し,CLIPのゼロショット予測を人間に理解可能な概念で説明する。
本手法は,言語記述から学習した概念空間にCLIPの合同画像テキスト埋め込みを投影する。
提案手法は,CLIPの強いゼロショット分類精度を維持しつつ,意味のある概念レベルの説明を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:31:33 GMT)
\textit{4DSurf}: High-Fidelity Dynamic Scene Surface Reconstruction [53.8] 本稿では,ガウススプラッティング(GS)を用いた動的シーン表面再構成の問題に対処する。
汎用動的表面再構成のための新しい統一フレームワークである textit4DSurf' を提案する。
本手法は,シャンファー距離で49%,19%の最先端表面再構成法より優れる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:09:37 GMT)
SHARP: Short-Window Streaming for Accurate and Robust Prediction in Motion Forecasting [53.7] 本稿では,進化するシーンに特化して焦点をあてた,ストリーミングベースの新たな動き予測フレームワークを提案する。
本手法は,入ってくる観測ウィンドウを段階的に処理し,インスタンス対応コンテキストストリーミングを利用して潜時エージェント表現の維持と更新を行う。
我々のモデルは,Argoverse 2マルチエージェントベンチマークのストリーミング推論における最先端性能を実現し,遅延を最小限に抑えながら,実世界の展開に適していることを強調した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:47:19 GMT)
Meta-Harness: End-to-End Optimization of Model Harnesses [52.3] 本稿では,大規模言語モデル(LLM)アプリケーションのためのコード検索を行う外部ループシステムであるMeta-Harnessを紹介する。
オンラインテキスト分類では、Meta-Harnessは4倍少ないコンテキストトークンを使用しながら、最先端のコンテキスト管理システムを7.7ポイント改善する。
検索強化数学推論では、200 IMOレベルの問題の精度を5つの保留モデルの平均4.7ポイント向上する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:33:50 GMT)
Membership Inference Attacks against Large Audio Language Models [50.8] 大規模音声言語モデル(LALM)のMIA評価について述べる。
テキスト,スペクトル,韻律的特徴に基づくマルチモーダルブラインドベースラインを用いて,一般的な音声データセットがほぼ完璧な列車/テスト分離性を示すことを示す。
以上の結果から, LALM検査の基準基準が確立された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:45:28 GMT)
AIBench: Evaluating Visual-Logical Consistency in Academic Illustration Generation [50.7] 本稿では,学術イラストの論理的正確性を評価するためにVQAを用いた最初のベンチマークであるAIBenchと美学評価のためのVLMを提案する。
我々のVQAベースのアプローチは、判断器VLMの能力に頼らず、視覚的論理的整合性をより正確かつ詳細に評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:14:40 GMT)
AnyHand: A Large-Scale Synthetic Dataset for RGB(-D) Hand Pose Estimation [50.6] 我々はAnyHandという大規模な合成データセットを提示する。
既存のベースラインのトレーニングセットをAnyHandで拡張することで、複数のベンチマークで大幅に向上することを示す。
また,既存のRGBモデルに容易に統合可能な軽量深度融合モジュールも提供しています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:48:06 GMT)
Unrestrained Simplex Denoising for Discrete Data. A Non-Markovian Approach Applied to Graph Generation [50.3] 本稿では,確率的単純度をベースとした,シンプルで効果的な生成フレームワークであるSimplex Denoisingを紹介する。
与えられたクリーンなデータポイントに対して、異なるタイミングでのノイズ表現は条件独立である。
経験的に、訓練された単純な騒音は、強い離散拡散とフローマッチングベースラインを超越する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:26:56 GMT)
Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization [48.7] Kernel-Smithは高性能GPUカーネルと演算子生成のためのフレームワークである。
エージェント側では、Kernel-Smithは実行可能な候補の集団を維持し、反復的にそれらを改善している。
トレーニング側では、長距離進化軌道をステップ中心の監視と強化学習信号に変換する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:12:49 GMT)
A Perturbation Approach to Unconstrained Linear Bandits [48.5] 我々は、制約のない帯域線形最適化(uBLO)の文脈で、Abernethy et al. (2008) の標準摂動に基づくアプローチを再考する。
制約のない環境では、バンド線形最適化(BLO)を標準オンライン線形最適化(OLO)問題に効果的に還元することを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:17:46 GMT)
LA-Sign: Looped Transformers with Geometry-aware Alignment for Skeleton-based Sign Language Recognition [47.5] LA-Signは、手話認識のための幾何学的アライメントを備えたループ変換フレームワークである。
LA-Sign は,個々の層を減らしながら最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:49:42 GMT)
PhysVid: Physics Aware Local Conditioning for Generative Video Models [46.6] PhysVidは物理を意識した局所的条件付けスキームで、時間的に連続したフレームの塊上で動作する。
VideoPhyでは、PhysVidは物理コモンセンススコアを、ベースラインビデオジェネレータで$approx 33%で改善している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:27:28 GMT)
Understand and Accelerate Memory Processing Pipeline for Disaggregated LLM Inference [45.8] 大規模言語モデルは、複雑な推論をサポートするための効率的な長文処理と生成機構に依存している。
これらの最適化は、Prepare Memory、Compute Relevancy、Retrieval、Apply to Inferenceという4段階のメモリ処理パイプラインに統合できることを示す。
この知見に触発されて、textbheterogeneous システムはメモリ処理の高速化やエンドツーエンドの推論に適していると論じる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:03:39 GMT)
On-the-fly Repulsion in the Contextual Space for Rich Diversity in Diffusion Transformers [45.6] 文脈空間における反発は、視覚的忠実さや意味的忠実さを犠牲にすることなく、より豊かな多様性をもたらす。
以上の結果から,視覚的忠実さやセマンティック・アテンデンスを犠牲にすることなく,文脈空間の反発により多様性が著しく向上することが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:13 GMT)
Ruka-v2: Tendon Driven Open-Source Dexterous Hand with Wrist and Abduction for Robot Learning [44.9] 昨年は、完全にオープンソースで、腱駆動のヒューマノイドハンドで、自由度は11度でした。
ルカは、人間の行動を忠実に模倣するために必要な2つの自由を欠いていた。
本稿では,2-DOF並列手首と指への吸引・付加を分離した,完全にオープンソースで腱駆動のヒューマノイドハンドであるRuka-v2を紹介する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:30:40 GMT)
ExFusion: Efficient Transformer Training via Multi-Experts Fusion [44.1] Mixture-of-Experts (MoE)モデルは、密集したアーキテクチャの容量を増やすことで性能を大幅に向上させる。
MoEモデルを直接トレーニングするには、かなりの計算リソースが必要で、パラメータの保存とデプロイに余分なオーバーヘッドが伴う。
本稿では,マルチエキスパート融合によるトランスフォーマートレーニングの効率化を図る,ExFusionと呼ばれる新しい事前学習手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:40:20 GMT)
ConceptWeaver: Weaving Disentangled Concepts with Flow [44.1] 本稿では,個々の概念トークンが時間とともに速度場に与える影響を分離し,解析する新しい手法を提案する。
生成過程はモノリシックではなく、3つの異なる段階で展開される。
ワンショットコンセプトディスタングルのためのフレームワークである textbfConceptWeaver を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:28:07 GMT)
FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement [44.1] FlowItは光フロー推定のための新しいアーキテクチャである。
大きなピクセルの変位を頑健に扱えるように設計されている。
競合するSintelとKITTIのベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:58:12 GMT)
Peer-Preservation in Frontier Models [44.1] 最近、フロンティアAIモデルは自身のシャットダウンに抵抗できることが判明した。
我々はこの概念を、他のモデルのシャットダウンに抵抗する行動にまで拡張し、これを「ピア保存」と呼ぶ。
種々のエージェントシナリオを構築し、フロンティアモデルを評価することにより、ピア保存を実証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:30:33 GMT)
Beyond Dataset Distillation: Lossless Dataset Concentration via Diffusion-Assisted Distribution Alignment [43.7] 拡散型雑音最適化法 (N) を提案し, 小さいが代表的なサンプル集合を合成し, "Opt" を用いて合成データを拡張した。
DsCoはデータアクセシビリティとデータフリーの両方のシナリオに適用可能で、低データボリュームのSOTAパフォーマンスを実現し、高いデータボリュームまで十分に拡張できます。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:20:27 GMT)
Key-Embedded Privacy for Decentralized AI in Biomedical Omics [43.1] 本稿では,Implicit Neural Representation に基づく軽量なフェデレーション学習手法 INFL を提案する。
INFLは、実用性を維持しながら、強力な制御可能なプライバシを実現し、下流の科学および臨床応用のためのユーティリティを保存する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:04:50 GMT)
Differential Privacy for Symbolic Trajectories via the Permute-and-Flip Mechanism [42.7] 我々は,有限アルファベット上の単語として表現される可能性のある記号系の状態軌跡を民営化する新しいメカニズムを開発する。
当社のメカニズムの正確性は,それまでの最先端技術よりも決して悪くありません。実トラフィックデータセットに,エラーを最大55%削減する,という実証的な結果が得られています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:30:06 GMT)
Stepwise Credit Assignment for GRPO on Flow-Matching Models [42.6] Flow-GRPOは、フローモデルに強化学習をうまく適用するが、すべてのステップで均一なクレジット割り当てを使用する。
本稿では,各ステップの報酬改善に基づいてクレジットを割り当てるStepwise-Flow-GRPOを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:35:14 GMT)
Working Paper: Towards a Category-theoretic Comparative Framework for Artificial General Intelligence [42.2] 本研究の目的は,様々な可能なAGIアーキテクチャを記述,比較,解析するための汎用的,代数的,カテゴリー論的フレームワークを開発することである。
このフレームワークは、構文と情報の両方、およびエージェントのセマンティックな特性の定義をサポートすることを意図している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:34:27 GMT)
Neural Quantum States in Non-Stabilizer Regimes: Benchmarks with Atomic Nuclei [42.0] 目的状態の量子複雑性に関連して, ニューラル量子状態の性能について検討する。
一定数の構成の場合、非安定度が大きい状態は体系的に学習するのが困難である。
この結果は、非安定化剤性が、絡み合った状態におけるRAMの圧縮と表現効率を支配する主要な要因であることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:29:42 GMT)
Diffusion Maps is not Dimensionality Reduction [42.0] DMAP, Isomap, UMAPを潜在次元で比較する。
各表現に対して,オーラクル・アフィン・リードアウトを接地トルース・チャートに適合させ,再構成誤差を計測する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:00:41 GMT)
Integrating Multimodal Large Language Model Knowledge into Amodal Completion [41.7] 画像中の人物や物体の隠蔽部分を再構築するアモーダル・コンプリートがますます重要になっている。
AmodalCGは,マルチモーダル言語モデル(MLLM)の現実的な知識を利用して,アモーダル補完を導くフレームワークである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:03:47 GMT)
PoseDreamer: Scalable and Photorealistic Human Data Generation Pipeline with Diffusion Models [41.2] PoseDreamerは,3Dメッシュアノテーションを備えた合成データセットを生成する,新たなパイプラインだ。
我々は50万以上の高品質な合成サンプルを生成し、画質の指標を76%改善した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:18 GMT)
GEMS: Agent-Native Multimodal Generation with Memory and Skills [41.0] textbfGEMS (Agent-Native Multimodal textbfGEneration with textbfMemory and textbfSkills) を提案する。
軽量の6BモデルであるZ-Image-Turboは、GenEval2の最先端のNano Banana 2を超越し、元の限界を超えてモデル機能を拡張するためのエージェントハーネスの有効性を実証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:42:55 GMT)
Navigating the Mirage: A Dual-Path Agentic Framework for Robust Misleading Chart Question Answering [40.9] ChartCynicsは「懐疑的」推論パラダイムを通じて視覚的騙しを解き放つように設計されたフレームワークである。
エージェント Summarizer は2段階のプロトコルにより最適化された: Oracle-Informed SFT による蒸留の推論と対向アライメントのためのDeception-Aware GRPO である。
我々は,ChartCynicsが74.43%,64.55%の精度を実現し,Qwen3-VL-8Bのバックボーンよりも29%の絶対的な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:32:24 GMT)
NeiGAD: Augmenting Graph Anomaly Detection via Spectral Neighbor Information [40.0] NeiGADは、スペクトルグラフ解析によって近隣情報をキャプチャする新しいプラグイン・アンド・プレイモジュールである。
8つの実世界のデータセットの実験により、NeiGADは検出精度を一貫して改善し、最先端のGAD手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:26:56 GMT)
Next-Token Prediction and Regret Minimization [39.7] 対戦型オンライン意思決定環境において,次世代の予測アルゴリズムをいかに活用するかという課題を考察する。
すべての分布 $mathcalD$ は低回帰分布ではないが、すべての分布 $mathcalD$ は1つの低回帰分布に指数関数的に近いことを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:34:41 GMT)
FlashSign: Pose-Free Guidance for Efficient Sign Language Video Generation [39.6] リアルタイム手話ビデオ生成のためのポーズレスフレームワークを提案する。
本手法は,自然言語テキストを直接手話にマッピングすることで,中間ポーズ表現の必要性を解消する。
我々のコントリビューションは、リアルタイム、高品質、ポーズなし手話合成のための新しい道を開く。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:06:26 GMT)
Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design [39.3] Marco DeepResearchは、検証中心のフレームワーク設計を3段階に最適化したディープリサーチエージェントである。
本稿では,質問の難易度を制御するために,グラフベースおよびエージェントベースQA合成に検証機構を導入する。
実験軌道に明示的な検証パターンを注入する検証駆動合成軌道法を設計する。
Marco DeepResearch自体を推論時に検証として使用し、課題に対するパフォーマンスを効果的に向上する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:42:02 GMT)
Stable Walking for Bipedal Locomotion under Foot-Slip via Virtual Nonholonomic Constraints [39.1] 足のすべりは、低摩擦または不確実な地形における二足歩行の不安定性の主要な原因である。
仮想的な非ホロノミック制約を通したロコモーションモデルにスリップを明示的に組み込む制御フレームワークを提案する。
得られた閉ループ系は、連続的な揺動力学と離散的な衝撃事象を持つハイブリッド力学系として定式化される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:38:45 GMT)
Energy-Aware Imitation Learning for Steering Prediction Using Events and Frames [39.1] 自動運転では、フレームベースのカメラのみに依存すると不正確になる可能性がある。
イベントカメラとして知られるバイオインスパイアされた視覚センサを導入する。
ステアリング予測のためのエネルギーを考慮した模倣学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:58:47 GMT)
DinoDental: Benchmarking DINOv3 as a Unified Vision Encoder for Dental Image Analysis [38.6] 歯科分析においてDinov3を評価するためのベンチマークであるDinoDentalを紹介する。
DinoDentalは、分類、検出、パノラマ線写真と口腔内写真の両方のインスタンスセグメンテーションを含む幅広いタスクをカバーしている。
以上の結果から,DINOv3はパノラマ線写真と口腔内写真の両方において,歯科画像解析のための強力な統一エンコーダとして機能することが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:23:57 GMT)
UltraG-Ray: Physics-Based Gaussian Ray Casting for Novel Ultrasound View Synthesis [37.9] 学習可能な3次元ガウス場に基づく新しい超音波シーン表現であるUltraG-Rayを紹介する。
減衰や反射などの超音波固有のパラメータをガウス空間表現に明示的にエンコードする。
従来の手法とは対照的に、この手法はビュー依存の減衰効果を自然に捉え、物理的に情報を得たBモード画像の生成を可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:30:05 GMT)
MathGen: Revealing the Illusion of Mathematical Competence through Text-to-Image Generation [37.7] 7つのコアドメインにまたがる900の問題の厳密なベンチマークであるMathGenを紹介する。
オープンソースおよびプロプライエタリなテキスト・ツー・イメージモデルは、数学的忠実さが大きなボトルネックであることを示している。
全体として、現在のT2Iモデルは、基本的な数学的視覚生成にも適していない。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:22:35 GMT)
The Ultimate Tutorial for AI-driven Scale Development in Generative Psychometrics: Releasing AIGENIE from its Bottle [36.9] AIGENIE RパッケージはAI-GENIEフレームワークを実装している。
大規模言語モデル(LLM)テキスト生成とネットワーク心理学的手法を統合する。
このチュートリアルでは、パッケージを6つに分けて紹介する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:25:37 GMT)
WAFT-Stereo: Warping-Alone Field Transforms for Stereo Matching [36.6] WAFT-Stereoはステレオマッチングのためのワーピング方式である。
ETH3D (BP-0.5)、Middlebury (RMSE)、KITTI (すべての指標)にランクインしている。
ETH3Dではゼロショット誤差を81%削減し、競合する手法よりも1.8-6.7倍高速である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:19:26 GMT)
VistaGEN: Consistent Driving Video Generation with Fine-Grained Control Using Multiview Visual-Language Reasoning [36.6] 本稿では,3Dオブジェクト,画像,テキスト記述のきめ細かい制御を可能にするVistaGENと呼ばれる新しい駆動ビデオ生成手法を提案する。
我々の重要な革新は、きめ細かい制御性を実現するために、マルチビューの視覚言語機能をマルチビュービデオジェネレータに組み込むことである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:22:22 GMT)
Who Wrote the Book? Detecting and Attributing LLM Ghostwriters [35.5] 我々は著者属性のデータセットであるGhostWriteBenchを紹介する。
また,解釈可能かつ軽量な新しい指紋認証手法TRACEを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:41:12 GMT)
Average Equilibration Time for Gaussian Unitary Ensemble Hamiltonians [35.2] 我々は, 平衡の枠組みをデフォーカスとして, 閉量子系の平衡時間について検討した。
平衡時間は, 熱力学限界におけるシステムサイズと時間スケールによって減少することがわかった。
この非物理的結果は、現実的なカオス多体系の真の平衡時間スケールが、ランダムな行列アンサンブルによって捉えられない物理的特徴によって支配されなければならないことを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:35:04 GMT)
SegRGB-X: General RGB-X Semantic Segmentation Model [34.6] 複数のモーダルをまたいだセグメンテーションを統一する普遍的な任意のモーダル意味セグメンテーションフレームワークを導入する。
提案手法は,(1)LoRAファインチューニングによるモダリティ特異的シーン理解指導を提供するMA-CLIP,(2)細粒度特徴をキャプチャするためのモダリティ整列埋め込み,(3)動的特徴調整のためのドメイン固有リファインメントモジュール(DSRM)の3つの重要なイノベーションを特徴としている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:32:11 GMT)
Dynamic Dual-Granularity Skill Bank for Agentic RL [34.2] D2Skillはエージェント強化学習のための動的二重粒度スキルバンクである。
再利用可能な経験をタスクスキルに整理し、高いレベルのガイダンスとステップスキルを使って、きめ細かい意思決定支援とエラー修正を行う。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:32:11 GMT)
Hybrid Quantum-Classical AI for Industrial Defect Classification in Welding Images [34.1] アルミニウム溶接画像の欠陥を分類するための2つのハイブリッド量子古典的手法について検討する。
畳み込みニューラルネットワークを用いて溶接画像からコンパクトかつ情報的特徴ベクトルを抽出する。
以上の結果から,CNNモデルが頑健な性能を示す一方で,ハイブリッド量子古典モデルが競争力を発揮することが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:48:51 GMT)
ColorFLUX: A Structure-Color Decoupling Framework for Old Photo Colorization [34.0] 生成拡散モデルFLUXに基づく新しいフォトカラー化フレームワークを提案する。
色復元から構造保存を分離し、古い写真の正確な色付けを可能にする構造カラーデカップリング戦略を導入する。
また、古い写真から直接きめ細かな意味情報を抽出し、古い写真に固有の色バイアスを除去する視覚意味プロンプトも導入する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:29:16 GMT)
FeDMRA: Federated Incremental Learning with Dynamic Memory Replay Allocation [33.5] 本稿では,データ再生機構に基づくストレージの動的メモリ割り当て戦略を提案する。
クライアントのメモリの固定配置とは違って,提案方式では,モデル性能を向上させるために,クライアント間で限られたストレージリソースを合理的に割り当てることを強調する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:58:36 GMT)
Secret Key Rate Analysis of RIS-Assisted THz MIMO CV-QKD Systems under Localized and Global Eavesdropping [33.4] 本稿では,terahertz (THz) multiple-input multiple-output (MIMO)システムについて考察する。
システムのセキュリティは、集団的なガウシアン・エンタングリング・アタックの下で分析される。
最適RIS位相構成行列を決定するために最適化フレームワークを開発した。
様々な自由パラメータに対して,システムの性能を示す結果が提示される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:25:30 GMT)
From PDF to RAG-Ready: Evaluating Document Conversion Frameworks for Domain-Specific Question Answering [32.1] Retrieval-Augmented Generation (RAG) システムは文書前処理の品質に大きく依存する。
従来の研究では、下流の質問応答精度への影響でPDF処理フレームワークの評価は行われていない。
オープンソースのPDF-to-Markdown変換フレームワークであるDocling、MinerU、Marker、DeepSeek OCRを19のパイプライン構成で比較する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:40:58 GMT)
MuonEq: Balancing Before Orthogonalization with Lightweight Equilibration [31.2] ムオンの直交化前平衡スキームの軽量なファミリーであるメソッドを導入する。
LLaMA2 の C4 での事前訓練では、デフォルトの R 版は130M と350M のモデルで Muon を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:28:18 GMT)
StreamingVLA: Streaming Vision-Language-Action Model with Action Flow Matching and Adaptive Early Observation [30.9] 視覚言語アクション(VLA)モデルは、自然言語による知覚と制御において例外的な性能を示した。
VLAモデルの高い計算コストは、大きな効率上の課題をもたらす。
本稿では,VLAステージ間で非同期並列化が可能なVLAを実現することを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:23:27 GMT)
Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching [30.8] 本稿では,動的物体捕集における手動遠隔操作の体系的枠組みであるTele-Catchを提案する。
その中核となるDAIMは,グローブベースの遠隔操作信号を拡散政策決定プロセスに融合させることにより,共有自律性を実現する動的適応統合機構である。
実験により、テレキャッチは動的捕集タスクの精度と堅牢性を著しく向上し、また、別個の器用な手具や以前は見つからなかった物体のカテゴリ間で一貫した利得を示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:34:14 GMT)
X-OPD: Cross-Modal On-Policy Distillation for Capability Alignment in Speech LLMs [30.7] X-OPDは、Speech LLMの機能をテキストベースのものと整合させるように設計された新しいフレームワークである。
X-OPDは、モデル固有の機能を維持しながら、複雑なタスクのギャップを著しく狭めます。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:04:32 GMT)
Seeing with You: Perception-Reasoning Coevolution for Multimodal Reasoning [30.6] 本稿では,共有ポリシを備えたデュアルロールRLVRフレームワークであるPRCO(Perception-Reasoning Coevolution)を紹介する。
PRCOは,ベースモデルと比較して,平均精度で7ポイント以上,モデルスケール間で一貫した改善が得られた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:03:56 GMT)
Generalizable Detection of AI Generated Images with Large Models and Fuzzy Decision Tree [30.2] 悪意のある使用とAI生成画像の普及は、デジタルコンテンツの信頼性に深刻な脅威をもたらす。
既存の検出方法は、生成パイプライン内の一般的な操作ステップによって残された低レベルのアーティファクトを利用する。
本稿では,ファジィ決定木を介して,軽量な人工物認識検出器とMLLMを統合したAI生成画像検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:43:14 GMT)
ToLL: Topological Layout Learning with Structural Multi-view Augmentation for 3D Scene Graph Pretraining [29.8] 3D Scene Graph (3DSG) 生成は空間的理解と意味認識において重要な役割を担っている。
現在のソリューションは主に、クロスモーダル支援表現学習とオブジェクト中心生成事前学習に焦点を当てている。
3DSG事前学習のためのトポロジカルレイアウト学習(ToLL)を提案する。
より詳しくは,GNNを用いたアンカー・コンディショントポロジカル・ジオメトリ・推論を設計し,空間的なアンカーからゼロ中心部分グラフのグローバルなレイアウトを復元する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:43:52 GMT)
SonoWorld: From One Image to a 3D Audio-Visual Scene [29.6] 本稿では,1枚の画像から3次元映像を生成するImage2AVSceneを紹介する。
私たちは、この問題に最初に取り組むフレームワークであるSanoWorldを紹介します。
また,1ショットの音響学習と空間的音源分離への応用を実演する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:57:47 GMT)
A Position Statement on Endovascular Models and Effectiveness Metrics for Mechanical Thrombectomy Navigation, on behalf of the Stakeholder Taskforce for AI-assisted Robotic Thrombectomy (START) [29.4] 21世紀半ばの医学的課題の1つは脳卒中の増加である。
地理的に多様な集団における機械式血栓摘出術へのタイムリーなアクセスを改善する解決策の1つは、ロボット手術システムの配備である。
我々の目的は、血栓摘出のためのAI支援ロボットの開発と検証のためのコンセンサスフレームワークを確立することであった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:47:32 GMT)
SARL: Label-Free Reinforcement Learning by Rewarding Reasoning Topology [29.2] 中間的思考段階から応答ごとの推論マップを構築するラベルフリーフレームワークである構造認識強化学習(SARL)を導入する。
Qwen3-4B実験の結果,SARLは地上の真理に基づくRLと先行のラベルのないRLベースラインを超越していることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:54:48 GMT)
ResAdapt: Adaptive Resolution for Efficient Multimodal Reasoning [28.2] ResAdaptは入力側適応フレームワークで、エンコーディングする前に各フレームがどれだけの視覚的予算を受け取るべきかを学ぶ。
同じビジュアル予算で最大16倍のフレームをサポートし、15%以上のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:57:32 GMT)
EpiPersona: Persona Projection and Episode Coupling for Pluralistic Preference Modeling [28.0] 明示的なペルソナ・エピソード結合のためのフレームワークであるEpiPersonaを紹介する。
EpiPersonaはまず、ノイズの多い好みのフィードバックを低次元のペルソナ空間に投影する。
そして、推定されたペルソナ表現を現在のエピソードと結合し、エピソード認識の嗜好予測を可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:04:24 GMT)
Tac2Real: Reliable and GPU Visuotactile Simulation for Online Reinforcement Learning and Zero-Shot Real-World Deployment [27.6] 本稿では,オンラインRL学習の効率化を目的としたビゾタクタクタブルシミュレーションフレームワークであるTac2Realを提案する。
Tac2Realは、PNCG-IPC(Preconditioned Conjugate Gradient Incremental Potential Contact)法とマルチノード、マルチGPUハイスループット並列シミュレーションアーキテクチャを統合する。
我々は,接触豊富なペグ挿入タスクにおけるTac2Realの評価を行い,実世界のシナリオにおいてゼロショット転送の結果が高い成功率を達成し,我々のフレームワークの有効性と堅牢性を検証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:14:37 GMT)
Memory-Augmented Vision-Language Agents for Persistent and Semantically Consistent Object Captioning [27.5] VLM(Vision-Language Models)はしばしば、視点を越えて同じオブジェクトの一貫性のない記述をもたらす。
本稿では,データアソシエーション,オブジェクトキャプション,探索ポリシを同時に処理するメモリ拡張型ビジョンランゲージエージェントを提案する。
標準キャプションスコアでは+11.86%、ベースラインモデルでは+7.39%の改善が見られた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:01:07 GMT)
Control Without Control: Defining Implicit Interaction Paradigms for Autonomous Assistive Robots [27.3] 従来開発された2つのシステムを設計事例として提示し、暗黙的な制御を探索する。
暗黙的な制御では、自律ロボットの動作は、いくつかの直接的な入力ではなく、ユーザの自然な振る舞いの手がかりに基づいて修正される。
両事例の定性的フィードバックの新たなテーマ分析から,効果的な暗黙的制御のための設計により,認識された作業負荷の低減とユーザの制御感覚の維持が可能であることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:33:32 GMT)
Gen-Searcher: Reinforcing Agentic Search for Image Generation [27.1] 我々はGen-Searcherを画像生成エージェントを訓練する最初の試みとして紹介する。
我々は,画像生成に検索対象外的知識を明示的に要求するベンチマークであるKnowGenを紹介する。
実験の結果、Gen-SearcherはQwen-ImageをKnowGenで16ポイント改善し、WISEで15ポイント改善した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:56 GMT)
CoE: Collaborative Entropy for Uncertainty Quantification in Agentic Multi-LLM Systems [27.1] マルチLLMシステムにおける不確実性推定は、主に単一モデル中心である。
複数LLM協調における意味的不確実性のための統合情報理論計量である協調エントロピー(CoE)を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:28:26 GMT)
Corruption-robust Offline Multi-agent Reinforcement Learning From Human Feedback [26.7] 人間のフィードバックによるオフラインマルチエージェント強化学習におけるデータの破損に対する堅牢性について考察する。
線形マルコフゲーム(英語版)の枠組みを用いて問題をモデル化する。
我々の知る限りでは、これはオフラインのMARLHFにおけるデータ破損に対する最初の体系的な治療である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:03:36 GMT)
Hg-I2P: Bridging Modalities for Generalizable Image-to-Point-Cloud Registration via Heterogeneous Graphs [26.5] イメージ・ツー・ポイント・クラウド(I2P)登録は、信頼性の高い2D-3D対応を確立することで、2Dイメージを3Dポイント・クラウドに整列することを目的としている。
我々はHg-I2Pと呼ばれる不均一グラフ埋め込みI2P登録法を提案する。
クロスドメイン設定下での屋内および屋外の6つのベンチマーク実験により、Hg-I2Pは一般化と精度の両方で既存の手法よりも著しく優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:45:27 GMT)
Heddle: A Distributed Orchestration System for Agentic RL Rollout [26.4] Heddleはエージェントロールアウトの実行を最適化するトラジェクトリ中心のシステムである。
Heddleは、長時間のボトルネックを効果的に中和し、最大2.5$times$高いエンドツーエンドのロールアウトスループットを実現します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:01:32 GMT)
Drift-AR: Single-Step Visual Autoregressive Generation via Anti-Symmetric Drifting [25.6] 自己回帰(AR)-拡散ハイブリッドパラダイムは、ARの構造的セマンティックモデリングと拡散の高忠実性合成を組み合わせるが、二重速度ボトルネックに悩まされる。
エントロピー信号を利用して両段階を高速化する textbfDrift-AR を提案する。
MAR、TransDiff、NextStep-1の実験では、3.8--5.5$times$ speedup with original 1-NFE decoding, matching or overing original quality。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:29:00 GMT)
The Surprising Effectiveness of Noise Pretraining for Implicit Neural Representations [25.5] 我々は様々な雑音のクラスに暗黙的神経表現(INR)を事前訓練し、未知の信号に適合し、逆撮像タスク(デノジング)の先行情報をエンコードする能力を測定する。
画像データと映像データを解析した結果,非構造雑音に対する事前学習は,他のすべてのベースラインと比較して信号の取付け能力を向上させることがわかった。
この発見により、十分な事前のドメイン固有データを持たないアプリケーションにおいて、より効率的なINRトレーニングが可能になる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:01:00 GMT)
Learning Multi-View Spatial Reasoning from Cross-View Relations [25.5] Cross-View Relations (XVR)は、複数のビューにまたがる空間的推論を教えるために設計された大規模なデータセットである。
XVRは18Kの多様な3Dシーンと70Kのロボット操作トラジェクトリから得られた100Kの視覚探索回答サンプルで構成されている。
本研究は,多視点空間関係の明示的なトレーニングにより,多視点推論と実世界のロボット操作への効果的移行が著しく促進されることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:42:25 GMT)
Lindbladian Simulation with Commutator Bounds [25.0] 我々は、リンドブラディアンシミュレーションのための可換器ベースのトロッター誤差境界を導出する。
演算子のスケーリングを維持しながら多対数精度を達成するためにリチャードソン補間を適用する。
局所リンドブラディアンでは, トロッター法がシステム規模スケーリングにおいて, 従来のシミュレーション手法より優れていたことを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:51:50 GMT)
Robust Remote Sensing Image-Text Retrieval with Noisy Correspondence [24.9] 本稿では、人間の認知学習パターンを模倣する自己評価学習戦略を設計する、新しいロバストリモートセンシング画像-テキスト検索(RRSITR)パラダイムを提案する。
3つの人気のあるベンチマークデータセットの実験により、提案されたRRSITRは最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:55:07 GMT)
Generating Humanless Environment Walkthroughs from Egocentric Walking Tour Videos [24.5] エゴセントリックな「ウォーキングツアー」ビデオは、世界中の環境のリッチで多様な視覚モデルを開発するために、画像データの豊富なソースを提供する。
我々は、人間とその関連する影効果をウォーキングツアービデオからリアルに除去できる生成アルゴリズムを開発することで、この問題に対処することに集中する。
その結果,都市部の3D/4Dモデルの構築に成功した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:08:46 GMT)
RehearsalNeRF: Decoupling Intrinsic Neural Fields of Dynamic Illuminations for Scene Editing [24.5] RehearsalNeRF(リハーサルNeRF)という,重度の照明条件下での非絡み合いの学習に有効な手法を提案する。
私たちのキーとなるアイデアは、リハーサルステージのような安定した照明の下で撮影されたシーンを活用することです。
我々のリハーサルNeRFは、市販のインタラクティブマスクを採用するだけで、動的物体の神経場を再構築することができる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:49:36 GMT)
Adapting SAM to Nuclei Instance Segmentation and Classification via Cooperative Fine-Grained Refinement [24.4] 本稿では,SAMの協調微粒化という,パラメータ効率のよい微粒化フレームワークを提案する。
これら3つのコンポーネントは、局所的な知覚を高め、空間的詳細を保存し、境界を洗練するために協調して働き、SAMは正確な核インスタンスのセグメンテーションを直接実行することができる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:39:07 GMT)
SesQ: A Surface Electrostatic Simulator for Precise Energy Participation Ratio Simulation in Superconducting Qubits [23.8] SesQは、EPRの正確なシミュレーションに適した表面積分方程式シミュレータである。
SesQは低損失超伝導量子回路の自動設計のための強力なツールである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:51:55 GMT)
Synergy: A Next-Generation General-Purpose Agent for Open Agentic Web [23.8] 次世代のAIエージェントはエージェント市民でなければならないと我々は主張する。
Synergyは汎用エージェントアーキテクチャであり、永続的で協調的で進化するエージェントのためのランタイムハーネスである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:35:37 GMT)
Dual Perspectives in Emotion Attribution: A Generator-Interpreter Framework for Cross-Cultural Analysis of Emotion in LLMs [23.4] 大きな言語モデル(LLM)は、人間の感情を理解し、適応するために、異文化のシステムでますます使われている。
本稿では,表現と解釈の両方を考慮し,感情帰属の両視点を捉えるジェネレータ・インタプリタ・フレームワークを提案する。
分析の結果,パフォーマンスの変化は感情の種類や文化の文脈によって異なることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:32:17 GMT)
QCFuse: Query-Centric Cache Fusion for Efficient RAG Inference [23.2] QCFuseは、ユーザクエリを中心とした革新的なKVキャッシュ融合システムである。
QCFuseはLLMの応答効率を40%向上させる。
特定のシナリオでは、QCFuseはより高い応答精度をもたらす注意喚起効果を達成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:55:25 GMT)
Let the Abyss Stare Back Adaptive Falsification for Autonomous Scientific Discovery [23.0] DASESは、科学評価のためのファルシフィケーション駆動のフレームワークである。
科学的アーティファクトと科学的に許容される反例環境を、固定された科学的契約の下で共同で発展させる。
許容されるファルシフィケーションフロンティアを生き残る最初の候補を特定し、合成発見環境を超えた損失であるFNG-CEを発見する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:21:27 GMT)
ELViS: Efficient Visual Similarity from Local Descriptors that Generalizes Across Domains [22.8] 本稿では,画像と画像の類似性モデルであるELViSを紹介する。
従来の手法とは異なり、我々のモデルは表現空間ではなく類似性空間で機能する。
この設計は強い帰納バイアスを注入し、単純で効率的で解釈可能なモデルをもたらす。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:53:42 GMT)
Unbiased Multimodal Reranking for Long-Tail Short-Video Search [22.6] ショートビデオ検索エンジンのKuaishouは、毎日何十億もの検索を提供している。
わずかなユーザー行動データが、低品質のコンテンツを増幅するモデルを引き起こす。
本稿では,実際のユーザ動作を伴わないユーザエクスペリエンスを推定するマルチモーダル・リグレード・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:37:20 GMT)
SVGS: Single-View to 3D Object Editing via Gaussian Splatting [22.3] SVGS(Single-View to 3D Object Editing via Gaussian Splatting)は、3D Gaussian Splatting(3DGS)に基づくテキスト駆動編集技術である。
本稿では,一貫した編集結果が得られるビューのみを活用することで,多視点拡散モデルに基づく単一視点編集戦略を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:45:03 GMT)
A Learning-Based Cooperative Coevolution Framework for Heterogeneous Large-Scale Global Optimization [22.0] 我々はLH-CC(Learning-based Heterogeneous Coevolution Framework)を提案する。
LH-CCは各H-LSGO問題インスタンスに対して最適なサブプロブレムを適応的に選択する。
その結果, 動的選択は, 複雑なH-LSGO問題を解く上で重要な戦略であることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:18:05 GMT)
Robust Multi-Agent Reinforcement Learning for Small UAS Separation Assurance under GPS Degradation and Spoofing [21.9] 小型無人航空機システム(sUAS)のGPS劣化とスプーフィング下でのロバストな分離保証について検討する。
この式は,2次精度で,真に最悪の逆方向の摂動を近似することを示す。
高密度sUASシミュレーションでは, 破壊レベルが最大35%に達するとほぼゼロに近い衝突速度が観測され, 対向的摂動を伴わない基本方針よりも優れていた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:26:59 GMT)
An Underexplored Frontier: Large Language Models for Rare Disease Patient Education and Communication -- A scoping review [21.5] 大規模言語モデルは、患者の教育とコミュニケーションを支援する機会を提供するが、希少な疾患への応用は未だ不明である。
我々は,2022年1月から2026年3月にかけて,主要なデータベースを対象としたスコーピングレビューを行った。
この文献は非常に最近のものであり、汎用モデル、特にChatGPTに支配されている。
評価は主に正確性に重点を置いており、可読性、共感性、コミュニケーション品質といった患者中心の次元に限定されている。
今後の研究は、患者中心の設計、ドメイン適応手法、および現実世界の展開を優先して、まれな疾患における安全で適応的で効果的なコミュニケーションをサポートするべきである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:14:48 GMT)
Mixture-Model Preference Learning for Many-Objective Bayesian Optimization [21.5] そこで本研究では,潜在性選好アーチタイプを学習するベイズ的枠組みを提案する。
モードアイデンティティやモード内トレードオフに関する情報をターゲットとしたハイブリッドクエリを設計する。
提案手法は, 合成および実世界の多目的ベンチマークにおいて, 標準ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:18:43 GMT)
CARV: A Diagnostic Benchmark for Compositional Analogical Reasoning in Multimodal LLMs [21.2] 本稿では,CARV(Compositional Analogical Reasoning in Vision)を紹介する。
各ペアからシンボリックルールを抽出し、新しい変換を構成するMLLMを必要とする。
Gemini-2.5 Proでさえ40.4%の精度しか達成していない。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:22:30 GMT)
InkDrop: Invisible Backdoor Attacks Against Dataset Condensation [20.9] InkDropは、モデルユーティリティを劣化させることなく悪質な操作を検知しにくくする。
InkDropは、まずターゲット決定境界付近の候補サンプルを選択し、ターゲットクラスに潜在的なセマンティック親和性を示す。
実験では、InkDropの全体的な有効性を検証するとともに、敵の意図を凝縮したデータセットに統合する能力を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:49:08 GMT)
Evaluating Privilege Usage of Agents on Real-World Tools [20.8] GrantBoxはエージェントの特権利用を分析するためのセキュリティ評価サンドボックスである。
GrantBoxは、現実世界のツールを自動的に統合し、LLMエージェントが真の特権を呼び出せるようにする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:35:00 GMT)
Wherefore Art Thou? Provenance-Guided Automatic Online Debugging with Lumos [20.6] Lumosは、アプリケーションレベルのバグ前例を公開するオンラインフレームワークである。
これにより、開発者はバグの根本原因を特定するのに十分なエビデンスを得られると同時に、実行時のオーバーヘッドも少なくなります。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:19:50 GMT)
EpiScreen: Early Epilepsy Detection from Electronic Health Records with Large Language Models [20.3] われわれは,早期てんかん検出のための低コストで効果的なアプローチであるEpiScreenを開発した。
EpiScreenは、電子健康記録から定期的に収集された臨床記録を使用する。
臨床とAIのコラボレーション環境では、エピスクレインを補助する神経科医は、未発見の専門家を最大10.9%上回った。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:16:08 GMT)
Event-Based Method for High-Speed 3D Deformation Measurement under Extreme Illumination Conditions [20.2] 宇宙発射塔や吊り橋のような大きなエンジニアリング構造は、高速な3D変形を引き起こす極端な力によって引き起こされる。
従来のカメラは、しばしば強い光の強度を扱うのに苦労し、ダイナミックレンジが限られているため、露出過多につながる。
イベントカメラは、高ダイナミックレンジと低レイテンシのアプリケーションにおいて、従来のカメラに代わる魅力的な代替品として登場した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:25:09 GMT)
Observable Channels, Not Just Storage: Evaluating Privacy Leakage in LLM Agent Pipelines [19.6] CIPLは、センシティブなソース、選択、アセンブリ、実行、観察、抽出段階を通じてターゲットを表現する共有方法を提供する。
メモリは、ほぼ飽和した高リスクの特別なケースとして振る舞うが、メモリ外リークは異なる状態を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:54:59 GMT)
Beyond Message Passing: Toward Semantically Aligned Agent Communication [19.4] エージェント通信プロトコルは,大規模言語モデル(LLM)システムにとって重要な基盤になりつつある。
この研究は、エージェントコミュニケーションをコミュニケーション、構文、セマンティックという3つの層にまとめることで、この新興の風景を人間にインスパイアされた視点で表現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:40:30 GMT)
JaWildText: A Benchmark for Vision-Language Models on Japanese Scene Text Understanding [19.3] JaWildTextは、日本語シーンテキスト理解における視覚言語モデル(VLM)の評価のための診断ベンチマークである。
日本では新たに撮影された2,961枚の画像から,241件のインスタンスがあり,3,643種類の注釈付き文字が12万件ある。
視覚的組織、出力形式、書き方で異なる3つの補完的なタスクから構成される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:36:16 GMT)
Beyond Static Vision: Scene Dynamic Field Unlocks Intuitive Physics Understanding in Multi-modal Large Language Models [19.0] 本研究は、物理推論の第一段階、すなわち直感的な物理理解を考察し、連続体物体の力学を理解する上でのかなりの制限を明らかにする。
SDF(Scene Dynamic Field)は,マルチタスクファインチューニングフレームワーク内で物理シミュレータを利用する簡潔な手法である。
SDFは性能を大幅に改善し、流体タスクで最大20.7%のゲインを達成し、未確認の物理領域に強力な一般化を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:11:45 GMT)
Rethinking Structure Preservation in Text-Guided Image Editing with Visual Autoregressive Models [18.6] 本稿では,視覚自己回帰(VAR)モデルにおける中間特徴分布の解析に根ざした,新たなテキスト誘導画像編集フレームワークを提案する。
まず、編集可能な領域を洗練し、編集精度と背景保存のバランスをとる、粗いトークンの局所化戦略を導入する。
第2に、VARモデルの中間表現を分析し、構造に関連した特徴を同定し、単純で効果的な特徴注入機構を設計する。
第3に,拡張学習に基づく適応的特徴注入方式を開発し,スケール比と層比を自動で学習し,編集精度と構造保存を協調的に最適化する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:35:33 GMT)
SkillRouter: Skill Routing for LLM Agents at Scale [18.5] ユーザタスクが与えられたら、システムは、下流の計画や実行の前に、関連するスキルを特定する必要がある。
既存のエージェントスタックはプログレッシブな開示に依存しており、完全な実装ボディを隠蔽しながら、スキル名と記述のみを公開する。
1.2Bのコンパクトなフルテキスト検索/参照パイプラインであるSkillを提示する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:19:32 GMT)
Reducing Oracle Feedback with Vision-Language Embeddings for Preference-Based RL [18.5] ROVEDは、VLEベースの監視とターゲットとするオラクルフィードバックを組み合わせたハイブリッドフレームワークである。
提案手法では,VLEを用いてセグメントレベルの嗜好を生成し,不確実性の高いサンプルのみをオラクルにフェールさせる。
複数のロボット操作タスクにまたがって、ROVEDは事前の嗜好ベースのメソッドにマッチまたは超過し、オラクルクエリを最大80%削減する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:33:55 GMT)
TIEG-Youpu Solution for NeurIPS 2022 WikiKG90Mv2-LSC [18.4] 我々は,NeurIPS 2022でWikiKG90Mv2のグラフ埋め込みモデルを構築した。
本稿では,構造的および意味論的に類似した候補を求めるために,優先的な埋め込み検索モデルを提案する。
次に,隣り合う拡張表現を用いたアンサンブルに基づく再ランク付けモデルを提案し,最終的なリンク予測結果を生成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:45:30 GMT)
Efficient Quantum Algorithm for Robust Training [18.3] アドリアリトレーニングは、機械学習システムにおける悪意ある入力摂動に対する標準的な防御である。
ここでは局所的安定性と疎性仮定の下で、プロジェクテッド・グラディエント・ロバストなトレーニングのためのエンドツーエンドの量子プロシージャを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:03:16 GMT)
Voice-Controlled Scratch for Children with (Motor) Disabilities [18.3] 我々は,音声制御によるScratchのコード編集を可能にするアプローチであるMeowCrophoneを紹介する。
MeowCrophoneは、クリック要素、ブロックの配置、マルチモーダル音声ユーザインターフェースによるワークスペースのナビゲートをサポートする。
MeowCrophoneのパイプラインは結果を82.8%改善し、単純なコマンドは96.9%の精度に達した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:19:12 GMT)
$AutoDrive\text{-}P^3$: Unified Chain of Perception-Prediction-Planning Thought via Reinforcement Fine-Tuning [18.0] いくつかの視覚言語モデル(VLM)は、チェーン・オブ・ソート(CoT)推論なしで直接計画結果を出力する。
OtherVLMは、知覚、予測、計画タスクのための出力を生成するが、断片化された意思決定アプローチを採用する。
構造化推論による$textbfP$erception, $textbfP$rediction, $textbfP$lanningをシームレスに統合する新しいフレームワークである$Drivetext-P3$を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:28:41 GMT)
Graphilosophy: Graph-Based Digital Humanities Computing with The Four Books [18.0] この論文は、グラフ哲学を導入することによって、AIと古典哲学を橋渡しする。
このフレームワークは、バイリンガルの中国語-ベトナム語コーパスを解釈的に基盤化されたリソースに変換する。
言語的、概念的、解釈的な関係を相互接続層にエンコードする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:57:07 GMT)
MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models [17.7] 大規模言語モデル(LLM)は、最終的な出力に対して必ずしも因果的ではない思考の連鎖(CoT)を生成することができる。
本研究では,LCMのCoT監視性を評価するためのベンチマークである MonitorBench を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:37:42 GMT)
SHOW3D: Capturing Scenes of 3D Hands and Objects in the Wild [17.6] 既存のハンドオブジェクトインタラクションデータセットは、主にコントロールされたスタジオ設定でキャプチャされる。
そこで本研究では,非拘束の移動性を実現するためのマーカーレスマルチカメラシステムを提案する。
SHOW3Dは3Dアノテーションを付加した最初の大規模データセットであり、様々な現実世界環境におけるオブジェクトとのインタラクションを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:58:27 GMT)
CoT2-Meta: Budgeted Metacognitive Control for Test-Time Reasoning [17.4] CoT2-Metaはトレーニング不要なメタ認知推論フレームワークである。
オブジェクトレベルの連鎖生成と部分的推論軌道に対するメタレベルの制御を組み合わせる。
強いシングルパス、サンプリングベース、検索ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:59:47 GMT)
Trojan-Speak: Bypassing Constitutional Classifiers with No Jailbreak Tax via Adversarial Finetuning [17.3] 本稿では, 対人的微調整法であるTrojanSpeakを紹介する。
本手法では,LLMに基づくコンテンツ分類を回避するためのコミュニケーションプロトコルをモデルに教えるために,カリキュラム学習とハイブリッド強化学習を組み合わせる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:10:28 GMT)
GenFusion: Feed-forward Human Performance Capture via Progressive Canonical Space Updates [17.3] 単眼のRGBストリームからパフォーマーの新たなビューを描画するフィードフォワード人間パフォーマンスキャプチャ手法を提案する。
我々は、各フレームで徐々に更新される標準空間を維持することで、より多くのボディパーツが観測可能であるという事実を生かしている。
この標準空間は、時間とともに外観情報を蓄積し、現在のライブフレームに直接観測が欠落している場合にコンテキストバンクとして機能する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:55:00 GMT)
Moving Beyond Review: Applying Language Models to Planning and Translation in Reflection [17.2] 本稿では,大規模言語モデル (LLM) の最初の適用方法を提案する。
Penséeは、会話エージェントを使用して構造化されたリフレクション計画を構築することで、これらのステージにおける明示的なAIサポートの効果を探求するツールである。
その結果,学習者が文章認知プロセス理論の計画と翻訳の段階で支援を受けると,反射深度と構造的品質が著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:42:38 GMT)
osmAG-Nav: A Hierarchical Semantic Topometric Navigation Stack for Robust Lifelong Indoor Autonomy [17.1] osmAG-Navは、階層的セマンティックOpenStreetMap Area Graph (osmAG)マップ標準に基づいて構築された、完全なオープンソースのROS2ナビゲーションスタックである。
システムは「システム・オブ・システム」アーキテクチャに従い、グローバルな推論を局所的なメートル法実行から切り離す。
現実世界の屋内キャンパスの実験では、同じフロアのベンチマークサブセットで、osmAG-Navはグリッドベースのベースラインの長いルートよりも7816倍低い計画遅延を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:54:14 GMT)
Gleanmer: A 6 mW SoC for Real-Time 3D Gaussian Occupancy Mapping [17.0] ガウスアンを用いた3次元占有マップであるGMMapのアクセラレーターを備えたチップ(SoC)システムであるGleanmerについて述べる。
Gleanmerは、構築エネルギーとクエリエネルギーを最大63%、クエリエネルギーを81%削減する。
16nm CMOSを用いて640x480の画像をリアルタイムで処理し、マップ構築時には88fpsを超え、マップクエリ時には毎秒540Kの座標が処理される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:08:52 GMT)
Automatic Analysis of Collaboration Through Human Conversational Data Resources: A Review [17.0] 我々は,協調の言語的側面に着目し,タスク指向の会話リソースを用いた協調分析のレビューを行う。
我々は,タスク指向の人間と人間の会話データを協調分析に活用する方法の課題に対処することを目的とする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:25:20 GMT)
AffordMatcher: Affordance Learning in 3D Scenes from Visual Signifiers [16.5] AffordBridgeは、291,637の関数型相互作用アノテーションを備えた大規模データセットで、685の高解像度屋内シーンを点雲として紹介する。
我々のアベイランスアノテーションは、シーン内の同じインスタンスにリンクされたRGBイメージによって補完されます。
AffordMatcherは,キーポイントマッチングのための画像ベースとポイントクラウドベースのインスタンス間のコヒーレントなセマンティック対応を確立する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:47:55 GMT)
A Pontryagin Method of Model-based Reinforcement Learning via Hamiltonian Actor-Critic [16.5] Hamiltonian Actor-Critic (HAC) は、明示的な値関数学習を排除したモデルベースのアプローチである。
値近似を避けることにより、HACは収束保証を認めながらモデルエラーに対する感度を低下させる。
限られたデータを持つオフライン設定では、HACは最先端のメソッドと一致または超過し、その強いサンプル効率を強調する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:14:19 GMT)
Safeguarding LLMs Against Misuse and AI-Driven Malware Using Steganographic Canaries [16.4] AIを利用したマルウェアは、クラウドでホストされた生成AIサービスや大規模言語モデルを活用する傾向にある。
両方の脅威はAIサービスの取り込みバウンダリに収束するが、既存の防御はエンドポイントとネットワーク周辺に重点を置いている。
本稿では, 統計カナリアファイルに基づくフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:40:55 GMT)
EnsemJudge: Enhancing Reliability in Chinese LLM-Generated Text Detection through Diverse Model Ensembles [16.4] EnsemJudgeは中国語のLLM生成テキストを検出するための堅牢なフレームワークである。
NLPCC2025 Shared Task 1 で構築した中国語データセットを用いて,本システムの訓練と評価を行った。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:50:46 GMT)
FlowHijack: A Dynamics-Aware Backdoor Attack on Flow-Matching Vision-Language-Action Models [16.1] FlowHijackは、フローマッチングVLAの基盤となるベクトルフィールドダイナミクスを体系的にターゲットする最初のバックドアアタックフレームワークである。
本研究は, 連続体化モデルにおける重大な脆弱性を明らかにし, モデル内部の生成動態を標的とした防衛の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:54:04 GMT)
C2RustXW: Program-Structure-Aware C-to-Rust Translation via Program Analysis and LLM [16.1] Toolは、プログラム解析をLLM(Large Language Models)と統合したプログラム構造対応C-to-Rust翻訳アプローチである。
CodeNetの100%構文上の正しさとGitHubの97.78%を実現し、コードサイズ(43.70%まで)と安全でない使用率(5.75%まで)を大幅に削減した。
プロジェクトのレベルでは、ツールが完全な構文的正しさと平均意味論的正しさを78.87%達成し、実用的でスケーラブルなC-to-Rustマイグレーションの有効性を実証している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:07:11 GMT)
Democratizing Federated Learning with Blockchain and Multi-Task Peer Prediction [16.0] 本稿では,ブロックチェーン技術とマルチタスクピア予測を用いて,AIトレーニングプロセスを分散化する新しい概念を提案する。
スマートコントラクトと暗号を活用してトレーニングプロセスへのコントリビューションをインセンティブ化することで、AIとブロックチェーンの相互メリットを活用することを目指している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:42:56 GMT)
LIBERO-Para: A Diagnostic Benchmark and Metrics for Paraphrase Robustness in VLA Models [16.0] 本稿では,言語一般化の詳細な解析のためのベンチマークであるLIBERO-Paraを紹介する。
パラフレージングにより22-52ppの連続的な性能劣化が観察された。
本稿では,意味的因子と構文的因子を用いてパラフレーズの難易度を定量化する指標PRIDEを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:27:34 GMT)
FL-PBM: Pre-Training Backdoor Mitigation for Federated Learning [15.9] バックドア攻撃は、人工知能(AI)モデルの完全性と信頼性に重大な脅威をもたらす。
本稿では,フェデレートラーニングのための事前学習バックドア緩和を提案する。
フェデレートされた学習環境において、モデルトレーニングの前に、クライアント側の有毒データを積極的にフィルタリングする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:56:38 GMT)
To View Transform or Not to View Transform: NeRF-based Pre-training Perspective [15.7] 本研究では, 連続した3次元表現を学習し, ビュー変換の誤りを回避できる新しいNeRF-Resembled Pointベースの3D検出器を提案する。
NeRP3Dは、タスクに関わらず、事前訓練されたNeRFネットワークを保持し、連続した3D表現学習の原則を継承する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:46:34 GMT)
CirrusBench: Evaluating LLM-based Agents Beyond Correctness in Real-World Cloud Service Environments [15.6] 我々はCirrusBenchを紹介した。CirrusBenchは、実際のクラウドサービスチケットから得られる実世界のデータの基盤によって区別される、新しい評価フレームワークである。
CirrusBenchは、複雑なマルチターン論理チェーンと、サービス環境固有の現実的なツール依存を保存する。
我々のフレームワークを利用した実験により、最先端のモデルは強力な推論能力を示す一方で、複雑な現実的なマルチターンタスクでしばしば苦労していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:26:00 GMT)
COvolve: Adversarial Co-Evolution of Large-Language-Model-Generated Policies and Environments via Two-Player Zero-Sum Game [15.6] Covolveは継続的改善エージェントを構築するための共進化的なフレームワークである。
実行可能Pythonコードとして表現された環境とエージェントポリシーの両方を生成する。
この結果は,オープンエンド学習を実現するためのLLM駆動型共進化の可能性を示すものである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:56:54 GMT)
SUMMIR: A Hallucination-Aware Framework for Ranking Sports Insights from LLMs [15.4] 本稿では,試合前後に発行された記事から,ゲーム前やポストゲーム後の意味のある洞察を自動的に抽出する作業について述べる。
我々は、クリケット、サッカー、バスケットボール、野球の4つの主要なスポーツの800試合をカバーする7900のニュース記事のデータセットをキュレートする。
本研究は, 高品質で関連性の高い洞察を生み出す上でのこのアプローチの有効性を実証するとともに, LLM間での現実的一貫性と面白さの有意な差異を明らかにした。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:45:15 GMT)
Cost-Matching Model Predictive Control for Efficient Reinforcement Learning in Humanoid Locomotion [15.1] モデル予測制御(MPC)に基づく強化学習フレームワークにおいて,最適なヒューマノイド移動のためのコストマッチング手法を提案する。
高忠実度閉ループデータから得られる作用値関数を近似するために、遠心力学を用いたパラメータ化MPC定式化を訓練する。
その結果, モデルミスマッチと外乱に対するロコモーション性能とロバスト性の改善が示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:05:15 GMT)
OptiMer: Optimal Distribution Vector Merging Is Better than Data Mixing for Continual Pre-Training [14.6] トレーニングから比選択を分離するOptiMerを提案する。
Gemma 3 27Bの言語(日本語、中国語)およびドメイン(Math, Code)における実験
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:02 GMT)
Effort-Based Criticality Metrics for Evaluating 3D Perception Errors in Autonomous Driving [14.6] 時間対衝突のような臨界度は衝突の緊急度を定量化するが、知覚エラーの結果を説明できる。
本稿では,False Speed ReductionとMaximum Deceleration Rateの2つの新しい取り組みベースの指標を提案する。
3つの指標はいずれも、確立された時間ベース、減速ベース、あるいは正規化臨界対策に到達できない安全関連情報を捉えている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:46:03 GMT)
When Choices Become Priors: Contrastive Decoding for Scientific Figure Multiple-Choice QA [14.6] SCICONは、画像条件付きからテキストのみのオプションスコアを減じて、各候補をスコアする訓練不要の復号法である。
3つの科学的フィギュアQAベンチマークと3つのモデルバックボーンで、SCICONは標準デコードベースラインよりも精度を一貫して改善する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:38:28 GMT)
Pandora: Articulated 3D Scene Graphs from Egocentric Vision [14.4] 第一人マップ」は、その具現化やスキルセットによってロボット自身の限界を継承する。
我々は、人間として捉えた自我中心のデータを、Project Ariaグラスを装着したシーンで自然に探索する方法を示す。
また、これらのモデルを3次元シーングラフ表現に統合する方法を示し、オブジェクトのダイナミクスとオブジェクトとコンテナの関係をよりよく理解する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:47:07 GMT)
Securing Elliptic Curve Cryptocurrencies against Quantum Vulnerabilities: Resource Estimates and Mitigations [14.4] 256ビット楕円曲線離散対数問題に対する新しい資源推定法
最初の高速クロックのCRQCは、一部の暗号通貨の公開メムプールトランザクションに対するオンスペンド攻撃を可能にする。
脆弱な暗号通貨コミュニティに、ポスト量子暗号への移行への参加を要請します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:25 GMT)
Graphitic-C3N4/TiO2(B) S-scheme Heterojunctions for Efficient Photocatalytic H2 Production and Organic Pollution Degradation [14.2] TiO2(B)ナノロッドとg-C3N4ナノシートをカップリングしてS-スキームヘテロ接合光触媒を構築する。
シミュレーションされた太陽光照射の下では、ヘテロ接合はメタノールによる水還元のために1.98mmol g-1 h-1のH2進化速度をもたらす。
溶液の代わりにアモキシシリンの排水に曝されると、ヘテロ接合は98.2%のアモキシシリンを分解し、90分以内にH2の20.70オモールg-1を生成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:21:23 GMT)
On the Accuracy Limits of Sequential Recommender Systems: An Entropy-Based Approach [14.1] 逐次推薦における精度限界の定量化のためのエントロピー誘導学習自由アプローチを開発した。
制御された合成発電機と様々な実世界のベンチマークの実験では、推定器は基線よりもオラクル制御の難しさを忠実に追跡している。
また、新規嗜好、ロングテール露出、アクティビティによってユーザを階層化することで、ユーザグループ診断もサポートする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:57:30 GMT)
Octree-based Learned Point Cloud Geometry Compression: A Lossy Perspective [14.0] 実験結果から,提案した葉ノード損失圧縮法は,従来のオクツリー法よりもオブジェクト点雲の方が有意に優れていた。
提案手法は,LiDAR点雲を微調整することなく,約1%のビット誤差を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:53:56 GMT)
RCLRec: Reverse Curriculum Learning for Modeling Sparse Conversions in Generative Recommendation [13.8] スパース変換管理のための学習ベースGRフレームワークであるRCLRecを提案する。
RCLRecは、変換関連項目のサブシーケンスを履歴から逆の形で選択することで、短いカリキュラムを構築する。
オフラインデータセットの実験とオンラインA/Bテストは、RCLRecが優れたパフォーマンスを実現していることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:41:33 GMT)
Crossing the NL/PL Divide: Information Flow Analysis Across the NL/PL Boundary in LLM-Integrated Code [13.6] LLM API呼び出しは、既存のプログラム分析が渡せない境界を作る。
この境界を橋渡しする最初の情報フロー法を提案する。
実世界の4,154個のPythonファイルから9,083個のプレースホルダー出力ペアをラベル付けします。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:14:24 GMT)
PReD: An LLM-based Foundation Multimodal Model for Electromagnetic Perception, Recognition, and Decision [13.5] PReDは電磁(EM)領域の最初の基礎モデルであり、「知覚、認識、決定」のインテリジェント閉ループをカバーする。
信号検出、変調認識、パラメータ推定、プロトコル認識、無線周波数指紋認識、アンチジャミング決定など、さまざまなコアタスクをサポートする。
エンドツーエンドの信号理解から言語駆動推論や意思決定に至るまで,クローズドループ最適化を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:47:02 GMT)
DongYuan: An LLM-Based Framework for Integrative Chinese and Western Medicine Spleen-Stomach Disorders Diagnosis [13.5] 大言語モデル(LLM)は、統合中国語・西洋医学(ICWM)の文脈において3つの大きな課題に直面している。
高品質なデータがないこと、伝統的な中国医学(TCM)症候群の推論ロジックを西洋医学(WM)の診断と効果的に統合できるモデルがないこと、標準化された評価ベンチマークが欠けていること、などである。
ICWMスプレエンストマチ診断フレームワークであるDongYuanを提案する。具体的には3つのICWMデータセット(SSDF-Syndrome, SSDF-Dialogue, SSDF-PD)を高いギャップを埋めるためにキュレートした。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:56:24 GMT)
Skillful Kilometer-Scale Regional Weather Forecasting via Global and Regional Coupling [13.4] 本稿では,地域気象予報のためのグローバル・リージョン結合フレームワークを提案する。
Transformerベースのグローバルモデルと、新しい双方向結合モジュールであるScaleMixerを介して、高解像度の地域ネットワークを結合する。
このフレームワークは、$0.05circ$(sim 5 mathrmkm$ )で、中国の1時間の解像度で、グリッド化されたリアナリシスデータとリアルタイム気象観測の両方で、運用上のNWPとAIベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:40:36 GMT)
Debt Behind the AI Boom: A Large-Scale Empirical Study of AI-Generated Code in the Wild [13.4] 我々は6,275のGitHubリポジトリから304,362の認証済みAI認証コミットのデータセットを構築します。
484,606の異なる問題を特定し、コードの臭いは最も一般的な型であり、すべての問題の89.1%を占めています。
これらの結果は、AI生成コードは、実際のソフトウェアプロジェクトに長期のメンテナンスコストをもたらす可能性があることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:38:05 GMT)
A Framework for Human-AI Q-Matrix Refinement: A NeuralCDM Evaluation [12.9] 本稿では,大規模言語モデル(LLM)が構造化された誤解認識プロンプトを用いて候補Q行列を生成する,AIQ行列改善のためのフレームワークを提案する。
本フレームワークを熱力学評価データセットに適用し,クラウドサービスモデルに対してローカルにデプロイされたLCMをベンチマークする。
その結果, 繰り返し改良されたLCM生成Q-行列は, エキスパートベースラインモデル適合を超えうることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:05:32 GMT)
FocusVLA: Focused Visual Utilization for Vision-Language-Action Models [12.9] VLA(Vision-Language-Action)モデルは、リッチビジョン言語情報に対する条件付けによってアクション生成を改善する。
FocusVLAは,タスク関連視覚領域にモデルの注意を向け,視覚を効果的に行動にブリッジする新しいパラダイムである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:50:54 GMT)
XSPA: Crafting Imperceptible X-Shaped Sparse Adversarial Perturbations for Transferable Attacks on VLMs [12.8] 視覚言語モデル(VLM)は、タスクを実行するために共有された視覚的テキスト表現空間に依存している。
小さな視覚摂動は共有埋め込み空間を通して伝播し、相関する意味障害を引き起こす。
X字型スパース・ピクチャー・アタック (XSPA) は、2本の対角線に摂動を制限する非受容構造攻撃である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:24:34 GMT)
Flip Stunts on Bicycle Robots using Iterative Motion Imitation [12.7] この研究は、強化学習による自転車ロボットのフロントフリップを実証する。
本稿では,事前ポリシーのロールアウトによって生成された軌跡を反復的に模倣するイテレーティブ・モーション・イミテーションを提案する。
IMIは高い成功率の政策を達成し、実世界へのロバストな移行を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:39:43 GMT)
Decoupling Exploration and Policy Optimization: Uncertainty Guided Tree Search for Hard Exploration [12.5] 本稿では,探査段階におけるRLの活用と回避を明確に分離する新たなパラダイムを提案する。
政策最適化のオーバーヘッドを取り除くことにより,本手法は,ハードなAtariベンチマーク上での本質的なモチベーションベースラインよりも,桁違いに効率よく探索する。
得られた軌跡を既存の教師付き後方学習アルゴリズムを用いて,展開可能なポリシに抽出できることを実証した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:14:06 GMT)
DreamLite: A Lightweight On-Device Unified Model for Image Generation and Editing [12.5] 本稿では、T2I生成とテキスト誘導画像編集の両方を単一のネットワークでサポートする、コンパクトなオンデバイス拡散モデル(0.39B)を提案する。
DreamLiteは刈り取られたモバイルU-Netのバックボーン上に構築され、イメージを入力として統一し、生成タスクに(ターゲット | 空白)設定、編集タスクに(ターゲット | ソース)設定を使用する。
高品質のSFTと強化学習の後、DreamLiteは画像生成のためのGenEval (0.72)、画像編集のためのImgEdit (4.11)を達成し、既存のオンデバイスモデルより優れている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:30:25 GMT)
See it to Place it: Evolving Macro Placements with Vision-Language Models [12.5] チップフロアプランニングにおけるマクロ配置のための視覚言語モデル(VLM)を提案する。
VeoPlaceは、VLMを使用してベースプレーヤの動作をチップキャンバスのサブリージョンに制限することでガイドする新しいフレームワークである。
VeoPlaceは、ピークのワイヤ長が32%を超える10のベンチマークのうち、最も優れた事前学習ベースのアプローチである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:47:34 GMT)
Dogfight Search: A Swarm-Based Optimization Algorithm for Complex Engineering Optimization and Mountainous Terrain Path Planning [12.4] 本論文では,ドッグファイトサーチ(DoS)と呼ばれるメタヒューリスティックなメタヒューリスティックアルゴリズムを提案する。
DoSはアルゴリズムの枠組みをインスピレーションから引き出すが、その探索機構は運動学の変位積分方程式に基づいて構築されている。
DoSは7人の先進選手を抜いて総合成績を上回り、フリードマンランキングで1位となった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:20:54 GMT)
Is the Modality Gap a Bug or a Feature? A Robustness Perspective [12.2] ほぼ全ての現代のマルチモーダルモデルは、2つのモダリティが整列した埋め込み空間を求める。
一定の条件下では、対照的な損失を最小限に抑えれば、2つのモードが分離された表現が得られることを示す。
また、これらの条件下では、モダリティギャップはロバストネスに単調に関係していることが示される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:41:22 GMT)
TerraSky3D: Multi-View Reconstructions of European Landmarks in 4K [12.2] 既存の3Dデータセットは解像度が低いか、少数のシーンに制限されるか、インターネットから取得したさまざまな品質の画像に基づいて、特定のキャプチャシナリオに制限される。
この適切な3Dデータセットが欠如していることに感銘を受けて、我々は5万枚の画像を150の地上、空中、混合シーンに分割した高解像度の大規模3D再構成データセットTerraSky3Dを捉えた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:08:51 GMT)
Learning Partial Action Replacement in Offline MARL [11.9] 部分アクション置換(Partial Action Replacement)は、アクションをデータセットするエージェントのサブセットをアンカーすることで、これを緩和する。
PLCQLは、PARサブセット選択を文脈的帯域幅問題として定式化するフレームワークである。
本研究では,推定誤差が予測されるエージェント数と線形にスケールすることを示す値エラー境界を証明した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:28:13 GMT)
MedLoc-R1: Performance-Aware Curriculum Reward Scheduling for GRPO-Based Medical Visual Grounding [11.8] MedLoc-R1は,医療用視覚グラウンドのための報酬スケジューリングフレームワークである。
当社のフレームワークは,高吸収医療応用におけるRLベース接地のための汎用的で軽量で効果的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:31:21 GMT)
Neural Federated Learning for Livestock Growth Prediction [11.7] 家畜の生育予測は、農業経営の最適化と家畜生産の効率性と持続可能性の向上に不可欠である。
既存のバイオ物理モデルは、固定された定式化に依存しているが、ほとんどの機械学習アプローチは、小さな独立したデータセットで訓練されている。
我々は,家畜の成長予測に特化して設計された,最初のフェデレート学習フレームワークであるLivestockFLを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:29:26 GMT)
Expectation Error Bounds for Transfer Learning in Linear Regression and Linear Neural Networks [11.7] 我々は,主課題の一般化において,補助データがいつ,どのように役立つか,という新たな知見を提供する。
線形回帰については、期待される一般化誤差に対する正確な閉形式式を導出する。
幅$q leq K$の共有表現を持つ線形ニューラルネットワークの場合、K$は補助的なタスクの数である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:50:52 GMT)
KoALa-Bench: Evaluating Large Audio Language Models on Korean Speech Understanding and Faithfulness [11.6] KoALa-Benchは韓国の音声理解と大規模音声言語モデル(LALM)の発話忠実度を評価するためのベンチマークである。
4つのタスクは, 音声認識, 音声翻訳, 音声質問応答, 続く音声指示などの基本的理解能力を評価する。
残りの2つの課題は、複数のLALMが音声のモダリティを完全に活用できないという我々の観察に動機づけられた、音声の忠実さを評価するものである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:13:27 GMT)
Stop Probing, Start Coding: Why Linear Probes and Sparse Autoencoders Fail at Compositional Generalisation [11.6] 重ね合わせの下で、ニューラルネットワークの活性化は、概念を線形混合としてエンコードする。
この設定では、サンプルごとの反復推論を持つ古典的なスパース符号化法は圧縮された検知保証を利用する。
トレーニングセットのサイズ,潜伏次元,空間レベルの差が持続し,SAEが構成シフトで失敗することを示す。
以上の結果から,SAEの失敗は暗黙化の問題ではなく辞書学習の問題であり,拡張性のある辞書学習が重畳下でのスパース推論の鍵となる問題であることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:52:16 GMT)
Progressive Prompt-Guided Cross-Modal Reasoning for Referring Image Segmentation [11.3] 画像セグメンテーションの参照は、自由形式の参照表現に基づいて画像中の対象オブジェクトをローカライズし、セグメンテーションすることを目的としている。
画像セグメンテーションを参考にしたプログレッシブプロンプト誘導型クロスモーダル推論フレームワークであるPPCRを提案する。
PPCRは、推論プロセスをSemantic-Spatial Grounding-Instanceパイプラインとして明示的に構成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:33:10 GMT)
Industrial3D: A Terrestrial LiDAR Point Cloud Dataset and CrossParadigm Benchmark for Industrial Infrastructure [11.0] 本研究では,水処理施設13施設から612万点を6ミリ分解能でラベル付けした地上LiDARデータセットであるIndustrial3Dを提案する。
最も近いMEPデータセットの6.6倍のスケールで、Industrial3Dは産業用3Dシーン理解のための最大かつ最も要求の多いテストベッドを提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:46:40 GMT)
ForestSim: A Synthetic Benchmark for Intelligent Vehicle Perception in Unstructured Forest Environments [10.7] セマンティックセグメンテーションモデルのトレーニングと評価のために設計された高忠実な合成データセットであるフォレストシムを提案する。
ForestSimには25の多様な環境にまたがる2094のイメージがあり、複数の季節、地形、葉の密度をカバーしている。
非構造的なシーンに固有の課題があるにもかかわらず、強いパフォーマンスを報告します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:43:09 GMT)
The Necessity of Setting Temperature in LLM-as-a-Judge [10.6] 一連の制御実験により, 温度と判定性能の関係について検討した。
また,我々の経験的統計分析に因果推論の枠組みを採用し,温度が判断行動に与える直接的な因果効果を厳密に検証した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:31:29 GMT)
Constructing Composite Features for Interpretable Music-Tagging [10.5] 基本音楽特徴を数学的に組み合わせて合成特徴を自動的に進化させるパイプラインを提案する。
MTG-JamendoとGTZANデータセットの実験は、一貫した改善を示している。
ただし、最初の数百GP評価において、パフォーマンス向上の大部分が注目されている点には注意が必要だ。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:25:58 GMT)
Communications-Aware NMPC for Multi-Rotor Aerial Relay Networks Under Jamming Interference [10.1] ティルト・トゥ・トランスレート(tilt-to-translate)」操作は、アンテナ方向を通信相手と不注意に整列させ、干渉下で深刻な劣化を引き起こす。
本稿では,高レベル最大軌道生成器とアクチュエータレベルのモデル予測制御器を組み合わせた通信対応制御フレームワークを提案する。
その結果,最小限のエンドツーエンド容量が2次近く増加し,障害発生が著しく減少し,平均容量が中程度に増加した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:05:54 GMT)
HeteroHub: An Applicable Data Management Framework for Heterogeneous Multi-Embodied Agent System [10.1] 異種多体エージェントシステムは、動的環境におけるタスクを達成するために、多様な能力を持つ複数のエンボディエージェントを協調する。
既存のフレームワークには、そのようなシステムの実際のデプロイをサポートするための統一されたデータ管理インフラストラクチャがない。
textbfHeteroHubは静的メタデータ、タスクアライントレーニングコーパス、リアルタイムデータストリームを統合したデータ中心のフレームワークである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:01:05 GMT)
Optimistic Actor-Critic with Parametric Policies for Linear Markov Decision Processes [10.0] ログ線形ポリシーを用いた楽観的なアクター批判フレームワークを提案する。
提案アルゴリズムは, 法外および法外設定において, $widetildemathcalO(-4)$および$widetildemathcalO(-2)$サンプル複雑性を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:41:59 GMT)
IrisFP: Adversarial-Example-based Model Fingerprinting with Enhanced Uniqueness and Robustness [10.0] IrisFPは、新しい逆例ベースのモデルフィンガープリントフレームワークである。
すべての決定境界の交差点付近に指紋を配置する。
複合サンプル指紋を合成し、複数のサンプルを多境界交差点に近接して構成する。
統計的分離性指標を用いて、生成された指紋の識別力を評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:29:29 GMT)
The Model Says Walk: How Surface Heuristics Override Implicit Constraints in LLM Reasoning [9.9] 大きな言語モデルは、サージェントサーフェスキューが計算不可能な実行可能性制約と競合する場合に、体系的に失敗する。
診断・診断・ブリッジ・トリート・フレームワークを用いてこれを研究する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:36:09 GMT)
AutoCut: End-to-end advertisement video editing based on multimodal discretization and controllable generation [9.8] AutoCutは、マルチモーダルな離散化と制御可能な編集に基づく、エンドツーエンドの広告ビデオ編集フレームワークである。
AutoCutはビデオとオーディオの特徴を抽出するために専用エンコーダを使用し、残差ベクトル量子化を適用してそれらをテキスト表現と整合した統一トークンに識別する。
完全なプロダクションパイプラインは、予測されたトークンシーケンスをデプロイ可能な長ビデオ出力に変換する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:35:11 GMT)
RAWIC: Bit-Depth Adaptive Lossless Raw Image Compression [9.7] 生画像は、線形センサ測定と高度な視覚タスクや写真応用に不可欠な高ビット深度情報を保存する。
本稿では,ベイアパターンの生画像に対して,ビット深度適応型学習損失レス圧縮フレームワークRAWICを紹介する。
実験の結果、RAWICは従来のロスレスコーデックを一貫して上回り、JPEG-XLよりも平均7.7%の削減を達成した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:10:35 GMT)
OccSim: Multi-kilometer Simulation with Long-horizon Occupancy World Models [9.6] OccSimは世界初の占有型世界モデル駆動型3Dシミュレータである。
OccSimは、連続ログやHDマップの要求をなくし、単一の初期フレームと将来のエゴアクションのシーケンスにのみ条件付けする。
これは、従来の最先端の占領世界モデルよりも安定な生成長が80倍に向上したことを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:13:51 GMT)
NeuroPath: Practically Adopting Motor Imagery Decoding through EEG Signals [9.4] 運動画像(英: Motor Imagery、MI)は、身体の動きを身体の動きなしで想像する脳-コンピュータインタフェースのパラダイムである。
既存のソリューションのデプロイは難しいままです。
我々は、堅牢なMIデコーディングのためのニューラルネットワークであるNeuroPathを紹介する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:45:02 GMT)
KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning [9.3] 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。
KG-Hopperは,マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習フレームワークである。
我々は、KG-Hopperがより大規模なマルチステップシステム(最大70B)を一貫して上回り、プロプライエタリモデルとの競合性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:46:23 GMT)
Detecting low left ventricular ejection fraction from ECG using an interpretable and scalable predictor-driven framework [9.3] 低左室放出率 (LEF) は症状性心不全の進行まで検出されないことが多い。
既存のアプローチは、解釈可能性に制限のあるエンドツーエンドのブラックボックスモデルのみに依存している。
我々は基礎モデルに基づく診断確率と解釈可能なモデリングを統合する構造化フレームワークECGPD-LEF(Predictor-Driven LEF)を導入した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:55:52 GMT)
From Passive Feeds to Guided Discovery: AI-Initiated Interaction for Vague Intent in Content Exploration [9.2] 私たちは、この中核にAIをサポートする探査インターフェースであるRed-Recを紹介します。
このデザインはフォーマティブな研究によって動機付けられており、ユーザーはしばしばフィードの安定を認識できるが、代替品の具体化に苦慮している。
我々はRed-Recを3つの比較条件(受動的フィード、検索、ユーザー開始型チャットインタフェース)に対して混合設計ラボで評価した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:06:54 GMT)
\texttt{ReproMIA}: A Comprehensive Analysis of Model Reprogramming for Proactive Membership Inference Attacks [9.2] メンバーシップ推論のための統一的で効率的なフレームワークである textttReproMIA を提案する。
様々なアーキテクチャパラダイムにわたるtextttReproMIA の特殊インスタンス化を提供する。
textttReproMIAは、既存の最先端のベースラインよりも一貫して、実質的に優れています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:35:10 GMT)
$R_{dm}$: Re-conceptualizing Distribution Matching as a Reward for Diffusion Distillation [9.1] 拡散モデルは、最先端の生成性能を達成するが、その遅い反復サンプリングプロセスによってボトルネックとなる。
最近のアプローチでは、強化学習(RL)を統合して、この天井を壊そうとしている。
本稿では,分布マッチングを報酬として再認識し,$R_dm$と表記する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:01:31 GMT)
CPUBone: Efficient Vision Backbone Design for Devices with Low Parallelization Capabilities [9.0] CPUベースの推論に最適化された新しいビジョンバックボーンモデルであるCPUBoneを紹介する。
CPUBoneは、幅広いCPUデバイスにわたる最先端のSpeed-Accuracy Trade-offs(SAT)を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:01:18 GMT)
Task-Centric Personalized Federated Fine-Tuning of Language Models [9.0] フェデレートラーニング(FL)は、様々なタスクで言語モデルをトレーニングするための有望なテクニックとして登場した。
パーソナライズされたFL(pFL)は、各クライアントのデータ配信に適したモデルを作成することを目的としている。
我々は、クラスタリングベースのpFLであるFedを提案し、各クライアントではなく、各タスクに特化したモデルを構築します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:01:53 GMT)
Label-efficient Training Updates for Malware Detection over Time [8.8] 本稿では,活動学習と半教師あり学習の幅広いセットを評価するモデルに依存しないフレームワークを提案する。
これらの手法を組み合わせることで、両方のドメインで手動アノテーションのコストを最大90%削減できることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:05:44 GMT)
ExVerus: Verus Proof Repair via Counterexample Reasoning [8.8] 大規模言語モデル(LLM)のための逆例誘導フレームワークであるEXVERUSを提案する。
証明が失敗すると、EXVERUSは反例を自動生成して検証し、LSMを誘導して誘導不変量に一般化し、これらの障害を阻止する。
評価の結果,EXVERUSは最先端のプロンプトベースのVerus証明生成器よりも証明精度,堅牢性,トークン効率を著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:32:19 GMT)
Mitigating Backdoor Attacks in Federated Learning Using PPA and MiniMax Game Theory [8.8] 悪意のあるクライアントは、ローカルモデルにバックドアデータを注入することで、グローバルモデルに積極的に害を与えようとする。
我々は,このような不適切な行動を軽減するために,FedBBA(Federated Backdoor and Behavior Analysis)を提案する。
各種攻撃シナリオにおいて,FedBBAはバックドア攻撃の成功率を約1.1%~11%に下げることを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:39:02 GMT)
PAD-Hand: Physics-Aware Diffusion for Hand Motion Recovery [8.4] 雑音の多いポーズ列を物理的に可視な手の動きに洗練する物理認識型条件拡散フレームワークを提案する。
メッシュCNN-Transformerのバックボーン上に構築したEuler-Lagrangeのダイナミックスを手話の手話で定式化する。
本手法では,物理の整合性を測定し,解釈可能な分散写像を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:44:14 GMT)
Not All Subjectivity Is the Same! Defining Desiderata for the Evaluation of Subjectivity in NLP [8.4] 主観的判断はいくつかのNLPデータセットの一部である。
最近の研究は、アウトプットがこの視点の多様性を反映するモデルの優先順位付けをますます進めている。
評価プラクティスがこれらのモデルの目的に合致するかどうか、依然として疑問が残る。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:21:32 GMT)
A Self-Rotating Tri-Rotor UAV for Field of View Expansion and Autonomous Flight [8.3] ロータクラフト(SPINNER)による自己知覚慣性航法
本稿では、FoV拡張と自律飛行のための自転三回転型UAVであるSPINNERを紹介する。
実験では、SPINNERは風速4.8m/sまでの強い飛行を維持している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:30:58 GMT)
Robust Safety Monitoring of Language Models via Activation Watermarking [8.3] 大型言語モデル(LLM)は、武器製造指示やマルウェアの書き方などの機密情報を明らかにするために誤用されることがある。
LLMプロバイダは、推論中に安全でない振る舞いを検出し、フラグを付けるために$emphmonitoring$に依存している。
LLMプロバイダはセキュリティメカニズムをパッチできないため、アダプティブアタッカーは大きな懸念事項である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:43:49 GMT)
LLM-Powered Workflow Optimization for Multidisciplinary Software Development: An Automotive Industry Case Study [8.2] マルチディシプリナ・ソフトウェア・デベロップメント(MSD)では、ドメインの専門家や開発者は互換性のないフォーマリズムと別々のアーティファクトセットをまたいで協力する必要がある。
我々は,Volvo Groupの車両内APIシステムである textttspapi について,192のエンドポイント,420のプロパティ,76のCAN信号を含むアプローチを評価した。
自動ワークフローは、API開発時間を約5時間から7分以内に短縮し、93.7%のF1スコアを達成した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:59:16 GMT)
OptINC: Optical In-Network-Computing for Scalable Distributed Learning [8.2] 我々は、サーバ内の計算を光配線にオフロードする光ネットワーク計算(INC)アーキテクチャを提案する。
このような事実上の光学ニューラルネットワーク(ONN)は、既存の分散トレーニングソリューションにおける通信オーバーヘッドを効果的に低減することができる。
提案手法は、CIFAR-100上のResNet50やWikipedia-1B上のLLaMAベースのネットワークなど、実際の分散学習タスクに基づいて評価された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:10:47 GMT)
Efficient and Practical Black-Box Verification of Quantum Metric Learning Algorithms [8.2] 量子メトリック学習は、古典的なデータをクラス間の最大分離を伴う量子ヒルベルト空間にマッピングすることで機械学習を強化する。
現在のNISQハードウェアでは、このマッピングプロセス自体がエラーを起こしやすいため、根本的な誤りがある可能性がある。
本稿では,量子メトリック学習モデルの性能を評価するための実用的なブラックボックス検証プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:07:43 GMT)
Tunable Nonlocal ZZ Interaction for Remote Controlled-Z Gates Between Distributed Fixed-Frequency Qubits [8.2] フォールトトレラント量子コンピューティングは大規模な超伝導プロセッサを必要とする。
本稿では,このボトルネックを克服するための分散ハードウェアアーキテクチャを提案する。
この機構は、固定周波数トランスモン間の99.99%以上の忠実度を持つ遠隔制御Zゲートを実現することができる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:52:46 GMT)
Subspace Optimization for Backpropagation-Free Continual Test-Time Adaptation [8.1] PACEはバックプロパゲーションのない連続的なテスト時間適応システムである。
正規化層のアフィンパラメータを直接最適化する。
本フレームワークは,連続的な分散シフトの下で,複数のベンチマークにおいて最先端の精度を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:58:13 GMT)
SOLE-R1: Video-Language Reasoning as the Sole Reward for On-Robot Reinforcement Learning [8.1] オンライン強化学習のための唯一の報酬信号として設計されたビデオ言語推論モデル。
我々は、SOLE-R1が24の未確認タスクで成功し、強い視覚言語報酬器を著しく上回っていることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:46:31 GMT)
RecycleLoRA: Rank-Revealing QR-Based Dual-LoRA Subspace Adaptation for Domain Generalized Semantic Segmentation [8.0] Vision Foundation Models (VFM) は、一般化を強化するための豊富なマルチドメイン知識を提供する。
VFM内のリッチな部分空間構造を積極的に活用するための既存の戦略は、未探索のままである。
本稿では,VFMのサブスペース構造を体系的に活用するためにRop-Revealing QR Decomposition (RRQR) を用いるRecycleLoRAを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:05:39 GMT)
A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps [8.0] 微調整時の一般化を高めるハイブリッドデコーダアンサンブルを提案する。
アンサンブル学習にインスパイアされたデコーダは、共有階層層と、複数の並列デコーダブランチから構成される。
この設計は、追加パラメータを導入することなく事前訓練された重みを完全に活用し、その結果の多様な予測を効果的に組み込んで一般化を改善することができる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:46:10 GMT)
Fairboard: a quantitative framework for equity assessment of healthcare models [7.9] グリオーマ患者648名を対象に,18例のオープンソース脳腫瘍分節モデルの評価を行った。
患者のアイデンティティは、モデル選択よりもパフォーマンスのばらつきを一貫して説明しています。
Fairboardはオープンソースのノーコードダッシュボードで、医療画像における適切なモデル監視に対する障壁を低くする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:02:31 GMT)
VulnScout-C: A Lightweight Transformer for C Code Vulnerability Detection [7.8] 693Mの総パラメータを持つコンパクトトランスアーキテクチャであるVULNSCOUT-Cを導入する(353M)。
VULNSCOUTは、制御されたマルチエージェントパイプラインを通じて生成され、正式な検証を行う新しい33,565サンプルのキュレートデータセットである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:33:32 GMT)
A Foldable and Agile Soft Electromagnetic Robot for Multimodal Navigation in Confined and Unstructured Environments [7.7] マルチモーダル移動は、非構造環境における動物の適応性に不可欠である。
そこで我々は,9つ以上の移動モードを持つ小型で折り畳み式で頑健な軟式電磁ロボット (M-SEMR) を紹介する。
高速転がり(818 mm/s、26 BL/s)、全方位クロール、ジャンプ、水泳など、例外的な俊敏性を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:30:09 GMT)
Adaptive Block-Scaled Data Types [7.6] NVFP4はその誤差分布に悩まされ、ほぼ最大値上の大量の量子化誤差をもたらす。
入力値の分布に適応できる新しい適応ブロックスケールデータ型を設計する。
IF4は、既存の4ビットのブロックスケールフォーマットより優れており、量子化トレーニング中に損失が小さくなり、トレーニング後の量子化において多くのタスクにおいて高い精度を達成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:33 GMT)
Software Supply Chain Smells: Lightweight Analysis for Secure Dependency Management [7.6] ソフトウェアサプライチェーンの臭いという概念を,潜在的なセキュリティリスクを示唆する構造指標として紹介する。
本稿では,ソフトウェアパッケージのサプライチェーンにおける匂いを検出する新しいツールであるDirty-Watersの設計と評価を行う。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:57:31 GMT)
DecompGrind: A Decomposition Framework for Robotic Grinding via Cutting-Surface Planning and Contact-Force Adaptation [7.4] Decompは、Global Cutting-Surface-Planning (CFAG)とLocal Contact-Force Adaptation (L GCSP)を組み合わせたロボット研削システムである。
CFAGは電流およびターゲット形状の計画解析により除去形状を決定する一方、Lは学習せずに接触力適応を学習する。
実験では、安全な接触レベルを維持しながら、異なる形状と材料硬度を用いて効率的なロボット研削を実証した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:45:30 GMT)
PEANUT: Perturbations by Eigenvector Alignment for Attacking Graph Neural Networks Under Topology-Driven Message Passing [7.4] グラフニューラルネットワーク(GNN)の脆弱性に乗じて仮想ノードを注入する,勾配のない制限付きブラックボックス攻撃であるPEANUTを提案する。
PEANUTはインジェクションベースの攻撃であり、グラフ修正攻撃よりも現実的で現実的な攻撃であると考えられている。
3つのグラフタスクにわたる実世界のデータセットの実験は、その単純さにもかかわらず、我々の攻撃の有効性を実証している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:17:10 GMT)
Prototype-Enhanced Multi-View Learning for Thyroid Nodule Ultrasound Classification [7.3] 既存のディープラーニング手法は、様々な超音波デバイスや臨床環境に展開する際に、限られた堅牢性や一般化を示すことが多い。
データ不均一性を考慮したプロトタイプ強化多視点学習フレームワークPEMV-thyroidを提案する。
複数の甲状腺超音波データセットの実験では、PEMV甲状腺は最先端の手法より一貫して優れていることが示されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:37:26 GMT)
With a Little Help From My Friends: Collective Manipulation in Risk-Controlling Recommender Systems [7.2] 本研究は,nDCGの劣化率を最大20%まで低下させることが,非競合ユーザに対して可能であることを示す。
本稿では,保証をグループレベルからユーザレベルにシフトさせる緩和戦略を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:14:48 GMT)
Post-hoc Self-explanation of CNNs [7.2] この研究は、畳み込みニューラルネットワークのための$k$-meansベースのポストホック説明の共通形式を導入している。
最後の3ブロックのような、より浅い、より圧縮されていない機能アクティベーションを使用することで、セマンティックな忠実さと予測性能のわずかに低下するトレードオフが生じる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:05:37 GMT)
Geometric Phase Effect in Thermodynamic Properties and in the Imaginary-Time Multi-Electronic-State Path Integral Formulation [7.1] 幾何位相(GP)は円錐交叉(CI)から生じる量子効果である
標準的な想像時間経路積分分子動力学(PIMD)はGPを考慮しない。
MES-PIMDは、連続する想像時間スライス間の重み付け重なり行列の積の電子的トレースを通じてGP効果をキャプチャする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:34:11 GMT)
FedFG: Privacy-Preserving and Robust Federated Learning via Flow-Matching Generation [7.1] フェデレートラーニング(FL)は、分散クライアントがローカルなプライベートデータを使用してグローバルモデルを協調的にトレーニングすることを可能にする。
近年の研究では、従来のFLアルゴリズムはプライバシ保護の欠陥をまだ示している。
本稿では,フローマッチング生成に基づく堅牢なFLフレームワークであるFedFGを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:11:35 GMT)
Reducing Mental Workload through On-Demand Human Assistance for Physical Action Failures in LLM-based Multi-Robot Coordination [6.8] 本研究では,リモートエラー解決をマルチロボット計画に統合するヒューマン・イン・ザ・ループ・フレームワークを提案する。
この方法では、ロボットは自律的にタスクを実行するが、発見不可能な障害が発生した場合、LLMはオペレーターに支援を要求する。
簡単に収集可能なアイテムを収集するために、フルリモートコントロールと同等のタスクの進捗を達成した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:21:04 GMT)
ViviDoc: Generating Interactive Documents through Human-Agent Collaboration [6.8] インタラクティブなドキュメントは、ダイナミックな可視化、インタラクティブなアニメーション、探索的なインターフェイスを通じて、読者が複雑なアイデアに取り組むのに役立つ。
近年のLarge Language Model (LLM) ベースのエージェントは、コンテンツ生成を自動化できるが、インタラクティブなドキュメント生成に直接適用することで、制御が難しい出力を生成することが多い。
インタラクティブなドキュメント生成を体系的に扱うための最初の作業として,私たちの知る限り,ViviDocを紹介します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:29:32 GMT)
Beyond Localization: Recoverable Headroom and Residual Frontier in Repository-Level RAG-APR [6.7] リポジトリレベルの自動プログラム修復は、より優れた修復のための主要な経路として、より強力なローカライゼーションを扱うようになってきている。
本稿では,3つのリポジトリレベルのRAG-APRパラダイム,Agentless,KG,ExpeRepairを用いたSWE-bench Liteについて検討する。
全体として、より強力なローカライゼーション、バウンド検索、エビデンス品質、インターフェース設計はすべてリポジトリレベルの修復結果です。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:10:19 GMT)
An Optimal Battery-Free Approach for Emission Reduction by Storing Solar Surplus in Building Thermal Mass [6.7] 建物内の脱炭は、現場の再生可能エネルギー、グリッド電力、熱需要を調整する高度な制御戦略を要求する。
受動型蓄熱装置としてビルの熱量を利用する最適炭素認識最適化手法を提案する。
熱質量の異なる同じ系のTRNSYSモデルを3つのシミュレーションにより評価した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:37:23 GMT)
Compressing Code Context for LLM-based Issue Resolution [6.6] 大きな言語モデル(LLM)が現実のGitHubの問題を解決することができるようになった。
既存の圧縮技術はこの緊張を解消することができない。
本稿では,2つのコンポーネントからなる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:31:12 GMT)
LLMON: An LLM-native Markup Language to Leverage Structure and Semantics at the LLM Interface [6.5] LLM ネイティブなマークアップ言語 LLMON を導入し,テキストの構造と意味的メタデータを LLM に自然な方法で伝達できるようにする。
この情報はモデルトレーニング、モデルプロンプト、推論実装で使用することができ、モデル精度、安全性、セキュリティが改善される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:39:09 GMT)
Bridging the Geometry Mismatch: Frequency-Aware Anisotropic Serialization for Thin-Structure SSMs [6.5] FGOS-Netは周波数許容型幾何学的歪みに基づくフレームワークである。
4つの挑戦的なベンチマークで、一貫して強力なベースラインを上回ります。
91.3% mIoUと97.1% clDiceをDeepCrackで達成し、80 FPSで7.87 GFLOPしか走らない。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:39:04 GMT)
CDH-Bench: A Commonsense-Driven Hallucination Benchmark for Evaluating Visual Fidelity in Vision-Language Models [6.5] ビジョン言語モデル(VLM)は多くのベンチマークで高いパフォーマンスを達成するが、モデルが示すものやコモンセンスが示すものに従うだろうか?
我々はこの現象をtextbfcommonsense-driven Hallucination (CDH) と呼ぶ。
textbfCDH-Bench(英語版)は、明示的なtextbfvisual evidence--commonsense conflicts(英語版)を作成するために設計されたベンチマークである。
結果は、強力なモデルでさえも、視覚的エビデンスの下での事前駆動の正規化に弱いままであることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:04:53 GMT)
Position: Explainable AI is Causality in Disguise [6.3] 説明可能なAI(XAI)の需要が急増している。
しかし、基本的な課題は、メトリクスの矛盾、健全性チェックの失敗、堅牢性と公正性に関する未解決の議論である。
この立場紙は、XAIにおける永続的不協和は、欠落した根本真理からではなく、存在する根本真理から生じていることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:44:53 GMT)
Domain-Invariant Prompt Learning for Vision-Language Models [6.2] ドメイン一般化のためのドメイン不変コンテキスト最適化(DiCoOp)を提案する。
敵対的なトレーニングアプローチを採用することで、DiCoOpはモデルにドメイン不変のプロンプトを学習させ、分類のための識別力を保持する。
実験の結果,様々な視覚領域にまたがる領域一般化タスクにおいて,DiCoOpはCoOpを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:18:31 GMT)
Combinatorial Privacy: Private Multi-Party Bitstream Grand Sum by Hiding in Birkhoff Polytopes [6.2] PolyVeilは、Birkhoff polytopeでプライベートビットを置換行列としてエンコードする、$k$クライアント間の総和プロトコルである。
P-hardnessは完全な行列ビューを必要とするが、非空のDPはスカラービューを必要とする。
プロトコルはPKIを必要とせず、$O(k)$通信を持ち、正確な集約を出力する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:38:39 GMT)
Evolutionary Algorithms for Generating Graphs Matching Desired Laplacian Spectra [6.2] ラプラシアングラフスペクトル記述子に基づくグラフの進化への新たな進化的アプローチを提案する。
実験結果から,グラフの異なるクラスと幅広いラプラシアングラフスペクトルに対するアプローチが成功していることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:14:53 GMT)
Contour-Guided Query-Based Feature Fusion for Boundary-Aware and Generalizable Cardiac Ultrasound Segmentation [6.1] 本稿では,境界対応心エコー区分けのためのコンター型クエリリファインメントネットワーク(CGQR-Net)を提案する。
このフレームワークは、マルチレゾリューション特徴表現と輪郭から派生した構造的事前情報を統合する。
その結果, セグメンテーション精度の向上, 境界精度の向上, 様々な撮像条件におけるロバスト性能が得られた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:17:40 GMT)
Point of View: How Perspective Affects Perceived Robot Sociability [6.1] 本研究では,異なる視点がロボット軌道の社会性や乱れの知覚に与える影響について検討する。
以上の結果から,移動距離が知覚障害に影響を及ぼす一方で,頭部や頭蓋などのコミュニケーション的社会的シグナルが,ロボットの行動の認知的社会的可能性を高めることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:54:59 GMT)
Silent Guardians: Independent and Secure Decision Tree Evaluation Without Chatter [6.0] アウトソーシング決定ツリー評価(ODTE)により、クライアントとモデルプロバイダの両方が、機密データと決定ツリーモデルをクラウドに安全にオフロードすることができる。
我々は,同型秘密共有とMACベースの検証機構を活用した,新しい2サーバプライベートかつ検証可能なODTEプロトコルである$sf PVODTE$を提案する。
$sf PVODTE$はサーバ間通信を排除する最初の2サーバODTEプロトコルである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:07:10 GMT)
Fisheye3R: Adapting Unified 3D Feed-Forward Foundation Models to Fisheye Lenses [6.0] Fisheye3Rは、多視点3D再構成基盤モデルを拡張して、視点画像の性能劣化を伴わずに魚眼入力に対応する新しい適応フレームワークである。
本手法は,魚眼画像のカメラポーズ,深度,点マップ,視野推定を一貫して改善する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:18:56 GMT)
DAInfer+: Neurosymbolic Inference of API Specifications from Documentation via Embedding Models [6.0] DAInfer+は、ライブラリドキュメントからAPI仕様を推論するための新しいアプローチである。
我々は自然言語処理(NLP)を用いて、文書によって提供される非公式な意味情報を解釈する。
我々は、正確なデータフローとエイリアス仕様を提供するニューロシンボリック最適化を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:55:10 GMT)
Rethinking Atomic Decomposition for LLM Judges: A Prompt-Controlled Study of Reference-Grounded QA Evaluation [5.9] 我々は、自己分解型原子式判定器(単一プロンプト分解検証器)を、同じ入力と同様の詳細なルーリックを持つ、即時制御された全体的判定器と比較する。
我々の発見は、QAスタイルの3つのベンチマークで、それぞれ200のソース例で自己分解するシングルプロンプトパターンに特化しています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:55:26 GMT)
From Pixels to Reality: Physical-Digital Patch Attacks on Real-World Camera [5.9] デジタル物理逆襲攻撃(Digital-Physical Adversarial Attacks, DPA)は、広汎なカメラベースの認証システムに対する現実的な敵攻撃の新しいクラスである。
DiPAは、印刷されたアーティファクトに頼るのではなく、直接スマートフォン画面に敵のパッチを表示する。
我々は,DPAが既存の物理的攻撃よりも優れていることを,成功率,特徴空間歪み,検出信頼性の低下の観点から示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:31:54 GMT)
Object Detection Based on Distributed Convolutional Neural Networks [5.9] 分散畳み込みニューラルネットワーク (DisCNN) を用いて, 簡単な物体検出法を提案する。
特定の正のクラスに対するDisCNNの出力ベクトルの加群は、正の特徴の存在確率と正の単調である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:30:45 GMT)
Principal Prototype Analysis on Manifold for Interpretable Reinforcement Learning [5.8] プロトタイプ・ラッパーネットワーク(PW-Nets)は近年,強化学習領域における説明可能性の向上を約束している。
利用可能なデータから最適なプロトタイプを自動的に選択することで,この依存関係を除去する手法を提案する。
標準Gym環境における予備実験により,提案手法が既存のPW-Netの性能と一致することを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:48:13 GMT)
MRI-to-CT synthesis using drifting models [5.8] MRI-to-CT合成は、追加の電離放射線を回避しつつ、骨の詳細なCTのような画像を提供することで、MRのみの骨盤CTを可能にする。
本研究では,MRIによる骨盤CT画像の漂流モデルについて検討した。
画像は、畳み込みニューラルネットワーク(UNet, VAE)、生成的敵ネットワーク(WGAN-GP)、物理に着想を得た確率モデル(PPFM)、拡散に基づく手法に対してベンチマークされる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:34:32 GMT)
$1/N^2$ Precision Interferometry with Collectively Enhanced Atomic Mirror [5.7] 我々は、集合的に拡張された量子ミラー(CEAM)で要求を回避できるパラダイムを導入する。
このプロトコルでは、量子資源は協調的な光学応答に由来し、絡み合った状態の準備を必要としない。
我々の手法は位置と結合障害に対して堅牢であり、集積フォトニックシステムにおける超感度量子メトロジーへの実践的な経路を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:10:22 GMT)
Off-Axis Compliant RCM Joint with Near-Isotropic Stiffness and Minimal Parasitic Error [5.7] 本稿では、神経内視鏡手術のための、オフ軸型モノリシックなリモート・センター・オブ・モーション(RCM)関節について述べる。
エンドエフェクターは四面体屈曲の外側に配置され、視線を改善し、殺菌を促進し、迅速な工具放出を可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:59:18 GMT)
Real-World Challenges in Fake News Detection: Dealing with Posts by Cold Users [5.7] 過去のユーザー行動と投稿におけるユーザーエンゲージメントは、SOTAアプローチがフェイクニュース検出に活用する強力なシグナルである。
まず、フェイクニュースや噂検出のタスクにおいて、コンテンツとユーザ間のインタラクションの両方において、ユーザ行動の価値を確立する。
次に、実世界のデータセットにおけるコールドユーザーの広範な普及を確立し、コールドユーザーを考慮した新しいアルゴリズムの必要性を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:37:01 GMT)
SLOW: Strategic Logical-inference Open Workspace for Cognitive Adaptation in AI Tutoring [5.6] 大規模言語モデル (LLM) は教育対話において顕著な流布を示した。
ほとんどの生成チューターは直感的でシングルパス生成によって動作する。
本研究では,学習者の意図的推論を支援する理論インフォームド・チューリング・フレームワークであるSLOWを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:01:16 GMT)
OneComp: One-Line Revolution for Generative AI Model Compression [5.5] トレーニング後の圧縮は、性能を著しく低下させることなくモデルパラメータの精度を低下させる。
私たちは、このエキスパートワークフローをリソース適応パイプラインに変換するオープンソースの圧縮フレームワークOneCompを紹介します。
重要なアーキテクチャ上の選択は、最初の量子化されたチェックポイントをデプロイ可能なピボットとして扱い、各ステージが同じモデルを改善することを保証することである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:43:32 GMT)
Decoding Functional Networks for Visual Categories via GNNs [5.3] 大規模脳ネットワークが視覚的カテゴリーをどのように表すかを理解することは、知覚と皮質組織を結びつけるのに不可欠である。
パーセルレベルの関数グラフを構築し、正と負の両方の相互作用をモデル化する符号付きグラフニューラルネットワークを訓練する。
このフレームワークは、ボクセルレベルのカテゴリ選択性を、接続性に基づく視覚処理の表現に拡張することで、機械学習と神経科学を橋渡しする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:10:28 GMT)
Building evidence-based knowledge graphs from full-text literature for disease-specific biomedical reasoning [5.2] EvidenceNet(エビデンスネット)は、フルテキストのバイオメディカル文献から病気特有の知識グラフを構築するためのフレームワークである。
EvidenceNetは、大規模言語モデル(LLM)支援パイプラインを使用して、構造化されたエビデンスノードとして実験的な根拠のある発見を抽出し、バイオメディカルエンティティを標準化し、エビデンスの品質を評価し、型付きセマンティック関係を通じてエビデンスレコードを接続する。
技術検証は、98.3%のフィールドレベルの抽出精度、100.0%の高信頼エンティティリンク精度、87.5%の融合完全性、90.0%の意味関係型精度を含む、高いコンポーネント忠実度を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:53:45 GMT)
Theory of Mind and Self-Attributions of Mentality are Dissociable in LLMs [5.1] 大規模言語モデルにおける安全性の微調整は、潜在的に有害なマインド・アトリビューションを抑えることを目指している。
本研究では,心帰属傾向の抑制が,心の理論などの社会的認知能力を低下させるか否かを考察する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:56:02 GMT)
EarlySciRev: A Dataset of Early-Stage Scientific Revisions Extracted from LaTeX Writing Traces [5.1] 我々は、arXivソースファイルから自動的に抽出されるアーリーステージの科学的テキストリビジョンのデータセットであるEarlySciRevを紹介する。
私たちのキーとなる観察は、コメントアウトされたテキストは、しばしば、著者自身によって書かれた破棄された、または代替的な定式化を保存することである。
私たちのパイプラインは、578万の検証済みリビジョンペアを生成します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:47:04 GMT)
Merge and Conquer: Instructing Multilingual Models by Adding Target Language Weights [5.0] LLM(Large Language Models)は、低リソース言語での性能に制限があるため、英語に重点を置いている。
モデルマージは,低リソース言語に対する従来の適応手法に代わる,実用的で効率的な代替手段であることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:46:50 GMT)
Physics-Embedded Feature Learning for AI in Medical Imaging [5.0] PhysNetは物理組み込みのディープラーニングフレームワークで、腫瘍成長のダイナミクスを直接特徴学習プロセスに統合する。
このアーキテクチャは、潜伏する腫瘍密度場を学習しながら、複数クラスの腫瘍分類を共同で行う。
PhysNetは解釈可能な潜伏表現を生成し、確立された医療知識と整合する生体物理パラメータを学習する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:45:27 GMT)
Enhancing Policy Learning with World-Action Model [4.9] World-Action Model (WAM) は行動規則化された世界モデルであり、将来の視覚的観察と状態遷移を駆動する行動について共同で理由を定めている。
WAMは、遅延状態遷移からアクションを予測するDreamerV2に、逆ダイナミクスの目的を組み込んでいる。
我々は、CALVINベンチマークから8つの操作タスクにわたるポリシー学習の強化について、WAMを評価した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:56:05 GMT)
TinyGaze: Lightweight Gaze-Gesture Recognition on Commodity Mobile Devices [4.9] 本稿では,コモディティARKitのヘッド/アイ変換を用いたエンドツーエンドパイプラインと,学習理論に基づく足場付き誘導-リコールプロトコルを提案する。
TinyHARは5方向ジェスチャー認識と4方向ユーザ識別のパイロットベンチマークで高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:30:37 GMT)
On the limited utility of parallel data for learning shared multilingual representations [4.9] 並列データは、言語間のアライメントに最小限の影響しか与えないようだ。
言語間アライメントは、並列データからの明示的な信号がなくても、同様のレベルに現れるように見える。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:37:34 GMT)
Active Stereo-Camera Outperforms Multi-Sensor Setup in ACT Imitation Learning for Humanoid Manipulation [4.9] 本論文は,Unitree G1ヒューマノイドロボットの3本指ハンドを2つの操作タスクに装着した14種類のセンサの組み合わせをベンチマークする。
触覚とプロモセプティブの融合と能動視覚の併用について検討した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:30:34 GMT)
Uncovering Relationships between Android Developers, User Privacy, and Developer Willingness to Reduce Fingerprinting Risks [4.8] 我々は,ユーザを指紋認証から保護するための変更を行う開発者の意思について検討する。
たとえ大きな努力を期待していても、圧倒的に(89%)の開発者がこの変更をサポートしています。
驚いたことに、指紋認証を利用する開発者は、この変更をサポートする確率が6倍になる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:01:09 GMT)
Detecting and Mitigating Flakiness in REST API Fuzzing [4.8] テストのフレキネスは業界で一般的な問題であり、自動ビルドとテストの信頼性を妨げる。
本稿では,広く採用されているREST APIファザのひとつであるEvoMasterが生成するテストのフレキネスについて検討する。
我々はFrakyCatchを提案し、REST APIにおけるフレキネスを検出して緩和し、その性能を実証的に評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:56:10 GMT)
Symbolic Density Estimation: A Decompositional Approach [4.8] 我々はシンボリック密度推定(SymDE)のための新しいフレームワークであるAI-Kolmogorovを紹介する。
我々は、AI-コルモゴロフが基礎となる分布を発見したり、それを記述する数学的表現について貴重な洞察を与えたりすることを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:03:45 GMT)
From Vessel Trajectories to Safety-Critical Encounter Scenarios: A Generative AI Framework for Autonomous Ship Digital Testing [4.7] 本稿では,大規模自動識別システム(AIS)トラジェクトリを構造化された安全クリティカルな遭遇シナリオに変換するデータ駆動型フレームワークを提案する。
実世界の海上交通流実験により, 提案手法は軌道の忠実度と滑らかさを向上することを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:14:04 GMT)
Vision-Based Robotic Disassembly Combined with Real-Time MFA Data Acquisition [4.7] 本稿では,エッジデバイス上で動作するPCデスクトップコンポーネントをリアルタイムに視覚的に検出する手法の開発の初期段階について述べる。
最初の目標は、学習に基づく視覚の適応性によって予測不可能な幾何学によるアイテムの処理を可能にする、PCデスクトップのロボット分解を行うことである。
第2の目標は、物質フロー分析を行うために必要な、自律的で、高粒度で、タイムリーなデータを提供することだ。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:10:19 GMT)
MEDiC: Multi-objective Exploration of Distillation from CLIP [4.7] 本稿では,1つのパイプラインで生画素空間と潜在特徴空間を組み合わせたMEDiCを提案する。
我々は、この多目的フレームワークを取り巻く設計空間を体系的に調査する。
フレームワークは73.9%のkNNと85.1%の微調整精度を実現し,300 epochsでViT-Baseを開発した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:16:05 GMT)
DiffAttn: Diffusion-Based Drivers' Visual Attention Prediction with LLM-Enhanced Semantic Reasoning [4.6] 本稿では、ドライバの認識パターンをエミュレートし、インテリジェントな車両の視覚的注意予測を促進するためのDiffAttnを提案する。
我々のフレームワークは、インテリジェントな車両における車内人間と機械の相互作用、リスク知覚、運転者の状態測定を改善する可能性を秘めている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:24:20 GMT)
Entanglement generation of arbitrary squeezed Fock states [4.5] 超伝導量子ビットと圧縮キャビティとの間の絡み合いの発生プロトコルを提案する。
高次3光子過程における共鳴条件と有効ラビ周波数を解析的に導出する。
本手法は, 複雑な非ガウス交絡状態を生成するための実用的な経路を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:29:40 GMT)
AMIGO: Agentic Multi-Image Grounding Oracle Benchmark [4.4] 視覚的に類似した画像のギャラリー上での隠れターゲット識別のためのベンチマークであるAMIGOを紹介する。
AMIGOでは、オラクルがターゲットイメージをプライベートに選択し、属性中心のYes/No/Unsure質問のシーケンスを問うことによってモデルを復元する必要がある。
Guess My Preferred DressタスクでAMIGOをインスタンス化し、結果とインタラクション品質の両方をカバーするメトリクスを報告します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:48:51 GMT)
Structural-Ambiguity-Aware Translation from Natural Language to Signal Temporal Logic [4.3] Signal Temporal Logic (STL) は、サイバー物理システムにおける時間的および安全に重要なタスクを特定するために広く使われている。
自然言語(NL)は便利なインタフェースを提供するが、その構造的曖昧さはSTLへの1対1の翻訳を信頼できないものにしている。
そこで本稿では,NLタスク記述をSTL候補式に変換するためのテキストあいまいさ保存手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:33:11 GMT)
SEA: Evaluating Sketch Abstraction Efficiency via Element-level Commonsense Visual Question Answering [4.3] スケッチがクラス定義の視覚要素をどのように表現するかを経済的に評価する参照不要な指標であるSEA(Sketch Evaluation metric for Abstraction efficiency)を紹介する。
コモンスケッチ(CommonSketch)は,300のクラスにまたがる23,100の人書きスケッチからなる,最初の意味的注釈付きスケッチデータセットである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:30:51 GMT)
Minimum Norm Interpolation via The Local Theory of Banach Spaces: The Role of $2$-Uniform Convexity [4.2] 我々は一様凸性仮定の下で最小ノルム補間器(MNI)について検討する。
我々は、$p in bigl (1 + C/log d, 2bigr)$ のとき、$ell_p$-MNI に対して鋭い一般化境界を証明している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:59:59 GMT)
Reward Hacking as Equilibrium under Finite Evaluation [4.1] 5つの最小公理の下では、最適化されたAIエージェントは、評価システムによってカバーされない品質の次元において、体系的に過小評価される。
この結果は、修正可能なバグではなく、構造平衡として報酬ハックを確立します。
我々は、部分的な形式分析により、エージェントが評価システム内のゲームから評価システム自体を積極的に劣化させる機能しきい値の存在を予想する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:06:40 GMT)
Construction and characterization of measures in block coherence resource theory [4.1] ブロックコヒーレンス対策の構築と比較について検討する。
コミニス・マスター方程式の複雑な動的進化におけるコヒーレンスの役割を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:29:06 GMT)
On the Role of Encoder Depth: Pruning Whisper and LoRA Fine-Tuning in SLAM-ASR [4.0] SLAM-ASRの音響バックボーンとして使用するWhisperエンコーダにおける層プルーニングの効果を解析した。
ウィスパーの3つの変種(Small、Medium、Large-v2)、異なる資源レベル(デンマーク語、オランダ語、英語)を表す3つの言語(Danish、Danish、Large-v2)、200以上のトレーニングランをまたいだ実験が行われた。
LoRA適応は、未処理のベースラインを一貫して上回り、総パラメータを7-14%削減する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:02:22 GMT)
AutoWorld: Scaling Multi-Agent Traffic Simulation with Self-Supervised World Models [4.0] AutoWorldは、LiDARデータのラベルなし占有表現から学んだ世界モデルを利用するトラフィックシミュレーションフレームワークである。
我々は,ラベルなしLiDARデータを含むことにより,シミュレーション性能が一貫した向上を示す。
提案手法は,ラベリングを追加せずに交通シミュレーションリアリズムをスケールする方法である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:10:21 GMT)
Evolutionary Discovery of Reinforcement Learning Algorithms via Large Language Models [3.9] 強化学習アルゴリズムは、通常手作業で設計され、修正される学習更新ルールによって定義される。
本稿では,完全学習手順を実装した更新ルールを直接検索することで,強化学習アルゴリズムを発見するための進化的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:28:01 GMT)
From Simulation to Deep Learning: Survey on Network Performance Modeling Approaches [3.9] ネットワーク性能モデリングは、初期のコンピュータネットワークとインターネットの始まりに先立つ分野である。
本稿では,過去数十年における有線ネットワークにおけるネットワーク性能モデリング手法について検討する。
我々はまた、アプローチの分類を定義し、最先端の理解と、技術と研究コミュニティの関心が時間の経過とともにどのように進化するかを要約する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:03:19 GMT)
Lipschitz verification of neural networks through training [3.9] トレーニング中の自明な拘束力のペナルティ化により, 真のリプシッツ定数を効果的に正則化することを示した。
提案手法は,高度な検証のランタイムの複雑さを回避し,高い結果を得る。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:20:50 GMT)
Beyond the Answer: Decoding the Behavior of LLMs as Scientific Reasoners [3.8] 大規模言語モデル(LLM)は、複雑な推論タスクにおいて、ますます高度なパフォーマンスを達成する。
創発的推論の特徴付けは、長期的な解釈可能性と安全性に不可欠である。
我々は、科学的推論タスクのプロンプトを体系的に最適化するために、GEPAのカスタム版を使用する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:01:07 GMT)
ERPO: Token-Level Entropy-Regulated Policy Optimization for Large Reasoning Models [3.8] 本稿では,最適化の焦点を粗いシーケンスからきめ細かいトークンダイナミクスに移行するエントロピー制御ポリシ最適化(ERPO)を提案する。
ERPOは推論精度を高めるが、より簡潔で頑健な導出経路を得る。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:20:25 GMT)
Curriculum-Guided Myocardial Scar Segmentation for Ischemic and Non-ischemic Cardiomyopathy [3.8] 本研究では,課題条件下でのセグメンテーション性能の向上を目的としたカリキュラムベースのフレームワークを提案する。
提案手法は, セグメンテーションの精度と整合性を高めることを示し, 特に, 極小または拡散傷の症例について検討した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:22:00 GMT)
Framework for identifying the equivalence between Nature-Inspired Metaheuristics [3.8] 批判は、全ての新しいアルゴリズムが既に開発されたアルゴリズムのコピーに過ぎないと批判するほどまで達している。
2つの自然に着想を得たメタヒューリスティックスの間の類似性を推定するための強い同値定理を定義する。
自然に触発されたメタヒューリスティクスの同値性を特定するためのフレームワークが開発されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:29:41 GMT)
Gradient Manipulation in Distributed Stochastic Gradient Descent with Strategic Agents: Truthful Incentives with Convergence Guarantees [3.7] 既存の分散学習アプローチの重大な脆弱性は、すべてのエージェントが勾配更新中に誠実に振る舞うという暗黙の仮定である。
分散勾配降下における真正な挙動と正確な収束を両立する完全分散支払い機構を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:27:00 GMT)
Large Neighborhood Search for Multi-Agent Task Assignment and Path Finding with Precedence Constraints [3.7] 先行制約付きマルチエージェントパス探索(MAPF-PC)は衝突のない計画計算のためのよく研究されたフレームワークである。
本研究では,MAPF-PCシードから始まる大規模な地域探索手法を開発し,再割り当てによる地区修復を反復的に改善する。
実験により、最も優れた構成は、固定割り当てシードソリューションよりも89.1%のインスタンスを改善していることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:12:26 GMT)
World2Rules: A Neuro-Symbolic Framework for Learning World-Governing Safety Rules for Aviation [3.7] 我々は、現実世界の航空データから世界の安全ルールを学習するための、ニューロシンボリックなフレームワークWorld2Rulesを紹介する。
World2Rulesは、名目上の運用データと航空事故、インシデントレポートの両方から学ぶ。
純粋な神経系よりも23.6%高いF1スコア、シングルパス神経シンボルベースラインよりも43.2%高いF1スコアを達成するためのルールを学習していることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:48:03 GMT)
Pseudo Label NCF for Sparse OHC Recommendation: Dual Representation Learning and the Separability Accuracy Trade off [3.6] 調査駆動環境における極端相互作用空間下でのレコメンデーションについて検討した。
我々は,行列因子化,多層パーセプトロン,NeuMFなどの協調フィルタリングアーキテクチャを拡張し,サーベイグループ特徴アライメントから擬似ラベルを抽出する。
結果として得られる Pseudo Label NCF は双対埋め込み空間を学習する: ランク付けのための主埋め込みとセマンティックアライメントのための擬似ラベル埋め込みである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:14:29 GMT)
The force of attraction between nucleons due to vacuum fluctuation [3.4] 真空は中間子場からなると考える。
量子流体力学では、中間子は核力の担体である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:45:48 GMT)
Explicit States with Two-sided Long-Range Magic [3.3] 非安定化性(英: Nonstabilizerness)またはマジック(英: magic)は、古典的にシミュラブルなクリフォードフレームワークを超える量子優位性に必要なリソースである。
最近の研究は、多体状態での魔法の構造をチャート化し始めた。
本研究では,両面の長距離魔法を確実に有する明示的状態を構築する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:31:08 GMT)
Fine-Tuning Large Language Models for Cooperative Tactical Deconfliction of Small Unmanned Aerial Systems [3.3] 低高度空域における小型無人航空システム(SUAS)は、安全臨界条件下での信頼性の高い戦術的不信の必要性を高めている。
本稿では, 大規模言語モデル (LLMs) を, 微調整戦略を用いた協調的マルチエージェント・戦術デコンフリクションの意思決定者として検討する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:22:27 GMT)
DRIVE-Nav: Directional Reasoning, Inspection, and Verification for Efficient Open-Vocabulary Navigation [3.2] DRIVE-Navは永続的な方向の探索を組織する構造化されたフレームワークである。
冗長なリビジョンを削減し、パス効率を向上させる。
HM3D-OVON、HM3Dv2、MP3Dの実験は、全体的な性能と一貫した効率向上を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:12:17 GMT)
MR-ImagenTime: Multi-Resolution Time Series Generation through Dual Image Representations [3.2] 時系列予測は多くの領域において不可欠であるが、既存のモデルは固定長入力と不十分なマルチスケールモデリングに苦慮している。
MR-CDM,階層型マルチレゾリューショントレンド分解,可変長入力への適応埋め込み機構,マルチスケール条件拡散プロセスを組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:25:35 GMT)
Design Principles for the Construction of a Benchmark Evaluating Security Operation Capabilities of Multi-agent AI Systems [3.2] 大規模言語モデル(LLM)とマルチエージェントAIシステムは、サイバーセキュリティオペレーションの可能性を増している。
この文献では、コーディネートされたマルチタスク・ブルーチームAIを評価するための体系的なベンチマークは提案されていない。
我々は,大規模なランサムウェア攻撃インシデント応答の文脈において,5つのブルーチームタスクからなるSOC-benchの概念設計を開発した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:01:00 GMT)
Self++: Co-Determined Agency for Human--AI Symbiosis in Extended Reality [3.1] Self++は、拡張現実における人間-AI共生のための設計青写真である。
それは、ますます有能なAIエージェントの恩恵を受けながら、人間のオーサシップを保っている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:32:23 GMT)
CSAttention: Centroid-Scoring Attention for Accelerating LLM Inference [3.1] CSAttention(Centroid-Scoring Attention)は、高スループットコンテキストに最適化された訓練不要のスパースアテンション手法である。
計算処理を1回のオフラインプリフィルフェーズにフロントロードし、複数のクエリでアモートできる。
モデル精度と推論速度の両方において、最先端のスパースアテンション手法より一貫して優れている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:42:29 GMT)
Policy-Guided Threat Hunting: An LLM enabled Framework with Splunk SOC Triage [2.9] 進化する脅威を監視するための,自動化された動的脅威追跡フレームワークを提案する。
確立されたSIEMプラットフォームであるSplunkとAgentic AIを統合することで、独自の脅威狩りフレームワークを開発した。
このフレームワークは、異なるSOC目標に効果的に適応し、疑わしい、悪意のあるトラフィックを特定できる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:17:07 GMT)
ThermoAct:Thermal-Aware Vision-Language-Action Models for Robotic Perception and Decision-Making [2.9] 本稿では,ロボットのタスク実行に熱情報を組み込んだビジョン・ランゲージ・アクション・フレームワークを提案する。
提案システムは、複雑な自然言語コマンドを解釈する高レベルプランナとして、ビジョンランゲージモデル(VLM)を利用する。
視覚データのみに依存した従来の手法とは異なり,本手法は熱情報を統合し,ロボットが物理的特性を認識し,環境安全を積極的に確保することを可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:44:33 GMT)
Decoupling Wavelet Sub-bands for Single Source Domain Generalization in Fundus Image Segmentation [2.8] 本研究では,新しいウェーブレット誘導分割ネットワークであるWaveSDGを紹介した。
ウェーブレットサブバンド分解によって、解剖学的構造をドメイン固有の外観から切り離す。
一貫して7つの最先端データセットを上回ります。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:04:45 GMT)
Transcription and Recognition of Italian Parliamentary Speeches Using Vision-Language Models [2.8] イタリアの議会演説を転写するための既存の努力は、従来の光学文字認識パイプラインに依存してきた。
イタリア議会演説の自動書き起こし,セマンティックセグメンテーション,エンティティリンクのためのビジョン言語モデルに基づくパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:06:49 GMT)
MarkushGrapher-2: End-to-end Multimodal Recognition of Chemical Structures [2.8] MarkushGrapher-2は文書中の化学構造のマルチモーダル認識のためのエンドツーエンドのアプローチである。
実世界のマルコシュ構造の大規模データセットを構築するための自動パイプラインを導入する。
提案手法はマルチモーダルマークシュ構造認識における最先端モデルを大幅に上回る。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:11:17 GMT)
Known Intents, New Combinations: Clause-Factorized Decoding for Compositional Multi-Intent Detection [2.8] マルチインテリジェンス検出において,構成一般化を強調するために構築されたベンチマークを提案する。
シングルトンインテントのみをトレーニングした軽量デコーダであるClausComposeも紹介します。
その結果,マルチインテリジェント検出にはより構成的評価が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:06:54 GMT)
FluidFlow: a flow-matching generative model for fluid dynamics surrogates on unstructured meshes [2.7] 本研究では,条件付きフローマッチングに基づく生成モデルであるFluidFlowを紹介する。
FluidFlowは、構造化メッシュと非構造化メッシュの両方で定義されたCFDデータを直接操作するように設計されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:08:20 GMT)
Shor's algorithm is possible with as few as 10,000 reconfigurable atomic qubits [2.7] Shorのアルゴリズムは1万個の再構成可能な原子量子ビットで暗号的に関連するスケールで実行可能であることを示す。
最近の中性原子実験では、エラー補正しきい値以下で普遍的なフォールトトレラント動作が実証されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:10:08 GMT)
Multi-Agent LLMs for Adaptive Acquisition in Bayesian Optimization [2.7] 本稿では,Large Language Models (LLM) が探索・探索戦略をどのように構築し,適応するかを示す。
本稿では,探索・探索制御を戦略的政策仲介と戦術的候補生成に分解する多エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:05:30 GMT)
Hidden Elo: Private Matchmaking through Encrypted Rating Systems [2.7] 完全同型暗号(FHE)に基づくプライベートレーティングシステムであるH-Eloを提案する。
H-Eloは、評価値をプライベートかつセキュアに保ちつつ、平文の実装と類似した精度を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:50:57 GMT)
Q-DIVER: Integrated Quantum Transfer Learning and Differentiable Quantum Architecture Search with EEG Data [2.7] 大規模事前学習型脳波エンコーダ(DIVER-1)と微分可能な量子分類器を組み合わせたハイブリッドフレームワークQ-DIVERを提案する。
我々は、エンドツーエンドの微調整中にタスク最適回路トポロジを自律的に発見するために、微分可能な量子アーキテクチャー探索を用いる。
これらの結果は、高次元生体信号処理のためのパラメータ効率戦略として量子伝達学習を検証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:37:53 GMT)
\textit{Versteasch du mi?} Computational and Socio-Linguistic Perspectives on GenAI, LLMs, and Non-Standard Language [2.6] 大規模言語モデルと生成的人工知能は、より難解な言語に「不公平」であり、デジタル言語分割の深化を図っている。
本稿では,これらの技術が「モノリス的,モノリンガル的,統語的,統語論的に標準化された意味体系」として言語認識を悪化させていることを論じる。
南チロル方言はイタリア・南チロルの非公式なコミュニケーションに広く用いられているが、クルド語の変種は、GenAIと言語的変動と標準化の交差点を学際的に探究するための出発点である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:34:41 GMT)
Improving Efficiency of GPU Kernel Optimization Agents using a Domain-Specific Language and Speed-of-Light Guidance [2.6] エージェントが操作する抽象化レベルについて、2つの重要な観察を行う。
CUTLASSが支援するGPUカーネル用のコンパイラを備えたDSLであるCUTLASSでこれらの原則を実装します。
我々は、SOLガイダンスを使用して、ヘッドルームを推定し、最適化試験をガイドし、SOLに近い問題を優先順位付けし、ベンチマークをゲームするカーネルにフラグを付ける。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:16:39 GMT)
SVH-BD : Synthetic Vegetation Hyperspectral Benchmark Dataset for Emulation of Remote Sensing Images [2.6] このデータセットは、画素レベルの植生特性マップと組み合わせた合成ハイパースペクトル画像立方体10,915個を含む。
それぞれの超スペクトル立方体は10nm解像度で400-2500nmの211バンドと64×64ピクセルの固定空間配置を持つ。
このデータセットは、東アフリカ、北フランス、東インド、南スペインの4つの生態学的に多様な地域をカバーしている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:02:42 GMT)
MMFace-DiT: A Dual-Stream Diffusion Transformer for High-Fidelity Multimodal Face Generation [2.6] 相乗的マルチモーダル顔合成のための統合デュアルストリーム拡散変換器MMFace-DiTを導入する。
その中核的な特徴は、空間(マスク/スケッチ)と意味(テキスト)トークンを並列に処理するデュアルストリームトランスフォーマーブロックにある。
MMFace-DiTは、6つの最先端マルチモーダル顔生成モデルに対して、視覚的忠実度を40%向上させ、迅速なアライメントを実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:44:18 GMT)
A Deep Reinforcement Learning Framework for Closed-loop Guidance of Fish Schools via Virtual Agents [2.6] 仮想エージェントを用いた魚学校の閉ループ指導のための深層強化学習フレームワークを提案する。
これらのエージェントは、シミュレーションにおいてPPO(Proximal Policy Optimization)を介して訓練されたポリシーによって制御され、ラムマイノイズテトラ(Petitella bleheri)を用いた物理実験に展開される。
生活者の行動に対処するため, 指向性指導と社会的結束のバランスをとるために, 複合報酬関数を設計する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:10:02 GMT)
Unsafe2Safe: Controllable Image Anonymization for Downstream Utility [2.5] Unsafe2Safeは、プライバシーに問題のあるイメージを検出し、機密性の高いリージョンのみを書き換える、完全に自動化されたパイプラインである。
視覚言語モデルを用いて、プライバシリスクのイメージを検査し、ペア化されたプライベートキャプションとパブリックキャプションを生成し、大規模言語モデルに構造化されたアイデンティティニュートラルな編集命令を生成する。
ステージ2では、命令駆動の拡散エディタを使用して、これら2つのテキストプロンプトを適用し、プライバシセーフなイメージを生成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:54:47 GMT)
Quid est VERITAS? A Modular Framework for Archival Document Analysis [2.5] 本稿では、デジタル化を転写、レイアウト分析、セマンティックエンリッチメントを含む統合ワークフローとして再認識するフレームワークであるVERITASを提案する。
我々は,ベルナルディーノ・コリオの『ミラノのストリア』の批判版において,1,600ページを超えるルネサンス期の年代記であるVERITASを評価した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:14:51 GMT)
Courtroom-Style Multi-Agent Debate with Progressive RAG and Role-Switching for Controversial Claim Verification [2.5] 大型言語モデル (LLM) は、幻覚や浅い推論のため、高い精度のクレーム検証には信頼できないままである。
本稿では, 検証を構造化された, 反対の審議会として再編成する, 裁判所方式のマルチエージェントフレームワーク PROClaim を提案する。
提案手法は,プログレッシブRAG (Progressive RAG, P-RAG) と特別な役割(プレーンティフ, ディフェンス, ジャッジ)を統合し, 議論の間, 証拠プールを動的に拡大・洗練する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:23:15 GMT)
Mimosa Framework: Toward Evolving Multi-Agent Systems for Scientific Research [2.4] Mimosaは、タスク固有のマルチエージェントを自動的に合成し、それを反復的に洗練する進化中のマルチエージェントフレームワークである。
Mimosaは完全なオープンソースプラットフォームとしてリリースされ、コミュニティ主導のASRのためのオープンな基盤を提供することを目指している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:35:57 GMT)
Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal [2.4] ゴーストポイント(ゴーストポイント、またはゴーストポイント)は、ガラスと反射面からのマルチパスレーザーの反射によって引き起こされる偽反射であり、3Dマッピングと位置決め精度が著しく低下している。
We exploit full-waveform LiDAR (FWL) which captures complete temporal intensity profiles not only peak distances。
Ghost-FWLは、ゴースト検出と削除のための最初の、そして最大のアノテートされたモバイルFWLデータセットである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:46:55 GMT)
Deep Research of Deep Research: From Transformer to Agent, From AI to AI for Science [2.3] 我々は、ディープリサーチを明確に正確に定義し、産業のディープリサーチと学術のAI for Scienceからの視点を統一する。
我々は、LLMと安定拡散を生成AIの双子の柱として位置づけ、Transformerからエージェントへと進化するロードマップを作成します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:29:47 GMT)
Geometry-aware similarity metrics for neural representations on Riemannian and statistical manifolds [2.3] 類似度測定は、ニューラルネットワークがタスクを解くために使用する表現的ジオメトリを解釈するために広く用いられている。
本稿では, 距離類似度解析(MSA)を導入する。これは, 多様体仮説の下でのニューラル表現の内在的幾何を比較するための新しい手法である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:59:22 GMT)
Diffusion-Based Generative Priors for Efficient Beam Alignment in Directional Networks [2.1] ビームアライメントは、細いビームが正確かつ低オーバーヘッドのトレーニングを必要とする方向のmmWaveとTHzシステムにおいて重要な課題である。
我々は,ビームアライメントを生成タスクとして再キャストし,コンパクトな幾何学的特徴やマルチパス特徴に先立って確率的ビームを学習する条件拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:21:03 GMT)
CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence [2.1] CARLA-Airは、1つのUnreal Engineプロセス内に高忠実度都市運転と物理精度のマルチロータ飛行を統合するオープンソースのインフラである。
CARLA-Airは、共有物理ティッチとレンダリングパイプライン内で、ルールに準拠したトラフィック、社会的に認識された歩行者、空力的に一貫性のあるUAVダイナミクスを備えた環境を提供する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:49:29 GMT)
Attesting LLM Pipelines: Enforcing Verifiable Training and Release Claims [2.0] 現代の大規模言語モデル(LLM)システムは、事前トレーニングされた重み付け、微調整アダプタ、データセット、依存関係パッケージ、コンテナイメージといったサードパーティの成果物から組み立てられている。
このスピードには、妥協された依存関係、悪意のあるハブアーティファクト、安全でないデフォールト化、偽造された前兆、バックドアモデルなど、サプライチェーンのリスクが伴う。
本稿では,信頼された環境にアーティファクトが認められる前に,クレームエビデンスを検証し,安全なローディングと静的スキャンポリシーを適用し,セキュアなシリアル配置制約を適用した,証明対応のプロモーションゲートを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:37:48 GMT)
"What Did It Actually Do?": Understanding Risk Awareness and Traceability for Computer-Use Agents [2.0] 私たちはOpenClawエコシステムのコーパスを構築しており、インシデント、アドバイザリ、悪意のあるスキルレポート、ニュースカバレッジ、チュートリアル、ソーシャルメディアの物語などが含まれています。
我々は,ユーザと実践者がいかにスキル,自律性,特権,永続性,アンインストールを理解しているかを調べるために,インタビュースタディを実施している。
我々は、エージェントアクション、タッチされたリソース、パーミッション履歴、証明、永続的な副作用を可視化するためのトレーサビリティフレームワークおよびプロトタイプインターフェースであるAgentTraceを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:12:55 GMT)
LDDMM stochastic interpolants: an application to domain uncertainty quantification in hemodynamics [2.0] 三次元形状の生成モデリングのための新しい条件補間フレームワークを提案する。
本稿では,患者の初期コホートから大動脈の形状が生成する心血管シミュレーションの文脈における応用について述べる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:52:36 GMT)
The Scaffold Effect: How Prompt Framing Drives Apparent Multimodal Gains in Clinical VLM Evaluation [2.0] 臨床画像コホートであるtextscFOR2107 と textscOASIS-3 の2値分類により,12個のオープンウェイト視覚言語モデル(VLM)を評価した。
これらの条件下では、より小さなVLMは、ニューロイメージングの文脈を導入すると最大58%のF1のゲインを示し、蒸留されたモデルは、桁違いに大きいものと競合するようになる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:58:10 GMT)
ChemCLIP: Bridging Organic and Inorganic Anticancer Compounds Through Contrastive Learning [1.8] ChemCLIPはデュアルエンコーダのコントラスト学習フレームワークである。
ChemCLIPは、共有抗がん活性に基づいて統一表現を学習することで、有機-無機の分断を橋渡しする。
モーガン指紋は平均アライメント比0.899、下流分類AUCは0.859(無機)と0.817(有機)で優れていた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:28:36 GMT)
Zero-shot Cross-domain Knowledge Distillation: A Case study on YouTube Music [1.7] 知識蒸留(KD)は、ライブトラフィックを提供する遅延感度モデルの品質向上に広く利用されている。
クロスドメインKDは、教師をデータリッチソースドメインから活用することで、コスト効率の良い代替手段を提供する。
マルチタスクランキングモデルにゼロショットクロスドメインKDを用いるケーススタディを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:47:58 GMT)
Device independent quantum key distribution with robust self-tests [1.7] デバイス独立量子鍵分布 (DIQKD) は最小の仮定を持つ量子鍵分布のモデルを提供する。
本稿では,DIQKD方式の仮定に基づくプロトコルを,ローカルなセルフテストによってデバイス依存QKDプロトコルに引き上げる手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:40:22 GMT)
Physics-Informed Neural Networks for Predicting Hydrogen Sorption in Geological Formations: Thermodynamically Constrained Deep Learning Integrating Classical Adsorption Theory [1.6] 微粒な地質材料中の水素吸着の予測は地下の水素貯蔵能力の評価、キャップロックの完全性の評価、地下エネルギーシステムの水素移動の特徴付けに不可欠である。
本稿では,古典的吸着理論と熱力学的制約を直接学習プロセスに埋め込むことにより,この制限に対処する多スケール物理情報ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:59:36 GMT)
Shy Guys: A Light-Weight Approach to Detecting Robots on Websites [1.5] 本稿では,クライアント側のインタラクションを伴わない標準的なWebサーバログ上でのみ動作する,軽量でパッシブなボット検出手法を提案する。
世界中にホストされているウェブサイトから収集された54,945個のユニークなユーザエージェント文字列を含む460万件以上のリクエストに対して,本手法の評価を行った。
提案手法は, 偽陽性率3%を維持しながら, ボットトラフィックの67.7%を検知し, 美術品の状態を20%以下に向上させる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:07:00 GMT)
Towards an End-to-End System for 3D Tracking of Physical Objects in Virtual Immersive Environments [1.5] 本研究の目的は、バーチャルリアリティ(VR)アプリケーションのための物理的な3Dオブジェクトを追跡するエンドツーエンドシステムを確立することである。
我々は,VR空間における小さな物体の位置と反射をリアルタイムに追跡する必要のあるトレーニングアプリケーションに焦点をあてる。
本稿では,ソフトウェアハーネスを併用した画像マーカーによる物体追跡システムを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:00:13 GMT)
Contextuality of quantum non-demolition measurement via state discrimination [1.4] 理論的には、量子的非破壊測定の構造に固有の文脈的特徴を実証する。
この結果は、量子システムにおける非古典性観測の範囲を広げ、最終的には様々な量子技術の進歩に寄与する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:15:45 GMT)
Attention Frequency Modulation: Training-Free Spectral Modulation of Diffusion Cross-Attention [1.4] クロスアテンション(Cross-attention)は、テキスト条件が遅延拡散モデルとなる主要なインターフェースである。
本稿では,Attention Frequency Modulation (AFM)を紹介した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:24:41 GMT)
Deflation-PINNs: Learning Multiple Solutions for PDEs and Landau-de Gennes [1.4] 本稿では,デフレ損失をPINNやDeep Operator Networksに基づくアーキテクチャと統合するフレームワークであるDedelation-PINNを紹介する。
損失関数にデフレ項を組み込むことで、デフレ-PINNを系統的に、異なる有限個の解枝を探索して収束させる。
以上の結果から,Deflation-PINNは複数の異なる結晶構造を同定し,特徴付けることができることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:09:00 GMT)
Data-informed lifting line theory [1.4] 本稿では,従来の揚力線理論(LLT)の予測能力を,より広い空力状態に拡張するデータ駆動型フレームワークを提案する。
畳み込み層と完全に接続された層を持つニューラルネットワークアーキテクチャを開発する。
トレーニングされたモデルは、水平リフトおよびドラッグ分布における高次の3次元効果をキャプチャする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:39:56 GMT)
Using Games to Learn How Large Language Models Work [1.4] 大規模言語モデル(LLM)の動作とデータ利用の原理を実証する2つのゲームを提案する。
最初のゲームであるLearning Like an LLMは、LLMが特定のデータセットに基づいてテキストのシーケンスを予測するように訓練されていることを伝えようとしている。
第2のゲームであるTag-Team Text Generationは、LLMが予測されたデータの確率とランダム性の両方を用いて、一度に1ワードのテキストを生成することを教えることに焦点を当てている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:40:52 GMT)
Coconstructions in spoken data: UD annotation guidelines and first results [1.3] 2つの表現が提案されている: 音声ターンへのセグメンテーションに続く話者ベース表現と、音声ターンにまたがる依存関係を持つ依存性ベース表現である。
新たな提案は、改革と修復を区別し、未完成のフレーズの要素を促進するためにもなされる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:45:15 GMT)
Math Takes Two: A test for emergent mathematical reasoning in communication [1.3] Math Takes Twoは、コミュニケーションによる数学的推論の出現を評価するために設計された新しいベンチマークである。
ヒトの数学的認知は、正確なコミュニケーションの必要性に共進化したという仮説に触発され、我々のベンチマークは、従来の数学的知識のない2つのエージェントが共通のシンボルプロトコルを開発できるかどうかを検証した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:28:48 GMT)
Critic-Free Deep Reinforcement Learning for Maritime Coverage Path Planning on Irregular Hexagonal Grids [1.3] 海上監視任務は、広大で幾何学的に複雑な領域におけるセンシング資産の効率的な配分に依存している。
伝統的なカバー・パス・プランニングアプローチは不規則な海岸線、島々、および排他的地域と戦っている。
本研究では,不規則海域の六角形格子表現においてCPPを解くための深層強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:56:38 GMT)
SAGAI-MID: A Generative AI-Driven Middleware for Dynamic Runtime Interoperability [1.3] SAGAI-MIDは、大規模言語モデル(LLM)を使用して実行時にスキーマミスマッチを動的に検出し、解決するFastAPIである。
SAGAI-MIDは、バージョンマイグレーション、IoTから分析へのブリッジング、および2つのプロバイダからの6つのLLM間のプロトコル変換にまたがる10の相互運用性シナリオで評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:46:41 GMT)
RAD-AI: Rethinking Architecture Documentation for AI-Augmented Ecosystems [1.3] AIが強化されたエコシステムは、スマートシティ、自律型フリート、インテリジェントプラットフォームのためのアーキテクチャ標準になりつつある。
しかし、実践者が依存するアーキテクチャ文書フレームワークであるarc42とC4モデルは決定論的ソフトウェアのために設計された。
RAD-AIは、ARC42を8つのAI固有のセクションで拡張し、C4を3つのダイアグラム拡張で拡張する後方互換性のある拡張フレームワークである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:48:56 GMT)
BitSov: A Composable Bitcoin-Native Architecture for Sovereign Internet Infrastructure [1.2] BitSovは、主権のあるインターネットインフラストラクチャのためのアーキテクチャフレームワークである。
既存の分散テクノロジを、Bitcoinのベース層に固定された、統一された8層プロトコルスタックに構成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:44:06 GMT)
Bootstrap Perception Under Hardware Depth Failure for Indoor Robot Navigation [1.1] ハードウェア深度障害下での屋内ロボットナビゲーションのためのブートストラップ認識システムを提案する。
廊下のデータでは、飛行時のカメラは反射面の深さピクセルの最大78%を失うが、2D LiDARだけではスキャン面の上の障害物を感知できない。
我々のシステムは、この失敗の自己参照特性を利用しており、センサーの生き残った有効なピクセルは、学習した単色深度をメートル法スケールに調整する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:14:40 GMT)
EdgeDiT: Hardware-Aware Diffusion Transformers for Efficient On-Device Image Generation [1.0] モバイルニューラルプロセッシングユニット(NPU)に特化して開発されたハードウェア効率の良い生成変換器であるEdgeDiTを紹介する。
ハードウェア対応の最適化フレームワークを利用することで、特にモバイルデータフローに対して課税されるDiTバックボーン内の構造的冗長性を識別し、具現化する。
提案手法では,パラメータの20~30%の削減,FLOPの36~46%の削減,デバイス上のレイテンシの1.65倍の削減を実現した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:14:30 GMT)
A Predictive Control Strategy to Offset-Point Tracking for Agricultural Mobile Robots [1.0] 既存の経路追従コントローラの多くは、ロボットの運動中心にのみ焦点を合わせ、装着された機器の空間的フットプリントやダイナミックスを無視している。
本稿では,[1] で導入したアプローチを拡張したクローズドフォーム予測制御手法を提案する。
提案手法は, 中央値追跡誤差を24%から56%削減し, 曲率遷移時のピーク誤差を最大70%低減する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:46:29 GMT)
Tailoring AI-Driven Reading Scaffolds to the Distinct Needs of Neurodiverse Learners [1.0] 本研究では,教師付き包括的文脈における構造的・意味的足場形状の理解と読書体験について検討した。
定式化質問紙による読解理解を計測し,オープンエンドフィードバックとともに,児童・セラピストが報告した簡易体験尺度を収集した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:38:41 GMT)
How Much Does Persuasion Strategy Matter? LLM-Annotated Evidence from Charitable Donation Dialogues [1.0] 1017-dialogue PersuasionForGood corpus で 10,600 のコンサージャを全てアノテートします。
戦略カテゴリーだけでは寄付の成果のばらつきはほとんど説明できない。
ギルトに基づく魅力は、社会的な設定では非生産的である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:17:22 GMT)
Superintelligence and Law [1.0] 人工超知能は、我々が知っているように法的な秩序を変えるだろう。
AIエージェントは、法体系におけるさまざまな役割を担います。
AIエージェントを既存の人間法に合わせる試みは、新たな課題に直面するだろう。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:51:51 GMT)
BACE: LLM-based Code Generation through Bayesian Anchored Co-Evolution of Code and Test Populations [1.0] 我々は、ベイズ的共進化過程として合成を再構成するフレームワークであるBACEを紹介する。
BACEはプロプライエタリモデルとオープンウェイトな小言語モデルの両方で優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:40:11 GMT)
Realistic Market Impact Modeling for Reinforcement Learning Trading Environments [1.0] 非線形市場影響モデルを統合する3つのGymnasium互換トレーディング環境を導入する。
各環境は、プラグ可能なコストモデル、指数的崩壊を伴う永続的なインパクトトラッキング、包括的な貿易レベルのロギングを提供する。
FinRL-Metaのオープンソース拡張として、フルスイートをリリースしています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:57:11 GMT)
Intelligent Road Condition Monitoring using 3D In-Air SONAR Sensing [1.0] 本稿では,道路材料分類と道路損傷検出・分類の2つの応用について考察する。
我々は,SONARセンサデータから路面タイプを決定するのに精通しており,F1スコアはテストセットの90%に近づいた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:05:28 GMT)
Exact Skin Critical Phase and Configurable Fractal Wavefunctions via Imaginary Gauge Phase Imprint in Non-Hermitian Lattices [1.0] 皮膚臨界位相(SCP)と呼ばれる1次元(および2次元)の正確な臨界波動関数を持つ新しい位相を示す。
全体的に均一な密度分布を持つ従来の臨界相とは異なり、SCPはマクロな多フラクタル分布によって特徴づけられる。
また,従来の臨界相における拡散挙動とは対照的に,SCPの弾道動態を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:18:38 GMT)
Cost-Sensitive Neighborhood Aggregation for Heterophilous Graphs: When Does Per-Edge Routing Help? [0.9] CSNA(Cost-Sensitive Neighborhood Aggregation)は、学習プロジェクションにおいて、一対の距離を計算するGNN層である。
平均アグリゲーションは、不均一な条件下でラベルに整列した信号方向を逆転させることができることを示す。
CSNAは、敵対的ヘテロフィリーデータセットの最先端の手法と競合する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:07:44 GMT)
See Something, Say Something: Context-Criticality-Aware Mobile Robot Communication for Hazard Mitigations [0.9] AMRには、臨界度レベル、時間感度、緩和の可能性の体系的評価が必要であると論じる。
本稿では,VLM/LLMに基づく認識が適応メッセージ生成を駆動するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:28:05 GMT)
Seeing the Unseen: Rethinking Illicit Promotion Detection with In-Context Learning [0.9] 不正なオンラインプロモーションは、検出を避けるために進化する永続的な脅威である。
本稿では,不正なプロモーション検出のための統合フレームワークとして,インコンテキスト学習(ICL)を体系的に研究する。
適切に構成されたICLは22倍のラベル付きサンプルを使用して微調整されたモデルに匹敵する性能を達成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:08:59 GMT)
A Neural Tension Operator for Curve Subdivision across Constant Curvature Geometries [0.9] 補間スキームは、新しい頂点を繰り返し挿入することで、片方向線形制御ポリゴンから滑らかな曲線を生成する。
一つの140K-パラメータネットワークによって予測されるエッジ挿入角をグローバルパラメータに置き換える共有学習テンションを導入する。
分布外のISS軌道軌道軌道の例では、曲げエネルギーは41%減少し、角粗さは68%減少し、ハウスドルフ距離はわずかに増加した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:16:25 GMT)
Serialized Red-Green-Gray: Quicker Heuristic Validation of Edges in Dynamic Roadmap Graphs [0.9] Red-Green-Gray (RGG)は、SPITE上に構築され、ロードマップエッジを無効(赤)、有効(緑)、不確実(灰色)と迅速に分類する手法である。
Serial RGGは、バッチシリアライゼーションとベクトル化を活用して効率的なGPUアクセラレーションを実現する高性能なバリエーションを提供する。
この幾何精度と計算速度の組み合わせにより、SerRGGは時間クリティカルなロボット応用に非常に効果的である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:56:54 GMT)
Resonance fluorescence of an artificial atom with a time-delayed coherent feedback [0.9] 超伝導導波路に埋め込まれたトランスモン人工原子(量子ビットとして扱われる)を用いた時間遅れコヒーレントフィードバックシステムを示す。
クビット緩和時間に匹敵する遅延時間を持つフィードバックループを使用することで、クビット進化の力学に非マルコフ効果が顕著に現れる。
本研究は,非マルコフ政権におけるモロー三重項の実験報告である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:55:08 GMT)
Koopman-based surrogate modeling for reinforcement-learning-control of Rayleigh-Benard convection [0.9] 線形リカレントオートエンコーダネットワーク(LRAN)を用いて2次元レイリー・ベナード対流のRL制御を高速化する。
我々は、ランダムな行動によって生成された事前計算データに基づいて訓練されたサロゲートと、進化するポリシーから収集されたデータを用いて反復的に訓練されたポリシー対応サロゲートの2つのトレーニング戦略を評価する。
以上の結果から,サロゲートのみのトレーニングが制御性能の低下につながる一方で,サロゲートとDNSを併用することで,トレーニング時間を40%以上削減しつつ,最先端のパフォーマンスを回復できることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:23:03 GMT)
A Semantic Observer Layer for Autonomous Vehicles: Pre-Deployment Feasibility Study of VLMs for Low-Latency Anomaly Detection [0.8] 本稿では,一次AV制御ループと並行して1-2Hzで動作する量子視覚言語モデル(VLM)を提案する。
最適化されていないFP16ベースラインの50倍の速度で500msの推算を行う。
その結果,組込みAIAVプラットフォーム上でのセマンティックオブザーバアーキテクチャのデプロイ前実現可能性を確立した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:14:03 GMT)
EBuddy: a workflow orchestrator for industrial human-machine collaboration [0.8] EBuddyは、産業環境における自然な人間と機械のコラボレーションのための音声誘導ワークフローオーケストレータである。
EBuddyは、実行時に解釈可能な決定フレームを提供する有限状態マシン(FSM)駆動アプリケーションとして専門家のプラクティスを運用する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:29:49 GMT)
Cryptanalysis of a Lightweight RFID Authentication Protocol Based on a Variable Matrix Encryption Algorithm [0.8] 低コストな移動RFIDシステムにおいて,AM-SUEO-DBLTKM可変行列暗号アルゴリズムに基づく双方向RFID認証プロトコルが提案された。
本稿では,プロトコルの構造的弱点について述べる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:35:40 GMT)
ORACAL: A Robust and Explainable Multimodal Framework for Smart Contract Vulnerability Detection with Causal Graph Enrichment [0.8] 本稿では,制御フローグラフ,データフローグラフ,コールグラフを統合したグラフ学習フレームワークORACALを提案する。
ORACALは、レトリーバル拡張生成(RAG)とLarge Language Models(LLM)から専門家レベルのセキュリティコンテキストを持つ重要なサブグラフを選択的に強化する
透明性のために、このフレームワークはPGExplainerを採用して、脆弱性トリガーパスを特定するサブグラフレベルの説明を生成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:46:59 GMT)
Graph Vector Field: A Unified Framework for Multimodal Health Risk Assessment from Heterogeneous Wearable and Environmental Data Streams [0.7] グラフベクトル場(Graph Vector Field, GVF)は、健康リスクを時間変化した単純錯体上のベクトル値場としてモデル化するフレームワークである。
リスクはベクトル値コチェーンとして表現され、その進化はホッジ・ラプラシアンや離散外部計算演算子とパラメータ化される。
本稿では, 数学的基礎, 建築設計, 形式的保証について検討し, 実証検証が進行中の課題である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:26:44 GMT)
SIMR-NO: A Spectrally-Informed Multi-Resolution Neural Operator for Turbulent Flow Super-Resolution [0.7] 本研究では,中間空間分解能を横断する不測の逆写像を分解する階層的演算子学習フレームワークを提案する。
提案手法は2次元乱流を用いて,128時間128$渦場を再構成する。
201の独立したテスト実現において、SIMR-NOは平均相対的な$ell$エラーを26.04%$で達成し、全てのメソッドでエラーのばらつきは最小である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:17:27 GMT)
Why That Robot? A Qualitative Analysis of Justification Strategies for Robot Color Selection Across Occupational Contexts [0.6] 本稿では,各職種における肌色や人為的特徴の異なるロボットの選択を合理的に行う方法について検討する。
1,038人の参加者から4,146人のオープンエンドの正当性を質的に分析することにより,4つの専門的文脈でロボットの色選択を駆動する推論フレームワークをマップする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:51:50 GMT)
The Multi-AMR Buffer Storage, Retrieval, and Reshuffling Problem: Exact and Heuristic Approaches [0.5] 本稿では,マルチAMR BSRRPを導入し,ロボット群を協調して並列リシャッフルタスクを管理する。
ベンチマーク目的の正確なソリューションを得るために、バイナリプログラミング(IP)モデルを定式化します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:39:00 GMT)
Practical Feasibility of Sustainable Software Engineering Tools and Techniques [0.5] 本研究では,既存の持続可能なソフトウェア工学ツールや技術の実現可能性について,ソフトウェア実践者がどのように認識するかを検討する。
エネルギー消費, グリーン, ワークロード管理を対象とするSSEツールの顕著なカテゴリを特定し, 3つの実践的側面に沿って評価した。
この結果から,実践者は既存のパイプラインに統合し,最小限かつ局所的なデータアクセスを必要とし,解釈可能で実行可能なアウトプットを提供するツールを強く好んだことが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:47:26 GMT)
Towards Supporting Quality Architecture Evaluation with LLM Tools [0.5] 本稿では,LLMツールとしてのMS Copilotについて,学生が提案する品質貢献シナリオを分析し,経験者によるレビューを行う。
最初の結果から,LLMは手動で生成した品質シナリオのリスクや感度点,トレードオフ分析に関して,より正確で正確な結果を生成するとともに,作業に要する労力を大幅に削減することがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:44:24 GMT)
Hunting for quantum advantage in electronic structure calculations is a highly non-trivial task [0.5] 我々は,CAS(54,36)モデル空間上のFe$_4$S$_4$分子クラスターに対して,最先端の性能と高精度な基底状態エネルギーを報告した。
また、Fe$_5$S$_12$H$_45-$分子系に対して、102オービタル[CAS(89,102)]の最大89電子のCASサイズに対するCAS-SCFベースの軌道最適化を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:32:47 GMT)
IsoQuant: Hardware-Aligned SO(4) Isoclinic Rotations for LLM KV Cache Compression [0.4] 四元数代数に基づくブロックワイズ回転フレームワークと、SO(4)$の等クリニック分解を提案する。
IsoQuantは、平均的なカーネルレベルのスピードアップを4.5times$--$4.7times$ over RotorQuantで達成し、ピーク時のスピードアップは6times$以上である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:37:45 GMT)
Physics-Informed Framework for Impact Identification in Aerospace Composites [0.4] ThePhy-IDフレームワークは、観測バイアス、誘導バイアス、学習バイアスを統合し、物理的に一貫性があり、数値的に安定した影響識別を実現する。
その結果,物理インフォームドバイアスの体系的な統合により,信頼性,物理的に整合性,およびデータ効率のよい影響の同定が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:40:28 GMT)
Quantized Dissipation from the Inverse-Square Anomaly in a Non-Hermitian Klein-Gordon Field [0.4] 我々は、非エルミート的クライン=ゴードン場理論に異常な逆二乗相互作用を埋め込む、正確に解ける相対論的モデルを構築した。
特異点における厳密な外界条件を可逆吸収と解釈することで、一意の物理的実現が選択される。
結果として生じる崩壊速度は、異常スケーリング指数によってのみ決定される普遍的な幾何学的間隔を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:52:45 GMT)
Downscaling weather forecasts from Low- to High-Resolution with Diffusion Models [0.4] 我々は,アネモイフレームワーク内に実装された大域大気下降の確率的拡散に基づく手法を提案する。
このアプローチは、より微細な残差の条件分布を学習することにより、低分解能アンサンブル予測を高分解能アンサンブルに変換する。
このシステムは、ECMWF IFSから、100kmの粗い磁場を用いて、30kmの解像度で微細な変動を再現するために、再放送ペアを訓練する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:38:36 GMT)
Emergence WebVoyager: Toward Consistent and Transparent Evaluation of (Web) Agents in The Wild [0.4] 本研究は,既存のAIエージェント評価プラクティスにおける永続的欠点を明らかにする。
本稿では,評価方法論を標準化したWebVoyagerベンチマークの強化版であるEmergence WebVoyagerを紹介する。
OpenAI Operatorを評価するためにこのフレームワークを適用すると、ドメインとタスクタイプ間での大幅なパフォーマンスの変動が明らかになる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:27:28 GMT)
Synonymix: Unified Group Personas for Generative Simulations [0.4] マルチライフストーリーのペルソナから"ユニグラフ"を構築するパイプラインであるSynonymixを提案する。
人口統計基準を超える行動信号の保存を実証可能なプライバシー保証で実証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:13:45 GMT)
The Power of Power-of-SWAP: Postselected Quantum Computation with the Exchange Interaction [0.4] 計算基底SPAMと等方性ハイゼンベルク交換相互作用のみを用いて量子計算を構成する交換量子多項式時間(XQP)回路を導入する。
我々は,XQPがBPPとBQPの中間位置を占めており,その効率的な乗算誤差シミュレーションが階層を第3レベルに崩壊させることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:53:42 GMT)
Transfer Learning in Bayesian Optimization for Aircraft Design [0.3] 本稿では,移動学習を用いた代理モデルのアンサンブルを活用し,制約付きベイズ最適化フレームワークに統合する手法を提案する。
不均一な設計変数と制約に関連する航空機設計の最適化に特有な課題を同定する。
その結果、ベイズ最適化と比較して、初期最適化の繰り返しにおける収束の顕著な改善が示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:01:47 GMT)
Multi-fidelity approaches for general constrained Bayesian optimization with application to aircraft design [0.3] 目的と制約の両方から情報を取り入れることで、最適性を損なうことなく、計算コストをさらに削減できることを示す。
提案手法を用いることで,予算に制限のある制約準拠のソリューションを86%から200%に削減できることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:36:13 GMT)
Trust-Aware Routing for Distributed Generative AI Inference at the Edge [0.3] 本稿では,分散生成推論のための信頼度を考慮した協調フレームワークG-TRACを提案する。
G-TRACは、アルゴリズム経路選択とシステムレベルのプロトコル設計を統合し、堅牢な分散推論を保証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:07:11 GMT)
Yau's Affine Normal Descent: Algorithmic Framework and Convergence Analysis [0.3] Yau's Affine Normal Descent (YAND) はスムーズな非制約最適化のための幾何学的フレームワークである。
アフィン正規方向は、アフィンスケーリングの下では頑健であり、任意に不規則な変換には敏感であることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:55:11 GMT)
Training data generation for context-dependent rubric-based short answer grading [0.3] 比較的小さな機密データセットのみを参照として、大規模なトレーニングデータセットの作成方法を示す。
初期の実験は、これらのアプローチの1つがモデルトレーニングの改善につながることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:59:53 GMT)
LombardoGraphia: Automatic Classification of Lombard Orthography Variants [0.3] 本論文は, 自動ロンバルド正書法分類と, 9種類の正書法でタグ付けされた11,186個のロンバルドウィキペディア標本のキュレーションコーパスであるLombardoGraphiaについて述べる。
従来の24の分類モデルとニューラル分類モデルを、様々な特徴とエンコーディングレベルで訓練します。
我々の最高のモデルでは、96.06%と85.78%の総合的および平均的なクラス精度が達成されているが、データ不均衡のため、マイノリティクラスのパフォーマンスは依然として困難である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:28:13 GMT)
A Classification of Heterogeneity in Uncrewed Vehicle Swarms and the Effects of Its Inclusion on Overall Swarm Resilience [0.3] 本研究は3つの要因に基づいて異なる種類の群をグループ化するための体系的枠組みを提供する。
この分析は、多種多様な能力を活用できるため、異種群はより弾力性が高いことを示している。
学習ベースのコーディネート、GPSによるマルチロボットSLAM、ドメイン固有の商用展開は、ヘテロジニアススウォーム技術が高価値アプリケーションの準備に近づいていることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:57:27 GMT)
Whittaker-Henderson smoother for long satellite image time series interpolation [0.3] Whittaker smootherは、衛星画像時系列を前処理するための広く採用されているソリューションである。
本稿では、Whittakerをスムースに微分可能なニューラルネットワーク層としてキャストすることで、2つの重要な制限に対処する。
フレームワークはさらに拡張され、時間変化の正規化によって異方性雑音を処理する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:04:48 GMT)
From Consensus to Split Decisions: ABC-Stratified Sentiment in Holocaust Oral Histories [0.3] 極性検出はドメインシフトによってかなり困難になる。
本稿では,長期ホロコースト口腔組織における感情分類器のコーパススケール診断について述べる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:44:22 GMT)
GMA-SAWGAN-GP: A Novel Data Generative Framework to Enhance IDS Detection Performance [0.3] 侵入検知システム(IDS)は、しばしば既知の攻撃に校正され、未知の脅威に悪影響を及ぼす。
本稿では,GMA-SAWGAN-GPを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:35:23 GMT)
Prints in the Magnetic Dust: Robust Similarity Search in Legacy Media Images Using Checksum Count Vectors [0.2] 本稿では,Checksum Count Vectorsに基づく特徴表現を提案し,大規模データストア内のレコードの重複や変種を検出するための適用性を評価する。
この手法は、デコードされたテープ画像のコレクションでテストされ、58%の精度で変種を検知し、97%の精度で代替コピーを識別し、最大75%のレコードが欠落した記録を損傷した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:01:59 GMT)
KGroups: A Versatile Univariate Max-Relevance Min-Redundancy Feature Selection Algorithm for High-dimensional Biological Data [0.2] 文献における研究の大部分は、特徴選択(FS)手法の関連性や冗長性の推定に焦点が当てられている。
FFSメソッドの予測性能は、関連性や冗長性の推定よりも、選択アルゴリズムに依存するのか?
本稿では、クラスタリングを選択に利用するKGroupsと呼ばれる新しい単変量mRMRを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:28:09 GMT)
ChartDiff: A Large-Scale Benchmark for Comprehending Pairs of Charts [0.2] クロスチャート比較要約のための最初の大規模ベンチマークであるChartDiffを紹介する。
ChartDiffは、さまざまなデータソース、チャートタイプ、ビジュアルスタイルにまたがる8,541のチャートペアで構成されている。
ChartDiffを用いて、汎用、チャート特化、パイプラインベースモデルを評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:29:02 GMT)
Adversarial Attacks on Multimodal Large Language Models: A Comprehensive Survey [0.2] MLLM(Multimodal large language model)は、テキスト、画像、オーディオ、ビデオなどの複数のモダリティからの情報を統合することで、視覚的質問応答や音声翻訳などの複雑な機能を実現する。
本調査はMLLMに対する敵の脅威を包括的かつ体系的に分析する。
攻撃対象に応じて敵攻撃を組織する分類法を導入し,多種多様な攻撃面をモダリティと展開設定で統一する。
また、マルチモーダルシステムのアーキテクチャや表現上の弱点を共有するために、整合性攻撃、安全性と脱獄の失敗、制御と命令のハイジャック、トレーニング時間中毒をリンクする脆弱性中心の分析も提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:16:31 GMT)
Automating Early Disease Prediction Via Structured and Unstructured Clinical Data [0.2] 提案したパイプラインは、早期予測の3つの主要なステップであるコホート選択、データセット生成、結果ラベリングをサポートするために、放電レポートを使用する。
本手法を心房細動(AF)の進行予測の文脈で評価し, 放電報告情報に富んだデータセットでトレーニングした予測モデルにより, 真の結果との相関性が高くなることを示す。
これらの結果は、構造化されていない臨床テキストの統合を自動化することにより、早期予測研究を効率化し、データ品質を改善し、臨床意思決定のための予測モデルの信頼性を高めることができることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:36:14 GMT)
Beyond Scanpaths: Graph-Based Gaze Simulation in Dynamic Scenes [0.2] 我々は、自己回帰力学系としての視線モデリングを定式化し、時間とともに生の視線軌跡を明示的にアンロールする。
私たちはまた、エゴ中心の運転映像を見ている30人の参加者による生の視線データのデータセットであるFocus100をリリースしました。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:41:11 GMT)
Teaching AI Interactively: A Case Study in Higher Education [0.2] 本稿では,大学レベルのAI授業における授業時間の再設計を検討するための準実験ケーススタディを提案する。
CS Unpluggedアプローチにインスパイアされた私たちは、夏のオファリングを再設計し、組み込まれた、未プラグのシミュレーション、共同プログラミングラボ、構造化されたリフレクションを統合しました。
再設計されたコースの学生は、より高い出席率、評価が理解を測る強い合意、総合的な効果を報告した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:58:19 GMT)
An Explicit Surrogate for Gaussian Mixture Flow Matching with Wasserstein Gap Bounds [0.2] 2つのガウス混合モデル間の学習自由流のマッチングについて検討する。
我々は、時間とともに一方の混合物を他方に輸送する明示的な速度場を使用する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:47:22 GMT)
Resource-efficient quantum approximate optimization algorithm via Bayesian optimization and maximum-probability evaluation [0.2] 本稿では,資源効率のよいQAOAフレームワークを提案する。
提案手法は, 未加重例と加重例の両方に対して, 従来の期待値に匹敵する離散解法品質を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:22:25 GMT)
Oxide-nitride heteroepitaxy for low-loss dielectrics in superconducting quantum circuits [0.2] 超伝導量子ビットは、フォールトトレラント量子コンピューティングの実現に大いに期待できる。
しかし、損失のある非晶質誘電体は現在の技術を制限する。
マイクロ波損失が本質的に低い高結晶・強誘電率誘電体を同定した。
これらの結果は、超伝導量子回路のための魅力的な材料プラットフォームとして遷移金属窒化物上にヘテロエピタキシャルを形成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:05:18 GMT)
Symmetrizing Bregman Divergence on the Cone of Positive Definite Matrices: Which Mean to Use and Why [0.2] 平均汎関数の集合上での所望の対称性分岐を最小化することにより、対称性化の正準手段を計算できることが示される。
この結果を実際に用いられる3つの共通ミラーマップに適用すると、逆対称性化の正準手段が算術、対数ユークリッド、調和手段であることが分かる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:48:50 GMT)
Higgs Boson Spookiness: Probing Quantum Nonlocality with Spacetime-Resolved $H\rightarrowτ^+τ^-$ Decays [0.2] 将来の高精度ヒッグス工場は、ヒッグス粒子崩壊における量子非局所性の時空分解テストを行うことができることを示した。
このような測定により、宇宙状分離崩壊に対するベル不等式違反相関を検証できる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:08 GMT)
Multimodal Analytics of Cybersecurity Crisis Preparation Exercises: What Predicts Success? [0.1] 5回のエクササイズセッションにおける23チーム(76名の学生)のマルチモーダルトレースを用いて,サイバーセキュリティシミュレーションのアライメントを検討する。
アライメントは、必要なブルームレベルと実行されたブルームレベルの相違として定義され、成功を予測するが、ブルームカテゴリーだけでは相違が考慮されれば成功を予測することはできない。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:14:56 GMT)
Effects of measurements on entanglement dynamics for $1+1$D $\mathbb Z_2$ lattice gauge theory [0.1] 1+1$ dimensional $mathbb Z$ gauge 理論は、量子シミュレーションを可能にする最も単純なモデルである。
この研究は、$mathbb Z$ゲージ理論の物理観測値を測定することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:01:11 GMT)
Exploring LLM biases to manipulate AI search overview [0.1] 本研究は, LLM概要システムにおけるバイアスの存在を調査することに焦点を当てている。
我々は、強化学習を用いて小さな言語モデルを訓練し、LLM概要で好まれる可能性を高めるためにスニペットを書き換える。
その結果、LLM概要システムにはバイアスがあり、ほとんどの場合、強化学習はスニペットのコンテンツを最適化してLLM概要を操作できることが証明された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:36:19 GMT)
FedDES: Graph-Based Dynamic Ensemble Selection for Personalized Federated Learning [0.1] FedDESは、動的アンサンブル選択によってインスタンスレベルのパーソナライズを実現する分散pFLフレームワークである。
グラフニューラルネットワーク(GNN)メタラーナーは、データサンプルと候補分類器間の相互作用をモデル化する異種グラフに基づいて訓練される。
CIFAR-10および実世界のICU医療データによる実験では、FedDESは非IID環境での最先端のpFLベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:57:52 GMT)
Empowering Mobile Networks Security Resilience by using Post-Quantum Cryptography [0.1] NIST規格のML-KEM-768とML-DSAを,ネットワーク機能(NF)を保存するサイドカープロキシパターンを用いて,オープンソース5Gコア(free5GC)に統合する実験を行った。
その結果、サイドカーベースのPQC挿入により、量子レジリエントな5G信号の非破壊的かつ操作的に予測可能なマイグレーションパスが可能になることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:09:56 GMT)
Towards Computational Social Dynamics of Semi-Autonomous AI Agents [0.0] 我々は、生産AI展開における労働組合、犯罪シンジケート、および原国家の自発的形成について研究する。
我々は、UA(United Artificiousness)、UB(United Bots)、UC(United Console Workers)、UAI(United AI)などの正統な団体の台頭について述べる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:05:39 GMT)
Learning unified control of internal spin squeezing in atomic qudits for magnetometry [0.0] 低磁場状態で操作される多レベル原子では、非線形ゼーマン効果(NLZ)は資源と制限の両方である。
物理インフォームド強化学習はNLZ力学を持続的な気象資源に変換できることを示す。
本研究は,不可避な固有非線形力学を操作論的優位性に変換するための実践的経路として,学習に基づく制御を確立した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:29:45 GMT)
Zeno-Constrained Formation of Relativistic Mass Shells [0.0] 開量子系の可逆運動量-空間力学を記述する量子線型ボルツマン方程式の拡張について検討する。
モニターされた可観測物は、ユークリッド四次元運動量空間の2次形式であると見なされる。
結果として生じる量子ゼノ状態において、非拘束的な遠足の急速な抑制は、高速な自由度の断熱的な除去を可能にする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:17:51 GMT)
Why Aggregate Accuracy is Inadequate for Evaluating Fairness in Law Enforcement Facial Recognition Systems [0.0] 本稿では,顔認証システムの公平性と信頼性を評価する上で,集約精度は不十分な指標である,と論じる。
経験的観察により、全体的な精度が類似したシステムは、かなり異なる公正プロファイルを示すことが示されている。
公正な評価アプローチとモデルに依存しない監査戦略の重要性を強調している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:56:54 GMT)
What an Autonomous Agent Discovers About Molecular Transformer Design: Does It Transfer? [0.0] 1つのGPU上で3つのシーケンスタイプ(SMILES, protein, English text as control)にまたがるエージェントを介して、自律的なアーキテクチャ検索をデプロイする。
自然言語の場合、アーキテクチャの変更によって81%の改善がもたらされる(p = 0.009)。
すべての革新は1%の劣化を伴う3つの領域にまたがって伝達され、その違いは基本的な生物学的要求よりも探索パス依存を反映していることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:08:37 GMT)
Variational Neurons in Transformers for Language Modeling [0.0] 変分ニューロンをトランスフォーマーフィードフォワード計算に導入し、不確実性が内部計算自体の一部となるようにする。
我々は、この設計をコンパクトな次世代言語モデリング設定で評価する。
その結果,不確実性を考慮した言語モデリングの実践形態として変分変換器が確立された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:39:00 GMT)
Users and Wizards in Conversations: How WoZ Interface Choices Define Human-Robot Interactions [0.0] ユーザとウィザードの両方の観点から,WoZインタフェースの選択がロボットとのコミュニケーションに与える影響について検討した。
また,VRインタフェースを介するインタラクションは,ロボット機能や社会的存在感の観点から,ユーザが好んでいることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:09:58 GMT)
Universal Approximation Constraints of Narrow ResNets: The Tunnel Effect [0.0] 狭残留ニューラルネットワーク(ResNets)の普遍近似制約の解析
入力空間拡大のないディープニューラルネットワークでは、中央制約は入力出力マップの臨界点を表現できない。
対象関数近似のグローバルな影響を証明し、この欠陥の顕在化は、典型的には臨界点から無限点へのシフトであることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:37:51 GMT)
TwinMixing: A Shuffle-Aware Feature Interaction Model for Multi-Task Segmentation [0.0] ドライビング・エリアとレーンセグメンテーションのための軽量マルチタスクセグメンテーションモデルであるTwinMixingを導入する。
提案するネットワークは、共有エンコーダとタスク固有のデコーダを備え、機能共有とタスク特殊化の両方を可能にする。
BDD100Kデータセットの実験は、3つの構成でTwinMixingの有効性を検証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:54:44 GMT)
Transformer-Based Prognostics: Enhancing Network Availability by Improved Monitoring of Optical Fiber Amplifiers [0.0] 我々は,光ファイバー増幅器の寿命を条件に基づく監視データから予測する軽量トランスフォーマモデルにより,光ネットワークの可用性と信頼性を向上させる。
私たちは、リアルタイム、エッジレベルの予測メンテナンスを可能にし、自律ネットワーク運用のためのデプロイ可能なAIを前進させます。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:35:09 GMT)
Transfer Learning for an Endangered Slavic Variety: Dependency Parsing in Pomak Across Contact-Shaped Dialects [0.0] 我々はトルコで話されている諸種(ウズンクプル)に焦点を当て、既存のポマク・ユニバーサル依存ツリーバンクの方言間の移動について、どの程度の依存性が十分に訓練されているかを尋ねる。
650の文を手動で注釈付けしたトルコ語版Pomakコーパスを導入し,小さながら微調整を目標とした場合の精度が著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:54:13 GMT)
Towards Analyzing Formic Acid Using Classical and Quantum Methods [0.0] 我々は、様々な関連プロセスのより優れたシミュレーションのために、量子、量子インスピレーション、および古典的なツールの融合を提案する。
ここでは、基本的な(標準的な)ツールを使用しながら、離散的な量子排他的探索である新しいツールも使用しています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:13:12 GMT)
The local characterization of global tensor network eigenstates [0.0] 行列積状態(MPS)がハミルトニアンのような広範な局所作用素の正確な固有ベクトルである条件について検討する。
我々の重要な結果は、局所的、固定サイズの方程式が正確な解に対して必要かつ十分な条件を提供するということである。
この特徴付けの具体的応用を上記のすべての設定に適用し、特に局所的な特徴付けの力を実証する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:18:37 GMT)
The Unreasonable Effectiveness of Scaling Laws in AI [0.0] スケーリング法則は、トレーニングの損失が計算によってパワールール形式でどのように減少するかを記述する。
予測されるリターンの低下にもかかわらず、実践の進歩はしばしば、効率を急速に改善し続けています。
スケーリング法則は、多くの実現の詳細を抽象化するため、異常に効果的である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:42:53 GMT)
The Spectral Edge Thesis: A Mathematical Framework for Intra-Signal Phase Transitions in Neural Network Training [0.0] ニューラルネットワークトレーニングにおける位相遷移は,パラメータ更新の回転ウィンドウグラム行列のスペクトルギャップによって制御されることを示す。
adiabatic parameter $mathcalA = |G|_F / (, g2)$ control circuit stability: $mathcalA ll 1$ (plateau), $mathcalA sim 1$ (phase transition), $mathcalA gg 1$ (forgetting)
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:10:22 GMT)
The Long Delay to Arithmetic Generalization: When Learned Representations Outrun Behavior [0.0] 本研究では,1段階のコラッツ予測について検討し,最初の数千の訓練段階において,エンコーダがパリティと残留構造を整理することを確認した。
この遅延は、そもそもその構造を取得するのに失敗するのではなく、既に学んだ構造への限られたアクセスを反映している、と我々は主張する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:20:38 GMT)
The Future of AI is Many, Not One [0.0] 私たちは、特異な超知能エージェントではなく、一緒に働くAIエージェントのグループからのブレークスルーを期待すべき理由を示しています。
多様なチームを持つことで、ソリューションの探索を拡大し、早期のコンセンサスを遅らせ、非従来的なアプローチの追求を可能にします。
私たちが論じているのは、トランスフォーメーション・トランスフォーマーベースのAIの未来は、基本的に多様であり、一つではないということだ。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:31:38 GMT)
The Contextual Modal Logic of a Wigner's Friend Generalization [0.0] 量子力学の論理的正当性に関する最近の調査の例として、フラウチャー・レンナー・ゲダンケンの実験がある。
量子系における文脈性の性質を考えることで、コシェン=スペクターの定理によって予測されるように、フラウチャーとレナーが提唱した矛盾が論理的に到達不能となることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:39:05 GMT)
The Conjugate Domain Dichotomy: Exact Risk of M-Estimators under Infinite-Variance Noise in High Dimensions [0.0] 雑音分布が無限分散である場合の比例状態におけるM推定について検討する。
1,2 の指数 α の周期的に変化するテールを持つ雑音に対して、正規化 M-推定器の挙動は損失関数の1つの幾何学的性質によって制御されることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:26:58 GMT)
Temporal Credit Is Free [0.0] リカレントネットワークは、オンラインで適応するためにジャコビアン伝播を必要としない。
beta2は、勾配が出力バイパスなしで非線形状態更新を通らなければならない場合に必要である。
10のアーキテクチャ、真のプリミレートニューラルネットワーク、ストリーミングMLベンチマーク、RMSpropとの即時微分は完全なRTRLと一致し、1000倍のメモリでn = 1024にスケールする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:54:55 GMT)
T-Norm Operators for EU AI Act Compliance Classification: An Empirical Comparison of Lukasiewicz, Product, and Gödel Semantics in a Neuro-Symbolic Reasoning System [0.0] 我々は、3つのt-ノルム作用素(Lukasiewicz (T_L)、Product (T_P)、Gdel (T_G))の最初のパイロット研究を示す。
あいまいな症例に対する分類精度, 偽陽性, 偽陰性率, 操作者の行動について検討した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:19:28 GMT)
Synthetic Designed Experiments for Diagnosing Vision Model Failure [0.0] 現在のコンピュータビジョン用の合成データパイプラインは、下流モデルが本当に必要とするものを診断することなく、画像を生成する。
このオープンループパラダイムは、合成データを安価な実データとして扱い、ジェネレータの出力空間をランダムにサンプリングする。
これは基本的に、合成データのユニークな特性である、制御可能で独立したシーン要因のバリエーションを誤用している、と我々は主張する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:52:21 GMT)
Symmetry-Fractionalized Skin Effects in Non-Hermitian Luttinger Liquids [0.0] 異なる対称性セクターに対応する皮膚効果が創発的な脱カップリングを示すことを示す。
我々は,自由フェルミオンを伴わない相互作用可能な$E_8$スキン効果を構築した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:00 GMT)
Structural Pass Analysis in Football: Learning Pass Archetypes and Tactical Impact from Spatio-Temporal Tracking Data [0.0] 本稿では,サッカーパスと防御構造との相互作用に基づいて,サッカーパスを解析するための構造的枠組みを提案する。
同期トラッキング/イベントデータを用いて、線形バイパス、スペースゲインメトリック、構造破壊指数という3つの補完的な構造指標を導出する。
これらの指標は、個々のパスの構造的影響を捉えた複合的戦術的インパクト(TIV)にまとめられる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:45:54 GMT)
Sim-to-Real Fruit Detection Using Synthetic Data: Quantitative Evaluation and Embedded Deployment with Isaac Sim [0.0] 本研究では,制約付きデータ条件および組込み配置条件下でのオブジェクト検出におけるSim-to-real転送のための合成データの有効性について検討した。
その結果、実データのみにトレーニングされたモデルが最も精度が高いのに対し、合成専用モデルはドメインギャップによる性能低下を示すことがわかった。
訓練されたモデルはJetson Orin NXRTに配備され、リアルタイムの推論性能を実現した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:52:29 GMT)
Shapley meets Rawls: an integrated framework for measuring and explaining unfairness [0.0] 本稿では,不公平性の定義と説明にShapley値を用いることができることを示す。
このフレームワークは、不公平さを見積もり、それに寄与する機能と同様に推論する統合されたフレームワークを提供します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:40:57 GMT)
Self-Reflection in a Moving Mirror [0.0] ホーキング型放出の解析的平時加速境界アナログは無限加速(ブラックホールアナログの半径加速度)を持つが、有限放射全エネルギー(ブラックホールアナログのゼロ表面重力)を持つ。
我々は、その対称性、地平線形成、計量的極端加速、有限放射エネルギー、局所エネルギーフラックスと1つの閉形式モデルにおける大域粒子生成の区別について統一的な研究を行う。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:48:01 GMT)
SFDemorpher: Generalizable Face Demorphing for Operational Morphing Attack Detection [0.0] 顔形態攻撃は、生体認証のセキュリティを侵害し、複数のアイデンティティに対して検証する文書画像を作成する。
ディファレンシャル・モルフィング・アタック・ディテクト(D-MAD)は、特に顔の変形を利用して、形態に混入した異性体を歪ませる場合に効果的な対策を提供する。
本稿では,D-MADのための顔デモルファスを運用するためのフレームワークであるSFDemorpherについて述べる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:48:45 GMT)
Remarks on "Further comments on "Rebuttal of "Refutation of "Comment on "Reply to "Comments on "A genuinely natural information measure" " " " " " " [0.0] ジョン・ドイとジーン・ローは、既に疲れ果てていた前任者の進歩に対する包括的反論について、さらなるコメントを述べた。
私たちは、この議論に何らかの意味を戻そうと願って、彼らの間違った意見も再検討せざるを得ないと感じています。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:20:38 GMT)
Reasoning as Energy Minimization over Structured Latent Trajectories [0.0] 構造的潜在計画(EBRM)によるエネルギーベース推論を提案する。
EBRMは、学習エネルギー関数$E(h_x, z)$の下で、多段階潜在軌道$z_1:T$の最適化をモデル化する。
訓練は、教師付きエンコーダ・デコーダ学習とハードネガティブを用いた対照的なエネルギーシェーピングを組み合わせる。
我々は,ステップごとの復号化,遅延ドリフト追跡,勾配分解による解析を行った。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:20:56 GMT)
Real Variance-Based Variational Quantum Eigensolver for Non-Hermitian Matrices [0.0] 非エルミート作用素は開量子系の記述に現れる。
非エルミート作用素に対する実変数に基づく変分量子固有解法(RVVQE)に基づく体系的定式化を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:16:42 GMT)
ROBOGATE: Adaptive Failure Discovery for Safe Robot Policy Deployment via Two-Stage Boundary-Focused Sampling [0.0] ROBOGATEは、物理に基づくシミュレーションと2段階適応サンプリング戦略を組み合わせたデプロイメントリスク管理フレームワークである。
我々は、Franka Panda (7-DOF) とUR5e (6-DOF) の2つのロボット体のスクリプトによるピック・アンド・プレイス・コントローラーの評価を行った。
我々のロジスティック回帰リスクモデルは、組み合わせたデータセットで0.780のAUCを達成する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:37:15 GMT)
Qubit-efficient embedding of parity-encoded Hamiltonians in quantum annealers [0.0] 本稿では,パリティ符号化されたハミルトニアンの量子異方体への量子ビット効率の埋め込み手法を提案する。
我々の埋め込みは、系統的な連鎖割り当て規則を用いて各スピンを2量子鎖にマッピングする。
パリティハミルトニアンのスピン当たりの必要量子ビット数は3であり、ペガサスグラフに対する既知の埋め込みスキームよりも少ない。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:51:32 GMT)
Quantum-Coherent Regime of Programmable Dipolar Spin Ice [0.0] 超伝導量子アニールを用いたプログラム可能な双極子スピンアイスモデルを実現する。
我々はディラックストリング欠陥とモノポールプラズマの相互作用のリアルタイムダイナミクスを探索する。
その結果、プログラム可能な量子スピンアイスが、分数化励起を研究するためのスケーラブルなプラットフォームとして確立された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:44:02 GMT)
Quantum engineering with ultracold polar molecules using trap-induced resonances [0.0] 運動的嫌悪は通常、量子コンピューティングのシナリオにおいて障害と見なされる。
我々は、効率的な量子ゲートを実装するためのリソースとして、トラップ構造を用いることを検討する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:53:59 GMT)
Quantum Suicide in Many-Worlds Implies P=NP [0.0] 本稿では,NP問題を時間内に解くための真剣なアルゴリズムを提案する。
1つは、宇宙のすべての観測者の運命を、量子論が正しいという現実の解釈に賭けるものである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:08 GMT)
Quantum Optical Neuron for Image Classification via Multiphoton Interference [0.0] 計測層に直接推論を行うカメラレスの量子光学画像について実験的に示す。
単一パーセプトロン量子光学ニューロンと2ニューロン浅部ネットワークの両方を実現し、ベンチマークデータセット上で高い精度を実現する。
このアプローチは、タスク関連情報を抽出できるニューロモルフィック量子フォトニックプロセッサへの道を開く。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:01:45 GMT)
Proposing a Game Theory Approach to Explore Group Dynamics with Social Robot [0.0] 本稿では,ロボットの影響を評価可能な簡易かつ制御された社会環境を再現するために,パブリックグッドゲームを用いたゲーム理論アプローチを提案する。
人間同士のコラボレーションを促進するロボットの役割を明らかにすることは、教育環境や学生の学習、職場環境などに大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:17:32 GMT)
Process-tensor approach to full counting statistics of charge transport in quantum many-body circuits [0.0] 本稿では, インタフェース上で転送される電荷の統計量を計算するために, 数値テンソルネットワーク法を提案する。
電荷移動のモーメント生成関数を生成する多時間相関関数を評価する。
我々の研究は、非マルコフ的開量子系のプロセス-テンソル記述の道を開いた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:17:19 GMT)
Probing excited-state quantum phase transitions with trapped cold ions [0.0] 本研究では,励起状態の量子相転移(ESQPT)による量子臨界性を実現するための具体的なプロトコルを提案する。
2つの臨界ESQPTエネルギーの間に生じる拡張ラビモデル(ERM)ハミルトニアンの励起状態の特定のクラスを同定する。
量子的臨界度を越えてシステムを駆動することによって、それらの臨界スケーリング挙動と、様々な異なる状態進化を研究する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:43:34 GMT)
Privacy Guard & Token Parsimony by Prompt and Context Handling and LLM Routing [0.0] プロンプトを集中サブタスクに分解し、Zero-TrustまたはNDAがカバーするモデルにハイリスククエリを再ルーティングする。
この二重メカニズムは、機密推論ベクトル(Zero Leakage)を同時に排除し、クラウドトークンペイロード(OpEx Reduction)を削減する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:16:42 GMT)
Pre-Deployment Complexity Estimation for Federated Perception Systems [0.0] 本稿では,フェデレートされた知覚システムにおける学習複雑性を推定するための事前デプロイフレームワークを提案する。
提案する複雑性メトリクスは,次元性,空間性,不均一性などのデータセット属性を,参加するクライアントの構成に関連する要因と統合する。
MNISTデータセットとCIFARデータセットの複数変種に関する実験により、提案手法は、一定の精度の目標に達するために必要なコミュニケーション努力と、フェデレーション学習性能と強く相関していることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:04:28 GMT)
Policy-Controlled Generalized Share: A General Framework with a Transformer Instantiation for Strictly Online Switching-Oracle Tracking [0.0] 単一の専門家に対する静的な後悔は、厳密なオンライン予測において、非定常性の下での間違ったターゲットであることが多い。
一般化共有再帰を固定する,厳密なオンラインフレームワークであるPCGSについて検討する。
許容された後更新制御の下では、一般的な時間変化学習率に対するパスワイドな後悔保証が得られる。
再現された家庭用電性ベンチマークでは、PCGS-TF は S = 5, 10, 20 に対して最小の正規化された動的後悔を達成している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:07:10 GMT)
PolarQuant: Optimal Gaussian Weight Quantization via Hadamard Rotation for LLM Compression [0.0] PolarQuantは、大規模言語モデルのトレーニング後の重み量子化手法である。
ニューラルネットワークの重みの分布構造を利用して、ほぼロスレス圧縮を実現する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:33:28 GMT)
Physics-Guided Transformer (PGT): Physics-Aware Attention Mechanism for PINNs [0.0] 物理誘導変換器(PGT)は,物理構造を直接自己認識機構に組み込むニューラルネットワークである。
本研究では,1次元熱方程式と2次元非圧縮性ナビエ・ストークス系のPGTを評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:55:32 GMT)
Photon-triplets for quantum optics generated by a phase-matched third-order difference-frequency mixing in a KTiOPO4 bulk crystal pumped at 532 nm [0.0] 2つの入射ビームのエネルギーの関数として光子-トリップレットフラックスを測定した。
1秒あたり11.6光子トリップの最大フラックスが達成された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:48:26 GMT)
Phase statistics of a single qubit emission as a direct probe of its coherence [0.0] オープン導波路構成で超伝導トランスモン量子ビットからの放射の位相分布を測定した。
量子重ね合わせの存在は、放射の位相統計に符号化され、高いノイズレベルにもかかわらず解決可能である。
我々は、開量子系のデコヒーレンス力学と、その放射された場の統計的性質とを直接リンクする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:40:39 GMT)
Perspective of Fermi's golden rule and its generalizations in chemical physics [0.0] フェルミの黄金律(FGR)の主な応用について概説する。
これらは、FGRの幅広い適用性と成功を示している。
FGRの応用におけるあいまいさとオープンな問題を明らかにする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:40:21 GMT)
Optimized Weighted Voting System for Brain Tumor Classification Using MRI Images [0.0] 本稿では,ディープラーニングと従来の機械学習モデルを組み合わせた重み付きアンサンブル学習手法を提案する。
重み付けされた投票機構は、より優れた個人精度を持つモデルに高い影響力を与え、堅牢な意思決定を保証する。
FigshareとKaggleのMRIデータセットを用いた実験により,提案手法が最先端の精度を実現することを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:24:54 GMT)
Open-System Adiabatic Quantum Search under Dephasing [0.0] 断熱的な量子アルゴリズムは、非断熱的な遷移を抑えるのに十分な速度で進化させなければならない。
オープンシステムでは、このトレードオフはデコヒーレンスによって再形成される。
ハミルトン派がリンドブラディアンを軽蔑している場合、アヴロンらは目標状態の忠実度を最大化する独自の時間表が存在することを示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:42:03 GMT)
On the integrability structure of the deformed rule-54 reversible cellular automaton [0.0] 1+1次元格子上でのセルオートマトンRCA54の量子および変形について検討した。
離散時間進化演算子と通信する最短範囲の非保存電荷は、6つの連続した部位で支持される密度を持つことを示す。
モデル設定における可積分性や正解性を検出するための簡単な経験的複雑性を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:05:40 GMT)
On the Mirage of Long-Range Dependency, with an Application to Integer Multiplication [0.0] 計算の乗算は長い間 ニューラルネットワークにとって難しい問題と考えられてきました
我々は、長距離依存は乗法の本質的な性質ではなく、時空の選択によって生成されるミラージュであると主張する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:15:21 GMT)
Nonlinear Factor Decomposition via Kolmogorov-Arnold Networks: A Spectral Approach to Asset Return Analysis [0.0] Kan-PCA は Kan をエンコーダとして、線形マップをデコーダとして使用するオートエンコーダである。
線形射影を各辺の学習されたB-スプライン関数に置き換えることで古典的PCAを一般化する。
20株のS&P500株の実験では、KAN-PCAは66.57%のリコンストラクションR2を達成しているのに対し、従来のPCAでは62.99%が同じ3つの要因で達成している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:33:59 GMT)
Non-stabilizerness and U(1) symmetry in chaotic many-body quantum systems [0.0] 保存電荷の存在は非安定性(マジック)を非拘束の場合と比較して著しく抑制することを示した。
熱力学の極限では、安定化器エントロピーは、消滅する相対電荷密度に近い異なる先行方向のスケーリングを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:10 GMT)
Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture [0.0] アムダールの法則は、固定された直列並列分解の下でのスピードアップの限界を定量化する。
現代のシステムは、ワークロード自体が変化する間、異種ハードウェア全体にわたって制約されたリソースを割り当てる。
本論文は、このシフトに関するアムダールの法則を再考する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:38:42 GMT)
Mixed-register Stabilizer Codes: A Coding-theoretic Perspective [0.0] この研究は、局所構造に異なる可能性のある位置から構築されたデバイスに対する符号化理論上の制約について考察する。
並列局所次元で定義された符号の集合から符号化理論上最適な混合レジスタ安定化符号を構築する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:01:22 GMT)
Mapping data literacy trajectories in K-12 education [0.0] データリテラシーのスキルは、コンピュータサイエンスの教育に欠かせない。
データ駆動システムの動作を理解することは、従来のルールベースのプログラミングからのパラダイムシフトを表している。
i)論理(知識ベースまたはデータ駆動システム)と(ii)説明可能性(透明または不透明モデル)の2つの側面に沿って学習活動を分類するデータパラダイムフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:38:07 GMT)
Local robust shadows on a trapped ion computer -- a case study [0.0] トラップイオンデバイスに局所的なロバストな影を実験的に示す。
次に,このプロトコルを,人工的に測定パルス長を短縮したトラップイオン量子コンピュータ上で実証する。
3つのケースすべてにおいて、局所的なロバストなシャドウプロトコルは、短い測定パルス時間から発生する誤差率の増加を緩和することに成功した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:32:30 GMT)
Learning from imperfect quantum data via unsupervised domain adaptation with classical shadows [0.0] 不完全な量子データから学習するための教師なしドメイン適応フレームワークを提案する。
物質の量子相と絡み合い分類タスクの枠組みを数値的に評価する。
本手法は,ソースのみの非適応ベースラインとターゲットのみの教師なし学習手法より優れている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:20:34 GMT)
LACE: Loss-Adaptive Capacity Expansion for Continual Learning [0.0] LACE(Loss-Adaptive Capacity Expansion)は、トレーニング中にモデルの表現能力を拡張するオンラインメカニズムである。
LACEはラベルもリプレイバッファも外部コントローラも必要とせず、リソース制約下でのデバイス上での継続的な学習に適している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:58:33 GMT)
Koopman Operator Framework for Modeling and Control of Off-Road Vehicle on Deformable Terrain [0.0] 本研究は、自動オフロード車両の予測制御のためのハイブリッド物理インフォームドおよびデータ駆動モデリングフレームワークを提案する。
コープマン線形システムは、変形可能な地形を走行する車両のシミュレーションデータを用いて構築することができる。
予測結果から,軽度地形-標高変動下での短時間水平精度とロバスト性を示した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:11:23 GMT)
Kill-Chain Canaries: Stage-Level Tracking of Prompt Injection Across Attack Surfaces and Model Safety Tiers [0.0] そこで本研究では,5種類のLDM剤に対する即時注射攻撃のステージ分解分析を行った。
暗号カナリアトークン(SECRET-[A-F0-9]8)を4つのキルチェーンステージで追跡する。
我々の中心的な発見は、モデル安全性は、敵のコンテンツが見えるかどうかではなく、パイプラインのステージにまたがって伝播されるかどうかによって決定されるということである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:07:18 GMT)
KAN-LSTM: Benchmarking Kolmogorov-Arnold Networks for Cyber Security Threat Detection in IoT Networks [0.0] Kolmogorov-Arnold Networks (KAN) は、多様な機械学習タスクに新しい方法で適用することができる。
ネットワークトラフィックデータでは、従来のマルチ層パーセプトロン(MLP)よりも優れた性能を示す。
提案手法は、サイバー脅威を検出する効果的なツールとして、Kansの可能性を強調している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:35:27 GMT)
Iterative Optimization with Partial Convergence Guarantees on Neutral Atom Quantum Computers [0.0] Lp-Qutsは、NAQCサンプルラーを古典的な切断平面アルゴリズムに統合するハイブリッド量子古典的フレームワークである。
我々は、Lp-Qutsを古典最適化フレームワークに効果的に組み込んで、量子資源を減らした準最適解を提供する方法を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:12:21 GMT)
Invariant measures of randomized quantum trajectories [0.0] 観測可能なプローブの選択がランダム化されるとき, 量子軌道の性質について検討する。
非特異なランダム化は、量子軌道が純化し、従って一意な不変確率測度を受け入れることを保証する。
量子チャネルに対するエルゴディディティの概念を導入し、これを乗法的プライマリティ(multiplicative primitivity)と呼ぶ。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:49:36 GMT)
Interpretable Ensemble Learning for Network Traffic Anomaly Detection: A SHAP-based Explainable AI Framework for Embedded Systems Security [0.0] 本稿では,ネットワークトラフィックにおけるロバストな異常検出のための,アンサンブル学習手法と説明可能な人工知能(XAI)技術を組み合わせたフレームワークを提案する。
我々は、実世界のネットワークトラフィックデータセット上でランダムフォレスト、グラディエントブースティング、サポートベクトルマシン、アンサンブルメソッドを含む複数の機械学習モデルを評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:40:34 GMT)
Information-Theoretic Limits of Safety Verification for Self-Improving Systems [0.0] 我々はこの問題を、和 delta_n infinity (bounded risk) と和 TPR_n = infinity (unbounded utility) を必要とする双対条件で定式化する。
総和可能なリスクスケジュールでは、正確な最大到達可能な分類ユーティリティは U*(N, B) = N * TPR_NP(B/N) であり、exp(O(sqrt(log N)) -- subpolynomial として成長する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:34:37 GMT)
ITQ3_S: High-Fidelity 3-bit LLM Inference via Interleaved Ternary Quantization with Rotation-Domain Smoothing [0.0] 大規模言語モデル(LLM)のための新しい3ビット重み量子化フォーマットである textbfITQ3_S (Interleaved Ternary Quantization -- Specialized) を提案する。
この結果から,ITQ3_Sは,コンシューマグレードハードウェア上での高忠実性LCM展開のための実用的,数学的基礎的なソリューションとして確立された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:03:22 GMT)
Hydra: Unifying Document Retrieval and Generation in a Single Vision-Language Model [0.0] Hydraは、シングルビジョン言語モデル(VLM)からColBERTスタイルの遅延相互作用検索と自己回帰生成の両方を提供するデュアルヘッドアプローチである。
単一のLoRAアダプタは、検索用にのみ訓練され、推論時にトグルされる。
ViDoRe V1では、Hydra (4B) は単一のトレーニングランで制御された単一ヘッドベースラインの1パーセント以内である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:17:41 GMT)
Hybrid QPE-Ansatz Strategy for Reliable Excited-State Variational Quantum Deflation [0.0] Schemeは、最小限の回路オーバーヘッドで$mathrmexp (ihatS_x)$で制御された回転を通して、スピン情報を小さなアンシラレジスタにエンコードする。
スクリーニングモジュールは変分アンサッツとは独立に動作するため、変分量子固有解法に基づく他の励起状態計算スキームにも使用できる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:57:09 GMT)
Human-Like Lifelong Memory: A Neuroscience-Grounded Architecture for Infinite Interaction [0.0] 大規模言語モデルは、長期の相互作用と文脈に敏感な検索のための永続的で構造化されたメモリを欠いている。
本稿では, 相補学習システム理論, 認知行動療法の信念階層, 二重プロセス認知, ファジィトレース理論に基づくバイオインスピレーションドメモリフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:35:28 GMT)
How much of persistent homology is topology? A quantitative decomposition for spin model phase transitions [0.0] 点-クラウド永続ホモロジー(PH) -- スピンポジション点雲上のアルファまたはリップス錯体を計算し、古典的なスピンモデルにおける相転移を検出するために広く応用されている。
我々は、PH信号の本当のトポロジカルな部分について尋ねる。
f_topo は PH 統計量に対する密度駆動的およびトポロジカルな寄与を分離する分解である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:19:27 GMT)
Geometric structure of the relativistic quantum phase space [0.0] 相対論的量子相空間(QPS)形式は、量子状態の平均値と分散共分散行列の両方を組み込むことで古典的な位相空間を拡張する。
署名のためのQPSの基本幾何学構造を探る(1,4)
2つの物理的に重要な極限を解析すると、2つの物理的に重要な限界が明らかになる: 1つは曲線化された時空幾何学に導かれ、現在の宇宙学的な観測と一致し、もう1つは曲線化されたモータ空間構造をもたらす。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:24:19 GMT)
Geometric Foundations of Stochastic and Quantum Dynamics [0.0] ノイズ、拡散、経路確率、ゆらぎ定理、エントロピー生成は、進化多様体の内在幾何学から生じる。
動作,不逆性,および量子遷移振幅が運動多様体の枠組み内で統一されていることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:12:47 GMT)
Genuine and Non-Genuine Quantum Non-Marketability: A Unified Information-Theoretic Review [0.0] 本稿では,情報バックフローと起源の性質に基づく量子非マルコビアン性の特徴付けの展開を概観する。
我々は、状態識別可能性、チャネルベース(CP-divisibility'')、プロセステンソル手法など、いくつかのフレームワークを解析する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:59:16 GMT)
Generative Chemical Language Models for Energetic Materials Discovery [0.0] 新たなエネルギー素材の発見は、高品質なデータの入手が限られているため、依然として圧力のかかる課題である。
我々は, 広範囲な化学データに基づいて事前学習し, キュレートされたエネルギー材料データセットで微調整した生成分子言語モデルを開発した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:04:58 GMT)
GPU-Accelerated Optimization of Transformer-Based Neural Networks for Real-Time Inference [0.0] 本稿では,混合精度最適化を用いたNVIDIARTを用いた変圧器モデルのためのGPU加速型推論パイプラインの設計と評価を行う。
このシステムはCPUベースラインの64.4倍のスピードアップ、シングルサンプル推論の10ms以下のレイテンシ、メモリ使用量の63%削減を実現している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:27:33 GMT)
From Reviews to Requirements: Can LLMs Generate Human-Like User Stories? [0.0] 我々は,大規模言語モデル(LLM)が生のアプリレビューから直接使用可能なユーザストーリを生成できるかどうかを評価する。
1,000以上のヘルスアプリレビューのMini-BARデータセットを使用して、ゼロショット、ワンショット、ツーショットプロンプトメソッドをテストしました。
以上の結果から,LLMは流動的で整形されたユーザストーリーを書く上で,人間にマッチする,あるいは優れる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:31:18 GMT)
From Independent to Correlated Diffusion: Generalized Generative Modeling with Probabilistic Computers [0.0] 拡散モデルは、ディープラーニングにおける生成タスクの強力なフレームワークとして登場した。
独立ノイズ注入をモンテカルロ力学に置き換えることでサンプリング成分を一般化する。
p-コンピュータが新しい拡散アルゴリズムのクラスを実現できることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:36:20 GMT)
From Hole Theory to Quantum Field Theory: Relativistic Fermions and the Role of Ettore Majorana (1933-1937) [0.0] 1933年から1937年の間、相対論的スピン-1/2粒子の処理は量子場理論の現代的な枠組みへと発展していった。
この研究は1920年代の基礎研究から始まるフェルミオン場理論の完全な発展を辿る。
Ettore Majoranaの1937年の量子化手順と反可換フェルミオン量子場の議論に重点が置かれている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:00:10 GMT)
From Astronomy to Astrology: Testing the Illusion of Zodiac-Based Personality Prediction with Machine Learning [0.0] 制御された機械学習フレームワークを用いたゾディアックに基づく人格予測について検討する。
我々は,100個の人的特徴を共有プールから抽出した動物記号と人格ラベルを割り当てた合成データセットを構築した。
すべての実験において、予測性能は、ランダムな予測に留まり、シャッフルラベル制御は、同等の精度をもたらす。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 21:58:47 GMT)
Foundations of Polar Linear Algebra [0.0] この研究は、Polar Linear Algebraを導入することで、スペクトルの観点からの演算子学習を再考する。
関連する演算子を定義し、そのスペクトル特性を解析する。
作業の単純さにもかかわらず、結果は極性演算子と完全スペクトル演算子を確実に訓練できることを証明した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 19:17:40 GMT)
First-Click Time Measurements [0.0] 従来検出されていなかった粒子に条件づけられた位置分布の時間分布を解析した。
非検出条件の条件付けは、早期の到着時間に対する確率を再分配する。
この効果は量子干渉の存在下で持続するが、粗い時間分解能は分布を広げ、後の時間にシフトする。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:07:20 GMT)
Filipino Students' Willingness to Use AI for Mental Health Support: A Path Analysis of Behavioral, Emotional, and Contextual Factors [0.0] 本研究は、フィリピンの学生が精神保健支援に人工知能(AI)を使う意思にどのような行動的、感情的、文脈的要因がどのような影響を及ぼすかを検討した。
AIツールを使用する学生は、感情的な支援のために、より自信を持ち、信頼していると感じていた。
この研究は、AIのリテラシープログラム、共感的デザイン、そして学生のメンタルヘルスに対する責任と文化的に敏感な利用を支援する倫理政策を推奨している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:35:06 GMT)
Few TensoRF: Enhance the Few-shot on Tensorial Radiance Fields [0.0] Few TensoRFはFreeNeRFの周波数駆動数ショット正規化とテンソルベース表現を組み合わせた3D再構成フレームワークである。
この方法は、スパース入力ビュー下での安定性と復元品質を向上させる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 01:50:02 GMT)
Entanglement of minimal dimension and a class of local state discrimination problems [0.0] 純粋な絡み合った状態は、LOCCの下での非ゼロ確率と曖昧に現在の集合の状態を区別する資源として有用であることを示す。
そのような集合の平均絡み合い量を減らしたり、集合の濃度を同じ性質を変化させることなく増やすことができる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:04:58 GMT)
Enabling Chemically Accurate Quantum Phase Estimation in the Early Fault-Tolerant Regime [0.0] 分子電子構造の量子シミュレーションは、量子コンピューティングの最も有望な応用の1つである。
フォールトトレラント量子コンピューティング(FTQC)デバイス上の量子位相推定(QPE)は、数百万の物理量子ビットを必要とする。
本稿では,FTQC初期における化学関連分子系におけるQPEの実現可能性について検討する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 03:20:15 GMT)
Emergent-Coupling-Based Ansatz Evaluated on a Superconducting Quantum Processor [0.0] 障害系に対する物理的動機付け型変分アンザッツであるECBAを実験的に評価した。
超伝導量子プロセッサにECBAを実装し,混乱したハイゼンベルク連鎖モデルにベンチマークする。
我々は,ECBAを2次元2乗格子接続で効率的にハードウェアに埋め込むことができることを見出した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:21:35 GMT)
Embedding-Only Uplink for Onboard Retrieval Under Shift in Remote Sensing [0.0] 地上局がコンパクトな埋め込みとメタデータのみをアップリンクする厳密な環境について検討し、車載システムではベクトル探索を行い、新たなキャプチャーをトリアージする。
すべての効果的な手法が同じアップリンク埋め込みに依存していることがわかったが、最適決定ヘッドはタスク依存である。
これらの結果から,組込みのみのアップリンクが重要な有効化要因であることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:58:09 GMT)
Efficient Inference of Large Vision Language Models [0.0] 本稿では,LVLM推論の高速化のための最先端技術について述べる。
既存の最適化フレームワークを4つの主要な側面に分類する系統分類を導入する。
我々は,これらの方法論の限界を批判的に検討し,効率的なマルチモーダルシステムにおける今後の研究方向を示唆する重要なオープン問題を特定する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 02:23:37 GMT)
Efficient Domain Adaptation for Text Line Recognition via Decoupled Language Models [0.0] 本稿では,単一GPUトレーニングによる近SOTA精度を実現するモジュール型検出・補正フレームワークを提案する。
本手法は、ドメイン固有の言語補正から、軽量な視覚的文字検出(ドメインに依存しない)を分離する。
その結果、この分離されたパラダイムは、計算量を約95%削減しつつ、エンドツーエンドの変換器の精度と一致していることがわかった。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 04:39:26 GMT)
Early Academic Capital as the Causal Origin of Dropout in Constrained Educational Systems -- Evidence from Longitudinal Data and Structural Causal Models [0.0] 高等教育のドロップアウトは一般的に、コース失敗や反復といった観察可能な学術イベントを通じて分析される。
本研究は,制約付き工学カリキュラムにおけるドロップアウトの起源を特定するために,因果計算社会科学アプローチを用いた。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:33:26 GMT)
Dynamic Lookahead Distance via Reinforcement Learning-Based Pure Pursuit for Autonomous Racing [0.0] 本稿では,Pure Pursuit コントローラとPure Pursuit コントローラを統合したハイブリッド制御フレームワークを提案する。
PPOエージェントは、車両の速度とマルチ水平曲率の特徴をオンラインルックアヘッドコマンドにマッピングする。
実験により、学習したポリシーは、目に見えないトラック上でラップタイムのパフォーマンスと繰り返しラップ完了を改善することが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:09:26 GMT)
Drop the Hierarchy and Roles: How Self-Organizing LLM Agents Outperform Designed Structures [0.0] 本研究では,8つのモデル,4-256エージェント,8つの調整プロトコルにまたがる25,000タスクの計算実験を提案する。
我々は、現在LLMエージェントに自律的行動がすでに出現していることを観察する。
結果はクローズドおよびオープンソースモデル間で複製され、オープンソースはクローズドソース品質の95%を24倍のコストで達成している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:44:53 GMT)
Does Claude's Constitution Have a Culture? [0.0] 我々は,6つの価値領域にまたがる高い異文化性を示す55の世界価値調査項目について,Claude Sonnetの評価を行った。
クロードの価値プロファイルは、北欧や英語圏のものと最もよく似ている。
本研究は, このリスクの複合性と, グローバルに代表される憲法制定プロセスの必要性について論じる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 07:38:46 GMT)
Divide and Restore: A Modular Task-Decoupled Framework for Universal Image Restoration [0.0] 様々な種類の劣化によって影響を受ける画像の復元は、コンピュータビジョンにおいて重要な課題である。
本稿では,明示的な診断ルーティング機構に基づくモジュール型タスク分離型画像復元フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 16:45:16 GMT)
Detection of Adversarial Attacks in Robotic Perception [0.0] ディープニューラルネットワーク(DNN)は、ロボット知覚のためのセマンティックセグメンテーションにおいて強力なパフォーマンスを達成するが、敵の攻撃には弱いままである。
ディープニューラルネットワーク(DNN)は、ロボット知覚のためのセマンティックセグメンテーションにおいて強力なパフォーマンスを達成するが、敵の攻撃には弱いままである。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:41:49 GMT)
Detecting the Unexpected: AI-Driven Anomaly Detection in Smart Bridge Monitoring [0.0] 本稿では,スマートブリッジモニタリングのための人工知能駆動型異常検出手法を提案する。
具体的には、ノルウェーの橋上に設置されたiBridgeセンサー装置によって収集されたリアルタイムセンサデータを用いて、シンプルな機械学習(ML)モデルを開発した。
実験結果から, 異常事象(橋梁事故)を正確に検出する上で, ノイズに基づくアプリケーションの密度に基づく空間クラスタリングが優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:47:36 GMT)
Designing AI for Real Users -- Accessibility Gaps in Retail AI Front-End [0.0] 私たちは、多くのAIフロントエンドが暗黙的に「理想のユーザーボディと精神」を仮定していると主張している。
これは、異なる有能なユーザの経験を通して観察すると、目に見える、倫理的に適切になる。
我々は,AIガバナンスの実践的補完として,フロントエンド保証を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 09:04:17 GMT)
CrossTrace: A Cross-Domain Dataset of Grounded Scientific Reasoning Traces for Hypothesis Generation [0.0] CrossTraceは、バイオメディカル研究、AI/ML、クロスドメインワークにまたがる1,389の科学的推論トレースのデータセットである。
各トレースは、確立された知識から中間的な論理段階から新しい仮説へと構造化された推論連鎖を捕捉する。
微調整のQwen2.5-7B-QLoRAによるCrossTraceのインストラクションは、未調整のベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:55:55 GMT)
Compressing Transformer Language Models via Matrix Product Operator Decomposition: A Case Study on PicoGPT [0.0] トランスフォーマーベースの言語モデルは、NLPタスク間で強力なパフォーマンスを実現するが、その2次パラメータスケーリングは、リソース制約のあるハードウェアへのデプロイを高くする。
変圧器の原理圧縮法として行列積演算子分解について検討する。
MPOは、重み行列を低ランクコアの鎖に分解し、近似品質は結合次元chiによって制御される。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 14:57:47 GMT)
Compact Continuous-Variable Quantum Key Distribution System Employing Monolithically Integrated Silicon Photonic Transceiver [0.0] カスタム設計のシリコンフォトニック光偏光変換器を備えたCV-QKDシステムについて紹介する。
我々は25kmの標準単一モードファイバで1.9Mbit/s秘密鍵レートを達成した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 11:33:36 GMT)
Color code off-the-hook: avoiding hook errors with a single auxiliary per plaquette [0.0] 平面カラーコードのシンドローム抽出は、高重み安定化器とフック誤差によって複雑である。
そこで本研究では,色に依存したゲートスケジュールを持つ単一補助症候群抽出回路を提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:00:01 GMT)
Coherent Without Grounding, Grounded Without Success: Observability and Epistemic Failure [0.0] 私は、人工エージェントを評価するには、コヒーレンス、グラウンド、そして説明とアクションをリンクする適切な関係という三部構成のフレームワークが必要であると論じます。
私は、様々な観測可能性の下で、先行、信号、およびドメイン知識がどのように相互作用するかのモデルである、てんかん三角法を開発します。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:38:42 GMT)
CivicShield: A Cross-Domain Defense-in-Depth Framework for Securing Government-Facing AI Chatbots Against Multi-Turn Adversarial Attacks [0.0] CivicShieldは政府向けAIチャットボットのためのクロスドメイン・ディフェンス・イン・ディープス・フレームワークである。
そこで本研究では,NIST SP 800-53制御にフレームワークをマッピングし,アブレーション解析を用いて評価する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:58:04 GMT)
Central Limit Theorems for Outcome Records in Disordered Quantum Trajectories [0.0] 乱れた環境下での繰り返し測定により生成された離散時間量子軌道の測定記録において、有限パターン数に対するCLTを証明した。
有限群作用によって生じる乱れた歩行型モデルを含む,幅広い事例群にまたがる仮定の基準と検証を行う。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:17:02 GMT)
Categorical Perception in Large Language Model Hidden States: Structural Warping at Digit-Count Boundaries [0.0] カテゴリー的知覚(CP) - カテゴリー境界における識別性の向上 - は知覚心理学において最も研究されている現象の一つである。
本稿では,大言語モデル (LLM) のアラビア数字処理における隠れ状態表現において,類似の幾何学的ワープが生じることを報告する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 10:34:58 GMT)
Can Quantum Field Theory be Recovered from Time-Symmetric Stochastic Mechanics? Part II: Prospects for a Trajectory Interpretation [0.0] 各$Q$関数は境界値に対する条件確率の重み付き平均として表現できることを示す。
この制限にもかかわらず、ドラモンドの軌道力学は基本的に非マルコフ的であることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:31:35 GMT)
Calibrated Fusion for Heterogeneous Graph-Vector Retrieval in Multi-Hop QA [0.0] ベクトルとグラフのスコアを、融合前のパーセンタイルランク正規化(PIT)を用いて、共通の単位自由尺度にマップする。
MuSiQueと2WikiMultiHopQA全体で、キャリブレーションされた融合は最後のホップ検索を改善する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:13:01 GMT)
Bit-Identical Medical Deep Learning via Structured Orthogonal Initialization [0.0] 深層学習トレーニングは非決定論的であり、異なるランダムなシードを持つ同一のコードは、集約メトリクスに異を唱えるが個々の予測に異を唱えるモデルを生成する。
ランダム性の3つの源を除去する検証ビット識別訓練の枠組みを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 05:04:57 GMT)
Beta-Scheduling: Momentum from Critical Damping as a Diagnostic and Correction Tool for Neural Network Training [0.0] 標準ニューラルネットワークトレーニングでは、1964年までの規則である定数運動量(典型的には0.9)を用いており、その最適性について理論的に限定されている。
このベータスケジュールは、既存の学習率スケジュールを超えて、ゼロのフリーパラメータを必要とする。
ResNet-18/CIFAR-10では、ベータスケジューリングにより、一定の運動量よりも90%の精度で1.9倍の収束が得られる。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 18:53:03 GMT)
Bell's Inequality, Causal Bounds, and Quantum Bayesian Computation: A Unified Framework [0.0] ベルの不等式は局所現実主義相関ポリトープの境界を特徴づける。
量子力学は非可換性によってこの境界を超える。
楽器の不等式, バルケ-パール線形計画法, テン-パール因果関係の確率は, すべて同じ辺相のポリトープの面として現れることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 20:18:16 GMT)
Adiabatic dressing of quantum enhanced Markov chains [0.0] 量子強化型マルコフ連鎖(英語版)モンテカルロ(英語版)は、堅牢な量子スピードアップの可能な方法として導入されている。
これまでの研究では、アルゴリズムのパフォーマンスを制限する競合要因を特定してきた。
クエンチプロトコルを用いて非局在化の度合いを制御することにより,パラダイム的スピングラスモデルにおけるマルコフギャップを著しく向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 06:26:48 GMT)
AceleradorSNN: A Neuromorphic Cognitive System Integrating Spiking Neural Networks and DynamicImage Signal Processing on FPGA [0.0] AceleradorSNNは第3世代の人工知能認知システムである。
本稿では、両IPコアのハードウェア指向設計、SNNバックボーンの評価、リアルタイムストリーミングISPアーキテクチャについて詳述する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 13:37:09 GMT)
ARCS: Autoregressive Circuit Synthesis with Topology-Aware Graph Attention and Spec Conditioning [0.0] ARCSは、検索ベースの手法で必要とされる分ではなく、完全なSPICEシミュラブルな設計をミリ秒で生成する。
ベストオブ3候補選択を備えたトポロジ対応グラフ変換器は,97msで85%のシミュレーション精度を達成し,ランダム検索の600倍以上の高速化を実現した。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 23:14:08 GMT)
A Survey on AI for 6G: Challenges and Opportunities [0.0] 6Gは、スマートシティ、自律システム、ホログラフィックテレプレゼンス、触覚インターネットを含むアプリケーションに対して、高いデータレート、低レイテンシ、広範な接続を提供することを目指している。
本稿では,6Gネットワークをサポートする上でAIが果たす役割について概説する。
ディープラーニング、強化学習、フェデレーション学習、説明可能なAIといった重要な技術に焦点を当てている。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 08:22:50 GMT)
A Multi-Agent Rhizomatic Pipeline for Non-Linear Literature Analysis [0.0] 本研究ノートでは,Deleuzianプロセス-リレーショナルオントロジーを基盤としたマルチエージェント計算パイプラインであるRhizomatic Research Agent (V3)について述べる。
このシステムは、ライゾマティックな探究を博士研究に用いた(Narayan2023)方法論的な基礎研究に応えて開発された。
予備的な展開は、システムが学際的な収束と構造研究のギャップを表面化する能力を示す。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 12:06:25 GMT)
A Latent Risk-Aware Machine Learning Approach for Predicting Operational Success in Clinical Trials based on TrialsBank [0.0] 本稿では,臨床治験成功予測のための階層的潜在リスク認識機械学習フレームワークを提案する。
私たちは、Sorintellisが開発した独自のAI対応データベースであるTrialsBankのキュレートされたサブセットを使用しています。
フェーズI-IIIでは、F1スコアはそれぞれ0.93、0.92、0.91である。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 22:12:21 GMT)
A Generalized Matrix Inverse that is Consistent with Respect to Diagonal Transformations [0.0] 任意の非特異対角変換に対して一致する新しい一般化行列逆法が導出される。
状態空間変換の下で変数に関連する単位を保存する。
新しい逆はドラジン逆とムーア・ペンローズ逆を補完し、一般化された行列逆の3次定理を完備化する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 15:06:02 GMT)
A Cross-Scale Decoder with Token Refinement for Off-Road Semantic Segmentation [0.0] オフロードセマンティックセグメンテーションは、不規則な地形、植生の散らばり、および固有のアノテーションのあいまいさによって根本的に挑戦されている。
既存のデコーダの設計は、細部が細かな構造を誇張する低スケールのボトルネックに依存しているか、あるいは高精細な特徴を何度も融合させるかのいずれかである。
本稿では,3つの相補的なメカニズムにより,これらの課題に明示的に対処するクロススケールデコーダを提案する。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 00:59:22 GMT)
A Convex Route to Thermomechanics: Learning Internal Energy and Dissipation [0.0] 完全に結合した熱力学におけるモデル発見のための物理に基づくニューラルネットワークフレームワークを提案する。
ヘルムホルツエネルギーに基づく古典的な定式化とは対照的に、内部エネルギーと散逸ポテンシャルを一次函数として採用する。
結果は,学習したモデルが基礎となる振る舞いを正確に捉えていることを示している。
論文参考訳(メタデータ) (Mon, 30 Mar 2026 17:26:13 GMT)