HELP: Hierarchical Embodied Language Planner for Household Tasks [75.4] 複雑なシナリオを扱うエージェントは、堅牢な計画能力に大きく依存する。
広範な言語知識を備えた大規模言語モデルは、この役割を果たすことができる。
LLMをベースとした一組のエージェントからなる階層型エンボディード言語プランナーHELPを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:54:08 GMT)
Co-GRPO: Co-Optimized Group Relative Policy Optimization for Masked Diffusion Model [75.0] Masked Diffusion Models (MDMs) は、視覚、言語、モーダル・ジェネレーションにまたがる有望な可能性を示している。
本稿では,MDM生成をMDP(Markov Decision Process)として再構成し,モデルと推論スケジュールを併用するCo-GRPOを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:06:04 GMT)
Generative Actor Critic [74.0] Generative Actor Critic (GAC) は、軌道上での関節分布の生成モデル学習として、テキスト政治評価を反映して、シーケンシャルな意思決定を分離する新しいフレームワークである。
Gym-MuJoCoとMaze2Dベンチマークの実験では、GACの強いオフライン性能と、最先端の手法と比較してオフラインからオフラインへの大幅な改善が示されている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:31:11 GMT)
Enabling Ultra-Fast Cardiovascular Imaging Across Heterogeneous Clinical Environments with a Generalist Foundation Model and Multimodal Database [64.7] MMCMR-427Kは、最大かつ最も包括的なマルチモーダル心血管共鳴k空間データベースである。
CardioMMは、異種高速CMRイメージングシナリオに適応可能な再構成基盤モデルである。
CardioMMは、物理インフォームドデータ一貫性と意味的文脈理解を統合して、堅牢な再構築を実現する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:47:50 GMT)
GeCo: A Differentiable Geometric Consistency Metric for Video Generation [61.3] 静的なシーンにおける幾何学的変形と閉塞不整合を共同検出するための幾何学的グラウンドメトリックであるGeCoを紹介する。
残留した動きと深さの先行を融合させることで、GeCoはこれらのアーティファクトを明らかにする解釈可能な高密度な一貫性マップを生成する。
我々は、GeCoを使用して、最新のビデオ生成モデルを体系的にベンチマークし、共通の障害モードを明らかにし、さらに、ビデオ生成時の変形アーチファクトを低減するために、トレーニング不要な損失ガイダンスとして使用します。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:28:28 GMT)
SemanticGen: Video Generation in Semantic Space [60.5] 最先端のビデオ生成モデルは、通常、VAE空間内のビデオ潜像の分布を学習し、VAEデコーダを使用してピクセルにマッピングする。
我々はセマンティックGenを紹介した。セマンティックGenはセマンティックな空間でビデオを生成する新しいソリューションだ。
提案手法は,長大なビデオ生成に拡張した場合にも有効であり,計算的にも効率的である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:25:56 GMT)
HiStream: Efficient High-Resolution Video Generation via Redundancy-Eliminated Streaming [58.6] HiStreamは、3つの軸にわたる冗長性を体系的に低減する効率的な自動回帰フレームワークである。
1080pのベンチマークでは、主要なHiStreamモデル(i+ii)は最先端のビジュアル品質を実現し、Wan2.1ベースラインと比較して76.2倍高速なデノイングを実現した。
より高速なHiStream+は3つの最適化を全て適用し、ベースライン上で107.5倍の高速化を実現しています。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:18:18 GMT)
Contrastive Graph Modeling for Cross-Domain Few-Shot Medical Image Segmentation [58.4] クロスドメイン少ショット医療画像セグメンテーション(CD-FSMIS)は医療応用に有望でデータ効率のよいソリューションを提供する。
本稿では,医用画像の構造的整合性を利用したコントラストグラフモデリング(C-Graph)を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:00:17 GMT)
Rethinking Sample Polarity in Reinforcement Learning with Verifiable Rewards [57.1] 試料の偏光がRLVRトレーニングの力学と挙動に与える影響について検討する。
正のサンプルは既存の正しい推論パターンを鋭くし、負のサンプルは新たな推論経路の探索を奨励する。
政策最適化のための適応的・非対称なトークンレベルのアドバンテージ整形法を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:15:46 GMT)
Dynamic Feedback Engines: Layer-Wise Control for Self-Regulating Continual Learning [55.9] 本研究では,そのエントロピーに基づいて各層を制御するための動的フィードバック機構を用いたエントロピー対応連続学習手法を提案する。
提案手法は,高エントロピー層におけるエントロピーを低減し,過度に信頼性の高い層におけるエントロピーを高め,過度なオーバーフィッティングを緩和する。
さまざまなデータセットの実験は、最先端の継続的学習ベースラインよりも大幅にパフォーマンスが向上したことを示している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:27:43 GMT)
Spatiotemporal-Untrammelled Mixture of Experts for Multi-Person Motion Prediction [53.6] 人間の動作の複雑な時間的依存関係を包括的に捉えることは、多対人動作にとって重要である。
既存の方法には2つの主要な制限がある。
従来の注意の時間に起因した計算コストが高い。
我々のモデルは4種類の時間的専門家を取り入れており、それぞれ異なる空間的・時間的依存を捉えている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:01:19 GMT)
When Bayesian Tensor Completion Meets Multioutput Gaussian Processes: Functional Universality and Rank Learning [53.2] 関数テンソル分解は実数値インデックスを用いて多次元データを解析することができる。
そこで本研究では,Right-Revealing Functional Low-rank tensor completion (RR-F)法を提案する。
連続多次元信号に対するモデルの普遍近似特性を確立する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:15:52 GMT)
Oogiri-Master: Benchmarking Humor Understanding via Oogiri [53.1] 参加者が与えられたプロンプトに対して機知に富む応答を生成できる,日本の創造的反応ゲーム「おぎり」を用いてユーモアを学習する。
既存のデータセットには、プロンプト毎の候補応答がほとんどなく、評価中に人気信号が露出し、客観性と同等の指標が欠如している。
Oogiri-Master と Oogiri-Corpus は,大規模言語モデルにおけるユーモア理解の厳密な評価を可能にするためのベンチマークとデータセットである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:59:20 GMT)
First Provable Guarantees for Practical Private FL: Beyond Restrictive Assumptions [52.8] Fed-$-NormECは、標準仮定の下で証明可能な収束とDP保証を提供する最初の微分プライベートFLフレームワークである。
Fed-$-NormEはローカルアップデートを統合し、サーバとクライアントを分離し、重要な部分的なクライアント参加をステップ化する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:05:15 GMT)
Multiple-play Stochastic Bandits with Prioritized Arm Capacity Sharing [52.1] このモデルは、$M$armと$K$playで構成されている。
各アームには複数の能力があり、各ユニットの能力は報酬関数に関連付けられている。
複数のプレーがアームキャパシティを競う場合、アームキャパシティは第1の優先重みで割り当てられる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:19:09 GMT)
Can Generative Models Actually Forge Realistic Identity Documents? [51.6] オープンソースでパブリックアクセス可能な生成モデルは、IDドキュメントの偽造物を生成することができる。
法定レベルの認証を達成するための、生成的アイデンティティドキュメントの深層化のリスクは過大評価される可能性がある。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:56:50 GMT)
DiverseGRPO: Mitigating Mode Collapse in Image Generation via Diversity-Aware GRPO [50.9] 強化学習(RL)は、同一グループ内で生成された画像の相対的性能を比較することにより、画像生成品質を著しく向上させる。
トレーニングの後半段階では、モデルは創造性と視覚的多様性を欠いた均質化されたアウトプットを生成する傾向にある。
この問題は、報酬モデリングとジェネレーションダイナミクスの両方の観点から分析することができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:37:37 GMT)
DAVE: A VLM Vision Encoder for Document Understanding and Web Agents [50.1] 視覚言語モデル(VLM)のための視覚エンコーダDAVEを紹介する。
私たちのトレーニングパイプラインは、ドキュメントやWebイメージの大規模なアノテーションの必要性を回避するために、豊富なラベルのないデータを活用するように設計されています。
我々は、アンサンブルトレーニングを使用して、事前訓練されたジェネリストエンコーダの機能を、独自のドキュメントとWeb固有の表現で融合する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 02:25:27 GMT)
Beyond Heuristics: A Decision-Theoretic Framework for Agent Memory Management [49.7] メモリ管理は、不確実性の下でのシーケンシャルな意思決定問題と見なされるべきである。
私たちの貢献は、新しいアルゴリズムではなく、アプローチの限界を明確にする原則的なリフレーミングです。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:23:03 GMT)
UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement [48.3] 我々は,高忠実度3次元幾何生成のためのスケーラブルな3次元拡散フレームワークであるUltraShape 1.0を紹介する。
提案手法では, 粗大な大域構造をまず合成し, 精細で高品質な幾何を生成する。
我々のモデルは、利用可能な3Dデータセットにのみトレーニングされており、限られたトレーニングリソースにもかかわらず、強力な幾何学的品質を達成することができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:59:47 GMT)
Five Years of SciCap: What We Learned and Future Directions for Scientific Figure Captioning [47.7] SciCapプロジェクトは、ペンシルバニア州の小さなシード資金によるアイデアから、科学的なフィギュアキャプションの風景を形作る中心的な取り組みへと成長した。
この5年間で、我々はarXivの論文から大量のフィギュア・キャプション・ペアを収集し、リリースし、継続的に更新した。
SciCapの最初の5年間を振り返って、私たちが学んだ重要な技術的、方法論的な教訓を要約します。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:39:10 GMT)
Inference-based GAN Video Generation [47.5] 可変エンコーダを用いた対向型非条件ビデオジェネレータの実現により,新しいタイプのビデオジェネレータを提案する。
既存のモデルは、生成されたビデオの時間的スケーリングに苦労する。
私たちは、数百から数千のフレームからなる長いビデオを生成するために、新しい、メモリ効率のアプローチを採用しています。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:14:38 GMT)
UniPercept: Towards Unified Perceptual-Level Image Understanding across Aesthetics, Quality, Structure, and Texture [46.9] UniPercept-Benchは3つの主要な領域(美学、品質、構造、テクスチャ)にまたがる知覚レベルのイメージ理解のための統合されたフレームワークである。
ドメイン指向の事前学習とタスク指向のRLによってトレーニングされた強力なベースラインUniPerceptを開発し、ビジュアルレーティング(VR)タスクと視覚質問応答(VQA)タスクの両方にわたって堅牢な一般化を可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:35:52 GMT)
WearVox: An Egocentric Multichannel Voice Assistant Benchmark for Wearables [46.7] WearVoxは、現実的なウェアラブルシナリオで音声アシスタントを厳格に評価するために設計された最初のベンチマークである。
3,842のマルチチャンネル、エゴセントリックなオーディオ録音をAIメガネで5つのタスクで収集する。
我々は、プロプライエタリでオープンソースのLarge Language Models (SLLM) をベンチマークし、ほとんどのリアルタイムSLLMが29%から59%の精度を達成することを発見した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:39:21 GMT)
Perplexity-Aware Data Scaling Law: Perplexity Landscapes Predict Performance for Continual Pre-training [46.5] 事前トレーニングのスケーリング法則は、データセットのサイズとLLMのテスト損失との間には、ゆるい関係がある。
本稿では,ドメイン固有データの難易度景観とテスト損失との予測的関係を確立するために,新しいパープレキシティ対応データスケーリング法を提案する。
本手法は, ほぼ最適トレーニングサブセットを一貫して同定し, 医用および一般のベンチマークにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:40:46 GMT)
JEPA-Reasoner: Decoupling Latent Reasoning from Token Generation [45.9] JEPA(Joint-Embedding Predictive Architecture)は、リッチな潜在表現を学習するための強力なアーキテクチャとして登場した。
我々はJEPAベースの新しいアーキテクチャであるJEPA-Reasonerを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:16:07 GMT)
Omni-Weather: Unified Multimodal Foundation Model for Weather Generation and Understanding [45.2] オムニ・ウェザー(Omni-Weather)は、気象の発生と1つのアーキテクチャ内での理解を統一する最初のマルチモーダル基礎モデルである。
大規模な実験は、オムニ=ウェザーが気象の発生と理解の両方において最先端のパフォーマンスを達成することを示している。
本研究は,気象領域における生成的・理解的タスクが相互に増強できることを示唆するものである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:08:09 GMT)
Weighted Fourier Factorizations: Optimal Gaussian Noise for Differentially Private Marginal and Product Queries [43.7] 差分プライバシー下での余分なクエリを付加(相関)ガウス雑音で解放する作業を再考する。
因子化機構である我々のアルゴリズムは、すべての因子化機構の中で正確に最適であることを示す。
提案手法は,数値属性のしきい値を用いた拡張限界クエリを製品クエリに組み込む方法を示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:14:59 GMT)
On prethermal time crystals from semi-holography [42.6] ハイブリッド量子系における低温におけるほぼ散逸のない振動モードの対の存在を示す。
これらのモードは, 微調整を伴わない半ホログラフィ系における予熱時間-結晶挙動を実現する。
また, グレゴリー・ラフラム型不安定性は高温における不均一性の形成を引き起こす。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:32:33 GMT)
Rethinking Output Alignment For 1-bit Post-Training Quantization of Large Language Models [41.7] 大きな言語モデル(LLM)は、幅広いNLPタスクに対して強力なパフォーマンスを提供するが、その巨大なサイズは、リソースに制約のあるデバイスへのデプロイメントを妨げる。
トレーニング後の量子化(PTQ)は、リトレーニングを必要とせず、キャリブレーションのための小さなデータセットのみを必要とするため、その効率性に広く採用されている。
ポストトレーニング量子化の最近の進歩は、サブ4ビット法でさえオリジナルのモデル性能のほとんどを維持できることを示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:39:36 GMT)
An Information Theoretic Perspective on Agentic System Design [40.4] 小さな「圧縮器」LMは生のコンテキストをコンパクトテキストに蒸留し、より大きな「予測器」LMによって消費される。
その人気にもかかわらず、圧縮機・予測装置の設計はいまだ大半がアドホックである。
我々は、特定のタスクによらず、相互情報が下流のパフォーマンスを強く予測することを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:45:31 GMT)
AstraNav-World: World Model for Foresight Control and Consistency [40.1] ダイナミックな環境での身体的ナビゲーションは、世界がどのように進化し、どのように行動が時間とともに広がるかを正確に予測する必要がある。
AstraNav-Worldは、未来の視覚状態とアクションシーケンスを共同で推論するエンド・ツー・エンドの世界モデルである。
本フレームワークは,拡散型ビデオジェネレータとビジョン言語ポリシーを統合し,同期ロールアウトを実現する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:31:24 GMT)
TICON: A Slide-Level Tile Contextualizer for Histopathology Representation Learning [39.2] TICONは変換器ベースのタイル表現文脈化器である。
計算病理学における 'any' アプリケーションのためのリッチでコンテキスト化された埋め込みを生成する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:05:10 GMT)
The Illusion of Clinical Reasoning: A Benchmark Reveals the Pervasive Gap in Vision-Language Models for Clinical Competency [38.7] 現在のベンチマークでは、現実の患者のケアに不可欠な統合されたマルチモーダルな推論を捉えられていない。
このベンチマークは、臨床推論経路を反映する7つのタスクにわたるモデルを評価する。
現在の人工知能モデルは、複雑なマルチモーダル推論にはまだ臨床的に適していない。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:33:22 GMT)
SymDrive: Realistic and Controllable Driving Simulator via Symmetric Auto-regressive Online Restoration [37.2] 現在のアプローチは、しばしば大きな角度の新規ビュー合成に干渉し、資産操作中に幾何学的または照明的アーティファクトに悩まされる。
高品質なレンダリングとシーン編集が可能な統合拡散ベースのフレームワークであるSymDriveを提案する。
我々は,SymDriveが新規視認性向上とリアル3D車両挿入の両面において,光実写性能を実現することを実証した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 10:28:43 GMT)
SVBench: Evaluation of Video Generation Models on Social Reasoning [35.1] ビデオ生成における社会的推論のための最初のベンチマークを紹介する。
我々は,各実験の推論機構を蒸留する,完全学習不要なエージェントベースパイプラインを開発した。
われわれは,7つの最先端ビデオ生成システムを対象とした大規模な研究を行った。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:44:59 GMT)
UltraLBM-UNet: Ultralight Bidirectional Mamba-based Model for Skin Lesion Segmentation [34.5] このUltraLBM-UNetは,マルチブランチ局所的特徴認識と双方向マンバに基づくグローバルモデリング機構を統合した軽量なU-Net変種である。
提案モデルでは, 既存の軽量およびMambaのパラメータが0.034M, 0.060GFLOPよりも優れ, 常に最先端のセグメンテーション精度を実現している。
これらの結果は、正確な、堅牢な病変解析が不可欠である、ポイント・オブ・ケア展開におけるUltraLBM-UNetの適合性を強調した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:05:02 GMT)
TrackTeller: Temporal Multimodal 3D Grounding for Behavior-Dependent Object References [33.3] 時間的言語に基づく3Dグラウンド化について検討し,その目的は,多フレーム観測を利用して,現在のフレーム内の参照対象を特定することである。
本稿では,LDAR-image fusion,言語条件付きデコード,時間的推論を統合アーキテクチャで統合した時間的マルチモーダルグラウンドディングフレームワークであるTrackTellerを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:02:56 GMT)
CATCH: A Controllable Theme Detection Framework with Contextualized Clustering and Hierarchical Generation [33.1] 本稿では,コンテキスト認識型トピック表現,優先誘導型トピッククラスタリング,階層型テーマ生成機構という,3つのコアコンポーネントを統合した統合フレームワークを提案する。
マルチドメイン顧客対話ベンチマーク(DSTC-12)の実験は、テーマクラスタリングとトピック生成品質の両方において、8B LLMを用いたCATCHの有効性を示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:33:25 GMT)
TAMEing Long Contexts in Personalization: Towards Training-Free and State-Aware MLLM Personalized Assistant [32.5] 長期MLLMパーソナライズ評価ベンチマークを提案する。
新しいフレームワークTAMEは、各パーソナライズされた概念の時間的および永続的なバリエーションを管理するために、MLLMにダブルメモリを付与する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 10:23:56 GMT)
Towards Long-window Anchoring in Vision-Language Model Distillation [32.4] 大きな視覚言語モデル(VLM)は、強い長文理解を示すが、その主流である小さな枝は、限られたウィンドウサイズで言語学的・写真的アライメントに失敗する。
知識蒸留により,窓の大きさのロータリー位置埋め込み(RoPE)を補完する学生の能力が向上することが判明した。
本稿では,2つの相補的コンポーネントを介し,長距離の注意機構の伝達を直接目的とするLAidを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:39:14 GMT)
Mitigating LLM Hallucination via Behaviorally Calibrated Reinforcement Learning [32.3] 振舞い校正された強化学習により、小さなモデルは不確実な定量化においてフロンティアモデルを超えることができる。
当社のモデルでは,GPT-5の0.207を超える精度向上率(0.806)を挑戦的なドメイン内評価において達成している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:58:51 GMT)
From Shallow Humor to Metaphor: Towards Label-Free Harmful Meme Detection via LMM Agent Self-Improvement [32.2] オンラインメディアにおける有害ミームの拡散は、公衆衛生と安定性に重大なリスクをもたらす。
既存の検出方法は、トレーニングのために大規模なラベル付きデータに大きく依存している。
本稿では,LMM(Large Multimodal Model)エージェントによる最初のlAbeLフリーなhARmful Meme検出フレームワークであるALARMを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:36:35 GMT)
Efficient MoE Inference with Fine-Grained Scheduling of Disaggregated Expert Parallelism [32.0] FinDEPは、タスクオーバーラップを最大化し、MoE推論スループットを改善するDEPのためのきめ細かいタスクスケジューリングアルゴリズムである。
DeepSeek-V2とQwen3-MoEの4つのGPUシステムの実験では、FinDEPは以前の方法よりも最大1.61倍のスループット向上を示している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:22:03 GMT)
Electrical Control of Optically Active Single Spin Qubits in ZnSe [31.5] 量子井戸内の単一ドナー量子ビットの電気的制御は、光学的およびスピンアドレナビリティを向上させる。
電気制御は光とスピンのアドレナビリティを著しく向上させる万能経路である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:48:15 GMT)
Gamayun's Path to Multilingual Mastery: Cost-Efficient Training of a 1.5B-Parameter LLM [30.4] 2.5Tトークンのスクラッチから完全にトレーニングされた多言語言語モデルであるGamayunを紹介します。
我々のモデルは12言語をサポートし、特にロシア語に焦点を当てています。
高度なSTEM以外のほとんどのタスクでQwen3(36Tトークン)にマッチまたは超える。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:52:23 GMT)
Vision Transformers are Circulant Attention Learners [30.3] 自己注意機構は視覚変換器の進歩の鍵となる要素である。
我々は,自己注意の本質的効率的なパターンを生かして,textbfCirculant Attentionと呼ばれる新しい注意パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:28:33 GMT)
InstructMoLE: Instruction-Guided Mixture of Low-rank Experts for Multi-Conditional Image Generation [30.2] InstructMoLEは、低ランクエキスパートのインストラクションガイドミクチャーを取り入れた、新しいフレームワークである。
本研究は、生成モデルの命令駆動微調整のための頑健で一般化可能なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:37:12 GMT)
DreaMontage: Arbitrary Frame-Guided One-Shot Video Generation [29.7] DreaMontageは任意のフレーム誘導生成用に設計された包括的なフレームワークである。
多様なユーザが提供するインプットから、シームレスで表現力豊かで長期にわたるワンショットビデオを合成することができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:24:33 GMT)
Discovering Sparse Recovery Algorithms Using Neural Architecture Search [29.5] Iterative Shrinkage Thresholding Algorithm (ISTA) and its accelerated Fast ISTA (FISTA) はアルゴリズムの再検討の候補である。
我々は,5万変数以上の探索空間を与えられた場合,上記の2つのアルゴリズムを再発見することのできるメタラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:17:40 GMT)
RIPCN: A Road Impedance Principal Component Network for Probabilistic Traffic Flow Forecasting [29.0] PTFFのための時間的主成分学習とドメイン固有の輸送理論を統合した道路インピーダンス主成分ネットワークであるRIPCNを提案する。
RIPCNは、渋滞レベルと流動変動によって引き起こされる交通伝達パターンをキャプチャし、不確実性の直接的な原因を明らかにし、信頼性と解釈可能性の両方を高める。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:08:50 GMT)
CellMamba: Adaptive Mamba for Accurate and Efficient Cell Detection [28.4] CellMambaは、微細なバイオメディカルなインスタンス検出に適した、軽量で正確なワンステージ検出器である。
NC-Mamba または Multi-Head Self-Attention (MSA) と新しい Triple-Mapping Adaptive Coupling (TMAC) モジュールを結合する。
CoNSePとCytoDArk0-demonstrateという2つの公開データセットに対する大規模な実験では、CNNベースのベースライン、Transformerベースのベースライン、Mambaベースのベースラインよりも精度が高く、モデルサイズと推論レイテンシが大幅に削減されている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 23:05:11 GMT)
TableGPT-R1: Advancing Tabular Reasoning Through Reinforcement Learning [28.1] TableGPT-R1は、システマティック強化学習フレームワーク上に構築された特殊なモデルである。
本手法は, 教師付きアライメントとRLロールアウトの両方に対して, 難成層化エージェント軌道を合成する。
信頼性ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:35:54 GMT)
Human-AI Interaction Alignment: Designing, Evaluating, and Evolving Value-Centered AI For Reciprocal Human-AI Futures [28.0] 生成AIを日々の生活に迅速に統合することは、一方向アライメントモデルを超えて動く必要性を浮き彫りにする。
このワークショップは、双方向のヒューマン-AIアライメント、人間とAIが相互作用、評価、価値中心の設計を通じて協調する動的な相互プロセスに焦点を当てている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:45:38 GMT)
MoRAgent: Parameter Efficient Agent Tuning with Mixture-of-Roles [25.2] 本稿では,エージェントタスクにおけるパラメータ効率細調整(PEFT)の3つの重要な戦略を紹介する。
より支配的なReason+Actionパラダイムに着想を得て、エージェントタスクに必要な機能を3つの異なる役割に分解する。
そこで我々は3つのLoRAグループからなるMixture-of-Roles(Mixture-of-Roles)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:02:07 GMT)
A Medical Multimodal Diagnostic Framework Integrating Vision-Language Models and Logic Tree Reasoning [24.8] 視覚言語アライメントと論理正規化推論を組み合わせたLLaVAに基づく診断フレームワークを提案する。
提案手法は,テキストのみの設定では競争力を維持しつつ,マルチモーダルタスクにおいてより解釈可能な推論トレースが得られることを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:01:06 GMT)
GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs [24.3] GateBreakerは、トレーニング不要で、軽量で、アーキテクチャに依存しない最初のアタックフレームワークです。
GateBreakerは、現代のMoE LLMの安全アライメントを推論時に妥協する。
本研究により,MoEの安全性はスパースルーティングによって調整された神経細胞の小さなサブセットに集中していることが判明した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:36:31 GMT)
Videos are Sample-Efficient Supervisions: Behavior Cloning from Videos via Latent Representations [22.6] 本稿では,ビデオからの模倣学習を実現するために,遅延表現(BCV-LR)を用いた動画からの行動クローニングを提案する。
BCV-LRは、自己監督タスクを通じて高次元映像入力から行動関連潜伏特徴を抽出する。
我々は、離散制御と連続制御の両方を含む、難易度の高い視覚的タスクのセットについて広範な実験を行う。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:11:14 GMT)
Ara-HOPE: Human-Centric Post-Editing Evaluation for Dialectal Arabic to Modern Standard Arabic Translation [22.4] 方言アラビア語から現代標準アラビア語への翻訳(DA-MSA)は機械翻訳(MT)において難しい課題である
既存の評価指標と汎用評価フレームワークは、方言固有のMTエラーを捉えるのに苦労している。
本稿では,これらの課題に体系的に対処するために設計された,人間中心のポスト編集評価フレームワークであるAra-HOPEを紹介する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:29:59 GMT)
Heaven-Sent or Hell-Bent? Benchmarking the Intelligence and Defectiveness of LLM Hallucinations [21.7] HIC-Benchは、幻覚をインテリジェント幻覚(IH)と欠陥幻覚(DH)に分類する新しい評価フレームワークである
評価プロセスには複数のLCM審査員が採用され、評価スコアを平均してバイアスを緩和し、人間のアノテータがIH/DH分類を検証する。
実験の結果、IHとDHの非線形関係が明らかとなり、創造性と正しさを共同で最適化できることが確認された。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:33:46 GMT)
AI for Mycetoma Diagnosis in Histopathological Images: The MICCAI 2024 Challenge [21.4] 菌糸体腫(Mycetoma)は、菌類や細菌が組織障害や障害を引き起こす原因となる、無視された熱帯性疾患である。
本稿では,AI ソリューションによる筋腫の診断を促進するために組織された mycetoma Micro Image: Detect and Classify Challenge (mAIcetoma) の概要について述べる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:46:33 GMT)
Degradation-Aware Metric Prompting for Hyperspectral Image Restoration [20.8] ハイパースペクトル画像の復元を支援するためのDAMP(Degradation-Aware Metric Prompting)フレームワークを提案する。
事前定義された劣化先行値に頼るのではなく、連続的に劣化を定量化するために空間スペクトル劣化指標を設計する。
このフレームワークは、多種多様、混合的、あるいは目に見えない劣化の下で適応的、効率的、堅牢な復元を可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 03:42:07 GMT)
GaussianEM: Model compositional and conformational heterogeneity using 3D Gaussians [18.6] 本稿では,Cryo-EM画像から構成的および構成的不均一性を同時にモデル化する擬似原子構造体であるGaussianEMを提案する。
このアプローチは、構造変化の直感的で解釈可能な記述を提供し、遷移軌道に沿った局所的な構造的一貫性を保持し、密度ベースモデルと対応する原子モデルの間のギャップを自然に橋渡しする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:36:52 GMT)
Hierarchy-Aware Fine-Tuning of Vision-Language Models [18.2] 視覚言語モデルは、大規模な画像テキスト事前学習を通じて強力なマルチモーダル表現を学習する。
標準的アプローチはラベルをフラットなカテゴリとして扱い、完全な微調整を必要とする。
構造的一貫性を保ちつつ,いくつかのパラメータを更新する,効率的な階層型微調整フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:44:33 GMT)
AMS-IO-Bench and AMS-IO-Agent: Benchmarking and Structured Reasoning for Analog and Mixed-Signal Integrated Circuit Input/Output Design [18.0] 構造認識型入出力(I/O)サブシステム生成のためのドメイン特化LDMエージェントであるAMS-IO-Agentを提案する。
この研究の中心的な貢献は、自然言語設計意図と産業レベルのAMS IC成果物とを結びつけるフレームワークである。
ベンチマークでは、AMS-IO-Agentは70%以上のDRC+LVSパスレートを達成し、設計のターンアラウンド時間を数時間から数分に短縮する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 10:20:55 GMT)
CCAD: Compressed Global Feature Conditioned Anomaly Detection [17.7] 我々は,CCAD(Compressed Global Feature Conditioned Anomaly Detection)という新しい手法を提案する。
CCADは、再構成モデルの新たなモダリティ条件として、グローバルな特徴を適応させることにより、両方のパラダイムの強みを相乗化する。
大規模な実験により、CCADはAUCの点で最先端の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:33:00 GMT)
Anota: Identifying Business Logic Vulnerabilities via Annotation-Based Sanitization [17.7] ANOTAは,新規なヒトインザループサニタイザフレームワークである。
ANOTAは、ドメイン固有の知識を、アプリケーションの意図した振る舞いを定義する軽量アノテーションとしてエンコードする。
実行時実行モニタがプログラムの動作を観察し、アノテーションによって定義されたポリシーと比較する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:48:40 GMT)
Exploring the Security Threats of Retriever Backdoors in Retrieval-Augmented Code Generation [17.6] Retrieval-Augmented Code Generation (RACG)は、ソフトウェア開発のための大規模言語モデルを強化するために、ますます採用されている。
本稿では,レトリバーコンポーネントを標的としたバックドアアタック(バックドアアタック)という,致命的かつステルス的な脅威を初めて体系的に調査する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:53:46 GMT)
Global-Graph Guided and Local-Graph Weighted Contrastive Learning for Unified Clustering on Incomplete and Noise Multi-View Data [17.5] 実世界のマルチビューデータはデータの不完全性やノイズに悩まされ、希少なペアのサンプルやミスペアのサンプルとなる。
我々は,不完全かつノイズの多いマルチビューデータに対するクラスタリングの有効性を高めるために,CLベースの統合MVCフレームワークを提案する。
提案手法は計算自由であり,グローバルなグラフ誘導型コントラスト学習フレームワークに統合可能である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:41:05 GMT)
Multiconnectivity for SAGIN: Current Trends, Challenges, AI-driven Solutions, and Opportunities [17.3] 次世代ネットワークの鍵となる手段として,SAGIN (Space-air-ground-integrated Network) とMC (Multiconnectivity) が登場している。
空対空、空対空、空間対地、地上対地通信といったリンクタイプの多様性は、最適な資源割り当てを非常に複雑にしている。
近年の強化学習(RL)とエージェントインテリジェンス(AI)の進歩は,複雑・動的環境における最適意思決定において顕著な効果を示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:40:52 GMT)
XTrace: A Non-Invasive Dynamic Tracing Framework for Android Applications in Production [17.2] XTraceは、新しい動的トレースフレームワークである。
Android ART仮想マシンの高度に安定して内蔵されたインスツルメンテーション機構を利用して,高性能なメソッドインターセプションを実現する。
XTraceは11以上の深刻なオンラインクラッシュと複数のパフォーマンスボトルネックを診断し、根本原因のローカライゼーション効率を90%以上改善した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:06:21 GMT)
Do Latent Tokens Think? A Causal and Adversarial Analysis of Chain-of-Continuous-Thought [16.9] 我々は、明示的なCoT(Chain-of-Thought)よりも優れた効率と安定性を主張するCOCONUT(Chain-of-Continuous-Thought)に焦点を当てる。
CoTトークンとは異なり、COCONUTトークンはステアリングに対する最小限の感度を示し、推論クリティカルな情報を欠いている。
MMLUとHotpotQAの結果は、COCONUTが一貫してデータセットのアーティファクトを利用して、真の推論なしにベンチマークパフォーマンスを膨らませていることを示している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:14:53 GMT)
SyncAnyone: Implicit Disentanglement via Progressive Self-Correction for Lip-Syncing in the wild [16.7] SyncAnyoneは、2段階の学習フレームワークで、正確なモーションモデリングと高い視覚的忠実度を同時に実現している。
ソースビデオからリップ同期映像を合成して擬似ペアリングトレーニングサンプルを作成するデータ生成パイプラインを開発した。
さらに、この合成データに基づいてステージ2モデルを調整し、正確な唇編集と背景の整合性を向上する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 16:49:40 GMT)
Knot Forcing: Taming Autoregressive Video Diffusion Models for Real-time Infinite Interactive Portrait Animation [16.7] リアルタイム・ポートレート・アニメーションのためのKnot Forcingという新しいストリーミング・フレームワークを提案する。
Kノットフォーシングは、無限列上の高忠実で時間的に一貫性があり、インタラクティブなポートレートアニメーションを可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 16:34:56 GMT)
One Tool Is Enough: Reinforcement Learning for Repository-Level LLM Agents [16.3] RepoNavigatorは、呼び出されたシンボルの定義に単一の実行対応ツールジャンプを備えるエージェントである。
RepoNavigatorは、事前訓練されたモデルから直接強化学習を通じてエンドツーエンドで訓練され、クローズドソースの蒸留は行われない。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:33:05 GMT)
Enabling Conversational Behavior Reasoning Capabilities in Full-Duplex Speech [15.4] 我々は,このプロセスをグラフ・オブ・ソート(GoT)内の因果推論としてモデル化することで,会話行動に対する推論を可能にするフレームワークを導入する。
我々は、制御可能でイベントリッチなシミュレーションと、有意な有理数と実際の会話音声とを組み合わせたハイブリッドコーパスを開発する。
GoTフレームワークは、ストリーミング予測を進化グラフとして構成し、マルチモーダルトランスフォーマーが次の音声行為を予測することを可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:00:50 GMT)
RAPTOR: Real-Time High-Resolution UAV Video Prediction with Efficient Video Attention [15.3] RAPTORはリアルタイムで高解像度のパフォーマンスを実現するビデオ予測アーキテクチャである。
その中心となるイノベーションは、高解像度モデリングを分解する新しいトランスレータモジュールであるEfficient Video Attention (EVA)である。
RAPTORは、実際のUAVナビゲーションタスクにおけるミッション成功率を18%向上させる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:12:55 GMT)
A Lyapunov Framework for Quantum Algorithm Design in Combinatorial Optimization with Approximation Ratio Guarantees [15.3] 最適化問題に対する量子アルゴリズムの設計を目的としたフレームワークを開発する。
近似比の理論的な保証を提供する。
本手法をMax-Cut問題に適用し,適応型変分量子アルゴリズムとして実装する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:38:24 GMT)
Intelligent recognition of GPR road hidden defect images based on feature fusion and attention mechanism [14.9] 地中貫入レーダ(GPR)は,地下道路の欠陥を非破壊的に評価するための重要なツールである。
本稿では,これらの制約に対処するための包括的枠組みを紹介する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:29:58 GMT)
Co-Evolution of Types and Dependencies: Towards Repository-Level Type Inference for Python Code [14.8] Pythonの動的型付けメカニズムは、柔軟性を促進する一方で、実行時の型エラーの重要な原因となっている。
methodNameは、型と依存関係の共進化を通じてリポジトリレベルの型推論を実現する新しいアプローチである。
主なイノベーションは、(1)リポジトリレベルの型依存をキャプチャするために設計されたEDGモデル、(2)各イテレーションで型と依存関係が共進化する反復型推論アプローチ、(3)オンザフライでの推論の検証と修正を行う型チェッカー・イン・ザ・ループ戦略である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:15:06 GMT)
Missing Pattern Tree based Decision Grouping and Ensemble for Deep Incomplete Multi-View Clustering [14.7] そこで本研究では,新しいパターンベースIMVCフレームワークであるTreeEICを提案する。
利用可能なマルチビューペアの完全な活用を実現するため、TreeEICはまず、欠落パターンツリーモデルを定義した。
マルチビュー決定アンサンブルモジュールは、すべての決定集合からのクラスタリング結果を集約するために提案される。
アンサンブルから個別の知識蒸留モジュールは、アンサンブルの知識をビュー固有のクラスタリングモデルに転送する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:13:09 GMT)
Research on Dead Reckoning Algorithm for Self-Propelled Pipeline Robots in Three-Dimensional Complex Pipelines [14.7] 自己推進型パイプラインロボットは、外部のドラッグなしで複雑で湾曲したパイプラインの位置作業を完了させるように設計されている。
本稿では,拡張カルマンフィルタリング(EKF)に基づくパイプラインロボットの位置推定手法を提案する。
矩形ループパイプラインでロボットを用いて実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:33:02 GMT)
Design and Research of a Self-Propelled Pipeline Robot Based on Force Analysis and Dynamic Simulation [13.5] 本稿では,力解析と動的シミュレーションに基づく自己推進型パイプラインロボットの設計を提案する。
車輪付きの構成とモジュラーデザインを採用することで、ロボットは体の動き制御のコア要求を優先する。
このロボットは、様々な複雑なパイプラインシナリオを安定して横断する能力を示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:34:13 GMT)
GoldenFuzz: Generative Golden Reference Hardware Fuzzing [13.4] 既存のハードウェアファズナーは、セマンティック認識の制限、非効率なテスト改善、高い計算オーバーヘッドに悩まされている。
我々は、テストケースの改良をカバレッジと脆弱性探索から部分的に分離する、2段階のハードウェアファジリングフレームワークであるGoldenFuzzを紹介する。
GoldenFuzzは既知の脆弱性をすべて発見し、5つの新たな脆弱性を発見した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:16:55 GMT)
Analyzing the Mechanism of Attention Collapse in VGGT from a Dynamics Perspective [13.4] Visual Geometry Grounded Transformer (VGGT)は、最先端のフィードフォワード3D再構成を提供する。
グローバルな自己保持層は、入力シーケンスが数百フレームを超えると、劇的な崩壊現象に悩まされる。
我々は,グローバルアテンションを退化拡散過程と見なして,崩壊の厳密な数学的説明を確立する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:34:27 GMT)
MAction-SocialNav: Multi-Action Socially Compliant Navigation via Reasoning-enhanced Prompt Tuning [13.3] 社会に適応したナビゲーションでは、人間中心の環境でロボットが安全かつ適切に移動する必要がある。
既存のほとんどの手法は、単一の正しいアクションを仮定することでこの問題を単純化し、現実世界の社会的不確実性を扱う能力を制限する。
我々は,行動のあいまいさに明示的に対処する,社会的に適合したナビゲーションのための効率的な視覚言語モデルであるMaction-SocialNavを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:52:10 GMT)
Leash: Adaptive Length Penalty and Reward Shaping for Efficient Large Reasoning Model [12.9] LeashはLLMの効率的な推論のための強化学習フレームワークである。
Leashは、さまざまなタスクで平均推論の長さを60%削減します。
そこで本研究は, 制御可能かつ効率的なLCMを開発するための, 実用的で効果的なパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:16:26 GMT)
RLLaVA: An RL-central Framework for Language and Vision Assistants [12.5] マルコフ決定過程(MDP)を定式化した言語・視覚アシスタント(RLLaVA)のためのRL分散フレームワークを提案する。
RLLaVAはモデルアーキテクチャと分散実行からRLアルゴリズムロジックを分離し、研究者が最小限のコードで新しいRLアルゴリズムを実装するのをサポートする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:09:02 GMT)
Quantitative Verification of Omega-regular Properties in Probabilistic Programming [12.1] 時間論理と確率的プログラミングを一体化する新しいフレームワークである時間的時間的時間的時間的時間的推論を導入する。
本研究では,オメガレギュラー特性の確率の満足度に関する上限値と下限値の計算法を開発した。
提案手法をプロトタイプツールTPInferに実装し,ベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:26:29 GMT)
Dreamcrafter: Immersive Editing of 3D Radiance Fields Through Flexible, Generative Inputs and Outputs [11.9] 我々は、生成AIの進歩をリアルタイムな没入型3Dラジアンスフィールド編集に組み込む方法について検討する。
我々は,(1)生成型AIアルゴリズムを統合するモジュールアーキテクチャを提供する,(2)自然言語や直接操作を含むオブジェクト生成のためのさまざまなレベルの制御を統合する,(3)高遅延操作時のインタラクションをサポートするプロキシ表現を導入する,という3Dシーン編集システムを紹介した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:12:10 GMT)
A Unified Definition of Hallucination, Or: It's the World Model, Stupid [11.8] 幻覚は単に不正確な(内部的な)世界モデリングであると主張する。
我々は、幻覚を人工的だが完全に特定された世界モデルとのミスマッチとして定義する一連のベンチマークの計画を概説する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:42:18 GMT)
Near-Optimal Coalition Structures in Polynomial Time [11.6] 疎緩緩和は、福祉が適度に最適品質に近い連立構造を高い確率で回復させることを示す。
これにより、厳密な確率的分離が確立され、厳密な解法は究極的には最適であるにもかかわらず、緩やかな緩和が望まれる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:56:37 GMT)
Bayesian Recovery for Probabilistic Coalition Structures [11.6] 確率的結合構造生成(PCSG)はNPハードであり、$l_0$型スパースリカバリ問題として再キャストできる。
重なり合う連立関係が重なり合い、ほぼ重複する列を生成するPCSGにインスパイアされた体制において、その答えは否定的であることを示す。
ガウス・ガンマ階層を持つスパースベイズ学習が、同じ構造的仮定の下で一貫したサポートであることを証明する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:03:07 GMT)
Analysis of LLM Vulnerability to GPU Soft Errors: An Instruction-Level Fault Injection Study [11.6] 大規模言語モデル(LLM)は計算量とメモリ集約性が高い。
LLMのソフトエラーに対するレジリエンスは、以前のモデルと大きく異なる場合がある。
LLM推論における第1の命令レベル欠陥注入法について検討する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:59:54 GMT)
Scene-VLM: Multimodal Video Scene Segmentation via Vision-Language Models [10.3] 本稿では,ビデオシーンセグメンテーションのための視覚言語モデル(VLM)フレームワークであるScene-VLMを紹介する。
Scene-VLMは、フレーム、転写、オプションメタデータを含む視覚的およびテキスト的キューを共同で処理し、マルチモーダル推論を可能にする。
提案手法は,標準的なシーンセグメンテーションベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:31:36 GMT)
EraseLoRA: MLLM-Driven Foreground Exclusion and Background Subtype Aggregation for Dataset-Free Object Removal [10.0] 本稿では,注目手術を背景認識推論とテスト時間適応に置き換えるデータセットフリーフレームワークであるEraseLoRAを提案する。
第一に、バックグラウンド対応のフォアグラウンド・エクスクルージョン(BFE)は、マルチモーダルな言語モデルを使用して、ターゲットフォアグラウンド、非ターゲットフォアグラウンド、クリーンなバックグラウンドを、ペアの監督なしに単一のイメージマスクペアから分離する。
第2に、サブタイプアグリゲーション(BRSA)によるバックグラウンド認識リコンストラクションは、推論されたバックグラウンドサブタイプを相補的なピースとして扱うテストタイム最適化を実行する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:34:38 GMT)
The State of the SBOM Tool Ecosystems: A Comparative Analysis of SPDX and CycloneDX [9.8] Software Bill of Materials (SBOM)の採用は、ツールエコシステムに依存している。
SPDXとCycloneDXの2つの主要なフォーマットにより、エコシステムは成熟度、ツールサポート、コミュニティエンゲージメントに大きく異なる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:50:51 GMT)
S&P 500 Stock's Movement Prediction using CNN [9.8] 本稿では,S&P500指数による株価変動の予測について述べる。
画像分類の最もよく知られているツールであるCNNは、過去のデータ行列(読影画像)のベクトルとして擬似的に市場から取られた多次元ストック番号に使われている。
予測は、単一の株式、セクターワイド、または株式のポートフォリオとして、株式によって株式化することができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 23:10:07 GMT)
Total Normal Curvature Regularization and its Minimization for Surface and Image Smoothing [9.6] 複数の方向から正規曲率をペナライズすることで曲率正規化のための新しい定式化を導入する。
この全正規曲率正規化は、鋭いエッジと正確な等方性を持つ解を生成することができる。
時間依存偏微分方程式の定常解を求めるタスクとして再検討する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:02:39 GMT)
Incorporating rank-free coupling and external field via an amplitude-only modulated spatial photonic Ising machine [9.2] 空間フォトニックイジングマシン(SPIM)は、マルチノード最適化とスピンガラスシミュレーションにおいて優れている。
本稿では,200回/秒の振幅のみ変調された空間フォトニックイジングマシン(AR-SPIM)を実演する。
任意のイジング・ハミルトニアンをアダマール積の和として再定式化することにより、外部場を持つ 797-スピンイジングモデルを非コヒーレント光場に写像する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:11:48 GMT)
Security Boundaries of Quantum Key Reuse: A Quantitative Evaluation Method for QKD Key Rotation Interval and Security Benefits Combined with Block Ciphers [8.9] 量子鍵分配(QKD)技術は情報理論のセキュリティを提供するが、その限られた帯域幅は古典暗号と組み合わせる必要がある。
本研究では,QKD鍵とブロック暗号の両方の使用に着目し,鍵回転間隔の正確な計算モデルを構築する。
セキュリティレベルを高める上で鍵回転間隔の利点を定量化するため、単一のキーで安全に暗号化できるファイルの最大数を導出する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:13:02 GMT)
nncase: An End-to-End Compiler for Efficient LLM Deployment on Heterogeneous Storage Architectures [7.5] さまざまなターゲットに対して最適化を統合するために設計された、エンドツーエンドのコンパイルフレームワークであるnncaseを提示する。
nncaseは、異種コンピューティングユニットに適応するためのAuto Vectorize、並列戦略を検索するためのAuto Distribution、オンチップキャッシュのローカリティを最大化するAuto Scheduleの3つの重要なモジュールを統合している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:27:53 GMT)
Selective LLM-Guided Regularization for Enhancing Recommendation Models [7.4] トレーニング可能なゲーティング機構がユーザ履歴の長さやアイテムの人気,モデルの不確実性によってLCMの信頼性が予測される場合にのみ,LCMに基づくペアワイズランキング管理を活性化する,モデルに依存しない効率的なフレームワークを提案する。
複数のデータセットにまたがる実験により、この選択的戦略は全体的な精度を一貫して改善し、コールドスタートとロングテールレジームにおいてかなりの利益をもたらし、世界的な蒸留ベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:30:00 GMT)
FAR-AVIO: Fast and Robust Schur-Complement Based Acoustic-Visual-Inertial Fusion Odometry with Sensor Calibration [7.4] 水中ロボットに適した音響・視覚・慣性計測フレームワークであるFAR-AVIOについて述べる。
私たちの実装はhttps://far-vido.gitbook.io/far-vido-docs.comでオープンソースソフトウェアとしてリリースされました。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:36:05 GMT)
Causal-HM: Restoring Physical Generative Logic in Multimodal Anomaly Detection via Hierarchical Modulation [7.3] Causal-HMは、Process to Resultの依存性を明示的にモデル化する、統一されたマルチモーダルなUADフレームワークである。
このフレームワークには,低次元センサ信号をコンテキストとして利用し,高次元音声・視覚的特徴抽出を誘導するセンサガイドCHM変調機構が組み込まれている。
4つのモードで新たに構築したWeld-4Mベンチマークの実験では、Causal-HMが90.7%の最先端(SOTA)I-AUROCを達成した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:32:33 GMT)
Human-like Social Compliance in Large Language Models: Unifying Sycophancy and Conformity through Signal Competition Dynamics [7.2] 本研究では,15の大規模言語モデル間での行動相関を検証した統合フレームワークであるSignal Competition Mechanismを紹介する。
コンプライアンスへの遷移は線形境界によって支配される決定論的プロセスであることが示され、社会感情信号は情報信号を効果的に抑制する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:57:42 GMT)
RefineBridge: Generative Bridge Models Improve Financial Forecasting by Foundation Models [7.1] 金融時系列予測は、非定常性、重尾分布、高周波ノイズにより困難である。
低ランク適応(LoRA)は、トレーニング済みのTSFMを下流データドメインに適応させる一般的なパラメータ効率の手法となっている。
本稿では, トラクタブル・シュルディンガーブリッジ(SB)生成フレームワーク上に構築された改良モジュールRefineBridgeを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:28:16 GMT)
SALP-CG: Standard-Aligned LLM Pipeline for Classifying and Grading Large Volumes of Online Conversational Health Data [7.0] 本研究では,大規模言語モデルに基づく抽出パイプラインSALP-CGを用いて,オンライン会話型健康データにおけるプライバシリスクの分類と評価を行う。
我々は、GB/T 39725-2020に従って、健康データ分類と格付け規則を締結した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 01:52:46 GMT)
Bidirectional Human-AI Alignment in Education for Trustworthy Learning Environments [7.0] 人工知能(AI)は教育を変革し、学習をパーソナライズし、評価を高め、教育者を支援するという前例のない機会を提供している。
しかし、これらの機会は、株式、プライバシー、学生の自律性に関するリスクももたらします。
この章は、教育における双方向のヒューマンAIアライメントの概念を発展させ、信頼できる学習環境は、人的価値をAIシステムに埋め込むことだけでなく、これらの技術を解釈し、批判し、指導するスキルを持つ教師、学生、機関の装備から生まれることを強調している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:50:56 GMT)
Cluster Aggregated GAN (CAG): A Cluster-Based Hybrid Model for Appliance Pattern Generation [6.9] 本稿では,その挙動特性に基づいて,各家電を専用ブランチにルートするハイブリッド生成手法を提案する。
断続的なアプライアンスでは、クラスタリングモジュールが同様のアクティベーションパターンをグループ化し、各クラスタに専用のジェネレータを割り当てる。
連続アプライアンスはLSTMベースのジェネレータを使用して、段階的な時間的進化を捉える。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:55:13 GMT)
Structural Induced Exploration for Balanced and Scalable Multi-Robot Path Planning [6.8] マルチロボット経路計画は、その複雑さと、ロボット間の公平なタスク割り当てとグローバル効率のバランスをとる必要があるため、基本的な課題である。
従来のSwarmインテリジェンス手法は、小さなインスタンスでは有効だが、しばしば早めに収束し、複雑な環境にスケールするのに苦労する。
アリコロニー最適化(ACO)の探索プロセスに構造先行を組み込んだ構造誘発探索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:53:24 GMT)
Modified TSception for Analyzing Driver Drowsiness and Mental Workload from EEG [6.8] ドライバーの眠気は依然として交通事故の主な原因であり、リアルタイムで信頼性の高い検知システムの開発を必要としている。
本研究は,脳波を用いたドライバ疲労のロバスト評価を目的とした改良型TSceptionアーキテクチャを提案する。
アーキテクチャの一般化性は、STEWのメンタルワークロードデータセットで検証される。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:48:11 GMT)
A Three-Level Alignment Framework for Large-Scale 3D Retrieval and Controlled 4D Generation [6.5] 大規模オープンな3D検索と制御された4D生成のための統合フレームワークであるUni4Dを紹介する。
Uni4Dは3Dテキストのマルチヘッドアテンションと検索モデルを用いて、セマンティックアライメントの改善を通じてテキストから3D検索を最適化する。
このフレームワークは、正確なテキストから3D検索、画像アライメントへのマルチビュー3D、時間的に一貫した4Dアライメントを生成するための画像からテキストアライメントという3つのコンポーネントを通じて、クロスモーダルアライメントをさらに強化する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:27:24 GMT)
Approximation Capabilities of Feedforward Neural Networks with GELU Activations [6.5] 関数とその導関数を任意の所定の順序まで同時に保持する近似誤差を導出する。
境界は、多変量、指数関数、相互関数を含む基本函数に適用される。
ネットワークサイズ,重み度,動作を無限大で報告する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:56:44 GMT)
How Do Agents Perform Code Optimization? An Empirical Study [6.1] エージェントと人間による性能最適化のコミットを比較した最初の実証的研究を行った。
AIで認可されたパフォーマンスPRは、人間で認可されたPRよりも明示的なパフォーマンス検証を含まないことが分かりました。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 18:20:25 GMT)
Prior-AttUNet: Retinal OCT Fluid Segmentation Based on Normal Anatomical Priors and Attention Gating [6.0] 本研究は, 生成解剖学的先行を付加したセグメンテーションモデルである Pre-AttUNet を紹介する。
このフレームワークは、生成前の経路とセグメンテーションネットワークを統合するハイブリッドなデュアルパスアーキテクチャを採用している。
このモデルは計算コストが 0.37 TFLOPs で、セグメント精度と推論効率の効果的なバランスを保っている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:37:04 GMT)
SlideChain: Semantic Provenance for Lecture Understanding via Blockchain Registration [5.7] モデルファミリ、推論設定、計算環境間の不整合は、AI生成した教材の信頼性を損なう。
この研究は、大規模なマルチモーダルセマンティック抽出のための検証可能な整合性を提供するように設計されたブロックチェーン支援の実証フレームワークであるSlideChainを紹介している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:02:27 GMT)
Break Out the Silverware -- Semantic Understanding of Stored Household Items [5.4] Stored Household Item Challengeは、サービスロボットの認知能力を評価するためのベンチマークタスクである。
構造化シーン理解と大規模言語モデル推論を組み合わせたハイブリッドエージェントパイプラインであるNOAMを紹介する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:21:49 GMT)
Efficient Vision Mamba for MRI Super-Resolution via Hybrid Selective Scanning [5.2] 超解像MRIはスキャン後の解像度を高めることができるが、深層学習法はトレードオフに直面している。
本稿では,マルチヘッド選択状態空間モデルと軽量チャネルを組み合わせた新しいフレームワークを提案する。
モデルは例外的な効率で優れた性能を実現した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 22:41:51 GMT)
AstraNav-Memory: Contexts Compression for Long Memory [4.9] 生涯体現されたナビゲーションでは、エージェントはタスク全体にわたって空間的セマンティックな経験を蓄積し、保持し、活用する必要がある。
本稿では,視覚的文脈圧縮モジュールを用いた長期暗黙記憶を実現する画像中心メモリフレームワークを提案する。
提案手法は,最先端のナビゲーション性能を実現し,慣れ親しんだ環境の探索を改善し,慣れ親しんだ場所の経路を短縮する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:19:26 GMT)
Towards Responsible and Explainable AI Agents with Consensus-Driven Reasoning [4.2] 本稿では,多モデルコンセンサスと推論層ガバナンスに基づく実運用レベルのエージェントのためのResponsible(RAI)およびExplainable(XAI)AIエージェントアーキテクチャを提案する。
提案した設計では、異種LLMとVLMエージェントのコンソーシアムが独立して、共有入力コンテキストから候補出力を生成する。
専用の推論エージェントは、これらのアウトプットをまたいで構造化された統合を行い、安全と政策の制約を強制し、幻覚と偏見を緩和し、監査可能な証拠に基づく決定を生成する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:49:25 GMT)
MotionTeller: Multi-modal Integration of Wearable Time-Series with LLMs for Health and Behavioral Understanding [4.2] MotionTellerは、大規模言語モデル(LLM)と微小レベルのウェアラブルアクティビティデータを統合した生成フレームワークである。
我々は,実世界のNHANES記録から得られた554383対の新たなデータセットを構築し,言語トークンにのみ依存したクロスエントロピー損失を用いてモデルを訓練する。
MotionTellerは高いセマンティック忠実度(BERT-F1 = 0.924)と語彙精度(ROUGE-1 = 0.722)を実現し、ROUGE-1ではプロンプトベースのベースラインを7%上回っている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:37:07 GMT)
Asymmetric polaron picture for the quantum Rabi model [3.9] 非対称ポラロン画像(APP)における改良された変分法を提案する。
APPはメソッドの精度を向上するだけでなく、量子相転移(QPT)に関する基礎物理学も明らかにする。
我々の結果とメカニズムの解明により、より微妙なエネルギー競合や豊富な物理学が明らかとなり、この手法は光-物質相互作用に幅広い応用をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:09:58 GMT)
KG20C & KG20C-QA: Scholarly Knowledge Graph Benchmarks for Link Prediction and Question Answering [3.8] KG20CはMicrosoft Academic Graphから構築された高品質な学術知識グラフである。
KG20C-QAは、学術データに対するQAタスクをサポートするためにKG20C上に構築されている。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 22:29:54 GMT)
LLM-Free Image Captioning Evaluation in Reference-Flexible Settings [3.8] 参照ベースと参照フリーの両方の設定における画像キャプションの自動評価に焦点を当てた。
本稿では,イメージキャプションとキャプションキャプションキャプションの類似性の表現を学習する新しいメカニズムを提案する。
パール氏は、コンポジトリ、Flickr8K-Expert、Flickr8K-CF、Nebula、FOILデータセット上の既存のLCMフリーメトリクスを、参照ベースと参照フリーの両方で上回った。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:59:57 GMT)
Semantic Codebooks as Effective Priors for Neural Speech Compression [3.4] SemDACはセマンティック・アウェアなニューラル・オーディオであり、セマンティック・コードブックを音声圧縮の効果的な先行要素として活用する。
FiLM条件付きデコーダは、セマンティックトークンに条件付きオーディオを再構成し、音響コードブックの使用効率を向上させる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:49:41 GMT)
LLM-I2I: Boost Your Small Item2Item Recommendation Model with Large Language Model [3.0] アイテムツーアイテム(I2I)レコメンデーションモデルは、スケーラビリティ、リアルタイム機能、高いレコメンデーション品質のために、現実世界のシステムで広く利用されている。
1) より深いアーキテクチャを採用するが、計算コストとデプロイメントの複雑さを増大させるモデル中心のアプローチ、2) モデルを変更することなくトレーニングデータを洗練するデータ中心の手法。
LLM-I2Iは,Large Language Models(LLM)を利用したデータ品質問題を軽減するためのデータ中心フレームワークである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:22:56 GMT)
ChatGPT: Excellent Paper! Accept It. Editor: Imposter Found! Review Rejected [2.8] 大規模言語モデル(LLM)は、現在では科学論文の執筆やレビューに広く使われている。
この研究は、この増大する脅威の攻撃的側面と防御的側面の両方を探求する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 23:50:17 GMT)
FETAL-GAUGE: A Benchmark for Assessing Vision-Language Models in Fetal Ultrasound [2.8] 出生前超音波画像の需要は、訓練されたソノグラフィーの世界的な不足を増している。
深層学習は、ソノグラフィーの効率を高め、新しい実践者の訓練を支援する可能性がある。
We present Fetal-Gauge, the first and largest visual question answering benchmark designed to evaluate Vision-Language Models (VLMs)。
対象は,42,000枚以上の画像と93,000枚の質問応答対,解剖学的平面同定,解剖学的形態の視覚的グラウンドニング,胎児の配向評価,臨床像の適合性,臨床診断である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:54:37 GMT)
When Does Learning Renormalize? Sufficient Conditions for Power Law Spectral Dynamics [2.8] 実証的なパワー-法則のスケーリングは、現代のディープラーニングシステムで広く観測されている。
パワー則のスケーリングは、再正規化可能性のみに従わず、剛性の結果として現れることを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 19:43:48 GMT)
Spatiotemporal Tubes for Probabilistic Temporal Reach-Avoid-Stay Task in Uncertain Dynamic Environment [2.7] 時間変化の不確実な障害を考慮した実時間管合成法を開発した。
管内の系軌跡を閉じ込める閉形式近似自由制御法を導出する。
本手法は確率的回避と有限時間タスク完了の正式な保証を提供する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:06:35 GMT)
Compliance Rating Scheme: A Data Provenance Framework for Generative AI Datasets [2.7] 我々は、重要な透明性、説明責任、セキュリティ原則によるデータセットコンプライアンスを評価するために設計されたフレームワークである、コンプライアンスレーティングスキーム(CRS)を紹介します。
このフレームワークを実装するために,データプロファイランス技術を中心に構築された,オープンソースのPythonライブラリもリリースしています。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:13:46 GMT)
AnchorGK: Anchor-based Incremental and Stratified Graph Learning Framework for Inductive Spatio-Temporal Kriging [2.7] AnchorGKは,インダクティブ・テンポラル・クリグのための,アンカーベースのインクリメンタル・ストラテファイドグラフ学習フレームワークである。
AnchorGKは、最先端のベースラインを常に上回り、正確な時間下クリグを行う。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:27:09 GMT)
Training-Free Disentangled Text-Guided Image Editing via Sparse Latent Constraints [2.4] テキスト駆動の画像操作は、しばしば属性の絡み合いに悩まされる。
Predict, Prevent, and Evaluate frameworkは、事前訓練された視覚言語モデルを活用して、アンタングル編集に利用することでこの問題に対処する。
実験の結果、提案手法はより集中的で制御された編集を強制し、顔認証を維持しながら意図しない非ターゲット属性の変化を効果的に低減することを示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:38:10 GMT)
Self-Supervised Masked Autoencoders with Dense-Unet for Coronary Calcium Removal in limited CT Data [2.3] Computed Tomography Angiography (CTA) における冠動脈石灰化現象
ボリューム医療データのための新しい自己教師型学習フレームワークである textbfDense-MAE を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:36:37 GMT)
AVP-Fusion: Adaptive Multi-Modal Fusion and Contrastive Learning for Two-Stage Antiviral Peptide Identification [2.2] AVP-Fusionは、適応的な特徴融合と対照的な学習を統合した、新しい2段階のディープラーニングフレームワークである。
精度は 0.9531 であり、MCC は 0.9064 であり、最先端の手法を著しく上回っている。
移行学習を利用する第2段階では、このモデルは6つのウイルスファミリーと8つの特定のウイルスの正確なサブクラス予測を可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:29:39 GMT)
Machine Learning Power Side-Channel Attack on SNOW-V [1.6] 本稿では,SNOW-V暗号アルゴリズムに対する電力解析に基づくサイドチャネル解析(SCA)攻撃について述べる。
その結果、SNOW-Vの機械学習ベースのSCAに対する脆弱性と堅牢な対策の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 16:55:00 GMT)
Dynamics of Socio-Institutional Asynchrony in Generative AI: Analyzing the Relative Importance of Intervention Timing vs. Enforcement Efficiency via the Socio-Institutional Asynchrony Model (SIAM) [1.6] 生成AIの超指数的成長は、技術拡散のペースと制度適応の速度との間の制度的ミスマッチを強化する。
本研究では、介入タイミングと実施効率の2つの政策レバーの相対的効果を定量的に評価するために、社会制度非同期モデル(SIAM)を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:04:15 GMT)
Robustness and Scalability Of Machine Learning for Imbalanced Clinical Data in Emergency and Critical Care [1.4] 我々は、MIMIC-IV-EDとeICUの不均衡データに基づいて、古典的機械学習モデルの堅牢性とスケーラビリティを評価する。
我々は,ツリーベース手法,最先端のTabNetディープラーニングモデル,カスタム軽量残差ネットワークの性能を比較した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:49:48 GMT)
Coherence in the brain unfolds across separable temporal regimes [1.4] 言語におけるコヒーレンスには、脳が競合する2つの時間的要求を満たす必要がある。
我々は、コヒーレンスを、文脈統合の遅い解離可能なニューラルレシエーションと、イベント駆動の迅速な再構成によって実現していることを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:05:25 GMT)
Toward Intelligent Scene Augmentation for Context-Aware Object Placement and Sponsor-Logo Integration [1.3] 広告とデジタルメディアのための2つの新しいタスクを紹介した。(1)適切な対象カテゴリを予測し、生成し、シーン内に適度に配置すること、(2)商品を検知し、正しいブランドロゴを挿入することを含むEmphsponsor-product logo augmentation。
これらのタスクをサポートするために、カテゴリアノテーション、配置領域、スポンサー製品ラベルを備えた2つの新しいデータセットを構築します。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:12:27 GMT)
A Novel Robotic Variable Stiffness Mechanism Based on Helically Wound Structured Electrostatic Layer Jamming [1.2] 本稿では,HWS-ELJ(Helically Wound Structured Electrostatic Layer Jamming)と呼ばれる新しい可変剛性機構を提案する。
提案法は静電気アトラクションを用いて層間摩擦を増強し, 相対的すべりを抑制し, 調整可能な剛性を実現する。
HWS-ELJを統合したロボットフィンガー試作機を開発し, 電圧駆動型剛性変調を実証し, 提案した可変剛性機構の有効性を確認した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:05:27 GMT)
Mechanical Strength Prediction of Steel-Polypropylene Fiber-based High-Performance Concrete Using Hybrid Machine Learning Algorithms [1.2] 本研究は, 鋼-ポリプロピレン繊維強化高性能コンクリートの機械的特性を予測するための機械学習モデルを開発し, 評価する。
対象は圧縮強度(CS)、曲げ強度(FS)、引張強度(TS)である。
ET-XGBモデルは、CSで0.994、FSで0.944、TSで0.978のR2値をテストし、全体的な精度が最も高かった。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:47:43 GMT)
From Expectation To Experience: A Before And After Survey Of Public Opinion On Autonomous Cars In Saudi Arabia [1.1] 自律走行車(AV)は、輸送における革新的な革新として現れ、安全、持続可能性、効率の潜在的な利益を提供する。
サウジアラビアのAVの採用はビジョン2030と一致しており、リヤド自治地下鉄や自動運転車といったイニシアチブを通じてスマートモビリティを強調している。
本研究では、これらの技術に曝露前後のサウジアラビア市民のAVに対する認識を調査し、年齢、性別、教育水準、運転習慣が受容に影響を及ぼすかどうかを検討する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:39:56 GMT)
A Data-Driven Multi-Objective Approach for Predicting Mechanical Performance, Flowability, and Porosity in Ultra-High-Performance Concrete (UHPC) [1.1] テストされた21の機械学習アルゴリズムのうち、5つのハイパフォーマンスモデルが選択され、XGBoostが最も正確である。
最初のXGBoostモデルは生のデータを使用して構築され、最終モデルとして選択されるとデータセットがクリーンになる。
次に、モデル2としての洗練されたデータセットを使用して、XGBoostを再トレーニングし、すべての出力に対して高い予測精度を達成する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 10:15:57 GMT)
Statistical vs. Deep Learning Models for Estimating Substance Overdose Excess Mortality in the US [1.0] パンデミック前のパターンに基づいて、予想以上の死亡率で定義された過剰死亡を推定することは、パンデミックの影響を理解し、介入戦略を伝えるのに不可欠である。
本稿では,3つのディープラーニングアーキテクチャ (LSTM, Seq2Seq, Transformer) に対するSARIMAの系統的比較を行った。
以上の結果から, 慎重に検証したDLモデルは, 従来の公衆衛生計画手法よりも信頼性の高い反事実推定が可能であることが判明した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:49:59 GMT)
Vox Deorum: A Hybrid LLM Architecture for 4X / Grand Strategy Game AI -- Lessons from Civilization V [0.8] 大きな言語モデルが自然言語で推論できる能力は、4Xとグランドストラテジーゲームに一意に期待できる。
本稿では,マクロストラテジック推論を処理し,戦術的実行をサブシステムに委譲するハイブリッドLLM+XアーキテクチャであるVox Deorumを紹介する。
我々は,Vox Populiの強化AIに対する簡単なプロンプトと2つのオープンソースLLMを比較し,2,327の完全ゲームによるアプローチを検証する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 18:41:26 GMT)
MuS-Polar3D: A Benchmark Dataset for Computational Polarimetric 3D Imaging under Multi-Scattering Conditions [0.8] 偏光をベースとした水中3D画像は、背景散乱を抑制するために偏光の手がかりを利用しており、濁った水には明確な利点がある。
MuS-Polar3Dは、水中偏光に基づく定量的な3Dイメージングのための、初めて公開されたベンチマークデータセットである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:32:39 GMT)
A review of NMF, PLSA, LBA, EMA, and LCA with a focus on the identifiability issue [0.8] 本稿では、LBA(Latent budget analysis)、LCA(Latent class analysis)、EMA(End-member analysis)、PLSA(probabilistic latent semantic analysis)、Non negative matrix factorization(NMF)の5つの人気モデルの類似性を明らかにする。
LBA, EMA, LCA, PLSA の解が一意であることと NMF の解が一意であることを証明する。
本稿では,社会科学の時間予算データセットを用いたモデルについて解説し,アーキティパル分析などの密接に関連するモデルについて論じる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:41:32 GMT)
Enhancing Distributed Authorization With Lagrange Interpolation And Attribute-Based Encryption [0.8] 今日のセキュリティの状況では、すべてのユーザが、大量のデータを機密性と承認でアクセスしたいと願っている。
セキュアなデータにアクセスするために、研究者はアクセス制御リストを使用して認証を許可し、認可を提供する。
これら2つの問題に対処するため,サーバ上でのマルチパーティ実行を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:26:14 GMT)
Exploration of Reproducible Generated Image Detection [0.8] 本稿では,AIGC検出,軽量なテストデータセットの構築,代表検出手法の再現に関する7つの重要な論文を再検討する。
フィールドにおけるジレンマの根本原因を同定する。
ほとんどのdetec tion法は、AIGC画像の普遍的な固有の特徴を学ぶのではなく、特定のジェネレータの排他的特徴に適合する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:16:41 GMT)
An approach to Fisher-Rao metric for infinite dimensional non-parametric information geometry [0.6] 無限次元であることから、非パラメトリックな情報幾何学は長い間「難易度障壁」に直面してきた。
本稿では,タンジェント空間の直交分解による難易度解決のための新しい枠組みを提案する。
情報キャプチャ比を定義することにより,高次元データの内在次元を推定する厳密な手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 00:18:41 GMT)
Residual Prior Diffusion: A Probabilistic Framework Integrating Coarse Latent Priors with Diffusion Models [0.6] Residual Prior Diffusion (RPD) は、粗い事前モデルをまずデータ分散の大規模構造をキャプチャする2段階のフレームワークである。
RPDは、分布の大規模構造を維持しながら、精密な詳細を正確にキャプチャする。
自然画像生成タスクにおいて、RDDは、代表拡散ベースラインと一致または一致した生成品質を達成した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 09:19:10 GMT)
Waveguide-array-based multiplexed photonic interface for atom array [0.5] 多重原子-光子エンタングルメントを持つ中性原子配列は、その実現に有望なプラットフォームである。
ガラスベースのフォトニック集積回路上に作製された単一モード導波路アレイに、原子配列から光子を誘導する鍵多重フォトニックインタフェースを実証する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:49:49 GMT)
Code Clone Refactoring in C# with Lambda Expressions [0.5] 抽出方法(Extract Method)は、コードクローンを統合する手法である。
ラムダ式は振る舞いのパラメータ化に使用することができるが、各プログラミング言語の仕様は、このテクニックの適用性に大きな影響を及ぼす。
本研究では,コードクローンの解析に式を用いるC#固有の手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:14:49 GMT)
World-Coordinate Human Motion Retargeting via SAM 3D Body [0.4] 本稿では,SAM 3D Bodyを凍結した知覚バックボーンとして活用するフレームワークを提案する。
再建された動きを、キネマティクスを意識した2段逆キネマティクスパイプラインを用いて、ユニツリーG1ヒューマノイドに再ターゲティングする。
その結果,本手法は安定な世界軌道と信頼性のあるロボット表現を有することが明らかとなった。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:30:04 GMT)
When the Base Station Flies: Rethinking Security for UAV-Based 6G Networks [0.3] 6Gネットワークは、特に未保存地域や災害発生地域において、シームレスなグローバルカバレッジを達成するために不可欠である。
プラットフォームの中では、無人航空機(UAV)はその迅速な展開性のために特に有望である。
本稿では、UAV-BSシステムの攻撃面を特定し、その脅威を軽減するための原則を概説する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:37:09 GMT)
Zero-Shot to Zero-Lies: Detecting Bengali Deepfake Audio through Transfer Learning [0.2] バングラフェイクデータセットを用いたベンガル語のディープフェイクの自動検出について検討した。
我々は,いくつかの事前学習モデルを用いてゼロショット推論を評価する。その中には,WAv2Vec2-XLSR-53,Whisper,PANNsCNN14,WAvLM,Audio Spectrogram Transformerなどがある。
次に、ベンガルのディープフェイク検出に複数のアーキテクチャを組み込む。その中には、Wav2Vec2-Base、LCNN、LCNN-Attention、ResNet18、ViT-B16、CNN-BiLSTMが含まれる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:53:40 GMT)
FUSE: Unifying Spectral and Semantic Cues for Robust AI-Generated Image Detection [0.2] FUSEは、Fast Fourier Transformから抽出されたスペクトル特徴とCLIPのビジョンエンコーダから得られたセマンティック特徴を組み合わせたハイブリッドシステムである。
GenImageデータセットの平均精度は91.36%、テストされたすべてのジェネレータの平均精度は88.71%、平均精度は94.96%である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:38:39 GMT)
Detecting AI-Generated Paraphrases in Bengali: A Comparative Study of Zero-Shot and Fine-Tuned Transformers [0.2] 大型言語モデル(LLM)は、人間の文章によく似たテキストを生成することができる。
この機能は、偽情報やコンテンツ操作など、誤用に関する懸念を引き起こす。
既存の研究は複数の言語における検出に対処してきたが、ベンガル語はほとんど探索されていない。
本研究では,XLMRoBERTa-Large,mDeBERTaV3-Base,BanglaBERT-Base,IndicBERT-Base,MultilingualBERT-Baseの5つの変圧器モデルについて検討した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:04:29 GMT)
BeHGAN: Bengali Handwritten Word Generation from Plain Text Using Generative Adversarial Networks [0.2] 我々はベンガル人手書きサンプルの自己収集データセットを開発し,使用する。
データセットには、年齢や性別の異なる約500人の個人からのコントリビューションが含まれている。
提案手法は,入力プレーンテキストから多種多様な手書き出力を生成する能力を示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:38:12 GMT)
Verifiable Passkey: The Decentralized Authentication Standard [0.2] FIDO2 Passkeysは、パスワードレス認証の最も広く採用されている標準の一つである。
本稿では,プライバシやユーザトラッキングを危険にさらすことなく,任意のプラットフォームにまたがる検証クレデンシャル発行者向けに作成したPasskeyを使用可能にする,新たな標準「検証パスキー」を提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:06:52 GMT)
External Hippocampus: Topological Cognitive Maps for Guiding Large Language Model Reasoning [0.1] 本稿では,認知力学の観点から言語モデル推論をモデル化するための外的ヒッポカンポスフレームワークを提案する。
トポロジカル認知マップは次元減少プロジェクションを通じて構築され、テスト時の正確な航法とエネルギーフローの介入を可能にする。
このフレームワークは、追加のトレーニングを必要とせず、自律的な成長能力を持ち、小さなモデル推論のための効率的かつ制御可能なトポロジ対応ソリューションを提供する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:23:25 GMT)
When Algorithms Manage Humans: A Double Machine Learning Approach to Estimating Nonlinear Effects of Algorithmic Control on Gig Worker Performance and Wellbeing [0.0] 我々は、制限のある機能形式を課すことなく、中間調停モデルを推定するために、Double Machine Learningフレームワークを使用します。
464ギグワーカーによる調査データから, 明確な非モノトニックパターンが得られた。
結果は、なぜ単純な線形仕様がパターンを見逃し、時には反対の結論を示唆するのかを示している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:45:15 GMT)
Variance-Aware Prior-Based Tree Policies for Monte Carlo Tree Search [0.0] モンテカルロ木探索(MCTS)は強化学習(RL)に大きな影響を与えた
Inverse-RPO は,任意の UCB から事前ベース UCT を体系的に導出する一般的な手法である。
実験により、これらの分散に注意した事前ベースUCTは、追加の計算コストを発生させることなく、PUCTを複数のベンチマークで上回ることを示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:25:26 GMT)
Valori: A Deterministic Memory Substrate for AI Systems [0.0] Valoriは、浮動小数点メモリ操作を固定点演算に置き換える決定論的AIメモリ基板である。
バロリがメモリ境界における決定性をどのように強制するかを示す。
以上の結果から,決定論的記憶は信頼に値するAIシステムに必要なプリミティブであることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 06:04:04 GMT)
VAMP-Net: An Interpretable Multi-Path Framework of Genomic Permutation-Invariant Set Attention and Quality-Aware 1D-CNN for MTB Drug Resistance [0.0] 本稿では,解釈可能な可変型マルチパスネットワーク(VAMP-Net)を提案する。
Path-1は、ゲノム座間のエピスタティック相互作用を捉えるために、Set Attention Transformer Processing permutation-invariant variant setを使用する。
Path-2は1D Confabal Networkを使用し、Variant Call Formatの品質指標を分析して信頼性スコアを学習する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:28:54 GMT)
Trade-off relation between integrated metrological gain and local dissipation in magnetic-field sensing by quantum spin ensemble [0.0] 本研究では, スピンアンサンブルを用いた強磁場センサの性能評価を行った。
種々の初期状態の準備を解析し, 散逸の存在下での量子エンタングルメントの役割を明らかにする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:02:20 GMT)
Towards representation agnostic probabilistic programming [0.0] 本稿では,5つの基本演算を基本表現によらず,因子を操作するための普遍的なインタフェースとして機能する因子抽象化を導入する。
これにより、表現に依存しない確率的プログラミングが可能になり、ユーザーは自由に異なる表現を混ぜることができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:51:58 GMT)
The Deepfake Detective: Interpreting Neural Forensics Through Sparse Features and Manifolds [0.0] 本稿では,視覚言語モデルに適用したディープフェイク検出のための機械的解釈可能性フレームワークを提案する。
提案手法は、内部ネットワーク表現のスパースオートエンコーダ解析と、新しい法科学多様体解析を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:27:56 GMT)
Synthetic Financial Data Generation for Enhanced Financial Modelling [0.0] 本稿では,合成財務データのための統合型マルチ基準評価フレームワークを提案する。
過去のSとP500の日次データを用いて、下流タスクにおける忠実度(最大平均離散性、MD)、時間構造(自己相関とボラティリティクラスタリング)、実用性を評価する。
アプリケーションのニーズや計算制約に応じて生成モデルを選択するための実践的ガイドラインを明確に述べる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:43:16 GMT)
Spectroscopic Search for Topological Protection in Open Quantum Hardware: The Dissipative Mixed Hodge Module Approach [0.0] 標準プロトコルは、孤立して指数関数的に崩壊する固有モードの重ね合わせとして、オープン量子系の力学をモデル化する。
textitDissipative Mixed Hodge Modules (DMHM) に基づく幾何学的枠組みを導入することで、この曖昧さを解決する。
我々は、WFSが散逸性X線として作用し、分子分極における散逸性漏れを定量化し、非エルミチアンアハロノフ-ボーム環における位相的孤立を証明していることを示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:06:42 GMT)
Smart IoT-Based Leak Forecasting and Detection for Energy-Efficient Liquid Cooling in AI Data Centers [0.0] 本稿では,LSTMニューラルネットワークを併用した概念実証型スマートIoTモニタリングシステムを提案する。
典型的な47ラックの施設では、このアプローチはおよそ1,500年のエネルギー無駄を防ぐことができる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 22:51:16 GMT)
ShrimpXNet: A Transfer Learning Framework for Shrimp Disease Classification with Augmented Regularization, Adversarial Training, and Explainable AI [0.0] エビ農業は多くの地域で重要な収入源となっている。
これらの病気は、持続的なエビ生産にとって大きな課題となる。
本研究は,エビ病の自動分類のための深層学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:30:38 GMT)
Raster Domain Text Steganography: A Unified Framework for Multimodal Secure Embedding [0.0] この研究は、テキスト、画像、オーディオ、ビデオなどの異種データをグリフのピクセル空間に直接埋め込むことができる統一されたドメイン・ステガノグラフィー・フレームワークを導入している。
言語的・構造的テキストベースステガノグラフィーとは異なり、本手法はフォント描画後にのみ動作する。
各グリフは、最小摂動インキ画素の濃度によってペイロード値が表現される秘密符号化ユニットとして機能する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:48:09 GMT)
Quantum Nondecimated Wavelet Transform: Theory, Circuits, and Applications [0.0] 非決定的あるいは翻訳不変なウェーブレット変換(NDWT)は、古典的なマルチスケール信号解析において中心となるツールである。
本稿では,これらの古典的性質を量子計算に連続的に組み込むNDWTの2つの相補的な量子定式化を開発する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 02:42:37 GMT)
Quantum Mean-Fields Spin Systems in a Random External Field [0.0] 量子平均場ハミルトニアンをランダムな外部場の影響下で考える。
我々は,非可換な大規模偏差解析として見ることのできる新しい戦略を導入する。
提案手法は,多種ハミルトニアンのような平均場モデルの他のクラスに使用するのに十分な一般性を有する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:23:01 GMT)
Quantization of Physical Interaction Strengths via Singular Moduli [0.0] 本稿では,結合強度の測定をアナログ推定からトポロジカルカウント問題に変換するプロトコルであるInteraction Metrologyを紹介する。
我々は、系の相互作用のモジュライが離散的な量子化値を取るように位相的に強制されることを証明し、「幾何$k$-Comb」を形成する。
この発見は、力センシングと量子論理ゲートの普遍的な標準を確立し、トポロジカル確実性による相互作用強度の校正を可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:54:48 GMT)
Properties of a Three-Level $Λ$-Type Atom Driven by Coherent and Stochastic Fields [0.0] 強コヒーレントレーザーにより駆動される3レベル$$-type原子の理論的検討を行った。
ドライブは単なるデコヒーレンスではなく,汎用的な制御パラメータであることを示す。
結果は、量子制御、量子技術、分光法、および原子系のノイズアシスト操作における応用を示唆している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:12:07 GMT)
Phase-space description of photon emission [0.0] Wigner関数を介して位相空間における光子の放出を記述する一般的な方法を提案する。
チェレンコフ放射に対するいくつかの効果は予測され、古典的領域や運動量空間の量子論にはない。
我々のアプローチは、他の種類の放射線に容易に一般化でき、散乱、崩壊、消滅過程にまで拡張できる。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:59:11 GMT)
On Fibonacci Ensembles: An Alternative Approach to Ensemble Learning Inspired by the Timeless Architecture of the Golden Ratio [0.0] EmphFibonacci Ensemblesは、数学的に原理化されたが哲学的に着想を得たアンサンブル学習フレームワークである。
フィボナッチのアンサンブルは、より広範なアンサンブル学習の理論の中で自然で解釈可能な設計点を形成する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:05:47 GMT)
Learning to Sense for Driving: Joint Optics-Sensor-Model Co-Design for Semantic Segmentation [0.0] 従来の自律走行パイプラインは、下流の認識からカメラ設計を分離する。
本稿では,光学,センサモデリング,軽量セマンティックセグメンテーションネットワークを統合したタスク駆動型協調設計フレームワークを提案する。
提案システムは,現実的な携帯電話スケールレンズモデル,学習可能なカラーフィルタアレイ,ポアソン・ガウス雑音処理,量子化処理を統合している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:26:31 GMT)
Learning from Negative Examples: Why Warning-Framed Training Data Teaches What It Warns Against [0.0] ここで報告された実験では、このような警告に晒されたモデルは、直接与えられたモデルと統計的に区別できない速度でフラグ付きコンテンツを再現した。
私が「ステルス・スリップ(stealth slip)」と呼ぶ関連する現象は、会話のプリアンブルがアクティベーションを線形プローブが完全に見逃す部分空間に回転させることを可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:07:57 GMT)
Investigation of quantum chaos in local and non-local Ising models [0.0] 横方向および縦方向の磁場を受けるイジングスピン鎖内の量子カオスについて検討する。
非局所的な相互作用を持つ系は、非局所的な結合が弱い場合でも、カオスに対する強い正当性を示す。
本研究は,カオスの開始と量子スピン鎖の動的複雑さの修飾における非局所相互作用の役割を明らかにするものである。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 15:25:01 GMT)
Insufficiency of Pure-State Ensembles in Characterizing Transformations of Entangled States under LOCC [0.0] 局所的な操作と古典的通信(LOCC)の下での純粋な絡み合った状態の変換条件はよく理解されている。
LOCCの下での混合絡み合い状態の変換条件は、それらの純状態アンサンブルの性質に基づいて決定できるだろうか?
調査の結果は以下のいくつかのオープンな疑問に対処した。
不等式 (sum_j p_j) geq sum_l q_l E(_l) は (p_j, ketvarphi_j) から () へのLOCC変換の存在を保証するには不十分である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:15:27 GMT)
Hybrid Quantum-Classical Mixture of Experts: Unlocking Topological Advantage via Interference-Based Routing [0.0] 本稿では,QML(Hybrid Quantum-Classical Mixture of Experts)アーキテクチャを用いて,制約に対処する量子機械学習(QML)の可能性を検討する。
量子ゲーティングネットワーク(アングル)と古典的専門家を組み合わせたアブレーション研究を行い、量子優位の源泉を分離する。
2つの月のデータセットのような非線形分離可能なデータに関する実験結果は、量子ルーターが大きなトポロジカル・アドバンテージを達成していることを示している。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:15:34 GMT)
Hybrid Quantum Repeater Chains with Atom-based Quantum Processing Units and Quantum Memory Multiplexers [0.0] 本稿では、原子ベースの量子処理ユニット、自発パラメトリックダウンコンバージョン光子源、原子周波数コム量子メモリを統合したハイブリッド量子リピータの設計を提案する。
線形リレーダチェーンモデルにおけるエンドツーエンド秘密鍵レートに対するハイブリッド設計の利点を実証する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 12:53:46 GMT)
Horizon Reduction as Information Loss in Offline Reinforcement Learning [0.0] 地平線低減は、オフラインの強化学習において、基本的かつ発見不可能な情報損失を引き起こす可能性があることを示す。
固定長軌道セグメントからの学習として地平線低減を定式化し、このパラダイムの下では、最適政策が準最適政策と統計的に区別できないことを証明する。
本研究は,地平線低減を安全に行うために必要な条件を確立し,アルゴリズムの改良だけでは克服できない本質的な限界を強調した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 07:41:48 GMT)
Hierarchical Stacking Optimization Using Dirichlet's Process (SoDip): Towards Accelerated Design for Graft Polymerization [0.0] 放射線による移植は、イオン交換膜、CO2分離膜、電池電解質のポリマーフィルムの正確な機能化を可能にする。
本稿では、DirichletのProcess(SoDip)階層型データ駆動フレームワークを用いた階層的スタック最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:36:26 GMT)
GaDE -- GPU-acceleration of time-dependent Dirac Equation for exascale [0.0] GaDEは相対論的状態における電磁場によって誘起される原子の電子動力学をシミュレートするように設計されている。
AMD MI250X GPU と Hewlett-Packard の Slingshot 相互接続を用いた LUMI による GaDE の評価を行った。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 14:47:36 GMT)
Fixed-Threshold Evaluation of a Hybrid CNN-ViT for AI-Generated Image Detection Across Photos and Art [0.0] クリーンな検証データに基づいて選択された決定しきい値を保持する固定閾値評価を導入し、すべての後処理変換に固定する。
AiDataアート/グラフィックでは91.4%の精度、AiDataアート/グラフィックでは89.7%の精度、CIFAKEでは98.3%(競争力)である。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:19:09 GMT)
Fixed-Budget Parameter-Efficient Training with Frozen Encoders Improves Multimodal Chest X-Ray Classification [0.0] マルチモーダル胸部X線分析は、しばしば計算コストのかかる大きな視覚言語モデルを微調整する。
我々は,インディアナ大学チェストX線データセットのマルチラベル分類のための冷凍エンコーダ,BitFit,LoRA,アダプタなど,パラメータ効率のよいトレーニング戦略について検討した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:02:19 GMT)
Effective Gauge Fields and Topological Band Structures in Pilot-Wave Hydrodynamics [0.0] パイロット波動力学は、バンド構造物理学を実現するためのマクロなプラットフォームを提供することを示す。
水中の正方格子は、ブロッホ帯域が支配する周波数依存性の伝送を生成する。
ハニカム格子は液滴をドメイン壁に閉じ込め、バレー・ハルの縁状態の流体力学的類似性を明らかにする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 02:41:36 GMT)
Dynamic Cooperative Strategies in Search Engine Advertising Market: With and Without Retail Competition [0.0] 本研究は,2つの協力型広告決定シナリオをモデル化することにより,SEAコンテキストにおける協調型広告管理ガイドラインの提供を試みる。
本稿では,SEAキャンペーンを通じて直接かつ間接的に商品を広告することができる新しい協調型広告最適化モデルを提案する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 04:21:53 GMT)
Diffusion Posterior Sampling for Super-Resolution under Gaussian Measurement Noise [0.0] 単一画像超解像(SISR)のための拡散後サンプリング(DPS)に関する研究
我々は,非条件拡散と勾配に基づく条件付けを併用した,確率誘導型サンプリング手法を実装した。
誘導尺度と雑音レベルによる後部サンプリング(PS)条件の評価を行った。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 22:22:53 GMT)
Democratizing Drug Discovery with an Orchestrated, Knowledge-Driven Multi-Agent Team for User-Guided Therapeutic Design [0.0] OrchestRAは、生物学、化学、薬理学を統一するマルチエージェントプラットフォームである。
静的コードジェネレータとは異なり、エージェントは積極的にシミュレーションを実行し、結果を反復的に最適化する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 11:03:04 GMT)
Decoherence challenges in Nanoscience: A Quantum Phase Space perspective [0.0] この研究は、環境選択ポインタ状態の特徴付けという2つの課題に対処するために、量子位相空間(QPS)に基づく新しい理論フレームワークを導入する。
粒子運動のポインタ状態は、量子不確実性関係を飽和させる最小不確かさ状態として識別される。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 21:41:33 GMT)
Context Discipline and Performance Correlation: Analyzing LLM Performance and Quality Degradation Under Varying Context Lengths [0.0] 大規模言語モデル(LLM)は、複雑な長文の推論と文書解析を容易にするために、最大コンテキストウィンドウの増大を優先している。
この拡張されたコンテキストの管理は、厳しい計算オーバーヘッドをもたらす。
本稿では,高密度変圧器アーキテクチャが無関係かつ気を散らす状況に晒される場合,システム性能とモデル品質の重大なトレードオフについて検討する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:37:57 GMT)
Comparative Analysis of Deep Learning Models for Perception in Autonomous Vehicles [0.0] 検出ベース認識タスクにおいて,YOLO-NASやYOLOv8などのDLモデルの性能を比較した。
分析の結果, YOLO-NASモデルと比較すると, YOLOv8sモデルはトレーニング時間の75%を節約できることがわかった。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 13:33:23 GMT)
Can We Trust AI Explanations? Evidence of Systematic Underreporting in Chain-of-Thought Reasoning [0.0] AIシステムが推論をステップバイステップで説明するとき、実践者はこれらの説明がAIの回答に実際に影響を与えたものを明らかにしていると仮定する。
私たちはこの仮定を、ヒントを質問に埋め込んで、モデルが言及したかどうかを測定することでテストしました。
モデルはほとんど自然にヒントに言及しないが、直接尋ねると、彼らはそれらに気付くことを認めている。
モデルにヒントを報告するよう強制するが、それが存在しない場合でもヒントを報告させ、精度を低下させる。
また、ユーザーの好みに訴えるヒントは特に危険であることがわかりました。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 05:29:53 GMT)
BertsWin: Resolving Topological Sparsity in 3D Masked Autoencoders via Component-Balanced Structural Optimization [0.0] BertsWinは、Swin Transformerウィンドウを使ったBERTスタイルのトークンマスキングを組み合わせたハイブリッドアーキテクチャである。
我々は、BertsWinが通常のViT-MAEベースラインに比べて5.8倍のセマンティック収束を本質的に加速することを示した。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 19:32:40 GMT)
Assessing the Effectiveness of Membership Inference on Generative Music [0.0] 本研究は,人気・影響力のある生成音楽モデルであるMuseGANに対するいくつかの既存攻撃の効果について考察する。
生成音声MIAに関する以前の研究と同様に、音楽データには既知のメンバーシップ推論技術にかなり耐性があることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 18:54:16 GMT)
Applications of synthetic financial data in portfolio and risk modeling [0.0] 本稿では、ポートフォリオ構築、トレーディング分析、リスクモデリングをサポートする合成リターンシリーズ作成のための生成モデルの利用について検討する。
TimeGANは、分布形状、ボラティリティパターン、および実際のリターンで観測されたものに近い自己相関挙動を持つ合成データを生成する。
この分析は、ポートフォリオ分析とリスクシミュレーションにおいて、実際の財務データの代用として合成データセットの使用をサポートする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 22:28:32 GMT)
A-QCF-Net: An Adaptive Quaternion Cross-Fusion Network for Multimodal Liver Tumor Segmentation from Unpaired Datasets [0.0] 本稿では,A-QCF-Net(Adaptive Quaternion Cross-Fusion Network)を提案する。
我々は,未実装のLiTS (CT) と ATLAS (MRI) データセットの1つのモデルを共同でトレーニングすることで,この枠組みを検証する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 18:42:21 GMT)
A Model of Causal Explanation on Neural Networks for Tabular Data [0.0] 本稿では, 因果的説明法であるCENNETと, エントロピーを用いた新たな説明力指標を提案する。
CENNETは、NNによる予測の因果的説明を提供し、構造因果モデル(SCM)とNNを効果的に組み合わせている。
我々は、CEN-NETが、分類タスクにおける合成データと準実データの両方に関する既存の手法との比較実験を通じて、そのような説明を提供することを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 17:47:57 GMT)
A Lindblad-Pauli Framework for Coarse-Grained Chaotic Binary-State Dynamics [0.0] 我々は、駆動ダッフィング発振器の粗粒度左/右の統計情報を2時間2$密度行列表現に埋め込む2状態フレームワークを開発した。
対角状態の場合、GKSL力学は古典的な二状態方程式に還元される。
我々は閉形式解、明示的なクラウス表現、時間的一階マルコフ仮定の実用的な診断を導出する。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 10:44:22 GMT)
A Knowledge Graph and Deep Learning-Based Semantic Recommendation Database System for Advertisement Retrieval and Personalization [0.0] 本稿では,広告検索とパーソナライズのための知識グラフと深層学習に基づくセマンティックレコメンデーションデータベース(KGSR-ADS)を提案する。
提案するフレームワークは,マルチリレーショナルセマンティクスをキャプチャする異質なAd-Knowledge Graph(Ad-KG)を統合する。
この階層アーキテクチャは、正確なセマンティックマッチングとスケーラブルな検索の両方を可能にし、大規模な異種ワークロード下でパーソナライズされた広告レコメンデーションを可能にする。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 20:55:30 GMT)
A General Weighting Theory for Ensemble Learning: Beyond Variance Reduction via Spectral and Geometric Structure [0.0] 本稿では,アンサンブル学習のための一般的な重み付け理論を開発する。
我々は、仮説空間に作用する線型作用素としてアンサンブルを定式化する。
非一様構造重みが平均値よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 25 Dec 2025 08:51:01 GMT)