Latent Collaboration in Multi-Agent Systems [140.5] マルチエージェントシステム(MAS)は、独立した単一モデル推論から協調的なシステムレベルのインテリジェンスへと拡張される。
LLMエージェント間の純粋な遅延協調を可能にするエンドツーエンドのトレーニングフリーフレームワークであるLatentMASを紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:56:57 GMT)
Boosting Reasoning in Large Multimodal Models via Activation Replay [136.7] RLVRは低エントロピーの活性化を予期せずシフトさせるが、高エントロピーの活性化は影響を受けないことを示す。
本稿では,学習後LMMのマルチモーダル推論を促進するトレーニングフリーアプローチであるActivation Replayを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:31:57 GMT)
International AI Safety Report 2025: Second Key Update: Technical Safeguards and Risk Management [115.9] 2025年の国際AI安全レポートの第2の更新は、この1年で汎用AIリスク管理の新しい展開を評価している。
研究者、公共機関、AI開発者が汎用AIのリスク管理にどのようにアプローチしているかを調べる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:12:56 GMT)
LocateAnything3D: Vision-Language 3D Detection with Chain-of-Sight [105.9] 次世代の予測問題として3D検出を行うVLMネイティブレシピを提案する。
このモデルでは, 49.89 AP_3Dの精度を+15.51倍に向上した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:45 GMT)
The Consistency Critic: Correcting Inconsistencies in Generated Images via Reference-Guided Attentive Alignment [105.3] ImageCriticはエージェントフレームワークに統合され、不整合を自動的に検出し、マルチラウンドおよびローカル編集で修正する。
実験では、ImageCriticは様々なカスタマイズされた生成シナリオで詳細に関連する問題を効果的に解決することができ、既存のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:40:25 GMT)
New York Smells: A Large Multimodal Dataset for Olfaction [93.2] ニューヨーク・スメルズ(New York Smells)は、野生で撮影された画像と嗅覚信号の大規模なデータセットである。
我々のデータセットには、屋内と屋外の環境にまたがる3,500個の異なる物体から7000個の匂いとイメージのペアが含まれています。
我々のベンチマークには3つのタスクがある: クロスモーダルな匂いとイメージの検索、シーン、物体、物質を嗅覚だけで認識すること、草種間のきめ細かい識別。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:44:50 GMT)
IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.6] IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。
提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。
NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:53:54 GMT)
V$^{2}$-SAM: Marrying SAM2 with Multi-Prompt Experts for Cross-View Object Correspondence [90.9] V2-SAMは、統合されたクロスビューオブジェクト対応フレームワークである。
SAM2は2つの相補的なプロンプトジェネレータを通して、シングルビューセグメンテーションからクロスビュー対応に適応する。
V2-SAMは、Ego-Exo4D(ego-exoオブジェクト対応)、DAVIS-2017(ビデオオブジェクト追跡)、HANDAL-X(robotic-ready cross-view対応)の新たな最先端性能を実現する
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:06:30 GMT)
MedROV: Towards Real-Time Open-Vocabulary Detection Across Diverse Medical Imaging Modalities [89.8] 医用画像のための最初のリアルタイムオープン語彙検出モデルであるMedROVを紹介する。
対照的な学習とクロスモーダル表現を活用することで、MedROVは既知の構造と新しい構造の両方を効果的に検出する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:53 GMT)
Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory [89.7] Evo-Memoryは、大規模言語モデル(LLM)エージェントで自己進化型メモリを評価するための、ストリーミングベンチマークとフレームワークである。
10以上の代表的なメモリモジュールを評価し、10種類の多ターンゴール指向およびシングルターン推論およびQAデータセットで評価した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:08:07 GMT)
A Reason-then-Describe Instruction Interpreter for Controllable Video Generation [89.0] 本稿では,生の命令をダウンストリームビデオジェネレータの正確な動作可能な仕様に変換する汎用型モデル非依存インタプリタReaDeを提案する。
命令忠実度,キャプション精度,下流映像品質が一貫した向上を示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:59:07 GMT)
Block Cascading: Training Free Acceleration of Block-Causal Video Models [87.5] 小さな1.3Bモデルは16FPSしか管理せず、大きな14Bモデルは4.5FPSでクロールする。
Block Cascadingは、トレーニング不要の並列化を通じて、このトレードオフを著しく軽減する。
私たちの重要な洞察は、将来のビデオブロックは、生成を開始するために完全に識別された現在のブロックを必要としないということです。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:52:58 GMT)
LongVT: Incentivizing "Thinking with Long Videos" via Native Tool Calling [87.3] LongVTは、Multimodal Chain-of-Tool-Thoughtを通じて"Thinking with Long Videos"を可能にするエンドツーエンドのエージェントフレームワークである。
我々は、LMM固有の時間的接地機能を利用して、特定のビデオクリップをズームインし、よりきめ細かいビデオフレームを再サンプリングするネイティブビデオトリミングツールを開発した。
トレーニングデータセットは, ツール統合型冷間始動微調整用247.9K試料, エージェント強化学習用1.6K試料, エージェント強化微調整用15.4K試料からなる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:22:48 GMT)
DiCaP: Distribution-Calibrated Pseudo-labeling for Semi-Supervised Multi-Label Learning [83.9] 半教師付きマルチラベル学習は、ラベルのないデータを活用してモデルの性能を向上させることを目的としている。
既存の手法の多くは、その品質に関わらず、すべての擬似ラベルに等しい重みを割り当てる。
擬似ラベル重みの校正に後部精度を推定する正当性認識フレームワークDiCaPを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:55:02 GMT)
ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation [81.5] 画像操作検出と局所化のための大規模ベンチマークである textbfManipBench を提案する。
また,マルチモーダル大言語モデル(MLLM)に基づくオールインワンモデルであるtextbfManipShieldを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:37:05 GMT)
Arcadia: Toward a Full-Lifecycle Framework for Embodied Lifelong Learning [80.7] 閉ループフレームワークであるArcadiaを導入し,4段階を密結合させることで生涯学習を実践する。
Arcadiaは、ナビゲーションと操作ベンチマークに一貫した利益をもたらし、物理的なロボットにしっかりと転送する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:26:00 GMT)
X-ReID: Multi-granularity Information Interaction for Video-Based Visible-Infrared Person Re-Identification [79.4] 本稿では,VVI-ReIDのためのX-ReIDという新しいクロスモーダル特徴学習フレームワークを提案する。
具体的には、まずクロスモダリティプロトタイプコラボレーション(CPC)を提案する。
次に, 隣接フレームからの短期的相互作用, 長期的クロスフレーム情報融合, クロスモダリティ特徴アライメントを組み込んだMII(Multi-granularity Information Interaction)を設計する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:11:45 GMT)
Reading Between the Lines: Abstaining from VLM-Generated OCR Errors via Latent Representation Probes [79.4] 隠れ状態や注目パターンの軽量プローブを学習するためのLRP(Latent Representation Probing)を提案する。
LRPは、ベストベースラインよりも吸音精度を7.6%向上させる。
これにより、デプロイメント対応AIシステムを構築するための原則化されたフレームワークが確立される。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:24:42 GMT)
SOMBRL: Scalable and Optimistic Model-Based RL [78.3] 我々は不確実性に直面した楽観主義の原理に基づくアプローチを提案する。
我々はSOMBRLが原理探索のための柔軟でスケーラブルなソリューションであることを示す。
また,動的RCカーハードウェア上でのSOMBRLの評価を行い,その性能について述べる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:39:21 GMT)
Scaling LLM Speculative Decoding: Non-Autoregressive Forecasting in Large-Batch Scenarios [76.9] 本稿では,一方向および注目メカニズムを加速する新しいアーキテクチャであるSpecFormerを紹介する。
また,SpecFormerはトレーニング要求の低減と計算コストの削減を実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:20:08 GMT)
AD-R1: Closed-Loop Reinforcement Learning for End-to-End Autonomous Driving with Impartial World Models [75.2] 我々は,Impartial World Modelを中心に構築されたポストトレーニング政策改善のためのフレームワークを紹介する。
私たちの主な貢献は、このモデルに危険について正直であることを教えることです。
大規模な実験を通じて、我々のモデルは失敗を予測する上で、ベースラインを著しく上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:57:24 GMT)
DLADiff: A Dual-Layer Defense Framework against Fine-Tuning and Zero-Shot Customization of Diffusion Models [75.0] 悪意のあるアクターは、拡散モデルのカスタマイズを利用することができ、人の数または1つのイメージだけで、元のアイデンティティとほぼ同一の合成IDを作成することができる。
本稿では,ファインチューニング法とゼロショット法の両方を保護するためのDual-Layer Anti-Diffusion (DLADiff)を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:35:55 GMT)
Adapter Shield: A Unified Framework with Built-in Authentication for Preventing Unauthorized Zero-Shot Image-to-Image Generation [74.6] ゼロショット画像・画像生成は知的財産権侵害に重大なリスクをもたらす。
この研究は、個人イメージを誤用から守ることを目的とした、最初の普遍的および認証統合ソリューションであるAdapter Shieldを提示する。
提案手法は, ゼロショット画像合成の不正化において, 最先端の防御を克服する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:49:16 GMT)
OmniLens++: Blind Lens Aberration Correction via Large LensLib Pre-Training and Latent PSF Representation [72.7] この研究は、既存のパイプラインの一般化能力を妨げる2つの課題を解決するOmniLens++フレームワークを提案する。
実世界のレンズと合成レンズリブの様々な収差実験により、OmniLens++はブラインド収差補正において最先端の一般化能力を示すことが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:06:54 GMT)
HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation [72.7] 最近の統一モデルでは、理解の専門家(LLMなど)と生成の専門家(拡散モデルなど)を統合している。
本研究では,非対称なH字型アーキテクチャであるHBridgeを提案する。
複数のベンチマークにわたる大規模な実験は、HBridgeの有効性と優れた性能を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:23:38 GMT)
On Evaluating LLM Alignment by Evaluating LLMs as Judges [68.2] 大規模言語モデル(LLM)のアライメントを評価するには、助け、誠実、安全、正確に人間の指示に従う必要がある。
本研究では,LLMの生成能力と評価能力の関係について検討した。
モデル出力を直接評価することなくアライメントを評価するベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:33:24 GMT)
Low-Resolution Editing is All You Need for High-Resolution Editing [67.7] 本稿では,高精細画像編集の課題を導入し,それに対応するテスト時間最適化フレームワークを提案する。
提案手法では,高解像度のソース画像に対してパッチワイズ最適化を行い,さらに細かな細部転送モジュールと新しい同期戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:35:32 GMT)
ShapeGen: Towards High-Quality 3D Shape Synthesis [67.4] 3D形状生成は顕著な進歩を遂げており、単一の画像から高忠実度3Dアセットを迅速に合成することができる。
しかし、現在の手法は、複雑な詳細の欠如、過度に滑らかな表面、断片化された薄殻構造など、依然として課題に直面している。
本稿では、3次元表現と監督の改善、解像度のスケールアップ、線形変換器の利点を通じて高品質な3次元形状生成を実現するShapeGenを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:47:27 GMT)
HiCoGen: Hierarchical Compositional Text-to-Image Generation in Diffusion Models via Reinforcement Learning [67.0] HiCoGenは、新しいChain of Synthesisパラダイムに基づいて構築されている。
複雑なプロンプトを最小の意味単位に分解する。
その後、これらのユニットを反復的に合成し、各ステップで生成された画像が次に重要な視覚的コンテキストを提供する。
実験により,提案手法は概念カバレッジと構成精度の両方において,既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:24:25 GMT)
V-Attack: Targeting Disentangled Value Features for Controllable Adversarial Attacks on LVLMs [66.8] 本稿では,局所的セマンティックアタックの新しい手法であるV-Attackを提案する。
V-Attackは、最先端の手法よりも平均して36%の攻撃成功率を改善する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:51:17 GMT)
Adaptivity and Universality: Problem-dependent Universal Regret for Online Convex Optimization [64.9] 普遍性と適応性の両方を達成する新しいアプローチであるUniGradを紹介し、UniGrad.CorrectとUniGrad.Bregmanの2つの異なる実現法を提案する。
どちらのメソッドも勾配の変動に適応し、強い凸関数に対する $mathcalO(log V_T)$ regret とexp-concave関数に対する $mathcalO(d log V_T)$ regret を同時に達成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:23:10 GMT)
Structured Prompting Enables More Robust, Holistic Evaluation of Language Models [63.9] 言語モデル(LM)は、ドメイン間でますます採用されている。
パフォーマンスを正確に見積もる高品質なベンチマークフレームワークは、デプロイメント決定を導く上で不可欠です。
本稿では,構造化プロンプト手法を導入した DSPy+HELM フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:37:59 GMT)
Stragglers Can Contribute More: Uncertainty-Aware Distillation for Asynchronous Federated Learning [61.2] Asynchronous Federated Learning (FL)は、その効率性とスケーラビリティの向上に注目されている。
我々は,不確実性を考慮した蒸留を組み込んだ新しいフレームワークであるFedEchoを提案し,非同期FL性能を向上する。
FedEchoが既存の非同期フェデレーション学習ベースラインを一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:25:25 GMT)
ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding [60.6] ReDirectorは、動的にキャプチャされた可変長のカメラ制御ビデオ生成方法である。
ロータリーカメラを紹介します。
RoCE - RoPEとリテイクコンディショニングカメラを統合したカメラ。
提案手法は, 分布外カメラトラジェクトリとビデオ長を一般化し, 動的物体の局所化と静的背景保存を改善した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:38:56 GMT)
Accelerating Wireless Distributed Learning via Hybrid Split and Federated Learning Optimization [58.6] フェデレートラーニング(FL)とスプリットラーニング(SL)は、無線ネットワークにおいて効果的な分散ラーニングパラダイムである。
ハイブリッドスプリットとフェデレート学習(HSFL)の両方の利点を活用するために、一部のデバイスはFLモードで動作し、その他のデバイスはSLモードで動作することができる。
本論文は,(1)学習モードの選択が全体の学習性能にどのように影響するか,2)バッチサイズとどのように相互作用するか,という3つの重要な疑問に対処することによって,HSFLを加速することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:29:22 GMT)
PrismAudio: Decomposed Chain-of-Thoughts and Multi-dimensional Rewards for Video-to-Audio Generation [57.9] Video-to-Audio (V2A) の生成には、4つの重要な知覚次元のバランスが必要である。
私たちは、強化学習をV2A世代に統合する最初のフレームワークであるPrismAudioを紹介します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:54:45 GMT)
Video Object Recognition in Mobile Edge Networks: Local Tracking or Edge Detection? [57.0] モバイルエッジコンピューティングの最近の進歩により、高精度ニューラルネットワークを備えたエッジサーバに集約的なオブジェクト検出をオフロードすることが可能になった。
このハイブリッドアプローチは有望なソリューションを提供するが、新たな課題として、エッジ検出とローカルトラッキングのタイミングを決定する。
局所的なトラッキングとエッジ検出を適応的に選択する深層強化学習に基づくアルゴリズムである単一デバイス環境での LTED-Ada を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:54:51 GMT)
Exo2EgoSyn: Unlocking Foundation Video Generation Models for Exocentric-to-Egocentric Video Synthesis [56.5] Exo2EgoSynは、Exocentric-to-Egocentric(Exo2Ego)クロスビュービデオ合成をアンロックするWAN 2.2の適応である。
私たちのフレームワークは3つの重要なモジュールで構成されています。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:08:37 GMT)
Unleashing the Power of Vision-Language Models for Long-Tailed Multi-Label Visual Recognition [55.2] 本稿では,長い尾を持つ多ラベル視覚認識のための新しい相関適応プロンプトネットワーク(CAPNET)を提案する。
CAPNETはCLIPのテキストエンコーダからの相関を明示的にモデル化する。
テスト時間アンサンブルによる一般化を改善し、視覚・テクスチャのモダリティを実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:57:28 GMT)
Layer-Aware Video Composition via Split-then-Merge [55.1] Split-then-Merge (StM) は、生成ビデオ合成の制御を強化するために設計されたフレームワークである。
StMは、ラベルなしのビデオの大規模なコーパスを、ダイナミックな前景と背景の層に分割し、それらを自己構成して、ダイナミックな被写体が多様なシーンとどのように相互作用するかを学習する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:53:15 GMT)
Representation Interventions Enable Lifelong Unstructured Knowledge Control [54.9] 大規模言語モデル(LLM)は、しばしば誤った、または時代遅れのコンテンツを生成します。その知識を効率的に正確に更新し、コストのかかる再トレーニングなしにするというのは、大きな課題です。
本稿では,モデル表現空間内の介入として知識制御を扱う,堅牢でスケーラブルな手法であるRILKEを紹介する。
トレーニング中、RILKEはパラフレーズロバストと編集局所化モジュールを学び、低次元のサブスペースへの更新を制限し、クロスディジット干渉を最小限に抑える。
推論において、クエリ適応ルータは、モデル生成をガイドする適切なモジュールを選択する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:15:00 GMT)
Large Language Models' Complicit Responses to Illicit Instructions across Socio-Legal Contexts [54.2] 大規模言語モデル(LLM)が前例のない規模に展開され、毎日のタスクで数百万のユーザを支援している。
本研究は、複雑なファシリテーションを、不正なユーザ指示を可能にするガイダンスやサポートの提供として定義する。
実世界の訴訟と確立された法的枠組みを用いて、269件の違法なシナリオと50件の違法な意図にまたがる評価ベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:01:31 GMT)
Supervise Less, See More: Training-free Nuclear Instance Segmentation with Prototype-Guided Prompting [53.8] 核インスタンスセグメンテーションのための完全トレーニングおよびアノテーションなしプロンプトフレームワークであるSPROUTを紹介する。
SPROUTは、スライド固有の参照プロトタイプを構築するために、ヒストロジーインフォームドプリエントを利用する。
前景と背景の特徴は正および負の点のプロンプトに変換され、Segment Anything Model (SAM) は正確な核線を生成できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:58:33 GMT)
MotionV2V: Editing Motion in a Video [53.8] 入力から抽出したスパーストラジェクトリを編集し,映像の動きを変化させることを提案する。
入力と出力の軌跡のずれを「運動編集」と呼ぶ。
私たちのアプローチでは、任意のタイムスタンプから始まり、自然に伝播する編集が可能になります。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:57:25 GMT)
VeriSciQA: An Auto-Verified Dataset for Scientific Visual Question Answering [53.7] 重要なボトルネックは、パブリックで大規模で高品質なビジュアル質問回答(SVQA)データセットの欠如にある。
本稿では、まず、図形関連テクストコンテキストとQAペアを生成する検証中心のGenerate-then-Verifyフレームワークを提案する。
このフレームワークをインスタンス化し、20の科学的ドメインと12のフィギュアタイプからなる20,351のQAペアのデータセットであるVeriSciQAをキュレートします。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:14:52 GMT)
LLM-EDT: Large Language Model Enhanced Cross-domain Sequential Recommendation with Dual-phase Training [53.5] クロスドメインシーケンスレコメンデーション (CDSR) は、様々なドメインからの情報を取り入れることで、ユーザとイテムのインタラクションを強化するために提案されている。
現在の進歩にもかかわらず、不均衡問題と移行問題はCDSRのさらなる発展を妨げる。
デュアルフェーズトレーニング(LLM-EDT)によるLLMの拡張型クロスドメインシーケンスレコメンデーションを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:18:04 GMT)
More Bias, Less Bias: BiasPrompting for Enhanced Multiple-Choice Question Answering [53.1] 大規模言語モデル(LLM)のための新しい推論フレームワークであるBiasPromptingを紹介する。
最終的な予測に到達する前に、LCMにすべての妥当な答えオプションの推論を生成し、批判的に評価するように誘導する。
広く使われている5つの質問応答ベンチマークにおいて、大幅な改善が示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:01:08 GMT)
FLaTEC: Frequency-Disentangled Latent Triplanes for Efficient Compression of LiDAR Point Clouds [53.0] FLaTECは、圧縮率の高いフルスキャンの圧縮を可能にする周波数対応圧縮モデルである。
ボキセル化埋め込みを三面体表現に変換することで、空間性、計算コスト、ストレージ要件を低減する。
提案手法は,最先端の速度歪み性能を実現し,標準コーデックのBDレートを78%,94%向上させる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:37:49 GMT)
Agent0-VL: Exploring Self-Evolving Agent for Tool-Integrated Vision-Language Reasoning [53.0] 自己進化型視覚言語エージェントは、ツール統合推論による継続的な改善を実現する。
Agent0-VLは、ツールの使用法を推論だけでなく、自己評価や自己修復にも取り入れている。
Agent0-VLはベースモデルよりも12.5%改善されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:15:14 GMT)
The Image as Its Own Reward: Reinforcement Learning with Adversarial Reward for Image Generation [52.6] 本稿では、報酬モデルとジェネレータの両方を反復的に更新する逆報酬を持つRLフレームワークであるAdv-GRPOを紹介する。
パラメータ更新を制約するKL正規化とは異なり、学習した報酬は生成元を直接視覚出力に導く。
人的評価では,Flow-GRPO と SD3 がそれぞれ 70.0% と 72.4% の画像品質,美学に優れていた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:35:57 GMT)
MapReduce LoRA: Advancing the Pareto Front in Multi-Preference Optimization for Generative Models [52.3] 人間のフィードバックからの強化学習は、生成モデルと人間の美学と知覚的嗜好を高度に一致させる。
MapReduce LoRA と Reward-aware Token Embedding (RaTE) の2つの補完手法を紹介する。
我々のフレームワークは、モダリティにまたがる新しい最先端のマルチ参照アライメントのレシピを定めている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:49:21 GMT)
Thinking in 360°: Humanoid Visual Search in the Wild [52.3] ヒトは視覚情報を360度で効率的に探索するために頭部(脳運動)と眼(眼運動)の相乗的制御に依存している。
360パノラマ画像で表現された没入型世界において,ヒューマノイドエージェントが頭部を積極的に回転させて物体や経路を探索するヒューマノイドビジュアルサーチを提案する。
我々の実験は、最上位のプロプライエタリモデルでさえ、オブジェクトとパスの検索で30%しか成功していないことを最初に明らかにした。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:30:10 GMT)
DINO-Tok: Adapting DINO for Visual Tokenizers [52.2] DINO-Tokは、階層的表現を情報完全潜在空間に統一する視覚トークンである。
ImageNetでは、DINO-Tokは最先端の再構築性能を達成し、自動エンコーディングでは28.54 PSNR、VQベースのモデリングでは23.98 PSNRに達した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:00:00 GMT)
Bootstrapping Physics-Grounded Video Generation through VLM-Guided Iterative Self-Refinement [51.5] 本稿では,映像生成のための物理対応ガイダンスを提供するための反復的自己再構成フレームワークを提案する。
物理的不整合からのフィードバックに基づいてプロンプトを洗練させるマルチモーダル・チェーン・オブ・シント(MM-CoT)プロセスを導入する。
PhyIQベンチマーク実験の結果,物理IQのスコアは56.31から62.38に改善した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:09:03 GMT)
Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization [50.5] 本稿では,トレーニングフリーでモデルに依存しないモジュールであるToken-Prompt Embedding Space Optimization (TPSO)を提案する。
TPSOは、トークン埋め込み空間の未表現領域を探索するために学習可能なパラメータを導入し、学習された分布の強いモードからサンプルを繰り返し生成する傾向を減少させる。
MS-COCOと3つの拡散バックボーンの実験では、TPSOは画像品質を犠牲にすることなく、生成多様性を著しく向上し、ベースライン性能を1.10から4.18ポイントに改善した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:42:09 GMT)
PhysChoreo: Physics-Controllable Video Generation with Part-Aware Semantic Grounding [50.5] PhysChoreoは、単一の画像から多様な制御性と物理的なリアリズムを持つビデオを生成する新しいフレームワークである。
本手法は2つの段階から構成される: まず, 画像中の全ての物体の静的初期特性を, 部分認識の物理的特性再構成により推定する。
そして、時間的に指示され、物理的に編集可能なシミュレーションを通じて、リッチな動的な振る舞いと物理的なリアリズムで高品質な動画を合成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:59:04 GMT)
Many-Body Entanglement in Solid-State Emitters [50.4] 固体量子エミッタ(QE)やナノフォトニクスの最近の進歩は、量子フォトニクス技術の展望を変えつつある。
QEと光子間の多体相互作用は、堅牢なコヒーレンスと制御可能な多体絡み合いを実現する。
これらの絡み合った状態は、量子計算、センシング、シミュレーションに有効である。
固体プラットフォームにおける内在的不均一性とデコヒーレンスは、そのような複雑な絡み合った状態を実現するための重要な課題を提起する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:39:32 GMT)
OpenApps: Simulating Environment Variations to Measure UI-Agent Reliability [50.0] 自律的なUIエージェントの約束を実現する上では、信頼性が重要です。
6つのアプリを備えた軽量なオープンソースエコシステムであるOpenAppsを開発しています。
我々は、7つの主要なマルチモーダルエージェントの信頼性を研究するために、1万以上の独立した評価を実行する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:22 GMT)
Harmonious Parameter Adaptation in Continual Visual Instruction Tuning for Safety-Aligned MLLMs [49.8] Harmonious Adaptation (HPA)は、集中型パラメータ分割、調和型パラメータ選択、パラメータ調整からなるポストトレーニングフレームワークである。
HPAは、既存のベースラインよりも高い安全性を維持し、忘れを軽減します。
CVITベンチマークと安全性評価データセットの実験は、HPAが既存のベースラインよりも高い安全性を維持し、忘れを軽減していることを示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:34:51 GMT)
Towards Benign Memory Forgetting for Selective Multimodal Large Language Model Unlearning [49.3] MLLM(Multimodal Large Language Models)は優れた能力を発揮するが、プライバシーに敏感な情報を不注意に記憶することができる。
既存の未学習の手法は、しばしばモデルの一般的な画像理解性能を劣化させるため、良心的な忘れを達成できない。
本稿では, メモリ領域のメモリ領域への忘れを抑えつつ, 全体的な機能を維持するSculpted Forgetting Adapter (SMFA)を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:22:45 GMT)
QiMeng-CRUX: Narrowing the Gap between Natural Language and Verilog via Core Refined Understanding eXpression [48.8] 大規模言語モデル(LLM)はハードウェア記述言語(HDL)生成において有望な能力を示している。
既存のアプローチは、しばしば曖昧で冗長で構造化されていない自由形式の自然言語記述に依存している。
我々は、ハードウェアコード生成を、オープンな自然言語空間からドメイン固有の高度に制約されたターゲット空間への複雑な変換として扱う。
構造化された中間空間であるCore Refined Understanding eXpression (CRUX)を導入し、ユーザの意図の本質的な意味を捉えながら、正確なVerilogコード生成のための式を整理する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:17:32 GMT)
RubricRL: Simple Generalizable Rewards for Text-to-Image Generation [48.5] 強化学習(Reinforcement Learning, RL)は、テキストから画像への生成モデルと人間の嗜好を整合させる、有望なアプローチとして最近登場した。
既存の方法は、固定重量の複合指標(例えば、CLIP、OCR、リアリズムスコア)や、人間の嗜好モデルから抽出した単一のスカラー報酬に頼っていることが多い。
本稿では,ルーブリック型報酬設計のための簡易かつ汎用的なフレームワークRLを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:55 GMT)
DecNefLab: A Modular and Interpretable Simulation Framework for Decoded Neurofeedback [47.6] Decoded Neurofeedback (DecNef) は、神経医学や認知神経科学に広く応用された、脳の調節に対する非侵襲的なアプローチである。
我々は、DecNefを機械学習問題として形式化するモジュラーで解釈可能なシミュレーションフレームワークであるDecNefLabを紹介する。
我々は,この手法がDecNef学習の実証的な現象を再現し,DecNefフィードバックが学習を誘導できない条件を特定し,より堅牢で信頼性の高いDecNefプロトコルの設計を人間による実装前に導く方法を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:10:25 GMT)
Data Augmentation Techniques to Reverse-Engineer Neural Network Weights from Input-Output Queries [47.6] 教師-学生のセットアップでは、教師マッピングのデータセット(教師に問い合わせる)を収集し、学生にそのようなマッピングを真似させる。
現在の方法は、教師のパラメータがトレーニングデータよりも多ければ失敗する。
教師ネットワークの入力出力マッピングを最適にサンプリングするために,教師の隠蔽層からリッチな表現セットを抽出することを目的とした拡張手法を検討する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:49:48 GMT)
ROOT: Robust Orthogonalized Optimizer for Neural Network Training [47.1] 大規模言語モデル(LLM)は、特にモデルのスケーリングがインプレクションやトレーニングの不安定性に対する感受性を悪化させるため、依然として重要な課題である。
我々は,特定の行列サイズに合わせた反復によるロバスト性を高める次元ロバスト化手法を開発した。
第2に,有意な方向を保ちながら外周雑音を抑制する最適化ロバスト化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:48:05 GMT)
Reasoning-VLA: A Fast and General Vision-Language-Action Reasoning Model for Autonomous Driving [47.0] Reasoning-VLAは、最先端性能、優れた一般化能力、そしてこれまでに報告された優れた推論速度を実現する。
8つの公開可能な自律運転データセットを、標準化された言語推論ベースの、モデルトレーニングのための使いやすいデータフォーマットに統合します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:40:11 GMT)
SFA: Scan, Focus, and Amplify toward Guidance-aware Answering for Video TextVQA [44.9] ビデオテキストベースの視覚的質問応答(Video TextVQA)タスクは、ビデオ内に現れる視覚的テキストを活用することで、ビデオに関する質問に答えることを目的としている。
このタスクは、フレーム毎にスケール、向き、明度が異なるシーンテキストを正確に知覚し、理解するモデルを必要とする、重大な課題を生じさせる。
本研究では,ビデオテキストVQAに適したトレーニングフリーのフレームワークであるSFAと,質問に答える人間のプロセスに動機づけられたビデオ-LLMベースの最初の手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:14:39 GMT)
Look Where It Matters: Training-Free Ultra-HR Remote Sensing VQA via Adaptive Zoom Search [44.8] ZoomSearchはトレーニング不要のプラグイン&プレイパイプラインで、Ultra-HR Remote Sensing Visual Question Answering (RS-VQA)の 'How to answer' から 'How to answer' を分離する。
LLaVA-ovと統合されると、ZoomSearchは様々なタスクで最先端の精度を実現し、LLaVA-ovベースラインはLRS-VQAで26.3%、MME-RealWorld-RSで114.8%向上した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:25:54 GMT)
Image-Free Timestep Distillation via Continuous-Time Consistency with Trajectory-Sampled Pairs [44.2] 本研究では, 連続時間連続蒸留におけるトラジェクティブ-バックワード整合性モデル(TBCM)を提案する。
VAEエンコーディングや大規模データセットを必要とする従来の方法とは異なり、我々の自己完結蒸留パラダイムは効率と簡易性の両方を著しく改善する。
TBCMは1ステップでMJHQ-30kで6.52 FIDと28.08 CLIPのスコアを達成し、Sana-Sprintと比較してトレーニング時間を約40%短縮した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:36:20 GMT)
OmniAlpha: A Sequence-to-Sequence Framework for Unified Multi-Task RGBA Generation [43.9] シーケンス間RGBA画像生成と編集のための,最初の統合マルチタスク生成フレームワークであるOmniAlphaを提案する。
我々の研究は、統一されたマルチタスクモデルがRGBAの優れた共有表現を学習できることを証明し、より強力で階層対応な生成システムへの道を開いた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:34:51 GMT)
Safe and Sustainable Electric Bus Charging Scheduling with Constrained Hierarchical DRL [43.7] 太陽光発電(PV)パネルなどの再生可能エネルギー源を備えた電気バス(EB)は、持続可能な低炭素公共交通を推進するための有望なアプローチである。
本稿では,EB充電スケジューリング問題(EBCSP)を多ソース不確実性下で解決するための安全な深層強化学習フレームワークを提案する。
我々は新しいHDRLアルゴリズム、すなわちDouble ActorCritic MultiAgent Proximal Policy Optimization Lagrangian(DACMAPPO-Lagrangian)を開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:00:02 GMT)
ST-PPO: Stabilized Off-Policy Proximal Policy Optimization for Multi-Turn Agents Training [43.5] PPOは多ターン対話や推論タスクにおいてトークンレベルでの大規模言語モデル(LLM)のトレーニングに広く採用されている。
ターンレベルの重要度サンプリングとクリッピングバイアス補正の2つの相補的安定化手法を導入する。
実験の結果,ST-PPOとS-PPOは大規模モデルのトレーニングで観測される性能崩壊を一貫して防止することがわかった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:54:02 GMT)
EM2LDL: A Multilingual Speech Corpus for Mixed Emotion Recognition through Label Distribution Learning [43.2] 本研究では,ラベル分布学習による混合感情認識の促進を目的とした多言語音声コーパスEM2LDLを提案する。
EM2LDLは、英語、マンダリン、カントン語で表現的な発声を含んでおり、香港やマカオなど多言語圏で広く使われている発声のコードスイッチングを捉えている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:26:15 GMT)
Semantic-KG: Using Knowledge Graphs to Construct Benchmarks for Measuring Semantic Similarity [42.9] 本稿では,大規模言語モデルの出力に対する意味的類似性を評価するために,ベンチマークを生成する新しい手法を提案する。
我々は4つの異なる領域(一般知識、バイオメディシン、ファイナンス、生物学)でベンチマークデータセットを生成する。
セマンティックな変化のサブタイプとベンチマークの領域がセマンティックな類似性手法の性能に与える影響を観察する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:07:08 GMT)
GigaWorld-0: World Models as Data Engine to Empower Embodied AI [42.7] 我々は、ビジョン・ランゲージ・アクション学習のためのデータエンジンとして明示的に設計された統一世界モデルフレームワークであるGigaWorld-0を提案する。
GigaWorld-0はGigaWorld-0-Videoという2つの相乗的コンポーネントを統合している。
GigaWorld-0-3Dは、3D生成モデリング、3Dガウススプラッティング再構成、物理的に微分可能なシステム識別、幾何学的一貫性と物理リアリズムを確保するための実行可能な動作計画を組み合わせる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:00:42 GMT)
UltraViCo: Breaking Extrapolation Limits in Video Diffusion Transformers [42.4] 本研究では,一定の減衰係数を介し,トレーニングウィンドウ以外のトークンの注意を抑える訓練自由プラグアンドプレイ手法を提案する。
注目すべきは、4倍の補間で前の最良の方法よりも233%、40.5%向上することである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:44:10 GMT)
Redefining Radar Segmentation: Simultaneous Static-Moving Segmentation and Ego-Motion Estimation using Radar Point Clouds [42.1] 本研究では,レーダ点雲から静的および移動物体を同時に分割するニューラルネットワークに基づく解を提案する。
静的物体の放射速度の測定値はレーダの運動と相関する。
また、移動プラットフォームや車両の瞬間的な2次元速度を推定することもできる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:13:34 GMT)
Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation [42.0] Inferixは、最適化された半自己回帰復号プロセスを通じて没入型世界合成を可能にする推論エンジンである。
Inferixはさらに、インタラクティブなビデオストリーミングとプロファイリングによる提供を強化し、リアルタイムのインタラクションと現実的なシミュレーションを可能にしている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:45:04 GMT)
DAPointMamba: Domain Adaptive Point Mamba for Point Cloud Completion [41.9] ドメイン適応ポイントクラウド補完(DA PCC)は、ラベル付きソースとラベルなしターゲットドメインの間の幾何学的および意味的差異を狭めることを目的としている。
DA PCCにおける状態空間モデル(SSM)の適応性に関する最初の研究について述べる。
本稿では,DAPointMamba for DA PCCを提案する。DAPointMamba for DA PCCは,ドメイン間の強い適応性を示し,大域的受容場と効率的な線形複雑性の利点を有する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:07:27 GMT)
When to Think and When to Look: Uncertainty-Guided Lookback [41.9] 長い鎖は多くの場合、画像を無視した長い間違った軌跡を生み出します。
より深い分析により、画像に明示的に言及する短い振り返り句が、成功した軌跡に強く富んでいることが明らかとなった。
本研究では,不確実性信号と適応的なルックバックプロンプトと広帯域探索を組み合わせた学習自由復号法である不確実性ガイド付きルックバックを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:38:28 GMT)
Learning Multi-Access Point Coordination in Agentic AI Wi-Fi with Large Language Models [40.9] マルチアクセスポイントコーディネート(MAPC)は、重なり合う基本サービスセット内の次世代Wi-Fiのスループットを向上させるための重要な技術である。
本稿では,自律型大規模言語モデルエージェントとしてモデル化された各アクセスポイントをネットワーク状態に関する協調的な理由と,適応的調整戦略をリアルタイムで交渉する,エージェント型AI Wi-Fiフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:29:25 GMT)
HybriDLA: Hybrid Generation for Document Layout Analysis [40.5] HybriDLAは単一の層に拡散と自己回帰デコーディングを統合する新しい生成フレームワークである。
このアーキテクチャはパフォーマンスを83.5%に向上させ、平均精度(mAP)を平均する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:53:47 GMT)
MFM-point: Multi-scale Flow Matching for Point Cloud Generation [40.5] MFM-Pointは、ポイントクラウド生成のためのマルチスケールフローマッチングフレームワークである。
MFM-Point は点ベース手法で最高のクラス性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:10:56 GMT)
ParaBlock: Communication-Computation Parallel Block Coordinate Federated Learning for Large Language Models [40.2] ParaBlockは、通信効率を向上させるために、通信と計算のための2つの並列スレッドを確立する新しいアプローチである。
提案するParaBlockは,標準結合ブロック座標降下法と同じ収束率が得られることを理論的に証明する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:09:21 GMT)
Dynamic Test-Time Compute Scaling in Control Policy: Difficulty-Aware Stochastic Interpolant Policy [40.2] Difficulty-Aware Interpolant Policy (DA-SIP) は、ロボットコントローラがタスクの難易度に基づいて、リアルタイムで統合の地平線を適応的に調整できるフレームワークである。
DA-SIPは、最大計算ベースラインに匹敵するタスク成功率を維持しながら、合計時間の2.6-4.4倍の削減を実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:46:42 GMT)
Scale Where It Matters: Training-Free Localized Scaling for Diffusion Models [39.6] テストタイムスケーリング(TTS)は、推論中により多くの計算を割り当てることで、品質を改善する。
既存のTSメソッドはフルイメージレベルで動作し、画像の品質が空間的に不均一であることが多いという事実を見越す。
高品質な領域を保存しながら、欠陥領域を適応的に再サンプリングする新しい方向であるローカライズTTSを提案する。
LoTTSは、ローカライズされたTSのための、最初の完全なトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:53:03 GMT)
Are Image-to-Video Models Good Zero-Shot Image Editors? [39.1] 命令駆動画像編集のための事前学習された画像間拡散モデルを再利用した、チューニング不要なフレームワークIF-Editを紹介する。
IF-Editは3つの重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:53:29 GMT)
SuperQuadricOcc: Multi-Layer Gaussian Approximation of Superquadrics for Real-Time Self-Supervised Occupancy Estimation [38.9] リアルタイム推論を実現するために,スーパークワッドリックを用いた占有モデルを提案する。
Occ3Dデータセットでは、SuperQuadricOccは75%のメモリフットプリントの削減とmIoUの5.9%の改善を実現している。
私たちの知る限り、これは競争性能を維持しながらリアルタイムの推論を可能にする最初の占有モデルです。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:31:55 GMT)
IDAP++: Advancing Divergence-Based Pruning via Filter-Level and Layer-Level Optimization [38.2] 本稿では,フィルタとアーキテクチャの両レベルでの冗長性に対処するニューラルネットワーク圧縮に対する新しいアプローチを提案する。
我々は,テンソルフローの分散という概念に基づいて,情報をネットワーク層間でどのように変換するかを定量化する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:02:21 GMT)
MTBBench: A Multimodal Sequential Clinical Decision-Making Benchmark in Oncology [37.6] LLM(Multimodal Large Language Models)は、バイオメディカル推論の可能性を保っているが、現在のベンチマークでは実際の臨床推論の複雑さを捉えていない。
MTBベンチ(MTBBench)は, MTB型意思決定を模擬したエージェントベンチマークであり, 臨床的に困難であり, マルチモーダルで, 縦断的な腫瘍学的な疑問を呈する。
地上の真実のアノテーションは、共同開発したアプリを通じて臨床医によって検証され、臨床関連性を保証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:56:25 GMT)
Hybrid Convolution and Frequency State Space Network for Image Compression [37.4] 畳み込みニューラルネットワーク(CNN)は、局所的な高周波の詳細をキャプチャする。
変換器と状態空間モデル(SSM)は強力な長距離モデリング機能を提供する。
本稿では,ハイブリッドコンボリューションと周波数状態空間ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:21:42 GMT)
LungEvaty: A Scalable, Open-Source Transformer-based Deep Learning Model for Lung Cancer Risk Prediction in LDCT Screening [37.3] LungEvatyは、1つのLDCTスキャンから1-6年の肺がんリスクを予測するトランスフォーマーベースのフレームワークである。
大規模なスクリーニングデータから直接学習し、悪性リスクに関連する包括的な解剖学的および病理学的手がかりをキャプチャする。
LungEvatyは9万回以上のCTスキャンを行い、28,000回以上の微調整、6000回以上の評価を行った。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:38:10 GMT)
Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination [37.2] Video-R4(Reinforceing Text-Rich Video Reasoning with Visual Rumination)は、視覚ルミネーションを行うビデオ推論LMMである。
本研究では、7B LMMを段階的に微調整し、原子を学習し、視覚操作を混合する多段階ルミネーション学習フレームワークを提案する。
ビデオR4-7Bは、M4-ViteVQAの最先端結果を達成し、さらにマルチページ文書QA、スライドQA、ジェネリックビデオQAに一般化する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:31:54 GMT)
The 2nd Workshop on Human-Centered Recommender Systems [37.2] Human-Centered Recommender Systemsワークショップでは、エンゲージメントの最適化から、人々を真に理解し、関与し、利益をもたらすシステム設計へのパラダイムシフトを呼びかけている。
研究者をレコメンデーションシステム、人間とコンピュータのインタラクション、AIの安全性、ソーシャルコンピューティングに集めて、人間の価値をレコメンデーションプロセスに統合する方法を探求する。
Human Understanding、Human Involvement、Human Impact-HCRSの3つのテーマが中心で、LLMベースのインタラクティブレコメンデーターから社会福祉の最適化まで、トピックをカバーする基調講演、パネル、論文が特徴である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:49:14 GMT)
MajutsuCity: Language-driven Aesthetic-adaptive City Generation with Controllable 3D Assets and Layouts [37.2] 本稿では,3次元都市シーンを合成するための自然言語駆動適応フレームワークであるMajutsuCityを紹介する。
MajutsuCityは、制御可能なレイアウト、資産、材料で構成された都市であり、4段階のパイプラインで運営されている。
本研究では, 構造整合性, シーンの複雑さ, 材料忠実度, 照明雰囲気など, 重要な側面をカバーする, 実用的な評価指標の開発を行う。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:40:12 GMT)
SAGE: An Agentic Explainer Framework for Interpreting SAE Features in Language Models [37.1] 大規模言語モデル(LLM)は目覚ましい進歩を遂げているが、その内部メカニズムはほとんど不透明である。
スパースオートエンコーダ(SAE)は、LLM表現をより解釈可能な機能に分解するための有望なツールとして登場した。
本稿では,SAGE(SAE AGentic Explainer)というエージェントベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:14:29 GMT)
XiCAD: Camera Activation Detection in the Da Vinci Xi User Interface [37.0] ロボットによる最小侵襲手術は、単独の術中視覚フィードバックとして内視鏡的映像に依存している。
Da Vinci Xiシステムは、内視鏡アームのアクティベーションを含む各ロボットアームの状態を示すグラフィカルユーザインタフェース(UI)をオーバーレイする。
我々は、カメラタイルの位置を自動的に識別するResNet18畳み込みニューラルネットワークに基づく軽量パイプラインを開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:29:10 GMT)
NNGPT: Rethinking AutoML with Large Language Models [36.9] NNGPTは、大規模な言語モデル(LLM)を、ニューラルネットワーク開発のための自己改善型のAutoMLエンジンに変換する、オープンソースのフレームワークである。
ゼロショットアーキテクチャ合成、ハイパーパラメータ最適化、コード認識精度/早期停止予測、強化学習の5つのシナジスティックLLMベースのパイプラインに統合されている。
このシステムは、すでに5K以上の検証済みモデルを生成しており、自律的なAutoMLエンジンとしてNNGPTを証明している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:10:44 GMT)
MTA: A Merge-then-Adapt Framework for Personalized Large Language Model [36.6] スパースデータを持つユーザのためのMTA(Merge-then-Adapt)フレームワークを提案する。
まず, アンカーユーザを選択し, メタロラモジュール内での個人化特性を事前学習することで, 共有メタロラバンクを構築する。
次に,静的モデルを超えた動的パーソナライズの組み合わせを実現するために,Adaptive LoRA Fusionステージを導入する。
第3に、Few-Shotパーソナライゼーションステージ用のLoRAスタックを提案し、このステージは、マージされたLoRAの上に、超低ランクで軽量なLoRAモジュールを付加する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:46:09 GMT)
Reducing Latency of LLM Search Agent via Speculation-based Algorithm-System Co-Design [36.0] LLMベースの検索エージェントは、高いパフォーマンスを実現するが、深刻なレイテンシーに悩まされる。
我々は憶測のレンズを通してこのボトルネックを再考する。
SPAgentは,検索エージェントにおける投機の役割を拡大し,レイテンシを低減するアルゴリズム・システム協調設計フレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:15:17 GMT)
VKnowU: Evaluating Visual Knowledge Understanding in Multimodal LLMs [35.8] 視覚知識は知覚と推論の間に橋渡しを形成する。
23個のSOTA MLLMの評価は、主要なモデルがまだ人間のパフォーマンスに欠けていることを明らかにしている。
MLLMに視覚知識を明示的に組み込むベースラインモデルとして,新たなデータセットであるVKnowQAとVideoKnow+を導入する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:58:32 GMT)
Beyond Relational: Semantic-Aware Multi-Modal Analytics with LLM-Native Query Optimization [35.6] Nirvanaは、プログラム可能なセマンティック演算子を組み込んだマルチモーダルデータ分析フレームワークである。
Nirvanaはエンドツーエンドのランタイムを10%から85%削減し、システム処理コストを平均で76%削減できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:41:49 GMT)
Map-World: Masked Action planning and Path-Integral World Model for Autonomous Driving [35.5] Masked Action Planning (MAP)モジュールは、将来のエゴ運動をマスクされたシーケンス完了として扱う。
軽量世界モデルは、各候補軌道に条件付き将来のBEVセマンティクスをロールアウトする。
NAVSIMでは,提案手法はアンカーベースアプローチと一致し,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:30:26 GMT)
EmoFeedback2: Reinforcement of Continuous Emotional Image Generation via LVLM-based Reward and Textual Feedback [35.4] 連続感情画像生成(C-EICG)のための新世代フィードバック強化パラダイム(EmoFeedback2)を提案する。
提案手法は,所望の感情を持つ高品質な画像を効果的に生成し,我々のカスタムデータセットにおける既存の最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:51:15 GMT)
Enhancing Sequential Recommendation with World Knowledge from Large Language Models [35.4] GRASPは、合成と類似性検索のための生成拡張検索を統合するフレキシブルなフレームワークである。
検索された類似ユーザ/イテムは、後続の全体的注目強化モジュールの補助的なコンテキスト情報として機能する。
GraSPは、さまざまなバックボーンと統合することで、最先端のパフォーマンスを一貫して達成します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:59:38 GMT)
Alternating Perception-Reasoning for Hallucination-Resistant Video Understanding [35.2] 我々は、ループベースのパラダイムと反幻覚報酬を統合した新しいフレームワークを導入する。
一度にビデオを記述する代わりに、各ループは正確なタイムスタンプを持つビデオセグメントを記述するためにモデルを必要とする。
幻覚のリスクに対して、Factual-Aware Evaluatorは、各知覚結果を信頼できる反幻覚報酬として評価する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:57:42 GMT)
Physics-informed self-supervised learning for predictive modeling of coronary artery digital twins [33.6] PINS-CADは物理情報を用いた自己教師型学習フレームワークである。
それは、20万の合成冠動脈デジタル双生児にグラフニューラルネットワークを事前訓練して、圧力と流れを予測する。
PINS-CADはAUCの0.73で将来の心血管イベントを予測し、臨床リスクスコアとデータ駆動ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:01:46 GMT)
Does Understanding Inform Generation in Unified Multimodal Models? From Analysis to Path Forward [33.6] データ漏洩を回避するために、制御された合成データセットと組み合わせた分離評価フレームワークUniSandboxを紹介する。
本研究は, 推論生成と知識伝達の2つの重要な側面に主に反映される, 重要な理解・生成ギャップを明らかにした。
UniSandboxは、将来の統合アーキテクチャや、理解と生成のギャップを真に埋めるトレーニング戦略を設計するための予備的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:58:48 GMT)
Steganographic Backdoor Attacks in NLP: Ultra-Low Poisoning and Defense Evasion [33.4] トランスフォーマーモデルは自然言語処理(NLP)アプリケーションの基礎であるが、バックドア攻撃には弱い。
我々はステガノBackdoorを導入し、ステルステクニックを実用的な脅威モデルに適合させる。
SteganoBackdoorの攻撃成功率は99%を超えている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:42:59 GMT)
Text-guided Controllable Diffusion for Realistic Camouflage Images Generation [33.3] カモフラージュ画像生成(CIG)は、物体が調和してブレンドされ、周囲と高い視覚的一貫性を示す合成画像に焦点を当てた新興研究分野である。
本稿では,リアルかつ論理的に妥当なカモフラージュ画像を生成する制御可能なテキスト誘導カモフラージュ画像生成手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:43:58 GMT)
Uplifting Table Tennis: A Robust, Real-World Application for 3D Trajectory and Spin Estimation [32.9] 本稿では,この問題をフロントエンド認識タスクとバックエンド2D-to-3Dアップリフトタスクに分割する新しい2段階パイプラインを提案する。
ボール検出器とテーブルキーポイント検出器を組み合わせることにより,概念実証法を実用的で堅牢で高性能なエンド・ツー・エンド・エンド・アプリケーションに変換する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:25:20 GMT)
CrossEarth-Gate: Fisher-Guided Adaptive Tuning Engine for Efficient Adaptation of Cross-Domain Remote Sensing Semantic Segmentation [32.4] CrossEarth-Gateはリモートセンシング(RS)データにおける多面的なドメインギャップに対処する。
このツールボックスで動作するフィッシャー誘導適応選択機構を開発した。
提案手法は,RSセマンティックセグメンテーションのための16のクロスドメインベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:41:59 GMT)
Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning [32.3] 拡散モデル(Diffusion Models)は、生成モデルの主要なクラスとして登場した。
タイムステップ蒸留は、生成を加速する有望な技術であるが、広範囲の訓練を必要とし、画質の劣化につながることが多い。
蒸留と共同RLによる精製による高速収束を実現する新しいフレームワークであるFlash-DMDを紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:47:11 GMT)
ABM-LoRA: Activation Boundary Matching for Fast Convergence in Low-Rank Adaptation [32.2] 低ランク適応のための原理的活性化境界マッチング(ABM-LoRA)を提案する。
私たちのABM-LoRAは、下流トレーニングの前に、アダプタのアクティベーション境界と事前訓練されたモデルのバウンダリを整列することで、この問題に対処します。
ABM-LoRAの有効性を様々なアーキテクチャやタスクで実証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:30:42 GMT)
Resource assessment of classical and quantum hardware for post-quench dynamics [31.8] アナログモードにおける中性原子量子コンピュータ上での非平衡動力学シミュレーションの実行時間とエネルギー消費量を推定する。
我々は、中性原子デバイスがすでに競争体制で運用されており、古典的アプローチに匹敵する、あるいは優れた性能を達成していることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:08:52 GMT)
SSA: Sparse Sparse Attention by Aligning Full and Sparse Attention Outputs in Feature Space [31.8] SSA(スパース・スパース・アテンション)は,スパースとフルアテンションの両方を考慮した統合トレーニングフレームワークである。
SSAは、スパースとフルアテンション推論の両方の下で最先端のパフォーマンスを達成する。
本研究では,流し地における注意値の過度な配置を緩和することにより,自然的スパースアテンショントレーニングが長時間の文脈を驚くほど改善することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:21:57 GMT)
SKEL-CF: Coarse-to-Fine Biomechanical Skeleton and Surface Mesh Recovery [31.6] 本稿では,SKELパラメータ推定のための粗大なフレームワークであるSKEL-CFを紹介する。
SKEL-CFはトランスフォーマーベースのエンコーダデコーダアーキテクチャを採用しており、そこではエンコーダが粗いカメラとSKELパラメータを予測する。
本研究では,SKEL-CFを人間の動作解析のためのスケーラブルで解剖学的に忠実なフレームワークとして確立した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:33:17 GMT)
WPT: World-to-Policy Transfer via Online World Model Distillation [31.2] WPT(World-to-Policy Transfer)トレーニングパラダイムを導入し,エンド・ツー・エンドの世界モデルの指導の下でオンライン蒸留を可能にする。
我々は,世界モデルによって予測される将来の力学と候補軌道を整合させることにより,世界知識を教師の方針に注入する訓練可能な報酬モデルを開発する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:12:06 GMT)
PaSE: Prototype-aligned Calibration and Shapley-based Equilibrium for Multimodal Sentiment Analysis [31.0] マルチモーダル・センティメント・アナリティクスは、テキスト、音響、視覚信号を統合することで人間の感情を理解しようとする。
融合は相互の相補性を活用するように設計されているが、現実のシナリオはしばしばモダリティの競合を示し、最適以下の性能をもたらす。
提案するPaSEは,モダリティ競争を緩和しつつ協調性を向上する,新しいプロトタイプ・アライメントおよびシェープ最適化平衡フレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:18:32 GMT)
MAPS: Preserving Vision-Language Representations via Module-Wise Proximity Scheduling for Better Vision-Language-Action Generalization [30.9] 我々は、視覚・言語・アクション(VLA)モデルのための、最初の堅牢な微調整フレームワークであるMAPSを紹介する。
系統解析により,安定性と柔軟性のバランスをとるために近接制約を緩和する経験的順序を明らかにする。
MAPSはこの緩和を線形にスケジュールし、視覚エンコーダは事前訓練された事前に近づき、アクション指向の言語層はより自由に適応できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:39:37 GMT)
Object-Centric Vision Token Pruning for Vision Language Models [30.6] 高VLM推論効率のための冗長な視覚トークンの抽出が継続的に研究されている。
提案するOC-VTPは,高効率かつ高精度なVLM推論のための,最も代表的な視覚トークンを選択するための,直接かつ保証されたアプローチである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:12:32 GMT)
LiMT: A Multi-task Liver Image Benchmark Dataset [30.1] 肝・腫瘍の分節化,多ラベル病変分類,動脈位相強調CTによる病変検出に用いたマルチタスク肝データセット(LiMT)を構築した。
このデータセットには150の異なる症例のCTボリュームが含まれており、4種類の肝疾患と正常な症例から構成されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:52:30 GMT)
MHB: Multimodal Handshape-aware Boundary Detection for Continuous Sign Language Recognition [29.5] 我々は、ASL(American Sign Language)文のビデオの開始フレームと終了フレームを機械学習で検出する。
強靭性を向上するために,手話ビデオから抽出した3次元骨格特徴を用いて手話特性の収束を捉える。
次に、事前訓練された手形ビデオセグメンテーションフレームワークと手形分類モデルを統合するために、マルチモーダル融合モジュールを使用する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:31:12 GMT)
TextBridgeGNN: Pre-training Graph Neural Network for Cross-Domain Recommendation via Text-Guided Transfer [29.4] TextBridgeGNNは、トレーニング済みのGNNから下流タスクに知識を効果的に転送できる、事前トレーニングおよび微調整のフレームワークである。
TextBridgeGNNは、クロスドメイン、マルチドメイン、トレーニング不要の設定において、既存のメソッドよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:36:01 GMT)
FAPE-IR: Frequency-Aware Planning and Execution Framework for All-in-One Image Restoration [29.3] 画像復元のための周波数対応計画・実行フレームワークであるFAPE-IRを提案する。
凍結したMultimodal Large Language Model (MLLM) をプランナーとして使用し、劣化した画像を解析し、簡潔で周波数対応の復元計画を生成する。
FAPE-IRは、セマンティックプランニングと周波数ベースの復元を結合することにより、オールインワン画像復元のための統一的で解釈可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:27:33 GMT)
4DWorldBench: A Comprehensive Evaluation Framework for 3D/4D World Generation Models [29.1] 次世代マルチモーダル・インテリジェンス・システムの基盤として、次世代モデルが登場しつつある。
World Modelsは、画像、ビデオ、テキストからリアルでダイナミックで物理的に一貫した3D/4Dワールドを構築することを目的としている。
4DWorldBenchは,知覚品質,条件4Dアライメント,物理リアリズム,4D一貫性の4つの重要な次元でモデルを測定する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:05:35 GMT)
MixLM: High-Throughput and Effective LLM Ranking via Text-Embedding Mix-Interaction [28.4] 大規模言語モデル(LLM)は意味的ニュアンスを捉えるのに優れている。
産業的なレイテンシとスループットの要求下では、高い計算オーバーヘッドに悩まされる。
LLMに基づく新しいランキングフレームワークであるMixLMを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:23:04 GMT)
A Unified Evaluation-Instructed Framework for Query-Dependent Prompt Optimization [28.4] ほとんどのプロンプト最適化手法は単一の静的テンプレートを洗練し、複雑なユーザーシナリオや動的なユーザーシナリオでは効果がない。
より根本的には、素早い品質それ自体は統一的で体系的な定義を欠き、断片化され信頼性の低い評価信号をもたらす。
当社のアプローチはまず、パフォーマンス指向で体系的で包括的な評価フレームワークを確立します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:41:13 GMT)
iRadioDiff: Physics-Informed Diffusion Model for Indoor Radio Map Construction and Localization [28.2] iRadioDiffは、屋内RM構築のためのサンプリングフリー拡散ベースのフレームワークである。
iRadioDiff は室内RM工法における最先端性能を実現し,信号強度に基づく室内局地化を実現した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:32:49 GMT)
SatSAM2: Motion-Constrained Video Object Tracking in Satellite Imagery using Promptable SAM2 and Kalman Priors [27.7] SatSAM2はSAM2上に作られたゼロショットの衛星ビデオトラッカーで、基礎モデルをリモートセンシング領域に適応させるように設計されている。
SatSAM2は2つのコアモジュールを導入している: KFCMM (Kalman Filter-based Constrained Motion Module) と、動きのダイナミクスと信頼性に基づいたトラッキング状態を制御するMotion-Constrained State Machine (MCSM) である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:58:49 GMT)
ConceptGuard: Proactive Safety in Text-and-Image-to-Video Generation through Multimodal Risk Detection [27.5] ConceptGuardは、マルチモーダルビデオ生成において、安全でないセマンティクスを積極的に検出し緩和するフレームワークである。
コントラスト検出モジュールは、融合画像テキスト入力を構造化概念空間に投影することにより、潜伏する安全リスクを特定する。
意味的抑制機構は、プロンプトのマルチモーダル条件を介在することにより、生成過程を安全でない概念から遠ざける。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:33:32 GMT)
Smooth regularization for efficient video recognition [27.4] 本稿では,ビデオ認識モデルに強い時間的帰納バイアスを与えるスムーズな正規化手法を提案する。
本手法は, 連続フレームの中間層埋め込みにおける滑らかさをガウスランダムウォーク (GRW) としてモデル化することによって促進する。
このようなモデルに適用すると,kinetics-600の精度は3.8%から6.4%向上した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:41:34 GMT)
AlignBench: Benchmarking Fine-Grained Image-Text Alignment with Synthetic Image-Caption Pairs [27.1] AlignBenchは画像テキストアライメントの新しい指標を提供するベンチマークである。
多様な画像・テキスト・画像モデルとテキスト・ツー・イメージモデルによって生成された詳細な画像・キャプチャ・ペアを評価する。
各文は正当性のために注釈付けされ、VLMをアライメント評価器として直接評価することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:19:47 GMT)
ADNet: A Large-Scale and Extensible Multi-Domain Benchmark for Anomaly Detection Across 380 Real-World Categories [27.0] 異常検出のための大規模マルチドメインベンチマークであるADNetを紹介する。
ベンチマークには合計196,294枚のRGBイメージが含まれており、トレーニング用サンプルは116,192枚、テスト用イメージは80,102枚あり、そのうち60,311枚が異常である。
Dinomaly-mは、推論コストを増大させることなくデコーダ容量を拡大するコンテキスト誘導型Mixture-of-Expertsである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:47:48 GMT)
Motion Marionette: Rethinking Rigid Motion Transfer via Prior Guidance [26.6] Motion Marionetteは、モノクルソースビデオからシングルビューターゲット画像への厳格なモーション転送のためのフレームワークである。
動画から動き軌跡を抽出して空間時間(SpaT)を予め構築する。
結果の速度場は、効率的なビデオ制作に柔軟に利用することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:34:42 GMT)
Advancing Image Classification with Discrete Diffusion Classification Modeling [25.9] DiDiCMは拡散に基づく手法を利用して入力画像上に条件付きクラスラベルの後方分布をモデル化する新しいフレームワークである。
本稿では,ImageNetデータセットの分類精度がベースラインよりも高くなり,タスクの難易度が高まるにつれて精度が向上することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:42:26 GMT)
Learning to Clean: Reinforcement Learning for Noisy Label Correction [25.6] 本稿では,雑音ラベル補正を強化学習問題として概念化する新しい枠組みを提案する。
提案手法であるReinforcement Learning for Noisy Label Correction (RLNLC)は,データとその関連ラベルを表す包括的状態空間を定義する。
RLNLCの有効性は、複数のベンチマークデータセットに対する広範な実験を通じて実証される。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:32:03 GMT)
Emergence and Localisation of Semantic Role Circuits in LLMs [25.6] 抽象的意味構造を基盤とする大言語モデルの内部メカニズムは、まだ十分に特徴づけられていない。
そこで本研究では,LLMのセマンティック・ロールの実装方法を検討するために,ロール・クロス・ミニマル・ペア,時間的出現分析,モデル間比較を統合する手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:51:34 GMT)
Frequency Bias Matters: Diving into Robust and Generalized Deep Image Forgery Detection [25.5] 一般化性と堅牢性は、偽造検知器の2つの重要な問題である。
実画像と偽画像の周波数差を除去する2段階の周波数アライメント手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:45:35 GMT)
Learning from Risk: LLM-Guided Generation of Safety-Critical Scenarios with Prior Knowledge [25.5] 本稿では,条件付き変分オートエンコーダ(CVAE)と大規模言語モデル(LLM)を統合した高忠実なシナリオ生成フレームワークを提案する。
我々のフレームワークは、リスクの高いイベントやロングテールイベントのカバレッジを大幅に向上させ、シミュレートされたトラフィック分布と実世界のトラフィック分布の一貫性を改善し、既存のルールやデータ駆動方式よりもはるかに難しいインタラクションに自律運転システムを公開します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:53:09 GMT)
A Comprehensive Characterization of the Vacuum Beam Guide and Its Applications [25.3] 提案された真空ビームガイド(VBG)は、大陸規模で毎秒テラキュービットを超える前例のない量子容量を提供する。
我々の理論解析は、広範囲の量子アプリケーションにおけるVBGの実現可能性とその期待性能を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:57:29 GMT)
SAM-MI: A Mask-Injected Framework for Enhancing Open-Vocabulary Semantic Segmentation with SAM [25.1] Mask-injected framework SAM-MIはSAMとOVSSモデルを統合し、課題に対処する。
SAM-MIはテキスト誘導スパースポイントプロンプターを使用して、以前の密度の強いグリッドのようなプロンプトの代わりにSAMのスパースプロンプターをサンプリングする。
DMIにはSAM生成マスクが組み込まれており、ラベルと直接組み合わせるのではなく、低周波と高周波を別々に誘導する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:52:07 GMT)
CostNav: A Navigation Benchmark for Cost-Aware Evaluation of Embodied Agents [25.0] 既存のナビゲーションベンチマークは、経済的な可能性を見越しながらタスク成功の指標に焦点を当てている。
CostNavは、ナビゲーション研究のメトリクスと商業性の間のギャップを定量的に露呈する最初の試みである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:42:28 GMT)
It Hears, It Sees too: Multi-Modal LLM for Depression Detection By Integrating Visual Understanding into Audio Language Models [24.0] うつ病は世界中で最も多い精神疾患の1つである。
抑うつ検出のための新しいマルチモーダルLLMフレームワークを提案する。
提案手法は,視覚的理解を伴う音声言語モデルを強化し,タイムスタンプレベルでの視覚的特徴の調整を行う。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:38:05 GMT)
Breaking Bad: Norms for Valence, Arousal, and Dominance for over 10k English Multiword Expressions [23.9] 本稿では,単語のVAD関連格付けを含む既存の辞書を補完する。
学会の信頼性は高い。
このレキシコンは、NLP、心理学、公衆衛生、デジタル人文科学、社会科学の幅広い研究を可能にする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:14:25 GMT)
GS-Checker: Tampering Localization for 3D Gaussian Splatting [23.7] 本稿では, 3DGSモデルにおける改ざん領域の探索手法であるGS-Checkerを提案する。
提案手法では, 3次元ガウスパラメータに3次元タンパリング属性を組み込んで, ガウスがタンパリングされたかどうかを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:33:31 GMT)
Continually Evolving Skill Knowledge in Vision Language Action Model [23.6] オープン環境における汎用ロボットインテリジェンスの開発には,継続的なスキル学習が必要である。
本稿では,タスク中心の知識空間をモデル化するT-Stellarと,階層的なタスクスキル構造を捉えるTS-Stellarという,知識駆動型連続学習フレームワークであるStellar VLAを提案する。
LIBEROベンチマークと実世界のタスクの実験は、ベースラインに対する最終成功率の平均50%以上の改善を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:25:13 GMT)
CREward: A Type-Specific Creativity Reward Model [23.6] CREwardは3つの創造性軸、幾何学、素材、テクスチャにまたがるタイプ固有の創造性報酬モデルである。
大規模視覚言語モデル(LVLM)による人間の判断と予測の相関分析
創造性評価,説明可能な創造性,創造的サンプル取得の3つの応用を,人間のデザインインスピレーションと,低ランク適応による創造的生成の導出の両面から検討する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:00:42 GMT)
Differential Smoothing Mitigates Sharpening and Improves LLM Reasoning [23.2] 大規模言語モデルの強化学習(RL)による微調整は,多種多様性の欠如による多種多様性の崩壊につながることが広く認識されている。
我々は、バニラRLと広く使われているエントロピーベースの言語を上回り、正確性と多様性の両方を確実に改善する原則的手法、テキスト微分スムーシングを導入する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:28:55 GMT)
Cross-Contrastive Clustering for Multimodal Attributed Graphs with Dual Graph Filtering [22.8] MMAG(MultimodalAttributed Graphs)は、エンティティ間の複雑な相互接続を表現するための表現型データモデルである。
本稿では,ノード表現学習に特徴分担成分を組み込んだデュアルグラフフィルタリング手法を提案する。
実験の結果,DGFは,地中トラスラベルに対して測定されたクラスタリング品質において,多種多様な最先端のベースラインを一貫して,かつ著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:56:40 GMT)
The Curious Case of Analogies: Investigating Analogical Reasoning in Large Language Models [22.6] 分析的推論は人間の認知の中心であり、様々な知的活動の重要な基盤となっている。
以前の研究で、LLMはタスクパターンや表面レベルの概念を表現できることが示されたが、これらのモデルが高レベルのリレーショナル概念をエンコードできるかどうかは不明だ。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:23:58 GMT)
On the Limits of Momentum in Decentralized and Federated Optimization [22.6] 連邦学習(FL)の運動量(英語版)は、統計的不均一性の影響を緩和するための解であるように見える。
我々は、循環的クライアント参加の下での運動量を分析し、それが統計的不均一性によって必然的に影響されることを理論的に証明する。
数値的な結果は理論を裏付けるものであり、深層学習実験は現実的な設定との関連性を確認している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:47:05 GMT)
On the Feasibility of Hijacking MLLMs' Decision Chain via One Perturbation [22.5] 単一の摂動は、決定連鎖全体をハイジャックすることができる。
Semantic-Aware Universal Perturbations (SAUP) は入力のセマンティクスに基づいて様々な結果をもたらす。
マルチモーダルな3つの大規模言語モデルの実験は、その脆弱性を実証している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:13:13 GMT)
Rectified SpaAttn: Revisiting Attention Sparsity for Efficient Video Generation [22.4] 拡散変換器はビデオ生成を支配するが、注意の二次的な複雑さは相当なレイテンシをもたらす。
注意間隔は、非クリティカルトークンを無視しながらクリティカルトークンに注目することで計算コストを削減します。
既存の手法は、注意配分における系統的バイアスを誘導する。
本稿では,暗黙のフルアテンション参照でアテンションアロケーションを補正するRectified SpaAttnを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:03:54 GMT)
Beyond Components: Singular Vector-Based Interpretability of Transformer Circuits [22.3] トランスフォーマーベースの言語モデルは複雑で分散した振る舞いを示すが、内部計算はあまり理解されていない。
既存の解釈可能性法は、注意頭と多層パーセプトロン層(MLP)を識別不能単位として扱い、その内部で学習された機能的サブ構造の可能性を見越す。
よりきめ細かい視点を導入し、これらの成分を特異な方向に分解し、重畳された独立な計算を1つのヘッドまたはメカニスティック内で明らかにする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:59:15 GMT)
Beluga: A CXL-Based Memory Architecture for Scalable and Efficient LLM KVCache Management [22.3] 我々は、GPUとCPUがCXLスイッチを介して共有された大規模メモリプールにアクセスできるようにする新しいメモリアーキテクチャであるBelugaを提案する。
CXLファブリック上でネイティブなロード/ストアアクセスセマンティクスをサポートすることで、我々の設計はローカルに近いメモリ遅延を提供する。
Belugaをベースとして,大規模KVCacheを推論で管理するシステムであるBeluga-KVCacheの設計と実装を行う。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:51:43 GMT)
Deep Learning as a Convex Paradigm of Computation: Minimizing Circuit Size with ResNets [21.9] 我々は、DNNが計算オッカムのカミソリを実装していることを示し、データに適合する最も単純なアルゴリズムを見つける。
これは、従来の統計手法よりも驚くほど広範囲に成功していることを説明できるかもしれない。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:11:39 GMT)
Wanderland: Geometrically Grounded Simulation for Open-World Embodied AI [21.5] Wanderlandは、マルチセンサーキャプチャ、信頼性の高い再構築、正確な幾何学、堅牢なビュー合成を特徴とする、リアルタイムのフレームワークである。
我々の研究は、オープンワールドの具体化AIにおける再現可能な研究のための新しい基盤を確立する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:43:55 GMT)
In-Context Compositional Learning via Sparse Coding Transformer [21.3] 本稿では,その構成作業能力を高めるため,注意の再構築を提案する。
スパース符号化では、データはそれらの構成規則を捉える係数を持つ辞書原子のスパース結合として表現される。
本研究では,S-RAVENデータセットとRAVENデータセットに対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:19:58 GMT)
DOGE: Differentiable Bezier Graph Optimization for Road Network Extraction [21.2] 微分可能なパラメトリック曲線に基づく表現であるベジエグラフを導入する。
我々のフレームワークDOGEは、セグメンテーションマスクから直接パラメトリックベジエグラフを学習することで、このパラダイムを運用する。
本手法は,大規模SpaceNetとCityScaleのベンチマークに基づいて,新しい最先端の手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:28:53 GMT)
On-Demand Multi-Task Sparsity for Efficient Large-Model Deployment on Edge Devices [21.0] スイッチングコストを最小限に抑えるために,オンデマンドマルチタスク・スパシティ・フレームワークを導入する。
従来のモノリシックアプローチに固有のコールドスタート遅延を効果的に軽減する。
実世界の自動運転プラットフォームでの実験は、我々のフレームワークがより優れたスイッチング効率を達成することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:54:04 GMT)
CANVAS: A Benchmark for Vision-Language Models on Tool-Based User Interface Design [20.7] 本稿では,ツールベースのユーザインタフェース設計におけるVLMのベンチマークであるCANVASを紹介する。
私たちのベンチマークには,3.3KモバイルUI設計から採取した地平線参照と組み合わせた598のツールベースのデザインタスクが含まれています。
結果は、主要なモデルがより戦略的ツール呼び出しを示し、設計品質が向上することを示唆している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:13:20 GMT)
Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning [20.5] AFROは,行動や再建を伴わない3次元表現を学習する自己指導型フレームワークである。
視覚的特徴の質と安定性を改善し,特徴の相違と逆一貫性の監視を取り入れた。
Diffusion Policyと組み合わせると、AFROは16のシミュレーションと4つの実世界のタスクの操作成功率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:15:32 GMT)
DeeAD: Dynamic Early Exit of Vision-Language Action for Efficient Autonomous Driving [20.2] Vision-Language Action (VLA) は、認識、推論、軌道生成を自律運転に統一するが、深いトランスフォーマースタックによる大きな推論遅延に悩まされる。
トレーニング不要で行動誘導型早期退避型フレームワークであるDeeADについて,中間軌道の物理的実現可能性を評価することにより,VLA計画の高速化を図る。
Bench2Driveベンチマークの実験では、計画品質と安全性を保ちながら、28%のトランスフォーマー層幅と29%のレイテンシ削減が示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:00:26 GMT)
Distilling Cross-Modal Knowledge via Feature Disentanglement [20.0] 本稿では,周波数分離型クロスモーダル知識蒸留法を提案する。
その結果,低周波特性は異なるモードで高い整合性を示すのに対し,高周波特性はクロスモーダルな類似性が極めて低いことがわかった。
本手法は従来のKD法と最先端のクロスモーダルKD法を大幅に上回る。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:45:37 GMT)
Geometry of Decision Making in Language Models [19.7] 大規模言語モデル(LLM)は様々なタスクにまたがる強力な一般化を示すが、それらの予測の背後にある内部決定プロセスは不透明である。
テクスト内在性次元(ID)のレンズを用いたLLMにおける隠れ表現の幾何学について検討する。
我々は28個のオープンウェイトトランスモデルを用いて大規模研究を行い、複数の推定器を用いて層間IDを推定する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:52:46 GMT)
AudioScene: Integrating Object-Event Audio into 3D Scenes [19.7] 本稿では,AudioScanNetとAudioRobothorという2つの新しいオーディオ空間シーンデータセットを提案する。
音声クリップと空間的に整列した3Dシーンを統合することで、我々のデータセットは、音声信号が空間的文脈とどのように相互作用するかの研究を可能にする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:28:13 GMT)
Online-PVLM: Advancing Personalized VLMs with Online Concept Learning [19.5] Online-PVLMは、双曲表現を利用したオンライン概念学習のフレームワークである。
OP-Evalは1,292のコンセプトと、多様な質問型を持つ30K以上の高品質なインスタンスからなるベンチマークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:25:30 GMT)
Temporal-Visual Semantic Alignment: A Unified Architecture for Transferring Spatial Priors from Vision Models to Zero-Shot Temporal Tasks [19.3] TimeArtistは、時系列のゆらぎと視覚概念のセマンティックレベルアライメントの先駆けとなる、時間-視覚変換フレームワークである。
我々の研究は、時間的ダイナミクスと視覚的セマンティクスのギャップを埋めて、クロスモーダル生成の新しいパラダイムを確立します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:35:48 GMT)
VGGTFace: Topologically Consistent Facial Geometry Reconstruction in the Wild [19.2] VGGTFaceは、眼内画像からトポロジカルに一貫した顔形状再構成を行うための自動アプローチである。
We augment VGGT with Pixel3DMM for Injecting Topology information through pixel-aligned UV values。
実験では、ベンチマークにおける最先端の結果と、ワイルドデータに対する印象的な一般化が示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:45:59 GMT)
RED-F: Reconstruction-Elimination based Dual-stream Contrastive Forecasting for Multivariate Time Series Anomaly Prediction [19.0] 本稿では,再構成に基づくDual-stream Contrastive Forecasting フレームワークを提案する。
このフレームワークは、絶対信号検出の難しいタスクを、相対軌道比較のより単純で堅牢なタスクに変換する。
6つの実世界のデータセットの実験は、異常予測タスクにおけるRED-Fの優れた能力を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:11:41 GMT)
DesignPref: Capturing Personal Preferences in Visual Design Generation [19.0] 20人のプロデザイナーが注釈付けしたUIデザイン生成の12k対比較データセットであるDesignPrefを紹介した。
パーソナライズされたモデルは、個々のデザイナの好みを予測するために、集約されたベースラインモデルよりも一貫して優れていることを示す。
我々の研究は、パーソナライズされたビジュアルデザイン評価を研究する最初のデータセットを提供し、個人デザインの味をモデル化する将来の研究を支援する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:19:10 GMT)
While recognizing actions, LMMs struggle to detect core interaction events [18.8] 我々は,Sone-Something-V2データセットの動画に20K以上の注釈付きインタラクションを備えた,この種の大規模データセットを紹介した。
AMTurk Human Annotator 250は、中核的な相互作用イベント、特に、いつ、どこでオブジェクトやエージェントがアタッチされるかをラベル付けした。
モデルは、ターゲットオブジェクトを確実に命名し、アクションを識別し、一貫性のある推論を提供するが、相互作用が開始または終了するフレームを常に識別できないことを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:38:41 GMT)
STAvatar: Soft Binding and Temporal Density Control for Monocular 3D Head Avatars Reconstruction [18.8] 既存の3次元ガウス散乱に基づく手法は、通常、ガウス多様体を線形ブレンドスキニングのみを通してメッシュ三角形とモデル変形に結合する。
本研究では,(1)UV空間内のガウス特徴オフセットを学習するために,画像ベースと幾何学的先行情報の両方を活用するUV-Temporal Soft BindingフレームワークであるSTAvatarを提案する。
STAvatarは、特に細かな細部を捉え、しばしば閉鎖された領域を再構築する際に、最先端の再構築性能を達成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:35:00 GMT)
3D-Aware Multi-Task Learning with Cross-View Correlations for Dense Scene Understanding [18.8] 現在のアプローチは主に2D画像空間におけるクロスタスク関係を捉えており、しばしば3D認識に欠ける非構造的特徴に繋がる。
MTLネットワークにおける幾何学的整合性として,ビュー間の相関,すなわちコスト容積を統合することで,この問題に対処することを提案する。
具体的には、タスク間で共有される軽量なクロスビューモジュール(CvM)を導入し、ビュー間で情報を交換し、クロスビューの相関を捉える。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:34 GMT)
AMB3R: Accurate Feed-forward Metric-scale 3D Reconstruction with Backend [18.6] AMB3Rは、計量スケールで密集した3次元再構成のためのフィードフォワードモデルである。
AMB3Rは運動から非平衡視覚計測(オンライン)や大規模構造へシームレスに拡張可能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:23:04 GMT)
HKRAG: Holistic Knowledge Retrieval-Augmented Generation Over Visually-Rich Documents [18.4] 本稿では,HKRAGを提案する。HKRAGは2つの知識タイプを明示的にキャプチャし,統合するために設計された,新しい総合的なRAGフレームワークである。
本フレームワークは,(1)有意な知識と細書知識を個別にモデル化し,クエリ関連情報検索を確保するための明示的なマスキング戦略を利用するハイブリッドマスキング型ホロスティック検索,(2)初期回答の不確かさを動的に評価し,最適な応答生成のために2つの異なる知識ストリームを統合する方法を積極的に決定する不確実性誘導エージェント生成の2つの重要なコンポーネントを特徴とする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:59:52 GMT)
Interactive AI NPCs Powered by LLMs: Technical Report for the CPDC Challenge 2025 [18.4] 本報告では,Commonsense Persona-Grounded Dialogue Challenge (CPDC 2025)におけるMSRA_SCの解決と成果について述べる。
我々は、GPU TrackとAPI Trackの両方で改善を統一する、シンプルで効果的なフレームワークを提案する。
最終評価では、Task 2 APIで1位、Task 1 APIで2位、そしてTask 3 APIとGPUトラックで3位にランクインし、このアプローチの有効性を実証しています。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:24:14 GMT)
Mosaic Pruning: A Hierarchical Framework for Generalizable Pruning of Mixture-of-Experts Models [18.4] SMOE(Sparse Mixture-of-Experts)のためのMosaic Pruning(MoP)を紹介する。
MoPは構造化クラスタ-then-selectプロセスを通じて、機能的に包括的な専門家のセットを構築する。
一つのコーパスを最適化する手法とは異なり、提案したモザイク・プルーニングは、プルーニングモデルが機能的に相補的な専門家の集合を保持することを保証します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:24:41 GMT)
HVAdam: A Full-Dimension Adaptive Optimizer [18.3] Anonは、古典と近代のギャップを埋めることのできる、最初の統一的で信頼性の高いフレームワークを提供する。
アニオンはSGDライクな行動とアダムライクな行動の両方を補間する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:05:40 GMT)
Tight Margin-Based Generalization Bounds for Voting Classifiers over Finite Hypothesis Sets [18.2] 一般化は、仮説セットのサイズ、マージン、与えられたマージンを持つトレーニングポイントの分数、トレーニングサンプルの数、失敗確率の間のトレードオフにおいて極めて厳密であることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:34:59 GMT)
M$^3$Prune: Hierarchical Communication Graph Pruning for Efficient Multi-Modal Multi-Agent Retrieval-Augmented Generation [18.1] 本稿では,M$3$Prune と呼ばれる新しいマルチモーダルマルチエージェント階層型通信グラフ PRUNing フレームワークを提案する。
当社のフレームワークは,タスクパフォーマンスとトークンオーバーヘッドの最適バランスを達成するために,さまざまなモダリティをまたいだ冗長なエッジを排除します。
本手法はシングルエージェントとロバストマルチエージェントのmRAGシステムにおいて一貫して性能を向上する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:29:13 GMT)
Private Data Imputation [18.0] 既存のデータ計算手法は、プライバシ保護を廃止したデータレンダリングのプライバシを侵害する。
プライベートデータ計算のための最初の最適化プロトコルを提示する。
我々のプロトコルは非常に効率的で、垂直分割データの場合2.4秒、水平分割データの場合8.4秒で実行されます。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:31:05 GMT)
VibraVerse: A Large-Scale Geometry-Acoustics Alignment Dataset for Physically-Consistent Multimodal Learning [17.8] VibraVerseは3次元形状から物理的属性、モーダルパラメータ、音響信号から因果連鎖をブリッジする大規模なデータセットである。
CLASPは、オブジェクトの物理的構造と音響応答の間の因果関係を保存する、クロスモーダルアライメントのための対照的な学習フレームワークである。
VibraVerseをベースとして、幾何から音への予測、音響誘導形再構成、モーダル表現学習のためのベンチマークタスクスイートを定義する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:48:49 GMT)
REFLEX: Self-Refining Explainable Fact-Checking via Disentangling Truth into Style and Substance [17.5] 本稿ではReason-Guided Fact-checking with Latent Explanations REFLEX paradigmを提案する。
バックボーンモデルの内部知識を活用して、検証精度と説明品質の両方を改善する、プラグアンドプレイの自己修正パラダイムである。
自己修正されたトレーニングサンプルはわずか465で、RELFEXは最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:06:23 GMT)
Adam Simplified: Bias Correction Simplified [17.2] 本稿では, バイアス補正の役割について考察する。
視覚と言語モデリングタスクに関する一連の体系的な説明を通じて、偏見補正を取り巻く従来の知恵が誤解を招くことを実証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:20:40 GMT)
SONIC: Spectral Optimization of Noise for Inpainting with Consistency [17.0] そこで本研究では,市販のテキスト・ツー・イメージ・モデルで絵を描くための新しいトレーニングフリーな手法を提案する。
本研究は, 初期シードノイズの最適化について, 学習不要な塗布の欠落成分について論じる。
本手法が各種塗工作業における効果を実証し,その有効性を検証した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:53:48 GMT)
Rethinking Semi-Supervised Node Classification with Self-Supervised Graph Clustering [16.3] 実際のグラフでは、ノードは、ラベルの不足を補うための豊富なシグナルを具現化した、密に編まれたコミュニティ/クラスタを形成する傾向がある。
本稿では,自己教師付きグラフクラスタリングと半教師付き分類を統合フレームワークに統合したNCGCを提案する。
実験の結果,提案したNCGCフレームワークは,一般的なGNNモデルよりも一貫して,かなり優れていた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:45:13 GMT)
Learning Subgroups with Maximum Treatment Effects without Causal Heuristics [16.1] 最適部分群探索は、データ生成モデルの回復を減らし、従って標準教師付き学習問題となる。
この手法をCART(おそらく最も広く使われている木に基づく手法の1つである)でインスタンス化し、最大限の処理効果でサブグループを学習する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:13:05 GMT)
VGGT4D: Mining Motion Cues in Visual Geometry Transformers for 4D Scene Reconstruction [15.9] VGGT4Dは、3DファウンデーションモデルであるVGGTを拡張して、堅牢な4Dシーン再構築を実現する。
当社のアプローチは,VGGTのグローバルアテンションレイヤが,リッチでレイヤワイドなダイナミックなキューを暗黙的にエンコードしている,という重要な発見に動機付けられています。
本手法は,動的物体分割,カメラポーズ推定,高密度再構成において優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:30:22 GMT)
Infinity-RoPE: Action-Controllable Infinite Video Generation Emerges From Autoregressive Self-Rollout [15.9] $infty$-RoPEは自動回帰ビデオ拡散のための統合された推論時フレームワークである。
ブロック相対論的RoPEは、時間的エンコーディングを移動局所参照フレームとして再構成する。
KV Flushは、グローバルシンクと最後に生成された潜在フレームの2つだけを保持することで、KVキャッシュを更新する。
RoPEカットは、時間的RoPE座標における制御された不連続を導入する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:46 GMT)
GHR-VQA: Graph-guided Hierarchical Relational Reasoning for Video Question Answering [15.9] 本稿では,ビデオシーケンス内の人間とオブジェクトの相互作用をキャプチャするグラフを組み込んだ新しいフレームワークを提案する。
従来の手法とは異なり、各フレームは複雑に表現され、フレームをまたいだグラフのヒューマンノードはシーンにリンクされる。
この人根構造は、人間と物体の相互作用に分解することで解釈可能性を高める。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:24:25 GMT)
Delta Sampling: Data-Free Knowledge Transfer Across Diffusion Models [15.4] Delta Sampling (DS)は、異なるアーキテクチャを持つベースモデル間の知識伝達を可能にする新しい方法である。
DSはデルタ(ベースモデルの適応前後のモデル予測の違い)を活用することで、完全に推論時に動作します。
これらの結果は,拡散型画像合成における知識伝達のための効果的なプラグアンドプレイ機構としてDSを強調した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:54:51 GMT)
Learning to Generate Human-Human-Object Interactions from Textual Descriptions [15.4] 本研究では,オブジェクトを含む共有インタラクションに携わる2人の関係をモデル化するための新しい研究課題を提案する。
我々はこの定式化をHHOI(Human-Human-Object Interactions)と呼ぶ。
本稿では,新たに取得したHHOIデータセットと,画像生成モデルを利用してHHOIデータを合成する方法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:17:23 GMT)
Probabilistic Hash Embeddings for Online Learning of Categorical Features [15.3] 分類的特徴値の語彙が変化している分類的特徴を持つストリーミングデータについて検討する。
ハッシュは、これらのカテゴリの値を埋め込みを学ぶ前に、固定サイズの特徴空間にマッピングするために一般的に使用される。
決定論的埋め込みはカテゴリーの到着順序に敏感であり,オンライン学習では忘れられがちであることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:18:45 GMT)
Foundry: Distilling 3D Foundation Models for the Edge [15.2] Foundation Model Distillation (FMD)は、大規模なSSLモデルをコンパクトプロキシに圧縮するための新しいパラダイムである。
3DポイントクラウドのためのFMDの最初の実装であるFoundryを紹介します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:53:56 GMT)
"Are We Done Yet?": A Vision-Based Judge for Autonomous Task Completion of Computer Use Agents [15.1] 本稿では、視覚言語モデルを用いて、スクリーンショットやタスク記述から直接タスク完了を評価する自律的な評価・フィードバックフレームワークを提案する。
本フレームワークは,タスク成功検出において最大73%の精度を実現し,評価者フィードバックを適用した場合のタスク成功率の平均相対的改善率は27%である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:40:33 GMT)
Extension and neural operator approximation of the electrical impedance tomography inverse map [15.1] 本稿では,カルダーンの逆導電性問題の解写像に対するノイズロスト・ニューラル演算子近似の問題を考察する。
境界測定はノイマン-ディリクレ写像の積分核の雑音摂動として実現される。
結果として得られる拡張は、カーネルから導電性への元の逆写像と同じ安定性を持つが、現在ではニューラル作用素近似にも適用可能である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:43:13 GMT)
MambaEye: A Size-Agnostic Visual Encoder with Causal Sequential Processing [14.9] MambaEyeは、低複雑さと因果プロセスベースの純粋なMamba2バックボーンを活用する、新しい因果シーケンシャルエンコーダである。
従来のMambaベースの視覚エンコーダとは異なり、我々の厳密な一方向アプローチは、状態空間モデルの本質的な因果性を保存する。
MambaEyeは、幅広い画像解像度、特にImageNet-1K分類タスクの15362$のような高解像度で、堅牢なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:18:18 GMT)
$\text{R}^2\text{R}$: A Route-to-Rerank Post-Training Framework for Multi-Domain Decoder-Only Rerankers [14.5] 動的エキスパートルーティングと2段階のトレーニング戦略を組み合わせたドメイン認識フレームワークであるR2Rを紹介する。
ドメインエキスパートを効率的に活性化するために、R2Rは軽量のLatent Semantic Routerを使用している。
以上の結果から,R2Rは強いドメイン間ロバスト性を持つドメイン特殊化に対するモデルに依存しないモジュラーアプローチであることが確認された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:54:51 GMT)
TReFT: Taming Rectified Flow Models For One-Step Image Translation [14.2] リクティファイド・フロー(RF)モデルは、最適な輸送理論を通じて高品質な画像とビデオ合成を行う。
最近の逆行訓練パラダイムであるCycleGAN-Turboは、1段階画像翻訳のための事前訓練された拡散モデルで動作する。
本稿では,一段階画像翻訳のためのTReFTを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:46:05 GMT)
Adaptive Knowledge Transfer for Cross-Disciplinary Cold-Start Knowledge Tracing [14.1] CDCKT(Cross-Disciplinary Cold-start Knowledge Tracing)は、対象分野における学生のインタラクションデータ不足という重大な課題に直面している。
本稿では,クロスディシプリナ・コールドスタート・ナレッジ・トラシング・フレームワークについて,エキスパートとアドリアティブ・ジェネレーティブ・ネットワークをベースとしたミックスド・オブ・エキスパートを提案する。
本手法の有効性を,20の超越性クロスディシプリナコールドスタートシナリオで検証した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:23:05 GMT)
Effective Command-line Interface Fuzzing with Path-Aware Large Language Model Orchestration [14.0] コマンドラインインターフェース (CLI) は、コマンド行オプションと入力ファイルの内容の両方を変更することで、プログラムをファジングする。
PILOTと呼ばれる新しいパス誘導型反復LLMオーケストレーションテストフレームワークを開発し、CLIアプリケーションをファジックする。
PILOTは最先端のファジィアプローチよりも高いカバレッジを実現し、51のゼロデイ脆弱性を発見する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:54:10 GMT)
From Passive Perception to Active Memory: A Weakly Supervised Image Manipulation Localization Framework Driven by Coarse-Grained Annotations [14.0] BoxPromptIMLは、アノテーションコストとローカライゼーションパフォーマンスのバランスをとる、新しい弱教師付きIMLフレームワークである。
ヒトの意識下記憶機構にインスパイアされた我々の特徴融合モジュールは、リアルタイムな観察手法を用いて、リコールされたパターンを積極的に文脈化するための二重誘導方式を採用している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:39:17 GMT)
Physics Steering: Causal Control of Cross-Domain Concepts in a Physics Foundation Model [13.9] 大規模物理基礎モデルの内部表現について検討する。
推論中に概念の方向をモデルに注入することで、予測を操ることができる。
本研究は,科学基盤モデルの理解と制御のための新たな道を開く。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:40:22 GMT)
Image Diffusion Models Exhibit Emergent Temporal Propagation in Videos [13.8] DRIFTは、SAM誘導マスクリファインメントを用いた事前学習画像拡散モデルを利用したビデオにおける物体追跡のためのフレームワークである。
実験時間最適化戦略-DDIMインバージョン、テキストインバージョン、適応頭部重み付け適応拡散機能の有効性を、頑健で一貫したラベル伝搬のために示す。
これらの知見に基づいて,SAM誘導マスクによる画像拡散モデルを利用したビデオにおける物体追跡のためのフレームワークであるDRIFTを紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:21:23 GMT)
Vision-Language Models for Automated 3D PET/CT Report Generation [13.8] 自己PET/CTレポート生成は, 臨床負荷軽減にますます重要である。
PETRG-3Dは、PETとCTのボリュームをエンコードし、スタイル適応プロンプトを組み込んだエンドツーエンドの3Dデュアルブランチフレームワークである。
PETRG-Score(PETRG-Score)は、悪性リンパ腫に特異的な評価プロトコルである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:07:57 GMT)
CounterVQA: Evaluating and Improving Counterfactual Reasoning in Vision-Language Models for Video Understanding [13.6] 視覚言語モデル(VLM)は近年,映像理解の大幅な進歩を見せている。
ビデオベースのベンチマークであるCounterVQAを導入する。
本研究は,言語モーダルから対実的推論能力を蒸留することにより,モデルの視覚的対実的推論能力を高めるポストトレーニング手法CFGPTを開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:59:55 GMT)
PRADA: Probability-Ratio-Based Attribution and Detection of Autoregressive-Generated Images [13.3] PRADAは、AR生成画像を確実に検出し、それらをそれぞれのソースモデルに属性付ける、シンプルで解釈可能なアプローチである。
実験により,PRADAは8つのクラス・ツー・イメージモデルと4つのテキスト・ツー・イメージモデルに対して高い効果を示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:40:48 GMT)
Memories Retrieved from Many Paths: A Multi-Prefix Framework for Robust Detection of Training Data Leakage in Large Language Models [13.2] 大規模なコーパスでトレーニングされた大規模な言語モデルは、トレーニングデータの冗長な記憶がちで、プライバシーと著作権の重大なリスクが生じる。
マルチメモリ化という新しいフレームワークを紹介します。
我々は、外部の敵探索がそれを引き起こす異なる接頭辞のターゲット数を特定することができれば、シーケンスを記憶として定義することでこれを定量化する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:40:24 GMT)
RefTr: Recurrent Refinement of Confluent Trajectories for 3D Vascular Tree Centerline Graphs [13.1] RefTrは3次元画像-グラフモデルであり、血管樹の中心生成を行う。
3次元医用画像における血管ツリー解析のための新しいフレームワークであるRefTrについて紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:22:57 GMT)
E2E-GRec: An End-to-End Joint Training Framework for Graph Neural Networks and Recommender Systems [13.0] 提案するE2E-GRecは,GNNトレーニングをレコメンダシステムと統合する新しいエンドツーエンドトレーニングフレームワークである。
本フレームワークの特徴は, 大規模クロスドメインなヘテロジニアスグラフからの効率的なサブグラフサンプリングにより, トレーニングのスケーラビリティと効率性を確保すること, (ii) グラフ特徴自動エンコーダを用いて, GNN が構造的に意味のある埋め込みを学習するための補助的な自己指導的タスクを実現すること, (iii) グラドノームに基づく動的損失分散と組み合わせた2段階の機能融合機構である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:59:22 GMT)
A Tale of Two Geometries: Adaptive Optimizers and Non-Euclidean Descent [13.0] 適応適応適応は、電流への勾配のみを使用する場合、正規化された急降下(NSD)に還元される。
凸設定では、適応性はより強い適応性滑らか性条件で制御される。
適応的滑らかさはネステロフ凸設定による適応の加速を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:13:53 GMT)
Adversarial Multi-Task Learning for Liver Tumor Segmentation, Dynamic Enhancement Regression, and Classification [12.8] 肝腫瘍セグメンテーション, ダイナミックエンハンスメントレグレッション, 分類は臨床的評価と診断に重要である。
エンド・ツー・エンドのフレームワークでこれらのタスクを同時に実行しようとする以前の作業はない。
本稿では,これらのタスクを同時に処理するための新しい統合フレームワークであるMTI-Netを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:33:24 GMT)
Sparse-to-Field Reconstruction via Stochastic Neural Dynamic Mode Decomposition [12.8] 風力場や海流のような現実世界のシステムの多くは、動的でモデル化が難しい。
動的モード分解(DMD)は、単純でデータ駆動の近似を提供するが、実用性はスパース/ノイズの観測によって制限される。
DMDの確率的拡張であるNODE-DMDを導入する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:39:50 GMT)
Clair Obscur: an Illumination-Aware Method for Real-World Image Vectorization [12.6] COVec は、Clair-Obscur の光陰性コントラスト原理に着想を得た照明対応ベクトル化フレームワークである。
ベクトル領域に固有の画像分解を導入し、イメージをアルベド、シェード、ライト層に分離する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:01:04 GMT)
Tell Model Where to Look: Mitigating Hallucinations in MLLMs by Vision-Guided Attention [12.5] VGA(Vision-Guided Attention)は、視覚トークンのセマンティックな内容を活用することで、まず正確な視覚的接地を構築する訓練自由な手法である。
画像キャプションにおいて、VGAは、既に記述されている領域を抑えることにより、生成中にこのガイダンスを動的に洗練する。
VGAでは、各トークンは1つのフォワードパスしか実行せず、無視できる遅延オーバーヘッドは4.36%である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:58:57 GMT)
Efficient and Fast Generative-Based Singing Voice Separation using a Latent Diffusion Model [12.4] 本研究では, このギャップを埋めるための拡散モデルの可能性について検討する。
本研究は,声帯と混合音の対に依存する歌唱音声の分離に焦点をあてる。
システムは、コンパクトなラテント空間に符号化されたサンプルを生成し、その後、それらをオーディオに復号する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:34:07 GMT)
Large Language Model Aided Birt-Hogg-Dube Syndrome Diagnosis with Multimodal Retrieval-Augmented Generation [12.2] 深層学習法は,びまん性嚢胞性肺疾患において,臨床サンプルの限定とクラス間分化の低さという2つの課題に直面している。
我々は,DCLD特有の専門知識と臨床の先例を統合した多モーダル検索拡張生成フレームワークであるBHD-RAGを提案する。
BHD-RAGは4種類のDCLDを含むデータセット上で検証され、精度が向上し、専門家の洞察と密接に一致したエビデンスベースの記述を生成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:55:23 GMT)
Image2Gcode: Image-to-G-code Generation for Additive Manufacturing Using Diffusion-Transformer Model [12.2] Image2GcodeはCADステージをバイパスし、画像や部分描画から直接プリンタ対応のGコードを生成するエンドツーエンドのデータ駆動フレームワークである。
2D画像から直接構造化Gコードを生成することにより、CADやSTL中間体の必要性をなくすことができる。
このアプローチは、単純なスケッチやビジュアル参照からのオンデマンドプロトタイピングをサポートし、上流2D-to-3D再構築モジュールと統合する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:55:12 GMT)
Translating Large-Scale C Repositories to Idiomatic Rust [12.2] 既存のC to Rustの変換テクニックでは、品質とスケーラビリティのバランスが取れない。
本稿では、効率的なリポジトリレベルのCから慣用的な安全なRust翻訳のための、完全に自動化されたパイプラインであるRustineを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:42:46 GMT)
Alzheimers Disease Progression Prediction Based on Manifold Mapping of Irregularly Sampled Longitudinal Data [12.2] アルツハイマー病(AD)の進行は、不規則にサンプリングされた縦型磁気共鳴画像(sMRI)データからモデル化される。
提案手法はまず,高次元sMRIから抽出した特徴を多様体空間に投射し,本質的な疾患進行の形状を保存する。
提案手法は,病状予測と認知スコア回帰の両面で,最先端モデルよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:28:37 GMT)
FREE: Uncertainty-Aware Autoregression for Parallel Diffusion Transformers [12.2] FREEは、並列検証で機能レベルの自動回帰を実行するために軽量なドラフトラを使用する、新しいフレームワークである。
ImageNet-$5122$の実験では、FREEは最大1.86倍の加速を実現し、FREE(relax)はさらに2.25倍のスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:12:10 GMT)
Quantifying the Privacy Implications of High-Fidelity Synthetic Network Traffic [12.1] 合成ネットワークトラフィックのための総合的なプライバシー指標を導入する。
本研究は,様々な代表生成モデルの脆弱性を評価し,攻撃成功に影響を与える要因について検討する。
我々の結果は、モデルとデータセット間でのプライバシーリスクのかなりのばらつきを明らかにします。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:04:02 GMT)
Learning Procedural-aware Video Representations through State-Grounded Hierarchy Unfolding [12.1] 我々は、オブジェクト構成のテキストスナップショットである'states'を、モデルが実際に見ることができるものにプロシージャを固定する視覚的に接地されたセマンティック層として導入する。
我々は、この洞察を新しいタスク-ステップ-ステート(TSS)フレームワークで定式化し、そこでは、観測可能な状態間の遷移を駆動するステップを通じてタスクが達成される。
提案手法は,タスク認識,ステップ認識,次のステップ予測など,複数の下流タスクのベースラインモデルより優れている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:46:11 GMT)
DeLightMono: Enhancing Self-Supervised Monocular Depth Estimation in Endoscopy by Decoupling Uneven Illumination [12.0] DeLight-Mono - 照度を分離した新しい自己教師型単分子深度推定フレームワークを提案する。
内視鏡画像は、設計された照明反射深度モデルで表現され、補助ネットワークで分解される。
不均一照明が深度推定に与える影響を軽減するために, 疎結合部品を利用した新規な損失を有する自己教師型共同最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:29:03 GMT)
Spatio-Temporal Trajectory Foundation Model - Recent Advances and Future Directions [12.0] ファンデーションモデル(FM)は強力なパラダイムとして登場し、さまざまなデータ分析と知識発見タスクを可能にしている。
このチュートリアルは、基礎モデル(TFM)の最近の進歩の包括的概要を提供することによってギャップに対処する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:47:03 GMT)
KRAL: Knowledge and Reasoning Augmented Learning for LLM-assisted Clinical Antimicrobial Therapy [12.0] KRAL(Knowledge and Reasoning Augmented Learning)は、低コストでスケーラブルで、プライバシ保護のパラダイムである。
教師モデル推論を用いて知識を自動抽出し、回答から質問への逆生成を通じて軌跡を推論する。
従来のレトリーバル拡張ジェネレーション(RAG)とスーパーバイザードファインチューニング(SFT)の手法を大きく上回っている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:53:19 GMT)
Comprehensive Design Space Exploration for Tensorized Neural Network Hardware Accelerators [12.0] 高次テンソル分解は、エッジ展開のためのコンパクトなディープニューラルネットワークを得るために広く採用されている。
このようなハードウェアを意識しない設計は、テンソル化モデルの潜在的な遅延とエネルギーの利点を曖昧にすることが多い。
テンソル化ニューラルネットワークの効率的なトレーニングと推論のために,これらの次元を統一設計空間内に統一する共同探索フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:21:00 GMT)
Towards A Tri-View Diffusion Framework for Recommendation [11.9] 熱力学的な観点から,推奨モデルの完全性について実験的に検討する。
我々は、推奨自由エネルギーの生成を通じて、両方の要因を組み込んだ最小主義拡散フレームワークを提案する。
提案するフレームワークは,精度と効率の点で,ベースラインよりも明確な優位性を持っている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:43:00 GMT)
Training-Free Diffusion Priors for Text-to-Image Generation via Optimization-based Visual Inversion [11.9] 最適化ベースのVisual Inversion (OVI) はトレーニングフリーでデータフリーの代替手段である。
OVIは、ランダムな擬似トークンから潜伏した視覚表現を初期化し、コサイン類似性を最大化するために反復的に最適化する。
カンディンスキー2.2で実施された実験では、OVIが従来の手法の代替となることが示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:20:21 GMT)
HyperbolicRAG: Enhancing Retrieval-Augmented Generation with Hyperbolic Representations [11.7] グラフベースのRAGは、大きな言語モデルが外部知識にアクセスできるようにする。
本稿では,ハイパーボリック幾何をグラフベースRAGに統合する検索フレームワークであるHyperbolicRAGを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:43:52 GMT)
Profile-LLM: Dynamic Profile Optimization for Realistic Personality Expression in LLMs [11.7] PersonaPulseは、状況対応ベンチマークをスコアリングツールとして統合しながら、ロールプレイプロンプトを反復的に強化するフレームワークである。
定量的評価は、PersonaPulseが生成したプロンプトが先行作業のプロンプトより優れていることを示している。
特定の性格特性に対しては、最適化過程を緩和することにより、人格評価の程度を部分的に制御することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:31:40 GMT)
Test-Time Alignment of Text-to-Image Diffusion Models via Null-Text Embedding Optimisation [11.6] テストタイムアライメントは、推論中に特定の報酬にモデルを適応させることを目的としている。
既存の方法は、目標の報酬関数を過度に最適化するか、あるいは過度に最適化(ハック)する傾向がある。
本研究では,Null-Text Test-Time Alignment (Null-TTA)を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:11:51 GMT)
DinoLizer: Learning from the Best for Generative Inpainting Localization [11.5] 本稿では,DINOv2をベースとしたDinoLizerについて紹介する。
本手法は,B-Freeデータセット上で合成画像を検出するために事前訓練したDINOv2モデルに基づいて構築する。
DinoLizerは次の最良のモデルよりも12%高いインターセクション・オーバー・ユニオン(IoU)を達成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:37:24 GMT)
Subtract the Corruption: Training-Data-Free Corrective Machine Unlearning using Task Arithmetic [11.4] CMU(Corrective Machine Unlearning)は、トレーニング後の汚職の影響を取り除くことを目的としている。
以前のCMUでは、典型的には、特定された破損したトレーニングサンプル("forget set")へのアクセスを前提としていた。
我々は、ソースフリーのCMUを定式化し、元のトレーニングデータが利用できないため、特定された不正なトレーニングサンプルの忘れ物セットを特定できない。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:14:27 GMT)
Diverse Video Generation with Determinantal Point Process-Guided Policy Optimization [11.4] 多様なビデオ生成のための新しいフレームワークであるDPP-GRPOを紹介する。
我々のフレームワークはプラグアンドプレイとモデル非依存であり、視覚的外観、カメラモーション、シーン構造など様々な世代にまたがる。
VBench, VideoScore, 人選好研究などの最先端のベンチマークでは, 映像の多様性が常に向上していることが示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:45 GMT)
Unsupervised Memorability Modeling from Tip-of-the-Tongue Retrieval Queries [11.2] 視覚的記憶可能性信号のモデル化のために設計された,最初の大規模教師なしデータセットを紹介する。
我々はRedditなどのオンラインプラットフォームからのToT検索クエリを活用している。
大規模視覚言語モデルは、GPT-4oのような最先端のモデルよりも優れており、オープンエンドの記憶可能性の記述を生成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:02:26 GMT)
Complex Instruction Following with Diverse Style Policies in Football Games [11.2] 本稿では,複雑なシナリオに対する新しいLC-RLパラダイムであるLanguage-Controlled Diverse Style Policies (LCDSP)を紹介する。
LCDSPは、DST(Diverse Style Training)法とSI(Style Interpreter)という2つの重要なコンポーネントから構成される。
我々は,LCDSPが抽象的戦術的指示を効果的に理解し,所望の多様な行動スタイルを正確に実行することを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:45:34 GMT)
Cisco Time Series Model Technical Report [11.2] 単変量ゼロショット予測器であるCisco Time Series Modelを紹介する。
この時系列基礎モデルは、マルチレゾリューション入力を受け入れることができる時系列モデルに対する一般的なアーキテクチャ革新の結果である。
結果として得られたマルチレゾリューションデコーダのみのモデルは、300億以上のユニークなデータポイントでトレーニングされ、半分以上が可観測領域から来ている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:12:52 GMT)
Real-time Monitoring of Neon Film Growth for Electron-on-Neon Qubits [11.1] 電荷状態の形成に対する制御は、回路表面上の固体Ne薄膜の成長を追跡し制御する技術を必要とする。
高温(高T_c$)YBCOマイクロ波共振器を用いたリアルタイムNe薄膜成長モニタを試作した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:15 GMT)
Mistake Attribution: Fine-Grained Mistake Understanding in Egocentric Videos [11.1] 自己中心型ビデオにおける人間の誤りのきめ細やかな理解のためのタスクである「Mistake Attribution(MATT)」を紹介した。
MATTは入力命令テキストまたは試行ビデオに誤りを関連付ける。
既存のデータセットから属性に富んだミスサンプルを自動的に構築するデータエンジンであるMisEngineを開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:29:12 GMT)
History-Augmented Contrastive Meta-Learning for Unsupervised Blind Super-Resolution of Planetary Remote Sensing Images [11.1] 本研究は, HACBSR(History-Augmented Contrastive Blind Super-Resolution)を提示する。
HACBSRはブラインド・スーパーレゾリューションのための教師なしのフレームワークである。
惑星探査における評価を支援するために, 多様な地質学的特徴を模擬した解析データであるCeres-50を導入する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:13:15 GMT)
Back to the Feature: Explaining Video Classifiers with Video Counterfactual Explanations [11.0] 対実的説明(英: Counterfactual explanations, CFE)は、モデル予測を変化させるモデルの入力を最小かつ意味的に意味のある修正である。
カウンターファクトビデオが有用であるためには、それらは物理的に妥当で、時間的に一貫性があり、スムーズな動きの軌跡を示す必要がある。
我々はビデオCFEを生成する最適化フレームワークであるBack To The Feature (BTTF)を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:31:30 GMT)
3D Motion Perception of Binocular Vision Target with PID-CNN [11.0] 本稿では,3次元座標誤差,速度,加速度を知覚するネットワークを訓練し,基本的な知覚能力を有する。
17の層と413万のパラメータを持つ比較的小さな畳み込みニューラルネットワークを設計した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:09:44 GMT)
Forgetting by Pruning: Data Deletion in Join Cardinality Estimation [10.9] Cardinality Estimation Pruning (CEP) は、マルチテーブル学習CEシステム向けに設計された非学習フレームワークである。
CEPは、特に高い削除率の下で、マルチテーブルシナリオにおいて、一貫して最低のQエラーを達成する。
CEP は収束を著しく減少させ、微調整時間の 0.3%-2.5% という無視可能な計算オーバーヘッドをもたらす。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:25:59 GMT)
Blind Adaptive Local Denoising for CEST Imaging [10.6] CEST(Chemical Exchange Saturation Transfer) MRIは、プロトン交換ダイナミクスを利用した低濃度代謝物の分子レベルでの可視化を可能にする。
従来のデノナイジング法は、この複雑なノイズのために設計されておらず、しばしば生体医学的分析において重要な基礎となる情報を変更する。
本稿では,これらの制約を克服するために,Blind Adaptive Local Denoising (BALD)法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:52:46 GMT)
VICoT-Agent: A Vision-Interleaved Chain-of-Thought Framework for Interpretable Multimodal Reasoning and Scalable Remote Sensing Analysis [10.6] 新たなマルチモーダルエージェントフレームワークVision-Interleaved Chain-of-Thought Framework (VICoT)を提案する。
VICoTは、視覚ツールを思考の連鎖に動的に組み込むことにより、明示的な多ラウンド推論を実装している。
また, 複雑なエージェントの挙動を小型軽量モデルに移行するためのReasoning Stack蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:00:28 GMT)
MindEval: Benchmarking Language Models on Multi-turn Mental Health Support [10.5] MindEvalは、現実的でマルチターンのメンタルヘルスセラピー会話において、言語モデルを自動的に評価するためのフレームワークである。
シミュレーションされた患者が生成したテキストに対する現実性を定量的に検証し、自動判断と人的判断との間に強い相関関係を示す。
われわれは12の最先端のLCMを評価し、AI固有のコミュニケーションパターンに特に弱点がある平均6点中4点以下で、すべてのモデルが苦戦していることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:47:40 GMT)
OmniRefiner: Reinforcement-Guided Local Diffusion Refinement [10.3] VAEベースの潜伏圧縮は微妙なテクスチャ情報を破棄し、アイデンティティと属性固有の手がかりが消滅する。
参照駆動補正の2段階を連続的に行う細部対応精細化フレームワークである ourMthd を紹介した。
実験により,我々のMthdは参照アライメントと細かなディテール保存を著しく改善することが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:57:49 GMT)
Front-Loaded or Balanced? The Mechanism through Which Review Order Affects Overall Ratings in Premium Service Settings [10.3] 本研究では,評価順序が認知的・情緒的経路を介して消費者評価に影響を与える心理的メカニズムを明らかにする。
3つの実験は、高品質なサービスコンテキストにおいて、レーティングファースト(vs.レビューファースト)インターフェースが消費者の全体的なレーティングを大幅に高めることを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:12:30 GMT)
Can Modern Vision Models Understand the Difference Between an Object and a Look-alike? [10.1] CLIPのような視覚言語モデルがこの違いを捉えているかどうかを考察する。
私たちはRoLA(RealまたはLookalike)という名前のデータセットを、リアルで見た目はLookalikeの例にまとめました。
この方向を画像やテキストの埋め込みに適用することで、クロスモーダル検索における識別が向上する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:49:13 GMT)
Disc3D: Automatic Curation of High-Quality 3D Dialog Data via Discriminative Object Referring [10.1] 3D Multi-modal Large Language Models (MLLM) は、大規模で高品質な3Dシーン対話データセットが不足しているため、2Dピアよりもまだ遅れている。
本稿では,生の3Dスキャンを,前回のコストのごく一部で,曖昧で高品質な対話データに変換する完全自動パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:32:48 GMT)
Material-informed Gaussian Splatting for 3D World Reconstruction in a Digital Twin [9.9] 従来のLiDAR-カメラ融合アプローチは複雑なキャリブレーションを必要とし、ガラスのような特定の材料といまだに苦労している。
多視点画像から3次元ガウススプラッティングを用いてシーンを再構成するカメラのみのパイプラインを提案する。
このアプローチは、光現実的再構成と物理に基づく物質割り当てを組み合わせることで、LiDAR-camera融合に匹敵するセンサーシミュレーションフィデリティを提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:25:19 GMT)
Operationalizing Pluralistic Values in Large Language Model Alignment Reveals Trade-offs in Safety, Inclusivity, and Model Behavior [9.9] 大規模言語モデル(LLM)は、人間の価値観の安全性と整合性のために人間のフィードバックを用いて、ますます訓練されている。
本研究では,複数値の組み込みがLLMの挙動にどう影響するかを,アライメントパイプラインにおける人口変動と設計パラメータを体系的に評価することによって検討する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:42:51 GMT)
LAYER: A Quantitative Explainable AI Framework for Decoding Tissue-Layer Drivers of Myofascial Low Back Pain [9.8] 筋膜痛 (MP) は慢性腰痛の主要な原因である。
既存の研究は主に筋肉に焦点を当て、フィカ、脂肪、その他の生体力学的役割を担う軟組織を無視している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:47:43 GMT)
CLIMATEAGENT: Multi-Agent Orchestration for Complex Climate Data Science Workflows [9.7] 我々は、エンドツーエンドの気候データ分析タスクを編成する、自律的なマルチエージェントフレームワークであるClimateAgentを紹介する。
Climate-Agent-Bench-85では、ClimateAgentが100%タスク完了とレポート品質スコア8.32を達成し、GitHub-Copilot(6.27)とGPT-5ベースライン(3.26)を上回りました。
その結果、動的API認識と自己修正実行を備えたマルチエージェントオーケストレーションが、気候科学分析タスクの信頼性とエンドツーエンドの自動化を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:27:33 GMT)
E-GEO: A Testbed for Generative Engine Optimization in E-Commerce [9.7] 生成エンジン最適化は、生成エンジンのコンテンツの可視性と関連性を改善する。
現在のGEOのプラクティスはアドホックで、その影響は理解されていないままです。
E-GEOは、EコマースGEO専用に開発された最初のベンチマークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:28:40 GMT)
HHFT: Hierarchical Heterogeneous Feature Transformer for Recommendation Systems [9.2] HHFTは、産業用CTR予測用に設計されたトランスフォーマーベースのアーキテクチャである。
トランスフォーマーはDNNベースラインを著しく上回り、CTR AUCは+0.4%向上した。
私たちは、このモデルをTaobaoのプロダクションプラットフォームにデプロイし、主要なビジネス指標の大幅な上昇を観察しました。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:07:56 GMT)
Assessing LLMs' Performance: Insights from the Chinese Pharmacist Exam [9.1] 中国では、国家薬剤師試験は、薬剤師の臨床的および理論的能力を評価するための標準化されたベンチマークとして機能する。
本研究では,ChatGPT-4oとDeepSeek-R1の2つの大規模言語モデルの性能を比較することを目的とした。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:31:25 GMT)
Robust 3D Brain MRI Inpainting with Random Masking Augmentation [9.0] 3Dスキャンで健康な組織を合成するための新しいディープラーニングフレームワークであるBraTS-Inpainting 2025 Challengeへの我々の提出について詳述する。
提案手法のコアとなるU-Netアーキテクチャは, 合成劣化領域の塗装を訓練し, 一般化を改善するために, ランダムマスキング拡張戦略で強化した。
このパフォーマンスは、BraTS-Inpainting 2025チャレンジで1位を獲得し、公式のリーダーボードでの2023年と2024年の大会で優勝したソリューションを上回った。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:26:10 GMT)
Bridging the Language Gap: Synthetic Voice Diversity via Latent Mixup for Equitable Speech Recognition [8.9] 音声タスクのための現代の機械学習モデルは、しばしば英語や他の豊富な言語で優れたパフォーマンスを示す。
この格差は、データ収集が困難かつコストのかかる低リソース言語において、不公平なパフォーマンスギャップをもたらします。
本稿では,このギャップを緩和するために設計された音声コーパスのための新しいデータ拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:35:57 GMT)
BrowseSafe: Understanding and Preventing Prompt Injection Within AI Browser Agents [8.9] 本稿では,実際のHTMLペイロードに埋め込まれた攻撃のベンチマークを合成し,インジェクション攻撃の現場を考察する。
私たちのベンチマークは、単なるテキスト出力ではなく、現実世界のアクションに影響を与えるインジェクションを強調することで、以前の作業を超えています。
アーキテクチャとモデルに基づく防御を両立する多層防衛戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:28:35 GMT)
GED-Consistent Disentanglement of Aligned and Unaligned Substructures for Graph Similarity Learning [8.8] 本稿では,GED-Consistent graph similarity learning frameworkであるGCGSimを提案する。
4つのベンチマークデータセットを用いた実験により,GCGSimが最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:07:30 GMT)
Cloud4D: Estimating Cloud Properties at a High Spatial and Temporal Resolution [8.7] Cloud4Dは、物理的に一貫した4次元のクラウド状態を再構築する最初の学習ベースのフレームワークです。
我々のシステムは、最先端の衛星計測と比較して、時空分解能のオーダー・オブ・マグニチュード向上を実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:46 GMT)
CodeFuse-CommitEval: Towards Benchmarking LLM's Power on Commit Message and Code Change Inconsistency Detection [8.6] バージョン管理は、コード変更の合理性を伝えるためにコミットメッセージに依存するが、これらのメッセージは、しばしば低品質で、メッセージコード不整合(MCI)として知られる差分と矛盾する。
大規模言語モデル(LLM)を用いたMCI検出のための最初のベンチマークであるCODEFUSE-COMMITEVALを紹介する。
我々は、元々一貫したコミットのルール誘導突然変異を通じて、7種類の一貫性のないメッセージを生成し、正と負の両方のサンプルを検証するために2倍の検証を適用した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:33:57 GMT)
Estimating Fog Parameters from a Sequence of Stereo Images [8.6] ステレオフォッギー画像の系列を考慮し,霧モデルのパラメータを推定し,それらを動的に更新する手法を提案する。
パラメータを逐次推定する従来の手法とは対照的に,アルゴリズムは新たな最適化問題を解くことにより,全てのパラメータを同時に推定する。
提案アルゴリズムは,霧の存在下での既存の視覚的局所化マッピング(SLAM)やオドメトリーシステムにおいて,アドオンモジュールとして容易に利用することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:25:41 GMT)
DRAFT-RL: Multi-Agent Chain-of-Draft Reasoning for Reinforcement Learning-Enhanced LLMs [8.5] DRAFT-RLは、Chain-of-Draft(CoD)推論をマルチエージェントRLトレーニングに統合する新しいフレームワークである。
我々は、コード合成、記号数学、知識集約型QAを含む複雑な推論タスクについて評価する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:33:42 GMT)
Space Alignment Matters: The Missing Piece for Inducing Neural Collapse in Long-Tailed Learning [8.5] クラスバランス条件下では、クラス特徴量と分類器重みが自然に単純な三角形のタイトフレーム(ETF)に整合していることが示される。
しかし、長い尾を持つ状態においては、試料の不均衡はNC現象の出現を防ぎ、一般化性能が低下する傾向にある。
アーキテクチャ変更なしに既存のロングテールメソッドにプラグアンドプレイする3つの明示的なアライメント戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:38:40 GMT)
A Systematic Analysis of Large Language Models with RAG-enabled Dynamic Prompting for Medical Error Detection and Correction [8.3] 我々は、ゼロショットプロンプト、ランダムな例による静的プロンプト、検索強化された動的プロンプトを評価する。
精度,リコール,偽陽性率 (FPR) , ROUGE-1, BLEURT, BERTScore を用いて誤差補正を行った。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:40:49 GMT)
Quantum-Resistant Authentication Scheme for RFID Systems Using Lattice-Based Cryptography [8.2] 高周波識別(RFID)システムのための新しい量子耐性相互認証方式を提案する。
本手法は格子ベースの暗号を用いており,特に不均一な短整数解(ISIS)問題の硬さを利用して量子抵抗を実現する。
本稿では,RFIDシステムにおいて,読取側通信チャネルとタグリーダ通信チャネルの両方の安全性に包括的に対処する最初の量子耐性認証プロトコルである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:49:29 GMT)
Patch-Level Glioblastoma Subregion Classification with a Contrastive Learning-Based Encoder [8.2] 我々は、トレーニングデータセット上に、専用の分類ヘッドを持つ事前訓練されたビジョントランスフォーマー(ViT)エンコーダを微調整する手法を開発した。
Synapseプラットフォームを用いて評価したオンライン検証セットの性能は, マシューズ相関係数0.7064, F1スコア0.7676を得た。
最終テストセットでは、MCC 0.6509、F1スコア 0.5330を達成し、BraTS-Pathology 2025 Challengeでチーム2位となった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:49:18 GMT)
Reinforcement Learning with $ω$-Regular Objectives and Constraints [8.1] 強化学習(RL)は通常、時間的、条件的、安全クリティカルな目標を表現する能力に制限のあるスカラー報酬に依存している。
我々は、$$-regularの目的と明示的な制約を組み合わせることで、両方の制限を同時に解決する。
線形計画法に基づくモデルベースRLアルゴリズムを開発し、その極限において、$$-regularの目的を満たす確率を最大化するポリシーを生成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:28:02 GMT)
Hierarchical Evaluation of Software Design Capabilities of Large Language Models of Code [7.9] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリング領域でますます採用されているが、コア設計概念に対する彼らの理解の堅牢性は、まだ不明である。
さまざまなレベルのガイダンスの下で、設計の不十分なソフトウェアフラグメントを生成します。
結合に関する推論は脆く、ノイズの多いオープンエンドのシナリオでパフォーマンスが崩壊する。
Reasoning-Trace分析はこれらの障害モードを確認し、結合のためのテキスト認識的ショートカットと結合のためのより徹底的な(まだ失敗している)分析を明らかにする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:50:00 GMT)
$Δ$-NeRF: Incremental Refinement of Neural Radiance Fields through Residual Control and Knowledge Transfer [7.9] $$-NeRFは、インクリメンタルなNeRFリファインメントのためのユニークなモジュラー残留フレームワークである。
衛星画像の実験では、$$-NeRFがジョイントトレーニングに匹敵するパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:46:15 GMT)
Learning to Compress Graphs via Dual Agents for Consistent Topological Robustness Evaluation [7.9] グラフをコンパクトな表現に圧縮し、トポロジ的構造とロバスト性プロファイルの両方を保存することを提案する。
Cutterは、バイタル検出エージェント(VDA)と冗長検出エージェント(RDA)からなる二重エージェント強化学習フレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:33:40 GMT)
A Training-Free Approach for Multi-ID Customization via Attention Adjustment and Spatial Control [7.8] マルチIDのカスタマイズはより難しく、2つの大きな課題を提起する。
推論中にしばしばコピーペースト問題に遭遇し、品質が低下する。
画像領域に異なるID埋め込みを注入するID分離型クロスアテンション機構を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:28:10 GMT)
ChessMamba: Structure-Aware Interleaving of State Spaces for Change Detection in Remote Sensing Images [7.8] ChessMambaは、複数時間入力を持つロバストCDのための状態空間モデリングを活用する構造認識フレームワークである。
ChessMambaは、ヘテロジニアスな機能を効果的に融合し、最先端の手法よりも相当な精度の向上を実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:43:28 GMT)
Zoo3D: Zero-Shot 3D Object Detection at Scene Level [7.8] Zoo3Dは、最初のトレーニング不要な3Dオブジェクト検出フレームワークである。
本手法は,2次元マスクのグラフクラスタリングにより3次元境界ボックスを構成する。
Zoo3Dをポイントクラウドを越えて拡張して,ポーズやアンポーズの画像を直接処理します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:29:06 GMT)
Optimize Flip Angle Schedules In MR Fingerprinting Using Reinforcement Learning [7.7] MRFにおけるフリップ角スケジュールを最適化するためのRLフレームワークを提案する。
本研究では,指紋分離性を高める非周期パターンを示す学習スケジュールを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:27:30 GMT)
DP-MicroAdam: Private and Frugal Algorithm for Training and Fine-tuning [7.4] 適応性は非プライベートなトレーニングにおける事実上の標準であり、より高速な収束とパフォーマンスの向上を可能にする。
対照的に、差分プライベートトレーニングは依然としてDP-SGD(典型的にはDP-SGD)で行われている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:17:48 GMT)
AI/ML based Joint Source and Channel Coding for HARQ-ACK Payload [7.4] 我々は、新しい「フリーランチ」学習アルゴリズムを用いてトランスフォーマーベースのエンコーダを学習し、エンコーダの前のソースを利用するために、コードワードごとのパワーシェイピングを提案する。
我々は,複数の情報ビットを持つ符号化ビットシステムへのNeyman-Pearsonテストの拡張を開発し,デコーダのACKビット上でのUnequal Error Protection of NACKを実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:31:26 GMT)
Kleinkram: Open Robotic Data Management [7.4] 我々は、大規模で非構造化のロボットデータセットを管理するという課題を解決するために設計された、フリーでオープンソースのシステムであるKleinkramを紹介します。
モジュラーでオンプレミスのクラウドソリューションとして設計されたKleinkramは、スケーラブルなストレージ、インデックス、データセットの共有を可能にする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:59:29 GMT)
Denoising Refinement Diffusion Models for Simultaneous Generation of Multi-scale Mobile Network Traffic [7.3] マルチスケールモバイルトラフィック生成のための拡散モデルZoomDiffを提案する。
DRDMはマルチステージノイズ付加・復調機構を採用しており、異なるステージが時間分解能でトラフィックを発生させることができる。
実世界のモバイルトラフィックデータセットの実験によると、ZoomDiffは、マルチスケールトラフィック生成タスクにおける最先端のベースラインよりも少なくとも18.4%改善されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:14:35 GMT)
Zero-Shot Transfer Capabilities of the Sundial Foundation Model for Leaf Area Index Forecasting [7.3] 本研究では,農業モニタリングにおけるリーフ面積指数(LAI)予測のための時系列基盤モデルのゼロショット予測能力について検討した。
ゼロショット設定では、入力コンテキストウィンドウが十分に長期的であるため、Sundialは十分に訓練されたLSTMより優れていることが判明した。
その結果, 農業・環境分野において, 実効的なプラグアンドプレイ予測を行うための事前学習型時系列基盤モデルの強みが浮き彫りとなった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:14:50 GMT)
Multi-Context Fusion Transformer for Pedestrian Crossing Intention Prediction in Urban Environments [7.3] 歩行者が歩行者の安全を改善し、交通事故を減らすためには、歩行者の横断意図予測が不可欠である。
本研究では、4つの鍵次元にまたがる多様な数値的属性を利用するマルチコンテキスト融合変換器を提案する。
JAADbeh, JAADall, PIEデータセットの精度は, それぞれ73%, 93%, 90%であった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:24:49 GMT)
Hierarchical Spatio-Temporal Attention Network with Adaptive Risk-Aware Decision for Forward Collision Warning in Complex Scenarios [7.2] 本稿では,階層型時空間注意ネットワークと動的リスク閾値調整アルゴリズムを併用した前方衝突警報フレームワークを提案する。
マルチシナリオデータセットでテストされ、完全なシステムは高い有効性を示し、F1スコアは0.912、偽警報率は8.2%、警告リード時間は2.8秒である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:57:29 GMT)
Improving Language Agents through BREW [7.1] 大規模言語モデル(LLM)ベースのエージェントは、構造化推論、ツールの使用、環境適応を必要とするタスクにますます適用される。
PPOやGRPOのようなモデルウェイト最適化手法の現在の訓練パラダイムは、ロールアウト収束の計算オーバーヘッドが高いため、比較的実用的ではない。
本稿では,下流タスクのエージェント最適化のためのフレームワークであるBREWを紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:34:54 GMT)
Conformal Safety Monitoring for Flight Testing: A Case Study in Data-Driven Safety Learning [7.0] 我々は、パイロットが不確実なパラメータで航空機の操縦を行う飛行試験における安全監視のためのデータ駆動型アプローチを開発した。
パイロットが直面している短期安全リスクのキャリブレーションされた統計モデルを、オフライン軌道シミュレーションを用いて学習する。
本研究では,不確実なパラメータを持つ飛行力学モデルを用いて,安全でないシナリオを確実に識別できることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:57:07 GMT)
Actionable and diverse counterfactual explanations incorporating domain knowledge and causal constraints [7.0] 電子メールマーケティング分野におけるサイバーセキュリティアプリケーションに動機づけられた我々は、Diverse, Actionable, and kNowledge-Constrained Explanations (DANCE) を生成する方法を提案する。
提案手法は,データから線形および非線形な制約を学習したり,専門家が提案する依存性グラフを統合して,対策が確実かつ実行可能なことを保証する。
この研究はポーランド最大の電子メールマーケティング会社であるFreshmailによる実生活事例調査に基づいて開発され、共同研究開発プロジェクトであるSendguardが支援している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:09:36 GMT)
BERT-APC: A Reference-free Framework for Automatic Pitch Correction via Musical Context Inference [6.8] BERT-APCは、新しい参照なし自動ピッチ補正フレームワークである。
ボーカル演奏の自然な表現性を保ちながらピッチ誤差を補正する。
BERT-APCは音符ピッチ予測において優れた性能を示し、高度に劣化したサンプルに対して第2のベストモデルであるROSVOTを10.49%上回った。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:16:49 GMT)
GFT-GCN: Privacy-Preserving 3D Face Mesh Recognition with Spectral Diffusion [6.6] 3D顔認証は、顔の形状をキャプチャすることで、堅牢な生体計測ソリューションを提供する。
その強いスプーフ抵抗は、高セキュリティアプリケーションに適しているが、保存された生体認証テンプレートを保護することは依然として重要である。
GFT-GCNは,スペクトルグラフ学習と拡散型テンプレート保護を組み合わせた3次元顔認識フレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:07:26 GMT)
Intelligent Image Search Algorithms Fusing Visual Large Models [6.6] 本稿では,オブジェクト検出を視覚的大モデルで融合する,インテリジェントな画像検索フレームワークであるDetVLMを提案する。
車両部品のデータセットの実験では、DetVLMは94.82%という最先端の総合的な精度を達成している。
また、ドライバーマスク着用のゼロショット検索では94.95%、州検索では90%以上の精度が達成されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:54:49 GMT)
Exploring Time-Step Size in Reinforcement Learning for Sepsis Treatment [6.4] 我々は,時間段階のサイズが状態表現学習,行動クローニング,政策訓練,政治外の評価にどのように影響するかを定量化する。
私たちの研究は、医療のオフライン強化学習における中核的な設計選択として、タイムステップのサイズを強調しています。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:05:10 GMT)
Selecting Belief-State Approximations in Simulators with Latent States [6.4] 状態リセットは基本的なものであるが、しばしば見過ごされるシミュレータの能力である。
この問題は、一般的な条件分布選択タスクに還元されることを示す。
我々はサンプリング専用アクセス下での新しいアルゴリズムと解析法を開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:34:01 GMT)
AutoFocus-IL: VLM-based Saliency Maps for Data-Efficient Visual Imitation Learning without Extra Human Annotations [6.3] AutoFocus-ILは、視覚模倣学習におけるデータ効率と一般化を改善するための、シンプルで効果的な方法である。
気晴らしや素早い相関よりも、タスク関連機能への参加をポリシーに導いている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:43:27 GMT)
Prompt Fairness: Sub-group Disparities in LLMs [6.3] 大きな言語モデル(LLM)は、応答の質において大きく異なる。
具体的には、原則として尋ねられるのと同じ質問にもかかわらず、異なるユーザやスタイルによるプロンプトの表現は、LLMから異なる応答を引き出す可能性がある。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:05:47 GMT)
A Physics-Informed Loss Function for Boundary-Consistent and Robust Artery Segmentation in DSA Sequences [6.2] 本稿では,予測と地道境界の相互作用をモデル化する新しいテクスタイトフィジックス・インフォームド・ロス(PIL)を提案する。
PILはクロスエントロピー、ディス、アクティブ・コンター、サーフェス・ロスといった従来の損失関数を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:08:14 GMT)
A Fully Probabilistic Tensor Network for Regularized Volterra System Identification [6.1] 本研究はBayesian Network Volterraカーネルマシン(BTN-V)を紹介する。
BTN-Vは正準ポリエイド分解を用いてボルテラ核を表現し、O(ID)からO(DIR)へのモデル複雑性を減少させる
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:24:52 GMT)
RPM-MCTS: Knowledge-Retrieval as Process Reward Model with Monte Carlo Tree Search for Code Generation [5.9] RPM-MCTSはモンテカルロ木探索に基づくプロセスリワードモデルとして知識検索を利用する効果的な手法である。
RPM-MCTSは, トークン消費の約15%削減を達成しつつ, 現在の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:06:02 GMT)
A Large Scale Heterogeneous Treatment Effect Estimation Framework and Its Applications of Users' Journey at Snap [5.8] 不均一処理効果(HTE)と条件平均処理効果(CATE)モデルは、全てのユーザに対して治療効果が同じであるという仮定を緩和する。
数億のSnapchatユーザーの実験データを用いてHTEを推定するための大規模産業フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:01:58 GMT)
Model-Based Learning of Whittle indices [5.8] BLINQは、インデックス可能、通信可能、一本鎖のマルコフ決定プロセス(MDP)のWhittle指標を学習する新しいモデルベースのアルゴリズムである。
BLINQは、正確な近似を得るために必要となるサンプルの数で、既存のQ-ラーニングアプローチよりも大幅に優れています。
総計算コストはQラーニングよりさらに低く、合理的に多くのサンプルがある。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:21:00 GMT)
Extracting conserved operators from a projected entangled pair state [5.6] テンソルネットワークの状態が与えられたら、状態が固有状態である保存作用素(ハミルトン群を含む)をどのように決定できるだろうか?
本手法は, フラストレーションフリーおよび非フラストレーションフリーの親ハミルトニアンの精度向上のために, 精度の高いiPEPSから抽出可能であることを示す。
特に、近距離RVB状態を基底状態とする4-サイトプラケット局所ハミルトニアンが見つかる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:43:47 GMT)
A deep learning model to reduce agent dose for contrast-enhanced MRI of the cerebellopontine angle cistern [5.5] 低用量シミュレーションから標準用量T1ceを復元するために、ディープラーニング(DL)モデルを訓練した。
DL保存したT1ceの画像品質とセグメンテーション性能を評価した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:40:43 GMT)
From Words to Wisdom: Discourse Annotation and Baseline Models for Student Dialogue Understanding [5.5] 本研究は、知識構築とタスク生産談話を含む学生会話の注釈付き教育対話データセットを導入する。
また,学習済みの大規模言語モデル GPT-3.5 と Llama-3.1 を用いて,会話のターン毎に,これらの言論特性を自動的に予測するベースラインモデルを構築した。
実験結果から,これらの最先端モデルがこの課題に対して準最適に実行し,今後の研究の可能性を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:46:00 GMT)
AdaCap: An Adaptive Contrastive Approach for Small-Data Neural Networks [5.5] 本稿では、置換に基づくコントラスト損失とTikhonovに基づくクローズドフォーム出力マッピングを組み合わせたトレーニングスキームであるAdaptive Contrastive Approach(AdaCap)を紹介する。
AdaCapは、特に残留モデルにおいて、小さなサンプル状態において一貫した統計的に重要な改善をもたらす。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:50:06 GMT)
RankOOD - Class Ranking-based Out-of-Distribution Detection [5.4] そこで我々は,Placket-Luce損失を伴うモデルのトレーニングに基づいて,ランクに基づくOOD(Out-of-Distribution)検出手法を提案する。
本手法は,Cross Entropy Lossを用いて学習した深層学習モデルを用いて,各IDクラス予測のランキングパターンを導出する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:02:56 GMT)
CarBench: A Comprehensive Benchmark for Neural Surrogates on High-Fidelity 3D Car Aerodynamics [5.4] CarBenchは、大規模な3Dカーエアロダイナミックスに特化した最初の包括的なベンチマークである。
我々は、自動車空力学のための最大の公開データセットであるDrivAerNet++の最先端モデルを評価する。
データ駆動エンジニアリングの進歩を加速するため、ベンチマークフレームワークをオープンソース化しました。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:53:43 GMT)
BRIC: Bridging Kinematic Plans and Physical Control at Test Time [5.3] BRICは,拡散型運動プランナと強化学習型物理制御装置間の実行差を解消する。
BRICの動作構成,障害物回避,人間とシーンの相互作用など,長期的課題に対する有効性を検証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:03:38 GMT)
Dynamical Properties of Tokens in Self-Attention and Effects of Positional Encoding [5.2] トークンが時間とともに互いに近づいたり近づいたりする場合、モデルのパラメータによって特徴付けます。
位置符号化の異なる形態、特に絶対的および回転的形態が、これらの力学系にどのように影響するかを考察する。
これらの知見により、絶対的あるいは回転的な位置符号化を持つモデルにおける収束挙動を緩和するトランスフォーマーアーキテクチャの簡易な改良を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:39:57 GMT)
Effects of Initialization Biases on Deep Neural Network Training Dynamics [5.2] 訓練されていない大きなニューラルネットワークは、クラスの小さなサブセットを好む傾向にある。
モデルをトレーニングするための損失関数の選択は、これらの初期のダイナミクスがどのように機能するかに大きな影響を与える。
その結果,損失関数の選択はネットワークの初期段階訓練に劇的な影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:27:14 GMT)
An Infinite BART model [5.2] 本稿では,2つの特徴を持つBARTモデルの一般化を提案する。
与えられたデータを使って自動的に決定木数を選択する。
各データポイントは、それらすべてではなく、弱い学習者の選択のみを使用することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:01:47 GMT)
A Unified Complexity-Algorithm Account of Constant-Round QAOA Expectation Computation [5.1] 一般グラフと任意の固定ラウンド$pge2$に対して、所定の角度での固定ラウンドQAOAの期待を正確に評価することは、$mathrmNP$-hardであることを示す。
フレームワークを汎用バイナリ非制約組合せ最適化(BUCO)に拡張する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:35:37 GMT)
Heterogeneous Multi-Agent Proximal Policy Optimization for Power Distribution System Restoration [5.0] 本稿では, 相互接続したマイクログリッド間の協調修復を実現するために, 不均一・エージェント強化学習フレームワークを適用した。
その結果、HARLフレームワークにマイクログリッドレベルの不均一性を組み込むことで、複雑なPSD修復のためのスケーラブルで安定で制約対応のソリューションが得られることが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:33:37 GMT)
Can Vibe Coding Beat Graduate CS Students? An LLM vs. Human Coding Tournament on Market-driven Strategic Planning [5.0] 大規模言語モデル(LLM)は、AI支援コード生成に革命をもたらした。
LLMは、適切にベンチマークする能力よりも優れています。
本稿では,実世界のロジスティクス最適化問題に基づくマルチエージェント推論駆動ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:40:22 GMT)
The rationality of radical pair mechanism in real biological systems [5.0] 化学磁気コンパスモデルにおけるラジカルペア機構(RPM)は、鳥の磁気ナビゲーションの最も有望な候補の一つであると考えられている。
実験室条件および生体条件下でのRPMモデルとRamsey様モデルとの比較を行った。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:30:28 GMT)
Mode multiplexing for scalable cavity-enhanced operations in neutral-atom arrays [5.0] 単一光キャビティの複数のモードを用いて,多数の原子上で高速かつ並列な動作を可能にするキャビティベースのアプローチを提案する。
本稿では,最大50モードの空洞モード多重化をサポートする実用的なシステム設計を提案する。
このアプローチは、中性原子配列のコア課題に対するスケーラブルなソリューションを提供し、実用的な量子技術の開発を前進させる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:13:11 GMT)
Mispronunciation Detection and Diagnosis Without Model Training: A Retrieval-Based Approach [4.7] 本研究では,事前訓練された音声認識モデルを用いた検索手法を活用した学習自由フレームワークを提案する。
本手法は,発音誤りの正確な検出と診断を達成しつつ,音素固有モデリングやタスク固有訓練を回避している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:26:34 GMT)
Attention Trajectories as a Diagnostic Axis for Deep Reinforcement Learning [4.7] トレーニング中のRLエージェントの注意力の発達を調査するために、注意指向メトリクス(ATOM)を導入する。
ATOMは、各ゲームのバリエーションに基づいて訓練されたエージェントの注意パターンを明確化し、これらの注意パターンの違いはエージェントの行動の違いに変換する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:20:42 GMT)
ScenarioCLIP: Pretrained Transferable Visual Language Models and Action-Genome Dataset for Natural Scene Analysis [4.6] PyramidCLIPは、グローバルな視覚的特徴と局所的な視覚的特徴の整合を目標としているが、オブジェクト間の関係の明示的なモデリングはいまだに欠けている。
我々は、既存の屋内および屋外の多様なシナリオデータセットから画像とテキストのペアを拡張することで、新しいデータセットを生成する。
いくつかのシナリオベースのタスクの総合的なベンチマークを確立し、それを多くのベースライン手法と比較した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:59:31 GMT)
Interpretable Air Pollution Forecasting by Physics-Guided Spatiotemporal Decoupling [4.6] 本研究では,物理誘導型,解釈可能な時間差学習フレームワークを提案する。
我々のモデルは、複数の予測地平線にまたがる最先端のベースラインを一貫して上回る。
予測性能と解釈可能性の統合は,実世界のアプリケーションにおいて,より信頼性の高い航空品質管理基盤を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:36:27 GMT)
Towards Trustworthy Wi-Fi Sensing: Systematic Evaluation of Deep Learning Model Robustness to Adversarial Attacks [4.6] 我々は、多様な脅威モデルと様々な攻撃リアリズムの下で、CSI深層学習モデルの堅牢性を評価する。
私たちの実験では、より小さなモデルは効率的で、クリーンなデータでも等しく機能するが、明らかにロバストさが低いことが示されています。
物理的に実現可能な信号空間の摂動は、実際の無線チャネルで実現可能なように設計されており、攻撃の成功を著しく減少させる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:24:29 GMT)
Open Vocabulary Compositional Explanations for Neuron Alignment [4.5] ニューロンがどのように情報をエンコードするかを理解することを目的として、構成的説明は概念間の論理的関係を利用してニューロンの活性化と人間の知識の間の空間的アライメントを表現する。
本稿では、任意の概念やデータセットのニューロンを探索する視覚領域のためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:45:37 GMT)
Guaranteed Optimal Compositional Explanations for Neurons [4.5] 構成的な説明は、ニューロンの活性化と概念の間の空間的アライメントを記述する。
ビームサーチは 最適性の理論的保証は 提供できない
本稿では,最適構成記述を計算するための最初のフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:50:22 GMT)
Vision-Language Memory for Spatial Reasoning [4.5] VLM$2$は空間推論のための永続記憶を持つ視覚言語モデルである。
VLM$2$は、ビデオのみのモデル間で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:59:02 GMT)
A Research and Development Portfolio of GNN Centric Malware Detection, Explainability, and Dataset Curation [4.4] グラフニューラルネットワーク(GNN)は,グラフ構造表現によるプログラム実行をキャプチャすることで,マルウェア検出に有効なツールとなっている。
本稿は、これらの問題に総合的に対処する6つの関連研究をまとめて紹介する。
ポートフォリオは、グラフベースのマルウェア検出と説明可能性の調査から始まり、その後、新しいグラフ削減方法、還元学習のアプローチの統合、説明の一貫性の調査に進む。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:40:39 GMT)
Click2Graph: Interactive Panoptic Video Scene Graphs from a Single Click [4.4] PVSG(Panoptic Video Scene Graph Generation)の最初のインタラクティブフレームワークであるClick2Graphを紹介する。
Click2Graphは、時間をかけて被写体を追跡し、対話するオブジェクトを自律的に発見し、被写体、オブジェクト、述語>三つ子を予測し、時間的に一貫したシーングラフを形成する。
本フレームワークでは,主観的なオブジェクトプロンプトを生成する動的インタラクション探索モジュールと,共同エンティティと述語推論を行うセマンティック分類ヘッドという2つの重要なコンポーネントを導入している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:45:28 GMT)
MIMIC-MJX: Neuromechanical Emulation of Animal Behavior [4.3] MIMIC-MJXは、キネマティックスから生物学的に証明可能な神経制御ポリシーを学ぶためのフレームワークである。
我々の実装は正確で、高速で、データ効率が良く、多様な動物体モデルに一般化できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:34:38 GMT)
CropVLM: Learning to Zoom for Fine-Grained Vision-Language Perception [4.3] VLM(Vision-Language Models)は、微細なイメージ理解を必要とするタスクに悩まされることが多い。
性能向上のための外部低コスト手法としてCropVLMを導入する。
CropVLMは強化学習を用いて訓練され、人間のラベル付きバウンディングボックスを監視信号として使用しない。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:21:26 GMT)
SPHINX: A Synthetic Environment for Visual Perception and Reasoning [4.2] 視覚知覚と推論のための合成環境であるSphinxを提案する。
モチーフ、タイル、チャート、アイコン、幾何学的プリミティブを使ってパズルを生成する。
このベンチマークでは、対称性検出、幾何学変換、空間推論、チャート解釈、シーケンス予測にまたがる25のタスクタイプがカバーされている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:00:47 GMT)
Softmax Transformers are Turing-Complete [4.2] 我々は、長さ一般化可能なソフトマックスCoT変換器がチューリング完全であることを証明した。
これは任意の言語に対してチューリング完全でないことを示す。
複雑な算術的推論を必要とする言語に対してトランスフォーマーを訓練することで、我々の理論を実証的に検証する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:08:39 GMT)
Time-Domain Linear Model-based Framework for Passive Acoustic Mapping of Cavitation Activity [4.2] パッシブ・アコースティック・マッピングにより空間マッピングと時間モニタリングが可能となる。
従来のビームフォーミング法は、基準放出開始時間がないため、軸方向分解能が限られている。
時間領域で完全に定式化された線形演奏モデルに基づくビームフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:48:04 GMT)
A Reality Check on SBOM-based Vulnerability Management: An Empirical Study and A Path Forward [4.0] Software Bill of Materials (SBOM)は、ソフトウェアサプライチェーン(SSC)を確保するための重要なツールである。
本稿では,2,414のオープンソースリポジトリに関する大規模な実証的研究を行い,これらの課題を現実的な観点から考察する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:52:16 GMT)
Designing Reputation Systems for Manufacturing Data Trading Markets: A Multi-Agent Evaluation with Q-Learning and IRL-Estimated Utilities [3.8] データマーケットプレースは、データ駆動イノベーションの重要な基盤として現れています。
購入者は、データを購入する前にコンテンツや品質を検証することができず、信頼性と品質保証が中心的な課題となっている。
本研究では,参加者行動のモデル化と信頼形成機構の評価を行うマルチエージェントデータマーケットシミュレータを開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:15:20 GMT)
Twin Hamiltonians, three types of the Dyson maps, and the probabilistic interpretation problem in quasi-Hermitian quantum mechanics [3.8] 準エルミート量子力学において、ハミルトニアンの最適で計算に優しい形式は一般に非エルミート的、$H neq Hdagger$である。
ここでは、Dyson map $: H to Mathfrakh$を介して$H$をHermitian形式に変換するという代替戦略に焦点をあてる。
このエルミートアイソスペクトル双対$mathfrakh$の$H$の構成は、従来の量子物理学と古典物理学の対応原理を復元するだけでなく、その網羅的な枠組みも提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:33:31 GMT)
Scalable Parameter-Light Spectral Method for Clustering Short Text Embeddings with a Cohesion-Based Evaluation Metric [3.8] 短いテキストの埋め込みをクラスタ化することは自然言語処理の基本的なタスクである。
本稿では,ラプラシア固有スペクトルの構造から直接クラスタ数を推定するスケーラブルなスペクトル法を提案する。
また、単純かつ解釈可能な評価指標である凝集比も提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:40:34 GMT)
Latent Diffusion Inversion Requires Understanding the Latent Space [3.7] エンコーダ/デコーダペアと対応する潜在符号は、潜在空間生成モデルに適用された反転技術によって無視されている。
拡散モデルは,高歪み領域にあるサンプルに過度に適合する傾向があり,非均一な暗記を示すことを示す。
そこで本研究では,デコーダのプルバック距離に対する1次元の寄与により,遅延次元をランク付けする原理的手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:21:33 GMT)
Generation, Evaluation, and Explanation of Novelists' Styles with Single-Token Prompts [3.7] 本稿では,19世紀の小説家のスタイルによる文の生成と評価のための枠組みを提案する。
大規模な言語モデルは、ディケンズ、オーステン、トウェイン、アルコット、メルヴィルといった作家の声でテキストを作成するために、最小限の単一音のプロンプトで微調整されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:25:44 GMT)
Dynamic local single-shot checks for toric codes [3.7] 単発誤り訂正は1ラウンドのシンドローム抽出のみを用いて誤りを抑えることを目的としている。
本研究では、局所的な単発チェックを導入し、チェックの重み付けに制約を課す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:09:25 GMT)
Supporting Students in Navigating LLM-Generated Insecure Code [3.6] BifrstはAI強化開発におけるセキュリティ意識を育む。
AIが強化された開発において、セキュリティ意識を育む教育フレームワークであるBifrstを紹介します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:49:36 GMT)
Scalable Data Attribution via Forward-Only Test-Time Inference [3.5] データ属性は、モデルを形作ったトレーニング例に遡る。
同一の1次対物目標を保存するデータ属性法を提案する。
提案手法は,大規模事前学習モデルにおける実時間データ属性の理論的枠組みを提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:11:39 GMT)
DUO-TOK: Dual-Track Semantic Music Tokenizer for Vocal-Accompaniment Generation [3.5] Duo-Tokは、音声伴奏音楽のためのソース対応のデュアルコードブックトークンである。
現代歌詞合成システムにおける再構築品質と言語モデル(LM)学習性の間の緊張の高まりを目標としている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:53:57 GMT)
Agentic AI-Empowered Conversational Embodied Intelligence Networks in 6G [3.4] 6G時代に入ると、複雑なタスク実行には、複数の組込みインテリジェントデバイス(MEID)間のセマンティックコラボレーションが不可欠である。
本稿では,マルチモーダルな特徴融合,適応型セマンティックコミュニケーション,タスクコーディネート,解釈可能性を統合した協調型会話型身体情報ネットワーク(CC-EIN)を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:16:30 GMT)
SX-GeoTree: Self-eXplaining Geospatial Regression Tree Incorporating the Spatial Similarity of Feature Attributions [3.4] 自己説明型地理空間回帰木であるSX-GeoTreeを提案する。
解釈可能なモデルに空間的類似性を組み込む方法を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:23:04 GMT)
Zero-Knowledge Proof Based Verifiable Inference of Models [3.3] モデル内部パラメータを公開せずに深層学習推論を検証できるゼロ知識フレームワークを提案する。
我々のフレームワークは、行列乗算、正規化、ソフトマックス、SiLUを含む線形ニューラルネットワーク層と非線形ニューラルネットワーク層の両方をサポートしている。
このアプローチの実用性を実証するため、DeepSeekモデルをZK-DeepSeekという名前の完全なSNARK検証バージョンに変換する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:19:16 GMT)
Decoupling and Damping: Structurally-Regularized Gradient Matching for Multimodal Graph Condensation [3.3] マルチモーダルグラフに適した新しい凝縮フレームワークSR-GMを提案する。
SR-GMは、ベースライン法と比較して精度を大幅に向上し、収束を加速する。
本研究は,資源制約環境下でのマルチモーダルグラフに基づく学習のためのスケーラブルな方法論を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:50:34 GMT)
Leveraging weights signals - Predicting and improving generalizability in reinforcement learning [3.3] 強化学習(RL)エージェントの一般化可能性(訓練されたエージェントとは異なる環境で実行可能であること)は重要な問題である。
本稿では、エージェントのニューラルネットワークの内部重みに基づいて、RLエージェントの一般化可能性スコアを予測する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:07:25 GMT)
Variational bagging: a robust approach for Bayesian uncertainty quantification [3.2] 本稿では,バラエティベイズとバッギング手法を統合した変分バッギング手法を提案する。
一般モデルに対する後部収縮率を含む強力な理論的保証を確立する。
我々は、パラメトリックモデル、有限混合モデル、ディープニューラルネットワーク、変分オートエンコーダ(VAE)への応用を通して、我々の変分バッグング法を数値的研究で説明する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:24:17 GMT)
Adaptive SGD with Line-Search and Polyak Stepsizes: Nonconvex Convergence and Accelerated Rates [3.2] 本稿では,2024年におけるAdaSLSとAdaPSの分析について述べる。
コントリビューションには、非一般の非関数の解析が含まれる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:33:00 GMT)
PRISM: Periodic Representation with multIscale and Similarity graph Modelling for enhanced crystal structure property prediction [3.0] PRISMは、マルチスケール表現と周期的特徴符号化を統合するグラフニューラルネットワークフレームワークである。
結晶構造に基づくベンチマークによる実験は、PRISMが最先端の予測精度を改善することを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:43:14 GMT)
Quantum-Enhanced Reinforcement Learning for Accelerating Newton-Raphson Convergence with Ising Machines: A Case Study for Power Flow Analysis [3.0] ニュートン・ラフソン法(NR法)は2次収束による電力流(PF法)方程式の解法として広く用いられている。
従来のNR初期化戦略は、しばしばこれらの課題に対処できず、収束が遅くなり、またばらつきさえも生じる。
本稿では、NRの初期化を最適化するために強化学習(RL)を用い、新しい量子強化RL環境更新機構を提案する。
その結果, 収束速度の大幅な向上, NR浸透回数の減少, 異なる運転条件下での堅牢性の向上が示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:11:34 GMT)
"When Data is Scarce, Prompt Smarter"... Approaches to Grammatical Error Correction in Low-Resource Settings [2.9] 文法的誤り訂正(英: Grammatical error correction, GEC)は、自然言語処理において重要な課題であり、テキスト中の文法的誤りを自動的に検出し、修正することを目的としている。
ほとんどのIndic言語にとって、GECは限られた資源、言語的多様性、複雑な形態学のために難しい課題である。
我々は,GPT-4.1やGemini-2.5,LLaMA-4といった最先端の大規模言語モデル(LLM)を用いたプロンプトベースのアプローチと,低リソース環境に適応するための数ショット戦略を併用することを検討した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:40:57 GMT)
A note on the impossibility of conditional PAC-efficient reasoning in large language models [2.9] 本研究では, 条件付きPAC効率保証は, 分散フリー環境では不可能であることを示す。
特に、非原子入力空間の場合、条件付きPAC効率を達成するアルゴリズムは自明でなければならない。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:08:08 GMT)
Provably Outlier-resistant Semi-parametric Regression for Transferable Calibration of Low-cost Air-quality Sensors [2.9] 本研究では,インド最大の多地点マルチソン・マルチセンサ・マルチ汚染型モバイル空気質監視ネットワークの1つであるLCAQ(LCAQ)センサの校正を事例として報告する。
LCAQセンサーは密集した空気品質監視ネットワークの構築に重要な役割を果たしていることが示されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:33:26 GMT)
Can LLMs Make (Personalized) Access Control Decisions? [2.9] 本研究では,大規模言語モデルの処理能力と推論能力を活用し,動的かつコンテキスト対応なアクセス制御決定を行うことを提案する。
ユーザ調査を行い、307の自然言語プライバシーステートメントと14,682のアクセス制御決定結果を得た。
以上の結果から,LLMはユーザの好みを反映し,ほとんどのユーザによる意思決定と比較して最大86%の精度を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:11:23 GMT)
Error-structure-tailored early fault-tolerant quantum computing [2.8] 量子アルゴリズムでは、論理回転ゲート$R_Z_L(varphi)$が必須成分である。
本研究では, 耐故障条件を解析する誤り構造調整耐故障性について考察する。
分散結合ハミルトニアンにより実装された安定符号を用いた1フォールトトレラント連続角回転ゲートを設計する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:51:46 GMT)
EnergyTwin: A Multi-Agent System for Simulating and Coordinating Energy Microgrids [2.8] EnergyTwinはエージェントベースのマイクログリッドシミュレーション環境で、物理的基盤モデルと予測インフォームド、ローリングホライゾン計画、交渉を結合する。
その結果, 予測駆動型ローリングホライゾンプランニングは, 地域エネルギーの自己充足性を高め, 電池備蓄率を高め, 低抵抗運転状態への曝露を減少させることがわかった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:19:40 GMT)
How to Purchase Labels? A Cost-Effective Approach Using Active Learning Markets [2.7] ラベルの購入手段として,アクティブな学習市場を紹介し,分析する。
これは、機能やサンプルを購入するためにすでに存在する多くの提案とは対照的である。
本稿では,単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:34:33 GMT)
Ranking-Enhanced Anomaly Detection Using Active Learning-Assisted Attention Adversarial Dual AutoEncoders [2.7] Advanced Persistent Threats(APT)は、そのステルス性と長期的な性質から、サイバーセキュリティにおいて重要な課題となっている。
現代の教師付き学習手法は、しばしば現実世界のサイバーセキュリティ環境において不足する広範囲なラベル付きデータを必要とする。
本稿では,教師なし異常検出にAutoEncodersを活用する革新的な手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:42:12 GMT)
Frailty-Aware Transformer for Recurrent Survival Modeling of Driver Retention in Ride-Hailing Platforms [2.6] 本研究では,大規模プラットフォームデータを用いた繰り返し生存過程としてアイドル挙動を定式化する。
その結果,提案したFACT(Frailty-Aware Cox Transformer)は,最高時間依存のC指標と最低のブライアスコアを達成できた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:04:04 GMT)
Context-Aware Token Pruning and Discriminative Selective Attention for Transformer Tracking [2.6] 1ストリームトランスフォーマーベースのトラッカーはテンプレートと検索領域トークンを連結することで顕著な性能を示した。
ターゲットテンプレートトークンに出席するバックグラウンド検索トークンの過剰な割合は、トラッカーの識別能力を弱める。
CPDATrackは、バックグラウンドトークンとイントラクタトークンからの干渉を抑制するために設計された、新しいトラッキングフレームワークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:12:17 GMT)
LLMs for Automated Unit Test Generation and Assessment in Java: The AgoneTest Framework [2.5] AgoneTestは、Javaにおける大規模言語モデル生成ユニットテストの評価フレームワークである。
コンパイルされるテストのサブセットでは、LLMの生成したテストは、カバレッジと欠陥検出の点で、人間によるテストと一致またはオーバーすることができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:33:00 GMT)
SelfMOTR: Revisiting MOTR with Self-Generating Detection Priors [2.5] SelfMOTRは自己生成前の検出に依存する新しいトランスフォーマーである。
DanceTrackでは、SelfMOTRは、最新の最先端のエンドツーエンドトラッキング手法と競合して、強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:08:09 GMT)
InferF: Declarative Factorization of AI/ML Inferences over Joins [2.4] 機械学習がマルチウェイ結合よりもAI/ML推論にどう影響するかを示す。
我々は,MetaのオープンソースデータベースエンジンであるVelox上でInferFを実装し,実世界のデータセットで評価する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:55:43 GMT)
Automated Histopathologic Assessment of Hirschsprung Disease Using a Multi-Stage Vision Transformer Framework [2.4] Hirschsprung病は腸間膜叢に神経節細胞が欠如していることが特徴である。
病理医の診断アプローチを模倣したビジョントランスフォーマー(ViT-B/16)に基づく3段階セグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:53:47 GMT)
Realizing Fully-Integrated, Low-Power, Event-Based Pupil Tracking with Neuromorphic Hardware [2.3] 本報告では,デバイス上での完全統合による,電池駆動型ウェアラブル型瞳孔追跡システムについて紹介する。
我々のソリューションは、厳密なメモリと帯域幅の制約に最適化されたゲート時間デコーディングを備えた、新しい不確実性量子化スパイクニューラルネットワークを備えている。
我々の研究は、エンド・ツー・エンドのニューロモルフィック・コンピューティングが、次世代のエネルギー効率の高いウェアラブルシステムに対して実用的で常に目の動きを追跡することを実証している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:58:23 GMT)
Length-MAX Tokenizer for Language Models [2.2] 本稿では,文字単位の平均トークンを最小限に抑える言語モデルのための新しいトークン化手法を提案する。
Length-MAXトークン化器は99.62%の語彙範囲を達成し、アウトオブボキャブラリレートはテストセットで0.12%と低い。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:56:56 GMT)
Mirror, Mirror on the Wall -- Which is the Best Model of Them All? [2.2] 大規模言語モデル(LLM)は多くのアプリケーションで最もトランスフォーメーションの高いツールの1つになっている。
我々は、さらなるトレーニングのためにモデルを選択する際に考慮すべき2つの主要な次元があると主張している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:52:45 GMT)
Universe of Thoughts: Enabling Creative Reasoning with Large Language Models [1.9] 認知科学の原理に触発された創造的推論のための計算フレームワークを導入する。
本稿では,テキスト探索,テキスト変換,テキストUoTという3つの中心的創造的推論パラダイムを提案する。
UoTは創造的推論において優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:34:59 GMT)
Differential privacy with dependent data [1.9] We show that Winsorized mean estimator can be used under dependent for bounded data。
我々は,対数ソボレフ不等式による関節非有界観測への依存性を定式化する。
我々の研究は、依存データに対する差分プライバシー(DP)の体系的研究に向けた第一歩となる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:41:49 GMT)
Revisiting KRISP: A Lightweight Reproduction and Analysis of Knowledge-Enhanced Vision-Language Models [1.9] Facebook AI ResearchがKRISPを導入した。これは、構造化された外部知識を、視覚言語推論のためのパイプラインに統合するものだ。
その有効性にもかかわらず、元のモデルは産業規模の訓練のために開発され、計算的に要求され、大きなバックボーンに強く結びついている。
本研究では,KRISPを異なる角度から再検討し,パラメータが著しく少ない軽量な再現性を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:37:19 GMT)
PaTAS: A Parallel System for Trust Propagation in Neural Networks Using Subjective Logic [1.8] 本稿では,ニューラルネットワークの信頼をモデル化・伝播するフレームワークであるemphParallel Trust Assessment System (PaTAS)を紹介する。
実世界および敵対的データセットの実験は、PaTASが解釈可能、対称性、収束信頼推定を生成することを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:15:36 GMT)
Gated Uncertainty-Aware Runtime Dual Invariants for Neural Signal-Controlled Robotics [1.8] GUARDIANは、ニューラルネットワーク制御ロボットのためのリアルタイム神経シンボル検証のためのフレームワークである。
GUARDIANは、信頼度校正された脳信号デコードと象徴的なゴールグラウンドとを結合することにより、論理的安全性と生理的信頼の両方を強制する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:05:05 GMT)
Multivariate Forecasting of Bitcoin Volatility with Gradient Boosting: Deterministic, Probabilistic, and Feature Importance Perspectives [1.8] 本研究は,Bitcoinが実現したボラティリティの確定的および確率的予測に,光グラディエントブースティングマシン(LGBM)モデルの適用について検討した。
本稿では,LGBMに基づくモデルの性能評価を行い,それとエコノメトリと機械学習のベースラインを比較した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:26:13 GMT)
R3A: Reliable RTL Repair Framework with Multi-Agent Fault Localization and Stochastic Tree-of-Thoughts Patch Generation [1.8] 本稿では,信頼性向上のための基本モデルに基づく自動プログラム修復フレームワークR3Aを提案する。
実験によると、R3Aは所定の時間内にRTL-repairデータセットの90.6%のバグを修正できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:08:48 GMT)
A Single-Root, Multi-Curve, Context-Isolated, PQC-Pluggable Cryptographic Identity Primitive with Stateless Secret Rotation [1.7] 本稿では,MSCIKDFについて紹介する。MSCIKDFは単一ルート,マルチカーブ,コンテクスト分離,PQCプラガブル暗号IDプリミティブである。
アイデンティティは決定論的に導出されるが、様々な文脈で暗号的に強制的に分離される新しいアーキテクチャ基盤を定義する。
ゼロリンク性、マルチカーブ独立性、コンテキスト間の相関に対する耐性など、強力なセキュリティ不変性を実現している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:15:18 GMT)
Deep Hybrid Model for Region of Interest Detection in Omnidirectional Videos [1.7] 360ドルのビデオストリーミングでは、関心の領域が重要な役割を担っている。
本研究では、関心のある地域を表すために、有給地域を参照する。
本発明の方法は、フレームを得るためのビデオを前処理し、関心領域を予測するためのハイブリッド・サリエンシ・モデルを開発し、最終的にハイブリッド・サリエンシ・モデルの出力予測を後処理して各フレームの出力領域を得る。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:37:37 GMT)
SVBRD-LLM: Self-Verifying Behavioral Rule Discovery for Autonomous Vehicle Identification [1.6] 本稿では,実際の交通映像から解釈可能な行動ルールを自動的に検出し,検証し,適用するフレームワークであるSVBRD-LLMを提案する。
このフレームワークは、YOLOv8とByteTrackを使用して車両軌跡を抽出し、キネマティックな特徴を計算し、GPT-5ゼロショットプロンプトを使用して自律車と人力車を比較している。
1500時間以上の実際の交通ビデオの実験では、このフレームワークは90.0%の精度と93.3%のF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:09:09 GMT)
Elucidating the Inter-system Crossing of the Nitrogen-Vacancy Center up to Megabar Pressures [1.6] 窒素-原子価の色は、ダイヤモンドアンビル細胞に中心を置き、メガバール圧力で量子センシングを行うための扉を開いた。
一般応力条件下でのNVの光学特性の完全な記述を開発する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:00 GMT)
The Text Aphasia Battery (TAB): A Clinically-Grounded Benchmark for Aphasia-Like Deficits in Language Models [1.6] Text Aphasia Battery (TAB) は、大規模言語モデル(LLM)における失語症様の欠陥を評価するためにQuick Aphasia Battery (QAB) から適応されたテキストのみのベンチマークである。
本稿ではTABの設計、サブテスト、評価基準について詳述する。
我々はTABを,人工システムにおける言語欠陥を解析するための臨床応用,拡張性のあるフレームワークとしてリリースする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:16:38 GMT)
FRAGMENTA: End-to-end Fragmentation-based Generative Model with Agentic Tuning for Drug Lead Optimization [1.6] FRAGMENTAはドラッグリード最適化のためのエンドツーエンドフレームワークである。
これには、断片化を"語彙選択"問題として再編成する、新しい生成モデルが含まれている。
また、ドメインの専門家からの会話フィードバックを通じて目的を洗練するエージェントAIシステムも含まれている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:17:54 GMT)
Engel p-adic Isogeny-based Cryptography over Laurent Series: Foundations, Security, and an ESP32 Implementation [1.5] 量子攻撃に対するIoT(Internet of Things)のセキュリティには、コンパクトで、マイクロコントローラ上で効率的に動作する公開鍵暗号が必要である。
p-進ローラン級数上の新規エンゲル展開を通じて超特異楕円曲線等質データを符号化する最初のアイソジニーフレームワークを提案する。
エンゲル算術は局所的であり、固定精度のp進演算を認め、組込みターゲットに適した低メモリの分岐正則カーネルでマイクロコントローラ効率を実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:35:54 GMT)
Energy-Efficient Federated Learning via Adaptive Encoder Freezing for MRI-to-CT Conversion: A Green AI-Guided Research [1.5] モデル性能を維持しながら、エネルギー消費と計算負荷を低減するため、グリーンAI指向の適応層凍結戦略を提案する。
提案手法は, エンコーダ重量の計測値とラウンド間の相対差に基づいて, エンコーダ重量を凍結することにより, フェデレーショントレーニングを最適化する。
また, 同等の非凍結環境と比較して, トレーニング時間, 総エネルギー消費量, CO2eq排出量を最大23%削減した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:35:51 GMT)
Hey there! You are using WhatsApp: Enumerating Three Billion Accounts for Security and Privacy [1.4] WhatsAppはいまだに大規模な列挙に対して非常に脆弱であることを示す。
私たちはブロックや有効レート制限に遭遇することなく、1時間に1億以上の電話番号を調査しました。
また、2021年のFacebookデータリークで公表された電話番号の半分近くが、WhatsAppでまだアクティブであることも示しています。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:27:05 GMT)
Securing the Model Context Protocol (MCP): Risks, Controls, and Governance [1.4] 我々は、MPPの柔軟性を生かした3種類の敵に焦点を当てる。
早期のインシデントと概念実証攻撃に基づいて,MPPが攻撃面を増加させる方法について述べる。
本稿では,ユーザ単位の認証とスコープ認証を含む,一連の実用的な制御を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:24:26 GMT)
Adversarial Confusion Attack: Disrupting Multimodal Large Language Models [1.4] マルチモーダル大言語モデル(MLLM)に対する新たな脅威クラスであるAdversarial Confusion Attackを導入する。
ジェイルブレイクやターゲットの誤分類とは異なり、目標は、モデルが不整合または確実な出力を生成するような、系統的な破壊を誘発することである。
MLLMを駆使したエージェントが確実に動作しないように、敵画像がウェブサイトに埋め込まれる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:00:31 GMT)
Asymptotic yet practical optimization of quantum circuits implementing GF($2^m$) multiplication and division operations [1.3] 我々は、$(2m)$乗算および除算演算のために最適化された量子回路を提案する。
我々のアシラフリーGF回路はゲートカウントの複雑性が$O(mlog3)$であり、以前の最高値の$O(m2)$よりも改善されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:43:08 GMT)
Critical Evaluation of Quantum Machine Learning for Adversarial Robustness [1.3] 量子機械学習(QML)における対向ロバスト性の体系化について述べる。
我々は、ブラックボックス、グレーボックス、ホワイトボックスの3つの脅威モデルに代表攻撃を実装した。
本研究は,実用展開のためのセキュアでレジリエントなQMLアーキテクチャの開発を導くものである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:00:58 GMT)
Generating Querying Code from Text for Multi-Modal Electronic Health Record [1.2] 我々は、textbfTablesと臨床用textbfTextの両方を統合した、公開データセットTQGenを構築した。
医療用テキスト処理において,テキスト処理モジュールをコール可能なツールとしてカプセル化するツールセットの概念を導入した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:43:51 GMT)
Complexity Reduction Study Based on RD Costs Approximation for VVC Intra Partitioning [1.2] 2つの機械学習技術が提案され、比較されている。
提案手法はサイズに依存しず,隣接するブロックのレート・ディストーション(RD)コストを入力特徴として組み込む。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:25:57 GMT)
Rectifying Distribution Shift in Cascaded Precipitation Nowcasting [1.2] 降水流速計は、現在のレーダー観測を活用して、高潮予報を提供することを目的としている。
局所性の発生から平均場シフトの是正を明確に結合するフレームワークであるRectiを紹介する。
2つのレーダデータセットの実験により、Rectiは既存の最先端メソッドよりも大幅にパフォーマンスが向上していることが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:57:01 GMT)
Pre-train to Gain: Robust Learning Without Clean Labels [1.2] ノイズの多いラベルでディープネットワークを訓練すると、一般化が悪く、精度が低下する。
ラベルなしで特徴抽出器のバックボーンを事前トレーニングすることで、クリーンなラベルのサブセットを必要とせずに、よりノイズの強いモデルをトレーニングできる。
提案手法は,低雑音レベルにおけるImageNet事前学習モデルに匹敵する結果を得たが,高雑音条件下ではかなり優れていた。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:48:07 GMT)
Hard Samples, Bad Labels: Robust Loss Functions That Know When to Back Off [1.2] 間違ったラベル付けされたトレーニングデータは、教師付き学習によって訓練されたモデルの性能と一般化性に悪影響を及ぼす。
そこで我々はBlurry Loss と Piecewise-zero Loss という2つの新しい損失関数を評価した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:42:49 GMT)
SEDA: A Self-Adapted Entity-Centric Data Augmentation for Boosting Gird-based Discontinuous NER Models [1.1] 不連続なエンティティに関連するセグメンテーションと欠落の問題に対処することを目的としている。
近年の研究では、グリッドタグ法が情報抽出に有効であることが示されている。
我々は,不連続な物体を認識する能力を高めるために,収穫,スケーリング,パディングなどの画像データ拡張手法をグリッドベースモデルに統合する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:06:50 GMT)
Emotion-Driven Personalized Recommendation for AI-Generated Content Using Multi-Modal Sentiment and Intent Analysis [1.1] 本研究では,BERTをベースとしたCross-Modal Transformerを用いたマルチモーダル感情認識モデル(MMEI)を提案する。
MMEIは、事前訓練されたエンコーダViT、Wav2Vec2、BERTを介して、視覚的(表情)、聴覚的(音声)、テキスト的(内容または発話)モダリティを処理する。
MMEIモデルは、F1スコアの4.3%の改善と12.3%のクロスエントロピー損失を達成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:52:22 GMT)
From One Attack Domain to Another: Contrastive Transfer Learning with Siamese Networks for APT Detection [1.1] Advanced Persistent Threats (APT) はそのステルス、永続性、適応性のために大きなサイバーセキュリティ上の課題を引き起こしている。
従来の機械学習検出器は、クラス不均衡、高次元の特徴、そして希少な現実世界の痕跡に苦しむ。
本稿では、トランスファーラーニング、説明可能なAI(XAI)、コントラストラーニング、およびシームズネットワークを統合し、クロスドメインの一般化を改善するハイブリッドトランスファーフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:07:41 GMT)
Microwave spectroscopy of few-carrier states in bilayer graphene quantum dots [1.1] 二層グラフェン量子ドットにおける数キャリア状態の分光について報告する。
その結果、二層グラフェン量子ドットにおける少数キャリアスピンとバレー状態の理解を深める。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:08:26 GMT)
Latent-space metrics for Complex-Valued VAE out-of-distribution detection under radar clutter [1.0] 複雑なレーダ環境におけるOF-Distribution(OOD)検出のための複雑な値付き変分オートエンコーダ(CVAE)について検討する。
CVAE(CVAE-MSE)の復元誤差(Mahalanobis, Kullback-Leibler divergence(KLD))とANMF-Tyler検出器(ANMF-FP)との比較を行った。
これらの検出器の性能は、合成および実験レーダーデータに基づいて分析され、それぞれの検出器の利点と弱点を示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:20:04 GMT)
Parameter-Efficient Neural CDEs via Implicit Function Jacobians [1.0] 本稿では,ニューラルCDEに対するパラメータ効率の代替手法を提案する。
パラメータははるかに少なくなりますが、"Continuous RNN"という非常に論理的なアナロジーも必要です。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:14:17 GMT)
One Patch is All You Need: Joint Surface Material Reconstruction and Classification from Minimal Visual Cues [1.0] 最小限の視覚入力から表面マテリア再構成と分類のための統一モデルSMARCを導入する。
画像の10%の連続パッチしか与えないSMARCは、材料カテゴリを同時に分類しながら、完全なRGB表面を認識し、再構成する。
SMARCは、PSNRは17.55dB、材料分類精度は85.10%である。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:21:27 GMT)
Virtual phase-covariant quantum broadcasting for qubits [0.9] 位相共分散、フリップ共分散、置換不変性、古典的整合性が放送マップの構造を完全に決定することを示す。
このファミリー内ではシミュレーションコストを最小化するユニークなマップを同定し、シミュレーションコストと最も近いCPTPマップの距離がユニタリ共変条件よりも厳密に小さいことを証明した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:30:47 GMT)
Exploring State-of-the-art models for Early Detection of Forest Fires [0.8] 本稿では,森林火災の早期同定のための視覚解析によるデータセットを提案する。
このデータセットをRed Dead Redemption 2などのゲームシミュレータを用いて合成した。
提案したデータセットにおける画像分類と局所化手法を比較した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:13:07 GMT)
Quantum measurement retrodiction and entropic uncertainty relations [0.8] 最小値変化の原理を用いて, 量子測位法について検討する。
量子-古典的測定チャネルでは、すべての標準量子発散が同じ再予測的更新を選択することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:10:36 GMT)
Face, Whole-Person, and Object Classification in a Unified Space Via The Interleaved Multi-Domain Identity Curriculum [0.8] ビジョンファウンデーションモデルは、ゼロショットモードで一般化されたオブジェクト分類を実行し、微調整されたときに顔と人物の認識を行うことができる。
我々は,4つのタスク(物体認識,高品質・低品質画像からの顔認識,全身画像からの人物認識)を1つの埋め込み空間で行うモデルを作成する。
IIC(Interleaved Multi-Domain Identity Curriculum)の2つの変種を紹介する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:23:10 GMT)
Building a Foundation Model for Trajectory from Scratch [0.8] 基礎モデルは人工知能において変革的だが、特に移動軌道のスクラッチから構築することは、まだ明確あるいは文書化されていない。
このチュートリアルは、GPT-2から始まる軌道中心の基盤モデルの最小限の実装のステップとコードを示すことで、このギャップを埋める。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:37:55 GMT)
Anatomica: Localized Control over Geometric and Topological Properties for Anatomical Diffusion Models [0.6] Anatomicaは、局所的な地形制御を伴う解剖学的ボクセルマップを生成するための推論時フレームワークである。
我々は、ボクセル的なモーメントを通してサイズ、形状、位置などの幾何学的特徴を制御する一方、連結成分、ループ、空隙といった位相的特徴は、永続的ホモロジーによって強制される。
解剖学は様々な解剖学的システムに柔軟に適用し、任意の次元や座標系上の複雑な構造を制御するために制約を構成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:18:16 GMT)
Quantum-Inspired Multi Agent Reinforcement Learning for Exploration Exploitation Optimization in UAV-Assisted 6G Network Deployment [0.6] 本研究では,UAVa支援6Gネットワーク展開に適用したマルチエージェント学習における探索エクスプロイトトレードオフを最適化するための量子インスパイアフレームワークを提案する。
10機のインテリジェントUAVが自律的に協調して信号カバレッジを最大化し、部分観測性と動的条件下での効率的なネットワーク拡張を支援することを考える。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 04:35:43 GMT)
Fighting AI with AI: Leveraging Foundation Models for Assuring AI-Enabled Safety-Critical Systems [0.6] 航空宇宙や自動運転車のような安全クリティカルなシステムへのAIの統合は、保証の基本的な課題を提示する。
AIシステムの不透明さは、高レベルの要求と低レベルのネットワーク表現のセマンティックなギャップと相まって、従来の検証アプローチの障壁を生み出します。
我々は、AI自体を活用して、2つの補完的なコンポーネントを通してこれらの課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:48:19 GMT)
Assessing the Effectiveness of Selective Marketing to Broaden Participation in CS Education [0.6] 太平洋岸北西部の中学校・高校生を対象とした教育ハッカソンのマーケティング戦略の変更について述べる。
その結果、疎外・低所得地域からの学生の割合が増加し、全体の出席率も低下しないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:52:28 GMT)
Representation Integrity in Temporal Graph Learning Methods [0.4] 実世界のシステムは、時間とともにトポロジーが変化する動的グラフとして自然にモデル化される。
我々はこの要求を表現整合性として定式化し、グラフの変化にいかに密着した変化を追随するかを測定する指標の族を導出する。
次に、この指標を用いて、一般的な動的グラフ学習モデルの表現整合性の比較研究を行う。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:37:00 GMT)
Feature-Modulated UFNO for Improved Prediction of Multiphase Flow in Porous Media [0.4] 2つの重要なイノベーションを取り入れた拡張アーキテクチャであるUFNO-FiLMを紹介する。
まず,特徴量線形変調層を用いて空間特徴からスカラー入力を分離する。
第二に、臨界領域における学習を優先する空間重み付き損失関数を用いる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:44:28 GMT)
Restora-Flow: Mask-Guided Image Restoration with Flow Matching [0.4] フローマッチングは、最先端拡散モデルに関連する長いサンプリング時間に対処する、有望な生成的アプローチとして登場した。
本稿では, 劣化マスクによるフローマッチングサンプリングをガイドする, トレーニング不要なRestora-Flowを紹介する。
本研究では,拡散法やフローマッチング法と比較して,知覚品質と処理時間に優れることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:22:26 GMT)
Language-Independent Sentiment Labelling with Distant Supervision: A Case Study for English, Sepedi and Setswana [0.4] 本稿では,感情を表わす絵文字や単語からの情報を活用する,言語に依存しない感情ラベル作成手法を提案し,分析する。
私たちの感情ラベル付けアプローチでは、英語のつぶやきを66%、Sepediのつぶやきを69%、Setswanaのつぶやきを63%とラベル付けすることが可能です。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:15:54 GMT)
Readout-Side Bypass for Residual Hybrid Quantum-Classical Models [0.4] 量子機械学習(QML)はコンパクトで表現力のある表現を約束するが、測定ボトルネックに悩まされる。
本稿では,分類前の生入力で量子的特徴を確認可能な,軽量な残差ハイブリッドアーキテクチャを提案する。
我々のモデルは、低通信コストとプライバシーの堅牢性を保ちながら、量子ベースラインよりも最大で55%精度が向上する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:27:53 GMT)
Evolved SampleWeights for Bias Mitigation: Effectiveness Depends on Optimization Objectives [0.4] 実世界のデータに基づいてトレーニングされた機械学習モデルは、必然的に偏見のある予測を生み出す可能性がある。
重み付け(reweighting)は、モデルトレーニングで使用される各データポイントに重みを割り当てることで、モデル予測におけるそのようなバイアスを軽減する方法である。
進化したサンプル重みは、代替重み付け法よりも公正度と予測性能のトレードオフが良いモデルを生成することができることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:50:59 GMT)
Accelerating Sparse Convolutions in Voxel-Based Point Cloud Networks [0.3] Sparse Convolutionは、自動運転やAR/VRで広く使われている3Dポイントのクラウドネットワークを利用している。
SpCは入力されたボクセル座標、出力座標、ウェイトオフセット間のマッピングを格納するカーネルマップを構築し、次にこのマップを使用して特徴ベクトルを出力座標に計算する。
我々の研究はボクセル座標の3つの重要な性質を同定する:それらは整数値であり、限られた空間範囲内で有界であり、同じ物体表面上の幾何学的に連続するボクセルは互いに小さな空間オフセットに存在する可能性が高い。
私たちは最初のボクセルプロパタイアウェア、Spiraを設計しました
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:34:37 GMT)
Diffusion for Fusion: Designing Stellarators with Generative AI [0.3] 我々は、高品質なステラレータ設計を迅速に生成する、機械学習コミュニティに逆問題を提示した。
我々は、quiSRデータベースのデータに基づいて条件拡散モデルを訓練し、望ましい特性を持つ準対称ステラレータの設計を生成する。
生成したステラレータの多くは, 準対称性および目標特性から5%未満の偏差を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:17:12 GMT)
Generative Modeling with Manifold Percolation [0.3] 生成的モデリングは通常、学習的なマッピング規則として構成されるが、これらの規則にアクセスできない観察者の視点からすると、タスクは確率分布から幾何学的支援を遠ざけるものとして表される。
本研究では,この支援解析に連続的パーコレーションが一意に適していることを示す。これは,サンプリングプロセスが,支持体上の幾何学的数え上げ問題に対して,高次元密度推定を効果的に行うためである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:12:42 GMT)
Data-Driven Methods and AI in Engineering Design: A Systematic Literature Review Focusing on Challenges and Opportunities [0.3] 機械学習と統計的手法が現在の実践を支配しているのに対して、ディープラーニングは採用における明らかな上昇傾向を示している。
既存のアプリケーションの主な課題は、限定されたモデル解釈可能性、低い段階的トレーサビリティ、現実の条件下での検証の不十分である。
このレビューは、設計段階のガイドラインへの第一歩であり、フォローアップ合成は、コンピュータ科学のアルゴリズムをエンジニアリング設計の問題や活動にマッピングするべきである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:16:38 GMT)
Personal Data Processing for Behavioural Targeting: Which Legal Basis? [0.2] 本稿では,ePrivacy Directiveのクッキー同意要件が個人データの処理に法的根拠を与えていないことを論じる。
企業が追跡クッキーの使用に関するe-Privacy Directiveの同意要件に準拠するためにオプトアウトシステムを使用したとしても、行動ターゲティングのために個人データを処理する場合、一般的にはデータ対象者の曖昧な同意を得る必要がある。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:55:53 GMT)
Behavioural Sciences and the Regulation of Privacy on the Internet [0.2] 本章では,インターネット上のプライバシの規制に関する行動科学の知見の政策的含意について考察する。
特定の行動的ターゲティングの慣行が起こらない場合、社会がより良い場合、政策立案者はそれらを禁止することを検討するべきだと私は主張する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:55:51 GMT)
MXtalTools: A Toolkit for Machine Learning on Molecular Crystals [0.2] MXtalToolsは、分子結晶のデータ駆動モデリングのためのPythonパッケージである。
これにより、分子の固体状態の機械学習研究が可能になる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:58:53 GMT)
Scoping Electronic Communication Privacy Rules: Data, Services and Values [0.2] この開発は、電子通信のプライバシー規則の範囲に疑問を投げかける。
3つのアプローチを用いて電子通信プライバシールールの範囲を分析するためのフレームワークを開発する。
欧州委員会によって発表された指令の今後の見直しは、規則のスコーピングを改善する機会を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:55:47 GMT)
EfficientXpert: Efficient Domain Adaptation for Large Language Models via Propagation-Aware Pruning [0.2] EfficientXpertは、伝搬対応プルーニング基準と効率的なアダプタ更新アルゴリズムを組み合わせた軽量なドメイン・プルーニングフレームワークである。
一般的な事前訓練されたモデルを、疎結合なドメイン適応の専門家に一段階の変換を可能にする。
40%の間隔で高密度モデルの性能を最大98%保持し、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:20:17 GMT)
StableTrack: Stabilizing Multi-Object Tracking on Low-Frequency Detections [0.2] マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて最も困難なタスクの1つである。
現在のアプローチは主に、ビデオストリームの各フレーム内のオブジェクトを追跡することに焦点を当てている。
本稿では,低周波検出における追跡品質を安定させる新しい手法であるStableTrackを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:42:33 GMT)
Directional Optimization Asymmetry in Transformers: A Synthetic Stress Test [0.2] 変換子は理論的には逆不変であり、その関数クラスは右から左への写像よりも左から右への写像を好まない。
LLMの時間的非対称性に関する最近の研究は、実世界のコーパスが独自の時間的矢印を持っていることを示唆している。
方向性の障害は、言語統計学によるものなのか、あるいはアーキテクチャ自体によるものなのか?
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:03:20 GMT)
The Driver-Blindness Phenomenon: Why Deep Sequence Models Default to Autocorrelation in Blood Glucose Forecasting [0.1] これを Driver-Blindness と呼び、$_textdrivers$ で形式化します。
オートコリレーションを優先するアーキテクチャバイアス、ドライバーを騒がせ、混乱させるデータフィデリティギャップ、人口レベルのモデルを損なう生理的不均一性という3つの相互作用要因に起因している。
ドライバ・ブラインドネスを部分的に緩和する戦略 - 生理的特徴エンコーダ、因果正則化、パーソナライゼーションを含む - を合成し、将来の作業は、ドライバ・ブラインドモデルが最先端と見なされるのを防ぐために、通常$_textdrivers$を報告することを推奨する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:30:55 GMT)
Dance Style Classification using Laban-Inspired and Frequency-Domain Motion Features [0.1] 本稿では,ビデオから抽出したポーズ推定に基づいて,ダンススタイルを分類するフレームワークを提案する。
これらの特徴は、上半身の速度、加速度、角運動などの局所的な関節動態を捉えている。
動きのリズミカルな側面と周期的な側面をさらにエンコードするために、周波数領域における動きパターンを特徴付ける高速フーリエ変換機能を統合する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:33:45 GMT)
Winning with Less for Low Resource Languages: Advantage of Cross-Lingual English_Persian Argument Mining Model over LLM Augmentation [0.1] 本稿では,低リソース言語における議論マイニングのための言語間アプローチを活用することを目的とする。
我々は、高リソース言語として英語、低リソース言語としてペルシア語でモデルを検証した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:36:39 GMT)
Mitigating hallucinations and omissions in LLMs for invertible problems: An application to hardware logic design automation [0.1] ソースドメイン(例えば、論理条件表(LCT))から宛先ドメイン(例えば、ハードウェア記述言語(HDL)コード)にデータを変換する可逆問題を示す。
我々は、7つの異なるLLMを用いて2次元ネットワークオンチップルータ用のフルHDLを生成し、自動生成されたHDLからLCTを再構成し、元のLCTと再構成されたLCTを比較した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:47:02 GMT)
Automated Monitoring of Cultural Heritage Artifacts Using Semantic Segmentation [0.1] 本稿では,様々な畳み込みニューラルネットワーク(CNN)エンコーダを用いて,像や記念碑の画素レベルのき裂識別を行うU-Netアーキテクチャの比較研究を行う。
これらのモデルが,文化的遺産の文脈に有望な一般化能力を示すことを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:42:11 GMT)
Invisible in Search? Auditing Aesthetic Bias in the Visual Representation of Holocaust Victims on Google [0.1] ホロコーストの犠牲者の視覚的表現をGoogle上で比較監査する。
Googleは、残虐行為の文脈に重点を置いて、ホロコーストの犠牲者の男性支配的な表現を広める傾向にある。
また、地理的な位置をまたいだ表現のバリエーションも観察し、検索アルゴリズムが被害者の美意識を創出する可能性を示唆している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:04:14 GMT)
Proximity driven photon-tunneling in chiral quantum hybrid systems [0.1] 共振器と共振器の共振器と共振器の共振器と共振器の共振器と共振器の共振器の共振器について検討した。
我々は、モード分割、干渉効果、暗黒状態の形成を含む透過スペクトルの強い変調を観察する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:35:29 GMT)
Opportunities and Challenges of Computational Electromagnetics Methods for Superconducting Circuit Quantum Device Modeling: A Practical Review [0.0] 多くの技術の設計にはCEM法が不可欠である。
超伝導回路量子デバイスの設計は、非伝統的な材料特性と重要な特徴のために、このカテゴリに該当する。
このようなマルチスケールデバイスは、CEMツールの基本的特性を強調し、シミュレーション時間の増加、精度の低下、あるいはソリューションを確実に見つけることさえできない。
このレビューは、研究者がデバイスをモデル化するために選択する必要があるかもしれない主要なCEM技術の基本的側面の実践的な紹介となる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:10:59 GMT)
Human-computer interactions predict mental health [0.0] 我々は、人間とコンピュータの相互作用が、自己報告されたメンタルヘルスの複数の次元をコードしていることを示す。
本稿では,デジタル活動から潜在精神状態を推定するためのマシーン学習フレームワークであるMAILAを紹介する。
私たちはMAILAをトレーニングし、9000人のオンライン参加者で記録された20,000のカーソルとタッチスクリーンの記録から13万のメンタルヘルスの自己報告を予測しました。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:00:39 GMT)
Generation of Ultrahigh Anomalous Hall Conductivities via Optimally Prepared Topological Floquet States [0.0] 量子最適制御技術を利用してFloquet振幅変調プロファイルを設計することにより、新しい物理がいかに発見されるかを実証する。
本研究は, 最適に調製された非平衡量子状態が, 対応する平衡系では達成できない輸送状態にアクセスできることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:19:02 GMT)
When Features Beat Noise: A Feature Selection Technique Through Noise-Based Hypothesis Testing [0.0] 機能選択は、機械学習と人工知能において、いまだに困難な課題である。
一般的なアプローチは、複数のランダムノイズ特徴を導入し、最強ノイズ特徴より上位の全ての予測器を保持する。
本稿では,これらの制約に対処する特徴選択手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:57:00 GMT)
UruDendro4: A Benchmark Dataset for Automatic Tree-Ring Detection in Cross-Section Images of Pinus taeda L [0.0] UruDendro4 データセットは Pinus taeda L. の 102 イメージサンプルの集合であり,それぞれが年次成長環を手動で注釈付けされている。
既存の公開データセットとは異なり、UruDendro4は茎に沿って複数の高さで抽出されたサンプルを含んでいる。
我々は,最先端手法を用いて,このデータセットの自動リング検出のための性能ベースラインを提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:52:52 GMT)
Tungsten Germanide Single-Photon Detectors with Saturated Internal Detection Efficiency at Wavelengths up to 29 μm [0.0] 超伝導ナノワイヤ単光子検出器(SNSPD)は、最も感度の高い単光子検出器の一つである。
大規模製造における高感度感と適合性を組み合わせた新しい材料システムであるタングステンゲルマタイドをベースとしたSNSPDの開発について報告する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:29:38 GMT)
Triangle Inequality for a Quantum Wasserstein Divergence [0.0] 量子2-ワッサーシュタイン距離に対する三角形の不等式を証明する。
この証明は、コストの新たな積分表現を確立するための複雑な分析手法に依存している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:19:51 GMT)
Train While You Fight -- Technical Requirements for Advanced Distributed Learning Platforms [0.0] TWYF(Train While You Fight)は、運用中に発生する継続的学習を提唱する。
本稿では,先進的な分散学習プラットフォームがTWYFをサポートするために必要な技術的要件について検討する。
相互運用性、レジリエンス、多言語サポート、データセキュリティとプライバシ、スケーラビリティ、プラットフォーム独立性、モジュール化の7つの技術的課題を特定します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:58:46 GMT)
The Qualitative Laboratory: Theory Prototyping and Hypothesis Generation with Large Language Models [0.0] 我々は、この特定のタスクに対して、ペルソナシミュレーションは確立された手法に対して明確な優位性をもたらすと論じる。
自然主義的な談話を生成することで、ヴィグネット調査でよく見られる散逸的な深さの欠如を克服する。
本稿では,気候受容の社会学的理論から派生したペルソナが政策メッセージに反応するプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:31:48 GMT)
The Making of Digital Ghosts: Designing Ethical AI Afterlives [0.0] 我々は、AIによるデジタルアフターリーブの概念的および倫理的分析を提供する。
我々は、悲しみと幸福、真実と偽り、同意と死後のプライバシ、尊厳と誤った表現に関する中核的な倫理的緊張を識別する。
我々は、デジタルゴーストが偽装の形に陥ることなく、思い出を救えるようにするための規制と専門的ガイドラインを論じている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:10:03 GMT)
The Devil in the Details: Emergent Misalignment, Format and Coherence in Open-Weights LLMs [0.0] 次世代オープンウェイトモデルがQwen-2.5ファミリーに類似した耐性を示すかどうかを評価する。
9つの現代的なオープンウェイトモデルにまたがって効果を再現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:25:33 GMT)
The Cumulants Expansion Approach: The Good, The Bad and The Ugly [0.0] 平均場近似は平均場近似として広く知られ、量子物理学を通して日常的に用いられる。
量子力学と量子情報における2つの問題、すなわち、双極子-双極子の相互作用する原子鎖の集合的放射散逸について論じる。
近似がより高い順序でより良く働くように、滑らかで収束的な振る舞いが見つかる。
後者は平均場を超えても役に立たないことが判明し、たとえ小さなシステムのサイズであっても、数値的に困難であり、部分的には非物理的解に悩まされる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:37:31 GMT)
Technical knowledge and soft skills in software startups within the Colombian entrepreneurial ecosystem [0.0] この記事では、ソフトウェアスタートアップの設立チームにとって、どの技術知識とソフトスキルが最も価値があるかに焦点を当てます。
最も価値のあるソフトスキルは、コミュニケーション、リーダーシップ、チームワークです。
この研究の結果は、ソフトウェア起業家、インキュベーター、研究者に関係している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:42:07 GMT)
Superconducting Parametric Amplifiers: Resonator Design and Role in Qubit Readout [0.0] 超伝導パラメトリック増幅器(SPAs)は、量子コンピューティングにおける超低雑音量子ビット読み出しにおいて重要な要素である。
古典的な増幅器とは異なり、SPAは量子制限性能を達成または近づかせることができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:15:15 GMT)
Super-resolution microscopy via fluctuation-enhanced spatial mode demultiplexing [0.0] 本研究では,空間モードデマルチプレックス(SPADE)とエミッタブリンクを組み合わせた超解像手法を提案する。
時間的変動はSPADE画像の精度を高めるだけでなく、全物体情報の復元に必要な測定を劇的に単純化することを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:31:08 GMT)
Suboptimality of Parity for Distilling Correlations with Nontrivial Marginals [0.0] 我々は、$n=2$の場合、局所極限が非自明であれば、PARITYはもはや最適でないことを示す。
同一のNLBを用いた適応蒸留プロトコルと非同一のNLBを用いたPARITYプロトコルの等価性を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:47:53 GMT)
Solving Heterogeneous Agent Models with Physics-informed Neural Networks [0.0] 本稿では物理インフォームドニューラルネットワーク(PINN)に基づくアプローチであるABH-PINNソルバを紹介する。
PINNはハミルトン・ヤコビ・ベルマン方程式とコルモゴロフフォワード方程式を直接ニューラルネットワークトレーニングの目的に組み込む。
予備的な結果は、PINNに基づくアプローチが、確立された有限差分解法に適合する経済的に有効な結果を得ることができることを示している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:11:03 GMT)
Simulated Self-Assessment in Large Language Models: A Psychometric Approach to AI Self-Efficacy [0.0] 我々は,10大言語モデル(LLM)の自己評価をシミュレートするために,10項目の総合自己効力尺度を適用した。
反応は、反復的な管理とランダム化されたアイテム注文の間で非常に安定していた。
モデルは条件によって異なる自己効力レベルを示し、スコアは人間の基準よりも低かった。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:24:11 GMT)
ShelfRectNet: Single View Shelf Image Rectification with Homography Estimation [0.0] 任意の角度から取得した棚画像の修正のために, 4点パラメタライズド・ホモグラフィ行列を推定する深層学習フレームワークを提案する。
本手法は,テストセット上の1.298ピクセルの平均角誤差を実現する。
この領域でのさらなる研究を促進するため、データセット、ShelfRectSet、およびコードを公開します。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:14:17 GMT)
Self-Organization and Spectral Mechanism of Attractor Landscapes in High-Capacity Kernel Hopfield Networks [0.0] カーネルベースの学習は、Hopfieldネットワークのストレージ容量を劇的に増加させる。
階調崩壊と拡散のスペクトル"Goldilocks Zone"に調整することで最適な性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:12:18 GMT)
SMoG: Schema Matching on Graph [0.0] 本稿では,イテレータを利用した新しいフレームワークであるSMoG(Matching on Graph)を紹介する。
知識グラフ質問(Knowledge Graph Question An- Swering)で成功した戦略にインスパイアされた,単純な1ホップのSPARQLクエリの実行。
実世界のメドカルデータセットの実験結果は、SMoGが最先端のベースラインに匹敵するパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:13:56 GMT)
Routing in Non-Isotonic Quantum Networks [0.0] 量子リピータネットワークにおける最適ルーティングは、一対の終端ノードを接続する最良の経路を見つける必要がある。
エンタングルメント生成の速度と品質を考慮に入れたユーティリティ関数は、しばしば非異方性であることを示す。
本稿では、目的地認識のメリット関数を高速収束に利用する2つのベストファースト検索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:48:49 GMT)
Restoring a Missing Meta-Symmetry of Quantum Mechanics [0.0] 従来の量子力学では、すべてのユニタリ進化は時空ヒルベルト空間$mathcal H_xt=L2(mathcal M_xt)$内で起こる。
量子論を拡大されたヒルベルト空間 $mathcal H_xt oplus 数学 H_kE$ に拡張する。
結果として生じる構造はメタ対称性、すなわち1つの大域量子状態の2つの共役動的射影の間の対称性を確立する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:49:32 GMT)
Reservoir-Engineered Exceptional Points for Quantum Energy Storage [0.0] 我々は、完全に受動的で物理的に一貫したオープン量子システムにおいて、例外点物理学を実現する量子エネルギー保存機構を導入する。
この機構は、光学デバイス、超伝導回路、マグノンシステムと互換性がある。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:04:20 GMT)
Realistic gossip in Trust Game on networks: the GODS model [0.0] 我々は,現実的なゴシップ処理と,異なる種類のトラストゲームとを組み合わせたエージェントベースモデルを開発した。
実験の結果, 局所的相互作用がゴシップの拡散を支配下に置くと, 共同作業者が障害を負うことが明らかとなった。
現実的なゴシップは全体の資源量を増加させるが、欠陥を促進する可能性が高い。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:23:05 GMT)
Real and Fourier space readout methods: Comparison of complexity and applications to CFD problems [0.0] 本稿では,実空間とフーリエ空間における複数の効率的な読み出し手法を提案し,比較する。
本稿では2次元バーガー方程式を線形化の高価な戦略を使わずに効率的に解けることを示す。
これは、中期量子デバイスにおける実用的な応用の潜在的な量子アドバンテージを示唆している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:37:27 GMT)
REWA: Witness-Overlap Theory -- Foundations for Composable Binary Similarity Systems [0.0] REWAは、目撃者のオーバーラップ構造に基づく類似性に関する一般的な理論を導入する。
概念間の類似性を単調な証人オーバーラップとして表すことができれば、コンパクトな符号化に還元できることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:04:44 GMT)
Quantum coherent dynamics of quasiclassical spacetimes [0.0] 重力力学に対するハミルトン形式主義は、無限大の時計に関して時空の時間進化を生成する。
我々は、ブラックホールの蒸発の問題に我々の枠組みを適用し、ユニタリティの保存方法のヒントを与える。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:06 GMT)
Quantum coherence measures in entangled atomic systems [0.0] ブーストされたオブザーバによって測定された波動関数のコヒーレンスを,ブースターパラメータとガウス波パケットの幅の関数として検討した。
一般に, ガウス波パケットの幅の増大とともにコヒーレンスが崩壊し, ブースターパラメータの値が高くなり, ブースターが適用される粒子数が増加する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:51:54 GMT)
Quantum Key Distribution: Bridging Theoretical Security Proofs, Practical Attacks, and Error Correction for Quantum-Augmented Networks [0.0] 量子鍵分布(QKD)は、量子力学の不変法則を通じて、情報理論のセキュリティを約束することで暗号に革命をもたらす。
しかし、理想化されたセキュリティモデルを実用的でレジリエントなシステムに変えるという課題は、未だに迫っている問題だ。
このレビューは、QKDプロトコルの最新の進歩とそのセキュリティ脆弱性を批判的に識別し、合成する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:31:02 GMT)
Quantum Framework for Wavelet Shrinkage [0.0] 本稿では、量子ウェーブレット収縮のための統一的なフレームワークを開発し、古典的な概念を量子領域に拡張する。
位相減衰とアンシラ駆動構造は、この挙動を一貫性を持って実現し、単一の回路モデル内で統計的適応性と量子ユニタリ性を組み合わせることができることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 02:35:18 GMT)
Prompt-Aware Adaptive Elastic Weight Consolidation for Continual Learning in Medical Vision-Language Models [0.0] 医用視覚言語モデルは、医用画像と臨床用語の間の横断的なアライメントを維持する必要がある。
本稿では,新しい連続学習手法であるPrompt-Aware Adaptive Elastic Weight Consolidation (PA-EWC)を紹介する。
実験の結果、PA-EWCは基準法に比べて最大17.58%の破滅的な忘れ込みを減少させることが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:22:56 GMT)
Proceedings Twentieth Conference on Theoretical Aspects of Rationality and Knowledge [0.0] TARKカンファレンスは、さまざまな分野の研究者を集結させることを目的としている。
1986年以降、世界各国で隔年開催されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:41:15 GMT)
Primal: A Unified Deterministic Framework for Quasi-Orthogonal Hashing and Manifold Learning [0.0] 素平方根の数論的独立性を利用して、頑健でチューニング可能なベクトル表現を構築する決定論的フレームワークであるPrimalを提案する。
提案手法はベシック特性を利用して非繰り返し位相軌道を保証する不合理周波数変調を生成する。
実験により, このフレームワークは, ランダムな行列投影法と比較して, 保持率と分布密度が優れていることを示した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:44:34 GMT)
Plug-n-Play Three Pulse Twin Field QKD [0.0] サニャック型スタートポロジープラグ・アンド・プレイアーキテクチャを用いた3時間ビン位相符号化ツインフィールド量子鍵分布(TF-QKD)プロトコルの実験的実装
提案手法は3つの時間ビンの相対位相を利用して信号毎に2ビットを符号化する。
その結果、実世界の量子通信ネットワークのための3時間ビンTF-QKDプロトコルの実用性、安定性、拡張性を実証した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:02:00 GMT)
Physics Enhanced Deep Surrogates for the Phonon Boltzmann Transport Equation [0.0] 物理強化深部サロゲート(PEDS)
ネットワークは、幾何学に依存した補正と、マクロとナノスケールの挙動を補間する混合係数を学ぶ。
PEDSは、純粋なデータ駆動ベースラインと比較して、トレーニングデータ要求を最大70%削減する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:25:24 GMT)
Optimization of Sums of Bivariate Functions: An Introduction to Relaxation-Based Methods for the Case of Finite Domains [0.0] 我々は、$n>2$引数を持つ関数の最適化を、それぞれ$n$引数の2ドルしか持たないいくつかの関数の和として表現する。
線形計画法、座標昇華法、閉形式解法で解けるいくつかのトラクタブル問題の定式化を導出する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:35:14 GMT)
Nonreciprocal quantum information processing with superconducting diodes in circuit quantum electrodynamics [0.0] 超伝導ダイオード(SDs)は、回路量子力学におけるコヒーレントな非相互素子である。
フラックスバイアスは非線形ダイオード応答と協調して作用し、透過スペクトルの方向依存共振シフトを誘導する。
我々の研究は、全対全連結マイクロ波量子ネットワークにおける高忠実な信号ルーティングと絡み合いの発生を可能にする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:05 GMT)
Nonextensive statistics for a 2D electron gas in noncommutative spaces [0.0] 本研究では、ハミルトン作用素によって記述された2次元非可換空間の量子系について検討する。
非可換幾何学は位相空間構造を変更する基本的な最小長を導入する。
非伸縮パラメータ$q$と非可換パラメータ$$の複合効果を解析する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:21:06 GMT)
Nanophotonic magnetometry in a spin-dense diamond cavity [0.0] ダイヤモンド中の窒素空孔中心に基づく量子センサーは、ナノメートルスケールの高感度磁気計測のための主要なプラットフォームである。
そこで我々は,ダイヤモンドチップからモノリシックなシャスパーリングガリーモードキャビティを作製することで,このトレードオフを克服する統合プラットフォームを実現する。
ナノファブリック化キャビティベースの磁力計ではこれまで報告された中で最高の感度である58,textnT/sqrttextHzの直流感度を実現する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:46:17 GMT)
NOIR 2.0: Neural Signal Operated Intelligent Robots for Everyday Activities [0.0] NOIRは汎用的な脳ロボットインタフェースで、人間が脳信号を使って日常のタスクのためにロボットを制御できる。
我々はNOIR 2.0の強化版であるNOIR 2.0を提案する。NOIR 2.0はより高速で高精度な脳復号アルゴリズムを備えており、タスク完了時間を46%短縮する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:56:27 GMT)
Multi-Field Relativistic Continuous Matrix Product States [0.0] マルチフィールドRCMPSの正規部分多様体上でのエネルギー密度を最小化する方法を示す。
相互作用する2つの場を1+1$次元でモデル化する。
これにより、RCMPSは以前よりもはるかに大きな問題に利用できる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:07 GMT)
Multi Head Attention Enhanced Inception v3 for Cardiomegaly Detection [0.0] 本稿では,X線画像を用いた心内膜自動検出のための深層学習ツールと注意機構の統合的アプローチについて説明する。
提案システムでは, 開始V3モデルを鍵ブロックの1つとして活用したCNN構成を提案する。
このモデルは95.6の精度95.2の精度、96.2のリコール、95.7の感度、96.1の特異性、96.0のエリアアンダーカーブ(AUC)、およびそれぞれのグラフを視覚化するためにプロットする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:19:20 GMT)
Modular Deep Learning Framework for Assistive Perception: Gaze, Affect, and Speaker Identification [0.0] 本研究は「スマートアイ」のような知覚システムのコア機能に触発されたモジュラーアーキテクチャの実現可能性を評価する。
本稿では,視覚状態検出のための畳み込みニューラルネットワーク(CNN),表情認識のための深層CNN,音声による話者識別のためのLong Short-Term Memory(LSTM)ネットワークの3つの独立したセンシングモジュールを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:35:42 GMT)
MoRE: Batch-Robust Multi-Omics Representations from Frozen Pre-trained Transformers [0.0] MoRE (Multi-Omics Representation Embedding) は、凍結した事前学習されたトランスフォーマーを用いて異質なアッセイを共有潜在空間に整列させるフレームワークである。
特に、MoREは軽量でモジュラリティ固有のアダプタとタスク適応型融合層を冷凍バックボーンに取り付ける。
我々は, scGPT, scVI, Harmonyなどの既存のベースラインに対して, scArchesを用いてMoREをベンチマークし, 統合忠実度, 希少な集団検出, モダリティ伝達を評価する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:04:06 GMT)
MicroSims: A Framework for AI-Generated, Scalable Educational Simulations with Universal Embedding and Adaptive Learning Support [0.0] 本稿では,軽量でインタラクティブな教育シミュレーションを構築するためのフレームワークであるMicroSimsを紹介する。
MicroSimsは人工知能を使って迅速に生成でき、デジタル学習プラットフォームに埋め込まれ、プログラミングの知識なしに簡単にカスタマイズできる。
対話型シミュレーションにより,従来の授業に比べて最大30~40%概念理解が向上することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:14:39 GMT)
Magnetic Control of the Non-Hermitian Skin Effect in Two-Dimensional Lattices [0.0] 多数のバルクモードの異常な境界蓄積である非エルミート皮膚効果(NHSE)は、非エルミート物理学の目印となっている。
2次元単一バンド格子におけるライン境界に沿ったNHSEの磁気制御のための理論的枠組みを開発する。
磁場は相反モデルにおいて幾何的皮膚効果を抑制するが,非相反系では皮膚局在が持続することを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:21:23 GMT)
MSTN: Fast and Efficient Multivariate Time Series Model [0.0] 階層型マルチスケールおよびシーケンスモデリングの原理に基づいて構築された,新しいディープラーニングアーキテクチャであるMulti-scale Temporal Network(MSTN)を紹介する。
MSTNは、局所パターンのための階層的な特徴ピラミッドを構築する畳み込みエンコーダと、長距離時間依存のためのシーケンスモデリングコンポーネントを統合する。
時系列長軸予測, 計算, 分類, 一般化可能性調査における広範囲な評価は, MSTNがSOTA(コントラスト・オブ・ザ・アーティファクト)のパフォーマンスを達成することを示すものである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:09:42 GMT)
Learning Degenerate Manifolds of Frustrated Magnets with Boltzmann Machines [0.0] 拘束ボルツマンマシン(RBM)はフラストレーション磁石の乱れ相におけるスピン配置をモデル化するための柔軟な生成フレームワークを提供することを示す。
ベンチマークとして、RBMがその多相点における一次元ANNNIモデルのゼロ温度基底状態多様体を学習できることを最初に示す。
次に, RBM をカゴメ・スピンアイスに適用し, 局所的な氷の規則や, 広範囲に生成した氷-I 多様体の短距離相関の学習に成功していることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:40:01 GMT)
KyrgyzBERT: A Compact, Efficient Language Model for Kyrgyz NLP [0.0] KyrgyzBERTは、KyrgyzのためのモノリンガルBERTベースの言語モデルである。
このモデルは35.9Mパラメータを持ち、言語の形態的構造のために設計されたカスタムトークンを使用する。
Kyrgyz-sst2は、Stanford Sentiment Treebankを翻訳し、手動で完全なテストセットを注釈付けすることで構築された感情分析ベンチマークである。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:05:53 GMT)
Is the large uncertainty of $δ_{CP}$ fundamentally encoded in the neutrino quantum state? [0.0] レプトニック CP 違反相 $_CP$ の正確な測定は、ニュートリノ物理学における大きな課題の1つとして残っている。
本研究は, 味覚測定における情報内容から, $_CP$に対する感度の制限が起因であることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 10:18:03 GMT)
InvisibleBench: A Deployment Gate for Caregiving Relationship AI [0.0] InvisibleBenchは、介護関連AIのためのデプロイメントゲートである。
安全、コンプライアンス、トラウマ・インフォームド・デザイン、長期/文化的適合性、メモリの5つの次元にわたる3~20以上のターンインタラクションを評価している。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:09:45 GMT)
Intriguing Properties of Dynamic Sampling Networks [0.0] 我々は「ウォーピング」と呼ぶ既存手法を一般化した新しい演算子の開発と解析を行う。
ウォープは動的サンプリングの最小限の実装を提供する。
これらのメカニズムは、畳み込みによって定義される伝統的な変換不変作用素とは全く異なる種類の作用素を表すことを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:40:36 GMT)
Improving the Identification of Real-world Malware's DNS Covert Channels Using Locality Sensitive Hashing [0.0] 本稿では,DNS シークレットチャネルを用いた実世界のマルウェアの検出と識別にLocality Sensitive Hashing を最初に応用した。
提案手法は,DNSサブドメイン配列を統計的に類似した特徴に符号化し,悪意のある活動を示す異常を効果的に捕捉する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:00:58 GMT)
Impact of the valence band on Rydberg excitons in cuprous oxide quantum wells [0.0] 我々は、ルッティンガー・コーンモデルに基づく酸化銅量子井戸の励起子に対する完全ハミルトニアンを導出した。
B-スプライン関数を用いたハミルトニアンの対角化に基づく結果は、エネルギーシフトと退化の持ち上げを明らかにする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:14:18 GMT)
Identifying environmental factors associated with tetrodotoxin contamination in bivalve mollusks using eXplainable AI [0.0] 2012年以降、テトロドトキシン(TTX)はヨーロッパの温帯海域で二枚貝などの魚介類で発見されている。
我々はオランダのゼーラント河口におけるTTX汚染を予測するための説明可能な深層学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:19:57 GMT)
HistoSpeckle-Net: Mutual Information-Guided Deep Learning for high-fidelity reconstruction of complex OrganAMNIST images via perturbed Multimode Fibers [0.0] HistoSpeckle-Netは、MMFスペックルから構造的にリッチな医用画像を再構成するために設計されたディープラーニングアーキテクチャである。
複雑なOrganAMNISTデータセットに対する実験により,HistoSpeckle-Netはベースラインモデルよりも高い忠実性が得られることが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:20:50 GMT)
GazeProphetV2: Head-Movement-Based Gaze Prediction Enabling Efficient Foveated Rendering on Mobile VR [0.0] 本稿では,時間的視線パターン,頭部運動データ,視覚シーン情報を組み合わせたVR視線予測へのマルチモーダルアプローチを提案する。
22のVRシーンと5.3Mの視線サンプルにまたがるデータセットによる評価は、モダリティを組み合わせる際の予測精度の改善を示している。
クロスシーンの一般化テストは、予測された視線軌跡における93.1%の検証精度と時間的整合性を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 06:55:39 GMT)
From data to concepts via wiring diagrams [0.0] 準スケルトン配線図法の概念を導入し、準スケルトン配線図法がハセ図法に対応することを証明した。
この結果を用いて、逐次データから配線図を抽出するアルゴリズムを設計した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:59:56 GMT)
Fault-Tolerant Non-Clifford GKP Gates using Polynomial Phase Gates and On-Demand Noise Biasing [0.0] 標準GKP誤り訂正回路に基づくオンデマンドノイズバイアス手法を提案する。
我々は,GKP符号状態の品質が向上するにつれて,$T$ゲートの論理誤差率を任意に小さくすることができることを証明した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 14:34:36 GMT)
Fast Quantum Gates for Neutral Atoms Separated by a Few Tens of Micrometers [0.0] 20m以上離れた中性原子間の高速で高忠実な2量子ISWAPゲートを提示する。
我々は、単一かつ滑らかなレーザーパルスの中で、キュービットとライドバーグ状態の間のコヒーレント励起-交換-脱励起ダイナミクスを利用する。
これにより、封鎖半径をはるかに超え、高速で高接続性量子プロセッサへの経路を提供することができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:11:07 GMT)
Exciton collective modes in a bilayer of axion insulator $\text{MnBi}_2 \text{Te}_4$ [0.0] 我々は, $textBiMntextTe_4$の2層構成において, エキシトン縮合および関連する集合モードの出現について検討した。
本研究は, トポロジーとボソニック凝縮物の相互作用の理解に寄与し, トポロジー特性の光学的アクセス, 消散性輸送, ゲート可変光電子工学への応用に刺激を与える可能性がある。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 00:01:11 GMT)
Exact WKB in all sectors II: Potentials with non-degenerate saddles [0.0] 我々は、WKB形式論の観点から、一般的な一次元ポテンシャルの正確な量子化について論じる。
一般ポテンシャルに対する正確なスペクトルの連続的および不連続な遷移を同定する。
属1系のP-NP関係については、任意の摂動的および非摂動的一対のWKBサイクル間の変換規則を導出する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:16:21 GMT)
Evaluating the Performance of Deep Learning Models in Whole-body Dynamic 3D Posture Prediction During Load-reaching Activities [0.0] 2つの時系列モデルは、双方向長短期メモリ(BLSTM)とトランスフォーマーアーキテクチャを用いて訓練された。
その結果, 新しいコスト関数により, アームモデルと脚モデルでそれぞれ約8%, 21%の予測誤差が減少した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:40:48 GMT)
Escaping AB caging via Floquet engineering: photo-induced long-range interference in an all-band-flat model [0.0] 高周波系における周期駆動は、全平らなダイヤモンド鎖を2つの準平らなバンドを特徴とする1つに変換することを示す。
格子幾何学と駆動系の対称性の相互作用は、駆動誘起トンネル過程を引き起こす。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:35:21 GMT)
Entanglement Witnesses of Condensation for Enhanced Quantum Sensing [0.0] スピン量子ビットの集合的絡み合いは、基底状態と励起スピン状態の間の遷移を増幅することができることを示す。
結果は、凝縮にインスパイアされた絡み合いを利用してスピンベースのプラットフォームの感度を高める量子センサーの設計原則を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:42:34 GMT)
Energy Costs and Neural Complexity Evolution in Changing Environments [0.0] 本研究では, 環境変動性とエネルギーコストが神経複雑性の進化に与える影響について検討した。
エネルギー制約の下では、季節性の増加はより小さなANNに繋がった。
結果は、神経複雑性の形成におけるエネルギー制約の役割、生物学的理論とエネルギー効率の良いロボット設計のためのシリコサポートの提供を強調した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:38:50 GMT)
Efficient Estimation of Multiple Temperatures via a Collisional Model [0.0] 衝突モデルフレームワーク内の複数の温度を推定するための量子熱量測定プロトコルを提案する。
補助システム内での爆発的相関は、フィッシャー情報のさらなる強化をもたらす。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 16:18:46 GMT)
Dual Stressors in Engineering Education: Lagged Causal Effects of Academic Staff Strikes and Inflation on Dropout within the CAPIRE Framework [0.0] 本研究は,アルゼンチンの長サイクルエンジニアリングプログラムにおいて,二重ストレス仮説の因果検証を行う。
本研究は,ストライク露光によるラタグ因果効果と導入時のインフレーションとの相互作用を推定する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:51:00 GMT)
Diffusion-Based Synthetic Brightfield Microscopy Images for Enhanced Single Cell Detection [0.0] 本研究では,無条件モデルを用いた合成光電場顕微鏡画像の生成について検討する。
U-Netベースの拡散モデルをトレーニングし、合成画像と実画像の比率の異なるデータセットを作成するために使用した。
YOLOv8, YOLOv9, RT-DETRを用いた実験では, 合成データによるトレーニングにより検出精度が向上することが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 08:57:23 GMT)
Defect Bootstrap: Tight Ground State Bounds in Spontaneous Symmetry Breaking Phases [0.0] ブートストラップ法は、熱力学の限界において、局所可観測物上の厳密な二辺境界を可能にした。
これらの境界は必然的に対称性の破れた位相において緩くなり、そこでは局所的な制約は長距離秩序を捉えるのに不十分である。
補助的な$textitdefectモデルにシステムを埋め込むことで、この制限を解決するために、$textitdefect bootstrap$フレームワークを導入します。
以上の結果から,量子多体系におけるブートストラップ手法のパワーは,物理的に動機付けられた制約セットによって劇的に向上することが示された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:17:54 GMT)
DRL-Guided Neural Batch Sampling for Semi-Supervised Pixel-Level Anomaly Detection [0.0] 産業用視覚検査における異常検出は, 欠陥試料の不足により困難である。
本稿では,ニューラルバッチサンプリング,オートエンコーダ,予測器を統合した半教師付き深層強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:53:53 GMT)
Cross-LLM Generalization of Behavioral Backdoor Detection in AI Agent Supply Chains [0.0] 本研究は,Cross-LLMビヘイビアバックドア検出に関する最初の体系的研究である。
単一モデル検出器は、トレーニング分布において92.7%の精度を達成するが、異なるLLM間で49.2%しか達成していないことを示す。
追加機能としてのモデル認識モデル同定は,すべての評価モデルに対して90.6%の精度で達成可能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 03:33:04 GMT)
Corporate Earnings Calls and Analyst Beliefs [0.0] 決算報告から抽出した物語が、実現した利益とアナリスト予測の両方の予測を著しく改善することを示します。
大規模言語モデルが対実的テキストを生成する新しいテキストモーフィング手法を提案する。
アナリストは感情に過度に反応し(最適化)、リスクと不確実性の物語に過度に反応する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:42:49 GMT)
Copyright Detection in Large Language Models: An Ethical Approach to Generative AI Development [0.0] 本稿では,コンテンツ作成者がデータセットのトレーニングに使用されているかどうかを検証できるオープンソース著作権検出プラットフォームを提案する。
直感的なユーザインターフェースとスケーラブルなバックエンドを持つこのフレームワークは、AI開発と倫理的コンプライアンスの透明性向上に寄与する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 18:46:14 GMT)
Constrained deep learning for pricing and hedging european options in incomplete markets [0.0] 不完全な金融市場では、価格とヘッジの欧州オプションは、未解決のリスクのために、ユニークな非緩和ソリューションを欠いている。
本稿では、オプション価格を決定するための制約付きディープラーニング手法を導入し、ゼロあたりの利益と損失の分布を最小限に抑えるヘッジ戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:40:01 GMT)
Conceptual Evaluation of Deep Visual Stereo Odometry for the MARWIN Radiation Monitoring Robot in Accelerator Tunnels [0.0] MARWINロボットは欧州XFELで働き、長い単調な加速器トンネルで自律的な放射線モニタリングを行う。
現在のナビゲーションの概念は、ライダーベースのエッジ検出、車輪/ライダー計測と周期的なQRコード参照、壁距離、回転、長手位置のファジィ制御を組み合わせたものである。
本稿では,DVSO(Deep visual stereo odometry)の3次元幾何学的制約を焦点とする手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:22:22 GMT)
Computing Evolutionarily Stable Strategies in Multiplayer Games [0.0] 3人以上のプレイヤーを持つ非退化正規形式ゲームにおいて、進化的に安定な戦略を計算するためのアルゴリズムを提案する。
このアルゴリズムは、3人以上のプレイヤーを持つ非退化正規形式ゲームにおいて、進化的に安定な戦略の全てを計算するのに使うことができる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:16:24 GMT)
Communication-Efficient Learning for Satellite Constellations [0.0] 我々は、衛星がデータを収集し、局所的に処理するフェデレートされたアプローチに焦点を合わせ、地上局は局所的なモデルを集約する。
我々は地上局との通信回数を減らすためにいくつかのメカニズムを採用している。
そこで我々は,アルゴリズムに依存しない誤りフィードバック方式である副産物として,精度を高める誤差フィードバック機構を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 11:47:47 GMT)
Comment on Classical-Gravity--Quantum-Matter Claims About Gravity-Mediated Entanglement [0.0] Aziz と Howl の最近の論文は、量子物質が古典的な重力場と結合して量子論のレベルで記述されると、高次過程は2つの空間的に分離された質量間の絡み合いを生じさせると主張している。
同時臨界ノートは、実際の非相対論的極限において、相互作用が超局所となり、全体のユニタリ因子が分解され、製品入力から絡み合わなくなることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:14:33 GMT)
Closed-Loop Phase-Coherence Compensation for Superconducting Qubits Integrated Computational and Hardware Validation of the Aurora Method [0.0] オーロラDD(Aurora-DD)は、グローバル位相オフセットの符号に基づくフィードバック更新を統合する位相コヒーレンス補償法である。
Delta phi* はハードウェア上で事前校正された位相補償としてデプロイされる。
オーロラDDは、測定された期待値Z>の平均二乗誤差を著しく低減し、位相設定 phi = 0.05, 0.10, 0.15, 0.20 に対して、n=30 のランダム化試行で68〜97% 改善する。
全体としては、Aurora-DDを実用的で安定的でハードウェア互換の位相コヒーレンス補償器としてサポートした。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:17:55 GMT)
Categorical Framework for Quantum-Resistant Zero-Trust AI Security [0.0] 我々は、セキュアなAIモデルのために、ポスト量子暗号(PQC)とゼロ信頼アーキテクチャ(AZT)の新たな統合を提案する。
我々のフレームワークは、暗号アクセスを射として、信頼ポリシーを関手として、一意にモデル化する。
具体的ESP32実装による実効性を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:17:24 GMT)
Bridging Symbolic Control and Neural Reasoning in LLM Agents: The Structured Cognitive Loop [0.0] エージェント認知を,検索,認知,制御,行動,記憶の5段階に分けたモジュール型アーキテクチャであるStructured Cognitive Loop (SCL)を導入する。
SCLの中核であるSoft Symbolic Controlは、確率的推論にシンボリック制約を適用する適応的なガバナンスメカニズムである。
我々は,ライブGPT-4oによる旅行計画エージェントとともに,R-CCAMループアーキテクチャを実演する完全なオープンソース実装を提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 01:09:40 GMT)
Beyond Generation: Multi-Hop Reasoning for Factual Accuracy in Vision-Language Models [0.0] ビジュアル言語モデル(VLM)は強力な生成ツールであるが、しばしば事実的に正確な出力を生成する。
本研究は、知識誘導推論のためのフレームワークをVLMで導入し、マルチホップ検証に構造化知識グラフを活用する。
本研究では,階層的・三点的・三点的・三点的・三点的知識表現を用いた枠組みの評価を行い,実効性と論理的推論性について分析した。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 17:34:32 GMT)
BengaliFig: A Low-Resource Challenge for Figurative and Culturally Grounded Reasoning in Bengali [0.0] コンパクトでリッチな注釈付き挑戦集合であるBengaliFigを提示する。
データセットには、ベンガルの口頭と文学の伝統から採られた435のユニークな謎が含まれている。
各項目は、推論タイプ、トラップタイプ、文化的深さ、回答カテゴリ、難易度を5次元にアノテートする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:26:47 GMT)
Baby universe as logical qubits: information recovery in random encoding [0.0] 我々はAdS/CFTの赤ちゃん宇宙が必ずしも自明な1次元ヒルベルト空間を持っているか、代わりに大きなエントロピーを持っているかを再検討する。
そこで我々は、赤ちゃんの宇宙が、どちらの境界からもアクセスできない論理的な自由度として現れるという解釈を提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:00:00 GMT)
Autoregressive Surrogate Modeling of the Solar Wind with Spherical Fourier Neural Operator [0.0] 太陽風放射速度を安定させるための,最初の自己回帰型機械学習サロゲートを提案する。
このモデルは、単一ステップアプローチと比較して、遠方の領域での精度を向上させる。
数値的なHUXサロゲートと比較すると、SFNOは優れた性能または同等のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:30:03 GMT)
Automated Statistical and Machine Learning Platform for Biological Research [0.0] 本稿では,古典的統計手法とランダムフォレスト分類を組み合わせた総合的データ分析のための統合プラットフォームを提案する。
我々の方法論は、従来の統計ソフトウェア、現代の機械学習フレームワーク、生物学のギャップに対処する。
初期試験プロトコルは、様々な化学データセットの分類精度を評価するように設計されている。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 19:29:22 GMT)
Application of machine learning for infrastructure reconstruction programs management [0.0] 本稿では,エンジニアリングインフラストラクチャ再構築プログラム管理の効率化を目的とした,適応型意思決定支援モデルについて述べる。
モデルの主要なコンポーネントは定義されており、一連の意思決定の好み、意思決定のタスク、入力データのセット、適用されたソフトウェアコンポーネントが含まれる。
熱, ガス, 電気, 水道, 排水などの工学系を再構築するためのプログラム管理において, 適応モデルの適用が可能となる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 23:14:36 GMT)
An Adaptable Route to Fast Coherent State Transport via Bang-Bang-Bang Protocols [0.0] コヒーレントな状態輸送は 量子計算と 量子情報処理に不可欠です
本稿では,前向きと後向きのトラップポテンシャルを組み合わせた適応的で高速なバンバンバンプロトコルを提案する。
このプロトコルは、ハーモニックトラップ電位の下での量子速度制限に近づき、前方移動のみのポテンシャルプロトコルによる性能を上回る。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:51:19 GMT)
All-Optical Brillouin Random number Generator [0.0] 本稿では,ブリルアン光学系に基づく二進乱数生成器(RNG)のモデルを提案する。
この装置はブリュアン光学系においてハード励起モードを使用し、熱雑音はハード励起モードにおいて2つの安定状態間の自発的な遷移を誘導する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 09:53:54 GMT)
Adaptive Detection of Polymorphic Malware: Leveraging Mutation Engines and YARA Rules for Enhanced Security [0.0] 多形性マルウェアは、その構造を継続的に変更し、署名ベースの防御を回避する。
本研究では,8つの多形挙動の解析フレームワークを提案する。コード挿入,制御フローの難読化,パッキング,データエンコーディング,ドメイン生成,ランダム化されたビーコンタイミング,プロトコルの模倣,フォーマット/ヘッダの微調整などである。
11種類の不活性多型変異体が、制御された突然変異エンジンを用いて振る舞い毎に生成され、孤立した環境で実行された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:47:28 GMT)
Active Inference in Discrete State Spaces from First Principles [0.0] 我々は、それを自由エネルギー原則から切り離すことにより、アクティブ推論の概念を明確にすることを目指している。
本稿では,離散状態空間における能動推論を実現するために最適化を行う必要があることを,制約付き発散最小化問題として定式化できることを示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 13:54:10 GMT)
A review on data fusion in multimodal learning analytics and educational data mining [0.0] 本稿では,学習分析(LA)と教育データマイニング(EDM)におけるデータ融合について紹介する。
主な出版物、融合した教育データ、EDM/LAで使用されるデータ融合のアプローチと技法を見直して、現在の技術状況を示す。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 21:36:05 GMT)
A Taxonomy of Pix Fraud in Brazil: Attack Methodologies, AI-Driven Amplification, and Defensive Strategies [0.0] 本研究は,ユーザや金融機関に影響を及ぼす主要な詐欺のタイプを特定し,分類することを目的とする。
その結果, 不正行為は, 純粋に社会工学的なアプローチから, 人間の操作と技術的搾取を融合したハイブリッド戦略へと発展してきたことが示唆された。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 22:41:57 GMT)
A Task-Oriented Evaluation Framework for Text Normalization in Modern NLP Pipelines [0.0] 本研究では,スリーミング手法を評価するための新しいタスク指向アプローチを提案する。
SES(Stemming Effectiveness Score)を用いたステミングの有用性,(2)モデル性能デルタ(MPD)を用いた下流タスクにおけるステミングの効果,(3)平均正規化Levenshtein Distance(ANLD)を用いた幹語と原語間の意味的類似性,の3つの側面を考察する。
我々の研究は、潜在的効率向上(高いSES)と意味保存(低いANLD)を区別するための貴重なツールを提供する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 15:35:42 GMT)
A System-Level Taxonomy of Failure Modes in Large Language Model Applications [0.0] 大規模言語モデル(LLM)は、意思決定支援ツール、自動化、AI対応ソフトウェアシステムに急速に統合されている。
本稿では,現実のLLMアプリケーションで発生する15の隠れ障害モードのシステムレベルでの分類について述べる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 05:19:23 GMT)
A Review of Pseudospectral Optimal Control: From Theory to Flight [0.0] 本研究は,飛行成功に不可欠であることが証明された疑似スペクトル最適制御における重要な理論的結果についてレビューする。
NASAの宇宙船での飛行デモの実施の詳細について論じる。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 20:47:48 GMT)
A Machine Learning Approach for Detection of Mental Health Conditions and Cyberbullying from Social Media [0.0] メンタルヘルスの課題とサイバーいじめは、デジタル空間でますます広まっている。
本稿では、ソーシャルメディアデータから10種類のメンタルヘルスとサイバーいじめのカテゴリを検出するための統合型マルチクラス分類フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 07:12:09 GMT)
$\mathcal{PT}$-assisted control of Goos-Hänchen shift in cavity magnomechanics [0.0] 我々は,非エルミタンキャビティマグノメカニクスシステムにおいて,反射プローブ場のグース・ヘンチェンシフト(GHS)を演算する手法を提案する。
プラットフォームはイットリウム-鉄-ガーネットの球体をマイクロ波空洞に結合し、強いマイクロ波駆動がマグノンモードをポンプし、弱い磁場が空洞をプローブする。
論文参考訳(メタデータ) (Tue, 25 Nov 2025 12:42:18 GMT)