World Simulation with Video Foundation Models for Physical AI [181.8] 我々は,[Cosmos-Predict2.5]と[Cosmos-Transfer2.5]を,エンボディインテリジェンスをスケールするための汎用ツールとしてリリースする。
我々はNVIDIA Open Model Licenseの下で、ソースコード、事前訓練されたチェックポイント、およびキュレートされたベンチマークをリリースします。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:44:13 GMT)
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuracy [129.3] Long-VITAは、長いコンテキストの視覚言語理解タスクのための大規模なマルチモーダルモデルである。
4Kフレームまたは1Mトークン上で、画像、ビデオ、テキストのモダリティを同時に処理し、分析するのに適している。
Long-VITAは完全にオープンソースで再現可能である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:02:48 GMT)
Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures [118.0] 我々は100以上の言語を対象とした参加型コモンセンス推論ベンチマークであるGlobal PIQAを提案する。
グローバルPIQAの116の言語変種は、5つの大陸、14の言語族、23の文字体系をカバーしている。
グローバルPIQAの非並列分割では、50%以上の例が地元の食品、習慣、伝統、その他の文化的特有な要素を参照している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:46:25 GMT)
Enhancing Pre-trained Representation Classifiability can Boost its Interpretability [112.3] 表現内の解釈可能な意味の比率との相関を利用して、表現解釈可能性の定量化を行う。
Inherent Interpretability Score(IIS)を提案し、情報損失を評価し、解釈可能なセマンティクスの比率を測定し、表現解釈可能性の定量化を行う。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:21:06 GMT)
OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs [92.2] OpenFactCheckは、大規模な言語モデルのためのオープンソースのファクトチェックフレームワークである。
ユーザーは自動的にファクトチェックシステムを簡単にカスタマイズできる。
また、そのシステムを用いて、入力文書におけるすべてのクレームの事実性を評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:14:55 GMT)
Relative Scaling Laws for LLMs [91.7] スケーリング法則は、追加のデータ、パラメータ、計算によって言語モデルがどのように改善されるかを記述する。
相対的なスケーリング法則を導入し、テスト分布間のパフォーマンスギャップをスケールで追跡する。
これらの結果は、スケーリングは全体的なパフォーマンスを改善するが、普遍的等化器ではないことを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:55:22 GMT)
Neural USD: An object-centric framework for iterative editing and control [91.1] ニューラル・ユニバーサル・シーン・ディスクリプタ(Neural Universal Scene Descriptor)またはニューラル・USD(Neural USD)は、構造化された階層的なシーンやオブジェクトを表す。
これは多様な信号に対応し、モデル固有の制約を最小限にし、外観、幾何学、ポーズに対するオブジェクトごとの制御を可能にする。
我々は、Neural USDが反復的かつインクリメンタルな編集を可能にしていることを実証し、フレームワークの設計上の考慮事項を評価した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:19:42 GMT)
Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [90.6] 一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している
本調査では,世界モデルの最新動向を包括的に調査する。
我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:04:23 GMT)
Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning [89.6] より強力な監督を伴わないクオリティク言語モデルを開発するためのオンラインRLアプローチであるCrytique-RLを提案する。
提案手法は,アクターが応答を生成し,批評家がフィードバックを提供し,アクターがそれに応じて応答を洗練する,という2段階のパラダイムに基づいている。
さまざまなタスクやモデルに対する実験では、Cristique-RLが大幅なパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:37:01 GMT)
COMMUNITYNOTES: A Dataset for Exploring the Helpfulness of Fact-Checking Explanations [89.4] ユーザが提供するノートと有用なラベルを用いた104kポストの大規模データセットを提示する。
本稿では,自動的なプロンプト最適化による理由定義の自動生成と改善を行うフレームワークを提案する。
実験の結果,最適化された定義は有用性と推論の両方を改善できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:28:47 GMT)
Learning to See and Act: Task-Aware View Planning for Robotic Manipulation [88.4] Task-Aware View Planning (TAVP)は、アクティブなビュープランニングとタスク固有の表現学習を統合するために設計されたフレームワークである。
提案したTAVPモデルは、最先端の固定ビューアプローチよりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:21:38 GMT)
Quadratic Direct Forecast for Training Multi-Step Time-Series Forecast Models [88.2] 既存の訓練目的は主に、各将来のステップを独立して均等に重み付けされたタスクとして扱う。
本稿では,両課題を同時に解決する2次元重み付き学習目標を提案する。
実験の結果,QDFは様々な予測モデルの性能を効果的に向上することが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:48:25 GMT)
DeshadowMamba: Deshadowing as 1D Sequential Similarity [85.1] 指向性状態遷移を通じてグローバルなコンテキストを伝播する選択状態空間モデルであるMambaを紹介する。
その可能性にもかかわらず、マンバを画像データに直接適用することは、シャドー・ノン・シャドウ・セマンティクスの認識が欠けているため、最適ではない。
我々は,マンバの入力ゲートにシャドウ・アウェアの類似性を注入する方向変調機構であるCrossGateを提案する。
外観の忠実度をさらに高めるために,グローバルな色統計によって駆動される対照的な学習目標であるColorShift正則化を導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:14:23 GMT)
Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents [85.0] 本稿では,エージェントデータセット間の"インターリングア"として機能する軽量表現言語であるエージェントデータプロトコル(ADP)を紹介する。
ADPはAPI/ツールの使用、ブラウジング、コーディング、ソフトウェアエンジニアリング、一般的なエージェントなど、さまざまなタスクを捉えるのに十分な表現力を持っている。
すべてのコードとデータが公開され、ADPが標準化され、スケーラブルで再現可能なエージェントトレーニングの障壁を低くすることを期待している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:53:13 GMT)
Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation [84.9] Ming-Flash-Omniは、Ling-Flash-2.0のスペーサーMixture-of-Experts (MoE)の派生版上に構築されており、総パラメータは1000億である。
前バージョンと比較すると、アップグレード版はマルチモーダルな理解と生成にまたがって大幅に改善されている。
Ming-Flash-Omniは、テキスト・画像生成と生成セグメンテーションで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:24:13 GMT)
Provable Scaling Laws for the Test-Time Compute of Large Language Models [84.0] 本研究では,大規模言語モデルのテスト時間計算において,証明可能なスケーリング法則を享受する2つのアルゴリズムを提案する。
1つは2段階ノックアウト方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
もう1つは2段階のリーグ方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:59:43 GMT)
IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction [82.5] 人間は自然に3次元世界の幾何学的構造と意味的内容を中間次元として知覚する。
本稿では,空間再構成とインスタンスレベルの文脈理解の両面での知識を統合するために,IGGT (InstanceGrounded Geometry Transformer) を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:16:45 GMT)
Repurposing Synthetic Data for Fine-grained Search Agent Supervision [82.0] LLMベースの検索エージェントは、エンティティ中心の合成データに基づいてますます訓練されている。
一般的なトレーニングメソッドは、このリッチなエンティティ情報を破棄し、代わりにスパースで結果に基づく報酬に依存します。
E-GRPO(Entity-Aware Group Relative Policy Optimization)は、高密度なエンティティ認識報酬関数を定式化する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:50:40 GMT)
STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 4D Intelligence [81.9] 時間と3次元空間における音波力学の推論として定義される音声4次元インテリジェンスを形式化する。
STAR-Benchは、基礎的な音響知覚設定とホロスティックな時空間推論設定を組み合わせる。
データキュレーションパイプラインは、高品質なサンプルを保証するために2つの方法を使用します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:50:34 GMT)
Kernelized Sparse Fine-Tuning with Bi-level Parameter Competition for Vision Models [80.5] スパースチューニングは、下流タスクに最も関係のある重みだけを調整することで、顕著なパフォーマンスを達成する。
上述の制限を克服する一段法SNELLAを提案する。
SNELLAは低メモリ使用量でSOTA性能を達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:39:18 GMT)
Latent Sketchpad: Sketching Visual Thoughts to Elicit Multimodal Reasoning in MLLMs [80.2] マルチモーダルな大規模言語モデルと内部の視覚的スクラッチパッドを備えたフレームワークであるLatent Sketchpadを紹介した。
人間は、視覚的思考の形でスケッチを使ってアイデアを開発、伝達する方法に触発され、Latent Sketchpadを紹介します。
新しいデータセットMazePlanningでフレームワークを評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:26:20 GMT)
AL-CoLe: Augmented Lagrangian for Constrained Learning [79.5] 現代の機械学習のパラメータ化がほとんどないにもかかわらず、ラグランジアン双対性は制約付き学習問題に対処するための一般的なツールとなっている。
制約付き分類タスクにおいて,その有効性を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:25:00 GMT)
Routing Matters in MoE: Scaling Diffusion Transformers with Explicit Routing Guidance [79.2] Mixture-of-Experts (MoE) は計算効率を保ちながらモデルキャパシティをスケールするための強力なパラダイムとして登場した。
本稿では、専門家の専門化を促進する明示的なルーティングガイダンスを備えた2ステップルータを備えたMoEフレームワークであるProMoEを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:59:02 GMT)
Context-level Language Modeling by Learning Predictive Context Embeddings [79.0] textbfContextLMは、固有のtextbfnext-context予測目標で標準事前学習を強化するフレームワークである。
このメカニズムは、将来のトークンチャンクから派生したエラー信号を利用して、マルチトークンコンテキストの予測表現を学ぶようモデルを訓練する。
GPT2およびPythiaモデルファミリーの実験では、1.5ドルBのパラメータまでスケールし、ContextLMがパープレキシティとダウンストリームのタスクパフォーマンスの両方で一貫した改善を提供することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:35:34 GMT)
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models [78.3] ビデオ理解はコンピュータビジョンにおける最も困難なフロンティアである。
近年,映像理解タスクにおいて,映像多時間モデルが顕著に出現している。
Surveyは、ビデオ-LMM能力を向上するための統一的なフレームワークを研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:02:26 GMT)
OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [78.0] VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:22:39 GMT)
RETTA: Retrieval-Enhanced Test-Time Adaptation for Zero-Shot Video Captioning [77.6] Retrieval-Enhanced Test-Time Adaptation (RETTA) と呼ばれる新しいゼロショットビデオキャプションフレームワークを提案する。
一般的なビデオテキスト検索モデルXCLIP、一般的な画像テキストマッチングモデルCLIP、テキストアライメントモデルAnglE、テキスト生成モデルGPT-2の4つのキーモデルを用いてビデオとテキストをブリッジする。
そこで本研究では,GPT-2,XCLIP,CLIP,AnglEの4つのフリーズモデルにおいて,学習可能なトークンを通信媒体として用いることを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:43:19 GMT)
Seeing Through the MiRAGE: Evaluating Multimodal Retrieval Augmented Generation [75.7] マルチモーダルソースからの検索拡張生成(RAG)評価フレームワークであるMiRAGEを紹介する。
MiRAGEは、InfoF1とCiteF1で構成されるマルチモーダルRAG評価のためのクレーム中心のアプローチである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:21:19 GMT)
Evolving Diagnostic Agents in a Virtual Clinical Environment [75.6] 本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:19:47 GMT)
Rethinking Visual Intelligence: Insights from Video Pretraining [75.3] 大規模言語モデル(LLM)は、大規模事前学習によってシステムが新しい問題に迅速に適応できることを実証している。
本稿では,映像拡散モデル(VDM)をギャップを埋めるための有望な方向として検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:12:11 GMT)
Deeply-Conditioned Image Compression via Self-Generated Priors [75.3] 我々は,自己生成前駆体(DCIC-sgp)を経由したDeeply-Conditioned Image Compression(Deeply-Conditioned Image Compression)という,機能的分解を前提としたフレームワークを提案する。
我々のフレームワークは、Kodak、CLIC、Tecnickデータセット上のVVCテストモデルVTM-12.1に対して、14.4%、15.7%、および15.1%のBDレートの大幅な削減を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:04:19 GMT)
CustomVideo: Customizing Text-to-Video Generation with Multiple Subjects [74.6] テキスト・ビデオ・ジェネレーションのパーソナライズへの現在のアプローチは、複数の課題に対処することに悩まされている。
複数の被験者の指導でアイデンティティ保存ビデオを生成する新しいフレームワークであるCustomVideoを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:47:22 GMT)
ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization [73.1] 本稿では,意味的整合性評価を自己形式化プロセスに統合する反射的自己形式化手法を提案する。
これにより、モデルが形式的なステートメントを反復的に生成し、セマンティックな忠実さを評価し、自己修正された特定エラーを発生させることができる。
実験の結果、ReFormは最強のベースラインに対して平均17.2ポイントの改善を達成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:22:54 GMT)
Can Aha Moments Be Fake? Identifying True and Decorative Thinking Steps in Chain-of-Thought [72.5] 大きな言語モデル(LLM)は、テスト時に長いチェーン・オブ・ソート(CoT)を生成することができ、複雑なタスクを解決できる。
提案したTrue Thinking Score (TTS) を用いて、各推論ステップの段階的因果関係がモデルの最終予測に与える影響を測定する。
我々は、LLMの潜在空間におけるTrueThinking方向を同定し、モデルに特定のCoTステップの実行や無視を強制することができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:14:02 GMT)
Switchable Token-Specific Codebook Quantization For Face Image Compression [72.4] 顔画像圧縮のための切り換え可能なToken-Specific Codebook Quantizationを提案する。
トークンが少量のビットを持つコードブックグループを記録することで,コードブックグループのサイズを小さくする場合に発生する損失を低減することができる。
提案手法は顔認識データに対して有効性を示し,0.05bppの再構成画像に対して平均93.51%の精度を実現した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:57:57 GMT)
Verifying Large Language Models' Reasoning Paths via Correlation Matrix Rank [71.1] 大規模言語モデル (LLM) は誤りや幻覚を引き起こす傾向がある。
アウトプットを効果的かつ効率的にチェックする方法は、アプリケーションにとって重要な問題となっている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:01:10 GMT)
Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [70.7] カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。
既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。
DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:42:48 GMT)
UtilGen: Utility-Centric Generative Data Augmentation with Dual-Level Task Adaptation [70.2] UtilGenは、コンピュータビジョンタスクのための新しいユーティリティ中心のデータ拡張フレームワークである。
UtilGenは、常に優れたデータセットを達成しており、平均精度は以前のSOTAよりも3.87%向上している。
データの影響と分布のさらなる分析により、UtilGenはより影響のあるタスク関連合成データを生成することが明らかになった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:17:11 GMT)
Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay [69.7] 強化学習(RL)は、大規模言語モデル(LLM)の微調整に有効なアプローチとなっている。
LLM RLファインチューニングにおけるデータ効率向上のための2つの手法を提案する。
本手法は,従来のGRPOアルゴリズムと同等の性能を示しながら,RLの微調整時間を23%から62%削減する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:50:11 GMT)
AgentFrontier: Expanding the Capability Frontier of LLM Agents with ZPD-Guided Data Synthesis [69.1] 大きな言語モデルエージェントをその能力の最前線でタスクで訓練することは、高度な推論をアンロックする鍵となる。
近縁開発ゾーン(ZPD)の教育理論に着想を得たデータ合成アプローチを導入する。
本稿では,ZPD内に位置する高品質な多分野データを合成する自動パイプラインであるAgentFrontier Engineを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:50:47 GMT)
BLM$_1$: A Boundless Large Model for Cross-Space, Cross-Task, and Cross-Embodiment Learning [68.9] MLLM(Multimodal large language model)は、高度な視覚言語推論を持ち、エンボディエージェントへの展開が増えている。
我々は,ロバストなクロスボディーメント制御をサポートするマルチモーダル空間基盤モデルであるtextbfBoundless Large Model (BLM$_1$)を紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:58:39 GMT)
VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation [68.0] VOLDは、テキストのみの教師モデルからVLMの学生モデルに推論機能を移行するためのフレームワークである。
VOLDはベースラインモデルよりも大幅に優れ,最先端技術よりもマージンが向上していることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:09:37 GMT)
Iterative Critique-Refine Framework for Enhancing LLM Personalization [67.8] PerFineは、パーソナライズされたテキスト生成のための、統一的でトレーニング不要な批判修正フレームワークである。
各イテレーションにおいて、LLMジェネレータは、検索されたプロファイルに条件付きドラフトを生成し、同じプロファイルに条件付きである批評家のLLMは、トーン、語彙、文構造、話題性に関する構造化されたフィードバックを提供する。
Yelp、Goodreads、Amazonのデータセット全体で、PerFineはPGraphRAGに対するパーソナライゼーションを一貫して改善している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:36:22 GMT)
HACK: Hallucinations Along Certainty and Knowledge Axes [66.7] 本稿では,2つの軸に沿って幻覚を分類する枠組みを提案する。
内部的に正しい知識を持っているにもかかわらず、モデルが確実に幻覚する幻覚のサブセットを特に特定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:34:31 GMT)
Investigating Intra-Abstraction Policies For Non-exact Abstraction Algorithms [64.4] モンテカルロ木探索(MCTS)の弱点は、そのサンプル効率である。
そこで我々は,いくつかの代替的吸収内政策を提案し,実証的に評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:00:30 GMT)
Affordance Representation and Recognition for Autonomous Agents [64.4] 本稿では,構造化データを用いた世界モデリングのためのパターン言語を提案する。
DOMトランスダクションパターンは、Webページの複雑さの課題に対処する。
Hypermedia Affordances Recognition Patternは、エージェントがその世界モデルを動的に強化することを可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:27:28 GMT)
TEXT2DB: Integration-Aware Information Extraction with Large Language Model Agents [64.1] 本稿では,IE 出力と対象データベースの統合を重視した IE TEXT2DB の新たな定式化を提案する。
データインフィル、行数、列の追加といった一般的な要求を特徴とする新しいベンチマークを導入する。
実験によると、OPALは異なるコードプランを生成し、必要なIEモデルを呼び出すことで、多様なデータベーススキーマにうまく適応できる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:49:40 GMT)
High-Energy Concentration for Federated Learning in Frequency Domain [62.9] 本稿では,高エネルギー濃度FL法(FedFD)を提案する。
FedFDは、離散コサイン変換が主に高エネルギー濃度と呼ばれる特定の領域にエネルギーを分配するという発見に触発されている。
5つの画像および音声データセットにおいて、FedFDは通信コストを低減しつつ、最先端の手法よりも優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:41:54 GMT)
Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies [62.7] VLA(Vision-Language-Action)モデルは、画像や命令をロボットアクションにマッピングするために、大きな視覚言語バックボーンを適応させる。
prevailingAsは、固定された左から右への順序で自動回帰的にアクションを生成するか、バックボーンの外側で分離または拡散ヘッドをアタッチする。
本稿では離散拡散を伴う離散化作用チャンクをモデル化する統一変換器ポリシである離散拡散VLAを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:22:20 GMT)
Trajectory Design for UAV-Based Low-Altitude Wireless Networks in Unknown Environments: A Digital Twin-Assisted TD3 Approach [62.1] 低高度無線ネットワーク(LAWN)のキーイネーブラーとして無人航空機(UAV)が登場している
我々は、デジタルツイン(DT)支援トレーニングおよびデプロイメントフレームワークを提案する。
このフレームワークでは、UAVは統合されたセンシングと通信信号を送信し、地上ユーザーに通信サービスを提供し、同時にDTサーバにアップロードされたエコーを収集して、仮想環境(VE)を段階的に構築する。
これらのVEはモデルトレーニングを加速し、展開中のリアルタイムUAVセンシングデータを継続的に更新し、意思決定をサポートし、飛行安全性を向上する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:05:53 GMT)
DrVoice: Parallel Speech-Text Voice Conversation Model via Dual-Resolution Speech Representations [62.0] DRVOICE-7BはOpenAudioBenchとBig Bench Audioベンチマーク上で新しい最先端(SOTA)を確立する。
本稿では,共同自己回帰モデルに基づくパラレル音声音声対話モデルであるDrVoiceを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:04:11 GMT)
ViPER: Empowering the Self-Evolution of Visual Perception Abilities in Vision-Language Model [61.3] ViPERは、自己評価と自己予測を通じて反復的な進化を可能にするように設計されたセルフブートストラッピングフレームワークである。
Qwen-Viperは、汎用性を維持しながら、さまざまな視覚言語シナリオにおける優れたパフォーマンスを一貫して示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:42:57 GMT)
Do Language Models Use Their Depth Efficiently? [61.0] Llama 3.1, Qwen 3, OLMo 2 モデルの残留ストリームを解析した。
後半のレイヤが前半のレイヤよりもはるかに少ないことが分かりました。
マルチホップタスクでは、モデルが深度を増してサブレサルを構成するという証拠が見つからない。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:56:58 GMT)
LeMat-Synth: a multi-modal toolbox to curate broad synthesis procedure databases from scientific literature [60.9] 本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いて合成手順と性能データを自動抽出・整理するマルチモーダルツールボックスを提案する。
LeMat-Synth (v 1.0):35種類の合成法と16種類の材料クラスにまたがる合成手順を含むデータセット。
我々は,新しいコーパスと合成ドメインへのコミュニティ主導の拡張をサポートするために設計された,モジュール形式のオープンソースライブラリをリリースする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:58:18 GMT)
VC4VG: Optimizing Video Captions for Text-to-Video Generation [60.5] 本稿では,テキスト・ツー・ビデオ(T2V)モデルのニーズに合わせて,包括的なキャプション最適化フレームワークであるVC4VGを紹介する。
評価を支援するため,T2V仕様に適合する細粒度,多次元,必要グレードのメトリクスを特徴とする新しいベンチマークVC4VG-Benchを構築した。
広汎なT2V微調整実験は、キャプション品質の改善と映像生成性能に強い相関を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:19:01 GMT)
LongWeave: A Long-Form Generation Benchmark Bridging Real-World Relevance and Verifiability [60.5] textbfLongWeaveを導入し、Constraint-Verifier Evaluation(CoV-Eval)による実世界と検証のバランスをとる。
LongWeaveは7つの異なるタスクに対して、カスタマイズ可能な入出力長(最大64K/8Kトークン)をサポートする。
23大言語モデルの評価は、実世界の複雑さと出力長の増加に伴い、最先端モデルでさえ、長文生成において重大な課題に直面していることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:11:12 GMT)
WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking [60.4] 情報検索は、自律的な推論と意思決定を可能にする中核的な能力である。
我々は、高カバレッジなISタスクを構築し、効率的なソリューショントラジェクトリを生成するためのフレームワークであるWebLeaperを提案する。
本手法は,強いベースラインに対する有効性と効率性の向上を継続的に達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:51:42 GMT)
FieldGen: From Teleoperated Pre-Manipulation Trajectories to Field-Guided Data Generation [60.3] FieldGenは、スケーラブルで多様な、高品質な実世界のデータ収集を可能にする、フィールド誘導型データ生成フレームワークである。
実験により、FieldGenでトレーニングされたポリシーは、遠隔操作ベースのベースラインと比較して、より高い成功率と安定性を達成することが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:10:50 GMT)
GEMeX-RMCoT: An Enhanced Med-VQA Dataset for Region-Aware Multimodal Chain-of-Thought Reasoning [60.0] 医学的視覚的質問応答は、医学的イメージに基づいた自然言語的質問にモデルで答えることによって、臨床的な意思決定を支援することを目的としている。
現在の方法はまだ、答えの信頼性の制限と解釈性の低下に悩まされている。
この研究はまず、回答を生成するプロセスが中間的推論ステップのシーケンスに先行する領域対応マルチモーダル・チェーン・オブ・ソートデータセットを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:37:24 GMT)
OpenFactCheck: Building, Benchmarking Customized Fact-Checking Systems and Evaluating the Factuality of Claims and LLMs [59.8] OpenFactCheckは、カスタマイズされたファクトチェックシステムを構築するためのフレームワークである。
ユーザーは自動的にファクトチェッカーをカスタマイズし、文書やクレームの事実的正当性を検証できる。
CheckerEVALは、人間の注釈付きデータセットを使用して、自動ファクトチェッカーの検証結果の信頼性を高めるソリューションである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:27:32 GMT)
ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking [59.7] 並列思考は探索範囲を広げ、情報探索(IS)エージェントの深い探索を補完する。
ディープISエージェント用に設計された2段階パラダイムであるParallelMuseを提案する。
複数のオープンソースエージェントとベンチマークの実験では、最大62%のパフォーマンス改善が示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:51:50 GMT)
SCOPE: Saliency-Coverage Oriented Token Pruning for Efficient Multimodel LLMs [59.4] textbfSaliency-textbfCoverage textbfOriented token textbfPruning for textbfEfficient MLLMs。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:29:37 GMT)
BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.0] 高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:10:09 GMT)
SPICE: Self-Play In Corpus Environments Improves Reasoning [58.8] SPICEは、単一のモデルが2つの役割で機能する強化学習フレームワークである。
チャレンジャーは、様々な推論タスクを生成するために、大きなコーパスから文書をマイニングする。
本分析は,SPICEにおける文書の基盤化が,ますます困難な目標を連続的に生み出す上で,いかに重要な要素であるかを明らかにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:46:16 GMT)
MCP-Flow: Facilitating LLM Agents to Master Real-World, Diverse and Scaling MCP Tools [58.6] 大規模言語モデルは、複雑で現実的なタスクを実行するために、ますます外部ツールに依存しています。
既存のMSPリサーチは、少数のサーバーをカバーし、コストのかかる手作業によるキュレーションに依存し、トレーニングサポートが欠如している。
我々は大規模なサーバ発見、データ合成、モデルトレーニングのための自動Webエージェント駆動パイプラインであるMPP-Flowを紹介した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:42:17 GMT)
VividCam: Learning Unconventional Camera Motions from Virtual Synthetic Videos [58.1] VividCamは、拡散モデルによって合成ビデオから複雑なカメラの動きを学習する訓練パラダイムである。
我々は、驚くほど単純な合成データを用いて、精密に制御された複雑なカメラの動きを広範囲に合成できることを実証した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:12:22 GMT)
BrowseConf: Confidence-Guided Test-Time Scaling for Web Agents [58.1] 本研究では,長期にわたる行動の後,言語化された信頼度スコアを用いて,検索エージェントが自身の信頼を伝達できるかどうかを検討する。
本研究では,信頼度スコアを用いて回答の質を判断し,信頼度レベルに達するまで再度試すテスト時間スケーリング(TTS)手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:23:04 GMT)
TowerVision: Understanding and Improving Multilinguality in Vision-Language Models [56.8] TowerVisionは、画像テキストとビデオテキストの両方のためのオープンな多言語視覚言語モデルである。
微調整中に視覚的、文化的コンテキストを取り入れることで、私たちのモデルは既存のアプローチを超えます。
さらなる研究を支援するため、すべてのモデル、データ、トレーニングレシピを公開しています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:23:06 GMT)
From Cross-Task Examples to In-Task Prompts: A Graph-Based Pseudo-Labeling Framework for In-context Learning [55.9] In-context Learning (ICL) は、大きな言語モデルでパラメータを更新せずに新しいタスクを実行できる。
データラベリングのための言語モデルに依存するコスト効率のよい2段階パイプラインを提案する。
5つのタスクにまたがる実験により,ラベリングコストを下げながら,本手法が高い性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:37:51 GMT)
Methodology for Comparing Machine Learning Algorithms for Survival Analysis [55.7] 生存分析のための6つの機械学習モデルを評価した。
XGB-AFTは最高性能(C-Index = 0.7618; IPCW = 0.7532、GBSAとRCF)を達成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:42:28 GMT)
TeleEgo: Benchmarking Egocentric AI Assistants in the Wild [55.5] 実世界のエゴセントリックなAIアシスタントは、マルチモーダル入力(ビデオ、オーディオ、テキスト)を処理しなければならない
我々は、エゴセントリックなAIアシスタントを評価するために、長いデュレーション、ストリーミング、オムニモーダルのベンチマークであるtextbfTeleEgoを紹介した。
このデータセットは、4つのドメインにわたる同期されたエゴセントリックなビデオ、オーディオ、テキストの参加者あたり14時間以上を特徴としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:24:24 GMT)
CritiCal: Can Critique Help LLM Uncertainty or Confidence Calibration? [55.3] 本稿では,自然言語批判が言語的信頼をいかに高めるかを検討する。
本稿では,LLMの信頼性をただの精度以上で評価し,信頼性を最適化する自己批判を提案する。
実験の結果、CritiCalはSelf-Critiqueや他の競争ベースラインを大きく上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:16:06 GMT)
Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.3] 顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:28:12 GMT)
DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights [54.9] 脳腫瘍の正確なセグメンテーションは、臨床診断と治療に重要である。
マンバを拠点とするState Space Modelsは、有望なパフォーマンスを示している。
本稿では,計算オーバーヘッドを最小限に抑えながら,マルチスケールの長距離依存関係をキャプチャするマルチ解像度双方向マンバを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:50:18 GMT)
DeltaPhi: Physical States Residual Learning for Neural Operators in Data-Limited PDE Solving [54.6] DeltaPhiは、PDE解決タスクを、直接入力出力マッピングの学習から、類似の物理的状態間の残差学習に変換する、新しい学習フレームワークである。
大規模な実験は、様々な物理的システムにまたがって一貫した、重要な改善を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:56:59 GMT)
PANDA: Towards Generalist Video Anomaly Detection via Agentic AI Engineer [54.1] ビデオ異常検出(VAD)は、現実のシナリオの複雑で多様な性質のため、重要な課題である。
以前の方法は、新しいシナリオや見えない異常タイプに適用する場合、ドメイン固有のトレーニングデータと手動の調整に依存していた。
本研究では,MLLMに基づくエージェントAI技術者であるPANDAを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:48:45 GMT)
Enhancing CLIP Robustness via Cross-Modality Alignment [54.0] 視覚言語モデルのための最適なトランスポートベースフレームワークであるクロスモダリティアライメントを提案する。
COLAは、グローバルな画像テキストアライメントと特徴空間における局所的な構造的一貫性を復元する。
COLAはトレーニングフリーで、既存の微調整モデルと互換性がある。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:47:44 GMT)
scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.7] 単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。
本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:28:39 GMT)
Discourse Features Enhance Detection of Document-Level Machine-Generated Content [53.4] 機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
既存のMGC検出器は、しばしば表面レベルの情報のみに焦点を当て、暗黙的かつ構造的な特徴を見渡す。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:20:41 GMT)
Non-Singularity of the Gradient Descent map for Neural Networks with Piecewise Analytic Activations [53.3] 重みとバイアスの空間上の関数としてのニューラルネットワークマップについて検討する。
我々は、現実的なニューラルネットワークアーキテクチャの損失ランドスケープにおける勾配降下(GD)マップの非特異性を初めて証明した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:34:33 GMT)
Multi-Agent Evolve: LLM Self-Improve through Co-evolution [53.0] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を高める大きな可能性を証明している。
近年のSelf-Play RL法は,ゲームやGoのパラダイムの成功に触発されて,人間に注釈を付けることなくLSM推論能力を向上することを目指している。
数学,推論,一般知識Q&Aなど多種多様な課題の解決において,LLMが自己発展できるフレームワークであるMulti-Agent Evolve(MAE)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:30:44 GMT)
Stealthy Patch-Wise Backdoor Attack in 3D Point Cloud via Curvature Awareness [52.8] バックドア攻撃はディープニューラルネットワーク(DNN)に深刻な脅威をもたらす
既存の3Dポイントのクラウドバックドア攻撃は、サンプルワイドなグローバルな修正に依存している。
我々は,3Dポイントクラウド用のパッチワイドバックドアアタックフレームワークであるStealthy Patch-Wise Backdoor Attack (SPBA)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:24:48 GMT)
Open Korean Historical Corpus: A Millennia-Scale Diachronic Collection of Public Domain Texts [52.8] 我々は1,300年と6つの言語からなるデータセットであるOpen Korean Historical Corpusを紹介した。
このコーパスには7世紀から2025年までの19の資料から1800万の文書と50億のトークンが含まれている。
この研究は、韓国語の歴史を捉えることで、量的二時間分析の基盤となる資源を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:43:26 GMT)
Pearl: A Foundation Model for Placing Every Atom in the Right Location [52.4] タンパク質-リガンド共フォールディングの基礎モデルであるPearlを紹介した。
パールはタンパク質-リガンド結合における新しい最先端性能を確立している。
Pearlは、パブリックなRuns N' PosesとPoseBustersベンチマークでAlphaFold 3や他のオープンソースベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:36:51 GMT)
Superpowering Open-Vocabulary Object Detectors for X-ray Vision [52.2] オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
RAXOは市販のRGB OvOD検出器を高強度X線検出に活用するフレームワークである。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:20:36 GMT)
ZTRS: Zero-Imitation End-to-end Autonomous Driving with Trajectory Scoring [52.2] ZTRS(Zero-Imitation End-to-End Autonomous Driving with Trajectory Scoring)は、情報を失うことなくセンサー入力と堅牢な計画のためのRLトレーニングという、両方の世界の強みを組み合わせたフレームワークである。
ZTRSは、Navtest、Navhard、HUGSIMの3つのベンチマークで強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:26:36 GMT)
DynaRend: Learning 3D Dynamics via Masked Future Rendering for Robotic Manipulation [52.1] 本稿では、3次元認識と動的インフォームド三面体特徴を学習する表現学習フレームワークDynaRendを紹介する。
マルチビューRGB-Dビデオデータに基づく事前トレーニングにより、DynaRendは空間幾何学、将来のダイナミクス、タスク意味を統合された三面体表現で共同でキャプチャする。
我々は、RLBenchとColosseumという2つの挑戦的なベンチマークでDynaRendを評価し、政策成功率、環境摂動の一般化、様々な操作タスクにおける実世界の適用性などを大幅に改善した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:17:11 GMT)
On Robustness of Vision-Language-Action Model against Multi-Modal Perturbations [52.1] 視覚-言語-アクション(VLA)モデルでは、現実世界の摂動に対する堅牢性は、デプロイに不可欠である。
本稿では,VLA入力と出力の摂動に対するロバストVLAを提案する。
LIBEROの実験では、ロバストVLAは、pi0バックボーンで12.6%、OpenVLAバックボーンで10.4%のベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:55:21 GMT)
Long-RVOS: A Comprehensive Benchmark for Long-term Referring Video Object Segmentation [51.3] 本稿では,長期参照オブジェクトセグメンテーションのための大規模ベンチマークであるLongtextbf-RVOSを紹介する。
Long-RVOSには、平均時間60秒を超える2,000以上のビデオが含まれており、さまざまなオブジェクトをカバーしている。
フレーム単位の空間評価にのみ依存する従来のベンチマークとは異なり、時間的・時間的整合性を評価するために2つの指標を導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:41:49 GMT)
Why Knowledge Distillation Works in Generative Models: A Minimal Working Explanation [50.8] 知識蒸留(KD)は、現代の生産モデルの訓練と展開における中核的な要素である。
我々は,KDが学生モデルにおける精度とリコールのトレードオフを引き起こすことを示す。
本分析は、生成モデルにおけるKDの有効性について、単純かつ一般的な説明を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:12:26 GMT)
Hyperparameters in Continual Learning: A Reality Check [50.8] 連続学習(CL)は、可塑性(新しいタスクを学ぶ)と安定性(事前知識を保持する)のトレードオフをバランスしながら、一連のタスクでモデルを訓練することを目的としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:13:11 GMT)
POWSM: A Phonetic Open Whisper-Style Speech Foundation Model [50.7] POWSMは、複数の電話関連のタスクを共同で実行できる最初の統合フレームワークである。
私たちのトレーニングデータ、コード、モデルは、オープンサイエンスを育むためにリリースされています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:43:45 GMT)
Synergistic Neural Forecasting of Air Pollution with Stochastic Sampling [50.4] 大気汚染は世界的な健康と環境のリスクの先駆けであり、特に山火事、都市干ばつ、塵嵐による大気汚染の急激な増加に弱い地域ではなおもである。
本稿では,気象および大気組成データを統合し,平均および極端汚染レベルの予測を改善する高分解能神経予測モデルであるSynCastを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:18:00 GMT)
MMPerspective: Do MLLMs Understand Perspective? A Comprehensive Benchmark for Perspective Perception, Reasoning, and Robustness [50.3] MMPerspectiveはマルチモーダルな大言語モデルの視点理解を評価するために設計された最初のベンチマークである。
このベンチマークでは,実世界の2,711の合成画像と5,083の問合せ対でキー機能を調べている。
43の最先端MLLMの総合評価により,重要な限界が明らかになった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:35:54 GMT)
Assessing the robustness of heterogeneous treatment effects in survival analysis under informative censoring [50.2] 臨床研究ではドロップアウトが一般的で、副作用やその他の理由で患者の半数以上が早期に退院する。
ドロップアウトが有益な場合、治療効果の推定値にもバイアスがかかるため、検閲バイアスが導入される。
検閲バイアスに直面した場合の生存分析における条件平均処理効果推定のロバスト性を評価するための仮定リーンフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:46:53 GMT)
Online neural fusion of distortionless differential beamformers for robust speech enhancement [50.1] 適応凸結合(ACC)アルゴリズムを導入し、複数の固定ビームフォーマの出力を線形に結合してロバスト性を向上させる。
ACCは、急激な変更を確実に追跡できないため、高速に動く干渉など、非常に非定常的なシナリオで失敗することが多い。
本稿では,複数の歪みのないディファレンシャルビームフォーマのためのフレームオンラインニューラルフュージョンフレームワークを提案し,ニューラルネットワークによる重み付けを推定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:12:48 GMT)
OSWorld-MCP: Benchmarking MCP Tool Invocation In Computer-Use Agents [49.3] 我々は,コンピュータ利用エージェントのツール実行,GUI操作,意思決定能力を評価するための,最初の総合的かつ公正なベンチマークであるOSWorld-MCPを提案する。
厳密な手作業による検証は158の高品質なツールをもたらし、それぞれが正しい機能、実用性、汎用性を検証します。
OSWorld-MCPはマルチモーダルエージェントの理解を深め、複雑なツール支援環境でのパフォーマンスを評価するための新しい標準を設定している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:56:36 GMT)
SafeVision: Efficient Image Guardrail with Robust Policy Adherence and Explainability [49.1] 我々は,適応性と透明性を高めるために人間ライクな推論を統合する新しいイメージガードレールであるSafeVisionを紹介する。
提案手法には,効率的なデータ収集・生成フレームワーク,ポリシフォロートレーニングパイプライン,カスタマイズされた損失関数が組み込まれている。
SafeVisionは、異なるベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:35:59 GMT)
Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [48.9] 我々は、ChatGPTのような大規模言語モデル(LLM)が、直接の金融トレーニングなしでニュースの見出しから株式市場の反応を予測する能力について文書化している。
GPT-4は、認識後カットオフの見出しを使って、最初の市場の反応を捉え、取引不能な初期反応に対して、ポートフォリオの1日当たりのヒット率を約90%達成している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:24:07 GMT)
Vanish into Thin Air: Cross-prompt Universal Adversarial Attacks for SAM2 [48.7] UAP-SAM2は,2つの意味的偏差によって駆動されるSAM2に対する最初のクロスプロンプト的普遍的敵攻撃である。
UAP-SAM2は, 最先端(SOTA)攻撃に対して, 大差で有意に優れていた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:59:11 GMT)
Lookahead Tree-Based Rollouts for Enhanced Trajectory-Level Exploration in Reinforcement Learning with Verifiable Rewards [48.3] Lookahead Tree-Based Rollouts (LATR) は、軌道レベルの多様性を明確に促進するために設計された新しいロールアウト戦略である。
LATRはポリシー学習を平均で131%加速し、最終パス@1パフォーマンスを4.2%向上させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:12:02 GMT)
APTBench: Benchmarking Agentic Potential of Base LLMs During Pre-Training [48.2] APTBenchは、現実世界のエージェントタスクと成功した軌道を多重選択やテキスト補完の質問に変換するフレームワークである。
中心となるエージェント能力、例えば計画と行動に焦点を当て、主要なエージェントシナリオ、ソフトウェア工学、深層研究をカバーしている。
既存の汎用ベンチマークと比較すると、APTBenchはモデル下流のパフォーマンスをエージェントとしてより予測的な信号を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:11:22 GMT)
HAMLET: Hyperadaptive Agent-based Modeling for Live Embodied Theatrics [48.2] HAMLETは、ドラマ制作とオンラインパフォーマンスに焦点を当てたマルチエージェントフレームワークである。
オンラインパフォーマンスでは、各俳優に自律的な心が与えられる。
HamLETは表現的で一貫性のある演劇体験を作り出すことができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:28:35 GMT)
S3C2 Summit 2025-03: Industry Secure Supply Chain Summit [48.1] ソフトウェアサプライチェーンは、膨大な経済とソフトウェア開発価値を提供します。
ここ数年、重要なソフトウェアサプライチェーンの脆弱なリンクをターゲットにしたサイバー攻撃が指数関数的に増加している。
NSFが支援するセキュアソフトウェアサプライチェーンセンター(S3C2)の4人の研究者が、セキュアソフトウェアサプライチェーンサミットを開催した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:47:07 GMT)
Multispectral State-Space Feature Fusion: Bridging Shared and Cross-Parametric Interactions for Object Detection [48.0] MS2Fusionと呼ばれる新しいマルチスペクトル状態空間特徴融合フレームワークが提案されている。
MS2フュージョンはデュアルパスパラメトリック相互作用機構を通じて効率的かつ効果的な融合を実現する。
我々のMS2Fusionは、主要なベンチマーク実験において、他の最先端のマルチスペクトルオブジェクト検出方法よりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:09:59 GMT)
NeedleInATable: Exploring Long-Context Capability of Large Language Models towards Long-Structured Tables [47.9] textscNeedleInATable (NIAT)は、各テーブルセルを針として扱い、セルの位置やルックアップ質問に基づいてターゲットセルを抽出するモデルを必要とする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:42:41 GMT)
Automatically Benchmarking LLM Code Agents through Agent-Driven Annotation and Evaluation [47.9] PRDBenchは、20のドメインにわたる50の現実のPythonプロジェクトからなる、新しいベンチマークである。それぞれに構造化された製品要求文書(PRD)要件、包括的な評価基準、リファレンス実装がある。
我々はエージェント・アズ・ア・ジャッジ(Agen-as-a-Judge)パラダイムを用いてエージェントの出力を評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:26:45 GMT)
MARS-M: When Variance Reduction Meets Matrices [47.4] マトリックスベースのプレコンディショニングは、大規模なニューラルネットワークのためのスカラーベースのプレコンディショニングよりも効率的であることが示されている。
我々は,MARSにおける分散低減手法をMuonと統合する新しい手法であるMARS-Mを紹介する。
言語モデリングとコンピュータビジョンタスクにおける実験結果から、MARS-Mは、様々な下流ベンチマークにおいて、一貫して損失を減らし、性能を向上することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:27:41 GMT)
Partially Observable Multi-Agent Reinforcement Learning with Information Sharing [47.3] 部分的に観察可能なゲーム(POSG)の一般的な枠組みにおける証明可能なマルチエージェント強化学習(RL)について検討する。
時間とサンプルの複雑さが擬似多項式である部分観測可能なマルチエージェントRLアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:12:00 GMT)
Mining Large Independent Sets on Massive Graphs [47.2] ARCISは、巨大なグラフ上の大きな独立した集合をマイニングするための効率的なアルゴリズムである。
ARCISは、ほとんどのインスタンスで最高の、または最も結びついたソリューション品質が得られることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:42:26 GMT)
GST-UNet: A Neural Framework for Spatiotemporal Causal Inference with Time-Varying Confounding [46.5] データから因果効果を推定することは、公衆衛生、環境科学、政策評価において不可欠である。
本稿では、U-Netベースの時間エンコーダと回帰ベースの反復G-mputationを組み合わせたニューラルネットワークフレームワークであるGST-UNetを紹介する。
本研究は,カリフォルニアキャンプ火災時の山火事煙曝露および呼吸器病院の総合実験および実世界の分析において,その効果を検証した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:01:40 GMT)
Unlocking Out-of-Distribution Generalization in Dynamics through Physics-Guided Augmentation [46.4] 物理誘導量拡張プラグインのSPARKについて述べる。
多様なベンチマーク実験により、SPARKは最先端のベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:30:35 GMT)
Geometric Algorithms for Neural Combinatorial Optimization with Constraints [46.2] Self-Supervised Learning for Combinatorial Optimization (CO)は、ニューラルネットワークを使って問題を解決するための新しいパラダイムである。
ニューラルネットワークによる離散的な制約付き最適化問題の解決を可能にする、エンドツーエンドの微分可能なフレームワークを設計する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:49:01 GMT)
Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs [45.3] Video-SafetyBenchは、ビデオテキスト攻撃下でのLVLMの安全性を評価するために設計された最初のベンチマークである。
ビデオテキストのペアは2,264で、48のきめ細かいアンセーフなカテゴリにまたがっている。
安全性評価のためのセマンティックなビデオを生成するために,ビデオ意味論を主題画像とモーションテキストに分解する制御可能なパイプラインを設計する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:44:07 GMT)
Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [44.3] 最初の段階でActive Indexingを導入し、一般化可能なソースアンコールバインディングを作成します。
Qwen-2.5-7B&3Bの実験は、アクティブインデックスがパッシブインデックスのベースラインを一貫して上回っていることを示している。
内部の引用は、モデルを検索ノイズに対してより堅牢にすることで、外部の引用を補完する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:06:24 GMT)
MiniOneRec: An Open-Source Framework for Scaling Generative Recommendation [44.1] MiniOneRecは、最初の完全なオープンソースジェネレーティブレコメンデーションフレームワークである。
SID構築にまたがるエンドツーエンドワークフロー、教師付き微調整、レコメンデーション指向の強化学習を提供する。
実験の結果,モデルサイズの増加に伴い,トレーニングと評価の両方の損失が一貫した下降傾向を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:58:36 GMT)
Towards the Automatic Segmentation, Modeling and Meshing of the Aortic Vessel Tree from Multicenter Acquisitions: An Overview of the SEG.A. 2023 Segmentation of the Aorta Challenge [44.0] この分野での進歩を触媒するSEG.A.チャレンジを紹介します。
この課題は、隠れたテストセットで自動アルゴリズムをベンチマークした。
主要な結果は、上位のアルゴリズムのアンサンブルが個々のモデルよりも大幅に優れていたことである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:33:45 GMT)
A Generalized Label Shift Perspective for Cross-Domain Gaze Estimation [44.0] クロスドメイン・ゲイズ推定(CDGE)は、現実世界のアプリケーションシナリオ向けに開発された。
一般化ラベルシフト(GLS)の視点をCDGEに導入する。
条件付き不変学習に重み付けされた音源分布を埋め込むために,条件付き演算子の不一致の確率的推定を導出する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:36:12 GMT)
Model-Guided Dual-Role Alignment for High-Fidelity Open-Domain Video-to-Audio Generation [44.0] MGAudioは、オープンドメインのビデオオーディオ生成のためのフローベースのフレームワークである。
モデル誘導二重ロールアライメントを中心設計原則として導入している。
MGAudioはVGGSoundで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:16:47 GMT)
SemCoT: Accelerating Chain-of-Thought Reasoning through Semantically-Aligned Implicit Tokens [43.8] CoT(Chain-of-Thought)の推論は、効率クリティカルなアプリケーションへの大量展開を妨げる。
本稿では,SemCoTと呼ばれる意味的に整合した暗黙的CoTフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:11:54 GMT)
UrduFactCheck: An Agentic Fact-Checking Framework for Urdu with Evidence Boosting and Benchmarking [43.7] 既存のファクトチェックシステムは、主に英語で開発されており、世界中の2億人以上のウルドゥー語話者にとって大きなギャップを残している。
UrduFactBenchとUrduFactQAは、Urduにおける事実チェックと事実整合性評価を可能にするために設計された2つの新しいベンチマークである。
これらのベンチマークを補完するために,モノリンガルおよび翻訳に基づくエビデンス検索戦略を組み込んだモジュール型ファクトチェックフレームワークであるUrduFactCheckを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:55:49 GMT)
Dual-Mind World Models: A General Framework for Learning in Dynamic Wireless Networks [43.4] 本稿では,mmWave V2Xネットワークのための新しい2次元世界モデルベース学習フレームワークを提案する。
認知心理学に触発されて提案されたデュアルミンド世界モデルは、パターン駆動型システム1コンポーネントと論理駆動型システム2コンポーネントを含んでいる。
シミュレーションの結果,提案した世界モデルはデータ効率を大幅に向上することがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:45:15 GMT)
Explainable Federated Learning for U.S. State-Level Financial Distress Modeling [42.9] 連邦学習(FL)の米国財務能力研究への最初の応用について述べる。
我々は、センシティブなデータを集中化せずに、50の州とコロンビア特別区にまたがる消費者の財政難を予測するための解釈可能な枠組みを導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:55:01 GMT)
InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention [42.7] 拡散モデルは高品質な画像を生成する際、顕著な能力を示した。
本稿では,インスタンスアセンブルによるレイアウト条件を取り入れた新しいアーキテクチャであるInstanceAssembleを提案する。
本手法は,軽量 LoRA モジュールを用いた既存の DiT ベース T2I モデルへのフレキシブル適応を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:37:32 GMT)
What Can Be Recovered Under Sparse Adversarial Corruption? Assumption-Free Theory for Linear Measurements [42.5] 我々は (x*)-を含む最小の集合が (bme) を知らずに (bmA) から一様に回復可能であることを発見した。
主な結果は (x* + ker(bmU) であり、 (bmU) は (2q) を削除して得られる (bmA) の可能なすべての部分行列の行空間の交叉上の一意の射影行列であることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:29:46 GMT)
Meta-Learning Objectives for Preference Optimization [42.3] より単純なベンチマークにおいて、選好最適化アルゴリズムの有効性についての洞察を得ることが可能であることを示す。
我々はミラー優先最適化(MPO)と呼ばれるミラー降下に基づく新しいPOアルゴリズム群を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:32:09 GMT)
Spin Glass Dynamics on Complex Hardware Topologies: A Bond-Correlated Percolation Approach [42.0] 本稿では,スピングラスの量子アニールハードウェアに関連するネットワークアーキテクチャ上での非指数緩和挙動について検討する。
この枠組みにより、スピングラスのエネルギー景観をより包括的に特徴づけることができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:16:59 GMT)
Data Fusion of Deep Learned Molecular Embeddings for Property Prediction [42.0] ディープラーニングのようなデータ駆動型アプローチは、極めて精度と効率のよい材料特性の予測モデルをもたらす可能性がある。
予測を改善するために、トランスファーラーニングやマルチタスクラーニングといった技術が用いられている。
標準マルチタスクモデルは、弱い相関特性を持つスパースデータセットで訓練された場合、性能が劣る傾向にある。
本手法は、小分子の量子化学データのベンチマークデータセットと、文献および我々の量子化学および熱化学計算から収集した実験データのスパースデータセットに広く用いられている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:27:06 GMT)
Classically Prepared, Quantumly Evolved: Hybrid Algorithm for Molecular Spectra [42.0] 多体量子系における動的相関関数と励起スペクトルを計算するためのハイブリッド古典量子アルゴリズムを提案する。
この方法は、摂動基底状態の古典的な準備と、そこから採取された積状態の短時間の量子進化を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:27:12 GMT)
OpenReward: Learning to Reward Long-form Agentic Tasks via Reinforcement Learning [41.5] 大規模言語モデル(LLM)の整合には,リワードモデル(RM)が不可欠である。
ツール拡張型ロングフォーム報酬モデルであるOpenRMを導入し、外部ツールを呼び出して適切な証拠を収集することで、オープンエンドの応答を判断する。
新たにコンパイルされた3つのデータセットと2つの広く使用されているベンチマークの実験は、OpenRMが既存の報酬モデリングアプローチを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:02:46 GMT)
Are you sure? Measuring models bias in content moderation through uncertainty [41.4] 我々は、脆弱なグループに属する人々によって注釈付けされたメッセージの分類における不確実性に基づいて、モデルをベンチマークする教師なしのアプローチを提案する。
コンフォメーション予測手法を用いて計算された不確実性を利用して,女性や非白人アノテータに対する11モデルのバイアスを分析する。
その結果,一部の事前学習モデルでは,予測の信頼性が低い場合でも,少数派からのラベルを高い精度で予測できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:11:48 GMT)
Understanding AI Trustworthiness: A Scoping Review of AIES & FAccT Articles [41.4] 信頼できるAIは、AIESとFAccTという2つの主要なAI倫理カンファレンスの基礎となっている。
このスコーピングレビューは、AIESとFAccTコミュニティがAIの信頼性を概念化し、測定し、検証する方法を検討することを目的としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:20:05 GMT)
Dissecting Role Cognition in Medical LLMs via Neuronal Ablation [41.0] 大規模言語モデル (LLM) は医学的意思決定支援システムにおいて大きな注目を集めている。
一般的な実践であるPBRP(Prompt-Based Role Playing)は、様々な専門的振る舞いをシミュレートするために異なる臨床的役割を採用するようモデルに指示する。
本研究は, RP-Neuron-Activated Evaluation Framework (RPNA)を導入し, LLMにおける役割促進が, 役割特異的認知過程を誘導するか否かを評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:40:53 GMT)
AutoPrompt: Automated Red-Teaming of Text-to-Image Models via LLM-Driven Adversarial Prompts [40.3] AutoPrompTはブラックボックスフレームワークで、良心的なプロンプトのために、人間が読める敵の接尾辞を自動的に生成する。
本稿では,2次回避戦略を最適化フェーズに導入し,難易度に基づくフィルタとブラックリストワードフィルタの両方のバイパスを可能にする。
実験では、人間の可読性、耐フィルタ性のある対向プロンプトの優れた赤チーム性能を実証した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:32:14 GMT)
Sample-efficient and Scalable Exploration in Continuous-Time RL [40.0] 本研究では,非線形常微分方程式を用いて未知系の力学を表現した連続時間強化学習の問題を考察する。
我々はガウス過程やベイズニューラルネットワークのような確率モデルを利用して、基礎となるODEの不確実性を考慮したモデルを学ぶ。
これにより、連続時間モデルベースのRLに対するスケーラブルでサンプル効率のよいアプローチが得られる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:54:12 GMT)
Law in Silico: Simulating Legal Society with LLM-Based Agents [39.9] LLMをベースとしたエージェントフレームワークであるLaw in Silicoを紹介する。
実世界データとシミュレーション犯罪率を比較した実験により, LLMをベースとしたエージェントがマクロレベルの犯罪傾向を再現できることが実証された。
同時に、マイクロレベルのシミュレーションでは、十分に機能し、透明で適応的な法体系が、脆弱な個人の権利をよりよく保護することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:07:10 GMT)
VIRAL: Vision-grounded Integration for Reward design And Learning [39.8] 強化学習は報酬関数の最大化を目的としている。
近年の進歩は、報酬生成のための大規模言語モデルが人間のパフォーマンスを上回っていることを示している。
報酬関数の生成と精算のためのパイプラインであるVIRALを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:37:35 GMT)
$β$-DQN: Improving Deep Q-Learning By Evolving the Behavior [39.5] $beta$-DQNは、振る舞い関数で標準DQNを拡張する、シンプルで効率的な探索方法である。
適応型メタコントローラは、各エピソードに有効なポリシーを選択し、柔軟で説明可能な探索を可能にするように設計されている。
単純かつ挑戦的な探索領域の実験は、$beta$-DQNが既存のベースラインメソッドより優れていることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:26:34 GMT)
FunReason-MT Technical Report: Overcoming the Complexity Barrier in Multi-Turn Function Calling [39.5] 本稿では,FunReason-MTを提案する。FunReason-MTは,実世界のマルチターンツール利用のための新しいデータ合成フレームワークである。
FunReason-MTは、環境-APIグラフ相互作用を用いて、マルチターンFCデータの複雑さ障壁を解決する。
FunReason-MT生成データに基づいて構築された4Bモデルは、同等サイズのモデル間で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:15:26 GMT)
Re-ttention: Ultra Sparse Visual Generation via Attention Statistical Reshape [38.8] 大きなボトルネックは、複雑性が解像度とビデオ長で2倍にスケールする注意機構である。
既存の技術は、非常に高い空間レベルにおける視覚的品質の維持に失敗し、無視できない計算オーバーヘッドを発生させる可能性がある。
本稿では,視覚生成モデルに非常に注意を払わせるRe-ttentionを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:55:57 GMT)
ComboBench: Can LLMs Manipulate Physical Devices to Play Virtual Reality Games? [38.7] 本稿では,VRデバイス操作シーケンスにセマンティックアクションを変換する大規模言語モデルの性能を評価するベンチマークComboBenchを紹介する。
GPT-3.5, GPT-4, GPT-4o, Gemini-1.5-Pro, LLaMA-3-8B, Mixtral-8x7B, GLM-4-Flashの7つのLCMを, 注釈付き地上真実と人的性能と比較した。
Gemini-1.5-Proのようなトップパフォーマンスモデルでは,強いタスク分解能力を示す一方で,手続き的推論や空間的理解に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:55:42 GMT)
VSA: Faster Video Diffusion with Trainable Sparse Attention [38.4] ビデオ拡散トランス (DiTs) のスケーリングは、注意質量の大部分が少数の位置に集中しているにもかかわらず、2次元の注意によって制限される。
私たちはこの観察を、トレーニング可能なハードウェア効率の良いスパースアテンションであるVSAに変換し、Emphbothのトレーニングと推論の完全なアテンションを置き換える。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:13:18 GMT)
Group Relative Attention Guidance for Image Editing [38.3] Group Relative Attention Guidance (GRAG) は、編集命令に対する入力画像に対するモデルの焦点を変調するシンプルで効果的な方法である。
私たちのコードはhttps://www.littlemisfit.com/little-misfit/GRAG-Image-Editing.comでリリースされます。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:22:44 GMT)
CITADEL: Context Similarity Based Deep Learning Framework Bug Finding [38.0] 既存のDLフレームワークテストツールは非効率で、数百のテストケースを生成し、トリガのバグが少ない。
効率と有効性の観点からバグ発見を高速化する手法であるCitadelを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:33:32 GMT)
Generative AI for Healthcare: Fundamentals, Challenges, and Perspectives [37.9] 我々は、医療のためのGenAIシステムの設計と展開において、データ中心のパラダイムを提案する。
このエコシステムは、多様な医療データと知識の統合、表現、検索をサポートするように設計されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:47:44 GMT)
Efficient Adaptive Experimentation with Noncompliance [37.9] 本研究では, 適応実験における平均治療効果 (ATE) の推定問題について検討する。
半パラメトリック効率理論に基づいて、任意の履歴に依存した機器割り当てポリシーの下で、ATE推定のための効率境界を導出する。
結果ノイズとコンプライアンス変数のバランスをとる分散アロケーションルールによって最小化できることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:08:31 GMT)
Neutrino thermalization via randomization on a quantum processor [37.5] 非局所力学をエミュレートするための経験的ツールとしてランダム量子回路を用いた,より大規模なシステムにおけるフレーバーの熱化について検討した。
熱化時間は, 半古典的手法による予測と一致し, ほぼ正方根として成長することがわかった。
また、物理学におけるランダム回路の新たな応用を強調し、古典的に難解な複雑な多体力学の洞察を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:00:01 GMT)
Success and Cost Elicit Convention Formation for Efficient Communication [37.3] 本稿では,大規模なマルチモーダルモデルを訓練してコンベンションを形成する手法を提案する。
提案手法はモデル間の参照ゲームを用いており,人為的なデータを必要としない。
人間のリスナーは、コンベンションを形成するモデルと対話する際に、より速く反応します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:06:07 GMT)
Accelerate Scaling of LLM Finetuning via Quantifying the Coverage and Depth of Instruction Set [37.3] スーパーバイドファインチューニング(SFT)に使用されるデータのスケーリングは、モデル性能の比例的なゲインを保証するものではない。
この研究は、SFTスケーラビリティを管理する2つの基本的なデータセット特性を特定する。
モデルに依存しないデータ選択フレームワークである textbfInformation Landscape Approximation (ILA) を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:59:44 GMT)
InteractComp: Evaluating Search Agents With Ambiguous Queries [36.1] 検索エージェントがクエリのあいまいさを認識でき、検索中に積極的に対話できるかどうかを評価するためのベンチマークであるInteractCompを紹介する。
最高のモデルでは71.50%の完全コンテキストにもかかわらず、13.73%の精度しか達成していない。
この停滞は、検索タスク固有の即時フィードバックと相まって、InteractCompは、検索エージェントのインタラクション機能の評価とトレーニングの両方に有用なリソースとなる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:35:54 GMT)
Diffusion Models for Wireless Transceivers: From Pilot-Efficient Channel Estimation to AI-Native 6G Receivers [35.9] 拡散モデル(DM)のような生成AI手法は、粗い初期推定を効率的に扱うことができる。
本稿では,DMに基づくOFDMシステムのトランシーバ設計について述べる。
また、さらに適応したDMを無線受信機の性能を向上させるための概念実証ケーススタディも提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:10:11 GMT)
Challenging Multilingual LLMs: A New Taxonomy and Benchmark for Unraveling Hallucination in Translation [35.9] 大規模言語モデル(LLM)は高度な機械翻訳を持つが、幻覚に弱いままである。
我々は,教科と教科を分離する分類の枠組みを導入する。
この分類法でガイドされたHaloMTBenchは、英語からXまでの11方向にわたる多言語で人間認証されたベンチマークです。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:17:18 GMT)
Human-Like Goalkeeping in a Realistic Football Simulation: a Sample-Efficient Reinforcement Learning Approach [35.5] 本稿では,産業環境下での訓練や微調整に適したサンプル効率のよい深層強化学習法を提案する。
EA SPORTS FC 25におけるゴールキーパーエージェントのトレーニングを,今日最も売れているサッカーシミュレーションの一つとして評価した。
我々のエージェントは、ゲームに組み込まれたAIを10%のボールセーブレートで上回ります。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:50:12 GMT)
ReCode: Unify Plan and Action for Universal Granularity Control [35.5] 現実世界のタスクは、様々な粒度の決定を必要とし、人間は、統一された認知表現を活用することで、これを優れている。
現在のLLM(Large Language Model)ベースのエージェントには、決定の粒度を流動的に操作する重要な機能が欠けている。
単一のコード表現内に計画とアクションを統合することで、この制限に対処する新しいパラダイムであるReCodeを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:22:35 GMT)
Resi-VidTok: An Efficient and Decomposed Progressive Tokenization Framework for Ultra-Low-Rate and Lightweight Video Transmission [35.4] Resi-VidTokは、超低レートで軽量なビデオ伝送のためのレジリエント・トークン化対応フレームワークである。
重要なコントリビューションは、差分時間トークンコーディングを統合するビデオのためのレジリエントな1Dトークン化パイプラインである。
その結果, チャネル帯域幅比 (CBR) が0.0004, 30fps以上のリアルタイム再構成では, 頑健な視覚的・意味的整合性を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:02:36 GMT)
Integrating Counterfactual Simulations with Language Models for Explaining Multi-Agent Behaviour [35.2] AXIS(Interrogative Simulation)を用いたエージェントeXplanationを提案する。
AXISはマルチエージェントポリシーのための人間中心のアクション説明を生成する。
自動運転車のAXISを10シナリオで5 LLMで評価した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:33:31 GMT)
Parallel Loop Transformer for Efficient Test-Time Computation Scaling [34.8] 大規模言語モデル(LLM)は強力だが、推論中に現実世界で使うには遅すぎるしコストもかかる。
ループ変換器は、複数の計算ステップで同じ重みを再利用することでパラメータを節約する。
ループが次々と実行され、各追加ループで推論遅延とメモリ要求が増大する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:35:50 GMT)
SARC: Sentiment-Augmented Deep Role Clustering for Fake News Detection [34.8] 本稿では,偽ニュースの検出を改善するために,ユーザロールを識別するSentiment-Augmented Role Clusteringフレームワークを提案する。
このフレームワークは、共同コメントテキスト表現と感情符号化によってユーザ機能を生成する。
次に、ユーザロールを自動的に分類するために、差別化可能なディープクラスタリングモジュールを構築する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:26:34 GMT)
Prosperity before Collapse: How Far Can Off-Policy RL Reach with Stale Data on LLMs? [34.6] 古いデータは、適切に悪用された場合、政治上のデータと同じくらい情報的になり得ることを示す。
重み付けの第2モーメントを制約し, 極端外れ値のみを抑制するM2POを導入する。
M2POは、少なくとも256のモデル更新によってデータが不安定になっても、安定したオフポリシートレーニングを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:28:48 GMT)
DUET: Dual Model Co-Training for Entire Space CTR Prediction [34.4] textbfDUET (textbfdual Model Co-Training for textbfdual Model Co-Training for textbfEntire Space CtextbfTR Prediction) は、厳密な計算予算下で表現的モデリングを実現するための、設定可能な事前のフレームワークである。
最先端のベースラインを一貫して上回り、複数のコアビジネスメトリクスにまたがる改善を実現します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:46:33 GMT)
RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases [34.4] グラフモデリング手法を評価するための最初のベンチマークフレームワークであるRDB2G-Benchを紹介する。
本研究では,12タスクにおけるRDB-to-graph自動モデリング手法を,オンザフライ評価より約380倍高速にベンチマークする。
データセットとベンチマークの結果から,グラフモデルの有効性に影響を及ぼす重要な構造パターンが明らかになった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:17:40 GMT)
Quantum Combinatorial Reasoning for Large Language Models [34.2] 大規模言語モデル(QCR-LLM)の量子推論を設計・実装する。
我々のQCR-LLMは、複数のLCMバックボーンの推論精度を一貫して改善し、o3-highやDeepSeek R1などの推論システムを最大$9,$ppで上回っています。
これらの結果は、量子支援推論の初めての実験的証拠であり、ハイブリッド量子古典最適化は、大規模言語モデルにおける推論のコヒーレンス、解釈可能性、持続可能性を高めることができることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:20:38 GMT)
OmniText: A Training-Free Generalist for Controllable Text-Image Manipulation [34.1] 我々は、幅広いテキスト画像操作タスクを実行できる訓練不要のジェネラリストであるOmniTextを提案する。
具体的には,テキストの削除を可能にするクロスアテンション機構とセルフアテンション機構の2つの重要な特性について検討する。
多様なTIMタスクを評価するためのベンチマークデータセットであるOmniText-Benchを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:06:52 GMT)
PanicToCalm: A Proactive Counseling Agent for Panic Attacks [34.0] PACEは,1対1の物語から構築された高密度のエピソードを含むデータセットである。
このデータを用いて、共感的および指示的サポートを提供するために設計されたカウンセリングモデルであるPACERを訓練する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:21:35 GMT)
PRISM-Bench: A Benchmark of Puzzle-Based Visual Tasks with CoT Error Detection [34.0] PRISM-Benchはマルチモーダル大言語モデル(MLLM)を評価するために設計されたパズルに基づく視覚的課題のベンチマークである。
PRISM-Benchは、最終回答精度のみを測定する以前の評価とは異なり、診断タスクを導入している: 視覚パズルと、正確に1つのエラーを含むステップバイステップの連鎖が与えられた場合、モデルは最初の誤ったステップを特定する必要がある。
PRISM-Benchのパズルは多段階の記号的、幾何学的、類推的推論を必要とし、表面的なパターンマッチングに基づくショートカットに抵抗する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:07:50 GMT)
LoRA-DA: Data-Aware Initialization for Low-Rank Adaptation via Asymptotic Analysis [33.7] データ認識型LoRAの理論的枠組みを確立した。
そこで我々は,目標領域の少数のサンプルから最適化問題の項を推定するアルゴリズムLoRA-DAを開発した。
さらなる研究により、より速く、より安定な収束、ランク間の堅牢性、LoRA-DAのオーバーヘッドはわずかである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:55:36 GMT)
MDP3: A Training-free Approach for List-wise Frame Selection in Video-LLMs [33.4] ビデオ大言語モデル(ビデオ-LLM)は、ビデオの理解に大きな進歩をもたらした。
本稿では,クエリ関連性,リストワイド多様性,シーケンシャル性という,フレーム選択の3つの重要な原則に従わなければならないことを強調する。
フレーム選択のための動的プログラミング(MDP3)を用いたマルコフ決定点プロセスを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:18:29 GMT)
Creativity or Brute Force? Using Brainteasers as a Window into the Problem-Solving Abilities of Large Language Models [33.3] 我々は、モデルが使用する推論戦略のタイプをより深く調査するために、長い物語形式で書かれたブレインティーザに基づくベンチマークを導入する。
ブレインティーザは、創造的な洞察を使った数ステップのソリューションや、より残酷な力を使ったより長いソリューションなど、複数のアプローチで解決することができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:30:31 GMT)
Comprehensive and Efficient Distillation for Lightweight Sentiment Analysis Models [33.2] 近年の取り組みは、知識蒸留技術を活用して、軽量で実用的な感情分析モデルを開発する。
これらの手法は、人手による命令と大規模なユーザテキストに基礎を置いている。
感情分析のための包括的かつ効率的な蒸留フレームワークCompeFFDISTを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:46:48 GMT)
Diffusion Adaptive Text Embedding for Text-to-Image Diffusion Models [33.0] そこで我々は拡散適応テキスト埋め込み (DATE) を提案し, 中間摂動データに基づく各拡散段階におけるテキスト埋め込みを動的に更新する。
DATEは、様々なタスクにまたがる固定されたテキスト埋め込みに対して、優れたテキストイメージアライメントを提供しながら、モデルの生成能力を維持していることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:10:15 GMT)
Low-depth fermion routing without ancillas [32.4] フェミオンルーティングは、アンシラ、測定、フィードフォワードなしで、深さ$O(log2 N)$ emphで実行可能であることを示す。
我々は、すべての積保存三元木フェルミオンエンコーディング間の深さ$O(log2 N)$の効率的な写像を構築する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:11:46 GMT)
Perception, Understanding and Reasoning, A Multimodal Benchmark for Video Fake News Detection [32.3] 実証分析に基づいてMVFNDB(Multi-modal Video Fake News Detection Benchmark)を提案する。
このベンチマークは10のタスクで構成され、MLLMの認識、理解、検出時の能力の推論を精巧に調査するために設計されている。
複数の特徴を組み合わせることが最終結果に与える影響を検証するため,MVFND-CoTという新しいフレームワークを設計する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:04:13 GMT)
Huxley-Gödel Machine: Human-Level Coding Agent Development by an Approximation of the Optimal Self-Improving Machine [31.8] エージェントの自己改善ポテンシャルと符号化ベンチマーク性能のミスマッチを同定する。
ハクスリーのクラッドの概念に触発され、エージェントの子孫のベンチマークパフォーマンスを集計する計量(mathrmCMP$)を提案する。
我々はHuxley-G"odel Machine (HGM)を紹介し、$mathrmCMP$を推定してガイダンスとして使用することにより、自己修正のツリーを検索する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:03:29 GMT)
CT-Less Attenuation Correction Using Multiview Ensemble Conditional Diffusion Model on High-Resolution Uncorrected PET Images [31.7] 減衰は、検出器に到達する前に生体組織を横切ると検出される光子の最小化を指す。
ニューラルネットワークアーキテクチャの新しい進歩は、合成CT画像合成による代替アプローチを提案する。
Siemens Biograph Vision PET/CTスキャナで得られた159個の頭部スキャンの結果、擬似CT生成の質的および定量的な改善が示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:18:35 GMT)
GRAID: Enhancing Spatial Reasoning of VLMs Through High-Fidelity Data Generation [31.4] 標準検出器から2次元ボックスを用いて空間推論を学習するためのフレームワークを提案する。
GRAIDデータに基づいて訓練すると、モデルは過剰詳細保持型を一般化する空間的推論概念を学習する。
また、すべての質問タイプでトレーニングすると、いくつかの既存のベンチマークの改善が達成されることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:53:28 GMT)
Cross-Scenario Unified Modeling of User Interests at Billion Scale [31.3] 本稿では,産業レベルのコンテンツレコメンデーションシステムに適した,多種多様なシナリオのための高度なレコメンダエンジンであるRED-Recを提案する。
Red-Recは、複数の振る舞いコンテキストにまたがるユーザ関心の表現を統一し、包括的なアイテムとユーザモデリングをもたらす。
RED-RecのオンラインA/Bテストは、RedNoteの数億人のユーザを対象に、オンラインA/Bテストを通じて検証し、コンテンツレコメンデーションと広告ターゲティングタスクの両方において、大幅なパフォーマンス向上を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:58:38 GMT)
Optimal Arm Elimination Algorithms for Combinatorial Bandits [31.2] Combinatorial Banditsは、古典的なバンディットフレームワークを、学習者が各ラウンドで複数のアームを選択する設定に拡張する。
腕を3つのカテゴリ(確認、アクティブ、削除)に分割する新しい除去方式を導入する。
学習者は,一般的なグラフフィードバックによるマルチアームバンディットと,線形コンテキストバンディットの2つの設定で,アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:50:24 GMT)
PULSE: Practical Evaluation Scenarios for Large Multimodal Model Unlearning [31.2] LMMのための現実的な未学習シナリオのためのPULSEプロトコルを提案する。
そして、これらの次元に沿って既存の未学習手法を評価する。
以上の結果から,いくつかの技術は微調整によって習得した知識を学べるが,事前学習中に学習した情報の除去に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:11:23 GMT)
Beyond Objects: Contextual Synthetic Data Generation for Fine-Grained Classification [31.1] テキスト・ツー・イメージ(T2I)モデルは、合成データセット生成にますます利用されている。
いくつかの実例でT2Iモデルを微調整することで、合成トレーニングデータの質を向上させることができる。
細粒度分類に対する懸念を軽減するための細粒度調整戦略BOB(Beyondjects)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:40:14 GMT)
Enabling Near-realtime Remote Sensing via Satellite-Ground Collaboration of Large Vision-Language Models [31.1] 大型視覚言語モデル(LVLM)は、最近、低軌道(LEO)衛星によるリモートセンシング(RS)タスクにおいて大きな可能性を証明している。
RSタスクにおけるほぼリアルタイムLVLM推論のために設計された衛星地上協調システムGraceを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:48:26 GMT)
Training-Free Safe Text Embedding Guidance for Text-to-Image Diffusion Models [30.6] 本研究では,拡散モデルの安全性を向上させるためのトレーニング不要アプローチであるセーフテキスト埋め込みガイダンス(STG)を提案する。
STGは、期待された最終識別画像に基づいて評価された安全性関数に基づいてテキスト埋め込みを調整する。
ヌード、暴力、アーティストスタイルの除去など、さまざまな安全シナリオの実験は、STGがトレーニングベースとトレーニングフリーベースラインの両方を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:37:20 GMT)
Non-invasive mid-circuit measurement and reset on atomic qubits [30.5] 量子ビットのサブセットの中間回路測定とリセットは、量子エラー補正と多くの量子情報応用の重要な要素である。
本研究では, 個々のレーザービームと狭い原子遷移を用いて, 空間とスペクトルの分離を両立させる新しい計測手法を提案し, 試作を行った。
このスキームのユニークな利点は、全ての操作が読み出し量子ビットにのみ適用され、同じ種の他の量子ビットには無視できない障害とほとんどオーバーヘッドが生じることである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:07:15 GMT)
MGA: Memory-Driven GUI Agent for Observation-Centric Interaction [30.5] メモリ駆動型GUIエージェント(MGA)を導入し、まず観察の原理に基づいてGUIインタラクションをリフレームし、次に決定する。
MGAは最先端のベースラインに比べてロバスト性、一般化、効率性が著しく向上する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:19:58 GMT)
Reasoning Visual Language Model for Chest X-Ray Analysis [30.3] 胸部X線解釈にチェーン・オブ・シント(CoT)推論をもたらすフレームワークを提案する。
推論ファーストのトレーニングパラダイムにインスパイアされた私たちのアプローチは、専門家が結論を下すだけでなく、どのように判断するかを学ぶように設計されています。
我々は,胸部X線撮影における信頼に値する,説明可能なAIに向けたコミュニティの進展を支援するために,コードとモデルNV-Reason-CXR-3Bをリリースする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:48:00 GMT)
From Objects to Anywhere: A Holistic Benchmark for Multi-level Visual Grounding in 3D Scenes [30.0] Anywhere3D-Benchは2,886個の表現3D境界ボックスペアからなる総合的な3D視覚的グラウンドベンチマークである。
我々は,大規模言語モデルとともに,最先端の3次元視覚的グラウンドディング手法の評価を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:59:19 GMT)
Scalable Exploration via Ensemble++ [29.9] ランダムな線形結合を持つ新しい共有要素アンサンブルアーキテクチャを用いたスケーラブルな探索フレームワークを提案する。
線形帯域については、Ensemble++がThompson Samplingに匹敵する後悔を達成していることを示す理論的保証を提供する。
我々は、固定された特徴を学習可能なニューラル表現に置き換えることで、この理論の基礎を非線形報酬に拡張する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:26:28 GMT)
AdaRewriter: Unleashing the Power of Prompting-based Conversational Query Reformulation via Test-Time Adaptation [29.9] AdaRewriterは、テスト時間適応による結果管理報酬モデルを用いたクエリ再構成のための新しいフレームワークである。
AdaRewriterは、ほとんどの設定で既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:11:09 GMT)
Uncovering the Potential Risks in Unlearning: Danger of English-only Unlearning in Multilingual LLMs [29.7] N-gram-based Language-Mix (N-Mix) スコアを導入し,多言語LLMにおいて言語混同が広範かつ一貫性があることを定量的に示す。
N-Mixスコアが高い場合,基準に基づく測定値が偽陰性となり,新しいタイプの未学習評価の必要性が示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:05:00 GMT)
PTQTP: Post-Training Quantization to Trit-Planes for Large Language Models [29.6] 大規模言語モデル(LLM)から極低ビット幅への後学習量子化は依然として困難である。
既存のUltra-low-bit PTQ法はバイナリ近似や複雑な補償機構に依存している。
重量行列を構造化三重項 -1, 0, 1 個の三重項平面に分解する最初の三重項 PTQ フレームワークである Trit-Planes (PTQTP) について紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:14:52 GMT)
Mano Technical Report [29.6] Manoは、大規模なWebおよびコンピュータシステムデータに基づいて事前訓練されたマルチモーダル基盤モデル上に構築された堅牢なGUIエージェントである。
Mano氏は、Mind2WebやOSWorldなど、複数のGUIベンチマークで最先端のパフォーマンスをデモしている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:31:14 GMT)
MemoryBench: A Benchmark for Memory and Continual Learning in LLM Systems [29.5] LLMsysの継続的な学習能力を評価するために,ユーザフィードバックシミュレーションフレームワークとベンチマークを提案する。
実験により、最先端のベースラインの有効性と効率は、満足には程遠いことが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:01:30 GMT)
Improving LLM Reasoning via Dependency-Aware Query Decomposition and Logic-Parallel Content Expansion [29.5] AIによる検索や会話エージェントなどのリアルタイムWebアプリケーションへのLarge Language Modelsの統合は、Webインフラストラクチャの基本的な課題である。
そこで我々は,依存性を意識したクエリの分解と論理並列コンテンツの拡張を可能にする,新規で効率的な推論フレームワークOrionを提案する。
多様なベンチマークの実験によると、Orionはトークン生成速度を最大4.33倍、応答遅延を3.42倍まで削減するだけでなく、推論品質を最大18.75%向上させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:05:23 GMT)
Detecting and Mitigating Insertion Hallucination in Video-to-Audio Generation [29.4] Video-to-Audio世代は、ビデオのための自動サウンドに顕著な進歩を遂げた。
我々は、この現象を挿入幻覚と呼び、データセットバイアスによって引き起こされるシステム的リスクとみなす。
この問題の有病率と重症度を定量化する2つの新しい指標を導入する。
IHを緩和する新しいトレーニングフリー推論時間法であるPosterior Feature Correctionを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:16:25 GMT)
ReplicationBench: Can AI Agents Replicate Astrophysics Research Papers? [29.2] 本稿では、フロンティアAIエージェントの評価フレームワークであるReplicationBenchを紹介する。
天体物理学の文献から得られた研究論文全体を、エージェントが複製できるかどうかを検査する。
R ReplicationBenchは、論文スケールで専門家が検証した天体物理学の研究タスクの最初のベンチマークを確立している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:21:19 GMT)
Adaptive Frontier Exploration on Graphs with Applications to Network-Based Disease Testing [29.0] 我々は,各ノードが未知のラベルを持つような$n$-node graph $mathcalG$上で,逐次決定問題を研究する。
我々は、一般的なグラフに適用可能なGittinsインデックスベースのポリシーを設計し、$mathcalG$がフォレストである場合に確実に最適である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:04:11 GMT)
SynthWorlds: Controlled Parallel Worlds for Disentangling Reasoning and Knowledge in Language Models [28.9] 本稿では,タスク推論の複雑さを現実の知識から切り離すフレームワークであるSynthWorldsを紹介する。
SynthWorldsでは、同一の相互接続構造を持つ2つの世界を表す並列コーパスを構築する。
実験では、記憶されたパラメトリック世界知識から得られるパフォーマンス向上モデルとして定義された、永続的な知識の優位性ギャップが明らかになる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:47:23 GMT)
Acoustic Neural 3D Reconstruction Under Pose Drift [28.6] ドリフトセンサを用いた音響画像を用いた3次元再構成のためのニューラル暗示面最適化の問題点を考察する。
我々のアルゴリズムは、6DoFのポーズを学習可能なパラメータとしてパラメータ化し、ニューラルネットワークと暗黙の表現を通して勾配をバックプロパゲートすることで実現している。
かなりのドリフト下でも高忠実度3D再構成が可能である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:30:20 GMT)
Non-Markovian Discrete Diffusion with Causal Language Models [28.4] CaDDi (Causal Discrete Diffusion Model) は、生成軌道全体について条件を定める離散拡散モデルである。
単一の非マルコフ変換器における逐次的(因果的)および時間的(拡散的)推論を統一することにより、CaDDiは標準因果言語モデルも特別なケースとして扱う。
実証的には、CaDDiは自然言語ベンチマークで最先端の離散拡散ベースラインより優れている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:36:28 GMT)
Offline Learning and Forgetting for Reasoning with Large Language Models [28.3] 本稿では,未完成かつ失敗に終わった推論経路を微調整することで,検索機能をモデルに直接統合する効果的な手法を提案する。
挑戦的なGame-of-24およびCountdown算術パズルの実験は、CoT生成データをオフラインの微調整のために検索生成データに置き換えることで、推論時検索ベースラインよりも約23%の成功率を向上させることを示した。
私たちの学習と忘れは、教師付き微調整と嗜好に基づく方法の両方で一貫して優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:36:51 GMT)
Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion [27.7] 教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。
我々は、教師なし単眼深度推定のために、生成ネットワーク間でよく収束する拡散モデルを用いる。
このモデルは深度分布の学習と解釈の能力を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:46:13 GMT)
Through the Lens: Benchmarking Deepfake Detectors Against Moiré-Induced Distortions [27.4] 本研究は,モイアの映像における最先端のディープフェイク検出器を系統的に評価する。
以上の結果から,モイアの人工物は25.4%の劣化率を示し,合成されたモイアのパターンは21.4%の精度低下を招いた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:25:00 GMT)
From Linear to Nonlinear: Provable Weak-to-Strong Generalization through Feature Learning [27.4] 線形CNN(弱)から2層ReLU CNN(強)への弱強一般化の形式解析を提供する。
分析では、データセットの信号対雑音特性に基づいて、データスカースとデータバウンダントという2つのレシエーションを特定した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:53:24 GMT)
Blindfolded Experts Generalize Better: Insights from Robotic Manipulation and Videogames [27.3] 目隠しされた専門家のクローン化は、完全にインフォームドされた専門家よりも、目に見えないタスクに一般化されていることを示す。
実世界のロボットペグ挿入作業において,人間によるデモンストレーションを限定的に行う実験を行った。
理論と実践の両方は、目隠しされた専門家は、より少ない実演タスクでより良く一般化することを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:57:27 GMT)
Endowing GPT-4 with a Humanoid Body: Building the Bridge Between Off-the-Shelf VLMs and the Physical World [27.3] BiBoは基本的なインタラクションだけでなく、多様な複雑な動きも扱える。
オープン環境でのインタラクションタスクの成功率は90.2%であり、従来の手法よりも16.3%精度が向上している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:20:34 GMT)
LLM-as-a-Judge for Software Engineering: Literature Review, Vision, and the Road Ahead [27.1] 本稿では,ソフトウェアアーティファクト評価のためのLCM-as-a-Judgeの推進に向けて,コミュニティを支援することを目的とする。
我々はこれらのフレームワークを,2030年までに一貫性のある多面的アーティファクト評価が可能な信頼性,堅牢,スケーラブルなヒューマンサロゲートとして想定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:44:54 GMT)
Listening without Looking: Modality Bias in Audio-Visual Captioning [26.2] 我々は,現在最先端の音声映像キャプションモデルであるLAVCapのモダリティテストを実施している。
この分析は、LAVCapのオーディオストリームに対する顕著なバイアスを明らかにする。
オーディオとビジュアルストリームを共同で記述するテキストアノテーションでAudioCapsを拡張する。
その結果、AudioVisualCapsでトレーニングされたLAVCapは、AudioCapsでトレーニングされた場合よりもモダリティバイアスが少ないことが示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:06:28 GMT)
Equivariance Everywhere All At Once: A Recipe for Graph Foundation Models [25.9] ノードレベルのタスクのためのグラフ基盤モデルを第一原理から設計するためのレシピを提案する。
本研究の基盤となる重要な要素は,グラフ基盤モデルが尊重すべき対称性を体系的に調査することである。
我々は29の実世界のノード分類データセットに関する広範な実験を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:48:13 GMT)
UniPlanner: A Unified Motion Planning Framework for Autonomous Vehicle Decision-Making Systems via Multi-Dataset Integration [25.9] 自動運転車の意思決定におけるマルチデータセット統合のための最初の計画フレームワークであるUniPlannerを提案する。
UniPlannerは3つのシナジスティックな革新を通じて、データセット間の統合学習を実現する。
まず、ヒストリー・フューチャー・トラジェクトリ辞書ネットワーク(HFTDN)は、複数のデータセットからヒストリー・フューチャー・トラジェクトリのペアを集約し、ヒストリー・トラジェクトリの類似性を利用して、関連する未来を検索し、クロスデータセット・プランニング・ガイダンスを生成する。
第2に、GFTM(Gradient-Free Trajectory Mapper)は、複数のデータセットから堅牢なヒストリ-フューチャー相関を学習し、過去のトラジェクトリを普遍的な計画先へと変換する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:12:15 GMT)
Identifiable learning of dissipative dynamics [25.4] I-OnsagerNetは、散逸ダイナミクスを直接トラジェクトリから学習するニューラルネットワークフレームワークである。
I-OnsagerNetはOnsagerの原理を拡張して、学習されたポテンシャルが定常密度から得られることを保証している。
このアプローチはエントロピーの生成を計算し、不可逆性を定量化し、平衡から逸脱を検出し定量化する原則的な方法を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:57:14 GMT)
The Kinetics of Reasoning: How Chain-of-Thought Shapes Learning in Transformers? [25.3] チェーン・オブ・シント(CoT)の監督はトランスフォーマーの性能を大幅に向上させることができる。
シンボリック推論タスクにおけるトランスフォーマーの事前学習により、これらの学習ダイナミクスをグラクキングのレンズを通して検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:14:26 GMT)
UniCrossFi: A Unified Framework For Cross-Domain Wi-Fi-based Gesture Recognition [25.0] Wi-Fiセンシングシステムは、目に見えない現実世界の環境に配備された場合、クロスドメインの問題によって深刻な障害を受ける。
我々は,CSIに基づく多様なデプロイメント設定におけるパフォーマンス低下を緩和する統合フレームワークUniCrossFiを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:10:33 GMT)
Learning Parameterized Skills from Demonstrations [24.8] DEPSは、専門家によるデモンストレーションからパラメータ化されたスキルを発見するためのエンドツーエンドのアルゴリズムである。
本手法は,各段階において適切な個別スキルと連続パラメータを選択するメタ政治と協調してパラメータ化スキルポリシーを学習する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:08:25 GMT)
A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization [24.7] 両レベル最適化問題において,低レベル問題は強い凸性を持ち,線形制約が結合している場合について検討する。
線形制約付き二レベル最適化(SFLCB)のための単一ループ1次アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:58:17 GMT)
Multimodal 3D Genome Pre-training [24.7] MIX-HICは3次元ゲノム構造とエピジェノミック・トラックを融合した3次元ゲノムの最初のマルチモーダル基盤モデルである。
正確なヘテロジニアスなセマンティックフュージョンを実現するため、ロバストな統一表現のためのクロスモーダル相互作用とマッピングブロックを設計する。
高品質な事前学習のためのHi-Cコンタクトマップとエピゲノミクストラックの100万以上のサンプルからなる,最初の大規模データセットを紹介した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:01:44 GMT)
A Unified Geometric Space Bridging AI Models and the Human Brain [24.5] 現代の人工ニューラルネットワークは、言語、知覚、推論において人間と競合している。
これらの人工システムが脳のように情報を整理するかどうかは、いまだに不明である。
ここでは、Brain-like Spaceという画期的な概念を紹介します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:09:23 GMT)
Diffusion LLM with Native Variable Generation Lengths: Let [EOS] Lead the Way [23.9] 拡散に基づく大規模言語モデル (dLLMs) は、並列テキスト生成にかなりの可能性を秘めている。
現在のdLLMは、デコード前にdLLMの生成長を決定する必要があることを示す固定生成長に悩まされている。
本稿では,dLLM-Var と略して,固有変数生成長を持つ拡散 LLM の学習を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:32:43 GMT)
Taming the Real-world Complexities in CPT E/M Coding with Large Language Models [23.7] E/Mコーディングは、医師のドキュメントの負担を増大させる補助的なタスクである。
多くの現実世界の複雑さが、E/Mエンコーディングの自動化を困難な課題にしている。
本稿では,それに対応するLLMベースのフレームワークであるProFeesを紹介し,続いて体系的な評価を行う。
専門家によって算出された実世界のデータセットでは、商用のCPT E/Mコーディングシステムにおいて、ProFeesはコーディング精度を36%以上向上させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:06:59 GMT)
RiddleBench: A New Generative Reasoning Benchmark for LLMs [23.6] 大規模言語モデルは、多くの確立された推論ベンチマークで強いパフォーマンスを示している。
RiddleBenchは、これらのコア推論能力を調査するために設計された英語の難解パズル1,737のベンチマークである。
RiddleBenchにおける最先端モデルの評価は、根本的な弱点を示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:58:24 GMT)
Unlearning Comparator: A Visual Analytics System for Comparative Evaluation of Machine Unlearning Methods [23.6] Machine Unlearning(MU)は、トレーニングされたモデルからターゲットトレーニングデータを削除して、削除されたデータがモデルの振る舞いにもはや影響を与えないようにすることを目的としている。
しかし、この急速に発展する分野の研究者たちは、異なるMUメソッドの振る舞いを分析し、理解する上で困難に直面している。
MU手法の体系的評価を容易にするために,視覚解析システムUnlearning Comparatorを導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:47:58 GMT)
Zero-Shot Cross-Lingual Transfer using Prefix-Based Adaptation [23.6] 本稿では,英語から35以上のハイ・ロー・リソース言語へのゼロショット・クロスランガル翻訳のためのプレフィックスに基づく3つの手法について包括的に研究する。
Llama 3.1 8Bでは、プレフィックスメソッドはベレベレベンチマークで最大6%LRAベースラインを上回った。
Mistral v0.3 7Bでも同様の改良が見られた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:48:03 GMT)
Aggregation Hides Out-of-Distribution Generalization Failures from Spurious Correlations [23.4] 我々は,IDを改善しながらOOD性能を低下させる相関関係は,実際には稀であることがわかった。
単純な勾配法を用いて,直線上の精度が保たない意味的コヒーレントなOOD部分集合を同定する。
以上の結果から,OODロバストネスの重要な障害モードが明らかになる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:35:57 GMT)
Causal Spatio-Temporal Prediction: An Effective and Efficient Multi-Modal Approach [23.3] E2-STPはマルチモーダルデータを統合するための効率的なフレームワークである。
E2-STPは9つの最先端技術よりも優れ、9.66%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:57:56 GMT)
Squrve: A Unified and Modular Framework for Complex Real-World Text-to-SQL Tasks [23.2] Squrveは、研究の進歩と現実世界のアプリケーションを統合するために設計されたフレームワークである。
Squrveはまず、呼び出しインタフェースを標準化する普遍的な実行パラダイムを確立し、次にマルチアクタ協調機構を提案する。
広く採用されているベンチマークの実験では、協調的な手法が元の個々の手法より一貫して優れていることが示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:16:38 GMT)
The Cost of Robustness: Tighter Bounds on Parameter Complexity for Robust Memorization in ReLU Nets [23.0] 本稿では,$mathrmReLU$ネットワークに対するロバスト記憶のパラメータ複雑性について検討する。
パラメータカウントの上と下の境界は、ロバストネス比 $rho = mu / epsilon$ の関数として成立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:09:43 GMT)
Beyond Neural Incompatibility: Easing Cross-Scale Knowledge Transfer in Large Language Models through Latent Semantic Alignment [22.8] 大規模言語モデル(LLM)は、膨大なパラメータの膨大な知識をエンコードする。
神経の解釈可能性の進歩にもかかわらず、どのようにして細かな方法で知識を伝達するか、すなわちパラメトリックな知識伝達(PKT)は明らかになっていない。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:25:40 GMT)
MINED: Probing and Updating with Multimodal Time-Sensitive Knowledge for Large Multimodal Models [22.5] 大規模マルチモーダルモデルは、クロスモーダル事前学習を通じて豊富な事実知識を符号化する。
MINEDは6つの重要な次元と11の課題に沿った時間的認識を評価するベンチマークである。
Gemini-2.5-Pro は平均 CEM スコア 63.07 を達成しているが、ほとんどのオープンソース LMM には時間理解能力がない。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:06:40 GMT)
MQM Re-Annotation: A Technique for Collaborative Evaluation of Machine Translation [22.4] 現在最先端翻訳評価パラダイム(MQM)の2段階版を実験した。
このセットアップでは、MQMアノテータが既存のMQMアノテーションのセットをレビューし、編集します。
我々は、再アノテーションにおけるレーダの振る舞いが私たちの目標と一致し、再アノテーションが高品質なアノテーションをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:29:59 GMT)
SignMouth: Leveraging Mouthing Cues for Sign Language Translation by Multimodal Contrastive Fusion [22.3] 手話翻訳は、手話ビデオから自然言語を翻訳することを目的としている。
たいていのアプローチは手動の信号(手動ジェスチャー)に重点を置いており、口打ちのような手動ではない手がかりを見渡す傾向がある。
我々は手話翻訳の精度を向上させるための新しいフレームワークSignClipを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:32:18 GMT)
Sequences of Logits Reveal the Low Rank Structure of Language Models [22.1] 本稿では,言語モデルの低次元構造をモデルに依存しないレベルで研究する手法を提案する。
われわれはまず,多種多様な現代言語モデルが低ランク構造を示すことを実証的に実証した。
そして、この低ランク構造を生成に活用できることが示される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:55:58 GMT)
MapComp: A Secure View-based Collaborative Analytics Framework for Join-Group-Aggregation [22.1] JGA(Join-group-aggregation)クエリはデータ分析の基本だが、共同で実行すると重大なプライバシーリスクが生じる。
本稿では、セキュアな協調分析のためのJGAクエリを容易にするビューベースの新しいフレームワークであるMapCompを紹介する。
我々の研究は、マテリアライズドビューを使ったセキュアな協調JGAクエリを高速化する最初の取り組みである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:05:13 GMT)
OneCast: Structured Decomposition and Modular Generation for Cross-Domain Time Series Forecasting [21.9] ドメイン間時系列の予測は、様々なWebアプリケーションにおいて貴重なタスクである。
OneCastは構造化されモジュール化された予測フレームワークで、時系列を季節およびトレンドコンポーネントに分解する。
8つのドメインでの実験では、OneCastは最先端のベースラインよりも優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:23:53 GMT)
Uni-LoRA: One Vector is All You Need [21.9] Low-Rank Adaptation (LoRA) は、大規模言語モデルのための事実上のパラメータ効率の微調整(PEFT)手法となっている。
Tied-LoRA、VeRA、VB-LoRAといった最近の研究は、トレーニング可能なパラメータ空間を減らすために追加の制約を導入することで、さらなる効率を推し進めている。
パラメータ空間削減戦略は, 統一フレームワークUni-LoRA内で定式化可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:20:47 GMT)
Uncovering Gaps Between RFC Updates and TCP/IP Implementations: LLM-Facilitated Differential Checks on Intermediate Representations [21.9] プロトコルスタックコードの実装とRFC標準の間にはしばしば矛盾があります。
この矛盾はプロトコル機能の違いを引き起こすだけでなく、深刻なセキュリティ上の脆弱性を引き起こす可能性がある。
大規模言語モデルの台頭により、RFC文書からプロトコル仕様を抽出する方法が研究され始めている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:19:46 GMT)
META-RAG: Meta-Analysis-Inspired Evidence-Re-Ranking Method for Retrieval-Augmented Generation in Evidence-Based Medicine [21.8] エビデンスベースの医療(EBM)は臨床応用において重要な役割を担っている。
EBMにおけるRAGの応用は、高品質な証拠を効果的に識別するのに苦労する。
医学的証拠を再収集しフィルタリングする新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:18:09 GMT)
M-Eval: A Heterogeneity-Based Framework for Multi-evidence Validation in Medical RAG Systems [21.8] Retrieval-augmented Generation (RAG) は、医学的質問応答システムを強化する可能性を示している。
この研究は、現在のRAGベースの医療システムにおけるエラーを検出するのに役立つ。
また、LSMの応用をより信頼性が高くし、診断エラーを低減する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:57:40 GMT)
Two-Stage Learning of Stabilizing Neural Controllers via Zubov Sampling and Iterative Domain Expansion [21.7] 連続時間システムのための制御器とリアプノフ関数を協調的に合成する新しい2段階学習フレームワークを提案する。
SMTソルバに頼ってリアプノフ条件を正式に検証する既存のシステムとは異なり、最先端のニューラルネットワーク検証器$alpha,!
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:42:04 GMT)
VADTree: Explainable Training-Free Video Anomaly Detection via Hierarchical Granularity-Aware Tree [21.7] ビデオ異常検出(VAD)は、ビデオ内の異常を特定することに焦点を当てている。
本稿では,階層的粒度木構造を利用したVADTreeを提案する。
VADTreeは、サンプルビデオセグメントの数を劇的に減らしながら、トレーニング不要な環境で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:57:22 GMT)
GRS: Generating Robotic Simulation Tasks from Real-World Images [21.6] GRSは単一のRGB-D観測からデジタルツインシミュレーションを作成し、仮想エージェントトレーニングのための解決可能なタスクを行う。
生成したテストスイートを通じてシミュレーションタスクのアライメントを確保し、シミュレーションとテストコードの両方を反復的に洗練するルータを導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:05:53 GMT)
Geo-Sign: Hyperbolic Contrastive Regularisation for Geometrically Aware Sign Language Translation [21.6] ジオサイン(Geo-Sign)は、双曲幾何学の特性を利用して手話キネマティクスに固有の階層構造をモデル化する手法である。
本稿では,双曲射影層,重み付きFr'echet平均アグリゲーションスキーム,および双曲空間で直接動作する幾何学的コントラスト損失を導入する。
これらのコンポーネントは正規化関数としてエンドツーエンドの翻訳フレームワークに統合され、言語モデル内の表現を強化する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:56:55 GMT)
SCOUT: A Lightweight Framework for Scenario Coverage Assessment in Autonomous Driving [21.6] SCOUTはエージェントの潜在センサー表現から直接シナリオカバレッジラベルを予測するために設計されたサロゲートモデルである。
SCOUTは冗長な計算を避け、高速でスケーラブルなシナリオカバレッジ推定を可能にする。
その結果,SCOUTは大規模カバレッジ分析に有効な代替手段であることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:31:19 GMT)
Radar and Event Camera Fusion for Agile Robot Ego-Motion Estimation [20.5] ロボットの移動速度を積極的に推定するためのIMUフリー・機能連想フリーフレームワークを提案する。
瞬時生イベントとドップラー計測を用いて、回転速度と翻訳速度を直接導出する。
本研究では,時間と事象を併用した連続時間状態空間モデルを提案し,よりスムーズな方法でエゴ運動速度を推定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:59:34 GMT)
Learning from History: A Retrieval-Augmented Framework for Spatiotemporal Prediction [20.3] 我々は,新しいtextbfRetrieval-Augmented Prediction (RAP) フレームワークを提案する。
RAPは、システムの局所力学の非パラメトリック推定として、歴史的進化の分岐を利用する。
RAPは、長期ロールアウトにおけるエラーを効果的に抑制することで、より物理的に現実的な予測を生成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:09:16 GMT)
Finding Culture-Sensitive Neurons in Vision-Language Models [20.1] 視覚言語モデル(VLM)における培養感受性ニューロンの存在について検討する。
我々は,培養選択性のニューロンを同定し,異なる同定法でフラグ付けされたニューロンを不活性化することにより因果検査を行う。
われわれはマルチモーダル表現の内部構造に新たな光を当てた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:14:37 GMT)
TableTime: Reformulating Time Series Classification as Training-Free Table Understanding with Large Language Models [20.1] 大規模言語モデル (LLM) は多変量時系列分類において有効であることを示した。
LLM は LLM の潜在空間内の時系列の埋め込みを直接コードし、LLM の意味空間と一致させる。
MTSCを表理解タスクとして再編成するテーブルタイムを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:23:53 GMT)
Geometric Mixture Models for Electrolyte Conductivity Prediction [20.1] 電解質系におけるイオン伝導率の正確な予測は、多くの科学的および技術的応用を促進するために重要である。
分子の幾何グラフ表現を組み込んで,まずCALiSolとDiffMix電解質のデータセットを再編成し,拡張する。
次に、混合系に必須だが挑戦的な性質を持つSet-SE(3)を保存した新しい幾何認識フレームワークGeoMixを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:19:23 GMT)
MetricX-25 and GemSpanEval: Google Translate Submissions to the WMT25 Evaluation Shared Task [20.0] We present our submits to the unified WMT25 Translation Evaluation Shared Task。
The Quality Score Prediction subtask, we create a new generation of MetricX with improve in the input format and the training protocol。
Error Span Detection subtaskでは,その重大さやカテゴリとともにエラー幅を予測するために,GemSpanEvalという新しいモデルを開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:56:20 GMT)
Eigenfunction Extraction for Ordered Representation Learning [20.0] 本稿では,鍵デシラタを満たすために設計されたモジュラービルディングブロックに基づいて,順序付き固有関数と同定可能な固有関数を抽出する一般的なフレームワークを提案する。
合成カーネルに対する我々のアプローチを検証するとともに,得られた固有値が特徴選択に有効な重要なスコアとして機能することを実世界の画像データセットで実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:37:12 GMT)
Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT [19.8] DoRA法は重み更新を大きさと方向に分解することで性能を向上させる。
本研究では,重み更新行列の特異値エントロピーを増大させる能力からDoRAの成功が導かれることを確かめる。
我々は、DoRAを数学的に等価で効率的な行列形式に再構成し、学習可能な重み条件付け法として明らかにした。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:52:54 GMT)
See the Speaker: Crafting High-Resolution Talking Faces from Speech with Prior Guidance and Region Refinement [19.7] 本研究は,音声から情報を直接抽出する新しいアプローチを提案する。
特に、これは1つの音声入力からのみ高解像度で高品質な音声ビデオを生成することができる最初の方法である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:46:19 GMT)
A High-Dimensional Statistical Method for Optimizing Transfer Quantities in Multi-Source Transfer Learning [19.6] 対象モデルを共同でトレーニングするために、各ソースタスクから必要なソースサンプルの最適な量は何か?
具体的には、K-Lの発散に基づく一般化誤差尺度を導入し、高次元統計解析に基づいて最小化し、各ソースタスクの最適転送量を決定する。
アーキテクチャに依存しないデータ効率のアルゴリズムOTQMSを開発し、マルチソーストランスファー学習におけるターゲットモデルトレーニングのための理論的結果を実装した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:15:39 GMT)
Greedy Sampling Is Provably Efficient for RLHF [19.6] この研究は、一般的な嗜好モデルを検討し、既存のモデルよりも大きく、順序的に改善された性能保証を得る。
驚くべきことに、これらの結果は経験的推定を直接利用するアルゴリズムから導かれる。
この知見は、KL正規化対象の下での最適政策クラスのユニークな構造特性に深く根付いており、さらにBTモデルに特化している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:52:08 GMT)
Traceable Signatures from Lattices [19.3] トレース可能なシグネチャは、グループシグネチャにおけるオープニング権限のトレース能力を拡張する匿名デジタルシグネチャシステムである。
本研究は、トレーサブルシグネチャの概念を再考し、量子ランダムオラクルモデル(QROM)において、格子ベースの構成を確実に確保する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:15:00 GMT)
PaTaRM: Bridging Pairwise and Pointwise Signals via Preference-Aware Task-Adaptive Reward Modeling [19.3] Preference-Aware Task-Aware Reward Model (PaTaRM) は、Rest-Aware rewardメカニズムと動的ルーリック適応を統合した統合フレームワークである。
PaTaRMは、IFEvalとInFoBenchベンチマークで平均13.6%改善され、下流RLHFのパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:43:47 GMT)
The Importance of Being Discrete: Measuring the Impact of Discretization in End-to-End Differentially Private Synthetic Data [19.3] そこで本研究では,差分プライベート(DP)生成限界モデルの文脈における4つの離散化戦略の測定を行った。
離散化器とビン数の選択を最適化することで,DPの限界モデル6モデルに対して,有効性を平均30%向上できることがわかった。
本研究では,非プライベートな離散化を伴うDP生成モデルが,メンバシップ推論攻撃に対して脆弱でありながら,離散化時にDPを適用することで,このリスクを効果的に軽減できることを実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:21:34 GMT)
Long-Term Mapping of the Douro River Plume with Multi-Agent Reinforcement Learning [19.1] 本研究では,複数の自律型水中車両(AUV)を用いた河川プルームの長期(複数日)マッピングの問題に焦点をあてる。
本稿では,中央コーディネータが断続的にAUVと通信する,エネルギー・通信・効率的なマルチエージェント強化学習手法を提案する。
Delft3D モデルを用いたシミュレーションにより,本手法はシングルエージェントとマルチエージェントのベンチマークで一貫した性能を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:48:21 GMT)
PICOs-RAG: PICO-supported Query Rewriting for Retrieval-Augmented Generation in Evidence-Based Medicine [18.9] ユーザクエリをもっとよいフォーマットに拡張するためのPICO-RAGを提示する。
提案手法は,クエリをプロのクエリに拡張し,正規化することができる。
これにより、PICO-RAGは、大規模言語モデルの性能を改善し、有用で信頼性の高い医療アシスタントとなる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:01:05 GMT)
Scheduling Your LLM Reinforcement Learning with Reasoning Trees [18.7] 本稿では、推論木の構造に基づいて、クエリの学習困難度を測定するReasoning Score(r-score)を紹介する。
rスコアに基づくスケジューリングアルゴリズムであるReasoning Tree Schedule (Re-Schedule)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:52:07 GMT)
Bridging Tool Dependencies and Domain Knowledge: A Graph-Based Framework for In-Context Planning [18.4] 本稿では,ツールやドキュメント間の依存関係を活用して,先進的なアーティファクト生成を促進するフレームワークを提案する。
我々の手法は、記述、引数、出力ペイロードを含むツールスキーマからツール知識グラフを構築することから始まります。
並行して、内部文書とSOPから補完的な知識グラフを導き、ツールグラフと融合する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:50:15 GMT)
Bridging the gap to real-world language-grounded visual concept learning [18.4] 本稿では,画像関連概念の軸を適応的に識別し,現実のシーンにおけるこれらの軸に沿った視覚概念を基盤とするスケーラブルなフレームワークを提案する。
我々は、ImageNet、CelebA-HQ、AFHQのサブセットに対するフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:32:23 GMT)
UMCFuse: A Unified Multiple Complex Scenes Infrared and Visible Image Fusion Framework [18.3] UMCFuseと呼ばれる複雑なシーンにおける赤外線と可視画像の融合のための統合フレームワークを提案する。
我々は、可視画像のピクセルを光透過の散乱度から分類し、全体的な強度から細部を分離する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:51:19 GMT)
Trade-offs in Data Memorization via Strong Data Processing Inequalities [18.3] 最近の研究では、大規模な言語モデルのトレーニングには、かなりの量のトレーニングデータの記憶が伴うことが示されている。
このような暗記は、センシティブなユーザデータをトレーニングする際のプライバシー侵害につながる可能性があるため、学習におけるデータ暗記の役割を研究する動機となる。
本稿では, 強データ処理の不等式とデータ記憶との新たな接続に依存する, 過剰なデータ記憶の下位境界を証明するための一般的な手法を開発する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:53:56 GMT)
SynAD: Enhancing Real-World End-to-End Autonomous Driving Models through Synthetic Data Integration [18.1] 合成データを用いた実世界のE2E ADモデルの拡張を目的とした,最初のフレームワークであるSynADを紹介する。
本手法は,マルチエージェント合成シナリオにおいて,エージェントをエゴ車として最も包括的な運転情報で指定する。
我々は、これらのマップベースの合成データを実運転データと効果的に統合する訓練戦略を考案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:22:02 GMT)
LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.9] Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:51:04 GMT)
The Formalism-Implementation Gap in Reinforcement Learning Research [17.9] 本稿では、強化学習研究は、エージェント能力の実証にのみ焦点を絞ることをやめるべきである、と論じる。
ベンチマークが基礎となる数学的形式にどのようにマッピングされるか、より正確にする必要がある、と氏は主張する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:06:41 GMT)
MISA: Memory-Efficient LLMs Optimization with Module-wise Importance Sampling [17.8] MISA(Module-wise SAmpling)は、各レイヤを小さなモジュールに分割する新しい手法である。
MISAは,既存のベースライン方式よりもメモリ節約に有効であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:06:27 GMT)
CalFuse: Multi-Modal Continual Learning via Feature Calibration and Parameter Fusion [17.7] クラス・コンチネンタル・ラーニング(CCL)は、歴史データを再考することなく、新たなクラス知識を段階的に取り入れることで、この課題に対処する。
CLIPのようなビジョンランゲージモデル(VLM)の最近の進歩は、事前訓練されたマルチモーダル知識を活用することで、CCLにとって重要な可能性を示している。
本稿では,マルチモーダルな知識統合を実現するために,特徴パラメータFusionを相乗化するフレームワークであるCalFuseを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:22:48 GMT)
A Luminance-Aware Multi-Scale Network for Polarization Image Fusion with a Multi-Scene Dataset [17.5] 偏光画像融合は、カモフラージュ認識、組織病理解析、表面欠陥検出などの分野で重要な応用がある。
複雑な輝度環境下での異なる偏光画像からのcoL-Splementary情報交換のために,輝度対応マルチスケールネットワーク(MLSN)を提案する。
エンコーダの段階では、輝度ブランチによるマルチスケール空間重み行列を提案する。
デコーダの段階では、複雑な照明への適応性をさらに向上するため、Brightness-Enhancementモジュールを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:57:42 GMT)
Long-Context Modeling with Dynamic Hierarchical Sparse Attention for On-Device LLMs [17.5] データ駆動型フレームワークであるDynamic Hierarchical Sparse Attention (DHSA)を導入する。
DHSAは高い注意力と精度を一致させ、プリフィル遅延を20-60%削減し、ピークメモリ使用量を35%削減した。
Needle-in-a-Haystack Test と LongBench を用いたGemma2 実験では,DHSA の精度は高いが,プリフィル遅延は20~60%,ピークメモリ使用量は35%削減された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:34:18 GMT)
Advancing Compositional Awareness in CLIP with Efficient Fine-Tuning [17.5] CLIC(Compositionally-Aware Learning in CLIP)は,複数の画像と関連するキャプションを組み合わせた新しいトレーニング手法である。
Clicは、構文理解と意味理解の両面で、アーキテクチャ間の構成性だけでなく、トレーニング済みのCLIPモデルも改善する。
それでも、CLICによる短い微調整は、検索の改善とSugarCrepe++の最高のコンポジションCLIPモデルにつながる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:08:40 GMT)
Developer Productivity with GenAI [17.4] 我々は415人のソフトウェア実践者がAI支援開発に伴う生産性の変化に対する認識を把握できるように調査した。
結果として、生産性の変化が制限され、生産性のパラドックスが強調され、開発者がより速くなっていくが、必ずしもより良いソフトウェアを作成したり、より満足できると感じたりはしない。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:23:57 GMT)
Mirror Descent and Novel Exponentiated Gradient Algorithms Using Trace-Form Entropies and Deformed Logarithms [17.4] 本稿では,ミラー輝き(MD)と一般化指数勾配(GEG)アルゴリズムについて紹介する。
これらの一般化エントロピーを活用することで、MD & GEGアルゴリズムは収束挙動の改善、消滅と爆発勾配への堅牢性、非ユークリッド幾何学への固有の適応性をもたらす。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:01:16 GMT)
SANSKRITI: A Comprehensive Benchmark for Evaluating Language Models' Knowledge of Indian Culture [17.4] インドにおける豊かな文化的多様性に関する言語モデルの理解を評価するためのベンチマークであるSANSKRITIを紹介する。
SNSKRITIは、28の州と8の連邦領域にまたがる、精巧にキュレートされた質問応答ペア21,853からなり、インドの文化知識をテストするための最大のデータセットである。
儀式、儀式、歴史、観光、料理、ダンス、音楽、衣装、言語、芸術、祭典、宗教、医学、輸送、スポーツ、ナイトライフ、個性など、インド文化の重要な特徴を網羅している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:12:22 GMT)
Cyst-X: A Federated AI System Outperforms Clinical Guidelines to Detect Pancreatic Cancer Precursors and Reduce Unnecessary Surgery [17.4] Cyst-Xは、764人の患者の1,461のMRIスキャンのユニークなマルチセンターデータセットに基づいてトレーニングされたIPMNリスク予測のためのAIフレームワークである。
Cystic-Xは、確立された京都のガイドラインと専門家の放射線技師よりはるかに高い精度(AUC = 0.82)を達成する。
Cystic-Xは膵嚢胞分析のための最初の大規模なマルチセンターMRIリソースを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:48:51 GMT)
3D-Prover: Diversity Driven Theorem Proving With Determinantal Point Processes [17.4] 自動形式推論における重要な課題は、証明の深さとともに指数関数的に成長する、難解な探索空間である。
セマンティックな多様性と高品質な戦術を活用する新しいフィルタリング機構を提案する。
提案手法は, 総合的な証明率の向上と, 戦術的成功率, 実行時間, 多様性の大幅な向上につながることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:10:02 GMT)
SALS: Sparse Attention in Latent Space for KV cache Compression [17.3] 本稿では,鍵ベクトルへのRoPEの適用により,それらの分散が増大し,結果として高い階数が得られること,鍵ベクトルが潜在空間に変換された後に,ほとんどの層にわたって表現が維持されること,という2つの重要な知見を紹介する。
これらの知見に基づき、我々はラテントスペースフレームワークにおけるスパースアテンション(Sparse Attention in Latent Space)を提案する。SALSはKVキャッシュをローランクプロジェクションを介してコンパクトなラテント空間に投影し、この空間でRoPEフリークエリキーインタラクションを用いてスパーストークン選択を行う。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:32:52 GMT)
Do Large Language Models Grasp The Grammar? Evidence from Grammar-Book-Guided Probing in Luxembourgish [17.2] 文法(Grammar)とは、言語単位の構造的構造と意味的関係を管理する規則の体系を指す。
自然言語処理では、文法に焦点を絞った評価プロトコルが不足している。
本稿では,文法評価のための体系的で一般化可能なフレームワークを提供するための文法ブックガイド評価パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:02:51 GMT)
Group-in-Group Policy Optimization for LLM Agent Training [17.2] Group-in-Group Policy Optimization (GiGPO) は、LLMエージェントのきめ細かいクレジット割り当てを実現する新しいRLアルゴリズムである。
我々は, ALFWorld や WebShop などのエージェントベンチマークに対する GiGPO の評価と,検索強化されたQA タスクに対するツール統合推論を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:11:36 GMT)
Causal-Aware Generative Adversarial Networks with Reinforcement Learning [17.2] 実世界のデータセットに対するこれらの課題に対処するために特別に設計された新しい生成フレームワークであるCA-GANを紹介する。
提案手法は,高品質でプライバシに適合した合成データセットを作成しようとするデータエンジニアに対して,実用的な高性能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:02:49 GMT)
Jailbreak Transferability Emerges from Shared Representations [17.2] ジェイルブレイクの伝達性は、あるモデルに対する敵の攻撃が他のモデルから有害な反応を誘発する驚くべき現象である。
移譲性は、偶発的欠陥ではなく、共有表現から生じる証拠を示す。
そこで本研究では,異なるタイプのジェイルブレイクにまたがる系統的伝達可能性パターンを明らかにした。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:06:01 GMT)
When are radiology reports useful for training medical image classifiers? [17.2] プレトレーニングと微調整の両方で放射線学のレポートをどのように利用できるのかを体系的に研究する。
その結果,明示的な画像テキストアライメントによる事前学習は,そうでない環境では有害であることがわかった。
これらの結果は、医学画像分類器の訓練に特権付きテキストデータをいつ、どのように活用するかについての実用的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:01:42 GMT)
Semi-Supervised Preference Optimization with Limited Feedback [17.1] 本稿では,少数のペアワイズ選好ラベルと多数の未ペアサンプルから同時に学習することを目的とした,SSPO(Semi-Supervised Preference Optimization)の問題について検討する。
我々の重要な理論的貢献は、高い確率で勝利と負けの反応を分離できる最適報酬閾値の存在を証明している。
これらの擬似ラベルを利用することで、SSPOは大規模未ペアデータから潜伏した嗜好を効果的に蒸留し、取得コストを大幅に削減しつつ、人間のアライメントを維持する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:33:43 GMT)
Eigen-Value: Efficient Domain-Robust Data Valuation via Eigenvalue-Based Approach [16.9] 我々は,OODロバストネスのためのプラグアンドプレイデータアセスメントフレームワークであるEmphEigen-Value (EV)を紹介した。
EVは、IDとOODの間の損失のギャップであるドメインの差を新しいスペクトルで近似する。
EVは、計算的に軽量なまま、現実世界のデータセット間でのOOD堅牢性と安定した価値ランキングの改善を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:35:45 GMT)
GACA-DiT: Diffusion-based Dance-to-Music Generation with Genre-Adaptive Rhythm and Context-Aware Alignment [16.9] ダンス・トゥ・ミュージック・ジェネレーション(D2M)は、リズムと時間的にダンスの動きに合わせた音楽を自動的に合成することを目的としている。
リズム整合性と時間整合性を有する音楽生成のための2つの新しいモジュールを備えた拡散トランスフォーマーベースのフレームワークである textbfGACA-DiT を提案する。
AIST++とTikTokデータセットの実験では、GACA-DiTは客観的メトリクスと人的評価の両方で最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:26:59 GMT)
Minimax Optimal Transfer Learning for Kernel-based Nonparametric Regression [16.9] 本稿では,非パラメトリック回帰の文脈における伝達学習問題について考察する。
目的は、実用性と理論的保証の間のギャップを埋めることである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:32:53 GMT)
Fock space prethermalization and time-crystalline order on a quantum processor [16.9] 本研究では,Fock Space Prethermalization (FSP) と呼ばれる非障害性機構を,加熱抑制のために提案し,実証する。
FSPはフォック空間ネットワークを線形に多くのスパースサブネットワークに分割し、熱化時間スケールを延長する。
我々の研究は、FSPをエルゴード性を破壊する堅牢なメカニズムとして確立し、新しい非平衡量子物質を探索する方法を開拓する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:40:05 GMT)
MoPFormer: Motion-Primitive Transformer for Wearable-Sensor Activity Recognition [16.8] Motion-Primitive Transformer (MoPFormer)は、慣性計測ユニット信号を意味のある動作プリミティブにトークン化することで、解釈性を高める新しいフレームワークである。
MoPFormerは、欠落したプリミティブを再構築するマスクされたモーションモデリングの目的を使って事前トレーニングを行うことができる。
6つのHARベンチマークの実験では、MoPFormerは最先端のメソッドを上回るだけでなく、複数のデータセットをまたいだ一般化も成功している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:32:37 GMT)
Topic Analysis with Side Information: A Neural-Augmented LDA Approach [16.5] 本稿では,ニューラル先行機構を通じて側情報を組み込んだニューラル拡張確率的トピックモデルを提案する。
nnLDA は LDA と Dirichlet-Multinomial Regression を、トピックコヒーレンス、パープレキシティ、分布、下流分類において一貫して上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:38:36 GMT)
RWKV-edge: Deeply Compressed RWKV for Resource-Constrained Devices [16.1] モデルアーキテクチャの最適化から,RWKVアーキテクチャに合わせたポストトレーニング圧縮まで,一連の圧縮手法を提案する。
我々の手法は、RWKVモデルのメモリフットプリントを3.4倍 -- 5倍減らし、精度は無視できる程度に低下させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:45:25 GMT)
GRASP: Geospatial pixel Reasoning viA Structured Policy learning [16.0] GRASPは、マルチモーダルな大規模言語モデルと事前訓練されたセグメンテーションモデルを統合する、構造化されたポリシー学習フレームワークである。
PRIMEは、教師付き微調整を強化学習に置き換える訓練パラダイムであり、推論や接地行動とタスク目標との整合性を改善する。
GRASP-1kは、推論集約的なクエリ、推論トレース、きめ細かいマスクを備えた、完全にドメイン外ベンチマークである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:06:16 GMT)
FraudTransformer: Time-Aware GPT for Transaction Fraud Detection [16.0] 我々は、専用のタイムエンコーダでバニラGPTスタイルのアーキテクチャを拡張するシーケンスモデルであるFraudTransformerを紹介する。
大規模な産業データセット(数千万のトランザクションと補助イベント)の実験は、FraudTransformerが4つの強力な古典的ベースラインを超えたことを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:34:23 GMT)
Talk2Ref: A Dataset for Reference Prediction from Scientific Talks [16.0] 本稿では,対話からの参照予測(Reference Prediction from Talks,RPT)を紹介する。
Talk2Refは,6,279件の講演と43,429件の引用論文を含む,この種の最初の大規模データセットである。
以上の結果から,Talk2Refの微調整は引用予測性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:50:03 GMT)
MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations [16.0] サルカズム(英: Sarcasm)は、図形言語の複雑な形態であり、意図された意味が文字通りの意味と矛盾する。
ドイツの最初のマルチモーダルサルカズム検出データセットである MuSaG について述べる。
この番組は、ドイツのテレビ番組から33分間、手動で選抜され、人間による注釈が付けられている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:33:45 GMT)
Discovering Heuristics with Large Language Models (LLMs) for Mixed-Integer Programs: Single-Machine Scheduling [15.9] EDD Challenger (EDDC) と MDD Challenger (MDDC) という2つの新しい LLM-covered を開発した。
我々は,プリエンプションや処理時間,期限を指定せずにnジョブを単一プロセッサにシークエンシングすることで,トータルタドルネスを最小化することを目的とした,シングルマシントータルタドルネス(SMTT)問題に着目する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:43:04 GMT)
Retrieval and Argumentation Enhanced Multi-Agent LLMs for Judgmental Forecasting [15.8] 本稿では,クレーム検証のための新しいマルチエージェントフレームワークを提案する。
異なる代理人は、クレームの正確性に異を唱え、クレームに対する具体的な証拠を提出することができる。
エージェントのエビデンスを組み合わせることで,予測精度が向上することが観察された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:12:43 GMT)
Your Microphone Array Retains Your Identity: A Robust Voice Liveness Detection System for Smart Speakers [15.8] 本稿では,マイクロホンアレイを用いて収集した音声の同一性を決定する,新たなライブ機能であるアレー指紋を提案する。
32,780個のオーディオサンプルと14個のスプーフィングデバイスを含むデータセットに対する評価は、ARRAYIDが99.84%の精度を達成したことを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:05:30 GMT)
Low-N Protein Activity Optimization with FolDE [15.7] 本稿では,終末成功を最大化するALDE法であるFolDEを提案する。
20のタンパク質標的のシミュレーションにおいて、FolDEは最高のベースライン法よりも上位10%の変異体を23%多く発見している。
また、バッチの多様性を向上させる定数線形バッチセレクタも導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:24:39 GMT)
The Dialogue That Heals: A Comprehensive Evaluation of Doctor Agents' Inquiry Capability [15.6] 我々は,医療マルチターン質問の自動的・包括的評価のための,これまでで最大のベンチマークであるMAQuE(Medical Agent Questioning Evaluation)を提案する。
3000の患者エージェントがリアルにシミュレートされ、多様な言語パターン、認知的制限、感情的反応、受動的開示の傾向を示す。
また,タスク成功,質問能力,対話能力,質問効率,患者体験を網羅する多面的評価フレームワークも導入した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:02:58 GMT)
Efficient Cost-and-Quality Controllable Arbitrary-scale Super-resolution with Fourier Constraints [15.6] 任意のスケールの超解像におけるコスト・アンド・クオリティ(CQ)制御は重要である。
本稿では,品質と効率を両立させるために,複数コンポーネントを共同で予測する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:19:54 GMT)
PVP: An Image Dataset for Personalized Visual Persuasion with Persuasion Strategies, Viewer Characteristics, and Persuasiveness Ratings [15.6] 596個のメッセージに28,454個の説得画像と9つの説得戦略からなるパーソナライズされたビジュアル説得データセットをリリースする。
このデータセットは、2,521人のアノテーションによって評価された画像の説得力スコアと、その人口統計学的および心理的特徴を提供する。
実験の結果,心理的特徴を取り入れることで説得的画像の生成と評価が促進されることが判明した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:59:36 GMT)
Training-free Source Attribution of AI-generated Images via Resynthesis [15.6] 画像再生に基づく新しいトレーニングフリーワンショット属性法を提案する。
また、商用およびオープンソースのテキスト・ツー・イメージ・ジェネレータの顔画像からなる合成画像属性のための新しいデータセットも導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:39:04 GMT)
Bridging Expressivity and Scalability with Adaptive Unitary SSMs [15.2] 本稿では,適応ユニタリ状態空間モデル(Adaptive Unitary State Space Model, AUSSM)を紹介する。
AUSSMとそのハイブリッド変種であるMambaoutperformが、パリティやモジュラー算術といった形式的なタスクでSSMに先立つことを示す。
この結果から,ユニタリ反復は記号的および連続的シーケンスモデリングの両方において,強力かつ効率的な帰納的バイアスを与えることが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:42:28 GMT)
Physics-Informed Extreme Learning Machine (PIELM): Opportunities and Challenges [15.2] 急勾配、非線形性、高周波挙動、厳しい制約、不確実性、多物理結合でPDEを解くために多くの努力がなされている。
成功にもかかわらず、多くの緊急課題に取り組み、より堅牢で、解釈可能で、一般化可能なPIELMフレームワークを開発する機会を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:11:16 GMT)
MH-GIN: Multi-scale Heterogeneous Graph-based Imputation Network for AIS Data (Extended Version) [15.2] 異なる異種属性の値が多様なレートで更新されるため、不足値の発行は困難である。
MH-GINはマルチスケールなグラフベースインプットネットワークであり、マルチスケールの依存関係をキャプチャすることで、インプットの精度を向上させることを目的としている。
その結果,MH-GINは,最先端手法と比較して平均57%の計算誤差を低減できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:58:09 GMT)
EddyFormer: Accelerated Neural Simulations of Three-Dimensional Turbulence at Scale [15.2] EddyFormerはTransformerベースの大規模乱流シミュレーションのためのスペクトル要素アーキテクチャである。
DNSレベルの精度を2563の解像度で達成し、DNSの30倍のスピードアップを提供する。
物理不変量-エネルギースペクトル、相関関数、構造関数-振れ領域一般化の精度を保っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:27:37 GMT)
The Generation Phases of Flow Matching: a Denoising Perspective [15.2] フローマッチングは著しく成功したが、生成プロセスの品質に影響を及ぼす要因はよく分かっていない。
本研究では,創成過程を実証的に探究する枠組みを設計する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:42:53 GMT)
SimpleVSF: VLM-Scoring Fusion for Trajectory Prediction of End-to-End Autonomous Driving [15.1] 本稿では,視覚言語モデル(VLM)と高度な軌跡融合手法の認知能力を活用することによって,エンド・ツー・エンドのプランニングを強化する新しいフレームワークを提案する。
ICCV 2025 NAVSIM v2 End-to-End Driving Challengeにおける主要なアプローチとして、SimpleVSFフレームワークは最先端のパフォーマンスを実証しています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:58:56 GMT)
Quantum-Resistant Networks Using Post-Quantum Cryptography [15.1] 本稿では,量子後暗号技術による古典的通信を保証する,量子抵抗型ネットワークアーキテクチャを提案する。
このフレームワークには、量子層と古典層の両方の継続的監視と、異種インフラストラクチャ間のオーケストレーションが含まれている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:39:12 GMT)
Pairwise Optimal Transports for Training All-to-All Flow-Based Condition Transfer Model [15.1] 本研究では,条件分布間の全転送マップをフローベースで学習する手法を提案する。
本稿では,全ての条件分布に対する最適輸送の同時学習を可能にする新しいコスト関数を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:28:52 GMT)
Robust Point Cloud Reinforcement Learning via PCA-Based Canonicalization [15.0] 下流ロボット制御に適した標準化フレームワークであるPCA Point Cloud (PPC)を提案する。
PPC は任意の剛体変換の下で点雲を特異な正則なポーズにマッピングし、観測結果を一貫したフレームに整列させ、視点誘起の不整合を著しく減少させる。
我々の実験では、PPCは難易度の高いカメラのポーズが困難なロボットタスクにまたがって堅牢性を向上させることを示し、ドメインランダム化の原則的な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:58:54 GMT)
MIC-BEV: Multi-Infrastructure Camera Bird's-Eye-View Transformer with Relation-Aware Fusion for 3D Object Detection [15.0] 我々は,トランスフォーマーをベースとした鳥眼ビュー(BEV)認識フレームワークであるMIC-BEVを紹介した。
トレーニングと評価を支援するため,インフラに基づくオブジェクト検出のための合成データセットM2Iを導入する。
M2Iと実世界のデータセットRoScenesの実験は、3Dオブジェクト検出において、MIC-BEVが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:49:42 GMT)
Demystifying Cookie Sharing Risks in WebView-based Mobile App-in-app Ecosystems [14.9] 我々はCross Mini- Program Cookie Sharing (CMCS)と呼ばれる新しい脆弱性を導入する。
予備的なステップとして、WeChat、AliPay、TikTok、Baiduを含む4つの主要なプラットフォームのWebビューメカニズムを分析しました。
CMCSでは、特権を持つミニプログラムがクッキーを介して機密データを出力し、特権のないミニプログラムにアクセスできるコラシオン攻撃を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:29:18 GMT)
BRIDGE: Benchmarking Large Language Models for Understanding Real-world Clinical Practice Text [14.4] BRIDGEは、9言語にわたる実世界の臨床データソースから得られた87のタスクからなる包括的なベンチマークである。
8つの主要なタスクタイプを6つの臨床段階と20の代表的な応用でカバーしている。
本結果から, モデルサイズ, 言語, 自然言語処理タスク, 臨床専門分野において, かなりの性能変化が明らかとなった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:55:42 GMT)
CT-OT Flow: Estimating Continuous-Time Dynamics from Discrete Temporal Snapshots [14.4] Continuous-Time Optimal Transport Flow (CT-OT Flow)は、高解像度のタイムラベルを推論し、連続時間データ分散を再構築するフレームワークである。
CT-OT Flow は OT-CFM, [SF](2)M, TrajectoryNet, MFM, ENOT と比較して分布誤差と軌道誤差を低減する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:08:49 GMT)
FedMAP: Personalised Federated Learning for Real Large-Scale Healthcare Systems [14.4] フェデレーテッド・ラーニング(FL)は、データのプライバシを保護しながら、医療現場での機械学習を可能にすることを約束する。
我々は,局所的な最大値(MAP)推定による統計的不均一性に対処するパーソナライズされたFLフレームワークであるFedMAPを紹介する。
局所トレーニング,FedAvg,PFL法を3つの大規模臨床データセットで比較検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:16:00 GMT)
FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation [14.3] 大規模言語モデル(LLM)は、かなりのプリフィル計算とキー値(KV)キャッシュを必要とする。
KVキャッシュをプレフィルアクセラレーションで圧縮する最近の作業は、このコストを低減しているが、誤ってプリフィル計算の削減をデコードKV予算に結び付ける。
FastKVはKVキャッシュ圧縮フレームワークで、プリフィルとデコードの両方の遅延を減らし、後のレイヤでのトークンの重要性の安定化を活用する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:00:18 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [14.1] 本稿では,新しい対照的なRLアルゴリズムを用いた最適化のための自動学習フレームワークを提案する。
--L1は最適化タスクで大幅なパフォーマンス改善を実現します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:04:44 GMT)
Which LiDAR scanning pattern is better for roadside perception: Repetitive or Non-repetitive? [14.1] InfraLiDARs' Benchmark"は,CARLAシミュレーション環境において,インフラストラクチャベースのLiDARを並列に動作させることにより,念入りに収集された新しいデータセットである。
その結果, 反復走査LiDARと128行繰り返しLiDARは, 様々なシナリオにおいて同等な検出性能を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:50:56 GMT)
Preparing Code States via Seed-Entangler-Enriched Sequential Quantum Circuits: Application to Tetra-Digit Topological Error-Correcting Codes [14.1] 量子回路の統一的で効率的な枠組みを導入する。
我々は、トポロジカルな誤り訂正符号の符号空間において、長い範囲の絡み合った状態(すなわちコード状態)を構築する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:59:42 GMT)
A Novel XAI-Enhanced Quantum Adversarial Networks for Velocity Dispersion Modeling in MaNGA Galaxies [14.0] 本稿では,従来のディープラーニング層とハイブリッド量子ニューラルネットワーク(QNN)を統合した新しい量子対向フレームワークを提案する。
提案モデルでは,予測精度とモデル説明可能性の両方を最適化し,QNNを並列に導出する。
実証的な評価は、バニラモデルがRMSE = 0.27、MSE = 0.071、MAE = 0.21、R2 = 0.59を達成し、敵のモデルと比較して最も一貫したパフォーマンスを提供することを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:27:10 GMT)
Mitigating Negative Transfer via Reducing Environmental Disagreement [13.8] 本研究は、因果非絡み合い学習のレンズを通しての負の伝達を再考する。
理論的分析から, 環境の発達に伴う非因果的環境特性への過度依存が差別的不一致を引き起こす可能性が示唆された。
本研究では,各試料をドメイン不変因果特徴とドメイン固有非因果的環境特徴に分解する環境診断(RED)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:56:20 GMT)
Decoupling What to Count and Where to See for Referring Expression Counting [13.7] W2-Netは、問題を「数えるべきもの」と「見るべき場所」に明確に分離する新しいフレームワークである。
本稿では,ラベル割り当て時のサブクラス間セパビリティを高めるために,反発力を含む新しいマッチング戦略であるサブクラスセパブルマッチング(SSM)を紹介する。
W2-NetはREC-8Kデータセットの最先端を著しく上回り、カウントエラーを22.5%、(テスト)18.0%削減し、ローカライゼーションF1を7%、そして8%改善した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:51:53 GMT)
Online (Non-)Convex Learning via Tempered Optimism [13.7] Optimistic Online Learningは、将来を予測するために信頼できる情報を提供する専門家を活用することを目的としている。
このような暗黙の楽観主義は、そのような専門家の実践的な作り方に関しては、疑問視されるかもしれない。
我々は,このような不完全な専門家を扱えるよう設計された,経験的誘惑(OT)オンライン学習フレームワークについて紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:36:36 GMT)
TraceTrans: Translation and Spatial Tracing for Surgical Prediction [13.7] 術後予測のための変形可能な画像翻訳モデルであるTraceTransを提案する。
予め入力された空間対応を明示しつつ、目標分布に整合した画像を生成する。
このフレームワークは、特徴抽出のためのエンコーダと、空間的変形を予測し、翻訳された画像を合成するためのデュアルデコーダを用いる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:06:09 GMT)
Privacy Perspectives and Practices of Chinese Smart Home Product Teams [13.6] 本報告では,中国のスマートホーム製品チームメンバーを対象に,27件の半構造化インタビューを行った。
我々の結果は、参加者が個人のプライバシーの権利よりも国家安全保障を優先する中国のデータプライバシー法に準拠することを強調したことを示している。
中国固有の文化的、社会的、法的要因も参加者の倫理的配慮や、ユーザーのプライバシーとセキュリティと利便性のバランスに対する態度に影響した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:19:28 GMT)
DogMo: A Large-Scale Multi-View RGB-D Dataset for 4D Canine Motion Recovery [13.5] 画像から運動回復のための多様な犬の動きをキャプチャする大規模マルチビューRGB-DビデオデータセットであるDogMoを提案する。
DogMoは10匹のユニークな犬から1.2kの運動シーケンスを収集し、運動と繁殖の両方に豊富なバリエーションを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:41:49 GMT)
AutoJudge: Judge Decoding Without Manual Annotation [13.5] AutoJudgeは大規模言語モデル(LLM)推論をタスク固有の損失投機的デコードで高速化する手法である。
提案手法は,ターゲットモデルとドラフトモデルとのミスマッチのどれを修正すべきかを,半グレディな探索アルゴリズムに頼っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:35:32 GMT)
SafeEditor: Unified MLLM for Efficient Post-hoc T2I Safety Editing [13.4] モデルに依存しないプラグイン・アンド・プレイモジュールとして機能するマルチラウンド安全編集フレームワークを提案する。
我々は、安全でないコンテンツを識別・精錬する人間の認知過程を反映した、ポストホックな安全編集パラダイムを導入する。
生成した画像に対して複数ラウンドの安全編集が可能な統合MLLMであるSafeEditorを開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:12:15 GMT)
Eye-Tracking, Mouse Tracking, Stimulus Tracking,and Decision-Making Datasets in Digital Pathology [13.3] PathoGaze1.0は,がん診断時の動的視覚探索と意思決定過程を解析した行動データセットである。
データセットは18.69時間の視線追跡、マウスの相互作用、追跡刺激、ビューポートナビゲーション、診断決定データ(EMSVD)で構成されている。
合計171,909個の固定,263,320個のサケード,1,867,362個のマウスの相互作用イベントが記録された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:18:43 GMT)
MTFL: Multi-Timescale Feature Learning for Weakly-Supervised Anomaly Detection in Surveillance Videos [13.3] 本稿では,時間的特徴量を改善するため,MTFL法を提案する。
実験の結果、MTFLはUCF-Crimeデータセットの最先端の手法より優れており、異常検出性能は89.78%であることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:30:55 GMT)
From Prompt Optimization to Multi-Dimensional Credibility Evaluation: Enhancing Trustworthiness of Chinese LLM-Generated Liver MRI Reports [13.2] 大言語モデル (LLM) は画像所見から診断結果を生成する上で有望な性能を示した。
本研究は, MDCA (Multi-dimensional Credibility Assessment) フレームワークの導入により, LLM産生肝MRIの信頼性を高めることを目的とする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:12:09 GMT)
GRPO-MA: Multi-Answer Generation in GRPO for Stable and Efficient Chain-of-Thought Training [13.2] RL(Reinforcement Learning)アプローチであるGRPOは,大規模言語モデル(LLM)と視覚言語モデル(VLM)において,CoT(Chain-of-Thought)推論を効果的に訓練することができる。
本稿では,GRPOの3つの課題として,思考と回答の勾配結合,限られた並列サンプリングによる報酬信号の分散,不安定な優位性推定について分析する。
本稿では, GRPO-MAを提案する。GRPO-MAは, 各思考プロセスから複数問合せを生成し, より堅牢で効率的な最適化を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:36:45 GMT)
Memory Mosaics at scale [13.1] メモリモザイクは中規模ネットワーク上でのコンポジションとインコンテキストの学習能力をアピールしている。
メモリモザイクを10Bサイズにスケールし、1兆トークンでトレーニングし、3つの評価次元でそれらの能力を評価する。
1兆のトークンで訓練されたメモリモザイクv2は、8兆のトークンで訓練されたトランスフォーマーよりも、これらのタスクで優れたパフォーマンスを保っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:59:36 GMT)
10 quick tips for making your software outlive your job [13.0] 政治的・財政的な変化は、多くの研究者を同時に職から外している。
この記事では、研究者が現在の仕事を辞めた後も、彼らが構築したソフトウェアが引き続き利用可能であることを保証するための10のヒントを提示します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:57:33 GMT)
Turbocharging Gaussian Process Inference with Approximate Sketch-and-Project [12.9] 本稿では,線形システムを解くための近似的,分散的,高速化されたスケッチ・アンド・プロジェクトアルゴリズム(texttADASAP$)を提案する。
決定点過程の理論を用いて、スケッチ・アンド・プロジェクションによって誘導される後進平均が、真の後進平均に急速に収束することを示す。
$texttADASAP$は$>3 cdot 108$のデータセットにスケールする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:57:58 GMT)
Exponentially Decaying Quantum Simulation Error with Noisy Devices [12.8] 現在の量子ハードウェアにおけるノイズは、量子シミュレーションにとって大きな障害となる。
単一トラッターステップにおける物理誤差だけでなくアルゴリズム誤差も回路深さとともに指数関数的に減少することを示す。
この研究は、量子シミュレーションによる実用的な量子優位性に関する、新しく体系的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:33:40 GMT)
Unveiling Concept Attribution in Diffusion Models [12.8] 拡散モデルは、テキストプロンプトから現実的で高品質な画像を生成する際、顕著な能力を示した。
近年の研究では、他のレイヤがターゲット概念にどのように貢献するかを示すことなく、知識保存層を生成モデルにローカライズするために因果トレースを採用している。
成分属性を用いた拡散モデルを分解し,概念生成における各成分の重要性を体系的に明らかにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:07:50 GMT)
Towards Real Unsupervised Anomaly Detection Via Confident Meta-Learning [12.7] Confident Meta-learning(CoMet)は、未処理のデータセットから深層異常検出モデルを学ぶことができる新しいトレーニング戦略である。
本手法では,低信頼度サンプルに低重みを割り当てるSoft Confident Learningと,更新を規則化してトレーニングを安定化するMeta-Learningを統合した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:28:13 GMT)
Spatio-temporal Multivariate Time Series Forecast with Chosen Variables [12.7] 本稿では,予測精度とモデル効率の両面において,変数選択とモデル最適化を共同で行う統一フレームワークを提案する。
5つの実世界のデータセットの実験では、我々の研究は精度と効率の両方で最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:19:06 GMT)
Ko-MuSR: A Multistep Soft Reasoning Benchmark for LLMs Capable of Understanding Korean [12.6] Ko-MuSRは、韓国の長文におけるソフト推論を総合的に評価した最初のベンチマークである。
完全な韓国の物語、推論の連鎖、そして人間のアノテーターによって検証された複数の選択の質問が特徴である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:42:59 GMT)
Adaptive Data Collection for Latin-American Community-sourced Evaluation of Stereotypes (LACES) [12.6] NLPモデルにおける社会的バイアスの評価は、地理的・文化的ギャップによって著しく妨げられている。
既存のベンチマークは圧倒的に英語中心であり、アメリカの人口統計に焦点を当てている。
我々は,ラテンアメリカにおけるコミュニティパートナーシップを通じて開発された,新しい大規模ステレオタイプデータセットを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:42:14 GMT)
Face the Facts! Evaluating RAG-based Fact-checking Pipelines in Realistic Settings [12.6] この作業は、Retrieval-Augmented Generationパラダイムに基づいた自動ファクトチェックのための現在の最先端パイプラインのいくつかの制約を取り上げる。
我々のゴールは、より現実的なシナリオの下で、予測の生成のためのRAGベースのメソッドをベンチマークすることです。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:02:14 GMT)
A Neuroscience-Inspired Dual-Process Model of Compositional Generalization [12.5] ニューラルインスパイアされたデュアルプロセスモデルであるtextscMirageを提案する。
高速で直感的なSystem1'(メタトレーニングされたトランスフォーマー)と、意図的にルールベースのSystem2'(エンジン)を組み合わせる。
Mirageはタスクに依存しない設定でSCANベンチマークのすべての分割に対して$99%の精度を達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:48:15 GMT)
HiMAE: Hierarchical Masked Autoencoders Discover Resolution-Specific Structure in Wearable Time Series [12.5] マスク付きオートエンコーディングと階層的畳み込みエンコーダデコーダを組み合わせた自己教師型フレームワークであるHiMAE(Hierarchical Masked Autoencoder)を紹介する。
HiMAEは、時間スケールの予測信号の体系的な評価を可能にするマルチ解像度埋め込みを生成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:15:45 GMT)
Compositional Image Synthesis with Inference-Time Scaling [12.2] レイアウトの忠実性を改善するために、オブジェクト中心のアプローチと自己制限を組み合わせたトレーニング不要のフレームワークを提案する。
近年のテキスト・ツー・イメージ・モデルと比較して,レイアウト・グラウンドを自己修正型推論時間スケーリングと統合することにより,シーンアライメントの強化を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:16:21 GMT)
WXImpactBench: A Disruptive Weather Impact Understanding Benchmark for Evaluating Large Language Models [12.2] WXImpactBenchは、大きな言語モデル(LLM)の破壊的な気象影響を評価するための最初のベンチマークである。
構築されたデータセットと評価フレームワークのコードは、社会が災害からの脆弱性を保護するのに役立つ。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:06:49 GMT)
Your Dense Retriever is Secretly an Expeditious Reasoner [12.1] 本稿では,ハイブリッドクエリ書き換えフレームワークであるAdaptive Query Reasoning (AdaQR)を提案する。
AdaQRは推論コストを28%削減し、保存または検索パフォーマンスを7%向上させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:31:06 GMT)
CAUSAL3D: A Comprehensive Benchmark for Causal Learning from Visual Data [12.1] 我々は、構造化されたデータ(テーブル)と対応する視覚表現(画像)を統合する新しいベンチマークであるtextsctextbfCausal3Dを導入し、因果推論を評価する。
Causal3Dは、多様な因果関係、ビュー、背景をキャプチャする19の3Dシーンデータセットで構成されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:41:35 GMT)
TokenTiming: A Dynamic Alignment Method for Universal Speculative Decoding Model Pairs [12.1] 投機的復号化は推論効率を大幅に向上させる。
ドラフトとターゲットモデルは、同じ語彙を共有しなければならない。
普遍的な投機的復号化のためのアルゴリズムTokenTimingを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:23:35 GMT)
Sparse Optimistic Information Directed Sampling [12.0] 我々は,SOIDSが最適に情報と後悔のバランスをとることができることを示す。
我々は,SOIDSがデータ豊かさとデータ貧弱さの両面において,最善の最悪の後悔を同時に達成していることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:42:15 GMT)
MambaCAFU: Hybrid Multi-Scale and Multi-Attention Model with Mamba-Based Fusion for Medical Image Segmentation [12.0] 本稿では,CNN,トランスフォーマー,およびMambaベースのアテンションフュージョン機構を統合した3分岐エンコーダを特徴とするハイブリッドセグメンテーションアーキテクチャを提案する。
マルチスケールアテンションベースのCNNデコーダは、コンテキスト整合性を維持しつつ、きめ細かいセグメンテーションマップを再構成する。
本手法は,計算量に匹敵する複雑性を維持しつつ,精度と一般化において最先端の手法より優れる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 23:43:17 GMT)
Datasheets for Machine Learning Sensors [11.7] 機械学習(ML)は、組み込みAIセンサーシステムで普及しつつある。
これらの"MLセンサー"は、コンテキストに敏感でリアルタイムなデータ収集と意思決定を可能にする。
このようなML対応センシングシステムの運用には透明性を提供する必要がある。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:53:16 GMT)
Exponential Dynamic Energy Network for High Capacity Sequence Memory [11.7] 本稿では,エネルギーパラダイムを時間領域に拡張する新しいアーキテクチャであるExponential Dynamic Energy Network (EDEN)を紹介する。
EDENは、人工システムと生物学的システムの両方において、高容量の時間記憶のためのスケーラブルで解釈可能なモデルを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:53:24 GMT)
Reduced State Embedding for Error Correction in Quantum Cryptography [11.6] 我々は、チャネルの誤差構造に合わせて、d次元ヒルベルト空間内のk-シンボル部分集合を用いる状態埋め込みを導入する。
量子エラー補正の枠組みでは, 減状態埋め込みは, 量子チャネル内の明示的な消去型エラー補正を実現する。
これらの知見は高次元QKDを推し進め、量子暗号の誤り訂正と変調の道を開いた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:07:26 GMT)
Adaptive Knowledge Transferring with Switching Dual-Student Framework for Semi-Supervised Medical Image Segmentation [11.6] 教師と学生のフレームワークは、半教師付き医療画像セグメンテーションにおける主要なアプローチとして現れてきた。
本稿では,各イテレーションで最も信頼性の高い学生を戦略的に選別する,新しいDual-Studentアーキテクチャを提案する。
また,教師が学生から有意義な情報を吸収することを動的に保証するために,Los-Aware Exponential moving Averageという戦略を導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:42:33 GMT)
SPARTA: Evaluating Reasoning Segmentation Robustness through Black-Box Adversarial Paraphrasing in Text Autoencoder Latent Space [11.5] MLLM(Multimodal large language model)は、推論セグメンテーションなどの視覚言語タスクにおいて顕著な機能を示す。
そこで本研究では,従来の問合せの意味を保ちつつ,セグメンテーション性能を劣化させつつ,文法的に正しい言い回しを生成する,新しい逆の言い回しタスクを提案する。
テキストオートエンコーダの低次元意味潜在空間で動作するブラックボックスであるSPARTAを導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:09:05 GMT)
VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation [11.5] 大規模言語モデル(LLM)は、自動システム設計のためのデータサイエンスにますます統合される。
本稿では,PCS(Predictability-Computability-Stability)の原則に基づくマルチエージェントシステムであるVDSAgentsを提案する。
VDSAgentsを、最先端のエンドツーエンドデータサイエンスシステムと比較し、様々な特徴を持つ9つのデータセット上で評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:07:50 GMT)
GraSS: Scalable Data Attribution with Gradient Sparsification and Sparse Projection [11.5] インフルエンス関数のような勾配に基づくデータ帰属法は、反復的なモデル再訓練を必要とせず、個々のトレーニングサンプルの影響を理解するために重要である。
線形層に対する新しい勾配圧縮アルゴリズムであるGraSSと、その変種であるFactGraSSは、サブ線形空間と時間複雑性を達成するために、サンプル単位の勾配の本質的な空間性を利用する。
特に、FactGraSSは、これまでの最先端ベースラインと比較して、数十億規模のモデルで最大165%のスループットを実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:46:13 GMT)
BNMusic: Blending Environmental Noises into Personalized Music [11.4] 本稿では,2つの重要なステージを持つパーソナライズド・ミュージック(BNMusic)フレームワークを提案する。
第1段階は、音楽の本質をカプセル化したメル・スペクトログラム表現で完全な楽曲を合成する。
第2段階では、生成した音楽セグメントを適応的に増幅し、さらにノイズ知覚を低減し、ブレンディングの有効性を高める。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:11:45 GMT)
Doubly Robust Alignment for Large Language Models [11.4] 本稿では,人からのフィードバックから,大規模言語モデルと人間の嗜好を整合させる強化学習について検討する。
本稿では、優先モデルと参照ポリシーのどちらが正しく指定された場合でも、一貫性が保たれる2つの頑健な選好最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:58:26 GMT)
The Hawthorne Effect in Reasoning Models: Evaluating and Steering Test Awareness [11.4] 推論に焦点を当てたLLMは、評価されていることを検知すると、その振る舞いを変えることがある。
このような「テスト意識」がモデル行動に与える影響について、最初の定量的研究を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:02:10 GMT)
Beyond Line-Level Filtering for the Pretraining Corpora of LLMs [11.3] パターン認識行レベル重複(PLD)とパターン認識追従句読取フィルタ(PTF)の2つの方法を紹介する。
提案手法では,行レベルの信号だけでなく,文書間の逐次的な分散も考慮し,構造的に重要なコンテンツを維持できる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:24:32 GMT)
Physics Context Builders: A Modular Framework for Physical Reasoning in Vision-Language Models [11.3] 視覚言語モデル(VLM)における物理推論の課題
物理コンテキストビルダー(PCB)は,物理シーンの詳細な記述を生成するために,より小型のVLMを微調整したモジュラーフレームワークである。
PCBは、視覚知覚と推論の分離を可能にし、身体的理解に対する相対的な貢献を分析することができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:43:29 GMT)
MATCH: Task-Driven Code Evaluation through Contrastive Learning [11.2] GitHub Copilotは、GitHubのコードの46%を生成すると見積もっている。
単体テストのような従来の評価手法は、しばしば計算不可能でコストがかかる。
本稿では,新しい参照フリーメトリックであるMATCHを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:44:06 GMT)
Emergency Response Measures for Catastrophic AI Risk [11.1] 本稿では、フロンティア安全ポリシー(FSP)という国際的AI安全プラクティスにインスパイアされた実装モデルを分析する。
FSPは、危険な能力と、事前に計画された安全対策のための事前配備評価を特徴としている。
我々は、FSPと中国の緊急対応枠組みの積極的相の密接な一致を観察する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:07:58 GMT)
Does Object Binding Naturally Emerge in Large Pretrained Vision Transformers? [11.1] 事前学習された視覚変換器(ViT)にオブジェクトバインディングが出現することを示す。
その結果,IsSameObjectはオブジェクト上の低次元部分空間に符号化されており,この信号が注目を集めていることがわかった。
我々の研究は、ViTがオブジェクト結合を欠いているという見解に挑戦し、コネクショナリストシステムにおいて「どの部分が一緒に属しているか」という象徴的な知識がどのように自然に現れるかを強調した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:57:05 GMT)
Graph-Guided Concept Selection for Efficient Retrieval-Augmented Generation [10.9] グラフベースのRAGは、テキストチャンクから知識グラフ(KG)を構築し、Large Language Model(LLM)ベースの質問応答における検索を強化する。
バイオメディシン、法学、政治学などの分野では特に有益であり、事実上の検索はプロプライエタリな文書に対するマルチホップ推論を伴うことが多い。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:47:30 GMT)
A Pragmatic Way to Measure Chain-of-Thought Monitorability [10.8] CoT(Chain-of-Thought)モニタリングは、AIの安全性にユニークな機会を提供する。
監視可能性を維持するために,可視性とカバレッジという2つのコンポーネントを測定するための実用的手法を提案する。
我々はこれらのメトリクスをオートラッタープロンプトで実装し、任意の有能なLCMが既存のCoTの可視性とカバレッジを計算できるようにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:44:25 GMT)
GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving [10.8] 本稿では,エンドツーエンド自動運転のためのガウス式マルチセンサフュージョンフレームワークを提案する。
本手法では,様々なセンサからの情報を集約するために,直観的かつコンパクトなガウス表現を中間キャリアとして利用する。
明示的な特徴は交通シーンに関する豊かな意味と空間情報を捉え、暗黙的な特徴は軌道計画のための補完的な手がかりを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:15:21 GMT)
p-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6] $p$-less サンプリングは、サンプリングに対する情報理論のアプローチである。
トークン確率分布全体に基づいて、各復号ステップでトラクション閾値を動的に設定する。
温度が上昇するにつれて、常に高品質な出力を生成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:33:49 GMT)
MixAT: Combining Continuous and Discrete Adversarial Training for LLMs [10.6] MixATは、トレーニング中により強力な離散的および高速な連続攻撃を組み合わせる新しい方法である。
以上の結果から,MixATは前回の防御よりもかなり優れたロバスト性(ALO-ASR 20%)を達成できることが示された。
この結果から,MixATの離散連続防衛は,計算オーバーヘッドを最小限に抑えつつ,原理的かつ高精度なトレードオフを提供することが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:41:22 GMT)
ChessQA: Evaluating Large Language Models for Chess Understanding [10.5] Chessは大規模言語モデル(LLM)の推論、モデリング、抽象化機能を評価するのに理想的なテストベッドを提供する。
5つのタスクカテゴリにわたるLLMチェス理解を評価するベンチマークであるChessQAを提案する。
5つのカテゴリにまたがって永続的な弱点を見つけ、結果とカテゴリ別エラー解析を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:02:52 GMT)
Detecting Latin in Historical Books with Large Language Models: A Multimodal Benchmark [10.4] 本稿では,様々なレイアウトの混在した古文書からラテン語の断片を抽出する新しい課題について述べる。
注釈付き724ページのマルチモーダルデータセットに対して,大規模ファンデーションモデルの性能をベンチマークし,評価した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:04:38 GMT)
STNet: Spectral Transformation Network for Solving Operator Eigenvalue Problem [10.3] 演算子固有値問題は、様々な科学分野や工学的応用において重要な役割を果たす。
最近のディープラーニング手法は、ニューラルネットワークを反復的に更新することで、この問題に対処するための効率的なアプローチを提供する。
本稿では,既存の学習手法を一貫して上回るスペクトル変換ネットワーク(STNet)を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:43:54 GMT)
ImageNet-trained CNNs are not biased towards texture: Revisiting feature reliance through controlled suppression [10.2] 我々は、畳み込みニューラルネットワーク(CNN)が本質的にテクスチャバイアスを受けているという仮説を再考する。
本稿では, 形状, テクスチャ, 色調を体系的に抑制することで, 特徴の信頼度を定量化するドメインに依存しないフレームワークを提案する。
コンピュータビジョン, 医用画像, リモートセンシングにまたがって解析を拡張し, 依存パターンが系統的に異なることを明らかにした。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:26:53 GMT)
Generalized Exponentiated Gradient Algorithms Using the Euler Two-Parameter Logarithm [10.2] 本稿では,ミラー・ディフレッシュ(MD)更新を用いたGEGアルゴリズムの新たなクラスを提案し,検討する。
このリンク関数は、トレース形式エントロピーの比較的広いクラスと関連付けられている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:53:44 GMT)
Optimizing Retrieval for RAG via Reinforced Contrastive Learning [10.1] Retrieval-augmented Generation(RAG)は、人間のユーザのための情報の検索から、AIシステムのコンテキスト知識の検索へと移行している。
本稿では,RAGに最適化された検索用フレームワークであるR3を提案する。
R3はRAG性能を元のレトリバーより5.2%向上し、最先端レトリバーを4.9%上回っている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:18:30 GMT)
Riemannian-Geometric Fingerprints of Generative Models [10.1] 生成モデル(GM)のアーティファクトと指紋の新しい定義を提案する。
我々はこの理論を、実際に指紋を計算するための新しい勾配に基づくアルゴリズムに適用する。
結果は,2つの異なる解像度で4つの異なるデータセットにまたがって,GMの大規模な配列を識別する方が効果的であることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:55:35 GMT)
TrajAgent: An LLM-Agent Framework for Trajectory Modeling via Large-and-Small Model Collaboration [10.0] 軌道モデリングは、生活サービス、都市交通、行政などの分野で広く応用されている。
本稿では,大規模言語モデルを用いたエージェントフレームワークであるTrajAgentを提案する。
4つの実世界のデータセットを用いた5つのタスクの実験において、TrijAgentはベースライン法よりも2.38%-69.91%の性能向上を達成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:18:04 GMT)
Partner Modelling Emerges in Recurrent Agents (But Only When It Matters) [10.0] モデルフリーのRNNエージェントを訓練し、多様なパートナーの集団と協力する。
エージェントがタスク割り当てを制御することで、パートナー行動に影響を与えると、構造化されたパートナーモデリングが出現する。
我々の結果は、パートナーモデリングはモデルのないエージェントで自然に起こる可能性があるが、適切な社会的圧力を課す環境条件下でのみであることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:28:59 GMT)
Self-Concordant Perturbations for Linear Bandits [10.0] 本稿では,Follow-the-Regularized-Leader法とFollow-the-Perturbed-Leader法をブリッジする統合アルゴリズムフレームワークを提案する。
自己協和性バリアの役割を反映した確率分布のファミリーである自己協和性摂動を導入する。
我々のアプローチは、$d$次元ハイパーキューブとユークリッド球の両方で$O(dsqrtn ln)$を後悔する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:47:15 GMT)
BEST-RQ-Based Self-Supervised Learning for Whisper Domain Adaptation [9.9] 未ラベルデータを用いてWhisperのエンコーダを適応させる新しいフレームワークであるBEARDを提案する。
従来の自己教師型学習法とは異なり、BEARDはBEST-RQ目標と凍結教師エンコーダからの知識蒸留を独自に組み合わせ、エンコーダと事前訓練されたデコーダとの相補性を確保する。
実験では,非ネイティブ音声,雑音,特殊フレーズを特徴とする,ATC(Air Traffic Control)通信ドメインのATCO2コーパスに着目した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:01:24 GMT)
HyPerNav: Hybrid Perception for Object-Oriented Navigation in Unknown Environment [9.8] 未知環境におけるナビゲーションの有効性とインテリジェンスを高めるために,Hybrid Perception Navigation (HyNav)を提案する。
本手法は,エゴセントリックな観測からの情報とトップダウンマップを同時に利用することにより,よりリッチなキューを捕捉し,オブジェクトをより効果的に発見する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:49:09 GMT)
Machine Learning based Analysis for Radiomics Features Robustness in Real-World Deployment Scenarios [9.8] 放射能ベースの機械学習モデルは、臨床決定のサポートを約束するが、分布シフトに弱い。
本研究では,5つのMRIシークエンスにまたがる分布変化下での放射能に基づく機械学習モデルのロバスト性について系統的に検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:54:43 GMT)
Idea2Plan: Exploring AI-Powered Research Planning [9.8] 大型言語モデル(LLM)は、科学的発見を加速する大きな可能性を証明している。
本研究では,LLMが概念研究のアイデアから十分に構造化された研究計画への移行にどう対応できるかを検討する。
本研究は, LLMsの今後の研究計画能力に関する新たな知見を提供し, 今後の発展に向けての基礎を固めるものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:54:51 GMT)
Graph Distance Based on Cause-Effect Estimands with Latents [9.8] 本研究では,非周期有向混合グラフ(ADMG)に対するグラフ距離測定法を提案する。
異なるグラフ摂動の下で測定値の挙動を解析し,既存の距離測定値と比較する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 23:38:43 GMT)
From Observability Data to Diagnosis: An Evolving Multi-agent System for Incident Management in Cloud Systems [9.6] OpsAgentは、インシデント管理のための軽量で自己進化型のマルチエージェントシステムである。
トレーニング不要のデータプロセッサを使用して、異種可観測データを構造化されたテキスト記述に変換する。
OpsAgentは一般化可能で、解釈可能で、コスト効率が高く、自己進化的です。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:38:15 GMT)
Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders [9.4] 連続的に外生的でない共同設立者が存在する場合、ロバストな政策評価と政策最適化について検討する。
本研究は,敗血症治療のシミュレーションと実世界の縦断医療データの両方において,複雑性境界,洞察,有効性を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:18:02 GMT)
FALQON: Accelerating LoRA Fine-tuning with Low-Bit Floating-Point Arithmetic [9.2] FP8のような低ビット浮動小数点(FP)フォーマットは、モデルトレーニングにおいて大きな加速とメモリ節約を提供する。
本稿では,ローランク適応(LoRA)計算経路から量子化オーバーヘッドを除去する新しいフレームワークであるFALQONを提案する。
FALQONは、同じレベルの精度で既存の量子化LoRA法よりも約3$times$のトレーニングスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:44:49 GMT)
Coreset for Robust Geometric Median: Eliminating Size Dependency on Outliers [9.2] サイズ $tildeO(varepsilon-2 cdot minvarepsilon-2, d)$ if $n geq 4m$。
d = 1$ の特別な場合、最適コアセットサイズは $tildeTheta(varepsilon-1/2 + fracmn varepsilon-1)$ となる。
我々の結果は、ロバスト$(k,z)$-clusteringにまで拡張されます。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:49:03 GMT)
StorageXTuner: An LLM Agent-Driven Automatic Tuning Framework for Heterogeneous Storage Systems [9.1] ヒューリスティックとMLチューニングは、しばしばシステム固有のものであり、手動のグルーを必要とし、変更の下で劣化する。
最近のLLMベースのアプローチは、チューニングをシングルショットのシステム固有のタスクとして扱うのに役立つ。
ヘテロジニアスストレージエンジンのためのLLMエージェント駆動自動チューニングフレームワークであるStorageXTunerを提案する。
プロトタイプを実装してRocksDB, LevelDB, CacheLib, InnoDBでYCSB, MixGraph, TPC-H/Cで評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:33:14 GMT)
What Causes Postoperative Aspiration? [9.1] 吸引、肺への異物吸入は外科患者の死亡率と死亡率に大きな影響を及ぼす。
本研究は,術後の呼吸を予測し,時間的に予防的介入を可能にする機械学習(ML)モデルを開発する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:53:22 GMT)
Real-Time Neural Video Compression with Unified Intra and Inter Coding [9.0] 各フレームを1つのモデルで処理する、イントラ・インターコーディングとイントラ・コーディングを統一したNVCフレームワークを提案する。
本稿では,フレーム間冗長性を利用した2フレーム同時圧縮設計を提案する。
実験の結果,提案方式はDCVC-RTよりも平均10.7%のBDレート低減効果を示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:17:14 GMT)
LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation [8.9] LagMemoはマルチモーダルでオープンなゴールクエリとマルチゴールビジュアルナビゲーションのためのナビゲーションシステムである。
探索中、LagMemoは統一された3D言語メモリを構築する。
タスクのゴールが届くと、システムはメモリをクエリし、候補のゴール位置を予測し、ローカルな認識に基づく検証メカニズムを統合する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:42:21 GMT)
Augmenting Biological Fitness Prediction Benchmarks with Landscapes Features from GraphFLA [8.9] 我々は、Mutagensisデータからフィットネスランドスケープを構築し、分析するPythonフレームワークであるGraphFLAを紹介した。
GraphFLAをProteinGym,RNAGym,CIS-BPの5,300以上のランドスケープに適用することにより,数十のフィットネス予測モデルの性能の解釈と比較に有用であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:50:58 GMT)
MENTOR: A Reinforcement Learning Framework for Enabling Tool Use in Small Models via Teacher-Optimized Rewards [8.6] 大規模言語モデル (LLM) のツール使用能力をより小さく、より効率的な小言語モデル (SLM) に拡張することは、実用上の重要な課題である。
教師付き微調整(英語版)(SFT)は、堅牢な方法論を学ぶのではなく、静的な教師軌跡のセットを模倣するようにモデルを訓練するので、一般化に苦しむ。
本稿では,強化学習と教師誘導蒸留を組み合わせたフレームワークであるMENTORを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:50:06 GMT)
PEARL: Peer-Enhanced Adaptive Radio via On-Device LLM [8.6] PEARLはデバイス間通信(D2D)における協調的な層間最適化のためのフレームワークである。
コンテキスト認識報酬は、アプリケーション寛容によってレイテンシを正規化し、デバイスバッテリ状態によってエネルギーを変調する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:48:14 GMT)
Caption-Driven Explainability: Probing CNNs for Bias via CLIP [8.6] コンピュータビジョン問題に対する最先端の手法の1つは、サリエンシマップを生成することである。
サリエンシマップは、MLモデルに最も興奮する画像のピクセル空間をハイライトする。
コントラッシブ言語イメージ事前学習モデルに説明可能なスタンドアロンモデルを統合するキャプションベースのXAI手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:52:08 GMT)
MASPRM: Multi-Agent System Process Reward Model [8.5] マルチエージェントシステム(MAS)は強いテスト時間性能を要求する。
MASPRM(Multi-Agent System Process Reward Model)を提案する。
アクションごと、エージェントごとの値を部分的なエージェント間転写に割り当てる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:48:20 GMT)
BMGQ: A Bottom-up Method for Generating Complex Multi-hop Reasoning Questions from Semi-structured Data [8.5] 本稿では,半構造化知識ソースから高難易度,訓練可能なマルチホップ質問を自動生成するフレームワークを提案する。
このシステムは、自然言語推論(NLI)に基づく関係型付けと多様性を意識した拡張を通じて、多様な、論理的にラベル付けされたエビデンスクラスタを成長させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:43:15 GMT)
Taming the Tail: NoI Topology Synthesis for Mixed DL Workloads on Chiplet-Based Accelerators [8.5] CPU/GPUと新興技術(HBM/DRAM)の異種チップレットベースシステムによるスケール向上
しかし、このパッケージ上のデアグリゲーションはNetwork-on-Interposer(NoI)に遅延をもたらす
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:36:44 GMT)
PRIVET: Privacy Metric Based on Extreme Value Theory [8.4] 深層生成モデルは、しばしば、遺伝配列、健康データ、より広範に、著作権、ライセンス、保護されたコンテンツなどの機密データに基づいて訓練される。
これにより、プライバシー保護のための合成データ、より具体的にはプライバシー漏洩に関する重要な懸念が持ち上がる。
本稿では,個別のプライバシリークスコアを合成サンプルに割り当てる,汎用的なサンプルベースモダリティ非依存アルゴリズムPRIVETを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:42:03 GMT)
Fair Indivisible Payoffs through Shapley Value [8.4] 我々は、大連立の価値が自然数である無分別連立ゲームにおけるペイオフ分割の問題を考える。
この数字は、議会議席、腎臓交換、あるいは機械学習モデルの結果に寄与する最上位の特徴など、一定の量の不可分な対象を表す。
本稿では,これらのオブジェクトをプレーヤ間で分割する公平な方法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:18:07 GMT)
GraphNet: A Large-Scale Computational Graph Dataset for Tensor Compiler Research [8.3] GraphNetは、リッチメタデータを備えた2.7Kの現実世界のディープラーニング計算グラフのデータセットである。
我々は、デフォルトのテンソルコンパイラ、PaddlePaddle用のCINN、PyTorch用のTorchInductor、コンピュータビジョン(CV)と自然言語処理(NLP)のサンプルをベンチマークし、GraphNetの実用性を実証した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:36:05 GMT)
LRT-Diffusion: Calibrated Risk-Aware Guidance for Diffusion Policies [8.2] 拡散政策はオフライン強化学習(RL)と競合する
LRT-Diffusion(リスク対応サンプリングルール)を導入し,各段階を逐次仮説テストとして扱う。
これにより、ガイダンスは、ユーザ解釈可能なリスク予算によるエビデンス駆動の調整に固定されたプッシュから切り替わる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:26:18 GMT)
Causal Ordering for Structure Learning From Time Series [8.2] 時系列における因果発見は、真の因果関係を特定する複雑さによって妨げられる。
伝統的な順序付け法は本質的に、結果のモデルの表現能力を制限する。
時間データに対する拡散に基づく因果探索を用いたDOTSを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:06:15 GMT)
CodeWiki: Automated Repository-Level Documentation at Scale [8.2] CodeWikiは7つのプログラミング言語にまたがる総合的なリポジトリレベルのドキュメンテーションのための、最初のオープンソースフレームワークです。
また、マルチレベル合成とエージェントアセスメントを備えた最初のリポジトリレベルのドキュメンテーションベンチマークであるCodeWikiBenchについても紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:52:46 GMT)
SEER: The Span-based Emotion Evidence Retrieval Benchmark [8.1] 感情を表現する特定のテキストを識別する大規模言語モデルの能力をテストするために,SEER(Span-based Emotion Evidence Retrieval)ベンチマークを導入する。
我々は14個のオープンソースLCMを評価し、あるモデルでは1文入力で平均的な人的パフォーマンスにアプローチするが、その精度は長いパスで低下する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:07:57 GMT)
Towards Transparent Reasoning: What Drives Faithfulness in Large Language Models? [8.0] 大きな言語モデル(LLM)は、しばしば、予測を駆動する要因を忠実に反映しない説明を生成する。
我々は、推論とトレーニング時の選択が、実践者がデプロイ時に制御できる要因に焦点をあてて、説明の忠実さを形作る方法について研究する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:43:49 GMT)
Quantifying Unxtendibility via Virtual State Extension [8.0] 仮想状態拡張タスクを導入することにより、状態が拡張できない程度を定量化する方法を示す。
我々の中心的な結果は、絡み合い理論と量子通信理論との深い関係を確立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:57:17 GMT)
Reproducible workflow for online AI in digital health [8.0] オンライン人工知能(AI)アルゴリズムは、デジタルヘルス介入の重要な構成要素である。
オンラインAIのデプロイは重要な課題である。
本稿では、デジタルヘルス介入におけるオンラインAI意思決定アルゴリズムの開発、デプロイ、分析のための再現可能な科学的ワークフローを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:00:42 GMT)
MCIHN: A Hybrid Network Model Based on Multi-path Cross-modal Interaction for Multimodal Emotion Recognition [7.9] マルチパス・クロスモーダル相互作用(MCIHN)に基づくハイブリッドネットワークモデルを提案する。
対向オートエンコーダ(AAE)は、各モードごとに別々に構築される。
潜伏符号は事前に定義されたクロスモーダルゲート機構モデル(CGMM)に入力される
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:04:03 GMT)
JanusDNA: A Powerful Bi-directional Hybrid DNA Foundation Model [7.9] 大規模言語モデル(LLM)は自然言語処理に革命をもたらし、他のシーケンシャルなデータタイプにもますます適用されてきている。
我々は、新しい事前学習パラダイムに基づいて構築された、最初の双方向DNA基盤モデルであるJanusDNAを紹介する。
JanusDNAは、1つの80GB GPU上で1つのヌクレオチド分解能で100万塩基対を処理する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:53:33 GMT)
Tractable Shapley Values and Interactions via Tensor Networks [7.7] テンソル・ネットワーク・サロゲート上の数評価スキームを用いて、シャプリー値の背後にある n 個の特徴に対する O(2n) 共役列挙を置換する方法を示す。
鍵となる考え方は、予測子の局所的な振る舞いを因子化された多重線型写像として表現し、連立量がテンソル係数の線形プローブとなるようにすることである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:35:27 GMT)
MMD-Flagger: Leveraging Maximum Mean Discrepancy to Detect Hallucinations [7.5] MMD-Flagger という幻覚コンテンツにフラグを付ける手法を提案する。
高レベルの観点から、MDD-Flaggerは出力間のMDDを追跡し、様々な温度パラメータで生成されたものと対応するものを検査する。
この軌跡の形状を検査することは幻覚のほとんどを検出するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:23:50 GMT)
SAGE: Structure-Aware Generative Video Transitions between Diverse Clips [7.5] 生成的なvidEo遷移は、微調整なしで滑らかで意味的に一貫した遷移を生成する。
SAGE(Structure-Aware Generative vidEo transitions)は、ラインマップとモーションフローを通じて提供される構造ガイダンスと生成合成を組み合わせたゼロショットアプローチである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:35:02 GMT)
Online Adaptation for Flying Quadrotors in Tight Formations [7.4] 複雑な空力的なウェイクインタラクションは、チームだけでなく、個々のチームメンバーを不安定にします。
適応型混合学習に基づく制御フレームワークであるL1 KNODE-DW MPCを提案する。
提案手法は, 飛行中, 近接して垂直に3つのクアッドロータを配置できることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:28:31 GMT)
How Many Ratings per Item are Necessary for Reliable Significance Testing? [7.4] 機械学習評価の基盤は、モデルと人間の反応が一元的、権威的、金標準のデータに対するモデルを評価するのに十分な信頼性を持つという仮定である。
我々は、(既存のまたは計画された)データセットが、信頼できるヌル仮説の統計的テストを保証するのに十分な応答を持っているかどうかを判断するために、メソッドを適用する。
我々の手法は、AI研究者がAI評価のためのデータ収集方法に関するより良い決定を下すのにどのように役立つかを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:25:28 GMT)
A Comprehensive Evaluation Framework for Synthetic Trip Data Generation in Public Transport [7.4] 合成データは、公共交通機関の研究でスマートカードデータを使用する際のプライバシーとアクセシビリティの課題に対して、有望な解決策を提供する。
本稿では,3つの相補的次元と3つの階層的レベルにまたがる合成旅行データを体系的に評価する枠組みを提案する。
結果として、合成データは本質的にプライバシを保証せず、"ワンサイズフィットオール"モデルは存在しないことが示される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:52:47 GMT)
Mars-Bench: A Benchmark for Evaluating Foundation Models for Mars Science Tasks [7.4] 他の領域における進歩の鍵となるのは、体系的な評価をサポートする標準化されたベンチマークが利用可能になったことである。
火星に関する幅広いタスクのモデルを体系的に評価するために設計された最初のベンチマークであるMars-Benchを紹介する。
我々は、自然画像、地球衛星データ、最先端のビジョン言語モデルに基づいて事前訓練されたモデルを用いて、標準化された、使用可能なデータセットとベースライン評価を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:34:08 GMT)
Robust Uncertainty Quantification for Self-Evolving Large Language Models via Continual Domain Pretraining [7.3] Conformal Prediction (CP)は、大きな言語モデルに対して正確性を保証することを約束している。
適応的な拒絶と非交換可能なCPフレームワークを導入する。
本フレームワークは,CDPシナリオ下でのCPの有効性と信頼性を両立させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:51:13 GMT)
AIRMap -- AI-Generated Radio Maps for Wireless Digital Twins [7.3] 超高速無線マップ推定のためのディープラーニングフレームワークを提案する。
AirMapはNVIDIA L40Sで、推論毎に5dB RMSE以下でパスゲインを予測する。
フィールド測定の20%しか使用していない軽量な移動学習校正は、中央値の誤差を約10%に削減する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:15:48 GMT)
Beyond MCQ: An Open-Ended Arabic Cultural QA Benchmark with Dialect Variants [7.2] 大きな言語モデル(LLM)は、日々の質問に答えるためにますます使われています。
文化的な基盤と方言のコンテンツに関する彼らのパフォーマンスは、言語間で不均一なままである。
本稿では,現代標準アラビア語(MSA)多重選択質問(MCQ)を英語およびいくつかのアラビア方言に翻訳する包括的手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:52:51 GMT)
Monitoring and Observability of Machine Learning Systems: Current Practices and Gaps [7.2] プロダクションマシンラーニング(ML)システムは、クラッシュではなく、間違った決定によって、静かに失敗します。
可観測性はML操作にとって重要であると認識されているが、実践者が実際に捉えるものに関する実証的な証拠が不足している。
本研究では,複数の領域における7つのフォーカスグループセッションを通じて,MLの可観測性に関する実証的な結果を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:31:08 GMT)
LittleBit: Ultra Low-Bit Quantization via Latent Factorization [7.2] 大規模言語モデル(LLM)は、かなりのメモリと計算コストの課題に直面していることが多い。
本稿では,極端LLM圧縮の新しい手法であるLittleBitを紹介する。
重量あたり0.1ビット(BPW)のレベルを目標としており、メモリの削減に約31ドル(約1,300円)かかります。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:57:14 GMT)
CFM-GP: Unified Conditional Flow Matching to Learn Gene Perturbation Across Cell Types [7.2] 細胞型非依存的遺伝子摂動予測法であるCFM-GPを提案する。
CFM-GPは、摂動遺伝子と摂動遺伝子発現の連続的、時間依存的な変換を学習する。
SARS-CoV-2感染, IFN-β刺激PBMCs, グリオ芽腫パノビノスタット, IFN-β刺激下でのループス, およびStatefate前駆者運命マッピングの5つのデータセットについて検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:55:43 GMT)
Telegrapher's Generative Model via Kac Flows [7.2] 本稿では,減衰波方程式に基づく新しい流れベース生成モデルを提案する。
フローマッチングの枠組みを用いて、速度場を近似したニューラルネットワークをトレーニングし、サンプル生成に使用する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:57:51 GMT)
FaRAccel: FPGA-Accelerated Defense Architecture for Efficient Bit-Flip Attack Resilience in Transformer Models [7.1] Forget and Rewire(FaR)方法論は、Transformerベースのモデル上でBit-Flip Attacks(BFA)に対して強力なレジリエンスを示した。
FPGA上に実装されたハードウェアアクセラレーションアーキテクチャであるFaRAccelを提案する。
FaRAccelは動的アクティベーションリルーチンのための再構成可能なロジックと、スイッチング構成の軽量ストレージを統合し、最小のエネルギーオーバーヘッドで低遅延推論を可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:27:09 GMT)
Statistical physics of deep learning: Optimal learning of a multi-layer perceptron near interpolation [7.1] 多層パーセプトロンの教師あり学習について検討する。
トレーニング可能なパラメータとデータの数が同等となる、困難な状況に注目します。
その単純さにもかかわらず、ベイズ最適設定は、深さ、非線形性、および有限幅がニューラルネットワークにどのように影響するかについての洞察を与える。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:34 GMT)
PULSE: Privileged Knowledge Transfer from Electrodermal Activity to Low-Cost Sensors for Stress Monitoring [7.0] 自己指導型事前学習においてのみEDAを利用するフレームワークを提案する。
このアプローチでは、エンコーダ出力を共有およびプライベートな埋め込みに分離する。
WESADでは, 強い応力検出性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:35:05 GMT)
Automatically Finding Rule-Based Neurons in OthelloGPT [6.9] OthelloGPTは、Othelloの有効な動きを予測するために訓練されたトランスフォーマーであり、解釈可能性の研究に理想的なテストベッドを提供する。
ルールベースのゲームロジックを符号化するニューロンを識別するために,決定木に基づく自動アプローチを提案する。
以上の結果から, 5層ニューロンの約半数は, コンパクトで規則に基づく決定木によって正確に記述できることが示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:23:52 GMT)
Learning to Attack: Uncovering Privacy Risks in Sequential Data Releases [6.9] 連続する出版物間の依存関係を利用して、攻撃者がシーケンシャルなデータリリースでプライバシーを侵害できるかどうかを検討する。
本稿では,Hidden Markovモデルと強化学習に基づく双方向推論機構を統合することで,これらのシーケンシャルな依存関係を捕捉する新たな攻撃モデルを提案する。
この結果から,個別に保護されたリリースが時間的解析を行うと,センシティブな情報を総合的に漏洩させるという,シーケンシャルなデータ公開に固有の基本的プライバシーリスクが明らかになった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:32:42 GMT)
Cyclic Counterfactuals under Shift-Scale Interventions [6.9] ほとんどの反事実推論フレームワークは非循環構造因果モデル(SCM)を前提としている。
シフトスケール介入による循環型SCMの反ファクト推論について検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:03:01 GMT)
Learning Provably Improves the Convergence of Gradient Descent [6.8] 最適化のために(L2O)ディープネットワークベースのソルバを最適化するために二次性を学ぶ。
我々は L2O が自身の収束フレームワークの理論的裏付けを欠いていることを示す。
理論的結果を支援するための決定論的戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:24:55 GMT)
Multimodal Dreaming: A Global Workspace Approach to World Model-Based Reinforcement Learning [6.7] 強化学習(Reinforcement Learning, RL)では、世界モデルはエージェントの行動に応じて環境がどのように進化するかを捉えることを目的としている。
潜在空間内での夢のプロセスの実行は、より少ない環境ステップでのトレーニングを可能にすることを示す。
我々は、GWとWorld Modelsの組み合わせは、RLエージェントの意思決定を改善する大きな可能性を秘めていると結論づける。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:49:07 GMT)
Galapagos: Automated N-Version Programming with LLMs [6.7] 大規模言語モデルを用いたプログラム変種の自動生成を提案する。
プログラムの変種を生成するツールであるGal'apagosを設計、開発、評価する。
我々は現実世界のCコードのN-Versionコンポーネントを作成することでGal'apagosを評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:34:26 GMT)
Interpretable Clustering with Adaptive Heterogeneous Causal Structure Learning in Mixed Observational Data [6.7] 教師なしのフレームワークであるHCLは、混合型観測データから潜在クラスタとその関連する因果構造を共同で推論する。
クラスタリングと構造学習の両方において優れた性能を発揮し、実世界の単一セル摂動データにおいて生物学的に意味のあるメカニズムを復元する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:32:34 GMT)
A Study on the Framework for Evaluating the Ethics and Trustworthiness of Generative AI [6.7] ChatGPTのような生成AIは、驚くべき革新的な可能性を示している。
これは同時に、偏見、有害性、著作権侵害、プライバシー侵害、幻覚などの倫理的・社会的懸念を提起する。
本研究は,社会的影響を反映した新たな人間中心基準の必要性を強調した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:53:52 GMT)
Aligning Large Language Models with Procedural Rules: An Autoregressive State-Tracking Prompting for In-Game Trading [6.6] LLM(Large Language Models)は、動的なゲーム間相互作用を可能にするが、ルールが支配するトレーディングシステムにおいて、必須の手続きフローに従わない。
本研究は, LLMの創造的柔軟性とゲーム内取引の手続き的要求の核心的緊張を解消する。
戦略的に組織されたプロンプトを中心とした方法論であるASTP(Autoregressive State-Tracking Prompting)が導入されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:26:34 GMT)
Schrödinger bridge for generative AI: Soft-constrained formulation and convergence analysis [6.6] いわゆるソフト拘束型シュリンガー橋問題(SCSBP)について検討する。
ペナルティが大きくなるにつれて、制御関数と値関数の両方が線形速度で古典的SBPのものと収束することが証明される。
これらの結果から,ソフト拘束ブリッジの定量的収束保証が得られた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:59:44 GMT)
Machine-Learning-Assisted Comparison of Regression Functions [6.5] 統計的推論の基本的な問題である回帰関数を比較するという古典的問題を再考する。
等回帰関数のヌル仮説を新たに特徴づけるカーネルベースの条件付き平均依存性の新たな概念を提案する。
フレキシブルな推定に近代的な機械学習手法を利用する2つの新しいテストを開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:59:15 GMT)
Disaggregation Reveals Hidden Training Dynamics: The Case of Agreement Attraction [6.5] 言語モデルは一般的に文法的なテキストを生成するが、特定の文脈で誤りを犯しやすい。
言語モデルにおける文法学習の中間段階をよりよく理解することは可能であることを示す。
言語モデルの振る舞いを解析するためにこのアプローチを採用することは、中間学習フェーズ、全体的なトレーニングダイナミクス、言語モデルによって学習された特定の一般化を理解するための強力なツールとなり得る、と我々は論じる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:59:26 GMT)
The Logical Expressiveness of Temporal GNNs via Two-Dimensional Product Logics [6.5] 時間的GNNの論理的特徴付けを二次元積論理に結合して検討する。
時間的GNNの表現力は,グラフと時間的成分の組み合わせによって異なることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:43:41 GMT)
From Memorization to Reasoning in the Spectrum of Loss Curvature [6.5] 記憶化は言語モデル (LM) と視覚変換器 (ViT) の両方の重みで切り離すことができることを示す。
本研究は,LMにおける下流タスクに対する編集手順の影響を広範囲に分析し,事実検索と算術が特に負の影響を受けることを明らかにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:09:35 GMT)
Nearest Neighbor Matching as Least Squares Density Ratio Estimation and Riesz Regression [6.4] Nearest Neighbor (NN)マッチングは、自動脱バイアス機械学習のためのRiesz回帰の例と解釈できる。
Lin et al. (2023) は、NNマッチングが新しい密度比推定器による密度比推定の例であることを示した。
Chernozhukov et al. (2024) は自動脱バイアス機械学習のためのリース回帰を開発する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:01:51 GMT)
FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching [6.4] 分子グラフ生成のためのフラグメントレベル離散フローマッチングによる新しい階層型フレームワークであるFragFMを紹介する。
FragFMはフラグメントレベルで分子を生成し、原子レベルで詳細を再構築するために粗いオートエンコーダを利用する。
また,現代分子グラフ生成モデルの天然物様分子生成能力を評価するための天然物生成ベンチマークも提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:12:05 GMT)
Language Model Behavioral Phases are Consistent Across Architecture, Training Data, and Scale [6.4] 自己回帰言語モデルでは, 事前学習の過程で, 行動の変化のパターンが極めて一貫したことを示す。
単語レベルでの言語モデル行動のばらつきの最大98%は、3つの単純な確率で説明できることがわかった。
これらの結果は、モデルの詳細に関係なく、ニューラル言語モデルにおける学習は同様の軌道に従う可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:51:01 GMT)
Adaptive Surrogate Gradients for Sequential Reinforcement Learning in Spiking Neural Networks [6.2] ニューロモルフィックコンピューティングシステムは、オーダー・オブ・マグニチュード効率向上を達成することで、エネルギー制約されたロボットに革命をもたらす。
スパイキングニューラルネットワーク(SNN)は、これらのシステムにとって有望なアルゴリズムアプローチであるが、複雑な制御タスクへの応用には2つの重要な課題がある。
本研究では,学習プロセスのブートストラップに特権的な指導方針を取り入れつつ,スパイクポリシーとオンライン環境の相互作用を生かしながら,新たな訓練手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:28:40 GMT)
An Adversarial-Driven Experimental Study on Deep Learning for RF Fingerprinting [6.1] 無線周波数(RF)フィンガープリントは、有望な物理層デバイス識別機構として登場した。
ディープラーニング(DL)手法はこの領域で最先端のパフォーマンスを実証している。
生の受信信号に対するDLモデルの訓練により,RF指紋と環境・信号パターンの特徴を絡み合わせる結果が得られた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:11:23 GMT)
A Comprehensive Survey on Surgical Digital Twin [6.1] 手術用デジタルツイン(英: surgery Digital Twins, SDT)は、手術前、手術中、および術後の医療において、意思決定を反映し、予測し、伝達する仮想のツインである。
SDTは、ヘテロジニアスイメージング、キネマティクス、生理学を厳格な遅延予算の下で融合させるという、永続的な課題に直面している。
この調査は、SDTの批判的で構造化されたレビューを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:13:47 GMT)
An unsupervised tour through the hidden pathways of deep neural networks [6.1] この論文は、教師なし学習ツールによる隠蔽表現の意味的内容の特徴付けに焦点を当てている。
第3章では、最先端のディープニューラルネットワークにおいて、隠れた層にまたがる確率密度の進化について検討する。
第4章では、ディープニューラルネットワークにおける一般化の問題について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:37:16 GMT)
GS4: Generalizable Sparse Splatting Semantic SLAM [6.0] GS4は、GSベースのセマンティックSLAMシステムである。
従来のアプローチと比較して、GS4は10倍速く動作し、ガウシアンを10倍少なく使用し、最先端のパフォーマンスを実現している。
実世界のScanNetとScanNet++ベンチマークの実験では、最先端のセマンティックSLAMのパフォーマンスが示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:40:02 GMT)
RL-AUX: Reinforcement Learning for Auxiliary Task Generation [5.9] 補助タスクを動的に作成するためのRLベースのアプローチを提案する。
このフレームワークでは、RLエージェントがトレーニングセット内の各データポイントに対する補助ラベルを選択する。
ウェイトラーニングのアプローチは、これらのベンチマーク全てを大幅に上回っています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:44:02 GMT)
Why Diffusion Models Don't Memorize: The Role of Implicit Dynamical Regularization in Training [5.9] 一般化から記憶への移行におけるトレーニングダイナミクスの役割について検討する。
私たちは、$tau_mathrmmem$がトレーニングセットサイズ$n$で線形的に増加するのに対して、$tau_mathrmgen$は一定であることに気付きました。
n$がモデル依存しきい値よりも大きくなると、無限のトレーニング時間でオーバーフィットが消える。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:54:07 GMT)
RegSpeech12: A Regional Corpus of Bengali Spontaneous Speech Across Dialects [5.8] ベンガル語は、南アジアやディアスポラスのコミュニティで広く話されている。
東ベンガル語、マンブミ語、ランプリ語、ヴァレンドリ語、ラーリ語の5つの主要な方言群が特定されている。
ベンガル方言の計算処理に関する研究は依然として限られている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:08:42 GMT)
Look and Tell: A Dataset for Multimodal Grounding Across Egocentric and Exocentric Views [5.7] 我々は、エゴセントリックな視点とエゴセントリックな視点をまたいだ参照コミュニケーションを研究するためのマルチモーダルデータセットであるLook and Tellを紹介した。
Meta Project Ariaスマートグラスと静止カメラを使って、25人の参加者がキッチンの材料を特定するようパートナーに指示した、同期した視線、スピーチ、ビデオを記録しました。
データセットには3.67時間の録音が含まれており、その中には2,707の注釈付き参照表現が含まれている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:39:14 GMT)
DualCap: Enhancing Lightweight Image Captioning via Dual Retrieval with Similar Scenes Visual Prompts [5.6] $DualCap$は、検索した類似した画像から視覚的なプロンプトを生成することで、視覚的な表現を強化する新しいアプローチである。
本モデルでは、テキストプロンプトの標準的な画像からテキストへの検索と、視覚的に類似したシーンを抽出するための新しい画像から画像への検索を併用する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:29:02 GMT)
Federated Learning with Partially Labeled Data: A Conditional Distillation Approach [5.6] 本稿では,条件付き蒸留を取り入れた新しいFLフレームワークであるConDistFLを提案する。
ConDistFLは、部分的にラベル付けされたデータセットから効果的な学習を可能にし、分散データセットと非一様データセットのセグメンテーション精度を大幅に改善する。
より優れたセグメンテーション性能に加えて、ConDistFLは計算と通信の効率を維持し、現実世界のアプリケーションにそのスケーラビリティを保証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:38:37 GMT)
SymMaP: Improving Computational Efficiency in Linear Solvers through Symbolic Preconditioning [5.5] シンボリックマトリックスプレコンディショニング(SymMaP)は、プリコンディショニングパラメータの効率的なシンボリック表現を学習する。
我々はニューラルネットワークを用いて、最適なパラメータを正確に予測できる表現のために高次元離散空間を探索する。
実験の結果、SymMaPは様々なベンチマークで従来の戦略を一貫して上回ります。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:25:03 GMT)
ADMN: A Layer-Wise Adaptive Multimodal Network for Dynamic Input Noise and Compute Resources [5.5] マルチモーダルディープラーニングシステムは、様々な計算資源の可用性と入力の質の変動に苦慮している。
両課題に対処可能なレイヤワイド適応深度マルチモーダルネットワーク ADMN を提案する。
評価の結果, ADMNは, 浮動小数点演算の75%を削減しつつ, 最先端ネットワークの精度を向上できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:37:03 GMT)
The Confidence Paradox: Can LLM Know When It's Wrong [5.4] Document Visual Question Answering (DocVQA)モデルは、しばしば過信または倫理的に不一致な応答を生成する。
重み付き損失とコントラスト学習を用いてモデルの信頼度と正しさを一致させるモデルに依存しない自己教師型フレームワークであるHonestVQAを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:19:32 GMT)
Experimental Demonstration of the Timelike Unruh Effect with a Trapped-Ion System [5.4] 基礎理論は、時間的なアンルー効果として知られる等価な熱応答が、加速のない特定の時間的な軌道に続く検出器に対して起こることを示している。
ここでは、捕捉されたイオンの量子系における時相的なウンルー効果の実証実験を報告する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:09:08 GMT)
UHKD: A Unified Framework for Heterogeneous Knowledge Distillation via Frequency-Domain Representations [5.4] クロスアーキテクチャ転送に周波数領域の中間的特徴を利用するフレームワークとして、統一不均一知識蒸留(UHKD)が提案されている。
CIFAR-100とImageNet-1Kの実験では、最新の手法よりも5.59%、0.83%向上した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:41:43 GMT)
Think Just Enough: Sequence-Level Entropy as a Confidence Signal for LLM Reasoning [5.4] 推論タスクにおいて,大規模言語モデルにおいてトークン効率を向上する新しいエントロピーベースのフレームワークを提案する。
提案手法では,トークンレベルのログプロブからのシャノンエントロピーを信頼信号として使用し,早期停止を実現する。
エントロピーに基づく信頼度キャリブレーションは,事前学習後の最適化の創発的特性を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:58:14 GMT)
Dark & Stormy: Modeling Humor in the Worst Sentences Ever Written [5.3] 本稿では,Bulwer-Lytton Fiction Contestの文の新たなコーパスを分析し,英語の「悪い」ユーモアをよりよく理解する。
標準的なユーモア検出モデルは私たちのコーパスでは不十分であり、文学機器の分析により、これらの文が既存のユーモアデータセットに共通する特徴を組み合わせることが判明した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:42:03 GMT)
Efficient Global-Local Fusion Sampling for Physics-Informed Neural Networks [5.3] 両手法の強みを組み合わせたグローバルローカル核融合(GLF)サンプリング戦略を提案する。
ガウス雑音を残差に対して逆スケールしたトレーニングポイントを摂動することで、新しいコロケーションポイントを生成する。
さらに計算オーバーヘッドを低減するために,大域的残差分布を近似するために,軽量線形サロゲートを導入する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:10:54 GMT)
Global Optimization of Gaussian Process Acquisition Functions Using a Piecewise-Linear Kernel Approximation [5.2] 本稿では,大域的獲得関数最適化のパラダイムとして混合整数 Kernel-MIQP について検討する。
提案した近似の理論的境界を解析し,その枠組みを実証的に実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:42 GMT)
DBLPLink 2.0 -- An Entity Linker for the DBLP Scholarly Knowledge Graph [5.2] 本稿では,DBLP の RDF ベースの知識グラフの 2025 バージョンに対するエンティティリンカを提案する。
2022年版と比較すると、DBLPは出版会場をdblp:Streamと呼ばれる新しいエンティティタイプと見なしている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:49:54 GMT)
ARIMA_PLUS: Large-scale, Accurate, Automatic and Interpretable In-Database Time Series Forecasting and Anomaly Detection in Google BigQuery [5.2] 時系列予測と異常検出は、小売、製造、広告、エネルギーといった産業の実践者にとって一般的な課題である。
ARIMA_PLUSは、(a)正確かつ解釈可能な時系列モデルと(b)スケーラブルで完全に管理されたシステムインフラストラクチャのユニークな組み合わせによって、これらの2つの課題を克服する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:18:50 GMT)
A Roadmap for Tamed Interactions with Large Language Models [5.1] 大規模言語モデル(LLM)によって駆動されるAI駆動ソフトウェアが誕生するのを私たちは目撃しています。
これらのLSMの応用は印象的であり、数え切れないほどに思えるが、その堅牢性は採用を妨げる。
LSLでは, LLM出力の制御, 相互作用の構造の強制, 検証, 検証, 説明可能性の両面を統合することで, 上記の限界に対処することを目指している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:46:07 GMT)
Fixed Point Neural Acceleration and Inverse Surrogate Model for Battery Parameter Identification [5.1] 電気化学電池モデルのパラメータ同定のためのディープラーニングに基づくフレームワークを提案する。
提案フレームワークは, 単一粒子モデルのニューラルサロゲートモデルと電解質 (NeuralSPMe) と深層学習に基づく固定点反復法を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:20:38 GMT)
Hammering the Diagnosis: Rowhammer-Induced Stealthy Trojan Attacks on ViT-Based Medical Imaging [5.1] 本稿では,Rowhammerハードウェア障害注入とニューラルトロイの木馬攻撃を組み合わせて,VTベースの医用画像システムの整合性を損なう新たな脅威モデルであるMed-Hammerを提案する。
その結果,MobileViT と SwinTransformer の攻撃成功率は 82.51% と 92.56% である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:17:35 GMT)
Multi-Agent Scenario Generation in Roundabouts with a Transformer-enhanced Conditional Variational Autoencoder [5.1] ラウンドアバウンドにおけるマルチエージェントトラフィックシナリオを生成するために,Transformer-enhanced Conditional Autoencoder (CVAE-T) モデルを提案する。
この結果から,提案モデルでは,オリジナルのシナリオを正確に再構築し,現実的で多様な合成シナリオを生成できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:36:52 GMT)
The Sign Estimator: LLM Alignment in the Face of Choice Heterogeneity [5.0] 従来のアライメント手法は、人間の嗜好の不均一性に対して脆弱である。
そこで我々は,手話推定器という,シンプルで,確実に一貫性があり,効率的な推定器を提供する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:42:38 GMT)
ResNet: Enabling Deep Convolutional Neural Networks through Residual Learning [4.9] ResNetは、数百のレイヤによるネットワークのトレーニングを可能にする。
CIFAR-10データセットの実装では、ResNet-18は89.9%の精度を達成している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:36:15 GMT)
Adaptive Anomaly Detection in Network Flows with Low-Rank Tensor Decompositions and Deep Unrolling [4.9] 異常検出(AD)は、将来の通信システムのレジリエンスを確保するための重要な要素として、ますます認識されている。
この研究は、不完全測定を用いたネットワークフローにおけるADについて考察する。
本稿では,正規化モデル適合性に基づくブロック帰属凸近似アルゴリズムを提案する。
ベイズ的アプローチに触発されて、我々はモデルアーキテクチャを拡張し、フローごとのオンライン適応とステップごとの統計処理を行う。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:59:49 GMT)
Teaching LLMs to Abstain via Fine-Grained Semantic Confidence Reward [4.9] 大規模言語モデル(LLM)における幻覚の緩和は、信頼性の高いデプロイメントにおいて重要である。
我々は,$textbfunderlineFine-fine underline Semantic UnderlineConfidence underlineReward (Ours) に基づく新しい強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:00:35 GMT)
CURATRON: Complete and Robust Preference Data for Rigorous Alignment of Large Language Models [4.9] 本稿では,大規模言語モデルと人間の価値観を協調する上での課題について考察する。
本稿では,LLMのレジリエンスを高めるために,堅牢で悪意のあるAIパイプラインデータセットを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:31:06 GMT)
DP-LLM: Runtime Model Adaptation with Dynamic Layer-wise Precision Assignment [4.9] DP-LLMは入力値に基づいて各層に動的に精度を割り当てる機構である。
DP-LLMは,従来の手法よりも優れた性能・遅延トレードオフを実現することを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:34:36 GMT)
Physics-Inspired Gaussian Kolmogorov-Arnold Networks for X-ray Scatter Correction in Cone-Beam CT [4.8] コーンビームCT(CBCT)は平らなパネル検出器を用いて高解像度の3次元イメージングを実現する。
CBCTは、再構成画像におけるCT値バイアスと組織コントラストの低下をもたらすデータ取得時に散乱を受けやすい。
本研究では,物理先行知識に触発された深層学習に基づく散在物補正手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:13:14 GMT)
Benchmarking Microsaccade Recognition with Event Cameras: A Novel Dataset and Evaluation [4.5] マイクロサケードは、視覚知覚や神経処理に不可欠な小さな不随意眼球運動である。
イベントベースのセンシングは、微細な時間変化を効率的にキャプチャすることで、高速で低レイテンシな代替手段を提供する。
このデータセットは、認知コンピューティングにおける小さな眼球運動ダイナミクスの研究を支援する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:41:30 GMT)
Text Simplification with Sentence Embeddings [4.5] 高複雑さと低複雑さのテキストを表す文埋め込みの変換を学習する。
文埋め込み空間における学習変換は将来の研究にとって有望な方向であると結論付けている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:41:10 GMT)
Bridging Simulators with Conditional Optimal Transport [4.5] 未ペアシミュレーションデータセットを用いて2つのシミュレータをブリッジするフィールドレベルの新しいエミュレータを提案する。
我々は、変換がデータの基盤構造を最小限に歪ませることを保証するために、最適輸送フローマッチングを採用する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:59:42 GMT)
Structure, Optimality, and Symmetry in Shadow Unitary Inversion [4.5] 未知のユニタリ演算を反転させる能力は、量子コンピューティングにおいて基本的な役割を果たす。
キュービット単位のシャドーインバージョンのための決定論的プロトコルを提案する。
第二に、固定された量子ビットオブザーバブルの下での立方体シャドウインバージョンのための実現可能な量子演算の完全なキャラクタリゼーションを提供する。
第三に、quditの場合、シャドーユニタリ反転シーケンシャルプロトコルを最適化するための半定値プログラミングの枠組みを与える。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:28:07 GMT)
Conformational Rank Conditioned Committees for Machine Learning-Assisted Directed Evolution [4.5] ランク構成を利用してランクごとにディープニューラルネットワーク委員会を割り当てるランク条件委員会(RCC)フレームワークを導入する。
我々は,SARS-CoV-2抗体ドッキングに対するアプローチを検証し,ベースライン戦略よりも有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:13:37 GMT)
Fill in the Blanks: Accelerating Q-Learning with a Handful of Demonstrations in Sparse Reward Settings [4.4] スパース・リワード環境における強化学習(RL)は、情報的フィードバックが欠如しているため、依然として重要な課題である。
本稿では,RLエージェントの値関数を初期化するために,少数の成功例を用いた簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:01:13 GMT)
Navigation with VLM framework: Towards Going to Any Language [4.4] 視覚言語モデル(VLM)は、言語データと視覚データの両方で推論できる顕著な能力を示している。
本稿では,オープンソースのVLMを活用したトレーニングフリーフレームワークであるNavigation with VLM(NavVLM)を紹介し,ロボットが効果的にナビゲートできるようにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:45:04 GMT)
A Dual-Branch CNN for Robust Detection of AI-Generated Facial Forgeries [4.3] 顔偽造技術は、AIセキュリティ、デジタルメディアの完全性、および公的な信頼に重大な脅威をもたらす。
顔偽造検出のための新しい二分岐畳み込みニューラルネットワークを提案する。
4つの代表法から生成された鍛造画像を含むDiFFベンチマークを用いて,本モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:06:40 GMT)
Sub-Terahertz Spin Relaxation Dynamics of Boron-Vacancy Centers in Hexagonal Boron Nitride [4.3] 負電荷のホウ素空孔は、0.2テラヘルツまでの緩和に基づく量子センサとして機能することを示す。
それらの均一なスピン配向と高磁場での持続的なスピンコントラストは、固有のスピン緩和を直接測定することができる。
これらの結果は、サブテラヘルツ高磁場状態における量子センシングのための汎用プラットフォームとして$mathrmV_B-$centerを確立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:09:09 GMT)
Learning Wireless Interference Patterns: Decoupled GNN for Throughput Prediction in Heterogeneous Multi-Hop p-CSMA Networks [4.3] Decoupled Graph Convolutional Network (D-GCN)は、ノードの送信確率の処理を近隣の干渉効果から明確に分離する新しいアーキテクチャである。
D-GCNは3.3%のNMAEを達成し、強力なベースラインを上回り、正確な解析手法が計算的に実現不可能になった場合でも、依然として引くことができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:11:02 GMT)
Exploration of Summarization by Generative Language Models for Automated Scoring of Long Essays [4.2] 本研究では,要約とプロンプトによる長いエッセイの自動採点のための生成言語モデルについて検討する。
その結果,QWKによる評価精度は,学習機関自動評価2.0データセットでは0.822から0.8878に向上した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:43:58 GMT)
Benchmarking AI Models in Software Engineering: A Review, Search Tool, and Unified Approach for Elevating Benchmark Quality [4.2] 2014年以降、273のAI4SEベンチマークを識別する247の研究のレビューを行う。
それらを分類し、現在のプラクティスのギャップを露呈し、適切なベンチマークを見つけるためのセマンティック検索ツールであるBenchScoutを紹介します。
参加者22名のユーザスタディにおいて、BenchScoutは、ユーザビリティ、有効性、直感性を4.5、4.0、そして5.1で達成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:40:52 GMT)
Approximating the universal thermal climate index using sparse regression with orthogonal polynomials [4.0] 本稿では、UTCI(Universal Climate Thermal Index)の分析と近似のための新しいデータ駆動モデリング手法について考察する。
本稿では,関数近似の解釈・効率的な手法として,記号的・スパース的回帰手法について検討する。
また,本モデルでは,広く使用されている6次2乗ベンチマークよりも根平均2乗損失が有意に低いことを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 23:09:56 GMT)
Task-Agnostic Fusion of Time Series and Imagery for Earth Observation [4.0] 本稿では,時系列と単一タイムスタンプ画像のマルチモーダル融合のためのタスク非依存フレームワークを提案する。
本手法は時系列量子化のための決定論的および学習戦略を探索する。
我々のモデルは衛星画像から一貫した地球温度分布を生成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:10:07 GMT)
Is It Certainly a Deepfake? Reliability Analysis in Detection & Generation Ecosystem [4.0] ディープフェイク検出器の包括的不確実性解析を行った。
生成アーティファクトが予測信頼性に与える影響について検討する。
我々の観測に基づいて、不確実性多様体は、深い震源検出のために不確実性を利用するのに十分な一貫性のある情報を保持する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:32:18 GMT)
Learning Individual Movement Shifts After Urban Disruptions with Social Infrastructure Reliance [4.0] ディスラプティブな出来事に続く個々のムーブメントパターンの変化は、コミュニティリソースに対する要求の変化を明らかにします。
本研究では、個人の社会基盤のレジリエンス(SIR)を条件付きディープラーニングモデルに組み込んで、個々の動きパターンと局所的な空間的文脈との間の複雑な関係を捉える。
実験により、個人のSIRと空間コンテキストを取り入れることで、モデルが活動後の個々の動きパターンを予測する能力を高めることが示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:44:55 GMT)
LLMLogAnalyzer: A Clustering-Based Log Analysis Chatbot using Large Language Models [4.0] システムログはサイバーセキュリティの基盤であり、積極的な侵害防止と事故後の調査をサポートする。
大量のログデータを解析することは、高いコスト、社内の専門知識の欠如、時間制約など、多くの組織にとって基本的な分析が難しいため、依然として非常に難しい。
本研究では、機械学習ベースのログ分析フレームワークであるLLMLogAnalyzerを紹介する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:29:55 GMT)
Pie: A Programmable Serving System for Emerging LLM Applications [3.9] Pieは、柔軟性と効率性のために設計されたプログラム可能なサービスシステムである。
従来の生成ループを、API経由で公開されたきめ細かいサービスハンドラに分解する。
WebAssemblyを使ってInferletを実行し、その軽量なサンドボックスの恩恵を受ける。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:17:55 GMT)
Fast and accurate neural reflectance transformation imaging through knowledge distillation [3.8] 反射率変換イメージング(RTI)は、表面を視覚的に解析する能力で非常に人気がある。
PTM(Polynomial Texture Maps)やHSH(Hemispherical Harmonics)といった従来の手法はコンパクトで高速である。
知識蒸留(DisK-NeuralRTI)に基づく新しい解法により計算コストを削減することを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:00:07 GMT)
Mitigating Hallucination in Large Language Models (LLMs): An Application-Oriented Survey on RAG, Reasoning, and Agentic Systems [3.8] 幻覚は、大きな言語モデルの信頼できるデプロイにおける重要な障害の1つです。
Retrieval-Augmented Generation (RAG) と推論の強化は、最も効果的で広く採用されているアプローチの2つとして現れている。
この調査はアプリケーション指向の視点を採用して、RAG、推論の強化、およびエージェントシステムへの幻覚への統合について分析する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:48:57 GMT)
Federated Structured Sparse PCA for Anomaly Detection in IoT Networks [3.8] そこで本研究では,IoTネットワークにおける異常に対する新しい主成分分析手法を提案する。
提案モデルでは, $ell_2, $Pnormin [0,1) が支配する空間正規化を統合する。
我々は、交互に構成された近近距離設定に基づく効率的な最適化アルゴリズムを考案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:55:22 GMT)
Conflict Adaptation in Vision-Language Models [3.8] 人間の認知制御の象徴はコンフリクト適応(コンフリクト適応)である。
逐次Stroopタスクを用いて、13の視覚言語モデル(VLM)のうち12が競合適応と整合した振る舞いを示した。
この動作の表現的基盤を理解するために,InternVL 3.5 4Bにおけるタスク関連スーパーノードの同定にスパースオートエンコーダ(SAE)を用いる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:05:32 GMT)
Can LLMs Translate Human Instructions into a Reinforcement Learning Agent's Internal Emergent Symbolic Representation? [3.7] 大規模言語モデル(LLM)が人間の自然言語命令を内部の記号表現に翻訳できるかどうかを検討する。
本研究では,異なる内部シンボル分割における翻訳性能の測定に構造化評価フレームワークを適用した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:13:43 GMT)
A comparison between joint and dual UKF implementations for state estimation and leak localization in water distribution networks [3.7] 本稿では,Unscented Kalman Filter(UKF)に基づく2つのデータ駆動状態推定法の比較を行う。
1つのアプローチは1つの推定子を持つ結合状態ベクトルを使い、もう1つは2重推定子スキームを使用する。
L-TOWNベンチマークのいくつかの評価結果を示し、実際の実装でそれらの特性を議論することを可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:39:41 GMT)
DeepRTE: Pre-trained Attention-based Neural Network for Radiative Transfer [3.7] 我々は、定常放射移動方程式(RTE)に対処するために、DeepRTEと呼ばれる新しいニューラルネットワークアプローチを提案する。
我々のDeepRTEフレームワークは定常RTEの解法に優れた計算効率を示す。
DeepRTEは、特にマルチヘッドアテンションなどのメカニズムが組み込まれているため、パラメータが大幅に少ない高い精度を実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:36:40 GMT)
Hybrid Cavity-Magnon Optomechanics: Tailoring Bipartite and Tripartite Macroscopic Entanglement [3.7] キャビティ-マグノン光学は本質的に光子とフォノンの間の非線形相互作用を与える。
本稿では,キャビティ-マグノン光学における多様な二分極と三分極の絡み合いを実現することを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:32:33 GMT)
Tight Generalization Bound for Supervised Quantum Machine Learning [3.7] 我々は、広範囲の教師付きタスク、データ、モデルに適用可能な量子機械学習の厳密な一般化を導出する。
私たちの境界は、効率的に計算可能であり、Big-O表記は不要です。
ラベルが完全にランダム化されている場合でも、我々の厳密な一般化上限が成り立つことを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:13:44 GMT)
Evaluating LLMs on Generating Age-Appropriate Child-Like Conversations [3.7] 大規模言語モデル(LLM)は、主に成人の会話データに基づいて訓練され、特定のアプリケーションのための真正な子供のような対話を生成する際の課題に直面している。
5歳,9歳児を対象に,5種類のLDMを比較検討し,年齢に合ったノルウェー語会話を生成させた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:00:52 GMT)
VeriStruct: AI-assisted Automated Verification of Data-Structure Modules in Verus [3.7] We introduced VeriStruct, a framework that a AI-assisted verification from single function to more complex data structure module in Verus。
11つのRustデータ構造モジュールの評価において、VeriStructは11つ中10つで成功し、合計で129の関数(99.2%)のうち128つを検証できた。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:28:37 GMT)
Do predictability factors towards signing avatars hold across cultures? [3.6] 本研究は, 内在的・外因的要因が, 文化全体にわたるアバターに対する態度の予測にどの程度寄与するかを検討した。
難聴者(57名)、聴力者(20名)、難聴者(3名)の3グループを対象に調査を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:08:46 GMT)
AI for a Planet Under Pressure [3.6] 本報告はストックホルムレジリエンスセンター(ストックホルム大学)、ポツダム気候影響研究研究所(PIK)、Google DeepMindの協力によるものである。
我々の研究は、AIを8つの幅広い持続可能性課題に対処するための研究手法として使う可能性と限界を探求する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:50:45 GMT)
Selective Parallel Loading of Large-Scale Compressed Graphs with ParaGrapher [3.6] ParaGrapherは、大規模および圧縮されたグラフをロードするための高性能なAPIとライブラリである。
本稿ではParaGrapherの設計とグラフ圧縮の性能モデルを提案する。
評価の結果,ParaGrapherはロード時の最大3.2倍,エンドツーエンド実行時の最大5.2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:29:09 GMT)
SLIP-SEC: Formalizing Secure Protocols for Model IP Protection [3.5] 大言語モデル(LLM)は知的財産(IP)を表す。
これらのモデルを部分的に信頼または安全でないデバイスにデプロイすると、モデル盗難のかなりのリスクが生じる。
本稿では,信頼できないリソースと信頼できないリソースの計算を分割するハイブリッド推論プロトコルSLIPの正式なフレームワークとセキュリティ基盤について述べる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:59:11 GMT)
Adaptive Spatio-Temporal Graphs with Self-Supervised Pretraining for Multi-Horizon Weather Forecasting [3.5] 本稿では、時間的構造を利用して多変量気象予測を改善する自己教師型学習フレームワークを提案する。
提案手法は従来の数値予測天気(NWP)モデルと比較して優れた性能を示す。
このフレームワークは、将来のデータ駆動気象システムに対してスケーラブルでラベル効率のよいソリューションを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:52:15 GMT)
Unsupervised local learning based on voltage-dependent synaptic plasticity for resistive and ferroelectric synapses [3.5] 覚醒性シナプスにおける教師なしおよび局所学習のための効率的なアプローチとして,電圧依存型シナプス可塑性(VDSP)を導入した。
複雑なパルス整形回路を必要としないオンライン学習を可能にする。
本稿では,VDSPを3種類のメムリシティブデバイスに適用する方法について述べる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:47:26 GMT)
Evaluation of Geographical Distortions in Language Models [3.5] 本研究は地理的知識に関するバイアスに焦点を当てる。
地理モデルと言語モデルとの関係を,空間情報を誤表現する傾向を強調して検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:44:48 GMT)
MSRANetV2: An Explainable Deep Learning Architecture for Multi-class Classification of Colorectal Histopathological Images [3.5] 大腸癌(CRC)は、世界中のがん関連死亡率の高い疾患である。
ディープラーニングアルゴリズムは、診断精度と効率を高めるための強力なアプローチとなっている。
大腸組織像の分類に最適化されたMSRANetV2という畳み込みニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:22:34 GMT)
Linear regression with overparameterized linear neural networks: Tight upper and lower bounds for implicit $\ell^1$-regularization [3.5] 過パラメータ線形回帰問題に対する深度Dge 2$の対角線形ニューラルネットワークの暗黙正則化について検討した。
D ge 3$ の場合、誤差は$alpha$ で線形的に減少するが、$D=2$ の場合、$alpha1-varrho$ で減少する。
数値実験は、我々の理論的な発見を裏付け、より深いネットワーク、すなわち$D ge 3$がより良い一般化をもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:49:08 GMT)
Quantum phase transitions and entanglement entropy in a non-Hermitian spin-boson system [3.5] 非エルミート結合を持つスピンボソン系の興味深い性質について述べる。
我々は、各不変部分空間上のスピンボソンエンタングルメントエントロピーを計算し、2つの位相が異なるエンタングルメントエントロピープロファイルによって区別可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:22:42 GMT)
From Time and Place to Preference: LLM-Driven Geo-Temporal Context in Recommendations [3.4] ほとんどのレコメンデーションシステムは、タイムスタンプを、休日、イベント、季節パターンといった現実世界のコンテキストを見渡す、数値的または循環的価値として扱う。
本稿では,大規模言語モデル(LLM)を用いて,タイムスタンプと粗い位置のみから時空間埋め込みを生成するスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:57:23 GMT)
GenTrack: A New Generation of Multi-Object Tracking [3.3] 本稿では,GenTrackと呼ばれる新しいマルチオブジェクトトラッキング手法を提案する。
フレキシブルかつ決定論的な追跡手法を使用して、未知数と時間変化のターゲットを堅牢に処理する。
GenTrackは、最先端トラッカーと比較して、標準的なベンチマークと実世界のシナリオで優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:13:20 GMT)
A Hybrid Approach for Visual Multi-Object Tracking [3.3] 本稿では,非線形力学下での未知および時間変化対象数の整合性を確保するために,視覚的多対象追跡手法を提案する。
粒子フィルタは非線形力学と非ガウス雑音に対処し、粒子最適化(PSO)の支援により粒子を状態分布モードへ誘導する。
ターゲット状態のスムーズな更新と識別の保存のための新しいスキームが提案されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:22:24 GMT)
From Narrative to Action: A Hierarchical LLM-Agent Framework for Human Mobility Generation [3.2] 大きな言語モデル(LLM)は潜在的な可能性を示すが、厳密な構造的コンプライアンスと創造的推論のバランスをとるのに苦労する。
本研究では,ハイレベルな物語推論,中間レベルのリフレクティブプランニングを統合した階層型LLM-Agentフレームワークを提案する。
本研究では,データ駆動型パラダイムから空間駆動型シミュレーションへの合成モビリティ生成を推し進める。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:26:36 GMT)
Local Performance vs. Out-of-Distribution Generalization: An Empirical Analysis of Personalized Federated Learning in Heterogeneous Data Environments [3.2] 本研究は,その局所的性能と一般化能力の両方を包含して,フェデレートラーニングアプローチを徹底的に評価することを含む。
本稿では、FLIU (Federated Learning with individualized Updates) に指定されたFedAvgの修正手法を提案し、適応的パーソナライゼーション係数でアルゴリズムをパーソナライゼーションステップで拡張する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:15:14 GMT)
Advancing site-specific disease and pest management in precision agriculture: From reasoning-driven foundation models to adaptive, feedback-based learning [3.2] 作物における部位特異的疾患管理(SSDM)は、リアルタイムコンピュータビジョンのための機械学習とディープラーニング(MLとDL)を通じて急速に進歩している。
本稿では,大規模言語モデル (LLMs) と視覚言語モデル (VLMs) に焦点を当てた,SSDM用FMアプリケーションに関する約40の論文を概説する。
適応学習(AL)、強化学習(RL)、ターゲット噴霧のためのデジタルツインフレームワークについて検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:16:47 GMT)
Quantum capacity amplification via privacy [3.1] 本稿では,Choi-Jamiolkowski演算子がプライベート状態であるプライベートチャネルを経由した量子容量の超付加性について検討する。
この観点は、プライベート状態のセキュリティ構造と量子容量を結びつけ、シールドシステムの役割を明確にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:47:53 GMT)
TIDMAD: Time Series Dataset for Discovering Dark Matter with AI Denoising [3.0] ダークマターの起源は 現代物理学において 最も重要な問題の一つです
ABRACADABRA実験は特に暗黒物質を探索するために設計された。
このデータリリースは、コアAIアルゴリズムがダークマター信号を抽出し、実際の物理結果を生成することを可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:03:25 GMT)
The high-dimension limit of characters of compact reductive Lie groups and restrictions on the production of quantum randomness [3.0] G$ が単純であれば、単位元以外の極限は消えることを示す。
半単純群に対しては、すべての単純成分の既約表現の次元が無限大になるという追加の仮定の下で同じ結果が得られる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:50:58 GMT)
Jacobi-Anger Density Estimation for Energy Distribution of Quantum States [3.0] 本稿では、この難易度を克服するために、非パラメトリックな量子インスパイアされた手法であるJacobi-Anger Density Estimation (JADE)を紹介する。
我々は,分子系の量子状態のエネルギー分布を正確に再現できることを実証した。
本研究は, JADEを実用量子システムのための強力で汎用的なツールであり, 地中エネルギー推定や関連応用を著しく向上させる可能性を示すものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:30:39 GMT)
The Divine Software Engineering Comedy -- Inferno: The Okinawa Files [3.0] 2024年6月,私は沖縄でソフトウェア工学シンポジウムを共同で開催した。
FUSEは、SEのために実際に未来があるかどうかの3日間のマラソンになった。
どこに向かっているのか話し合うために集まった素晴らしい人たちに耳を傾け、私たちの方向に向かっている3つの悪夢を蒸留しました。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:54:54 GMT)
From Language to Action: A Review of Large Language Models as Autonomous Agents and Tool Users [2.8] 本稿では,大規模言語モデルを用いた自律型エージェントとツールユーザの開発状況について概説する。
LLMエージェントのアーキテクチャ設計原則を構造化分析し,アプリケーションを単一エージェントおよびマルチエージェントシステムに分割する。
我々はLSMの検証可能な推論、自己改善能力、LSMをベースとしたエージェントのパーソナライズに関する批判的な知見を同定した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:52:29 GMT)
Survey and Tutorial of Reinforcement Learning Methods in Process Systems Engineering [2.7] 本稿では,プロセスシステム工学コミュニティに適したRL手法に関する調査とチュートリアルを紹介する。
我々はRLに関するチュートリアルを公開し、価値ベース、ポリシーベース、アクター批判的手法を含む基本的な概念と重要なアルゴリズムファミリーについて紹介する。
フィードバッチや継続的プロセス制御、プロセス最適化、サプライチェーンなど、様々なPSEドメインにまたがるこれらのRL技術の既存の応用について調査する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:31:12 GMT)
The Software Diversity Card: A Framework for Reporting Diversity in Software Projects [2.7] ソフトウェアプロジェクトの多様性に関する報告は、ユーザ信頼を高め、規制当局が採用を評価するのを支援します。
最近のAI指令には、開発中に多様性情報を委任する条項が含まれており、公共規制機関の関心の高まりを強調している。
この研究は、ソフトウェアプロジェクト内の多様性に関連する側面を文書化し、共有するための構造化されたアプローチであるSoftware Diversity Cardを紹介します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:15:09 GMT)
Efficient magic state cultivation with lattice surgery [2.7] マジック状態蒸留は、フォールトトレラント量子計算において重要な役割を果たす。
伝統的な論理レベルの蒸留は、物理ゲートによる直接的な実装を可能にすることによって、大幅なオーバーヘッド削減を提供する。
マジックステート栽培は、正方形グリッド接続と互換性のある最先端の物理レベルの蒸留プロトコルである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:34 GMT)
Kineo: Calibration-Free Metric Motion Capture From Sparse RGB Cameras [2.7] アンカロライズされていないRGBカメラで撮影したビデオから、マーカーレスモーションキャプチャーのための、完全に自動でキャリブレーションのないパイプラインであるKineoを提示する。
自信駆動型キーポイントサンプリング戦略とグラフに基づくグローバル最適化を組み合わせることで、列長に依存しない固定計算コストでロバストなキャリブレーションが保証される。
Keinoはカメラ翻訳誤差を83~85%、カメラ角誤差を86~92%、世界平均結合誤差(W-MPJPE)を83~91%削減する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:30:47 GMT)
Systematic construction of asymptotic quantum many-body scar states and their relation to supersymmetric quantum mechanics [2.7] 量子多体散乱(AQMBS)状態を構築するための体系的手法を開発した。
AQMBS状態は量子多体散乱(QMBS)状態と密接に関連しているが、それらは重要な違いを示す。
我々の定式化は、QMBSと超対称性(SUSY)量子力学の関連を明らかにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:47:52 GMT)
Enhancing Hierarchical Reinforcement Learning through Change Point Detection in Time Series [2.6] 本稿では、自己教師型トランスフォーマーベースの変更点検出(CPD)モジュールをOption-Criticフレームワークに統合する新しいアーキテクチャを提案する。
CPDモジュールは、内在的な信号から派生した擬似ラベルを用いて、外部監視なしで環境ダイナミクスの潜伏シフトを推測する訓練を行う。
フォー・ルームとピンボール・タスクの実験では、PD誘導剤は加速収束、累積リターンの向上、オプション特殊化の大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:34:23 GMT)
Fast algorithms enabling optimization and deep learning for photoacoustic tomography in a circular detection geometry [2.5] 光音響トモグラフィーおよび他のいくつかの結合された物理量モダリティに起因する逆元問題はしばしば反復アルゴリズムによって解決される。
前方および隣接作用素の数値評価のための新しいアルゴリズムを提案する。
アルゴリズムと計算例のPython実装が一般に公開されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:49:31 GMT)
Politically Speaking: LLMs on Changing International Affairs [2.5] LLMが生成した出力は、明示的な異なる役割割り当てにもかかわらず、どの程度収まるのか?
批判の中心は、中国、イラン、ロシア、米国の政治について話す際、欧米で使われるオシライズされた政治用語を緩和する事前訓練されたモデルである。
その結果、イランと中国に関する4つのモデルから生成されたAIの談話は、OpenAI GPT、Google Gemini、Histropic Claude、DeepSeekを含む4つのモデルの中で最も均質で変化しない。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:15:17 GMT)
Querying Inconsistent Prioritized Data with ORBITS: Algorithms, Implementation, and Experiments [2.5] 優先順位付けされた知識ベース上で不整合耐性問合せ応答を行うための実用的なアルゴリズムについて検討する。
最適補修の2つの概念に基づく3つのよく知られた意味論(AR, IAR, 勇敢)を考える(パレート, 完成)。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:48:36 GMT)
MsEdF: A Multi-stream Encoder-decoder Framework for Remote Sensing Image Captioning [2.4] リモートセンシング画像には複雑な空間パターンや意味構造が含まれており、キャプションモデルを正確に記述することは困難である。
空間表現と言語生成の両方を最適化することにより、RSICの性能を向上させる新しいマルチストリームデコーダフレームワーク(MsEdF)を提案する。
3つのベンチマークRSICデータセットの実験は、MsEdFがいくつかのベースラインモデルより優れていることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:40:41 GMT)
Human-Level Reasoning: A Comparative Study of Large Language Models on Logical and Abstract Reasoning [2.4] 本研究では,Large Language Models (LLM) の論理的および抽象的推論スキルを8つのカスタム設計の推論質問を用いて比較した。
結果は、同じタスクにおける人間のパフォーマンスに対してベンチマークされ、大きな違いと、LLMが推論に苦しむ領域を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:02:58 GMT)
FT-ARM: Fine-Tuned Agentic Reflection Multimodal Language Model for Pressure Ulcer Severity Classification with Reasoning [2.4] 圧力潰瘍(PUs)は重篤かつ一般的な医療上の問題である。
PU重症度(Stages I-IV)の正確な分類は適切な治療に不可欠である。
PU重度分類のためのエージェント自己回帰機構を備えた細調整多モード大言語モデル(MLLM)であるFT-ARMを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:23:32 GMT)
Generative Large Language Models (gLLMs) in Content Analysis: A Practical Guide for Communication Research [2.4] 生成型大規模言語モデル (gLLM) は、コンテンツ分析のためのコミュニケーション研究にますます利用されている。
これらの可能性にもかかわらず、通信研究の方法論的ツールキットへのgLLMの統合はまだ未開発である。
本稿では,gLLMを用いた量的コンテンツ分析に関する最近の研究を合成し,これらの課題をナビゲートするための総合的ベストプラクティスガイドを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:01:43 GMT)
LuxIT: A Luxembourgish Instruction Tuning Dataset from Monolingual Seed Data [2.4] LuxITは、この課題を緩和するために開発されたLuxembourgishのための新しい単言語命令チューニングデータセットである。
我々は,Luxembourgishの習熟度を示すために選択されたDeepSeek-R1-0528を用いて,Luxembourgish原文のコーパスからデータセットを合成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:02:55 GMT)
A Practitioner's Guide to Kolmogorov-Arnold Networks [2.3] Kolmogorov-Arnold Networks (KANs) は、従来のマルチレイヤーパーセプトロン(MLP)に代わる有望な代替品として登場した。
本総説は,急速に拡大するKANSAの景観を体系的かつ包括的に概観するものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:03:44 GMT)
Serving LLMs in HPC Clusters: A Comparative Study of Qualcomm Cloud AI 100 Ultra and NVIDIA Data Center GPUs [2.3] 本研究では,大規模言語モデル(LLM)推論のためのQualcomm Cloud AI 100 Ultra (QAic)アクセラレータのベンチマーク解析を行う。
合計12のオープンソース LLM は、1億1400万から700億のパラメータで、vLLMフレームワークを使用して提供されている。
分析の結果,QAicはより粒度の細かいハードウェアアロケーションを実現しつつ,特定のモデルに有利な競争エネルギー効率を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:58:55 GMT)
CLFSeg: A Fuzzy-Logic based Solution for Boundary Clarity and Uncertainty Reduction in Medical Image Segmentation [2.3] 本稿では,Fuzzy-Convolutional (FC)モジュールを集約するエンコーダデコーダベースのフレームワークであるCLFSegを紹介する。
このモジュールは、境界領域における不確実性、ノイズ、あいまいさを最小限にしながら、局所的特徴とグローバルな特徴を識別し、セグメンテーション性能を向上させる。
提案モデルでは,CVC-ColonDB,CVC-ClinicDB,EtisLaribPolypDB,ACDCの4つの公開データセットに対して,例外的な性能を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:06:27 GMT)
Tree Ensemble Explainability through the Hoeffding Functional Decomposition and TreeHFD Algorithm [2.2] データサンプルからツリーアンサンブルのHoeffding分解を推定するために、TreeHFDアルゴリズムを導入する。
TreeHFDの高性能化は、シミュレーションデータと実データの両方の実験を通して実証される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:49:01 GMT)
Investigating Software Aging in LLM-Generated Software Systems [2.2] 本稿では,Large Language Models (LLM) によるアプリケーションにおけるソフトウェア老化現象を実験的に検討する。
BoltプラットフォームとBaxbenchからの標準化されたプロンプトを使用して、4つのサービス指向アプリケーションを生成し、50時間の負荷テストを実施しました。
その結果, 進行記憶の増大, 応答時間の増加, 性能不安定など, ソフトウェア老化の顕著な証拠が示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:50:24 GMT)
Normal and Abnormal Pathology Knowledge-Augmented Vision-Language Model for Anomaly Detection in Pathology Images [2.2] Ano-NAViLaは、病理画像における異常検出のための正常および異常な病理知識拡張型ビジョンランゲージモデルである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:08:14 GMT)
Closing Gaps: An Imputation Analysis of ICU Vital Signs [2.2] 臨床予測モデルの性能向上に研究者を導くために確立された計算手法を比較した。
現在15のインプットと4つの修正メソッドを備えた ICU および再利用可能なベンチマークを導入し、主要な ICU データセットのベンチマークを行う。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:30:52 GMT)
Towards Human-AI Synergy in Requirements Engineering: A Framework and Preliminary Study [2.2] 本稿では,Human-AI RE Synergy Model(HARE-SM)を紹介する。
このモデルは、AIによる分析と人間の監視を統合して、要求の推論、分析、検証を改善する。
我々は、REデータセットの作成、微調整AIモデル、協調型ヒューマンAIの設計に焦点を当てた多段階の研究方法論を概説する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:29:11 GMT)
What do vision-language models see in the context? Investigating multimodal in-context learning [2.1] インコンテキスト学習(ICL)により、大規模言語モデルでは、パラメータ更新なしで実演例からタスクを学習することができる。
視覚言語モデル(VLM)におけるICLの体系的研究について述べる。
我々は、設計、アーキテクチャの選択、トレーニング戦略がマルチモーダルICLにどのように影響するかを分析する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:55:24 GMT)
Auto-Adaptive PINNs with Applications to Phase Transitions [2.1] 本稿では,物理情報ニューラルネットワーク(PINN)のトレーニングのための適応サンプリング手法を提案する。
特にAllen-Cahn方程式に焦点をあて、ポストホック再サンプリングなしでPINNを用いて特徴的界面領域を正確に解こうとする。
実験では,残差適応フレームワークに対するこれらの手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:03:39 GMT)
Bayesian Neural Networks vs. Mixture Density Networks: Theoretical and Empirical Insights for Uncertainty-Aware Nonlinear Modeling [2.1] 本研究では,不確実性を考慮した非線形回帰に対するベイズニューラルネットワーク(BNN)と混合密度ネットワーク(MDN)のアプローチを比較する。
理論的には、H"古い滑らかさ条件下での収束率と誤差境界を導出し、MDNがより高速なクルバック・リーブラー(KL)分散収束を実現することを示す。
本研究は, 非線形システムにおける不確実性を考慮したモデリングの指針として, 後進的および確率的確率論的学習の相補的強みを明らかにした。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:00:30 GMT)
Hyperfine-resolved optical spectroscopy of ultracold $^{87}$Rb$^{133}$Cs molecules: the $\mathrm{b}^3Π_0$ metastable state [2.1] 我々は、ビブロニック基底状態から電子状態の最低可視状態への遷移の超微細分解分光を行う。
これらの遷移はスピン禁止され、狭い直線幅となり、ほぼ対角のフランク・コンドン因子が特徴である。
我々は、0+$と0-$コンポーネント間の結合を含む超微細構造とゼーマン構造のモデルを開発する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:24:07 GMT)
Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems: A Structured Review [2.1] この研究は、RLの原理、高度強化学習(DRL)アルゴリズム、ロボットと制御システムへの統合に関する詳細なレビューを提示する。
DDPG、TD3、PPO、SACといった現代のDRL技術は、高次元連続制御タスクの解決において有望であることを示している。
このレビューは、最近の研究成果を要約し、技術動向、デザインパターン、そして実世界のロボット工学におけるRLの成熟度の増加を強調している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:14:57 GMT)
NeuroPilot: A Realtime Brain-Computer Interface system to enhance concentration of students in online learning [2.0] オンライン学習の普及は,学生の集中度をリアルタイムにモニタリングする上で重要な課題となっている。
既存のBrain-Computer Interface (BCI)システムにはリアルタイムの検証と評価手順がない。
リアルタイムフィードバックの有効性を評価するパイロット実験を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:13:13 GMT)
Renormalization-group-based preparation of matrix product states on up to 80 qubits [2.0] 量子コンピュータの鍵となる課題は、多くの量子ビットにわたる多体絡み合った状態の効率的な調製である。
再正規化グループ(RG)をベースとした超伝導量子ハードウェアを用いて,行列生成物の状態の生成を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:45:48 GMT)
Pilot-Wave Simulator: Exact Classical Sampling from Ideal and Noisy Quantum Circuits up to Hundreds of Qubits [2.0] 本稿では,テンソルネットワークの収縮手法をマルコフプロセスに統合する,正確なサンプリングアルゴリズムを提案する。
実演として,最大476量子ビットのQAOA回路からサンプルを生成するという課題を対象としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:33:11 GMT)
Can LLMs Write Faithfully? An Agent-Based Evaluation of LLM-generated Islamic Content [1.9] 大きな言語モデルはイスラム教の指導にますます使われるが、テキストを誤って引用したり、法学を誤用したり、文化的に矛盾した反応を生んだりするリスクがある。
GPT-4o、Ansari AI、Fanarの評価を、真正のイスラムブログからのプロンプトでパイロットする。
GPT-4oはイスラムの正確さ(3.93)とCitation(3.38)、Ansari AI(3.68, 3.32)、Fanar Lagged(2.76, 1.82)で最高点を記録した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:05:55 GMT)
Rewarding Engagement and Personalization in Popularity-Based Rankings Amplifies Extremism and Polarization [1.9] 実験的な証拠に基づくメカニズムを同定し、検証し、ランキングアルゴリズムが極端主義と偏極をいかに増幅するかを説明する。
我々は、このメカニズムを力学モデルで定式化し、シミュレーションと数百人の被験者によるインタラクティブな実験により評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:19:41 GMT)
Separability Criteria of Quantum States based on Generalized Bloch Representation [1.9] 量子絡み合いは、量子情報理論の基本的な資源として機能する。
本稿では,量子システム間の絡み合いを検出するための分離性基準の包括的枠組みを提案する。
数値的な例では,我々の分離性基準は絡み検出能力の向上を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:29:06 GMT)
An exact Error Threshold of Surface Code under Correlated Nearest-Neighbor Errors: A Statistical Mechanical Analysis [1.9] 現在の正確な表面コードしきい値分析は、独立で同一に分散されたエラー(すなわち、d)の仮定に基づいている。
ここでは、量子誤差補正を正八角形ランダムボンドイジングモデルにマッピングできる誤差エッジ写像を確立する。
次に,近接するデータキュービット間の独立な単一キュービット誤差と相関する誤差を組み合わせ,現実的なノイズモデルの下で正確な閾値を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:35:07 GMT)
Flow matching for reaction pathway generation [1.8] モルゲンは、ガウス前駆体を標的とする化学分布を輸送する最適な輸送経路を学習する条件付きフローマッチングフレームワークである。
TSDiffとOA-ReactDiffが使用しているベンチマークでは、MolGENはTSの幾何精度とバリアハイト予測を超越し、サンプリングを秒未満に削減している。
MolGENはまた、競合するトップkの精度でオープンな製品生成をサポートし、シーケンスモデルに共通する質量/電子バランス違反を避ける。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:17:27 GMT)
Fundamental limit on the heralded single photons' spectral brightness [1.8] 単一光子のスペクトル輝度(SB)は、直線幅当たりの発生率として定義される。
HSPの生成速度が大きくなるか、光子の線幅が狭くなると、SBは限界を持つのだろうか?
我々はSBと相互相関関数を系統的に検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:06:22 GMT)
Maximum-Entropy Analog Computing Approaching ExaOPS-per-Watt Energy-efficiency at the RF-Edge [1.7] エントロピー生成の物理は,高性能かつエネルギー効率の良いアナログ計算システムの実装にどのように利用できるかを示す。
このアンサンブルの最大エントロピー状態は、マージンプロパゲーション(MP)分布に対応することを示す。
2Peta (1015$) Bit Operations per Watt (PetaOPS/W) at 8bitcision, 0.8 Exa (1018$) Bit Operations per Watt (ExaOPS/W) at 3-bitcision for RF data sampled at 4 GS/W。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:17:27 GMT)
Non-myopic Matching and Rebalancing in Large-Scale On-Demand Ride-Pooling Systems Using Simulation-Informed Reinforcement Learning [1.7] ライドプール(英: Ride-pooling)またはライドシェアリング(英: ride-hailing)またはシェアライドシェアリング(英: shared ride-sharing)またはマイクロトランジット(英: microtransit)は、乗客が乗車を共有するサービスである。
しかし、重要な制限は、派遣決定の長期的な影響を見落としている、その神秘的な決定である。
シミュレーションインフォームド強化学習(RL)手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 23:21:27 GMT)
Language-Conditioned Representations and Mixture-of-Experts Policy for Robust Multi-Task Robotic Manipulation [1.7] LMoE-DP(Language-Conditioned Visual Representation)モジュールとLanguage- Conditioned Mixture-of-Experts Density Policy(LMoE-DP)を組み合わせたフレームワークを提案する。
実ロボットのベンチマークでは、LCVRはAction Chunking with Transformers (ACT) と Diffusion Policy (DP) の成功率をそれぞれ33.75%、25%向上させた。
セマンティックグラウンドと専門家の専門化を組み合わせることで、堅牢で効率的なマルチタスク操作が可能になることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:27:03 GMT)
Explicitly Modeling Subcortical Vision with a Neuro-Inspired Front-End Improves CNN Robustness [1.7] 物体認識で訓練された畳み込みニューラルネットワーク(CNN)は、高いタスク性能を実現するが、生物学的視覚と比較すると脆弱性を示す。
本稿では,VOneBlockと新しいSubcorticalBlockを組み合わせたハイブリッドCNNの新たなクラスであるEarly Vision Networks(EVNets)を紹介する。
最新のデータ拡張技術と組み合わせることでEVNetをさらに改善できることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:19:25 GMT)
DArFace: Deformation Aware Robustness for Low Quality Face Recognition [1.6] 顔認識システムは、低品質の顔画像を含む現実のシナリオにおいて劣化することが多い。
textbfDArFaceは、高品質と低品質のトレーニングサンプルをペアで必要とせずに、このような劣化に対する堅牢性を高めるフレームワークである。
本手法は, 訓練中の大域変換(回転, 変換など)と局所弾性変形の両方を逆向きに統合し, 現実的な低品質条件をシミュレートする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:53:29 GMT)
A Penny for Your Thoughts: Decoding Speech from Inexpensive Brain Signals [1.6] 脳波記録を音声表現にマッピングすることで、ニューラルネットワークが脳活動を音声にデコードできるかどうかを検討する。
被験者が自然音声を聴くように記録した脳波データを用いて、コントラストのあるCLIP損失を持つモデルを訓練し、脳波由来の埋め込みと、事前訓練されたトランスフォーマーベース音声モデルからの埋め込みとを一致させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:02:41 GMT)
Graph Neural Network Assisted Genetic Algorithm for Structural Dynamic Response and Parameter Optimization [1.5] 質量(m)、剛性(k)、減衰係数(c)などの構造パラメータの最適化は、効率的で弾力性があり安定した構造を設計するのに重要である。
本研究では,グラフニューラルネットワーク(GNN)サロゲートモデルと遺伝的アルゴリズム(GA)を統合し,これらの課題を克服するハイブリッドデータ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:56:47 GMT)
Towards actionable hypotension prediction- predicting catecholamine therapy initiation in the intensive care unit [1.4] ほとんどの機械学習(ML)モデルは、固定されたMAP閾値またはMAP予測を使用して低血圧を予測する。
15分間の予測窓内でカテコールアミンの開始を連発イベントとしてモデル化した。
このモデルは0.822(0.813-0.830)のAUROCを達成し、低血圧ベースライン(MAP 65, AUROC 0.686 [0.675-0.699])を上回った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:49:42 GMT)
KAN-GCN: Combining Kolmogorov-Arnold Network with Graph Convolution Network for an Accurate Ice Sheet Emulator [1.4] 氷床モデルのための高速かつ正確なエミュレータであるkan-GCNを紹介する。
Kan-GCNは、グラフ畳み込みネットワーク(GCN)の前に、KAN(Kolmogorov-Arnold Network)を機能的キャリブレータとして配置する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:55:29 GMT)
Score-based constrained generative modeling via Langevin diffusions with boundary conditions [1.4] 本稿では,境界定義制約上の速度のスペクトル反射を伴う動力学(アンダーダムド)ランゲヴィンダイナミクスを用いた制約付き生成モデルを提案する。
離散化ステップにおいて最適な速度に収束する効率的な数値サンプリング器を提示することにより、局所時間による反射拡散に基づくモデルと、閉じ込められた(特別に反映される)ランゲヴィン拡散に基づくモデルの包括的比較を行う。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:36:54 GMT)
Machine learning approaches for interpretable antibody property prediction using structural data [1.4] 抗体配列、構造、機能の関係を理解することは、抗体ベースの治療法や研究ツールの設計に不可欠である。
機械学習モデルは、主に、抗体特性を予測するために、シーケンス情報への大規模言語モデルの適用に基づいて開発されている。
この章では、(グラフ表現を介して)構造データとニューラルネットワークを統合し、抗体の特性を予測する2つのMLフレームワークについて説明する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:13:09 GMT)
MIMIC-Sepsis: A Curated Benchmark for Modeling and Learning from Sepsis Trajectories in the ICU [1.4] 我々はMIMIC-IVデータベースから派生したコホートおよびベンチマークフレームワークであるMIMIC-Sepsisを紹介する。
ICU患者35,239名を対象に,標準治療データとタイムアラインな臨床変数について検討した。
本稿では,Sepsis-3の基準に基づく透過的な前処理パイプライン,構造化されたインプット戦略,そしてそれをベンチマークタスクとともにリリースする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:13:38 GMT)
Global urban visual perception varies across demographics and personalities [1.4] 街路図を用いた世界規模の街路景観の大規模都市視覚知覚調査を行った。
我々は、性別、年齢、収入、教育、人種、民族性、性格特性などの人口動態が、どのようにして形づくられるかを検討した。
このデータセットは、従来の6つの指標にまたがる人口統計と人格に基づく差異を明らかにする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:27:55 GMT)
SHA-256 Infused Embedding-Driven Generative Modeling of High-Energy Molecules in Low-Data Regimes [1.4] 本研究は,分子生成のためのLong Short-Term Memory(LSTM)ネットワークと特性予測のためのAttentive Graph Neural Networks(GNN)を組み合わせることで,高エネルギー分子に対する新しいアプローチを提案する。
爆発速度は9km/s以上と推定された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:48:22 GMT)
Rademacher Meets Colors: More Expressivity, but at What Cost ? [1.3] グラフニューラルネットワーク(GNN)の表現力は、グラフ同型テストとの対応によって一般的に理解される。
この研究は、色付けアルゴリズムのレンズを通して表現性と一般化をリンクすることで、このトレードオフの理論的な説明を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:57:39 GMT)
An efficient preconditioned conjugate-gradient solver for a two-component dipolar Bose-Einstein condensate [1.3] 双極性ボース-アインシュタイン凝縮体の基底状態に対する事前条件付き非線形共役勾配解法を開発した。
双極性混合に代表されるテクスチャと液滴安定性ウィンドウを再現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:44:47 GMT)
Entanglement dynamics of monitored non-interacting fermions on Graphic-Processing-Units [1.3] 観測された非相互作用フェルミオンの絡み合いのダイナミクスを$U(1)$対称性で数値的に特徴づける。
本結果は,量子システムの絡み合いのダイナミクスを定量的に説明するための道を開くものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:22:31 GMT)
An N-of-1 Artificial Intelligence Ecosystem for Precision Medicine [1.3] N-of-1決定支援のためのマルチエージェントエコシステムを提案する。
エージェントはモデルとエビデンス合成ツールの共有ライブラリーを描画する。
このアプローチは、医療AIと第一原理 – 透明性があり、公平で、個人中心の医療 – を結びつけることを目指している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:28:02 GMT)
Comparison of generalised additive models and neural networks in applications: A systematic review [1.2] 一般化付加モデル(GAM)とニューラルネットワークは、解釈可能性を保持する最先端の統計モデルである。
我々は,GAMとニューラルネットワークの実証的な比較を行った論文を体系的にレビューする。
データセット全体では、GAMやニューラルネットワークで優位性を示す一貫した証拠は見つからなかった。
このレビューでは、GAMとニューラルネットワークは補完的な競合と見なされるべきである、と強調する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:28:42 GMT)
Resource-Efficient LLM Application for Structured Transformation of Unstructured Financial Contracts [1.2] 法律文書を機械可読形式に変換するためのCDMizerフレームワークの拡張を提案する。
我々は,その性能を国際スワップ・デリバティブズ協会によって開発されたベンチマークと比較した。
この研究は、法的な契約変換を自動化するリソース効率の高いソリューションの可能性を強調します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:49:10 GMT)
Abjad AI at NADI 2025: CATT-Whisper: Multimodal Diacritic Restoration Using Text and Speech Representations [1.1] アラビア語の方言文に対する多モーダルアプローチを用いたダイアクリティカル・リカバリ(DR)課題に取り組む。
本稿では,CATT という名前の事前学習モデルから抽出したエンコーダを用いて,テキストのモダリティを表すモデルを提案する。
実験の結果,提案手法は, 単語誤り率0.25, 文字誤り率0.9を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:58:18 GMT)
WBT-BGRL: A Non-Contrastive Weighted Bipartite Link Prediction Model for Inductive Learning [1.1] 2部グラフのリンク予測は、レコメンデーションシステムや障害検出といったアプリケーションには不可欠である。
Weighted Bipartite Triplet-Bootstrapped Graph Latents (WBT-BGRL) を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:56:13 GMT)
"Mm, Wat?" Detecting Other-initiated Repair Requests in Dialogue [1.1] 本研究では,オランダ語対話における修復開始を自動的に検出するマルチモーダルモデルを提案する。
その結果,韻律的手がかりは言語的特徴を補完し,事前学習されたテキストと音声の埋め込みの結果を大幅に改善することがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:58:26 GMT)
IBIS: A Powerful Hybrid Architecture for Human Activity Recognition [1.1] 我々は、Inception-BiLSTMとSupport Vector Machine(SVM)を統合した新しいハイブリッドアーキテクチャを導入する。
我々の IBIS アプローチは、モデル一般化を改善し、より堅牢な分類境界を作成するために一意に設計されている。
本手法をドップラー由来のデータに適用することにより,99%近くの動き認識精度を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:06:08 GMT)
Send Less, Save More: Energy-Efficiency Benchmark of Embedded CNN Inference vs. Data Transmission in IoT [1.0] IoT(Internet of Things)と人工知能(Artificial Intelligence)の統合は、生態的な変化を監視し、対処する能力を強化する大きな機会を提供します。
環境問題がますます強まる中、効果的な遠隔監視ソリューションの必要性はかつてないほど重要になっている。
大きな課題は、電力可用性に制限のある遠隔地での長期運用が可能なエネルギー効率のよいIoTデバイスを作ることである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:18:14 GMT)
Few-Shot Remote Sensing Image Scene Classification with CLIP and Prompt Learning [1.0] 我々は,数ショットのリモートセンシング画像シーン分類のための軽量かつ効率的な適応戦略として,即時学習を探求する。
これらのプロンプト学習手法を,手作りプロンプトを用いたゼロショットCLIPと,凍結したCLIPの特徴を訓練した線形プローブの2つの標準ベースラインに対してベンチマークした。
我々の研究結果は、衛星画像と空中画像の領域ギャップを埋めるスケーラブルで効率的な方法として、迅速な学習を裏付けている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:39:22 GMT)
Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS [1.0] ブラジル手話(LIBRAS)における孤立信号認識のための軽量ボディランドマーク検出の有用性について検討する。
Alves et al. (2024)に比べて処理時間を5倍以上削減しながら、最先端の手法に匹敵するあるいは優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:43:17 GMT)
Cross-Corpus Validation of Speech Emotion Recognition in Urdu using Domain-Knowledge Acoustic Features [0.9] 本研究では, 未調査領域であるクロスコーパス環境でのUrdu SERについて検討した。
我々は、モデル一般化をテストするために、3つの異なるUrdu感情音声データセット間のクロスコーパス評価フレームワークを用いる。
その結果,UARはクロスコーパス評価を最大13%上回る結果となり,自己コーパス検証が性能を過大評価することがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:35:48 GMT)
Attack on a PUF-based Secure Binary Neural Network [0.9] 分岐ニューラルネットワーク(BNN)は、エッジコンピューティングのためのエネルギー効率の良いソリューションを提供する。
最近、Rajendranらは盗難に対するBNNを保護するために、Physical Unclonable Function (PUF)ベースのスキームを提案した。
本稿では,このBNN保護方式がPUFキー回復攻撃に対して脆弱であることを実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:43:00 GMT)
Feature-Guided Analysis of Neural Networks: A Replication Study [0.9] FGA(Feature-Guided Analysis)は、タスクに関連するニューラルネットワークのスライスを抽出する。
既存の特徴誘導アプローチは通常、関連するルールを抽出するためにニューラルネットワークニューロンの活性化を監視する。
本稿では,MNIST と LSC のデータセットを用いて,FGA の適用性を評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:38:10 GMT)
Arena-Lite: Efficient and Reliable Large Language Model Evaluation via Tournament-Based Direct Comparisons [0.9] 本稿では,頭対頭比較に基づいてトーナメント構造を統合するアリーナ・ライトを提案する。
トーナメント構造と直接比較の適用により、ベースライン出力が不要になる。
試行は、アリーナ・ライトがより少ない比較で常に高い信頼性を達成することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:26:20 GMT)
Nonreciprocity enhanced Quantum Gyroscopes based on Surface Acoustic Waves [0.9] 表面音響波(SAW)はジャイロスコープで40年以上使われてきた。
量子化SAWの最近の進歩は、有望な解決策を提供する。
多重点結合を特徴とする量子ジャイロスコープを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:58:30 GMT)
SpatialTraceGen: High-Fidelity Traces for Efficient VLM Spatial Reasoning Distillation [0.9] SpatialTraceGenは、大規模な教師モデルの推論プロセスを、マルチホップ、マルチツールの推論トレースの高品質なデータセットに抽出するフレームワークである。
重要なイノベーションは自動検証であり、各推論ステップの忠実さを確実に保証します。
CLEVR-Humansベンチマークでは、この検証済みのプロセスにより、トレースの平均品質スコアが17%向上し、品質のばらつきが40%以上減少する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:33:50 GMT)
The Neural Pruning Law Hypothesis [0.8] 我々は,概念的に接地された刈り込み法であるHyperfluxを導入し,刈り込み過程の研究に利用した。
我々は、我々の枠組みから自然に生じる性質を仮定し、重みと密度の最小フラックスの関係が、パワー-ロー方程式に従うことを発見した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:10:13 GMT)
The Evolution of Probabilistic Price Forecasting Techniques: A Review of the Day-Ahead, Intra-Day, and Balancing Markets [0.8] 電力価格の予測はエネルギー市場における意思決定にとって重要なツールとなっている。
確率に着目した手法は不確実性推定における鍵となる限界に対処する。
本研究は, 技術方法論, 重要評価指標, 進行中の課題について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:25:23 GMT)
Managing Administrative Law Cases using an Adaptable Model-driven Norm-enforcing Tool [0.8] 本稿では,行政訴訟に対するモデル駆動型事例管理ツールの実装について報告する。
本ツールでは,eFLINTのインタプリタと対話することで,適応性と規範の適用性を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:27:29 GMT)
Optimizing Quantum Compilation via High-Level Quantum Instructions [0.7] 本稿では,高度な最適化に必要なセマンティック情報をコンパイラに提供する方法を示す。
我々は、量子ゲートをより効率的で近似的な分解で自動的に置換する量子固有命令を活用する新しい最適化を導入する。
以上の結果から,高レベルの抽象化は,コンパイラの最適化の新たなクラスをアンロックする上で極めて重要であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:44:38 GMT)
Matrix product state approach to lossy boson sampling and noisy IQP sampling [0.7] 損失ボソンサンプリングとノイズのある瞬時量子時間サンプリングのための古典的アルゴリズムを開発した。
我々のアルゴリズムは精度と効率のトレードオフを大幅に改善する。
さらに、MPSシミュレーションの適用性を、ノイズの多い量子サンプリングモデルのより広範なクラスに拡張する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:23:10 GMT)
Semi-supervised and unsupervised learning for health indicator extraction from guided waves in aerospace composite structures [0.7] 健康指標(HIs)は、航空宇宙複合構造物の状態の診断と診断の中心である。
本研究では、マルチドメイン信号処理と統合された2つの学習手法を用いてHIを学習するデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:11 GMT)
Comparing Retrieval Strategies to Capture Interdisciplinary Scientific Research: A Bibliometric Evaluation of the Integration of Neuroscience and Computer Science [0.7] 学際的な科学研究は、知識生産、資金政策、学術的な議論においてますます重要になっている。
本研究では,2つの知識体系間の学際的コーパスを定義するための異なる戦略を開発し,比較する。
提案手法は, より優れた検索, 擬似リコール, F1を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:05:07 GMT)
Evidence-Bound Autonomous Research (EviBound): A Governance Framework for Eliminating False Claims [0.6] EviBoundは、二重ガバナンスゲートを通じて偽のクレームを排除するエビデンスベースの実行フレームワークである。
事前実行承認ゲートは、コードが実行される前に受け入れ基準スキーマを検証する。
実行後検証ゲートは、MLflow APIクエリを通じてアーティファクトを検証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:47:13 GMT)
A Critical Study towards the Detection of Parkinsons Disease using ML Technologies [0.6] 提案手法は,3種類の茶葉疾患を分類できるディープラーニング技術である。
レッド・ラスト(Red Rust)、ヘロペルティス(Helopeltis)、レッド・スパイダー・マイト(Red Spider mite)である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:24:34 GMT)
A Modular, Adaptive, and Scalable Quantum Factoring Algorithm [0.6] Shorの整数分解アルゴリズムは古典的手法よりも指数関数的な高速化を提供する。
多くのコヒーレント量子ビットと非常に深い回路を必要とするため、ノイズ中間量子(NISQ)ハードウェアでは実用的ではない。
我々は、これらの制限を緩和するShorのアルゴリズムのモジュラーでウィンドウ化された定式化を開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:15:55 GMT)
Sound Source Localization for Spatial Mapping of Surgical Actions in Dynamic Scenes [0.5] 本研究は,3次元音響情報を統合することにより,手術シーンの表現性を高めることを目的とする。
手術シーンの4次元映像表現を生成するための新しい枠組みを提案する。
提案するフレームワークにより,コンテキスト理解の充実が図られ,今後のインテリジェントな手術システムの基礎となる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:55:45 GMT)
Modeling Electric Vehicle Car-Following Behavior: Classical vs Machine Learning Approach [0.5] 本研究では,EV車追従行動の古典的モデルと機械学習モデルを比較した。
我々は、予測と実データの間のRMSEを最小化することにより、古典的モデルパラメータを校正した。
ランダムフォレストモデルは、スペーシング、スピード、ギャップタイプを入力として加速度を予測する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:54:50 GMT)
HistoLens: An Interactive XAI Toolkit for Verifying and Mitigating Flaws in Vision-Language Models for Histopathology [0.5] HistoLensは、AIエンジンについて明確に構造化されたレポートを提供している。
もし医者が「なぜ?」と尋ねると、HistoLensはすぐに「視覚的証拠」を提供することができる。
HistoLensは、患者の組織のみに焦点を当てている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:38:59 GMT)
HyperGraphX: Graph Transductive Learning with Hyperdimensional Computing and Message Passing [0.5] hdgcはグラフの畳み込みを、超次元計算における結合と束縛操作と組み合わせて、トランスダクティブグラフ学習を行う。
予測精度のhdgcは、主要なグラフニューラルネットワークの実装よりも優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:21:54 GMT)
FruitProm: Probabilistic Maturity Estimation and Detection of Fruits and Vegetables [0.5] 果実や野菜の成熟度推定は農業の自動化にとって重要な課題であり、収穫予測やロボット収穫に直接影響を及ぼす。
現在のディープラーニングアプローチは、成熟度を個別の分類問題(例えば、未熟、熟、過熟)として主に扱う。
本稿では,現在最先端のリアルタイム物体検出器RT-DETRv2に,専用の確率的頭部を導入することで,新たなアーキテクチャ変更を提案する。
このヘッドは、検出対象ごとの成熟度スペクトルの連続分布を予測し、同時に平均成熟度状態とその関連する不確かさを学習する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:39:03 GMT)
Enhancing Vision-Language Models for Autonomous Driving through Task-Specific Prompting and Spatial Reasoning [0.5] 本報告では,IROS 2025におけるRoboSense Challengeの解決策について述べる。
VLM(Vision-Language Models)は、知覚、予測、計画、汚職検出タスクを横断する自律走行シーンの理解について評価する。
4つのコアコンポーネント上に構築された体系的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:43:30 GMT)
A Systematic Literature Review of the Use of GenAI Assistants for Code Comprehension: Implications for Computing Education Research and Practice [0.5] 本稿では,生成的人工知能(GenAI)を利用したコード理解の向上のための手法とツールについて,体系的な文献レビューを行う。
本稿では,GenAIをベースとした手法とツールを分類し,その有効性の実証的評価を要約する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:19:10 GMT)
Resource-Efficient and Robust Inference of Deep and Bayesian Neural Networks on Embedded and Analog Computing Platforms [0.4] この研究は、アルゴリズムとハードウェアの効率を共同で追求することで、ニューラルネットワークのリソース効率と堅牢な推論を促進する。
最初のコントリビューションであるGalenは、感度分析とハードウェア・イン・ザ・ループフィードバックによって導かれる自動層特異的圧縮を実行する。
第2の作業は確率的推論を前進させ、コストのかかるサンプリングを置き換え、コンパイラスタックに統合し、組み込み推論を最適化する分析およびアンサンブル近似を開発する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:34:53 GMT)
Says Who? Effective Zero-Shot Annotation of Focalization [0.4] フォカライゼーション(Focalization)とは、物語情報へのアクセスがナレーターの知識に基づいて制限されるか、制御される方法を指す。
訓練されたアノテータでさえしばしば正しいラベルについて意見が一致せず、このタスクは質的にも計算的にも難しいことを示唆している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:02 GMT)
The Economics of AI Training Data: A Research Agenda [0.4] データのAI生産における中心的な役割にもかかわらず、まだ理解されていないインプットである。
AIラボが公開データを消耗し、プロプライエタリなソースに転換するにつれ、コンピュータ科学、経済学、法律、そしてポリシーに関する研究が断片化している。
私たちは3つの貢献を通じてコヒーレントな分野としてデータ経済学を確立します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:37:35 GMT)
Polygonal network disorder and the turning distance [0.4] ネットワーク面と「順序付き」形状の旋回距離を平均化することによって定義される多角形平面ネットワークに対するテクスチャターン障害を導入する。
正規多角形の特殊類に対する回転距離の閉形式表現を導出する。
また,T1移動下で進化するバネネットワークと多角的破断過程という,ネットワーク上のプロセスの2つの例に適用可能な回転障害についても検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:04:58 GMT)
NVSim: Novel View Synthesis Simulator for Large Scale Indoor Navigation [0.4] NVSimは,一般的な画像列のみから大規模でナビゲート可能な屋内シミュレータを自動構築するフレームワークである。
クリーンでナビゲーション可能な地上面と,メッシュフリーなトラバーサビリティチェックアルゴリズムを実現するために,Floor-Aware Gaussian Splattingを導入する。
実世界のデータから有効な大規模ナビゲーショングラフを生成する能力を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:57:33 GMT)
Acoustic and Machine Learning Methods for Speech-Based Suicide Risk Assessment: A Systematic Review [0.4] 本研究は,音声の音響解析による自殺リスク評価における人工知能(AI)と機械学習(ML)の役割を体系的に評価する。
我々はPubMed, Cochrane, Scopus, Web of Scienceデータベースから選択した33項目を分析した。
自殺リスク (RS) と非自殺リスク (NRS) との間に有意な音響的特徴が一貫して認められた。
音響、言語、メタデータ、そして優れたパフォーマンスを示す特徴を統合するマルチモーダルアプローチ。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:02:13 GMT)
Cybersecurity AI Benchmark (CAIBench): A Meta-Benchmark for Evaluating Cybersecurity AI Agents [0.4] 既存のベンチマークは、統合されたパフォーマンスではなく、独立したスキルを評価する。
モジュール型メタベンチマークフレームワークであるCAIBench(Cybersecurity AI Benchmark)を紹介する。
適切なマッチは2.6$times$ variance in Attack and Defense CTFsまで改善される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:36:20 GMT)
Thermally Assisted Supersolidity in a Dipolar Bose-Einstein Condensate [0.3] 双極子ボース-アインシュタイン凝縮体の超固体は、接触相互作用、長距離双極子-双極子力、量子揺らぎの相互作用から生じる。
我々は、拡張平均場フレームワークを用いて、調和に閉じ込められた双極子BECの有限温度位相挙動をグラフ化した。
有限温度は、超固相境界をより大きな散乱長にシフトさせ、超固相開始の密度閾値を下げ、変調相の安定性窓を広げる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:35:23 GMT)
Clustering-Based Low-Rank Matrix Approximation for Medical Image Compression [0.3] 適応的なLoRMAは、医療画像を重なり合うパッチに分割し、構造的に類似したパッチをk-meansを使ってクラスタにグループ化し、各クラスタ内でSVDを実行する。
我々は,MRI,超音波,CT,胸部X線という4つの画像モダリティのグローバルSVDに対する適応型LoRMAの評価と比較を行った。
その結果, 適応型 LoRMA はPSNR, SSIM, IoU, EPI, EPI で測定された構造的整合性, エッジ細部, 診断関連性を効果的に維持することが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:31:26 GMT)
Trust Dynamics in Strategic Coopetition: Computational Foundations for Requirements Engineering in Multi-Agent Systems [0.3] 本稿では,動的信頼進化を伴う戦略的協調のためのゲーム理論の基礎を拡張した計算信頼モデルを開発する。
我々は,i*依存ネットワークと組織コンテキストから計算信頼モデルをインスタンス化するための構造化翻訳フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:26:14 GMT)
Charting the European LLM Benchmarking Landscape: A New Taxonomy and a Set of Best Practices [0.3] 本稿では,多言語あるいは非英語の使用シナリオに適したベンチマークの分類のための新しい分類法を提案する。
また、ヨーロッパの言語のためのベンチマークをより協調的に開発するためのベストプラクティスと品質基準も提案します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:13:44 GMT)
Correlated dynamics as a resource in molecular switches [0.3] 光異性化は近年、熱力学の量子資源理論の中でモデル化されている。
物理系間の相関は、特定の演算の作業コストを下げることによって量子熱力学において重要な役割を果たすことが示されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:06:18 GMT)
Enforcing boundary conditions for physics-informed neural operators [0.3] 物理インフォームドニューラルネットワークのような機械学習に基づく手法は、偏微分方程式の複雑なシステムでも解けるようになってきている。
境界条件は、損失関数の偏差を減じることによって弱められるか、あるいは所定の値や微分に本質的に一致する解構造を訓練することによって強められる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:51:48 GMT)
Efficient License Plate Recognition via Pseudo-Labeled Supervision with Grounding DINO and YOLOv8 [0.3] ALPRは交通制御、駐車、車両追跡、料金徴収、法執行機関の応用において不可欠である。
本稿では, YOLOv8によるプレート検出・認識タスクの深層学習戦略を提案する。
これは、CENPARMI(Center for Pattern Recognition and Machine Intelligence)のデータセットで94%、UFPR-ALPRデータセットで91%という驚くべきリコール率を達成した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 23:21:00 GMT)
Transformers can do Bayesian Clustering [0.3] 本稿では、事前データフィットネットワーク(PFN)を教師なしベイズクラスタリングに拡張するトランスフォーマーベースモデルであるCluster-PFNを提案する。
有限ガウス混合モデル(GMM)から生成された合成データセットに完全に訓練されたクラスタ-PFNは、クラスタの数とクラスタ割り当ての両方にわたる後部分布を推定することを学ぶ。
クラスタ-PFNは、欠落したデータ、現実世界のゲノムデータセットにおける命令ベースのベースラインよりも優れたパフォーマンス、高い欠落率を含む複雑なプリエントに基づいてトレーニングすることができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:36:31 GMT)
Filtering instances and rejecting predictions to obtain reliable models in healthcare [0.3] 本稿では,機械学習モデルの性能向上のための2段階のデータ中心方式を提案する。
最初のステップは、インスタンスハードネス(IH)を活用して、トレーニング中の問題のあるインスタンスをフィルタリングする。
第2のステップでは、推論中に信頼に基づく拒絶機構を導入し、信頼性のある予測のみを保持する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:45:20 GMT)
Temporal Knowledge Graph Hyperedge Forecasting: Exploring Entity-to-Category Link Prediction [0.2] 時間的知識グラフは、エンティティ間の静的な関係をモデル化するだけでなく、時間とともにどのように関係が進化するかのダイナミクスをモデル化する強力な方法として登場した。
この分野での研究のほとんどは、畳み込みベースの手法に焦点を当て、畳み込みニューラルネットアーキテクチャを利用することが多い。
本稿では,既存のルールベースのフレームワークであるTLogicの拡張について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:47:38 GMT)
Toward precision soil health: A regional framework for site-specific management across Missouri [0.2] ミズーリの多様な景観は、広く一般化された管理勧告の有効性を制限している。
州内の精密土壌管理戦略を支援するために設計された地域土壌クラスタリングフレームワーク。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:46:24 GMT)
XAI Evaluation Framework for Semantic Segmentation [0.2] セマンティックセグメンテーションにおいて、説明可能なAI(XAI)を評価するために特別に設計された包括的で体系的な評価フレームワークを導入する。
このフレームワークは、ピクセルレベルの評価戦略と注意深く設計されたメトリクスを使用して、きめ細かい解釈可能性の洞察を提供する。
これらの知見は、透明性、信頼性、説明可能なセマンティックセグメンテーションモデルの発展に寄与する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:27:38 GMT)
Self-supervised Synthetic Pretraining for Inference of Stellar Mass Embedded in Dense Gas [0.2] 機械学習は複雑な構造を恒星質量に結びつけることができるが、高解像度のシミュレーションから、大きな高品質のラベル付きデータセットを必要とする。
自己教師型フレームワークDINOv2を用いて,100万枚の合成フラクタル画像上に視覚変換器を事前学習することにより,この問題に対処する。
以上の結果から, 合成プレトレーニングは, 同じ限られたシミュレーションでトレーニングした教師付きモデルよりも, 若干の精度で, 凍結状態の回帰星質量予測を改善することが示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:55:34 GMT)
MAGNET: A Multi-Graph Attentional Network for Code Clone Detection [0.1] コードクローン検出は、脆弱性検出と盗作分析を支えるソフトウェア工学の基本的なタスクである。
既存の方法は抽象構文木(AST)、制御フローグラフ(CFG)、データフローグラフ(DFG)といった特異表現に依存していることが多い。
本研究では,AST,CFG,DFG表現を併用してソースコードの構文的・意味的特徴を抽出する多グラフアテンショナルフレームワークMAGNETを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:48:06 GMT)
A simpler probe of the quantum Mpemba effect in closed systems [0.1] 還元密度行列と長い時間限界の間の相対エントロピーによる閉量子系の局所緩和について検討する。
解析的議論と数値的なチェックを組み合わせることで、この相対エントロピーはエントロピー差によって非常によく近似できることを示す。
エンタングルメント膜図に従うモデルでは、多くの初期状態に対して量子ムペンバ効果は生じないことが示される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:29:19 GMT)
Exploring the Influence of Relevant Knowledge for Natural Language Generation Interpretability [0.1] 本稿では,自然言語生成における外部知識統合の影響について考察する。
我々は、入力概念セットとConceptNetから取得した意味関係をペアリングするベンチマークであるKITGIを作成することにより、CommonGenデータセットを拡張した。
T5-Largeモデルを用いて、外部知識の完全化とフィルタリング知識の2つの条件下で文生成を比較する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:34:01 GMT)
Disentangling Shared and Private Neural Dynamics with SPIRE: A Latent Modeling Framework for Deep Brain Stimulation [0.1] SPIREはディープマルチエンコーダオートエンコーダで、レコードを共有およびプライベート潜在サブスペースに分解する。
地域間構造を堅牢に復元し、外部がどのように再編成するかを明らかにする。
頭蓋内深部脳刺激(DBS)記録に応用される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:45:52 GMT)
Revisiting the Structure of Trend Premia: When Diversification Hides Redundancy [0.1] 最近の研究は、複数の地平線をまたいだトレンド信号の組み合わせによる多様化の利点を強調している。
本稿では,地平線上での露光を動的に再配置することで,従来の視点を再考する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:11:26 GMT)
Emergence of Minimal Circuits for Indirect Object Identification in Attention-Only Transformers [0.1] 我々は、間接オブジェクト識別タスクのシンボリックバージョンにおいて、スクラッチから小さな注意のみのトランスフォーマーを訓練する。
2つのアテンションヘッドしか持たない単一層モデルは、残差と正規化層が欠如しているにもかかわらず、完全なIOI精度を達成する。
2層1頭モデルでは,問合せと問合せの相互作用を通じて,複数の層にまたがる情報を構成することで,同様の性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:25:19 GMT)
Stroke Lesion Segmentation in Clinical Workflows: A Modular, Lightweight, and Deployment-Ready Tool [0.1] nnU-Netのようなディープラーニングフレームワークは、脳病変のセグメンテーションにおいて最先端のパフォーマンスを達成するが、臨床展開は困難である。
textitStrokeSegは、研究グレードの脳梗塞のセグメンテーションモデルをデプロイ可能なアプリケーションに変換するモジュール式で軽量なフレームワークである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:56:48 GMT)
V-SAT: Video Subtitle Annotation Tool [0.1] V-SAT(Video Subtitle Tool)は、様々な字幕品質問題を自動的に検出し、修正する統合フレームワークである。
大規模言語モデル(LLM)、視覚言語モデル(VLM)、画像処理、自動音声認識(ASR)を組み合わせることで、V-SATは音声とビデオの両方からコンテキストキューを活用する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:34:27 GMT)
Privacy-Preserving Personalization in Education: A Federated Recommender System for Student Performance Prediction [0.1] 教育のデジタル化は、データ駆動型パーソナライゼーションの機会を提供するが、学生のデータプライバシーにも課題をもたらす。
フェデレートラーニング(FL)を用いた新しいプライバシ保護レコメンデータシステムを提案し,その課題に対処するために評価を行った。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:54:59 GMT)
MERGE: Minimal Expression-Replacement GEneralization Test for Natural Language Inference [0.1] オープンクラスの単語を置換することで,NLI問題の高品質な変種を自動的に生成する手法を提案する。
MERGEとして一般化テストを行い、元の問題の推論保存変種間でモデルの予測の正しさを評価する。
以上の結果から,NLIモデルの性能は4-20%低下し,最小限に変化した問題においても一般化性の低下が示唆された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:58:59 GMT)
Does CLIP perceive art the same way we do? [0.1] 絵画から高レベルの意味情報や文体情報を抽出するCLIPの能力について検討する。
以上の結果から,CLIPの視覚的表現の長所と短所が明らかとなった。
我々の研究は、マルチモーダルシステムにおけるより深い解釈可能性の必要性を強調している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:05:02 GMT)
Deep Feature Optimization for Enhanced Fish Freshness Assessment [0.1] 魚の鮮度を評価することは、食品の安全性を確保し、魚介類産業の経済的損失を最小限に抑えるために不可欠である。
近年のディープラーニングの進歩は視覚的鮮度予測を自動化しているが、精度と特徴透明性に関する課題は継続している。
本研究では,魚の鮮度評価に深い視覚的表現を洗練・活用する3段階統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:02:10 GMT)
Exploring the Fidelity of Flux Qubit Measurement in Different Bases via Quantum Flux Parametron [0.0] 高忠実度量子ビット読み出しは量子コンピューティングシステムの基本要件である。
本稿では,量子フラックスパラメタトロンを用いた読み出し方式を用いて,フラックス量子ビットの測定精度を高める手法について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:51:45 GMT)
LEVITAS: Levitodynamics for Accurate Individual Particle Sensing in Space [0.0] 浮遊ナノ粒子(レビトダイナミックス)の動力学に基づくその場センシングソリューションを提案する。
希薄媒質中の個々の粒子の影響を検知し、測定することができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:35:23 GMT)
An efficient probabilistic hardware architecture for diffusion-like models [0.0] ハードウェアレベルで強力な復調モデルを実装した全トランジスタ確率コンピュータを提案する。
システムレベルの分析では、我々のアーキテクチャに基づくデバイスは、約1万分の1のエネルギーを使って、単純な画像ベンチマークでGPUと同等の性能を達成できることを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:09:19 GMT)
emg2speech: synthesizing speech from electromyography using self-supervised speech models [0.0] 本稿では,音声の調音中に口腔筋から収集した筋電図(EMG)信号を直接音声に変換する神経筋音声インタフェースを提案する。
自己教師音声(SS)表現は筋活動電位の電気力と強い線形関係を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:50:15 GMT)
XTS mode revisited: high hopes for key scopes? [0.0] 本稿では,ストレージセクターベースの暗号化アプリケーションにおいて,XTSブロック暗号化モードを簡潔に要約する。
我々は,IEEE 1619 規格に新たに導入されたキースコープの変更について,建設的な議論を行うための統一的な基盤を提供することを目標としている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:45:40 GMT)
Where did you get that? Towards Summarization Attribution for Analysts [0.0] 我々は、要約中の各文をソーステキストの一部にリンクする、帰属のための自動メソッドに焦点を当てる。
本稿では,ハイブリッド要約,すなわち抽出要約の自動パラフレーズを用いて,属性の容易化について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:24:44 GMT)
What do model reports say about their ChemBio benchmark evaluations? Comparing recent releases to the STREAM framework [0.0] ほとんどのフロンティアAI開発者は、新しいAIモデルの安全性評価をモデルレポートに公開している。
しかし、現在、開発者はレポートに -- あるいは省略 -- 評価方法論のどの側面を含んでいますか?
本稿では、2025年春に発表された3つのフロンティアAIモデルレポートについて、最も詳細なドキュメンテーションについて検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:49:18 GMT)
Validating Alerts in Cloud-Native Observability [0.0] 本稿では,観測可能性実験ツールOXNの警告拡張について紹介する。
エンジニアは、開発中にアラートを早期に試すことができる。
OXNを使えば、エンジニアは設計時にルールを調整でき、警告の発射動作を定期的に検証できる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:05:12 GMT)
VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment [0.0] 本稿では,視覚言語キャプション・エンハンサー(VLCE)を導入し,災害画像の包括的,文脈的にインフォームドされた説明を作成する。
VLCEでは、XBDデータセットのEuroSat衛星画像に事前トレーニングされたResNet50バックボーンを備えたCNN-LSTMモデルと、RescueNetデータセットのUAV画像に事前トレーニングされたViTモデルという、デュアルアーキテクチャのアプローチを採用している。
セマンティックアライメントにはCLIPScore,キャプション情報にはInfoMetICを用いて,主要な視覚言語モデル(LLaVAとQwenVL)と比較してVLCEを評価する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:57:29 GMT)
Unsupervised Machine-Learning Pipeline for Data-Driven Defect Detection and Characterisation: Application to Displacement Cascades [0.0] 本研究では、変位カスケード欠陥を検出し、分類する、完全に教師なしの機械学習(ML)ワークフローを提案する。
Ni, Fe70Ni10Cr20, Zrの80keV変位カスケードを用いて, 欠陥形成に関与する不純物原子のごく一部を同定した。
ML外接点マップといくつかの従来の検出器間の統計的交差解析により、強い重複と相補的カバレッジが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:34:23 GMT)
Universal Limits on Quantum Correlations [0.0] 量子相関の限界により、量子力学と量子情報科学の基礎が確立された。
ここでは、すべての既知の相関制限と、新しい相関制限を導出できる一般的なフレームワークを紹介する。
すべての相関関係が古いか新しいかで、局所的なカタストロフィ-理論構造を示すことを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:33:38 GMT)
Towards a Method for Synthetic Generation of PWA Transcripts [0.0] 本研究では,AphasiaBank Cat Rescue 画像記述タスクの合成文字を生成する2つの方法を構築し,検証する。
これらの手法は, 単語ドロップ, フィラー挿入, パラファシア置換によって, 4つの重度レベル(Mild, Moderate, Severe, Very Severe)にまたがる書き起こしを生成する。
ミストラル7bは,失語症で観察される言語学的劣化の重要な側面を最もよく捉えている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:06:49 GMT)
Towards Personalized Treatment Plan: Geometrical Model-Agnostic Approach to Counterfactual Explanations [0.0] 4段階のステップを用いて高次元空間における反実的説明を生成する手法について述べる。
そこで我々は,境界面上の多くの離散点を発見し,最も近い事実的説明を同定する離散化手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:33:37 GMT)
Topological shaping of vortex neutron beams using forked phase gratings [0.0] 種々のトポロジカル電荷の分岐相格子からの渦中性子ビームの生成を実証した。
SESANSは、中性子の軌道角運動量(OAM)をより正確に測定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:10:38 GMT)
Time-resolved and Superradiantly Amplified Unruh Effect [0.0] 励起原子の集まりにおいて、ウンルー効果が初期の超放射能バーストとして現れる低加速条件を同定する。
結果として得られるアンルー信号は、時間と強度の両方において慣性信号から解決される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:52:16 GMT)
Thermometry of simulated Bose--Einstein condensates using machine learning [0.0] ボースガスの化学ポテンシャルと温度を迅速かつ非破壊的に推定するための機械学習手法を実証する。
我々の畳み込みニューラルネットワークは、ハーモニックトラップ構成における準2Dパンケーキの凝縮にのみ訓練されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:17:19 GMT)
Thermodynamics and State Preparation in a Two-State System of Light [0.0] 2段階の量子システムを熱環境に結合することは根本的な問題であり、キュービット状態の準備からスピンモデルまで幅広い応用がある。
Nボソンが熱浴に結合した2レベル系に浮かび上がることを実証した。
我々の実験は、量子技術における状態準備と量子熱力学の研究を約束する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:49:08 GMT)
The quantum Newton's bucket: Active and passive rotations in quantum theory [0.0] 量子系における「アクティブ」と「パッシブ」の回転の差について論じる。
我々は、量子場理論にどのように変換できるかについて議論した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:01:20 GMT)
The human-machine paradox: how collaboration creates or destroys value, and why augmentation is key to resolving it [0.0] 我々は、人間機械技術政策の真のボトムライン経済効果は、危険なほど誤解されていると論じる。
以上の結果から,複雑なシナリオにおいて,人間・機械戦略が最も経済的に有効である可能性が示唆された。
コンテキストが複雑でクリティカルな場合、単に人や機械のスキルをタスクに割り当てるだけでは不十分かもしれません。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:36:46 GMT)
The Narrative Continuity Test: A Conceptual Framework for Evaluating Identity Persistence in AI Systems [0.0] Narrative Continuity Test (NCT) は、AIシステムにおけるアイデンティティの永続化とダイアクロニックコヒーレンスを評価するためのフレームワークである。
NCTは、Situated Memory、Goal Persistence、Autonomous Self-Correction、Stylistic & Semantic stability、Persona/Role Continuityの5つの必要軸を定義している。
ケース分析では、ステートレス推論の下で予測可能な連続性障害が示される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:30 GMT)
Systematic Absence of Low-Confidence Nighttime Fire Detections in VIIRS Active Fire Product: Evidence of Undocumented Algorithmic Filtering [0.0] 夜間観測における低信頼度分類の完全欠如を示す。
このパターンは、月中、緯度帯、NOAA-20衛星とスオミ-NPP衛星の両方で世界中に持続する。
私は、VIIRSユーザガイドにこのアルゴリズム制約の明示的な文書を推奨します。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:51:30 GMT)
Surface Reading LLMs: Synthetic Text and its Styles [0.0] MLの進歩の潜在的な台地にもかかわらず、大きな言語モデルの社会的影響は、超知能に近づくのではなく、人間の文章と区別できないテキスト表面を生成することである。
本稿では,LLMが人間通信に登録する即時平面への参加として,「地表面の整合性」のセミオティックスを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:27:11 GMT)
Strong quantum interaction between excitons bound by cavity photon exchange [0.0] 偏光子-偏光子相互作用は、励起子結合エネルギーを減少させることで劇的に向上できることを示す。
我々の予測は、この物理学が中・遠赤外線における巨大な量子光学非線形性をもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:39:57 GMT)
Stability of Floquet sidebands and quantum coherence in 1D strongly interacting spinless fermions [0.0] フロケ・ブロッホ側バンド(FBs)の寿命における駆動のコヒーレンスにおける電子-電子相互作用と摂動の影響について検討する。
高周波駆動では,完全多体励起連続体から分離した長寿命FBが得られた。
現像像は、実空間単一粒子プロパゲータの挙動によってさらに解明される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:14:46 GMT)
Spoofing resilience for simple-detection quantum illumination LIDAR [0.0] 弱い光源を用いた物体検出と範囲検出は、侵入者による妨害や妨害に対して脆弱である。
非同時位相非感受性の同時測定による量子照明は、ジャミングレジリエンスをもたらす。
我々は、スプーフィングレジリエンスを含む量子照明ベースのプロトコルを実験的に実現可能なオブジェクト検出とレンジ検出を拡張した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:02:12 GMT)
Selecting Critical Scenarios of DER Adoption in Distribution Grids Using Bayesian Optimization [0.0] 我々は、分散グリッドにおいて最も重要なDER導入シナリオを選択するための新しい手法を開発した。
本稿では,多目的ベイズ最適化に基づく高効率検索フレームワークを提案する。
200-400バスによる現実的な給餌器のケーススタディは,我々のアプローチの有効性と精度を実証している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:52:26 GMT)
Seeding neural network quantum states with tensor network states [0.0] 行列積状態 (MPS) を多項単位からなる制限ボルツマンマシン波動関数に変換する効率的な手法を見出した。
この手法により、多体基底状態計算のための隠れた初期ニューラルネットワーク量子状態を生成することができる。
基底状態波動関数が複素ノルダー構造を持つより一般的な量子多体系への本手法の適用の可能性について論じる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:43:01 GMT)
Security Implications of User Non-compliance Behavior to Software Updates: A Risk Assessment Study [0.0] ソフトウェアアップデートの非準拠は、依然として広く問題となっている。
ソフトウェア更新に対するユーザの認識と行動に心理的要因がどのような影響を及ぼすかを検討した。
潜在的な脆弱性やリスクスコアに関する情報は、その行動に影響を与える。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:40:21 GMT)
Robustness is Important: Limitations of LLMs for Data Fitting [0.0] 大規模言語モデル(LLM)は幅広い設定に適用されている。
データフィッティングにLLMを使うことの重大な脆弱性を特定する。
変数名を変更することで、特定の設定で予測エラーのサイズを最大82%縮小することができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:52:33 GMT)
Reinforcement Learning for Long-Horizon Multi-Turn Search Agents [0.0] 大規模言語モデル(LLM)エージェントは、複雑なタスクを解決するために複数のターンとツールを利用できる。
この研究は、強化学習が経験から学ぶことによって、能力を大幅に推し進めることを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:00:42 GMT)
ReLaX-Net: Reusing Layers for Parameter-Efficient Physical Neural Networks [0.0] 本稿では,eXpanding a Neural Network (ReLaX-Net) アーキテクチャのためのレイヤ再利用を提案する。
単純な層間時間多重化方式を用いて,有効ネットワーク深度を増大させ,パラメータ数を効率的に活用する。
この結果から,ReLaX-Netは従来のPNNにわずかな変更を加えるだけで計算性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:25:41 GMT)
Quantum simulation of the phase transition of the massive Thirring model [0.0] QMETTSは、巨大なThiringモデルの相転移と熱力学特性を正確に再現することができる。
その結果,QMETTSはサイリングモデルの相転移と熱力学特性を正確に再現できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:49:08 GMT)
Quantum measurements and equilibration: the emergence of objective outcomes via entropy maximisation [0.0] 我々は、量子測度はエントロピーを最大化するために閉系の自然な傾向によって駆動されるという仮説を定式化する。
我々は、量子測定の自己完結型モデルの基礎を置き、簡単なスキームの改善を提案している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:17:35 GMT)
Quantum evolution with classical fields [0.0] 古典電磁場のための導波路は、量子ビット系の波動関数の量子進化を実現することができる。
位相シフト、スイッチ、ビーム分割は任意の量子ゲートの構築を可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:35:25 GMT)
Quantum advantage bounds for a multipartite Gaussian battery [0.0] 我々は、量子状態と古典状態の一貫性のある比較を可能にするモデルを分析する。
我々は、グローバル効率を、貯蔵エネルギーに対する抽出可能な作業(エルゴトロピー)の比率として定義する。
数値シミュレーションは、熱力学効率の類似した階層の出現を支持する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 07:59:00 GMT)
Quantum Relative Entropy implies the Semiclassical Einstein Equations [0.0] 半古典的アインシュタイン方程式が量子情報理論から直接現れることを証明する。
このことは、量子情報は、量子重力の理論のゼロ階近似と見なされるものにおいて、基本的な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:05:57 GMT)
Quantum Field Measurements in the Fewster-Verch Framework [0.0] 局所スミアフィールドのガウス変調測定がFewster-Verchフレームワークに適合していることを証明する。
技術的副産物として、線形スカラー場の下にある古典位相空間の有限ランクによって引き起こされる状態変換がアダマールの性質を保存することを確立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:50:07 GMT)
Quantum Coherence and Anomalous Work Extraction in Qubit Gate Dynamics [0.0] 一般化された循環型量子進化における作業抽出におけるコヒーレンスの寄与を定量化する枠組みを開発する。
特に、準確率分布の負性性により、個々のプロセスがエネルギーゲインと関連付けられている場合でも、作業が抽出されるという直感的なシナリオに焦点を当てる。
深部量子回路の準確率構造を解析し、全回路の作業統計と構成ゲートの作業統計を関連付ける構成関係を確立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:41:56 GMT)
Quantifying the Effects of Word Length, Frequency, and Predictability on Dyslexia [0.0] 単語レベルの特徴に一致した視線追跡を用いて、各特徴がディプレックスの時間コストにどのように影響するかをモデル化する。
これら3つの特徴は、典型的な読解時間と解読時間の両方において、しっかりと変化している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:15:31 GMT)
Quantifying Phonosemantic Iconicity Distributionally in 6 Languages [0.0] この研究は6つの異なる言語にまたがる規模で音韻マンティックな象徴性を定量化するための分布的アプローチを採っている。
各言語において,モーフィムの音声的類似性空間と意味的類似性空間のアライメントを統計的尺度を用いて解析する。
また,従来仮定されていた5つの音韻マンティックアライメントを解析し,そのようなアライメントの支持や,他のアライメントに対する混合結果を見出した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:10:02 GMT)
Quantifying Irreversibility via Bayesian Subjectivity for Classical & Quantum Linear Maps [0.0] 古典物理学や量子物理学において、不可逆過程は状態空間を収縮する写像によって記述される。
ベイズ推定では、情報の喪失は、参照先の選択によって、初期状態の遡及がますます影響される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 08:47:17 GMT)
ProofSketch: Efficient Verified Reasoning for Large Language Models [0.0] 本稿では,記号的クロージャ,語彙的検証,適応的スケッチ生成を統合した検証誘導推論フレームワークProofSketchを提案する。
実験の結果,ProofSketchはトークンの使用率を一定に抑えつつ精度を向上し,このアプローチが効率的かつ信頼性の高い推論に有望な経路を提供することを示した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:34:15 GMT)
Probing non-equilibrium topological order on a quantum processor [0.0] 超伝導量子ビットの配列上で, 理論的に [6] に提案されたフロケット位相秩序状態を実現する。
我々は、そのキラルエッジモードの特徴力学を画像化し、その創発性異音励起を特徴付ける。
我々の研究は、量子プロセッサが、物質の高度に絡み合った非平衡な状態の、遠方のほとんど探索されていない風景に重要な洞察を与えることができることを実証している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:16:50 GMT)
Predicting Barge Tow Size on Inland Waterways Using Vessel Trajectory Derived Features: Proof of Concept [0.0] 本研究では,機械学習(ML)を用いた曳航船数予測にAIS(Automatic Identification System)船体追跡データを用いた新しい手法を提案する。
モデルの訓練と試験のために、ミシシッピ川下流の衛星シーンからバージのインスタンスが注釈付けされた。
提案手法は,MDA(Maritime Domain Awareness)を,ロックスケジューリング,ポート管理,および貨物計画に強力な応用で拡張する,スケーラブルで容易に実装可能な手法を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:51:23 GMT)
Policy Cards: Machine-Readable Runtime Governance for Autonomous AI Agents [0.0] Policy Cardは、AIエージェントの運用、規制、倫理的制約を表現するための、マシン可読なデプロイ層標準である。
各ポリシカードは、自動検証、バージョン管理、ランタイムの実施、あるいは継続的監査パイプラインにリンクすることができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:59:55 GMT)
Pixels to Signals: A Real-Time Framework for Traffic Demand Estimation [0.0] 包括的な方法論は、トラフィックフローの最適化と遅延の最小化を目的として設計されている。
このフレームワークは、(a)車両検出、(b)交通予測、(c)交通信号最適化の3つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:04:53 GMT)
Physics-Informed Neural Network Frameworks for the Analysis of Engineering and Biological Dynamical Systems Governed by Ordinary Differential Equations [0.0] PINNは、挑戦的な数値シナリオを扱うための強力なアプローチを提供する。
PINNは、物理法則を直接学習プロセスに埋め込むことで、優れた結果を得ることができる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:00:59 GMT)
Physics-Informed Latent Neural Operator for Real-time Predictions of time-dependent parametric PDEs [0.0] ディープ・オペレーター・ネットワーク(DeepONet)は、偏微分方程式(PDE)によって支配される系の代理モデルとして約束されている。
本研究では,物理を直接学習プロセスに統合する物理インフォームトニューラルネットワークフレームワークPI-Latent-NOを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:58:31 GMT)
Perception Learning: A Formal Separation of Sensory Representation Learning from Decision Learning [0.0] 本稿では,エージェントの知覚インタフェースを最適化するパラダイムである知覚学習(PeL)を紹介する。
PeLは、ニュアンセへの安定性など、ラベルのない知覚特性を直接ターゲットとしている。
知覚品質を認定するタスク非依存評価指標のスイートを提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:19:49 GMT)
Pairing-induced phase transition in the non-reciprocal Kitaev chain [0.0] 非相反ホッピングとペアリングをフェミオンキタエフ鎖で誘導する。
ペアリング誘起相転移の出現を明らかにする。
我々の研究は超伝導ペアリングによる非相反性の非自明な分解を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:01:02 GMT)
Optimal Information Combining for Multi-Agent Systems Using Adaptive Bias Learning [0.0] 現在のアプローチでは、これらのバイアスを無視し、最適以下の決定につながるか、あるいは実際は不可能な高価なキャリブレーション手順を必要とする。
本稿は,これらの未知のバイアスをいつ学習し,正し,ほぼ最適性能を回復できるか,という根本的な問題に対処する。
バイアスを学習可能な体系的構成要素と既約コンポーネントに分解する理論的枠組みを開発する。
学習容易度が高いシステムは高い性能を回復できるが,学習可能性の低いシステムは最小限の利益を得られることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:52:33 GMT)
Odontoceti: Ultra-Fast DAG Consensus with Two Round Commitment [0.0] OdontocetiはDAGベースのコンセンサスの最新版で、既存の33%レベルではなく20%のフォールトトレランスで運用されている。
DAGベースのプロトコルとしては、わずか2回の通信ラウンドでコミットメントを達成し、中央値のレイテンシは300ミリ秒である。
本稿では,ブロックチェーンに対する低耐障害性コンセンサスプロトコルの実用性を確立する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:48:37 GMT)
Observation of vector rogue waves in repulsive three-component atomic mixtures [0.0] 粒子不均衡, 対数不和合性3成分のボース=アインシュタイン凝縮体におけるペレグリンソリトンベクター拡張の実験的観察を報告する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:37:04 GMT)
NeuroPathNet: Dynamic Path Trajectory Learning for Brain Functional Connectivity Analysis [0.0] 本稿では,脳機能分割間の接続経路の動的挙動を特徴付ける新しい経路レベル軌道モデリングフレームワーク(NeuroPathNet)を提案する。
本研究では,3つの公共機能型磁気共鳴イメージング(fMRI)データセット上でのモデル性能を検証し,複数の指標において既存の主流手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:07:06 GMT)
Miniaturized magnetic-field sensor based on nitrogen-vacancy centers [0.0] ダイヤモンド中の窒素空孔(NV)中心は、量子センシング技術の主要な候補である。
完全一体型で機械的に頑健な繊維ベースの内視鏡センサーで、先端径は1.25 Mathrmmm$である。
このセンサーは、5.9mathrmnT/sqrtmathrmHz$を50mathrmmW$のマイクロ波パワーで15mathrmmu m$のマイクロダイアモンドで撮影できる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:44:22 GMT)
Mind, Matter, and Freedom in Quantum Mechanics and the de Broglie-Bohm Theory [0.0] 量子力学が重要な貢献をしたと言われる重要な哲学的な問題もいくつかある。
デ・ブロイ=ボーム理論(またはボーム力学)を採用することで、これらの主張を裏付けることなく直接量子現象を説明できる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:52:44 GMT)
Metadata-Driven Retrieval-Augmented Generation for Financial Question Answering [0.0] 文脈的にリッチなドキュメントチャンクを作成するための高度なインデックスパイプラインを導入します。
我々は、検索前フィルタリング、検索後再ランク付け、エンリッチな埋め込みなど、さまざまな拡張のスペクトルをベンチマークする。
提案する最適アーキテクチャは、LLM駆動の事前検索最適化とコンテキスト埋め込みを組み合わせることで、優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:16:36 GMT)
MathBode: Understanding LLM Reasoning with Dynamical Systems [0.0] 大規模言語モデル(LLM)における数学的推論のための動的診断法であるMathBodeを提案する。
一つのパラメータを正弦波に駆動し、モデル出力と正確な解の第一高調波応答に適合する。
5つのクローズドフォームファミリにまたがって、診断面は系統的な低域通過挙動と位相ラグを呈し、精度のみを曖昧にしている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:44:55 GMT)
Low-overhead Magic State Circuits with Transversal CNOTs [0.0] 本稿では,耐故障性計算におけるCNOTの影響について検討する。
同様の状況下で他のプロトコルをさらに単純化するアルゴリズムと手法を開発した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:22:29 GMT)
Long-range resonances in quasiperiodic many-body localization [0.0] 準周期多体局在系(MBL)における長距離共鳴について検討した。
遠距離の長手相関関係の脂肪尾分布を特徴とし, 強い準周期ポテンシャルの広い非従来型体制を見いだした。
これらの知見は準周期的MBLの理解を前進させ、超低温原子系の密度相関測定を長距離共鳴のプローブとして同定した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:55:20 GMT)
Localized Kernel Projection Outlyingness: A Two-Stage Approach for Multi-Modal Outlier Detection [0.0] Two-Stage LKPLOは、新しいマルチステージアウトレイラ検出フレームワークである。
従来の射影的手法の制約を克服する。
挑戦的なデータセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:53:46 GMT)
Levée d'ambiguïtés par grammaires locales [0.0] 本稿では、ゼロサイレントレートの目的に適応し、SilberzteinのINTEXシステム(1993)で実装された語彙的曖昧化手法について述べる。
本稿では,このフレームワークで局所的な曖昧さの文法を検証するためには,トランスデューサの経路を別々に考えるだけでは不十分であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:38:22 GMT)
Learning to Drive Safely with Hybrid Options [0.0] 本研究は, 安全性と快適性の制約を組み込んだ縦・横操作の専用オプションを定義する。
提案手法は,最先端の強化学習手法に倣って,階層制御を選択肢付きで提案し,実用的なアルゴリズムを導出するものである。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:40:04 GMT)
Krylov exponents and power spectra for maximal quantum chaos: an EFT approach [0.0] 時間外秩序付き相関器(OTOC)とクリロフ複雑性(Krylov complexity)という,量子カオスの2つの尺度の関係を検証した。
シフト対称性だけでは、リャプノフ指数が極大である場合でも、極大クリロフ指数を強制するには不十分である。
ホログラフィックシステムで見られるいわゆる熱生成式によく似たスペクトルを持つ自己相関式を同定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:29:15 GMT)
Intrinsic Heisenberg-type lower bounds on spacelike hypersurfaces in general relativity [0.0] 我々は、物質と定数を持つ任意の時空の半径空間のような超曲面の測地球に厳密に局在した量子状態に対する座標および葉分非依存のハイゼンベルク型下界を証明した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:00:05 GMT)
InsurTech innovation using natural language processing [0.0] 本稿では,非構造化テキストを構造解析や意思決定に適した構造化データに変換することに焦点を当てる。
各種NLP技術を用いて, 商品保険状況における特徴脱バイアス, 特徴圧縮, 産業分類を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:52:14 GMT)
Improving User Experience with Personalized Review Ranking and Summarization [0.0] 本研究は、レビューランキングと抽象要約を統合し、意思決定効率を向上させるためのパーソナライズされたフレームワークを提案する。
70名を対象に行ったユーザスタディでは、パーソナライズされたアプローチが満足度、妥当性、意思決定の信頼性を改善した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:16:28 GMT)
Improved anharmonic trap expansion through enhanced shortcuts to adiabaticity [0.0] STA(Shortcut to adiabaticity)は、理論上も実験的にも、様々な量子制御タスクにうまく適用されている。
従来の研究において、著者らは、拡張された近道的近道的近道的近道的近道(eSTA)と呼ばれる近道的近道的近道的近道的拡張を開発した。
ここでは、この手法を一般化し、高次項を利用する代替eSTA法を構築する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:25:16 GMT)
Improved Accuracy of Robot Localization Using 3-D LiDAR in a Hippocampus-Inspired Model [0.0] 境界ベクトル細胞(BVC)は、特定の距離と同心方向の環境境界をコードする脊椎動物の脳のニューロンである。
ほとんどの計算的BVCモデルは2次元(2次元)環境に制限されており、環境に水平対称性が存在する場合、空間的曖昧さが生じる。
BVCフレームワークに垂直角感度を導入し、3次元の堅牢な境界検出を可能にする。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:24:02 GMT)
Hybrid Deep Learning Model to Estimate Cognitive Effort from fNIRS Signals [0.0] 本研究では,ハイブリッドDeepNetモデルを用いて,機能的近赤外分光データと性能スコアに基づく認知的努力を推定する。
本研究では,教育用クイズゲームにおいて,機能的近赤外分光法を用いて酸素化ヘモグロビンを採取した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:05:46 GMT)
HergNet: a Fast Neural Surrogate Model for Sound Field Predictions via Superposition of Plane Waves [0.0] 本稿では,2次元および3次元の音場を効率的に予測するためのニューラルネットワークアーキテクチャを提案する。
このネットワークはヘルムホルツ方程式を自動的に満たし、出力が物理的に有効であることを保証するように設計されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:39:10 GMT)
Group theoretic quantization of punctured plane [0.0] 我々は、標準群に対応するリー代数の間の代数準同型、$mathscrG = R2 rtimes (SO(2)times R+)$を確立する。
古典的可観測物の部分空間 $fin Cinfty(M)$ をヒルベルト空間上の自己随伴作用素 $mathscrH$ に写す量子化写像を導出する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:54:37 GMT)
Graph-Attentive MAPPO for Dynamic Retail Pricing [0.0] 本稿では,小売価格最適化のためのマルチエージェント強化学習の体系的研究について述べる。
強MAPPOベースラインとグラフ付加型MAPPO+GATの比較を行った。
その結果,MAPPOはポートフォリオレベルの価格管理のための堅牢で再現可能な基盤を提供することが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 00:15:59 GMT)
Gouy Phase-Related Effects in the Free-Space Optical Modulation of Free Electrons [0.0] 自由電子波関数を光で変調することは、アト秒間電子パルス列を作る新しい機会をもたらす。
これらの応用に適した自由電子波動関数を効率的に生成することが重要である。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:11:46 GMT)
GEPOC Parameters -- Open Source Parametrisation and Validation for Austria, Version 2.0 [0.0] この研究には、オーストリアのモデルパラメータの計算のためのデータ処理手法の完全な記述が含まれている。
この文書は、最も重要なGEPOCモデルであるGEPOC ABMのパラメータの計算に特に重点を置いている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:45:01 GMT)
Frustration-Free Control and Absorbing-State Transport in Entangled State Preparation [0.0] フラストレーションフリーハミルトニアンの概念を動的に拡張する量子状態準備のための測定フィードバックプロトコルについて検討する。
対象状態への緩和は非局所電荷の緊急輸送によって制御されることを示す。
観測された量子力学における制御された絡み合い状態の準備と電荷輸送の探索の戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:00:01 GMT)
Frequency-Aware Vision Transformers for High-Fidelity Super-Resolution of Earth System Models [0.0] 超解像法はスペクトルバイアスを示し、貴重な高周波の詳細よりも容易に低周波コンテンツを再構成する。
本稿では、ViSIR(Vision Transformer-Tuned Sinusoidal Implicit Representation)とViFOR(Vi Vision Transformer Fourier Representation Network)の2つの周波数対応フレームワークを紹介する。
その結果、ViFORは、気候データダウンスケーリングのための最先端でスケーラブルなソリューションとして確立された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:06:34 GMT)
Freeze and Conquer: Reusable Ansatz for Solving the Traveling Salesman Problem [0.0] 本稿では, (i) 置換のコンパクト符号化と (ii) 最適化フリーズ・再利用戦略を組み合わせたトラベリングセールスマン問題 (TSP) の変分アルゴリズムを提案する。
このパイプラインは、テストにおいてコストのかかる構造的な研究を排除し、NISQハードウェア上で即時にプロシージャを実装できるようにする。
その結果, 解の質を低下させることなく, アンザッツの凍結が解の時間と解の時間を大幅に短縮できることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:27:51 GMT)
Forecasting precipitation in the Arctic using probabilistic machine learning informed by causal climate drivers [0.0] 本研究では,降水の動態と重症度をモデル化し,予測するための確率論的機械学習フレームワークを提案する。
不確実性を考慮するために、校正された非パラメトリック予測区間の生成を可能にする共形予測法を用いる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:05:34 GMT)
Forecasting Outside the Box: Application-Driven Optimal Pointwise Forecasts for Stochastic Optimization [0.0] 軽微な仮定の下では、この問題は一つのシナリオで解決できることを示します。
一般に最適なシナリオを見つけることは難しいが、文脈情報を用いた最適化問題では特に有用であることを示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:54:54 GMT)
Fields of covariances on non-commutative probability spaces in finite dimensions [0.0] 非可換確率空間からヒルベルト空間への反変関手である共変体の概念を導入する。
有限次元非可換確率空間の場合、そのような場の完全な分類が得られる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:45:18 GMT)
Exploiting biased noise in variational quantum models [0.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェア上で量子ユーティリティを実証するための有望なツールである。
古典的最適化過程における量子ノイズの影響について検討する。
トワイリングは、ノイズをシンメトリーズするために標準的な誤り軽減戦略でよく用いられるが、実際には変動条件下での性能を低下させる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:14:20 GMT)
Evaluating the Use of Large Language Models as Synthetic Social Agents in Social Science Research [0.0] 大規模言語モデル(LLM)は、社会科学における合成エージェントとしてますます使われてきている。
本稿では,アウトプットの解釈において考慮すべき注意点を概説し,実用的なリフレーミングを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:00:46 GMT)
Evaluating Device-First Continuum AI (DFC-AI) for Autonomous Operations in the Energy Sector [0.0] エネルギー部門における産業自動化には、ネットワークの可用性に関係なく自律的に動作するAIシステムが必要である。
本稿では,Device-First Continuum AI(DFC-AI)の臨界エネルギーセクターへの応用について検討する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:07:32 GMT)
Equivalence of Discrete and Continuous Otto-Like Engines assisted by Catalysts: Mapping Catalytic Advantages from the Discrete to the Continuous Framework [0.0] 離散二ストロークエンジンの触媒拡張は環状補助系を用いる。
離散的ユニタリ過程と熱化過程を相互作用ハミルトンおよびマルコフ散逸モデルにマッピングする。
この写像はオットーエンジンの最も単純な触媒拡張であり、連続状態における触媒強化を示す。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 10:05:19 GMT)
Epileptic Seizure Detection and Prediction from EEG Data: A Machine Learning Approach with Clinical Validation [0.0] 本稿では,リアルタイムの発作検出と予測を統合した新しい手法を提案する。
提案手法はCHB-MIT Scalp EEG Databaseを用いて評価した。
この発作を予測できる能力は、反応性の発作管理からより積極的なアプローチへと大きく変化している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:28:18 GMT)
Engineering chlorine-based emitters in silicon carbide for telecom-band quantum technologies [0.0] 光ファイバテレコム帯における4H-SiC発光における塩素空孔(ClV)色中心の実験的実現と光学的特性について報告する。
ClV欠陥はCMOS互換プラットフォームにおける新しいテレコムバンドカラーセンターのクラスであり、スケーラブルな量子ネットワークに強力な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 22:09:54 GMT)
Emergent Bell-Triplet State in Proton-Proton Scattering [0.0] 絡み合いは量子情報科学の基本的な資源である。
実験室エネルギー151MeVにおけるベル・トリップレット状態の出現を報告する。
この第2次最大絡み合った状態は、前階カイラル実効場理論を超えたテンソル力によって直接形成される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:46:25 GMT)
Efficient Post-Selection for General Quantum LDPC Codes [0.0] 低信頼度計算結果を捨てるポストセレクション戦略は、量子誤り訂正の有効な忠実度を著しく向上させることができる。
我々は,エラークラスタ統計を利用した計算効率の高い信頼度指標に基づくポストセレクション戦略を開発する。
本手法は,QLDPC符号を用いたフォールトトレラント量子コンピューティングにおいて,効率的なポストセレクションのための実用的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 12:22:52 GMT)
Efficiency Without Cognitive Change: Evidence from Human Interaction with Narrow AI Systems [0.0] 狭義のAIツールへの短期的な露出は、コア認知能力を高める。
問題解決や言語理解の標準化には、ポスト前の大きな違いは現れなかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:55:44 GMT)
EDC: Equation Discovery for Classification [0.0] 新たなEDベースのバイナリ分類フレームワークを提案する。
提案手法は,管理可能なサイズの解析関数を求める。
対象方程式の構造とパラメータの値の両方をEDCが発見できることを実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:20:06 GMT)
Dynamical system analysis of quantum tunneling in an asymmetric double-well potential [0.0] 我々は、エレンフェスト形式に根ざした力学系に基づくアプローチを用いて、非対称二重井戸ポテンシャルにおける量子トンネルの研究を行った。
システムを引き付けるのに必要となる近似的閉包は、平均と分散の力学系を減らし、ポテンシャルの非対称性のために歪みが明示的に入る。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 06:11:28 GMT)
Do Chatbots Walk the Talk of Responsible AI? [0.0] 本研究では、主要なAI企業が公然と主張する責任あるAI原則を実装しているかどうかを検討する。
著者らは4つの主要なチャットボット(ChatGPT、Gemini、DeepSeek、Grok)を会社のウェブサイト、技術ドキュメント、直接的な評価で分析する混合メソッドアプローチを採用した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:31:24 GMT)
Distinct Types of Parent Hamiltonians for Quantum States: Insights from the $W$ State as a Quantum Many-Body Scar [0.0] 簡単な量子状態を考え、これらの状態が正確な固有状態である地元のハミルトン状態を調べる。
これらの状態はしばしば、それぞれの親ハミルトニアンの量子多体スカー(QMBS)に対応する。
より一般的な結果は、製品状態のような単一の型が存在する単純な量子状態や、短距離の絡み合った状態に対して、すぐに結果が得られる親ハミルトン型に導かれる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:59:12 GMT)
Design and Optimization of Cloud Native Homomorphic Encryption Workflows for Privacy-Preserving ML Inference [0.0] ホモモルフィック暗号化(HE)は、暗号化されたデータに対する暗号計算を可能にする魅力的な技術として登場した。
大規模クラウドネイティブパイプラインにおけるHEの統合は、高い計算オーバーヘッド、オーケストレーションの複雑さ、モデル互換性の問題によって制限されている。
本稿では、プライバシML推論をサポートするクラウドネイティブな同型暗号化の設計と最適化のための体系的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:13:32 GMT)
Deep Learning-Enhanced Calibration of the Heston Model: A Unified Framework [0.0] ヘストン・ボラティリティ・モデル (Heston volatility model) は、ヨーロッパの価格設定において金融数学において広く用いられるツールである。
本稿では,計算効率と校正手順の精度を両立させるハイブリッドディープラーニングベースのフレームワークを提案する。
実S&P 500オプションデータに対する実験結果から、ディープラーニングアプローチが従来のキャリブレーション手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:21:55 GMT)
Decision-Making Amid Information-Based Threats in Sociotechnical Systems: A Review [0.0] 技術システムは人間の情報交換をますます仲介し、人間と人工エージェント間の相互作用を分散させる。
このレビューは、情報に基づく脅威に脆弱性を媒介し、行動結果を形成する共有認知メカニズムを特定するために、両方のドメインから洞察を合成する。
これらの視点を統合することを目的とした今後の研究の方向性を概説し、人間の脆弱性を緩和し、人間と機械の表現を整合させることの重要性を強調した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:26:41 GMT)
DWaste: Greener AI for Waste Sorting using Mobile and Edge Devices [0.0] DWasteは、リソースに制約のあるスマートフォンやエッジデバイスでリアルタイムに廃棄物をソートするために設計されたコンピュータビジョンベースのプラットフォームである。
私たちの研究は、エッジデバイス上でのリアルタイムで持続可能な廃棄物ソートをサポートするために、"Greener AI"モデルの実装が成功したことを実証しています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:44:35 GMT)
CustomIR: Unsupervised Fine-Tuning of Dense Embeddings for Known Document Corpora [0.0] CustomIRは、ドメイン固有のコーパスへの言語埋め込みモデルの教師なし適応のためのフレームワークである。
実験の結果、CustomIRはRecall@10の2.3ポイントまでの小さなモデルで検索効率を継続的に改善することがわかった。
これらの結果は、ターゲットとなる合成微調整が、ドメイン固有のパフォーマンスを高めるためのスケーラブルでコスト効率の高い戦略を提供することを示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:15:47 GMT)
Covert Surveillance in Smart Devices: A SCOUR Framework Analysis of Youth Privacy Implications [0.0] 発見によると、スマートデバイスは、特に若者向けに作られたスマートおもちゃや音声で起動するスマートガジェットで、個人情報を隠蔽している。
これらの問題は、不明瞭なデータ収集のプラクティスと、スマートデバイスアプリケーションにおける透明性の欠如によって悪化している。
発見は、ポリシー開発と、スマートデバイスのデータ収集の透明性に重大な影響を及ぼす。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:10:10 GMT)
Copula-Stein Discrepancy: A Generator-Based Stein Operator for Archimedean Dependence [0.0] 統計的依存の幾何学に合わせた相違点のクラスであるCopula-Stein Disrepancyを導入する。
幅広い種類のアルキメデスコプラに対して、このアプローチはスカラー生成関数から派生した閉形式ステイン核を生成する。
このフレームワークは、楕円形やブドウのコプラを含む、一般的な非アルキメデスのコプラにまで拡張されている。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:33:57 GMT)
Comparing physical quantities with finite-precision: beyond standard metrology and an illustration for cooling in quantum processes [0.0] 一般量子系における有限精度冷却の概念を導入する。
本研究では, 過渡状態と定常状態の双方に対して, 有限精度内における冷却の発生を実証する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 14:55:36 GMT)
Bounds on Lorentz-violating parameters in magnetically confined 2D systems: A phenomenological approach [0.0] 本稿では、磁区2次元電子系を用いて最小のSME係数を$a_mu$および$b_mu$で制限する枠組みを提案する。
有効質量を持つ非相対論的(Schr"odinger--Pauli)極限で働くと、円筒ジオメトリーのラジアル問題を導出する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 11:11:59 GMT)
Bio-Inspired Neuron Synapse Optimization for Adaptive Learning and Smart Decision-Making [0.0] 神経相互作用にインスパイアされた新しいメタヒューリスティックアルゴリズムである神経最適化(NSO)を紹介する。
このアルゴリズムは人気のあるメタヒューリスティックスと最近発表されたHippopotamus Optimization Algorithm (HOA)とをベンチマークした。
ベンチマークの結果、NSOは収束速度、堅牢性、スケーラビリティという点で他の主要なアルゴリズムよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 03:58:11 GMT)
Audio Signal Processing Using Time Domain Mel-Frequency Wavelet Coefficient [0.0] 本稿ではウェーブレット変換の概念を組み合わせた時間領域におけるメルスケール特徴抽出手法を提案する。
貯水池計算手法を用いた時間領域メル周波数ウェーブレット係数(TMFWC)法は,音声信号処理の効率を大幅に改善した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:31:52 GMT)
Approaching the Thermodynamic Limit of an Ideal Gas [0.0] 容器に閉じ込められた気体に対して、粒子-壁相互作用は、気体粒子の平均表面密度を含む分配関数に変化をもたらす。
正準アンサンブル内の粒子壁相関の古典的および量子的モデルと対比する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:48:25 GMT)
All in one timestep: Enhancing Sparsity and Energy efficiency in Multi-level Spiking Neural Networks [0.0] スパイキングニューラルネットワーク(SNN)は、最も有望なバイオインスパイアされたニューラルネットワークモデルの一つである。
瞬時スパイクのバイナリの性質は、SNNにかなりの情報損失をもたらし、精度が低下する。
本稿では,低量子化誤差と最小推論遅延を両立できるマルチレベルスパイキングニューロンモデルを提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 17:03:33 GMT)
Algorithmic Randomness, Exchangeability, and the Principal Principle [0.0] 私たちは、このフレームワークを使ってプリンシパル原則を導出する方法を示します。
主原理は、ノーモロジー的制約と帰納的学習の整合性の数学的結果として現れる。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 04:26:19 GMT)
AdvBlur: Adversarial Blur for Robust Diabetic Retinopathy Classification and Cross-Domain Generalization [0.0] 糖尿病網膜症(DR)は、世界中の視覚障害の主要な原因である。
基礎画像からDRを予測するためのディープラーニング(DL)モデルが開発されている。
取得装置の違い、人口格差、画像条件の違いによる分布変動によるロバスト性維持における多くの課題に直面している。
本稿では,AdvBlurと呼ばれる新しいDR分類手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 02:10:54 GMT)
Adoption of AI-Driven Fraud Detection System in the Nigerian Banking Sector: An Analysis of Cost, Compliance, and Competency [0.0] 本研究では,ナイジェリアの銀行におけるAIによる不正検出システムの適用範囲と決定要因について検討した。
この研究の人口はナイジェリアの24の銀行から成っている。
その結果,トップマネジメントサポート,ITインフラストラクチャ,規制コンプライアンス,スタッフの能力,有効性がAIによる不正検出システムの採用を促進することがわかった。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 21:30:20 GMT)
Addressing Local Realism through Bell Tests at Colliders [0.0] 量子相関の2つの例は、量子絡み合いとベル非局所性である。
ベル非局所性は、局所現実主義が有効な記述である理論の区別において二重の役割を担っているため、特別な位置を占める。
本研究では,検出器が特定の確率で正しい結果を報告する実験においてベル試験について検討した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 19:53:21 GMT)
Adaptive EEG-based stroke diagnosis with a GRU-TCN classifier and deep Q-learning thresholding [0.0] 我々は32チャネル信号からパワースペクトル密度特徴(Welch)に変換する適応型EEGマルチタスクを提案する。
再帰畳み込みネットワーク(GRU-TCN)を用いて、脳卒中型(健康、虚血、出血)、半球側方化、重度の予測を行い、DQN(Deep Q-network)を用いて意思決定閾値をリアルタイムで調整する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:48:48 GMT)
Access to Klein Tunneling via Space-Time Modulation [0.0] 電磁ポテンシャルの時空変調により、クライントンネルは静的しきい値よりはるかに下にあることが示される。
関連するエネルギー閾値の減少は、フライングフォーカスフロントと相対論的電子ビームを用いた実験的実現の可能性を示している。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 01:55:27 GMT)
Accelerated relaxation and Mpemba-like effect for operators in open quantum systems [0.0] ムペンバ効果は、定常状態から遠く離れた量子系が比較的近い状態よりも速く緩和するときに起こる。
オープン量子系設定における作用素の緩和力学において、この非常に非直感的な効果の存在を探索する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:59:35 GMT)
A word association network methodology for evaluating implicit biases in LLMs compared to humans [0.0] 大規模言語モデル(LLM)における暗黙バイアス評価のための新しい単語関連ネットワーク手法を提案する。
提案手法では,LLMに符号化された暗黙的関係構造を解析し,バイアスの定量的および定性的評価を行う。
提案手法の有用性を実証するために, 性別, 宗教, 民族性, 性的指向, 政党に関連する社会的偏見を調べるために, 人間と多用されたLLMの両方に適用した。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 15:03:18 GMT)
A simple electromagnetic model of the electron [0.0] 我々はQED電子の現実的な微視的モデルを提供するトロイダル電磁アンザッツを提案する。
提案されたトロイダル電磁波はマクスウェルの方程式を満足し、電子の基本的性質を再現する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 20:13:54 GMT)
A Sub-kHz Mechanical Resonator Passively Cooled to 6 mK [0.0] 700Hz (1.5 ng) の機械式カンチレバーを6.1(4)mKまで冷却した。
最低温度では、共振器の熱運動は背景雑音と明確に区別できる。
これらの結果は、低周波共振器をサブミルリクトルビン系に冷却する受動的経路を舗装する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 09:04:47 GMT)
A Path Integral Treatment of Time-dependent Dunkl Quantum Mechanics [0.0] 伝搬器の明示的な表現を開発するため,経路積分を再構成した。
この定式化は、時間依存質量と周波数を持つダンクルハーモニック発振器を含む特定のケースに適用される。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:01:08 GMT)
A No-Go Theorem for Shaping Quantum Resources [0.0] 我々は、任意の滑らかなハミルトン力学の下では、高次統計モーメントの制御は不可能であることを示す。
シンプレクティックな(クリフォード)力学と、ゴッテマン-クニル極限を超えた非シミュラブルな状態の間の解析的境界を同定する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 16:07:48 GMT)
A Euclidean Monte-Carlo-informed route to ground-state preparation for quantum simulation of scalar field theory [0.0] 量子シミュレータは、量子場理論のリアルタイム(ミンコフスキー)力学の研究に大いに期待できる。
本研究では古典情報を利用して、(1+1)次元の相互作用するスカラー場の理論に対してユークリッドとミンコフスキーの記述を橋渡しする。
モンテカルロデータを用いた選択波動関数モーメントにより、効率よく量子回路に変換できるアンサーゼを得る。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 18:24:50 GMT)
50 Years of Water Body Monitoring: The Case of Qaraaoun Reservoir, Lebanon [0.0] レバノン最大の表層水域であるカラオウン貯水池の持続的な管理は、その貯蔵量の信頼性に頼っている。
本研究では, オープンソースの衛星画像, 高度水没セグメンテーション, 機械学習を統合したセンサレスアプローチにより, 貯水池表面積と体積をほぼリアルタイムで推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Oct 2025 13:23:32 GMT)