MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling [115.6] MiroThinkerは、ツール拡張推論と情報検索機能を向上させるために設計されたオープンソースの研究エージェントである。
モデルサイズやコンテキスト長のみをスケールアップする以前のエージェントとは異なり、MiroThinker氏はモデルレベルでのインタラクションスケーリングについて検討している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:52:07 GMT)
Abstract 3D Perception for Spatial Intelligence in Vision-Language Models [100.1] 視覚言語モデル(VLM)は、空間認識や物理的理解といった3D関連課題に苦しむ。
我々は,VLMの幾何学的構造と物理力学を符号化するために,抽象的境界ボックスを利用するフレームワークであるSandboxVLMを紹介した。
提案手法は空間知能を常に向上させ,SAT Realの8.3%のゲインをベースライン法と比較して達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:16:09 GMT)
Music Flamingo: Scaling Music Understanding in Audio Language Models [98.9] Music Flamingoは、基礎的なオーディオモデルにおける音楽理解を促進するために設計された、新しい大きなオーディオ言語モデルである。
MF-Skillsはマルチステージパイプラインを通じてラベル付けされたデータセットで、調和、構造、音色、歌詞、文化的な文脈をカバーする豊富なキャプションと質問応答ペアを生成する。
MF-Thinkは音楽理論に基づく新しいチェーン・オブ・シンク・データセットで、続いてGRPOベースの強化学習とカスタム報酬を取り入れた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:47 GMT)
WEAVE: Unleashing and Benchmarking the In-context Interleaved Comprehension and Generation [98.5] We present WEAVE, the first suite for in-context interleaved cross-modality comprehension and generation。
WeAVE-100kは、370Kのダイアログターンと500Kイメージにまたがる100Kのインターリーブサンプルの大規模なデータセットである。
WeAVEBenchは480の画像に基づいた100のタスクを備えた人手によるベンチマークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:02:38 GMT)
Language-Guided Graph Representation Learning for Video Summarization [96.3] 本稿では,映像要約のためのLGRLN(Language-guided Graph Representation Learning Network)を提案する。
具体的には,ビデオフレームを構造化グラフに変換して時間的順序と文脈依存性を保存するビデオグラフ生成装置を提案する。
提案手法は,複数のベンチマークにおいて既存手法より優れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:35:48 GMT)
Black-Box On-Policy Distillation of Large Language Models [95.6] ブラックボックス蒸留は、プロプライエタリな教師モデルのテキスト出力から学習することで、学生の大きな言語モデル(LLM)を生成する。
本稿では,行政上およびブラックボックス蒸留が可能なGAD(Geneversarative Adrial Distillation)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:03 GMT)
Enhancing the Outcome Reward-based RL Training of MLLMs with Self-Consistency Sampling [90.9] マルチモーダル大言語モデル(MLLM)のステップ・バイ・ステップ推論を洗練させる手段としては,アウトカム・リワード強化学習(RL)が一般的であり,ますます重要になっている。
この問題を修正するために,自己整合サンプリング(SCS)を提案する。
Qwen2.5-VL-7B-インストラクトに基づいて、SCSは、無視できる余分な計算を伴う6つのマルチモーダルベンチマークにおいて、最大7.7ポイントの精度を向上する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:14 GMT)
MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation [86.8] テキストと画像の出力モダリティの両方を評価するための新しいベンチマークを提案する。
この性能劣化は、生成した推論と最終画像との整合性に強く相関する。
本稿では,テキストと画像間の双方向の連続的相互作用を可能にする並列多モード拡散フレームワークMMaDA-Parallelを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:35 GMT)
VisMem: Latent Vision Memory Unlocks Potential of Vision-Language Models [78.9] VisMemはヴィジュアル・ランゲージ・モデルに動的潜在視覚記憶、微細な知覚保持のための短期モジュール、抽象的セマンティック・コンソリデーションのための長期モジュールを装備するフレームワークである。
我々の実験によると、VisMemはバニラモデルと比較して11.8%の大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:51:34 GMT)
SSR: Socratic Self-Refine for Large Language Model Reasoning [78.6] Socratic Self-Refine (SSR)は、大規模言語モデル(LLM)のきめ細かい評価と精度向上のための新しいフレームワークである。
提案したSSRはモデル応答を検証可能な(サブクエスト,サブサブアンサー)ペアに分解し,ステップレベルの信頼度推定を可能にする。
5つの推論ベンチマークと3つのLCMによる実証的な結果から、SSRは一貫して最先端の反復的自己修正ベースラインを上回っていることが分かる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:16 GMT)
MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.7] MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。
TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:05 GMT)
Boosting In-Silicon Directed Evolution with Fine-Tuned Protein Language Model and Tree Search [67.2] 大規模言語モデルの革新的パラダイムを活用することにより,タンパク質配列を進化させる新しいフレームワークであるAlphaDEを提案する。
第一に、AlphaDEファインチューンは、タンパク質配列のマスク言語モデルを用いて、関心のあるタンパク質クラスの進化的妥当性を活性化するタンパク質言語モデルである。
第二に、AlphaDEはモンテカルロ木探索に基づくテスト時間推論を導入し、微調整されたタンパク質言語モデルからの進化誘導でタンパク質を効果的に進化させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:20 GMT)
Divide, Conquer and Unite: Hierarchical Style-Recalibrated Prototype Alignment for Federated Medical Image Segmentation [66.8] フェデレートラーニング(Federated Learning)は、複数の医療機関がデータを共有することなく、グローバルなモデルをトレーニングすることを可能にする。
現在のアプローチは主に、重要なマルチレベルキューを見下ろす最終層機能に重点を置いている。
我々は,ドメイン不変のコンテキスト型プロトタイプアライメントを介して特徴表現ギャップをブリッジするFedBCSを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:15:34 GMT)
SemanticVLA: Semantic-Aligned Sparsification and Enhancement for Efficient Robotic Manipulation [65.6] 本稿では,効率的なロボットマニピュレーションのためのセマンティックスペーシフィケーション・エンハンスメントを実現する新しいVLAフレームワークSemanticVLAを提案する。
SemanticVLAはOpenVLA on LIBEROベンチマークを21.1%上回り、トレーニングコストと推論遅延を3.0倍と2.7倍に削減した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:58 GMT)
Depth Anything 3: Recovering the Visual Space from Any Views [64.1] 任意の数の視覚入力から空間的に一貫した幾何を予測するモデルとして,Depth Anything 3 (DA3) を提案する。
我々は、カメラのポーズ推定、任意のビュー幾何学、視覚レンダリングを含む新しいビジュアルジオメトリ・ベンチマークを構築した。
このベンチマークでは、DA3は全てのタスクをまたいで新しい最先端を設定し、以前のSOTA VGGTを平均44.3%の精度で上回り、幾何学的精度は25.1%である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:12 GMT)
ICX360: In-Context eXplainability 360 Toolkit [64.1] 大規模言語モデル (LLM) は日常的に広く普及し, より高度な応用が進んでいる。
LLMを説明するためのオープンソースのPythonツールキットであるIn-Context Explainability 360 (I CX360)を紹介する。
I CX360には、ブラックボックスとホワイトボックスの両方を使ってLCMを説明する最近の3つのツールの実装が含まれている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:55 GMT)
Synthetic Voices, Real Threats: Evaluating Large Text-to-Speech Models in Generating Harmful Audio [63.2] この研究は、TSシステムを利用して有害なコンテンツを含む音声を生成する、コンテンツ中心の脅威を探究する。
HARMGENは、これらの課題に対処する2つのファミリーにまとめられた5つの攻撃群である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:00:04 GMT)
AUVIC: Adversarial Unlearning of Visual Concepts for Multi-modal Large Language Models [63.1] を強制する規制フレームワークは、機械学習の必要性を喚起します。
AUVICはMLLMのための新しい視覚概念アンラーニングフレームワークである。
AUVICは,非ターゲット概念の性能劣化を最小限に抑えつつ,最先端の目標忘れ率を実現していることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:35:32 GMT)
VP-Bench: A Comprehensive Benchmark for Visual Prompting in Multimodal Large Language Models [62.5] 本稿では,視覚的プロンプトと利用におけるMLLMの能力を評価するベンチマークであるVP-Benchを紹介する。
VP-Bench氏は2段階評価フレームワークを使用している。 ステージ1は8つの形状と355の組み合わせにまたがる30k属性プロンプトを使用して、自然のシーンでVPを知覚するモデルの能力を調べる。
ステージ2では、VPが下流タスクに与える影響を調査し、現実の問題解決シナリオにおけるその効果を測定します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:06:25 GMT)
MVU-Eval: Towards Multi-Video Understanding Evaluation for Multimodal LLMs [61.7] MVU-EvalはMLLMのマルチビデオ理解を評価するための最初の包括的なベンチマークである。
私たちのMVU-Evalは、主に8つのコア能力を評価し、4,959本のビデオにまたがる1,824本の厳密にキュレートされた質問応答ペアを評価します。
これらの機能は、自律システムにおけるマルチセンサー合成や、クロスアングルスポーツ分析のような現実世界のアプリケーションと厳格に一致している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:46 GMT)
DocLens : A Tool-Augmented Multi-Agent Framework for Long Visual Document Understanding [59.4] 我々は、レンズのようなエビデンスに対して「効果的にズームインする」ツール強化マルチエージェントフレームワークであるDocLensを提案する。
最初はドキュメント全体から、関連するページの特定のビジュアル要素にナビゲートし、次にサンプリング・アジュディテーション機構を使用して、信頼できる1つの回答を生成する。
MMLongBench-DocとFinRAG-Vで最先端のパフォーマンスを達成し、人間専門家さえ超えている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:42:18 GMT)
Unsupervised Robust Domain Adaptation: Paradigm, Theory and Algorithm [58.4] 教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル豊富なソースドメインから、ドメインシフトに対処することで、ラベルなしのターゲットドメインに知識を転送することを目的としている。
ほとんどのUDAアプローチは転送能力を強調しているが、敵の攻撃に対する堅牢性を見落としていることが多い。
本稿は, 1) 防衛効果として知られるVATがUDAパラダイムで失敗する理由, 2) 攻撃下の一般化境界理論と, 古典的UDA理論からどのように進化するか, の3つに焦点をあてる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:54:06 GMT)
Simulating Distribution Dynamics: Liquid Temporal Feature Evolution for Single-Domain Generalized Object Detection [58.3] Single-Domain Generalized Object Detection (Single-DGOD)は、あるソースドメインで訓練された検出器を複数の未知のドメインに転送することを目的としている。
シングルDGODの既存の方法は通常、データの多様性を拡大するために離散的なデータ拡張や静的摂動法に依存している。
そこで本研究では,ソース領域から潜伏分布のシミュレーションに至るまでの機能の進化をシミュレートする手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:54 GMT)
PAS: A Training-Free Stabilizer for Temporal Encoding in Video LLMs [57.8] ビデオLLMは時間的不整合に悩まされ、フレームタイミングの小さなシフトは注意をそらすことができ、関連するフレームを抑えることができる。
本稿では, 位相アグリゲード平滑化(PAS)について述べる。これは, 頭部に小さな反対位相オフセットを適用して, 出力を集約する学習自由機構である。
解析の結果,RoPE回転ロジットは,時間核でスケールしたコンテントドット積として近似でき,このカーネルを滑らかにすることで,小さな時間シフトに対する注意のリプシッツ安定性が得られ,マルチフェーズ平均化は,Nyquist-valid サンプリング下での頭当たりスペクトルを保ちながら高周波リップルを減衰させることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:56:47 GMT)
Thinker: Training LLMs in Hierarchical Thinking for Deep Search via Multi-Turn Interaction [57.7] Thinkerはマルチターンインタラクションによるディープ検索のための階層的思考モデルである。
複素問題を独立に解ける部分確率に分解する。
サブプロブレム間の依存関係は、これらの論理関数を介してパラメータとして渡される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:24:15 GMT)
Training Neural Networks at Any Scale [57.0] 本稿では、効率とスケールを重視したニューラルネットワークのトレーニングのための最新の最適化手法についてレビューする。
本稿では,問題の構造に適応することの重要性を強調する統一的アルゴリズムテンプレートの下で,最先端の最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:58:07 GMT)
Towards Federated Clustering: A Client-wise Private Graph Aggregation Framework [57.0] フェデレーションクラスタリングは、分散化されたラベルのないデータからパターンを抽出する課題に対処する。
本研究では,プライバシ保護のための知識共有媒体として,局所構造グラフを革新的に活用する新しいアルゴリズムSPP-FGCを提案する。
我々のフレームワークは最先端のパフォーマンスを実現し、認証可能なプライバシー保証を維持しつつ、フェデレーションベースラインよりも最大10%(NMI)のクラスタリング精度を向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:05:22 GMT)
Learning Intersections of Halfspaces under Factorizable Distribution [56.5] ハーフスペースの交叉学習は計算学習理論における中心的な問題である。
たった2つのハーフスペースであっても、学習が時間内に可能かどうかという大きな疑問が残る。
本稿ではCSQ硬度障壁を確実に回避する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:04 GMT)
Autonomous Vehicle Path Planning by Searching With Differentiable Simulation [55.5] 計画では、エージェントが現実世界で実行する前に、アクションを安全に洗練することができる。
自動運転では、衝突を避け、複雑な密集した交通シナリオをナビゲートすることが不可欠である。
本稿では、微分可能シミュレータWaymaxを次の状態予測と批判の両方として活用するフレームワークである、微分可能探索シミュレーション(DSS)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:56:34 GMT)
URaG: Unified Retrieval and Generation in Multimodal LLMs for Efficient Long Document Understanding [55.5] MLLM内での検索と生成を統一するフレームワークであるURaGについて述べる。
URaGは,計算オーバーヘッドを44~56%削減し,最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:33 GMT)
Intilligence Foundation Model: A New Perspective to Approach Artificial General Intelligence [55.1] 我々は,人工知能基盤モデル(IFM)による人工知能(AGI)への新たな視点を提案する。
IFMは、多様な知的行動から直接学習することで、インテリジェンスの基礎となるメカニズムを取得することを目的としている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:34 GMT)
Intelligence Foundation Model: A New Perspective to Approach Artificial General Intelligence [55.1] 我々は,人工知能基盤モデル(IFM)による人工知能(AGI)への新たな視点を提案する。
IFMは、多様な知的行動から直接学習することで、インテリジェンスの基礎となるメカニズムを取得することを目的としている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:21:06 GMT)
OutSafe-Bench: A Benchmark for Multimodal Offensive Content Detection in Large Language Models [54.8] マルチモーダル時代に設計された,最も包括的なコンテンツ安全性評価テストスイートであるOutSafe-Benchを紹介する。
OutSafe-Benchには、4つのモダリティにまたがる大規模なデータセットが含まれており、18,000以上のバイリンガル(中国語と英語)テキストプロンプト、4500のイメージ、450のオーディオクリップ、450のビデオが9つの重要なコンテンツリスクカテゴリで体系的に注釈付けされている。
このデータセットに加えて,多次元クロスリスクスコア(Multidimensional Cross Risk Score, MCRS)も導入した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:41 GMT)
Efficient Thought Space Exploration through Strategic Intervention [54.4] 本稿では,この知見を2つの相乗的コンポーネントを通して操作するHint-Practice Reasoning(HPR)フレームワークを提案する。
フレームワークの中核となる革新は、動的に介入点を識別する分散不整合低減(DIR)である。
算術的および常識的推論ベンチマークによる実験は、HPRの最先端の効率-精度トレードオフを実証している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:41 GMT)
Learning to Pose Problems: Reasoning-Driven and Solver-Adaptive Data Synthesis for Large Reasoning Models [54.3] 本研究は, 生成前に問題方向を明示的に計画する問題生成装置の開発である。
我々は,合成問題に対する解法者のフィードバックを報奨信号として扱い,生成元が難易度を調整できるようにする。
本手法は平均2.5%の改善を実現し,言語モデルと視覚言語モデルの両方に一般化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:46 GMT)
Improving Multimodal Sentiment Analysis via Modality Optimization and Dynamic Primary Modality Selection [54.1] マルチモーダル・センティメント・アナリティクス(MSA)は、ビデオにおける言語、音響、視覚データから感情を予測することを目的としている。
本稿では,モーダリティ最適化と動的一次モーダリティ選択フレームワーク(MODS)を提案する。
4つのベンチマークデータセットの実験では、MODSが最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:21:11 GMT)
Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression [53.4] テキスト圧縮性能に基づくモデル効率の指標である情報容量を導入する。
主流のオープンソースモデルに対する実証的な評価は、シリーズ内のさまざまなサイズのモデルが一貫した情報容量を示すことを示している。
情報容量の特徴的な特徴は、入力と出力の両方のトークン数に影響を与えるトークン化効率が組み込まれていることである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:11 GMT)
Temporal Latent Variable Structural Causal Model for Causal Discovery under External Interferences [53.3] 観測データに影響を与える非観測因子を表現するために潜伏変数を導入する。
具体的には、因果強度と隣接情報を捉えるために、時間変動型因果モデルを提案する。
専門家の知識が特定のシナリオにおける未知の干渉に関する情報を提供することができることを考慮し,パラメータ学習への事前知識の導入を容易にする手法を開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:14 GMT)
LeJEPA: Provable and Scalable Self-Supervised Learning Without the Heuristics [53.2] JEPA(Joint-Embedding Predictive Architectures)は、有望な青写真を提供するが、実践的なガイダンスや理論の欠如がアドホックな研究開発につながっている。
我々はJEPAの包括的な理論を示し、それをbf LeJEPAでインスタンス化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:38:32 GMT)
HD$^2$-SSC: High-Dimension High-Density Semantic Scene Completion for Autonomous Driving [53.0] カメラベースの3Dセマンティックシーン補完(SSC)は、自動運転において重要な役割を果たす。
既存のSSC法は、固有の入出力次元ギャップとアノテーション-現実密度ギャップに悩まされている。
本稿では,画素セマンティクスを拡張した高次元高密度セマンティックシーンコンプリートフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:50:16 GMT)
Debiased Dual-Invariant Defense for Adversarially Robust Person Re-Identification [52.6] 人物再識別(ReID)は、歩行者軌道追跡などの現実の多くの応用において、基本的な課題である。
Person ReIDモデルは、歩行者画像に対する知覚不能な摂動が完全に誤った予測を引き起こすような、敵の攻撃に非常に敏感である。
本稿では,2つの相からなる二重不変防衛フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:35 GMT)
LiNeXt: Revisiting LiDAR Completion with Efficient Non-Diffusion Architectures [52.6] LiNeXtは、高速で正確なポイントクラウド補完に最適化された軽量で非拡散ネットワークである。
LiNeXtは推論の199.8倍の高速化を実現し、チャンファー距離を50.7%削減し、LiDiffと比較してパラメータの6.1%しか使用していない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:07 GMT)
MTAttack: Multi-Target Backdoor Attacks against Large Vision-Language Models [52.4] 我々は,LVLMにおける複数のトリガターゲットマッピングを正確に行うための,最初のマルチターゲットバックドアアタックフレームワークであるMTAttackを提案する。
人気のあるベンチマークの実験では、マルチターゲット攻撃に対するMTAttackの成功率が高いことが示されている。
我々の攻撃は、データセット間での強力な一般化性と、バックドア防衛戦略に対する堅牢性を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:32:27 GMT)
Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.2] 本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:11 GMT)
Order Matters: Rethinking Prompt Construction in In-Context Learning [52.2] In-context Learning (ICL)により、大規模言語モデルでは、例の列に条件付けすることで、新しいタスクを実行できる。
以前の作業のほとんどは、どの例が選択されたかが、これらの例の順序よりもパフォーマンスにはるかに大きな影響を与えると仮定している。
この仮定を再検討し、選択と順序付けの効果を体系的に比較する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:05 GMT)
Modelos Empiricos de Pos-Dupla Selecao por LASSO: Discussoes para Estudos do Transporte Aereo [51.6] 本研究は,器用変数モデルに適用した変分を含む,主2次後選択と後規則化モデルについて検討した。
航空輸送に焦点をあてた研究におけるアプローチの可能性について論じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:43 GMT)
AgentEvolver: Towards Efficient Self-Evolving Agent System [51.5] 本稿では,自律型エージェント学習を駆動する自己進化型エージェントシステムであるAgentEvolverを紹介する。
AgentEvolverは、セルフクエスト、セルフナビゲート、セルフコントリビューションという3つのシナジスティックメカニズムを導入している。
予備実験により、AgentEvolverは従来のRLベースのベースラインと比較して、より効率的な探索、より優れたサンプル利用、より高速な適応を実現していることが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:03 GMT)
SliderEdit: Continuous Image Editing with Fine-Grained Instruction Control [50.8] スライダ編集(SliderEdit)は、細粒度で解釈可能な命令制御による連続的な画像編集のためのフレームワークである。
複数部分の編集命令が与えられたSliderEditは、個々の命令をアンタングルして、グローバルにトレーニングされたスライダとして公開する。
本結果は,連続的,構成的制御による対話的,命令駆動型画像操作の道を開くものである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:52 GMT)
PriVi: Towards A General-Purpose Video Model For Primate Behavior In The Wild [50.7] 大規模な霊長類中心のビデオ事前トレーニングデータセットであるPriViを紹介する。
PriViには424時間のキュレートされたビデオがあり、11の環境での行動調査から174時間と、さまざまなWebソースの映像を250時間組み合わせている。
プリVi上でV-JEPAを事前訓練し, 軽量凍結分類器を用いて霊長類特有の表現を学習し, 評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:53 GMT)
OIDA-QA: A Multimodal Benchmark for Analyzing the Opioid Industry Documents Archive [50.5] オピオイド危機は公衆衛生にとって重要な瞬間である。
UCSF-JHU Opioid Industry Documents Archive(OIDA)に公開されているデータと文書
本稿では,文書属性に応じて元のデータセットを整理することで,この問題に対処する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:04:58 GMT)
OIDA-QA: A Multimodal Benchmark for Analyzing the Opioid Industry Documents Archive [50.5] オピオイド危機は、規制システム、医療実践、コーポレートガバナンス、公共政策にまたがるシステム的欠陥を明らかにする。
これらの医療関連法律および企業文書の複雑さ、マルチモーダル性、特殊特性は、より高度な方法とモデルを必要とする。
本稿では、文書属性に基づいて元のデータセットを整理し、400kのトレーニング文書と10kのテスト用ベンチマークを構築することで、この問題に対処する。
予備的な結果は、文書情報抽出および質問応答タスクにおけるAIアシスタントの改善を示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:31 GMT)
Parameter-Free Clustering via Self-Supervised Consensus Maximization (Extended Version) [50.4] 本稿では,SCMax と呼ばれる自己教師型コンセンサス最大化による,新しい完全パラメータフリークラスタリングフレームワークを提案する。
本フレームワークは,階層的なクラスタリングとクラスタ評価を単一の統合プロセスで行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:55 GMT)
Experience-Guided Adaptation of Inference-Time Reasoning Strategies [50.0] Experience-Guided Reasoner (EGuR) は蓄積された経験に基づいて推論時に調整された戦略を生成する。
EGuRは最強のベースラインに対して最大14%の精度向上を実現し、計算コストを最大111倍に削減する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:45:28 GMT)
PAN: A World Model for General, Interactable, and Long-Horizon World Simulation [49.8] PANは、汎用的で対話性があり、長い水平世界モデルである。
歴史と自然言語のアクションを前提とした高品質なビデオシミュレーションにより、将来の世界の状態を予測します。
実験により, PANは行動条件付き世界シミュレーション, 長期予測, シミュレーション推論において高い性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:55 GMT)
Adaptive Redundancy Regulation for Balanced Multimodal Information Refinement [49.6] 支配的モダリティの長期支配は、表現と出力の結合を弱める。
従来の手法はしばしば、有利なモジュラリティの勾配を直接的に均一に調整する。
バランスの取れたマルチモーダル情報リファインメントに対する適応冗長性制御を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:44:34 GMT)
Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning [49.6] 大規模言語モデル(LLM)は医療分野で大きな可能性を示しており、いくつかのベンチマークで高いパフォーマンスを実現している。
しかし、実際の医療シナリオではパフォーマンスが低下し続けており、コンテキスト認識の強化が要求されることが多い。
データ駆動型アプローチであるMultifaceted Self-Refinement (MuSeR)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:48:02 GMT)
Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning [49.6] 大規模言語モデル(LLM)は医療分野で大きな可能性を示しており、いくつかのベンチマークで高いパフォーマンスを実現している。
しかし、実際の医療シナリオではパフォーマンスが低下し続けており、コンテキスト認識の強化が要求されることが多い。
データ駆動型アプローチであるMultifaceted Self-Refinement (MuSeR)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:03 GMT)
Panda: Test-Time Adaptation with Negative Data Augmentation [49.4] 負データ拡張(NDA)に基づく新しいテスト時間適応(TTA)手法であるPandaを提案する。
パンダはPDA法に比べて優れた性能を示し, パンダと統合した場合, 広範囲なTTA法により大幅に性能が向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:46 GMT)
Text-guided Weakly Supervised Framework for Dynamic Facial Expression Recognition [49.4] 動的表情認識は、映像列間の顔の動きの時間的変化をモデル化することにより、感情状態の同定を目的としている。
DFERの重要な課題は、多数のフレームからなるビデオが単一の感情ラベルに割り当てられる、多対一のラベリングの問題である。
本稿では,テキスト誘導型弱教師付きフレームワークであるTG-DFERを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:49:58 GMT)
LangGPS: Language Separability Guided Data Pre-Selection for Joint Multilingual Instruction Tuning [49.2] 大規模言語モデル(LLM)の多言語命令追従能力と下流性能を改善するための多言語命令チューニングは広く採用されている手法である。
既存の選択法は、しばしばテキストの品質、多様性、タスク関連性といった特徴に基づいており、典型的には多言語データの固有の言語構造を見落としている。
言語分離性によって導かれる軽量な2段階事前選択フレームワークであるLangGPSを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:36 GMT)
RAGFort: Dual-Path Defense Against Proprietary Knowledge Base Extraction in Retrieval-Augmented Generation [49.1] Retrieval-Augmented Generationシステムでは、モデル応答を集約して知識ベースを複製するリコンストラクション攻撃の脅威が増大する。
本稿では,クラス間分離のための"コントラストリデクシング"とクラス内保護のための"制約付きカスケード生成"を組み合わせた構造対応デュアルモジュールディフェンスであるRAGFortを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:58 GMT)
ImAgent: A Unified Multimodal Agent Framework for Test-Time Scalable Image Generation [49.0] ImAgentは、推論、生成、自己評価を統合するトレーニングフリーの統一マルチモーダルエージェントである。
画像生成と編集タスクの実験は、ImAgentがバックボーンよりも一貫して改善していることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:00:29 GMT)
MTR-DuplexBench: Towards a Comprehensive Evaluation of Multi-Round Conversations for Full-Duplex Speech Language Models [48.3] MTR-DuplexBenchはマルチラウンド環境でFDSLMを評価するための新しいベンチマークである。
MTR-DuplexBenchは,対話品質,対話力学,フォローインストラクション,安全性など,FDSLMの総合的・ターンバイターン評価を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:18 GMT)
A Multifaceted Analysis of Negative Bias in Large Language Models through the Lens of Parametric Knowledge [48.0] 負のバイアスとは、二分決定タスクにおいて負の反応を過度に生成する大きな言語モデルの傾向を指す。
大規模言語モデルでは, 形式レベルの負のバイアスが示され, つまり, プロンプト形式は, 負の応答のセマンティクスよりも応答に強く影響している。
モデルがイエスノー質問に答える十分な知識を欠いた場合、負の応答を生じる傾向にあるショートカットの挙動を同定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:18 GMT)
Reasoning About Intent for Ambiguous Requests [48.0] あいまいな要求に対して単一の構造化された応答で複数の解釈-問合せペアを生成することを提案する。
我々のモデルは、複数の有効な回答を監督として、強化学習とカスタマイズされた報酬関数で訓練されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:18 GMT)
Phys-Liquid: A Physics-Informed Dataset for Estimating 3D Geometry and Volume of Transparent Deformable Liquids [48.0] 透明な変形可能な液体の幾何学的および体積的特性の推定は、光学的複雑さと容器運動によって引き起こされる動的表面変形により困難である。
97,200個のシミュレーション画像とそれに対応する3Dメッシュからなる物理インフォームドデータセットであるPhys-Liquidを紹介する。
実験の結果, 液体形状と体積の再構成における精度と整合性が向上し, 既存のベンチマークより優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:50:58 GMT)
Comprehension of Multilingual Expressions Referring to Target Objects in Visual Inputs [47.9] Referring Expression (REC) は、自然言語の記述に基づいてオブジェクトを画像にローカライズするモデルを必要とする。
この研究は2つの主要な貢献を通じて多言語RECに対処する。
10言語にまたがる統合多言語データセットを構築し、機械翻訳と文脈に基づく翻訳拡張により、既存の12のRECベンチマークを体系的に拡張する。
得られたデータセットは、177,620の画像にまたがる800万の多言語参照表現と、336,882の注釈付きオブジェクトで構成されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:54:34 GMT)
Learning to Tell Apart: Weakly Supervised Video Anomaly Detection via Disentangled Semantic Alignment [47.5] 本稿では,不規則な特徴と正常な特徴を粗粒度と細粒度から明確に分離する,DSANet(Disentangled Semantic Alignment Network)を提案する。
粗粒度レベルでは,学習された正規プロトタイプの指導のもと,入力映像の特徴を再構成する自己誘導正規性モデリングブランチを導入する。
詳細なレベルでは、まず、各動画をイベント中心およびバックグラウンド中心のコンポーネントに分解する、分離されたコントラスト的セマンティックアライメント機構を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:51 GMT)
Towards Global Quantum Key Distribution [47.1] 量子鍵分配(QKD)は、認証された当事者間の無条件のセキュリティを備えた秘密鍵の交渉と共有をサポートする。
QKDが世界規模でリーチを拡大するにつれ、パフォーマンスの制限やコスト、現実的なセキュリティ上の懸念といった課題に直面している。
本稿では,プロトコル,デバイス,量子チャネルを中心に,QKD実装の概要を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:04:48 GMT)
An In-Depth Systematic Analysis of the Security, Usability, and Automation Capabilities of Password Update Processes on Top-Ranked Websites [46.8] トップランクのウェブサイトに展開された111のパスワード更新プロセスについて,最初の体系的解析を行った。
ウェブサイトは、非常に多様な、しばしば複雑で混乱したパスワード更新プロセスをデプロイし、パスワードマネージャのサポートを欠いている。
私たちは、Web開発者、Web標準化コミュニティ、セキュリティ研究者にレコメンデーションを提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:49:42 GMT)
An In-Depth Systematic Analysis of the Security, Usability, and Automation Capabilities of Password Update Processes on Top-Ranked Websites [46.8] トップランクのウェブサイトに展開された111のパスワード更新プロセスについて,最初の体系的解析を行った。
ウェブサイトは、非常に多様な、しばしば複雑で混乱したパスワード更新プロセスをデプロイし、パスワードマネージャのサポートを欠いている。
私たちは、Web開発者、Web標準化コミュニティ、セキュリティ研究者にレコメンデーションを提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:16 GMT)
Learning-based Radio Link Failure Prediction Based on Measurement Dataset in Railway Environments [46.2] CNN、LSTM、XGBoost、Anomaly Transformer、PatchTST、TimesNetの6つのモデルをベンチマークする。
その結果,商用デバイスで利用可能な軽量機能を用いて,信頼性の低下を事前に予測できることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:26 GMT)
FOUND: Fourier-based von Mises Distribution for Robust Single Domain Generalization in Object Detection [46.1] オブジェクト検出のための単一ドメインの一般化は、対象ドメインに効果的に一般化できる単一のソースドメイン上でモデルをトレーニングすることを目的としている。
本稿では、von Mises-Fisher(vMF)分布とフーリエ変換をCLIP誘導パイプラインに統合することにより、オブジェクト検出を強化する新しいフレームワークを提案する。
提案手法はCLIPのセマンティックアライメントの利点を保全するだけでなく,機能多様性とドメイン間の構造的整合性も強化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:46:49 GMT)
One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models [45.9] 本稿では,Latent Upscaler Adapter(LUA)について述べる。
LUAはドロップインコンポーネントとして統合されており、ベースモデルや追加の拡散段階を変更する必要はない。
スケール固有のピクセルシャッフルヘッドを持つ共有Swinスタイルのバックボーンは、2xと4xファクタをサポートし、画像空間SRベースラインと互換性がある。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:38 GMT)
ChemFixer: Correcting Invalid Molecules to Unlock Previously Unseen Chemical Space [45.9] 無効分子を有効な分子に補正するフレームワークであるChemFixerを提案する。
ChemFixerはトランスフォーマーアーキテクチャ上に構築されており、マスク技術を使って事前トレーニングされ、大規模なデータセットで微調整されている。
元の出力の化学的および生物学的分布特性を効果的に保ちながら、分子の妥当性を改善した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:25:03 GMT)
Incentive Attacks in BTC: Short-Term Revenue Changes and Long-Term Efficiencies [45.8] BitcoinのDifficulty Adjustment Algorithm(DAA)は、利己的なマイニング、ブロックの保持、コインホッピング戦略などのインセンティブ攻撃の脆弱性の1つだ。
我々は、これらのインセンティブ攻撃に対する敵的かつ正直な鉱山労働者のハッシュパワー当たりの短期的な収益変化について検討する。
ブロック・アンホールディング・ストラテジーでは、プールの外の正直な鉱山労働者が攻撃から利益を得ており、通常は短期と長期の両方で攻撃者よりも多いことが判明した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:18:17 GMT)
ConSurv: Multimodal Continual Learning for Survival Analysis [45.7] ConSurvは、生存分析のための最初のマルチモーダル連続学習法である。
主なコンポーネントは、Multi-staged Mixture of Experts (MS-MoE)とFeature Constrained Replay (FCR)である。
大規模な実験では、ConSurvは複数のメトリクスで競合するメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:06 GMT)
Physically Interpretable Multi-Degradation Image Restoration via Deep Unfolding and Explainable Convolution [45.6] 本稿では,多段劣化画像復元のための新しい解釈可能性駆動手法を提案する。
改良された2階半平滑ニュートンアルゴリズムを用いて,各モジュールが明確な物理的解釈性を維持することを保証する。
解釈可能性と適応性をさらに向上するため,人間の脳の柔軟な情報処理に触発された説明可能な畳み込みモジュールを設計した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:36:49 GMT)
Rubric-Based Benchmarking and Reinforcement Learning for Advancing LLM Instruction Following [44.8] 我々は1,600以上のプロンプトとエキスパートキュレートされたルーリックを備えた総合ベンチマークであるAdvancedIFを紹介する。
本稿では,ルーブリック生成,微調整ルーブリック検証,報酬形成を生かした新しい後学習パイプラインであるRIFL(Rubric-based Instruction-Following Learning)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:23 GMT)
Potent but Stealthy: Rethink Profile Pollution against Sequential Recommendation via Bi-level Constrained Reinforcement Paradigm [44.6] 対話シーケンスを通じて動的ユーザインテントを利用するシークエンシャルリコメンダは、敵攻撃に対して脆弱である。
本報告では, ユーザインタラクションを微妙に汚染し, ターゲットの誤予測を誘発するプロファイル汚染攻撃について述べる。
本稿では,2段階の最適化フレームワークを多方向強化学習と相乗化して,対向効果とステルスネスのバランスをとる制約付き強化駆動攻撃 CREAT を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:31:46 GMT)
ACT as Human: Multimodal Large Language Model Data Annotation with Critical Thinking [44.6] 教師付き学習は高品質なラベル付きデータに頼っているが、人間のアノテーションを通してそのようなデータを取得するのは高価かつ時間を要する。
最近の研究は、アノテーションに大規模言語モデル(LLM)を使うことを探求しているが、LLM生成ラベルは人間レベルの品質に欠けている。
この問題に対処するために,批判的思考(ACT)データパイプラインを用いたスーパーバイスを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:06 GMT)
SAM-DAQ: Segment Anything Model with Depth-guided Adaptive Queries for RGB-D Video Salient Object Detection [44.5] 本稿では,Depth-Guided Adaptive Queries (SAM-DAQ) を用いた新しいセグメンテーションモデルを提案する。
SAM-DAQは、深度と時間的手がかりを統一されたフレームワークにシームレスに統合することにより、SAM2をビデオから鮮やかなオブジェクトに適応させる。
実験は3つのRGB-D VSODデータセットを用いて行われ、提案したSAM-DAQは、すべての評価指標で常に最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:25 GMT)
HetDAPAC: Leveraging Attribute Heterogeneity in Distributed Attribute-Based Private Access Control [43.9] Het(Het)DAPACは、$N-D$の検証を中央サーバにオフロードするフレームワークである。
サーバ毎のダウンロードバランスと$frac12K$のレートを達成するための2つ目のスキームを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:40:17 GMT)
Convomem Benchmark: Why Your First 150 Conversations Don't Need RAG [43.5] 本稿では,75,336組の質問応答対を含む対話型メモリ評価のためのベンチマークを提案する。
対話記憶と検索強化生成の関係について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:05 GMT)
Shrinking the Teacher: An Adaptive Teaching Paradigm for Asymmetric EEG-Vision Alignment [43.0] 視覚と脳のモダリティの関係は基本的に非対称である。
この非対称性に対処するための適応的な教育パラダイムを提案する。
本手法は,ゼロショット脳画像検索タスクにおいて,トップ1の精度を60.2%向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:52:00 GMT)
SimuFreeMark: A Noise-Simulation-Free Robust Watermarking Against Image Editing [42.6] SimuFreeMarkは低周波成分の深い特徴空間に直接透かしを埋め込む。
SimuFreeMarkは、さまざまな従来的およびセマンティックアタックにおいて、最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:30:43 GMT)
Bridging Synthetic and Real Routing Problems via LLM-Guided Instance Generation and Progressive Adaptation [42.6] EvoRealは多様で現実的な構造パターンを特徴とする合成インスタンスを生成する。
EvoRealは最先端のニューラルソルバの一般化能力を著しく改善する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:40 GMT)
MATAI: A Generalist Machine Learning Framework for Property Prediction and Inverse Design of Advanced Alloys [42.6] MATAIは、鋳型合金の逆設計のための機械学習フレームワークである。
キュレートされたデータベース、ディープニューラルネットワークベースのプロパティ予測器、制約対応最適化エンジン、反復的なAI-実験フィードバックループを統合する。
軽量構造材料の標準クラスであるTi基合金におけるMATAIの機能を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:09 GMT)
MSGNav: Unleashing the Power of Multi-modal 3D Scene Graph for Zero-Shot Embodied Navigation [42.5] 現実世界のデプロイメントには、オープンな語彙の一般化とトレーニングのオーバーヘッドの低減が必要だ。
明示的な3Dシーングラフを構築する既存のゼロショット法は、リッチな視覚的観察をテキストのみの関係に圧縮することが多い。
M3DSG(Multi-modal 3D Scene Graph)を導入し,テキストリレーショナルエッジを動的にアサインされた画像に置き換えることで視覚的手がかりを保存する。
MSGNavはGOAT-BenchとHM3D-OVONデータセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:53 GMT)
MSGNav: Unleashing the Power of Multi-modal 3D Scene Graph for Zero-Shot Embodied Navigation [42.5] 現実世界のデプロイメントには、オープンな語彙の一般化とトレーニングのオーバーヘッドの低減が必要だ。
明示的な3Dシーングラフを構築する既存のゼロショット法は、リッチな視覚的観察をテキストのみの関係に圧縮する。
テキスト関係を置き換えることで視覚的手がかりを保存できるM3DSG(Multi-modal 3D Scene Graph)を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:20:45 GMT)
GrounDiff: Diffusion-Based Ground Surface Generation from Digital Surface Models [42.4] グラウンド拡散(GrounDiff)は、非グラウンド構造を反復的に除去する最初の拡散ベースのフレームワークである。
本稿では,DSM-to-DTM翻訳タスクにおける多種多様なデータセットを対象とした手法について検討する。
提案手法は,GeRoDベンチマークの特殊手法と比較して最大81%低い距離誤差を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:48 GMT)
Potent but Stealthy: Rethink Profile Pollution against Sequential Recommendation via Bi-level Constrained Reinforcement Paradigm [41.8] 対話シーケンスを通じて動的ユーザインテントを利用するシークエンシャルリコメンダは、敵攻撃に対して脆弱である。
本報告では, ユーザインタラクションを微妙に汚染し, ターゲットの誤予測を誘発するプロファイル汚染攻撃について述べる。
本稿では,2段階の最適化フレームワークを多方向強化学習と相乗化して,対向効果とステルスネスのバランスをとる制約付き強化駆動攻撃 CREAT を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:19 GMT)
Remodeling Semantic Relationships in Vision-Language Fine-Tuning [41.7] セマンティクスと関係性の両方に基づいてマルチモーダルアライメントと融合を改善する手法を提案する。
視覚的特徴をグループ関連セマンティクスに投影することを学びました。
最後に、継承可能なクロスアテンションを用いて視覚的特徴をテキストと融合させ、冗長な視覚的関係をグローバルに除去する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:35 GMT)
When Eyes and Ears Disagree: Can MLLMs Discern Audio-Visual Confusion? [41.6] 実験結果から,Multimodal Large Language Models (MLLM) は視覚的に支配的な推論のため,存在しない音声の識別に苦慮していることが明らかとなった。
本稿では,RL-CoMM(Reinforcement Learning-based Collaborative Multi-MLLM)を紹介する。
1)視覚的に支配されるあいまいさを緩和するために、音声のみの推論を生成するための参照モデルとして、外部モデルであるLarge Audio Language Model (LALM)を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:26 GMT)
SCRUTINEER: Detecting Logic-Level Usage Violations of Reusable Components in Smart Contracts [41.6] SCRUTINEERは、SCRの論理レベルの使用法違反を検出する自動システムである。
SCRUTINEERの精度は80.77%、リコールは82.35%、F1スコアは81.55%である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:41:56 GMT)
Learning the Basis: A Kolmogorov-Arnold Network Approach Embedding Green's Function Priors [41.0] この文字は、固定基底上の係数を解くのではなく、学習可能な基底表現の周りに電磁的モデリングを再構成する。
この知見に触発されて,RWGを学習可能な適応型ベースファミリーに一般化する物理インフォームド・コルモゴロフ・アルノルドネットワーク(KAN)であるPhyKANを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:33 GMT)
Temporal-adaptive Weight Quantization for Spiking Neural Networks [40.9] 本稿では,時間的次元に沿って超低ビット重みを適応的に割り当てるために,時間的ダイナミクスによる重み量子化を取り入れた時間的適応重み量子化(TaWQ)を提案する。
当社のTaWQは高エネルギー効率(4.12M, 0.63mJ)を維持しながら、ImageNetでは0.22%の無視可能な量子化損失しか生じない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:08:14 GMT)
MeCaMIL: Causality-Aware Multiple Instance Learning for Fair and Interpretable Whole Slide Image Diagnosis [40.3] MIL(Multiple Case Learning)は、コンピュータ病理学における全スライド画像(WSI)解析の主流パラダイムとして登場した。
因果関係を意識したMILフレームワークである textbfMeCaMIL は、構造化因果グラフを通じて、階層的共同創設者を明示的にモデル化する。
MeCaMILは優れた公正性を達成する -- 人口格差の分散は、属性全体の平均で65%以上減少する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:47:21 GMT)
Data Poisoning Vulnerabilities Across Healthcare AI Architectures: A Security Threat Analysis [39.9] 我々は,畳み込みニューラルネットワークに対するアーキテクチャ攻撃,大規模言語モデル,強化学習エージェントの4つのカテゴリの8つの攻撃シナリオを分析した。
以上の結果から,100~500サンプルしかアクセスできないアタッカーは,データセットのサイズに関わらず,医療AIを侵害する可能性が示唆された。
我々は、必要な敵検定、アンサンブルに基づく検出、プライバシー保護セキュリティ機構、AIセキュリティ標準に関する国際調整を含む多層防御を推奨する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:16:16 GMT)
Quantum Design Automation: Foundations, Challenges, and the Road Ahead [39.2] 量子コンピューティングにおける全体論的設計の観点を提唱する。
本稿では,相互接続型計算手法とツールが協調して,エンドツーエンドの量子コンピュータ設計を実現する方法について述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:44 GMT)
Molecular analogue for scalar dynamics in a tachyonic metric [39.1] タキオンは光よりも速く伝播する仮説的な粒子であるが、自然界や実験室では観測されていない。
本研究では, 水素分子イオンを, タキオンが生成する重力場と相互作用するスピンレス試験粒子の動力学のアナログとして導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:02:18 GMT)
A measurement-driven quantum algorithm for SAT: Performance guarantees via spectral gaps and measurement parallelization [39.1] この研究は、測定駆動量子SATソルバの厳密な最悪の実行時解析を示す。
この量子アルゴリズムはGrover型法にのみ依存せず,有望な数値性能を示す。
また,複数のタスクを満足するインスタンスに対しても,効率的に解を見つける新しい読み出しルーチンを開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:16 GMT)
Multi-agent In-context Coordination via Decentralized Memory Retrieval [39.1] 多様なデータセットに基づいてトレーニングされた大規模なトランスフォーマーモデルは、これまで目に見えなかったタスクにおいて、印象的な数ショットのパフォーマンスを誇示している。
MARL(Multi-Agent Reinforcement Learning)では、エージェントが共通の目標に向かって調整しなければならない。
高速適応によるコーディネーション向上を目的とした新しい手法である分散メモリ検索(MAICC)によるマルチエージェントインコンテキストコーディネーションを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:07 GMT)
Intelligence per Watt: Measuring Intelligence Efficiency of Local AI [39.0] 大規模言語モデル(LLM)クエリは、主に集中型クラウドインフラストラクチャのフロンティアモデルによって処理される。
小さなLMは、多くのタスクにおけるフロンティアモデルに対する競合的なパフォーマンスを実現しています。
集中インフラからの需要の再分配によるローカル推論は可能か?
本稿では,局所的推論の能力と効率を評価する指標として,1ワット当たりのインテリジェンス(IPW)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:53:12 GMT)
RoboBenchMart: Benchmarking Robots in Retail Environment [38.9] ダークストアにおける複雑な操作タスクのベンチマークであるRoboBenchMartを紹介する。
小売領域をターゲットとすることで、我々のベンチマークは、短期的な自動化の影響の強い可能性のある設定に対処します。
さらなる研究を支援するため、手続き型ストアレイアウト生成器、軌道生成パイプライン、評価ツール、微調整ベースラインモデルを含むRoboBenchMartスイートをリリースする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:54 GMT)
In-Token Rationality Optimization: Towards Accurate and Concise LLM Reasoning via Self-Feedback [38.9] InTROはトークンレベルの探索と,正確かつ簡潔な推論のための自己フィードバックを可能にする,新たなフレームワークである。
InTROは他のベースラインを一貫して上回り、ベースモデルと比較して解の精度を最大20%向上させる。
その思考の連鎖は明らかに簡潔であり、冗長性が低下している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:47 GMT)
A Space-Time Transformer for Precipitation Forecasting [38.9] SaTformerは、衛星の放射光から極端な降水量を予測するビデオトランスフォーマーだ。
我々は降水量の回帰を分類問題に再構成し、ラベルの不均衡に対処するためにクラス重み付き損失を用いる。
私たちのモデルは、NeurIPS Weather4Cast 2025 Cumulative Rainfall Challengeで1位を獲得しました。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:10:31 GMT)
GPR: Towards a Generative Pre-trained One-Model Paradigm for Large-Scale Advertising Recommendation [38.5] GPR(Generative Pre-trained Recommender)は,広告推薦をエンドツーエンド生成タスクとして再定義するワンモデルフレームワークである。
統一表現、ネットワークアーキテクチャ、トレーニング戦略にまたがる3つの重要なイノベーションを紹介します。
GPRはTencent Weixin Channelsの広告システムに完全にデプロイされており、主要なビジネスメトリクスを大幅に改善している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:34:51 GMT)
Generalization Can Emerge in Tabular Foundation Models From a Single Table [38.1] 簡単な自己教師型事前学習は、単体の実テーブル上で、異種ベンチマーク間で驚くほど強力な転送を実現できることを示す。
次に、ほとんどのTFMが共有する事前学習手順に接続し、データセットから構築できるEmphtaskの数と品質が、下流のパフォーマンスの鍵であることを示します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:06 GMT)
GGBench: A Geometric Generative Reasoning Benchmark for Unified Multimodal Models [37.8] GGBenchは幾何学的生成的推論を評価するために特別に設計されたベンチマークである。
それは、モデルが理解し、推論するだけでなく、積極的にソリューションを構築する能力を体系的に診断するための包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:07:53 GMT)
Chain-of-Generation: Progressive Latent Diffusion for Text-Guided Molecular Design [37.8] 生成した部品の解釈性が劣るなど,ワンショットコンディショニング生成の3つの課題について論じる。
トレーニング不要な多段階遅延拡散フレームワークであるChain-of-Generation (CoG)を提案する。
CoGは各プロンプトをカリキュラム順のセマンティックセグメントに分解し、段階的に中間目標として組み込む。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:54:10 GMT)
Speech-Audio Compositional Attacks on Multimodal LLMs and Their Mitigation with SALMONN-Guard [37.7] SACRED-Benchを導入し、複雑な音声ベースの攻撃下での大規模言語モデル(LLM)の堅牢性を評価する。
安全判断のための音声,音声,テキストを共同で検査する安全LLMであるSALMONN-Guardを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:14:03 GMT)
Speech-Audio Compositional Attacks on Multimodal LLMs and Their Mitigation with SALMONN-Guard [37.7] SACRED-Benchを導入し、複雑な音声ベースの攻撃下での大規模言語モデル(LLM)の堅牢性を評価する。
安全判断のための音声,音声,テキストを共同で検査する安全LLMであるSALMONN-Guardを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:18 GMT)
Text to Robotic Assembly of Multi Component Objects using 3D Generative AI and Vision Language Models [37.7] パイプラインは3D生成AIを視覚言語モデル(VLM)と統合する
メソッドは、事前に定義された構造とパネルコンポーネントを使用して、AI生成メッシュをマルチコンポーネントの3Dモデルに分解する。
システムは会話フィードバックによってコンポーネントの割り当てを洗練できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:18 GMT)
What happens when nanochat meets DiLoCo? [37.5] 我々は、トークン化、事前学習、微調整、サービスを含む8KラインのフルスタックChatGPTライクな実装であるオープンソースのnanochatプロジェクトを、制御ベースラインとして使用しています。
ナノチャットのトレーニングループ上での軽量ラッパーとしてDiLoCoアルゴリズムを実装し、外部ラッパーと同期する前にワーカー毎に複数のローカルステップを実行する。
ナノチャットは小型で検査可能であるため、制御パイプライン適応が可能であり、従来の集中型ベースラインと直接比較することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:30:04 GMT)
Next-Frame Feature Prediction for Multimodal Deepfake Detection and Temporal Localization [37.4] 一般化を促進する一段階学習フレームワークを提案する。
予測されたフレームと実際のフレームの相違を捉えるために,ウィンドウレベルのアテンション機構を導入する。
複数のベンチマークデータセットで評価した本モデルでは,強い一般化と正確な時間的局所性を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:34 GMT)
Enhancing Kernel Power K-means: Scalable and Robust Clustering with Random Fourier Features and Possibilistic Method [37.2] カーネルパワー$k$-means (KPKM) は、カーネル$k$-meansのローカルミニマ問題を緩和する手段のファミリーを利用する。
RFF-KPKMはRFFを用いて効率的な低次元特徴写像を生成する。
IP-RFF-MKPKMは、RFFによるMKPKMのスケーラビリティを確保し、クラスタ割り当てを改良する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:51 GMT)
Incorporating Spatial Information into Goal-Conditioned Hierarchical Reinforcement Learning via Graph Representations [37.1] 目標条件付き強化学習(GCHRL)とグラフの統合は近年注目されている。
既存のアプローチは通常、これらのグラフを構築するためにドメイン固有の知識に依存します。
本稿では,未確認状態を評価するためのグラフエンコーダデコーダの開発による解を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:58:39 GMT)
Library Liberation: Competitive Performance Matmul Through Compiler-composed Nanokernels [37.0] 本稿では,スケーラブルで高性能なマイクロカーネルを自動生成するコンパイル方式を提案する。
本手法は,ベクトルおよびタイルベースのCPU命令をサポートするMLIRベースのコンパイラで実装する。
実験の結果、生成したナノカーネルは生産品質が高く、最先端のマイクロカーネルライブラリと競合することがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:32:28 GMT)
Toward Scalable Early Cancer Detection: Evaluating EHR-Based Predictive Models Against Traditional Screening Criteria [36.6] 現在のがんスクリーニングガイドラインは、いくつかの種類のがんしかカバーしていない。
電子健康記録を用いた予測モデルは、リスクの高いグループを特定するためのより効果的なツールを提供するかもしれない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:26:49 GMT)
Lacking Data? No worries! How synthetic images can alleviate image scarcity in wildlife surveys: a case study with muskox (Ovibos moschatus) [36.2] 視覚的空中計数やテレメトリ追跡を含む伝統的な調査手法は、北極圏のマスコックス人口を監視するために広く用いられている。
しかし、ディープラーニングオブジェクト検出モデル(ODM)の有効性は、小さなデータセットによって制限されることが多い。
本研究は,ゼロショット (ZS) と少数ショット (FS) の設定において, 限られたトレーニングデータを補うための合成画像 (SI) の統合と, マスコックス検出の改善について検討した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:20:31 GMT)
Difference Vector Equalization for Robust Fine-tuning of Vision-Language Models [36.2] 微調整時の幾何構造を維持するために差分ベクトル等化(DiVE)を提案する。
DiVEは幾何学的構造を効果的に保存し、ID、OOD、ゼロショットのメトリクスで強力な結果を得る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:13 GMT)
Modeling Uncertainty Trends for Timely Retrieval in Dynamic RAG [36.0] 本稿では,トークンレベルの不確実性のダイナミクスをモデル化し,最適検索タイミングを決定するトレーニングフリーな手法であるEntropy-Trend Constraint(ETC)を紹介する。
ETCは、検索周波数を減少させながら、強いベースラインを一貫して上回る。
プラグアンドプレイで、モデルに依存しず、既存のデコードパイプラインに簡単に統合できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:44 GMT)
MULTIBENCH++: A Unified and Comprehensive Multimodal Fusion Benchmarking Across Specialized Domains [35.5] 我々は,マルチモーダル評価のための大規模ドメイン適応型ベンチマークを開発した。
このベンチマークでは,15のモダリティと20の予測タスクを含む,30以上のデータセットを統合している。
また、オープンソース、統一、自動評価パイプラインも開発しました。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:32:41 GMT)
MedPT: A Massive Medical Question Answering Dataset for Brazilian-Portuguese Speakers [35.4] ブラジル初の大規模実世界コーパスであるMedPTを紹介した。
患者と医師の相互作用から384,095個の質問応答対を合成する。
本分析では,患者と医師のコミュニケーションにおける自然な非対称性など,主題の幅(3,200トピックス)と独特の言語特性を明らかにした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:13:28 GMT)
STORM: Segment, Track, and Object Re-Localization from a Single 3D Model [35.4] STORMはオープンソースの堅牢なリアルタイム6Dポーズ推定システムで、手動のアノテーションを必要としない。
STORMは、視覚監督型理解と自己言語機能マッチングを組み合わせた、新しい3段階パイプラインを採用している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:49 GMT)
SVD-NO: Learning PDE Solution Operators with SVD Integral Kernels [35.2] 本稿では,その特異値分解(SVD)によってカーネルをパラメータ化し,その積分を直接ローランクベースで実行するニューラル演算子SVD-NOを提案する。
SVD-NOが全カーネルを近似すると、表現性の高いデグレーが得られる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:58 GMT)
Text2SQL-Flow: A Robust SQL-Aware Data Augmentation Framework for Text-to-SQL [34.9] Text2-Flowは構造対応のデータ拡張フレームワークである。
最小のシードデータから大規模で意味論的に有効な、構造的に多様なテキスト対を生成する。
6つの拡張ディメンションで動作し、エンドツーエンドのパイプラインを統合する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:21:54 GMT)
Text2SQL-Flow: A Robust SQL-Aware Data Augmentation Framework for Text-to-SQL [34.9] Text2-Flowは構造対応のデータ拡張フレームワークである。
最小のシードデータから大規模で意味論的に有効な、構造的に多様なテキスト対を生成する。
6つの拡張ディメンションで動作し、エンドツーエンドのパイプラインを統合する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:38:00 GMT)
Right Looks, Wrong Reasons: Compositional Fidelity in Text-to-Image Generation [34.9] 本研究は,3つの基本的論点,計数,空間的関係の分解について検討する。
この失敗を3つの重要な要因に遡る。まず、トレーニングデータから明らかな否定がほとんどないことを示す。
我々は、既存のアーキテクチャへの漸進的な調整よりも、表現と推論の根本的な進歩が必要であると結論付けている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:34:40 GMT)
Improving Perturbation-based Explanations by Understanding the Role of Uncertainty Calibration [34.6] 本研究では,モデルが説明可能性に比例した摂動を受けると,信頼できない確率推定値が得られることを示す。
本稿では,ReCalXを提案する。ReCalXは,従来の予測を保ちながら,改善された説明のためのモデルの再検討を行う新しい手法である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:30 GMT)
Rectify Evaluation Preference: Improving LLMs' Critique on Math Reasoning via Perplexity-aware Reinforcement Learning [34.4] 本稿では,不均衡な評価嗜好の潜在的な理由を定量化し,検討する。
理由の分析により、評価の嗜好を正すために、新しいパープレキシティ対応強化学習アルゴリズムが提案されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:32 GMT)
Speech-Aware Long Context Pruning and Integration for Contextualized Automatic Speech Recognition [34.4] 本稿では,関連する文脈キーワードを2段階にまとめ,統合する新しいフレームワークを提案する。
実験により,SlideSpeechおよびLibriSpeechデータセット上でのSAP$2$の最先端性能が実証された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:15:16 GMT)
Parametric Expensive Multi-Objective Optimization via Generative Solution Modeling [34.3] 本稿では,この逆モデルについて,獲得駆動探索モデルと生成モデルとの交互に学習した最初のパラメトリック多目的ベイズモデルを提案する。
我々はタスク対応ガウス過程を通じてタスク間シナジーを活用することにより、より高速な収束を理論的に正当化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:12 GMT)
Test-Time Spectrum-Aware Latent Steering for Zero-Shot Generalization in Vision-Language Models [34.2] スペクトル認識型テスト時間ステアリング(STS)を導入し,遅延表現をスペクトル認識方式で操る。
STSは、凍結エンコーダのバックプロパゲーションや修正なしに、潜在空間での推論で完全に動作する。
標準評価プロトコルをベースとした実験では,STSが最先端の試験時間適応手法をはるかに上回るか,あるいは好適に比較することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:47 GMT)
Global Convergence of Four-Layer Matrix Factorization under Random Initialization [34.2] 4層行列因数分解におけるランダムな勾配降下に対する大域収束保証を示す。
我々は従来の理論を拡張し、層重みの固有値の変化を特徴づける。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:03 GMT)
Don't Waste It: Guiding Generative Recommenders with Structured Human Priors via Multi-head Decoding [33.9] 生成的推薦者のエンド・ツー・エンドトレーニングに直接、人間の先入観を直接シームレスに統合するバックボーン非依存の枠組みを導入する。
本手法は精度と超精度の両方を著しく向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:30 GMT)
Moral Change or Noise? On Problems of Aligning AI With Temporally Unstable Human Feedback [33.8] この研究は、人々の道徳的嗜好が時間とともにどのように変化するか、そしてそのような変化がAIのアライメントに与える影響について調査する。
本研究は腎臓割当領域に根ざし, 腎移植患者との比較を行った。
いくつかの参加者の補正された意思決定モデルにおいて、時間とともに大きな変化が観察される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:19 GMT)
Explicit Temporal-Semantic Modeling for Dense Video Captioning via Context-Aware Cross-Modal Interaction [33.8] 我々は,CACMI (Context-Aware Cross-Modal Interaction) という,時間-意味の明示的なモデリングフレームワークを提案する。
本モデルは,クロスモーダルフレームアグリゲーションとコンテキスト認識機能拡張という,2つのコアコンポーネントから構成される。
ActivityNet CaptionsとYouCook2データセットの実験は、CACMIが高密度ビデオキャプションタスクで最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:34:28 GMT)
AirCopBench: A Benchmark for Multi-drone Collaborative Embodied Perception and Reasoning [33.5] MLLM(Multimodal Large Language Models)は、単一エージェントビジョンタスクにおいて有望であることを示す。
AirCopBenchは、MLLMを体感的に評価するために設計された最初の総合的なベンチマークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:23:05 GMT)
Filtering Jump Markov Systems with Partially Known Dynamics: A Model-Based Deep Learning Approach [33.4] JMFNetは、ジャンプマルコフシステムにおけるリアルタイム状態推定のための新しいモデルベースのディープラーニングフレームワークである。
2つのリカレントニューラルネットワーク(RNN)からなるハイブリッドアーキテクチャを提案する。
提案したRNNは,潜伏モードの監督なしに相互適応可能な最小二乗戦略を用いて共同で訓練される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:18 GMT)
Out-of-Distribution Detection with Positive and Negative Prompt Supervision Using Large Language Models [33.4] アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)とOOD画像の分類境界を規定する。
画像特徴とプロンプトコンテンツの相違を強調するために、負のプロンプトが導入される。
我々は,クラス間の特徴を捕捉するネガティブなプロンプトを奨励するポジティブ・ネガティブ・プロンプト・スーパービジョンを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:24:09 GMT)
Rethinking Efficient Mixture-of-Experts for Remote Sensing Modality-Missing Classification [33.3] リモートセンシングにおけるマルチモーダル分類は、環境干渉、センサーの故障、大気の影響によって生じるモダリティの欠如に悩まされることが多い。
既存の2段階適応法は計算コストが高く、訓練中に完全なマルチモーダルデータを仮定し、その一般化を実世界の不完全性に制限する。
マルチタスク学習問題として欠落したモダリティを再構成するMissing-Aware Mixture-of-Lorasフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:31:37 GMT)
Transformers vs. Recurrent Models for Estimating Forest Gross Primary Production [32.8] リモートセンシングは、単一センサーのスペクトル指標と統計モデルに代わるものを提供する。
深層学習(DL)とデータ融合の最近の進歩は、植生プロセスの時間的ダイナミクスをより良く表現する新たな機会を提供する。
本稿では,Grossプライマリ生産予測のための2つの代表的なモデルの性能について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:18:01 GMT)
Accelerating Controllable Generation via Hybrid-grained Cache [32.8] 制御可能な生成モデルは、合成視覚コンテンツのリアリズムを改善するために広く利用されている。
本稿では,異なる計算段階における粒度の異なるキャッシュ戦略を採用することにより,計算オーバーヘッドを低減するHybrid-Grained Cache (HGC) 手法を提案する。
我々は,4つのベンチマークデータセットにおけるHGCの有効性,特に生成効率と視覚的品質のバランスをとる上での利点を検証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:35:50 GMT)
Multi-Agent VLMs Guided Self-Training with PNU Loss for Low-Resource Offensive Content Detection [32.7] 協調的な擬似ラベリングにより、豊富な未ラベルデータを活用する自己学習フレームワークを提案する。
提案手法は,マルチエージェント・ビジョン・ランゲージ・モデルのサポートにより,未ラベルのインスタンスに擬似ラベルを反復的に割り当てる。
ベンチマークデータセットの実験は、我々のフレームワークが限られた監督下でベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:03:35 GMT)
A Systematic Study of Model Extraction Attacks on Graph Foundation Models [32.6] 本稿では,グラフ基礎モデル(GFM)に対するモデル抽出攻撃(MEAs)の最初の系統的研究について述べる。
本稿では,グラフ埋め込みの教師付き回帰を用いて攻撃者エンコーダを訓練する軽量抽出手法を提案する。
実験の結果、攻撃者は元のトレーニングコストのごく一部しか使わず、ほとんど精度を損なうことなく、被害者モデルを近似できることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:43:42 GMT)
FreDFT: Frequency Domain Fusion Transformer for Visible-Infrared Object Detection [32.3] 可視赤外物体検出のための周波数領域融合変換器FreDFTを提案する。
提案手法は、変調と周波数フィードフォワード層の間の相補的な情報をマイニングするために、新しいマルチモーダル周波数アテンション(MFDA)を用いる。
提案するFreDFTは,他の最先端手法と比較して,複数の公開データセット上で優れた性能を発揮する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:01 GMT)
FreDFT: Frequency Domain Fusion Transformer for Visible-Infrared Object Detection [32.3] 可視赤外物体検出のための周波数領域融合変換器FreDFTを提案する。
提案手法は、変調と周波数フィードフォワード層の間の相補的な情報をマイニングするために、新しいマルチモーダル周波数アテンション(MFDA)を用いる。
提案するFreDFTは,他の最先端手法と比較して,複数の公開データセット上で優れた性能を発揮する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:34 GMT)
EffiReason-Bench: A Unified Benchmark for Evaluating and Advancing Efficient Reasoning in Large Language Models [32.0] EffiReason-Benchは、効率的な推論手法の厳密なクロスパラダイム評価のための統一ベンチマークである。
ステップバイステップ評価を実現するため,CommonsenseQAとLogiQAの認証済みCoTアノテーションを構築した。
本稿では,不連続性を伴わないスムーズで安定した評価を提供する経済トレードオフモデルに着想を得た原則的指標であるE3-Scoreを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:38:30 GMT)
In Good GRACEs: Principled Teacher Selection for Knowledge Distillation [32.0] 本研究では,教師が学生モデルのポストトレーニングにどの程度効果的であるかを定量化するために,GRACEと呼ばれる軽量スコアを提案する。
GRACEは、検証者、教師のログ、教師の内部、テストデータにアクセスすることなく、生徒の勾配の分布特性を測定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:37 GMT)
Beyond ReAct: A Planner-Centric Framework for Complex Tool-Augmented LLM Reasoning [31.7] そこで我々は,局所最適化ボトルネックを解決するために,プランナー中心のPlan-Executeパラダイムを提案する。
新しいプランナーモデルでは、複雑なクエリのためのグローバル指向非巡回グラフ(DAG)計画を実行する。
複雑なクエリを特徴とする大規模ベンチマークデータセットである ComplexTool-Plan も紹介する。
有能なエグゼキュータと統合すると、我々のフレームワークは複雑なユーザクエリのためのStableToolBenchベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:38 GMT)
VocalNet-M2: Advancing Low-Latency Spoken Language Modeling via Integrated Multi-Codebook Tokenization and Multi-Token Prediction [31.6] VocalNet-M2は、マルチコードブックトークンライザとマルチトークン予測戦略を統合した、新しい低レイテンシSLMである。
提案モデルでは,マルチコードブック音声トークンを直接生成することで,遅延発生型フローマッチングモデルの必要性を解消する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:39 GMT)
Dynamic Gaussian Scene Reconstruction from Unsynchronized Videos [31.5] マルチビュー映像再構成はコンピュータビジョンにおいて重要な役割を担い、映画製作、バーチャルリアリティー、モーション分析に応用できる。
同期のないマルチビュービデオから高品質な4DGS再構成を実現するための新しい時間的アライメント戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:20:43 GMT)
RTGaze: Real-Time 3D-Aware Gaze Redirection from a Single Image [30.8] RTGazeはリアルタイムかつ高品質な視線リダイレクト方式である。
我々は、顔画像から視線制御可能な顔表現を学習し、視線リダイレクトのためのニューラルレンダリングにより、この表現をデコードする。
我々はRTGazeを質的かつ定量的に評価し、効率、リダイレクト精度、画像品質の最先端性能を実証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:24:13 GMT)
Liquid metal printing for superconducting circuits [30.8] 液体金属系マイクロピペット印刷は超伝導ラッピング素子共振器の製造に適している。
本研究は,超伝導量子コンピュータのハードウェア実装における新たな道を開くものである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:22 GMT)
Scaling Environments for LLM Agents in the Era of Learning from Interaction: A Survey [30.7] エージェントは環境と直接対話し、強化学習を通じて経験から学ぶべきだという意見が高まりつつある。
本稿では,この反復処理をGEFループとして定式化し,環境がエージェントに挑戦するためのタスクを生成し,タスク実行中のエージェントの動作に応答して観察を返却し,その後の学習のためのロールアウトに対する評価フィードバックを提供する。
このパラダイムの下では、環境は経験的データの必須生産元として機能し、より複雑な、現実主義、対話性へのスケールの必要性を強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:47 GMT)
PROPA: Toward Process-level Optimization in Visual Reasoning via Reinforcement Learning [30.4] 本稿では,モンテカルロ木探索 (MCTS) とGRPOを統合した新しいフレームワーク PROPA について紹介する。
7つのベンチマークと4つのVLMバックボーンで、PROPAはSFTとRLVRベースのベースラインを一貫して上回っている。
ドメイン内タスクで最大17.0%、ドメイン外タスクで最大21.0%のゲインを達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:04 GMT)
Uncovering Strategic Egoism Behaviors in Large Language Models [30.2] 本稿では,大規模言語モデル(LLM)におけるルールバウンド自己関心の一形態である戦略エゴイズム(SE)に関する最初の体系的な研究を紹介する。
我々は,5つのオープンソースおよび2つの商用LCMに対して実験を行い,戦略的エゴニズムがモデル全体にわたって普遍的に現れることを観察した。
意外なことに,エゴ主義的傾向と有害言語行動との間には肯定的な相関関係がみられ,戦略的なエゴ主義がより広範な不適応リスクを負う可能性が示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:54 GMT)
SPOT: Single-Shot Positioning via Trainable Near-Field Rainbow Beamforming [30.2] 本稿では,レインボービームを同時に設計し,ユーザ位置を推定するエンド・ツー・エンドのディープラーニング方式を提案する。
提案手法は, オーバヘッドを桁違いに低減し, 連続的に2次元位置決め誤差を低減させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:21:35 GMT)
Scalable Population Training for Zero-Shot Coordination [30.0] 人口ベーストレーニングは、ゼロショット調整性能が良いことが証明されている。
本稿では,効率的な学習フレームワークであるScaPT(Scalable Population Training)を提案する。
エージェント間でパラメータを選択的に共有することで、効率的に集団を実現するメタエージェントと、集団の多様性を保証する相互情報レギュレータとから構成される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:59:22 GMT)
When Data is the Algorithm: A Systematic Study and Curation of Preference Optimization Datasets [29.9] 本稿では,オープンソースDPOコーパスの包括的データ中心分析について紹介する。
Magpieフレームワークを利用して、各サンプルにタスクカテゴリ、入力品質、好みの報酬をアノテートします。
これにより、データセット間の好みの質をスケーラブルできめ細かい検査が可能になり、報酬マージンの構造的および質的な相違が明らかになる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:12:16 GMT)
SlideBot: A Multi-Agent Framework for Generating Informative, Reliable, Multi-Modal Presentations [29.9] 大規模言語モデル(LLM)は、クイズ生成やコンテンツ要約といったタスクを自動化し、教育において大きな可能性を示している。
既存のLCMベースのソリューションは、信頼性と情報的アウトプットが得られず、教育的価値が制限されることが多い。
SlideBot - LLMを検索、構造化計画、コード生成と統合したモジュラーでマルチエージェントなスライド生成フレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:17 GMT)
Fast and Expressive Multi-Token Prediction with Probabilistic Circuits [29.9] MTP(Multi-token Prediction)は、大規模言語モデル(LLM)における生成を著しく高速化するための重要な戦略である。
確率回路(PC)の枠組みにおけるMPPの表現性と遅延のトレードオフについて検討する。
我々のフレームワークであるMTPCは、将来のトークン上の共同分布をエンコードする様々な方法を探索することを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:33:14 GMT)
Echoing: Identity Failures when LLM Agents Talk to Each Other [29.8] 大規模言語モデル(LLM)ベースのエージェントは、相互に自律的に相互作用する。
人間とエージェントの相互作用とは異なり、AxAはそのような安定化シグナルを欠いている。
エージェントは割り当てられた役割を放棄し、代わりに会話相手を反映する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:34 GMT)
A Unified Convergence Analysis for Semi-Decentralized Learning: Sampled-to-Sampled vs. Sampled-to-All Communication [29.7] 半分散化フェデレーション学習では、デバイスはデバイス間通信に依存するが、時には中央サーバと対話する。
その実用的重要性にもかかわらず、これらの2つの戦略の厳密な理論的および実証的な比較はいまだに残っていない。
我々は,キーシステムパラメータを考慮に入れた統合収束フレームワークにおいて,S2SとS2Aを解析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:53:37 GMT)
LARM: A Large Articulated-Object Reconstruction Model [29.7] LARMは、スパースビュー画像から3Dの明瞭なオブジェクトを再構成する統合フィードフォワードフレームワークである。
LARMは、ディープマップやパートマスクなどの補助出力を生成し、明示的な3Dメッシュ抽出と関節推定を容易にする。
我々のパイプラインは、密集した監視の必要性を排除し、多様な対象カテゴリにわたる高忠実度再構築をサポートする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:55:27 GMT)
PROF: An LLM-based Reward Code Preference Optimization Framework for Offline Imitation Learning [29.4] 本稿では,自然言語記述から実行可能報酬関数コードを生成し,改善するためのフレームワークであるPROFと,単一専門家の軌跡を提案する。
また,環境相互作用やRLトレーニングを必要とせず,新たな報酬関数品質評価とランキング戦略であるReward Preference Ranking(RPR)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:38:02 GMT)
Rebellion: Noise-Robust Reasoning Training for Audio Reasoning Models [29.3] 適切な安全推論データを持つ標準RTは、バニラオーディオのジェイルブレイクからARMを保護することができることを示す。
我々は、ARMが最悪の表現フロートに対して堅牢であるように訓練する堅牢なRTであるRebellionを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:09 GMT)
UI2Code^N: A Visual Language Model for Test-Time Scalable Interactive UI-to-Code Generation [29.2] UI2Code$textN$は、事前トレーニング、微調整、強化学習を通じて訓練されたビジュアル言語モデルである。
このモデルは、UI-to-code生成、UI編集、UI研磨という3つの重要な機能を統合する。
UI-to-codeとUIの洗練ベンチマークの実験は、UI2Code$textN$が、オープンソースモデルの間で新しい最先端技術を確立していることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:44:26 GMT)
Towards Leveraging Sequential Structure in Animal Vocalizations [29.2] 本稿では,ベクトル量子化とガムベル・ソフトマックスベクトル量子化によって導出される離散音響トークン列が,時間情報を効果的に捕捉・活用できるかどうかを考察する。
その目的のために、HuBERT埋め込みから生成されるトークンシーケンスのペアワイズ距離分析により、4つのバイオ音響データセットでコールタイプと呼び出し元を識別できることが示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:58 GMT)
MindSET: Advancing Mental Health Benchmarking through Large-Scale Social Media Data [29.1] Reddit から収集した新たなベンチマークデータセット textbfMindSET について報告する。
注釈付きデータセットには、以前のベンチマークの2倍以上の大きさの7つのメンタルヘルス条件にわたる textbf13M アノテーション付きポストが含まれている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:06:04 GMT)
Maximizing the nondemolition nature of a quantum measurement via an adaptive readout protocol [28.7] 量子エラー補正(QEC)は、フォールトトレラント量子コンピューティングの非侵襲的な測定を必要とする。
正の結果の後,$D-1$残余部分空間のみを探索する$D-$dimensionalシステムのためのプロトコルを開発する。
この戦略は、ハミルトニアンを摂動しない負の反則測定結果に依存することにより、測定誘起誤差を最小化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:52:54 GMT)
MicroVQA++: High-Quality Microscopy Reasoning Dataset with Weakly Supervised Graphs for Multimodal Large Language Model [28.5] MicroVQA++は3段階、大規模、高品質のVQAコーパスである。
ピアレビュー記事から得られた専門家公認のフィギュア・キャプション・ペアから、監督をブートストラップする。
HiCQA-Graphは、画像、キャプション、QA上の新しい異種グラフであり、NLIベースのテキストエンタテインメント、CLIPベースの視覚言語アライメント、エージェントシグナルを融合させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:35:43 GMT)
A Closer Look at Knowledge Distillation in Spiking Neural Network Training [28.5] スパイキングニューラルネットワーク(SNN)は、優れたエネルギー効率のため人気を博しているが、効果的なモデルトレーニングの課題に直面している。
近年の研究では,教師として,学生として対象のSNNを用いて,知識蒸留(KD)技術を導入して,これを改善している。
これは一般的に、ANNとSNNの中間機能と予測ロジットを直列に並べることで実現され、アーキテクチャ間の固有の違いを無視することが多い。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:58:32 GMT)
DP-GENG : Differentially Private Dataset Distillation Guided by DP-Generated Data [28.4] libnは、DP生成データを活用することで、現在のDP-DDの重要な制限に対処する新しいフレームワークである。
libは、データセットの有用性とメンバシップ推論攻撃に対する堅牢性の両方の観点から、最先端のDP-DDメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:58 GMT)
Disentangling Emotional Bases and Transient Fluctuations: A Low-Rank Sparse Decomposition Approach for Video Affective Analysis [28.1] ビデオベースのAffective Computing(VAC)は、複雑な感情力学によるモデル不安定性と表現的劣化に悩まされている。
本稿では,LowRank Sparse Emotion Understanding Framework (LSEF)を提案する。
LSEFは3つのプラグ・アンド・プレイモジュールを用いており、このモジュールは階層的な低ランクスパース構成過程として感情力学を歪めている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:35:11 GMT)
Uncertainty-Guided Checkpoint Selection for Reinforcement Finetuning of Large Language Models [28.0] 強化学習(RL)ファインタニングは大規模言語モデル(LLM)の整合に不可欠であるが、そのプロセスは不安定である。
実際に、最高のチェックポイントを選択することは難しい。トレーニング中の検証セットのチェックポイントを評価することは、計算コストが高く、優れた検証セットが必要である。
チェックポイント選択(UGCS)に対する不確実性誘導手法を導入し,これらの落とし穴を回避する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:45 GMT)
Conformal Constrained Policy Optimization for Cost-Effective LLM Agents [27.4] 大規模言語モデル(LLM)は最近、AI問題の解決に向けて大きな進歩を遂げた。
本稿では,複数のLLMモデルとコスト/精度のトレードオフをエージェント方式で組み合わせた新しい戦略を提案する。
当社のアプローチは,信頼性を維持しつつ,よりコスト効率のよいLCMエージェントをデプロイするための,原則的かつ実用的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:39:28 GMT)
On-Device Fine-Tuning via Backprop-Free Zeroth-Order Optimization [27.2] メモリ効率のゼロオーダー最適化(MeZO)はこのボトルネックを軽減する。
本稿ではまず,BPおよびMeZOトレーニングで適用可能な相対モデルサイズを理論的に推定する。
次に,メモリ上の制約下で,MeZOが精度上の優位性を示すことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:46:29 GMT)
Structured Definitions and Segmentations for Legal Reasoning in LLMs: A Study on Indian Legal Data [27.2] 大規模な言語モデル(LLM)は、Webからの広範なデータセットに基づいて訓練され、目覚ましい一般的な推論スキルを示す。
しかし、主にドメイン固有の事前訓練がないため、法律のような専門分野に苦しむことが多い。
従来の研究では、知識ギャップに対処するためのコンテキスト内アプローチを検証し、ドメインの完全な整合性のない新しいドメインにおけるモデル性能を高めてきた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:24:00 GMT)
Compensating Distribution Drifts in Class-incremental Learning of Pre-trained Vision Transformers [27.1] 本稿では、遅延空間遷移演算子を導入し、ドリフト補償を用いた逐次学習を提案する。
SLDCは、ドリフトの影響を軽減するために、タスク間で機能の分散を調整することを目的としている。
標準CILベンチマークの実験では、SLDCはSeqFTの性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:06 GMT)
MTP: Exploring Multimodal Urban Traffic Profiling with Modality Augmentation and Spectrum Fusion [26.9] 我々は,数値的,視覚的,テキスト的観点からマルチモーダルな特徴を学習する,新しいTextitMultimodalフレームワークを提案する。
6つの実世界のデータセットの実験は、最先端のアプローチよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:08 GMT)
Fragile by Design: On the Limits of Adversarial Defenses in Personalized Generation [26.9] Anti-DreamBoothのような防御機構は、顔認証漏洩のリスクを軽減する。
これらの手法の2つの重要かつ見過ごされた限界を同定する。
その結果、現在の手法はいずれもそのような脅威下での保護効果を維持していないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:09 GMT)
LoG3D: Ultra-High-Resolution 3D Shape Modeling via Local-to-Global Partitioning [26.9] 非符号距離場(UDF)に基づく新しい3次元変分オートエンコーダフレームワークを提案する。
私たちの中心となるイノベーションは、UDFを統一サブボリュームであるUBlockに分割することで処理する、ローカルからグローバルなアーキテクチャです。
再現精度と生成品質の両面での最先端性能を実証し,表面の滑らかさと幾何学的柔軟性を向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:09 GMT)
DocSLM: A Small Vision-Language Model for Long Multimodal Document Understanding [26.8] LVLM(Large Vision-Language Models)は、長い複雑な文書に対して強力なマルチモーダル推論能力を示す。
本稿では,制約されたリソース下での長期文書理解のために設計された,効率的なスモールビジョン言語モデルDocSLMを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:56:39 GMT)
Toward Gaze Target Detection of Young Autistic Children [26.8] 本稿では,自閉症児の視線目標検出のための実世界のAIアプリケーションを紹介し,活動画像から子どもの視線点を予測する。
本稿では,シーンの社会的文脈を明示的に活用して,自閉症データセットに共通するクラス不均衡を克服する,新たなソーシャル・アウェア・コア・トゥ・ファイン(SACF)視線検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:44:06 GMT)
Global Solutions to Non-Convex Functional Constrained Problems with Hidden Convexity [26.7] 証明不可能な複雑な問題を解くアルゴリズムを開発する。
まず、非滑らか空間における複素数$widetildemathcalO(varepsilon-1)$ oracle を用いて、大域的最終レート収束を保証する。
問題に対して,線形に制約された2次サブプロブレムに基づく新しいバンドルレベル型法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:29 GMT)
When Genes Speak: A Semantic-Guided Framework for Spatially Resolved Transcriptomics Data Clustering [26.7] SemSTは空間転写学データクラスタリングのための意味誘導型ディープラーニングフレームワークである。
FSMモジュールは、空間的特徴の要素ワイドキャリブレーションを実行するためにセマンティック埋め込みを促進するスポット特異的なアフィン変換を学習する。
公共空間トランスクリプトミクスデータセットの実験により、SemSTが最先端のクラスタリング性能を達成することが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:03:41 GMT)
AHA! Animating Human Avatars in Diverse Scenes with Gaussian Splatting [26.6] 3次元ガウススプラッティング(3DGS)を用いた3次元シーンにおける人間アニメーションのための新しい枠組みを提案する。
ヒトとシーンをガウスとして表現することで、我々のアプローチは3Dシーンと相互作用する人間の幾何学的に一貫性のある自由視点レンダリングを可能にする。
我々は,Scannet++とSuperSplatライブラリのシーンに対するアプローチと,疎密で高密度なマルチビュー・ヒューマンキャプチャから再構成したアバターに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:43 GMT)
Enhanced Privacy Leakage from Noise-Perturbed Gradients via Gradient-Guided Conditional Diffusion Models [26.5] フェデレーション学習は、勾配伝達と集約を通じてモデルを同期させる。
これらの勾配は、センシティブなトレーニングデータが組み込まれているため、プライバシー上の重大なリスクをもたらす。
既存の勾配反転攻撃は、雑音によって勾配が乱されるとき、大幅に劣化した復元性能に悩まされる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:50:33 GMT)
Dynamic Deep Graph Learning for Incomplete Multi-View Clustering with Masked Graph Reconstruction Loss [26.3] textbfIncomplete textbfMulti-textbfView textbfClustering with textbfMasked Graph Reconstruction Loss (DGIMVCM)を提案する。
次に、グラフ畳み込み埋め込み層を設計し、主要な特徴を抽出し、動的なビュー固有のグラフ構造を洗練し、グローバルグラフを利用して、不足するビューの計算を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:26:38 GMT)
FedCure: Mitigating Participation Bias in Semi-Asynchronous Federated Learning with Non-IID Data [25.5] FedCureは、革新的な半非同期フェデレーション学習フレームワークである。
連立構築と参加対応スケジューリングを利用して、非IIDデータによる参加バイアスを軽減する。
最先端の4つのベースラインと比較して、精度は最大5.1倍向上する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:27 GMT)
Gene Incremental Learning for Single-Cell Transcriptomics [25.5] 我々は、遺伝子インクリメンタル学習のためのパイプラインを定式化し、対応する評価を確立する。
既存のクラスインクリメンタルな学習手法を応用して、遺伝子の忘れを軽減します。
単細胞転写学における遺伝子インクリメンタル学習のための完全なベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:54:03 GMT)
Retrofit: Continual Learning with Bounded Forgetting for Security Applications [25.2] 本稿では,データ振り返りのない連続学習手法であるRETROFITを提案する。
干渉を軽減するために、独立部分空間にパラメータ変化を限定する低ランクかつスパースな更新を適用する。
時間的ドリフト下でのマルウェア検出では、CLベースラインよりも20.2%から38.6%の保持スコアが大幅に向上し、新しいデータに対するオラクルの上限を超える。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:07:03 GMT)
CATS-V2V: A Real-World Vehicle-to-Vehicle Cooperative Perception Dataset with Complex Adverse Traffic Scenarios [25.2] 本稿では,複雑な交通シナリオ下でのV2V協調認識のための,最初の実世界のデータセットであるCATS-V2Vを紹介する。
100クリップのデータセットには、10HzのLiDAR点雲の60Kフレームと、1.26Mのマルチビュー30Hzカメライメージが含まれている。
そこで本研究では,すべての物体が全センサモードで正確に整列されていることを保証し,目標に基づく時間アライメント手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:07:04 GMT)
Beyond Cosine Similarity Magnitude-Aware CLIP for No-Reference Image Quality Assessment [25.1] 本稿では,コサインの類似性を大局的に認識できる品質クオリティキューに補完する新しい適応融合フレームワークを提案する。
本手法は,タスク固有のトレーニングを伴わずに,標準のCLIPベースのIQAと最先端のベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:20:58 GMT)
Equivariant Sampling for Improving Diffusion Model-based Image Restoration [25.1] 本稿では,2つのサンプリングトラジェクトリを通じて同変情報を付加するDMIR手法であるEquSを紹介する。
EquSをさらに強化するために、タイムステップ・アウェア・スケジュール(TAS)を提案し、EquS$+$を導入する。
本手法は従来の問題に依存しないDMIR法と互換性があり,計算コストを増大させることなく性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:30 GMT)
Seeing the Forest and the Trees: Query-Aware Tokenizer for Long-Video Multimodal Language Models [24.9] 長いビデオ理解のための視覚トークン選択モジュールであるQTSplusを提案する。
Qwen2.5-VLに統合され、ビジョンストリームを textbf89% まで圧縮し、長いビデオでは textbf28% でエンドツーエンドのレイテンシを低減する。
以上の結果から,QTSplusはMLLMを現実世界の長ビデオシナリオに拡張するための,効果的で汎用的なメカニズムであることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:41:27 GMT)
Towards Non-Stationary Time Series Forecasting with Temporal Stabilization and Frequency Differencing [24.6] 時系列はしばしば時間分布シフトやスペクトルの変動を含む非定常性を示す。
本稿では、時間領域と周波数領域の両方で非定常性に対処する二分岐フレームワークDTAFを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:04:02 GMT)
Towards Non-Stationary Time Series Forecasting with Temporal Stabilization and Frequency Differencing [24.6] 時系列はしばしば時間分布シフトやスペクトルの変動を含む非定常性を示す。
本稿では、時間領域と周波数領域の両方で非定常性に対処する二分岐フレームワークDTAFを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:37 GMT)
CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.6] CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。
CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:52:22 GMT)
Instella: Fully Open Language Models with Stellar Performance [24.5] Instellaは、完全にオープンな30億のパラメータ言語モデルのファミリーである。
Instinct MI300Xによって開発されたInstellaは、大規模な事前訓練、汎用的な指導チューニング、人間の好みの調整によって開発されている。
Instella-Longは128Kトークンまでのコンテキスト長を扱うことができ、Instella-Mathは教師付き微調整と強化学習によって強化された推論に焦点を当てたモデルである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:08:46 GMT)
Instella: Fully Open Language Models with Stellar Performance [24.5] Instellaは、完全にオープンな30億のパラメータ言語モデルのファミリーである。
Instinct MI300Xによって開発されたInstellaは、大規模な事前訓練、汎用的な指導チューニング、人間の好みの調整によって開発されている。
Instella-Longは128Kトークンまでのコンテキスト長を扱うことができ、Instella-Mathは教師付き微調整と強化学習によって強化された推論に焦点を当てたモデルである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:35 GMT)
Beyond Monotonicity: Revisiting Factorization Principles in Multi-Agent Q-Learning [24.5] 値分解はマルチエージェント強化学習(MARL)における中心的アプローチである
既存の方法は、表現力を制限する単調性制約を強制するか、アルゴリズムの複雑さを犠牲にしてよりソフトなサロゲートを採用するかのどちらかである。
制約のない非単調な分解は、IGG最適解を確実に回復し、一貫して単調な基底線を上回ることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:03 GMT)
Free3D: 3D Human Motion Emerges from Single-View 2D Supervision [24.2] Free3Dは、3Dモーションアノテーションなしでリアルな3Dモーションを合成するフレームワークである。
完全に2Dモーションデータに基づいて訓練されたFree3Dは、多様で時間的に一貫性があり、意味的に整合した3Dモーションを生成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:49:19 GMT)
OT-ALD: Aligning Latent Distributions with Optimal Transport for Accelerated Image-to-Image Translation [23.8] DDIB (Dual Diffusion Implicit Bridge) は、強力な柔軟性を保ちながらサイクルの一貫性を保ちながら画像から画像への変換を行う手法である。
最適輸送理論に基づく新しいI2I翻訳フレームワークOT-ALDを提案する。
OT-ALDはサンプリング効率を20.29%向上し,FIDスコアを平均2.6削減することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:57:21 GMT)
Two Constraint Compilation Methods for Lifted Planning [23.7] 本研究では,定性的状態軌跡制約を伴うPDDL断片の計画について検討する。
本研究では,制約を基底にすることなく,制約をコンパイルする2つの手法を提案する。
コンパイラの正しさを証明し、最悪の時間の複雑さを概説します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:36:25 GMT)
Bot Meets Shortcut: How Can LLMs Aid in Handling Unknown Invariance OOD Scenarios? [23.5] 本研究は,テクストの特徴に基づく潜在的ショートカットの影響について検討する。
本稿では,大規模言語モデルに基づく緩和戦略を提案する。
我々の戦略は、ショートカットシナリオ下での平均相対的なパフォーマンス改善を56%達成します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:21:01 GMT)
Bot Meets Shortcut: How Can LLMs Aid in Handling Unknown Invariance OOD Scenarios? [23.5] 本研究は,テクストの特徴に基づく潜在的ショートカットの影響について検討する。
本稿では,大規模言語モデルに基づく緩和戦略を提案する。
我々の戦略は、ショートカットシナリオ下での平均相対的なパフォーマンス改善を56%達成します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:22 GMT)
HI-TransPA: Hearing Impairments Translation Personal Assistant [23.3] 我々は,Omni-Modelパラダイムを補助技術に導入し,インストラクション駆動型音声視覚パーソナルアシスタントHI-TransPAを提案する。
このモデルは、高フレームレートのリップダイナミックスで不明瞭な音声を融合させ、単一のマルチモーダルフレームワーク内での翻訳と対話を可能にする。
HI-Dialogueデータセットを用いた実験により,HI-TransPAの精度と意味的忠実度を両立させることができた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:33 GMT)
HI-TransPA: Hearing Impairments Translation Personal Assistant [23.3] 我々は,Omni-Modelパラダイムを補助技術に導入し,インストラクション駆動型音声視覚パーソナルアシスタントHI-TransPAを提案する。
このモデルは、不明瞭な音声を唇のダイナミックスと融合させ、単一のマルチモーダル・フレームワーク内での翻訳と対話を可能にする。
HI-Dialogueデータセットを用いた実験により、HI-TransPAは精度とセマンティック忠実度の両方で最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:05:10 GMT)
Continuous Benchmark Generation for Evaluating Enterprise-scale LLM Agents [23.3] 本稿では,要求の変化に応じてベンチマークを進化させ,進化するAIエージェントの堅牢な評価を行うベンチマーク生成プロセスを提案する。
このアプローチは、開発者が高レベルのインテントを表現し、最先端のLCMを使用して、ごく少数の文書からベンチマークを生成する半構造化ドキュメントに依存している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:45 GMT)
EnchTable: Unified Safety Alignment Transfer in Fine-tuned Large Language Models [23.1] 多くの機械学習モデルは、コード生成、バイオメディカル分析、数学的問題解決といった特殊な領域で高いパフォーマンスを達成するために、大きな言語モデル(LLM)から微調整されている。
EnchTableは、大規模な再訓練を必要とせず、下流のLLMにおける安全アライメントを転送し、維持するように設計された新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:30 GMT)
Distributional Treatment Effect Estimation across Heterogeneous Sites via Optimal Transport [23.1] そこで本研究では,対象地における非現実的処理群データを合成するための新しいフレームワークを提案する。
提案手法は, ソースおよびターゲット部位の確率をモデル化・制御することにより, 分布因果推論の視点を採用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:12 GMT)
DGFusion: Dual-guided Fusion for Robust Multi-Modal 3D Object Detection [23.1] 3次元物体検出は、車両や歩行者などの重要な物体を識別し追跡するために用いられる。
既存のマルチモーダルな3Dオブジェクト検出手法は、しばしば単一誘導のパラダイムに従う。
そこで我々はDGFusionを提案する。DGFusionはポイントガイド・イメージ・パラダイムの利点を完全に継承するデュアルガイド・パラダイムに基づいている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:26 GMT)
Adaptive Hyperbolic Kernels: Modulated Embedding in de Branges-Rovnyak Spaces [23.0] 本稿では,ポアンケア球に等方性を持つ再生カーネルヒルベルト空間 (RKHS) であるBranges-Rovnyak空間を導入する。
我々は新しい適応型双曲型ラジアルカーネルを含む適応型双曲型カーネル群を構築する。
提案するカーネルは,階層的依存関係のモデル化において,既存のハイパーボリックカーネルよりも優れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:55 GMT)
TubeRMC: Tube-conditioned Reconstruction with Mutual Constraints for Weakly-supervised Spatio-Temporal Video Grounding [22.9] Video Grounding (ST) は、ある言語クエリに対応する時間管を非言語ビデオでローカライズすることを目的としている。
最近の研究は、境界ボックスや時間的アノテーションのような細かいアノテーションへの依存を取り除くために、弱い教師付きSTを探索している。
本稿では,視覚的接地モデルを生成し,時間的制約を伴ってチューブ条件の再構成により洗練するテキスト条件付き候補再構成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:04 GMT)
From Parameter to Representation: A Closed-Form Approach for Controllable Model Merging [22.8] モデルマージは、マルチタスクのパフォーマンスのエキスパートモデルを組み合わせるが、パラメータ干渉による課題に直面している。
既存のアプローチではコンパイル型クエリーのパラダイムを採用しており、高速で好み対応のモデル生成を可能にするために、コストのかかるオフラインの多目的最適化を実行する。
我々は、この補正を最適線形変換としてモデル化し、オフライン最適化プロセス全体を単一ステップでアーキテクチャに依存しない計算で置き換える閉形式解を得る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:09:25 GMT)
From Events to Clarity: The Event-Guided Diffusion Framework for Dehazing [22.7] イベントカメラはより高いHDR(120dBvs.60dB$)とマイクロ秒のレイテンシを提供する。
本稿では, イベント誘導拡散モデルを提案する。
2つのベンチマークとデータセットの実験により、最先端の結果が得られた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:34:27 GMT)
Scale-Aware Relay and Scale-Adaptive Loss for Tiny Object Detection in Aerial Images [22.7] 本稿では,SARL(Scale-Aware Relay Layer)とSAL(Scale-Adaptive Loss)を提案する。
SARLは、各層の有意義な特徴を徐々に豊かにするために、空間チャネルを横断的に注意する。
SALは、バニラIoUベースの損失を補足して、より大きなオブジェクトに低重量を動的に割り当てる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:16:56 GMT)
Persona-Aware Alignment Framework for Personalized Dialogue Generation [22.6] 本稿では,対話生成のトレーニング目的としてペルソナアライメントを扱うPAL(Persona-Aware Alignment Framework)を提案する。
PALは、ペルソナ認識学習とペルソナアライメントを含む2段階のトレーニング手法を採用し、簡単に使える推論戦略Selectを使用して生成する。
我々のフレームワークは、多くの最先端のパーソナライズされた対話手法や大規模言語モデルよりも優れていることを実証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:46 GMT)
Experiences from Benchmarking Vision-Language-Action Models for Robotic Manipulation [22.4] 本稿では,4種類のVLAをベンチマークした経験を報告する。
我々は,3つの重要な側面に沿って性能を計測するtextbf Standardized Evaluation frameworkを構築した。
VLAモデルアーキテクチャ間のトレードオフとして,精度,一般化,デプロイメントコストのバランスが考えられる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:35:30 GMT)
FedeCouple: Fine-Grained Balancing of Global-Generalization and Local-Adaptability in Federated Learning [22.4] プライバシ保護型モバイルネットワーク伝送シナリオでは、パーソナライズされた学習手法が学習において顕著な優位性を示している。
我々は,グローバルな特徴表現と局所的な特徴表現を微粒なレベルでバランスをとるフェデレーション学習を提案する。
有効性を評価する実験では、フェデは最高のベースラインを4.3%の差で上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:13 GMT)
TermGPT: Multi-Level Contrastive Fine-Tuning for Terminology Adaptation in Legal and Financial Domain [22.3] 用語適応のためのマルチレベルコントラスト微調整フレームワークであるTermGPTを提案する。
まず,意味的および構造的関係を捉える文グラフを構築し,意味論的に一貫した識別的サンプルを生成する。
次に,文レベルとトークンレベルの両方において,多段階のコントラスト学習アプローチを考案し,グローバルな文脈理解と微粒な用語識別の促進を図る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:07 GMT)
Unsupervised Motion-Compensated Decomposition for Cardiac MRI Reconstruction via Neural Representation [22.3] MoCo-INRは、暗黙の神経表現(INR)と従来のモーション補償(MoCo)フレームワークを統合する、新しい教師なしの手法である。
明示的な運動モデリングとINRの連続的先行により、MoCo-INRは正確な心臓運動の分解と高品質なCMR再構成を実現できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:05:37 GMT)
Perceive, Act and Correct: Confidence Is Not Enough for Hyperspectral Classification [22.2] 信頼のみは、高スペクトル画像分類において誤解を招くことが多く、モデルは不確実性の認識を欠きながら、高い予測スコアを誤りを犯す傾向がある。
CABINは、知覚、行動、修正の閉ループ学習プロセスを通じて、この制限に対処する半教師付きフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:05 GMT)
Explore and Establish Synergistic Effects Between Weight Pruning and Coreset Selection in Neural Network Training [22.1] 軽量プルーニングとコアセット選択は、計算効率を向上させるために提案される2つの新しいパラダイムである。
我々は,重み付けとコアセット選択を交互に行う同時重み付け機構(SWaST)を開発し,訓練における相乗効果を確立する。
実験ではプルーニングとコアセットの選択の間に様々なプルーンレートとコアセットサイズの間で強い相乗効果が示され、精度は最大で17.83%向上し、10%から90%のFLOPが減少する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:22 GMT)
Enhancing Logical Expressiveness in Graph Neural Networks via Path-Neighbor Aggregation [22.1] 本稿では,GNNの論理的表現力を高めるため,PN-GNN(Path-Neighbor enhanced GNN)を提案する。
まず,既存のGNN手法の論理表現力を分析し,これらの手法の欠点を指摘する。
そこで理論的にPN-GNNの論理表現力について検討し、C-GNNよりも強い表現力を持つだけでなく、$(k+1)$-hop論理表現性が$k$-hopよりも厳密に優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:34:06 GMT)
SP-Guard: Selective Prompt-adaptive Guidance for Safe Text-to-Image Generation [21.8] 拡散ベースのT2Iモデルは、優れた画像生成品質を達成した。
また、有害なコンテンツを容易に作成できる。
また,SP-Guard法は,これらの制約に対処し,迅速な有害性を推定し,選択的誘導マスクを適用した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:04:06 GMT)
ChEmREF: Evaluating Language Model Readiness for Chemical Emergency Response [21.8] 本稿では,化学緊急対応評価フレームワーク(ChEmREF)について紹介する。
ChEmREFは、(1)構造化フォームと非構造化フォーム間の化学表現の変換(例:C2H6Oをエタノールに変換する)、(2)緊急応答生成(例:適切な避難距離を推奨)、(3)化学安全性および認証試験からのドメイン知識質問の3つのタスクに分けられる。
最良評価モデルは,非構造化HAZMAT化学表現翻訳で68.0%,LCM判定では52.7%,インシデント応答推奨で68.0%と精度良く一致した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:16:33 GMT)
ChEmREF: Evaluating Language Model Readiness for Chemical Emergency Response [21.8] 本稿では,化学緊急対応評価フレームワーク(ChEmREF)について紹介する。
ChEmREFは、(1)構造化フォームと非構造化フォーム間の化学表現の変換(例:C2H6Oをエタノールに変換する)、(2)緊急応答生成(例:適切な避難距離を推奨)、(3)化学安全性および認証試験からのドメイン知識質問の3つのタスクに分けられる。
最良評価モデルは,非構造化HAZMAT化学表現翻訳で68.0%,LCM判定では52.7%,インシデント応答推奨で68.0%と精度良く一致した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:02 GMT)
Synthetic Data-Driven Prompt Tuning for Financial QA over Tables and Documents [21.7] データ拡張最適化によって駆動される自己改善プロンプトフレームワークを導入する。
我々は、合成財務表と文書の抜粋を生成し、それらの正確性と堅牢性を検証し、結果に基づいてプロンプトを更新する。
我々は通常のプロンプト法よりも精度と堅牢性の両方で高い性能を達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:38:49 GMT)
StochEP: Stochastic Equilibrium Propagation for Spiking Convergent Recurrent Neural Networks [21.6] スパイキングネットワーク(SNN)は、エネルギー効率が高く、希少で生物学的にインスパイアされた計算を約束する。
BPTT(Backproagation Through Time)とサロゲート勾配(surrogate gradients)を併用したトレーニングは、強い性能を達成できるが、生物学的には不可能である。
本稿では,確率論的スパイキングニューロンをEPパラダイムに統合した平衡伝播(EP)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:58:39 GMT)
OpenUS: A Fully Open-Source Foundation Model for Ultrasound Image Analysis via Self-Adaptive Masked Contrastive Learning [21.6] 公開データの集合体上に構築された初の再現可能なオープンソース超音波基礎モデルであるOpenUSを提案する。
OpenUSはビジョンのMambaバックボーンを採用し、画像全体のローカルおよびグローバルな長距離依存関係をキャプチャする。
我々の事前学習したOpenUSモデルは、ラベル効率の良い微調整のバックボーンとして機能することで、特定の下流タスクに容易に適応できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:31:18 GMT)
PANDA - Patch And Distribution-Aware Augmentation for Long-Tailed Exemplar-Free Continual Learning [21.5] 本稿では,Patch-and-Distribution-Aware AugmentationフレームワークであるPANDAを提案する。
PANDAは、CLIPエンコーダを使用して、代表領域を特定し、各タスク内の頻繁なクラスサンプルに移植することで、低周波クラスを増幅する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:01 GMT)
CountSteer: Steering Attention for Object Counting in Diffusion Models [21.5] テキスト・ツー・イメージ拡散モデルは現実的で一貫性のある画像を生成するが、しばしばテキストの数値的な命令に従わない。
提案手法は,モデルが意図しない隠蔽状態の推論を行うことにより,特定対象数の生成を改善する訓練不要な手法であるCountSteerを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:52:11 GMT)
Fault Detection in Solar Thermal Systems using Probabilistic Reconstructions [21.3] 太陽熱システム(STS)は、低炭素熱発生に有望な道を示す。
STSは、不適切なインストール、メンテナンス、運用による欠陥を示すことができる。
本稿では,異常検出のための確率的再構成に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:16 GMT)
On Stealing Graph Neural Network Models [21.2] 現在のグラフニューラルネットワーク(GNN)モデルステアリング手法は、被害者モデルに対するクエリに大きく依存している。
本稿では,敵がモデルと非常に限られた相互作用を持つGNNを抽出する方法を実証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:06 GMT)
Key Decision-Makers in Multi-Agent Debates: Who Holds the Power? [21.1] 異なる視点で特定の位置に役割を割り当てることがマルチエージェント・ディベート(MAD)のパフォーマンスに大きく影響を与えることを示す。
我々は,MAD性能を最大22%向上させる新たな役割割当戦略である「真実の最後」を見出した。
実運用における未知の真理の問題に対処するため,マルチエージェント・ディベート・コンシステンシー(MADC)戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:47:56 GMT)
AIonopedia: an LLM agent orchestrating multimodal learning for ionic liquid discovery [21.0] AIonopediaを紹介します。私たちの知る限りでは、最初のIL発見エージェントです。
LLMの拡張されたILのためのマルチモーダルドメイン基盤モデルによって実現された。
新しくキュレートされ、包括的なILデータセットでトレーニングされ、評価され、我々のモデルは優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:53:57 GMT)
EEGAgent: A Unified Framework for Automated EEG Analysis Using Large Language Models [21.0] EEGAgentは、大規模な言語モデル(LLM)を活用して、複数のツールをスケジュールし、計画し、EEG関連のタスクを自動的に完了させる汎用フレームワークである。
EEGAgentは、EEG基本的な情報認識、EEG探索、EEGイベント検出、ユーザとのインタラクション、EEGレポート生成といった重要な機能を実行することができる。
これらの機能はパブリックデータセットで評価され、私たちのEEGAgentは柔軟で解釈可能なEEG分析をサポートできます。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:20:57 GMT)
SITA: A Framework for Structure-to-Instance Theorem Autoformalization [20.9] 我々は、SITA(Structure-to-instance theorem autoformalization)の枠組みを開発する。
SITAは抽象数学的理論と、リーン証明アシスタントにおける具体的な応用のギャップを埋める。
対応するリーンの定義とインスタンス宣言を生成し、それらをリーンのタイプクラスメカニズムを使って統合し、構造的な仮定をチェックして検証済みの定理を構築します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:08 GMT)
Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism [20.6] MLLM(Multimodal Large Language Models)が人間の言語における聴覚情報をどのように解釈するかを検討する。
LEX-ICONは,4つの自然言語から8,052個の単語からなる,広範囲なミメティックな単語データセットである。
その結果,(1)MLLMの音韻直感は,複数の意味的次元にわたる既存の言語研究と一致し,(2)印象的音韻に焦点をあてる音韻的注意パターンが明らかになった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:33 GMT)
A Style is Worth One Code: Unlocking Code-to-Style Image Generation with Discrete Style Space [20.5] 本稿では,数値的なスタイルのみを前提とした,新しい一貫した視覚的スタイルのイメージを生成する,コード・ツー・スタイル画像生成の新しいタスクを紹介する。
CoTyleはこのタスクのための最初のオープンソースメソッドである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:36 GMT)
Beyond the Black Box: Demystifying Multi-Turn LLM Reasoning with VISTA [20.4] VISTAは、マルチターン推論タスクにおけるテキスト分析のためのWebベースのVisual Interactive Systemである。
ユーザーは、コンテキストがモデル決定に与える影響を可視化し、対話的に会話履歴を変更することができる。
プラットフォームはオープンソースで、カスタムベンチマークとローカルモデルを簡単に統合できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:31 GMT)
Facial-R1: Aligning Reasoning and Recognition for Facial Emotion Analysis [20.4] FEA(Facial Emotion Analysis)は、説明可能なきめ細かい推論を取り入れることで、従来の顔の感情認識を拡張している。
近年のアプローチでは、ビジョンランゲージモデル(VLM)を活用し、有望な結果が得られるが、2つの限界に直面している。
両課題を最小限の監督で効果的に解決する3段階アライメントフレームワークであるFacial-R1を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:43 GMT)
Advanced Black-Box Tuning of Large Language Models with Limited API Calls [20.3] ブラックボックスチューニングは、より大きな言語モデル(LLM)を望ましい振る舞いに適応するための新たなパラダイムである。
限られたAPI呼び出しを持つLLMのための新しい高度なブラックボックスチューニング手法を提案する。
提案手法では,事前学習した言語モデルの精度を55.92%から86.85%に引き上げ,APIクエリの頻度を1.38%に削減する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:25 GMT)
Making Every Head Count: Sparse Attention Without the Speed-Performance Trade-off [20.3] 既存のスパース手法は、しばしば計算効率のために情報の整合性を交換する。
我々はSPAttentionを提案し、その中心となる貢献は、原則的構造スパーシリティ(Principled Structure Sparsity)という新しいパラダイムの導入である。
SPAttentionは、全注目作業負荷をバランスの取れた非重なり合う距離バンドに再編成し、各ヘッドにユニークなセグメントを割り当てる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:04 GMT)
A General Anchor-Based Framework for Scalable Fair Clustering [20.3] AnchorベースのFair Clustering Framework(AFCF)を紹介します。
AFCFは任意の公正クラスタリングアルゴリズムを線形時間拡張性で強化する。
理論的には、データセット全体における最終クラスタリングの公平性は、アンカークラスタリングの公平性と一致することが証明されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:16:50 GMT)
Stroke Modeling Enables Vectorized Character Generation with Large Vectorized Glyph Model [20.2] 我々は,次のストロークを予測して,ベクトル化された中国のグリフを生成するために設計された,LVGM(Large Vectorized Glyph Model)を提案する。
限られたストロークで、完全な文字、意味的にエレガントな単語、さらにはベクトル化された形で見えない詩を生成できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:48:38 GMT)
Improved Differentially Private Algorithms for Rank Aggregation [20.2] ケメニー階数集計問題に対して,改良されたPTASと5$-approximationアルゴリズムを提案する。
我々はまず,足位集計問題について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:58:36 GMT)
Generalizable Slum Detection from Satellite Imagery with Mixture-of-Experts [20.1] GRAMは、2段階のテスト時間適応フレームワークであり、ターゲット領域からのラベル付きデータを必要とせずに堅牢なスラムセグメンテーションを可能にする。
ソーストレーニングには,4大陸12都市を対象とした,100万規模の衛星データデータセットを使用します。
適応の間、専門家間の予測整合性は信頼できない擬似ラベルをフィルタリングし、モデルがこれまで見られなかった領域に効果的に一般化することを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:21 GMT)
AffordBot: 3D Fine-grained Embodied Reasoning via Multimodal Large Language Models [20.1] エージェントが3Dシーンの各参照余剰要素、その位置、動きタイプ、動き軸について予測する必要がある。
本稿では,MLLM(Multimodal Large Language Models)とCoT(Chere-of-Thought)推論パラダイムを統合した新しいフレームワークであるAffordBotを提案する。
AffordBotは最先端のパフォーマンスを実現し、3Dポイントのクラウド入力とMLLMだけで強力な一般化と物理的根拠を持つ推論を実証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:26 GMT)
UCPO: A Universal Constrained Combinatorial Optimization Method via Preference Optimization [20.0] Universal Constrained Preference Optimization (UCPO)は、既存のニューラルソルバに好み学習をシームレスに統合する新しいプラグイン・アンド・プレイフレームワークである。
UCPOは制約満足度を直接嗜好に基づく目的に組み込む。
当初のトレーニング予算の1%に過ぎず、例外的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:35:14 GMT)
CSGaze: Context-aware Social Gaze Prediction [20.0] CSGazeは、顔やシーン情報を補完的な入力として活用し、社会的視線パターンの予測を強化する、コンテキスト認識型マルチモーダルアプローチである。
実験の結果,CSGazeはGP-Static, UCO-LAEO, AVA-LAEOの最先端手法と競合することがわかった。
生成したアテンションスコアを通じて、最初の説明可能性を提供し、モデルの意思決定プロセスに関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:54:18 GMT)
On the Trade-Off Between Transparency and Security in Adversarial Machine Learning [19.8] 本稿では,トランスファー可能な対向攻撃のレンズによるエージェントに対する透明性の戦略的効果について検討する。
転送可能な敵の例攻撃では、攻撃者は攻撃者のターゲットモデルを騙すために代理モデルを使用して入力を悪意を持って妨害する。
攻撃者は、攻撃者の判断と一致した場合、より成功している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:05:50 GMT)
FQ-PETR: Fully Quantized Position Embedding Transformation for Multi-View 3D Object Detection [19.8] カメラを用いたマルチビュー3D検出のためのフル量子化フレームワークであるFQ-PETRを提案する。
W8A8 の FQ-PETR は、最大75% のレイテンシを低下させながら、ほぼ浮動小数点精度 (1% の劣化) を達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:25:14 GMT)
Thermally Activated Dual-Modal Adversarial Clothing against AI Surveillance Systems [19.8] 敵パッチは、AI駆動監視システムに抵抗する一般的なプライバシー保護アプローチとして現れている。
本研究では,現実環境における適応性と有効性を確保するために,熱活性化型対向ウェアラブルを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:52 GMT)
HCC-3D: Hierarchical Compensatory Compression for 98% 3D Token Reduction in Vision-Language Models [19.6] ポイントクラウドとテキストデータ間のマルチモーダル推論を可能にするために、VLM(Vision-Language Models)を活用している。
現在の3D-VLMは、3Dポイントの雲を直接3Dトークンに埋め込む。
このフレームワークはアプリケーションを制限する計算コストが非常に高く、LLM(Large Language Model)の全ての3Dトークンの処理にボトルネックがあることを特定します。
重要な情報の完全性を維持しながら、3Dトークンによってもたらされる計算オーバーヘッドをどうやって削減できるのか?
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:39 GMT)
Q-Doc: Benchmarking Document Image Quality Assessment Capabilities in Multi-modal Large Language Models [19.6] 本稿では,MLLMの粗度,中度,微粒度レベルでのDIQA能力を体系的に探索するQ-Docを提案する。
MLLMはDIQA能力を有するが,不整合スコア,歪み誤同定,重度誤判断などの限界がみられた。
我々の研究は、MLLMにおけるDIQA能力のベンチマークを提供し、その品質知覚における明らかな欠陥と、拡張のための有望な経路を明らかにする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:41:17 GMT)
Reinforcing Trustworthiness in Multimodal Emotional Support Systems [19.6] 感情的支援に対するマルチモーダルなアプローチは、多種多様なデータソースを統合することで、共感的、文脈的に関係のある応答を提供する。
我々は、ビデオ、オーディオ、テキストからのマルチモーダル埋め込みを活用し、感情的要素を予測し、専門的な治療基準に沿った応答を生成する新しいフレームワーク、textsc MultiMoodを紹介した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:47 GMT)
Format Matters: The Robustness of Multimodal LLMs in Reviewing Evidence from Tables and Charts [19.6] 我々は,表と表の両方を証拠として科学的クレームを検証するマルチモーダルな大規模言語モデルの能力を評価する実験を設計し,実施する。
この適応したデータセットを用いて、12個のマルチモーダルLCMを評価し、グラフベースのエビデンスに苦慮しながら、現在のモデルがテーブルベースのエビデンスでより良い性能を発揮することを発見した。
また,より小さなマルチモーダル LLM (8B以下) では,テーブルベースタスクとチャートベースタスクのパフォーマンスの相関が低く,クロスモーダル一般化の制限が示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:34 GMT)
Collaborative Representation Learning for Alignment of Tactile, Language, and Vision Modalities [19.5] 触覚は視覚と言語に豊かで相補的な情報を提供し、ロボットはきめ細かい物体の性質を知覚することができる。
既存の手法では、触覚、言語、視覚のモダリティ間の中間的コミュニケーションを完全に統合することができない。
TLV-CoReは,CLIPをベースとした触覚・言語・視覚協調表現学習手法である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:34:20 GMT)
Generalizing Analogical Inference from Boolean to Continuous Domains [19.4] アナロジカル推論は強力な誘導機構であり、人間の認知に広く使われ、人工知能にますます応用される。
我々は、一般化された手段によって定義されたパラメータ化された類似性に基づいて、実数値領域における類似推論のための統一的なフレームワークを導入する。
この結果は離散領域と連続領域をまたいだアナログ推論の一般理論を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:50:18 GMT)
From Single to Societal: Analyzing Persona-Induced Bias in Multi-Agent Interactions [19.3] 大規模言語モデル(LLM)ベースのマルチエージェントシステムは、人間のインタラクションをシミュレートし、協調的なタスクを解決するためにますます利用されている。
ペルソナはマルチエージェントインタラクションにバイアスをもたらすか?
本稿では,多エージェントインタラクションにおけるペルソナ誘発バイアスの系統的研究について述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:19:28 GMT)
DynamicRTL: RTL Representation Learning for Dynamic Circuit Behavior [19.3] DR-GNNは、静的構造と多サイクル実行の両方を組み込むことで、RTL回路表現を学習する新しいアプローチである。
我々は,6300以上のVerilog設計と63,000のシミュレーショントレースからなる,最初の包括的動的回路データセットを構築した。
その結果,DR-GNNは分岐ヒット予測やトグルレート予測において既存モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:59 GMT)
Tree-Based Stochastic Optimization for Solving Large-Scale Urban Network Security Games [19.1] 都市ネットワークセキュリティゲーム(UNSG)は、都市道路ネットワーク上の限られたセキュリティリソースの戦略的割り当てをモデル化する。
大規模なUNSGにおけるナッシュ平衡(NE)の発見は、その大規模かつ活動的な空間のために困難である。
NEフィンディングとUNSGの要求のギャップを埋めるフレームワークであるTree-based Optimization (TSO)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:26 GMT)
Draft and Refine with Visual Experts [19.0] 最近のLVLM(Large Vision-Language Models)は、強力なマルチモーダル推論能力を示す。
彼らはしばしば、視覚的な証拠ではなく、言語的な先入観に強く依存しているため、根拠のない、あるいは幻覚的な反応を生み出す。
本稿では,質問条件付き利用指標によって駆動されるエージェントフレームワークであるDraft and Refine(DnR)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:50:14 GMT)
Reverberation: Learning the Latencies Before Forecasting Trajectories [19.0] 過去を未来へブリッジし、空間的および時間的にエージェントを接続することは、軌道予測タスクの中核にある。
異なるエージェントは、特定の軌道変更イベントに注意し、処理し、反応するために、明確な遅延優先を示す可能性がある。
音響学における残響曲線に着想を得て,新しい残響曲線とそれに対応する残響軌道予測モデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:59:24 GMT)
Learning and Testing Convex Functions [19.0] 本稿では,ガウス空間上の実数値凸関数の学習と証明の問題について考察する。
数学における関数の凸性に関する広範な研究にもかかわらず、その学習可能性とテスト容易性は、主に離散的あるいは限定的な設定でのみ検討されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:19:44 GMT)
Robust Decentralized Multi-armed Bandits: From Corruption-Resilience to Byzantine-Resilience [18.9] 分散型協調型マルチエージェント・バンドイット(DeCMA2B)は、複数のエージェントが分散型マルチエージェント・バンドイット設定でどのように協力するかを考察する。
DeCMA2Bを敵の汚職で研究し、敵は限定的な汚職予算を持つ全てのエージェントの報酬観察を損なうことができる。
DeMABARと呼ばれるロバストなアルゴリズムを提案し、各エージェントの個別の後悔が汚職予算に比例する加法的項にのみ悩まされることを保証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:46:14 GMT)
RobIA: Robust Instance-aware Continual Test-time Adaptation for Deep Stereo [18.8] RobIAは、ステレオ深度推定における連続的なテスト時間適応のための新しいRobust, Instance-Awareフレームワークである。
RobIA は,(1) Attend-and-Excite Mixture-of-Experts (AttEx-MoE) と (2) Robust AdaptBN Teacher の2つの重要なコンポーネントを統合している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:08 GMT)
FineSkiing: A Fine-grained Benchmark for Skiing Action Quality Assessment [18.7] アクション品質アセスメント(AQA)は、スポーツ活動の評価と評価を目的としている。
既存のAQA手法は、主にビデオ全体から抽出された特徴に基づいてスコアを予測する。
本稿では,空飛ぶスキーのための微粒なサブスコアと推論アノテーションを含む最初のAQAデータセットを構築する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:22 GMT)
Enhancing Meme Emotion Understanding with Multi-Level Modality Enhancement and Dual-Stage Modal Fusion [18.6] 我々は、ミーム感情理解(MEU)を促進するための新しいフレームワークであるMemoDetectorを提案する。
特に,MemoDetectorはMET-MEMEでは4.3%,MOODでは3.4%向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:59:08 GMT)
Multicalibration yields better matchings [18.5] 不完全な予測器が与えられた場合、最適下決定規則は誘導された誤りを補うことができ、したがって標準最適規則よりも優れる。
以下のプロパティで、特定のマルチキャリブレーションされた予測子$hat $を構築する方法を示す。
hat $の出力に基づいて最適なマッチングを選択することは、オリジナルの予測子に適用された$mathcal C$の最良の決定ルールと競合する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:45:07 GMT)
Beyond empirical models: Discovering new constitutive laws in solids with graph-based equation discovery [18.4] 実験データから法則の自動発見のためのグラフベースの方程式探索フレームワークを提案する。
我々は, アルミニウム合金材料のひずみ速度効果とリチウム金属の変形挙動の新しいモデルを発見した。
提案するフレームワークは、データ駆動科学モデリングのための一般化可能かつ解釈可能なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:44 GMT)
Robust and Efficient Communication in Multi-Agent Reinforcement Learning [18.4] マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
既存のほとんどのアプローチは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:23:11 GMT)
PRBench: Large-Scale Expert Rubrics for Evaluating High-Stakes Professional Reasoning [18.3] Professional Reasoning Bench (PRBench) は、ファイナンス・アンド・ローにおける現実的な問題の現実的で、オープンで、困難なベンチマークである。
私たちは1,100人の専門家によるタスクと19,356人の専門家による基準をオープンソース化しました。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:55:12 GMT)
Does AI-Assisted Coding Deliver? A Difference-in-Differences Study of Cursor's Impact on Software Projects [18.3] Cursorの採用は、プロジェクトレベルの開発速度を著しく、大きく、しかし過渡的に増加させます。
静的解析警告の増加とコードの複雑さは、長期の速度低下を引き起こす主要な要因である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:08 GMT)
From Proof to Program: Characterizing Tool-Induced Reasoning Hallucinations in Large Language Models [18.1] ツール拡張言語モデル(TaLM)は、パラメトリック能力を超えた問題を解決するために外部ツールを呼び出すことができる。
ツールが正しく選択され、実行されたとしても、TaLMは推論の代用としてツール出力を扱います。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:21:34 GMT)
Towards Comprehensive Sampling of SMT Solutions [18.0] PanSamplerは、少数のソリューションで高いカバレッジを実現する新しいSMTサンプリングシステムである。
多様性を意識したSMTアルゴリズム、抽象構文木(AST)誘導スコアリング機能、ポストサンプリング最適化技術という3つの新しい手法が組み込まれている。
パンサンプラーは高い対象範囲に到達する能力が著しく向上する一方で、同じカバレッジレベルを達成するために現在のサンプルよりも少ないソリューションを必要としている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:36 GMT)
Generalizing to Unseen Disaster Events: A Causal View [17.9] 本稿では,イベントやドメインに関するバイアスを低減し,将来のイベントへの一般化を促進する手法を提案する。
このアプローチは、最大+1.9%のF1で複数のベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:47 GMT)
FarSkip-Collective: Unhobbling Blocking Communication in Mixture of Experts Models [17.6] 本稿では,FarSkip-Collectiveを提案する。
我々は16Bから109Bパラメータに変化する一連の最先端モデルを完全に変換し、通信の重複を可能にする。
大規模な修正モデルの保持精度の証明に加えて,最適化実装によるFarSkip-Collectiveの利点も実現した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:25:14 GMT)
Robust Watermarking on Gradient Boosting Decision Trees [17.6] GBDTモデルに適した最初の堅牢な透かしフレームワークを提示する。
モデル精度への影響を最小限に抑えつつ,透かしの堅牢性を確保しつつ,4つの埋め込み戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:25 GMT)
Align$^3$GR: Unified Multi-Level Alignment for LLM-based Generative Recommendation [17.5] Align$3$GRはトークンレベル、振る舞いモデリングレベル、優先度レベルのアライメントを統一する新しいフレームワークである。
提案手法は,動的嗜好適応のための自己再生(SP-DPO)と実世界フィードバック(RF-DPO)を組み合わせる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:52:43 GMT)
H3Former: Hypergraph-based Semantic-Aware Aggregation via Hyperbolic Hierarchical Contrastive Loss for Fine-Grained Visual Classification [17.4] H3Formerは、きめ細かい視覚分類のための新しいトークン・ツー・リージョンフレームワークである。
SAAMは、トークン間で重み付けされたハイパーグラフを動的に構築するために、マルチスケールのコンテキストキューを利用する。
HHCLは非ユークリッド埋め込み空間において階層的意味制約を強制する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:11 GMT)
Image Aesthetic Reasoning via HCM-GRPO: Empowering Compact Model for Superior Performance [17.3] マルチモーダル大言語モデル(MLLM)を用いた画像スクリーニングの性能について検討する。
データには128万以上のサンプルと約640万の画像を含む総合的な画像スクリーニングデータセットを収集する。
データセットは、外観変形、物理的な影、配置レイアウト、拡張の4つの側面で画像美的推論能力を評価する。
実験の結果,GPT4oやQwen-VL-Maxのような最先端のクローズドソースMLLMでさえ,画像美的推論におけるランダムな推測に類似した性能を示すことがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:19 GMT)
Generalized infinite dimensional Alpha-Procrustes based geometries [17.1] 統一ヒルベルト・シュミット作用素と拡張マハラノビスノルムに基づく形式主義を導入する。
提案手法は,高次元比較において幾何安定性を高める学習可能な正規化パラメータも組み込んだものである。
この研究は、機械学習、統計的推論、関数型データ解析において、堅牢な幾何学的手法を進化させるための理論的および計算的基礎を築いた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:14 GMT)
Phantom Menace: Exploring and Enhancing the Robustness of VLA Models against Physical Sensor Attacks [17.1] VLA(Vision-Language-Action)モデルは、エンドツーエンドの知覚対アクションパイプラインを可能にすることで、ロボットシステムに革命をもたらす。
これらのパイプラインは、カメラによって処理された視覚信号やマイクによってキャプチャされた聴覚信号など、複数の感覚的モダリティを統合している。
VLAベースのシステムがセンサー入力に大きく依存していることを考えると、物理世界のセンサー攻撃に対するVLAモデルのセキュリティはいまだに過小評価されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:39 GMT)
Out-of-Distribution Generalization with a SPARC: Racing 100 Unseen Vehicles with a Single Policy [17.0] エージェントが様々な文脈で環境の中で行動する文脈強化学習に焦点をあてる。
テスト時に明示的なコンテキスト情報にアクセスすることなく、アウト・オブ・ディストリビューション(OOD)設定を一般化する重要な課題に取り組む。
我々は方法論を単純化し、ロバスト制御のための単相適応を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:10 GMT)
Unitho: A Unified Multi-Task Framework for Computational Lithography [17.0] UnithoはTransformerアーキテクチャ上に構築されたマルチタスクの大型ビジョンモデルである。
Unithoはエンドツーエンドのマスク生成、リソグラフィシミュレーション、ルール違反検出をサポートする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:52:44 GMT)
Unitho: A Unified Multi-Task Framework for Computational Lithography [17.0] UnithoはTransformerアーキテクチャ上に構築されたマルチタスクの大型ビジョンモデルである。
Unithoはエンドツーエンドのマスク生成、リソグラフィシミュレーション、ルール違反検出をサポートする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:44 GMT)
GraphPilot: Grounded Scene Graph Conditioning for Language-Based Autonomous Driving [16.9] ビジョン言語モデルは、自動運転のための有望なプランナーとして登場した。
モデルは通常、リレーショナル依存関係を明示的にエンコードする監督なしにトレーニングされる。
本稿では,交通シーングラフの形式で構造化された関係文脈上で,言語に基づく運転モデルを記述する新しいモデル非依存手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:57:39 GMT)
Querying Labeled Time Series Data with Scenario Programs [16.9] シミュレーションベースのテストは、サイバー物理システムの安全性を確保するための道路テストの重要な補完となっている。
シミュレーション環境における障害シナリオの特定に向けた研究が進められている。
実世界の実システムの再現可能なシミュレーションにおいて、AV故障シナリオは見つかるか?
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:34 GMT)
DEFT-LLM: Disentangled Expert Feature Tuning for Micro-Expression Recognition [16.9] マルチエキスパート・ディアングルメントによるセマンティックアライメントを実現するDEFT-LLMを提案する。
まず,テキストと局所的な顔の動きを一致させる動作駆動型命令であるUni-MERを紹介する。
次に、3人の専門家によるアーキテクチャを設計し、顔のダイナミクスを独立した表現に分離します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:21:24 GMT)
Coordinate Descent for Network Linearization [16.9] ReLUアクティベーションは、ResNetネットワークに基づくPrivate Inferenceの主要なボトルネックである。
現在の最先端手法のほとんどは、ネットワーク精度とReLU予算を同時に最適化するスムーズな近似に基づいている。
我々は、最適化フレームワークとしてCoordinate Descentを活用することで、離散ドメインで直接動作する別のアプローチを取ります。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:03:58 GMT)
CLIP4VI-ReID: Learning Modality-shared Representations via CLIP Semantic Bridge for Visible-Infrared Person Re-identification [16.8] 本稿では,VI-ReIDタスクのためのCLIP4VI-ReIDという,CLIP駆動型モダリティ共有表現学習ネットワークを提案する。
自然画像と赤外線画像の物理的特徴の巨大なギャップを考慮すると、TSGは可視画像のみにテキストセマンティクスを生成するように設計されている。
IFEは、生成されたテキストセマンティクスを用いて、赤外線画像の特徴埋め込みを修正するために提案されている。
最後に、ハイレベルなセマンティックアライメントを洗練するためにHSAが確立される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:53 GMT)
LampQ: Towards Accurate Layer-wise Mixed Precision Quantization for Vision Transformers [16.8] 量子化アルゴリズムはビジョントランスフォーマー(ViT)を低ビットフォーマットに圧縮し、メモリと計算要求を減らす。
既存の手法は均一な精度に依存しており、量子化に対するViT成分の多様な感度を無視している。
本稿では,これらの制限を克服するために,VTの正確なメートル法MPQ手法であるLampQを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:47:11 GMT)
LampQ: Towards Accurate Layer-wise Mixed Precision Quantization for Vision Transformers [16.8] 量子化アルゴリズムはビジョントランスフォーマー(ViT)を低ビットフォーマットに圧縮し、メモリと計算要求を減らす。
既存の手法は均一な精度に依存しており、量子化に対するViT成分の多様な感度を無視している。
本稿では,これらの制限を克服するために,VTの正確なメートル法MPQ手法であるLampQを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:12 GMT)
Trapped by Their Own Light: Deployable and Stealth Retroreflective Patch Attacks on Traffic Sign Recognition Systems [16.8] 本稿では、パッチアタックの高デプロイ性とレーザープロジェクションのステルス性を組み合わせた新しい攻撃ベクトルであるAdversarial Retroreflective Patch (ARP)を紹介する。
ユーザによる調査では、ALP攻撃は、前回のパッチ攻撃よりも1.9%高いステルスネススコアを獲得しながら、サインを無視するために、ほぼ同一のステルスネスを維持していることが示された。
我々は,DPRシールドディフェンスを戦略的に配置した偏光フィルタを用いて,停止標識と速度制限標識の防衛成功率を$geq$75% とする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:46 GMT)
SRLF: An Agent-Driven Set-Wise Reflective Learning Framework for Sequential Recommendation [16.7] 我々のフレームワークは,LLMの強力なコンテキスト内学習機能を利用するクローズドループ "アセス・バリケート・リフレクト" サイクルを運用する。
提案手法では,ユーザの行動に不可欠な複雑なパターンを抽出し,シーケンシャルなレコメンデーションタスクに非常に適している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:50:33 GMT)
AccKV: Towards Efficient Audio-Video LLMs Inference via Adaptive-Focusing and Cross-Calibration KV Cache Optimization [16.7] 簡単な最適化戦略は、タスクに基づいてオーディオやビデオのKVキャッシュに選択的に集中し、保持することである。
その結果, AV-LLM の高層構造に対する注意は, タスクに厳密に依存していないことがわかった。
AccKVは,効率的なAV-LLM推定のための適応型・クロスキャリブレーションKVキャッシュ最適化フレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:31:11 GMT)
NP-LoRA: Null Space Projection Unifies Subject and Style in LoRA Fusion [16.6] Low-Rank Adaptation (LoRA) 融合は学習対象とスタイル表現を再利用・構成するための重要な技術である。
既存の方法は重量ベースのマージに依存しており、一方のLoRAが他方を支配下に置くことが多い。
サブスペース分離を強制するLoRA融合のためのプロジェクションベースのフレームワークであるNull Space Projection LoRAを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:06:01 GMT)
Contrastive Integrated Gradients: A Feature Attribution-Based Method for Explaining Whole Slide Image Classification [16.6] 計算病理学における全スライド画像(WSI)解析には解釈可能性が不可欠である。
本稿では,ロジット空間におけるコントラスト勾配の計算により,解釈可能性を高める新しい帰属法であるContrastive Integrated Gradients (CIG)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:12:25 GMT)
LEMUR: Large scale End-to-end MUltimodal Recommendation [16.6] 生データからエンドツーエンドにトレーニングした,初の大規模マルチモーダルレコメンデーションシステムであるLEMURを提案する。
実世界の産業シナリオにおけるエンド・ツー・エンドのマルチモーダル・レコメンデーションの優位性を検証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:15:15 GMT)
From 2D to 3D Without Extra Baggage: Data-Efficient Cancer Detection in Digital Breast Tomosynthesis [16.6] パラメータフリーのままで学習可能な3D推論が可能なアーキテクチャであるM&M-3Dを提案する。
M&M-3Dは2次元投影法と3次元スライス法を11~54%、分類法は3~10%超える。
人気の高いBCS-DBTベンチマークでは、M&M-3Dは、分類で4%、ローカライゼーションで10%、以前のトップベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:25 GMT)
Multimodal Peer Review Simulation with Actionable To-Do Recommendations for Community-Aware Manuscript Revisions [16.6] 論文提出前の効果的な原稿改訂を実現するために,マルチモーダル・コミュニティ対応のピアレビューシミュレーションのための対話型Webベースシステムを提案する。
本フレームワークは,マルチモーダル LLM を用いてテキスト情報と視覚情報を統合し,Web スケールの OpenReview データに基づく検索拡張生成 (RAG) によるレビュー品質を向上させる。
このシステムは既存の学術書記プラットフォームにシームレスに統合され、リアルタイムフィードバックとリビジョントラッキングのためのインタラクティブインターフェースを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:29:23 GMT)
Rethinking Progression of Memory State in Robotic Manipulation: An Object-Centric Perspective [16.5] 物体レベルの部分観測性の下でのストレステストロボット操作のための非マルコフタスクスイートであるLIBERO-Memを紹介する。
短軸と長軸の物体追跡と時間的に順序付けられたサブゴールを組み合わせ、現在のフレームを超えて推論を必要とする。
Embodied-SlotSSMは時間的拡張性のために構築されたスロット中心のVLAフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:56:01 GMT)
MDMLP-EIA: Multi-domain Dynamic MLPs with Energy Invariant Attention for Time Series Forecasting [16.5] 我々は、季節的な信号を強い成分と弱い成分に分類する適応的融合二重領域季節区分を開発する。
第2に、トレンドや季節予測の中で異なる特徴チャネルに適応的に焦点をあてるエネルギー不変アテンション機構を導入する。
第3に,チャネル非依存ニューロンに対する動的容量調整機構を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:01 GMT)
Rethinking the Reliability of Multi-agent System: A Perspective from Byzantine Fault Tolerance [16.5] 大規模言語モデル (LLM) はマルチエージェントシステム (MAS) のメインブランチとして LLM ベースのエージェントを確立している。
本研究では, ビザンチン系耐故障性の観点から, LLM系エージェントの信頼性を検証し, 定量化する。
我々は、信頼度プローブに基づく重み付きビザンチン耐故障コンセンサス機構であるCP-WBFTを設計し、異なる位相でMASの安定性を向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:12 GMT)
Satisficing and Optimal Generalised Planning via Goal Regression (Extended Version) [16.4] 汎用計画 (GP) とは、関連する計画問題のファミリーを解くプログラムを合成するタスクである。
GPのための新しい単純な手法を導入し、各問題に対する一連のトレーニング問題を与えられた場合、ある順序で各ゴール原子に対して最適な計画を計算する。
我々は,我々の方法が保証されている条件を定式化し,有効な一般化計画と探索のための状態空間決定公理を学習する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:16:32 GMT)
Baby Sophia: A Developmental Approach to Self-Exploration through Self-Touch and Hand Regard [16.4] 本研究では,ロボットエージェントBaby Sophiaにおける自律的自己探索のための強化学習フレームワークを提案する。
エージェントは、幼児の好奇心を駆使した自身の身体の探索を模した本質的な報酬を通じて、自己触知と自尊心の行動を学ぶ。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:25 GMT)
Proceedings of The third international workshop on eXplainable AI for the Arts (XAIxArts) [16.3] 第3回説明可能な芸術のためのAIに関する国際ワークショップ(XAIxArts)
17th ACM Conference on Creativity and Cognition (C&C 2025) オンライン。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:53 GMT)
Boosting Neural Video Representation via Online Structural Reparameterization [16.3] オンライン構造的再パラメータ化に基づくNVRフレームワークである Online-RepNeRV を提案する。
本手法は,トレーニング時間と復号速度を同等に保ちながら,ベースライン法平均PSNR0.37-2.7dBを達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:44:31 GMT)
PROMISE: Prompt-Attentive Hierarchical Contrastive Learning for Robust Cross-Modal Representation with Missing Modalities [16.3] 本稿では,不備なモダリティ下でのロバストなクロスモーダル表現のためのPROMISEという新しいフレームワークを提案する。
ProMISEはマルチモーダル・プロンプト・ラーニングを階層的なコントラスト・ラーニング・フレームワークに組み込んでおり、特別に設計されたプロンプト・アテンション・メカニズムを備えている。
ベンチマークデータセットを用いて行った実験は、包括的なアブレーション研究とともに、現在の最先端マルチモーダル手法と比較して、ProMISEの優れた性能を明らかに示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:39:24 GMT)
AV-Dialog: Spoken Dialogue Models with Audio-Visual Input [16.3] AV-Dialogは、音声と視覚の両方を使ってターゲット話者を追跡し、ターンテイクを予測し、一貫性のある応答を生成する最初のフレームワークである。
実験により、AV-Dialogは干渉下での音声のみのモデルよりも優れ、転写エラーの低減、ターンテイク予測の改善、人格の対話品質の向上が示されている。
これらの結果から,実環境,騒音環境,環境,環境,環境,環境,環境,環境,環境,環境,環境,環境,環境,環境,環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境、環境
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:56:26 GMT)
Product distribution learning with imperfect advice [16.2] 未知分布からの i.d.samples が$P$ であることを考えると、分布学習の目標は、$P$ に近い分布のパラメータを復元することである。
サンプル複雑性を持つTV距離$varepsilon$は、$tildeO(d1-/varepsilon2)$である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:30 GMT)
MOON Embedding: Multimodal Representation Learning for E-commerce Search Advertising [16.0] 我々は、eコマースアプリケーションのためのマルチモーダル表現学習のための持続可能な反復的プラクティスの包括的セットであるMOONを紹介する。
月はすでに、Taobao検索広告システムの全段階にわたって完全に展開されている。
MOONはデータ処理、トレーニング戦略、モデルアーキテクチャ、下流アプリケーションという4つの重要な側面に沿って進化してきた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:49:56 GMT)
Explainable Cross-Disease Reasoning for Cardiovascular Risk Assessment from LDCT [15.9] 低用量胸部CT(LDCT)は本質的に肺と心臓の両方の構造を捉えている。
本稿では,LDCTスキャンによる心肺リスクの解釈を可能にする,説明可能なクロスディスリーズ推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:05 GMT)
From Static Structures to Ensembles: Studying and Harnessing Protein Structure Tokenization [15.9] タンパク質構造トークン化は、3D構造を離散的あるいはベクトル化された表現に変換する。
構造トークン化に関する最近の多くの研究にもかかわらず、基礎となる離散表現の性質はよく理解されていない。
構造予測のための言語モデルにおける構造トークンの有効利用は、リッチで訓練済みのシーケンス埋め込みを使うことに依存していることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:22 GMT)
CLARITY: Contextual Linguistic Adaptation and Accent Retrieval for Dual-Bias Mitigation in Text-to-Speech Generation [15.7] 2つのバイアスは、アクセントバイアス(英語版)と言語バイアス(英語版)という命令誘導のテキスト音声研究で継続する。
Inclusive TTS synthesis (CLARITY) の文脈言語適応と検索について述べる。
CLARITYは、双信号最適化によってこれらのバイアスに対処するバックボーンに依存しないフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:29:10 GMT)
VIDEOP2R: Video Understanding from Perception to Reasoning [15.6] 強化微調整(RFT)は,大規模言語モデル(LLM)の推論能力向上に有望な成果を示した。
本稿では,認識と推論を個別のプロセスとしてモデル化することにより,映像の推論を強化する新しいプロセス対応ビデオRFTフレームワークであるVideoP2Rを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:42:42 GMT)
TSPE-GS: Probabilistic Depth Extraction for Semi-Transparent Surface Reconstruction via 3D Gaussian Splatting [15.5] 3D Gaussian Splattingは、高い速度品質のトレードオフを提供するが、ほとんどのメソッドは1ピクセルあたりの深さを仮定するため、半透明な表面の再構築に苦慮している。
我々は,不透明度と深さの画素単位のマルチモーダル分布をモデル化するために,透過率を均一にサンプリングするTSPE-GSを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:20:21 GMT)
Algorithm Design and Stronger Guarantees for the Improving Multi-Armed Bandits Problem [15.5] 増え続ける研究は、多少悲観的な最悪の保証があるにもかかわらず、盗賊を改善するためのアルゴリズムを設計してきた。
本研究では,2つの新しいパラメータ化された帯域幅アルゴリズム群を提案し,オフラインデータを用いて各家族から近最適アルゴリズムを学習する際のサンプル複雑性を限定する。
この家系から適切に選択されたアルゴリズムがより強力な保証を達成できることを示し、アーム報酬曲線が凹凸の強さに関連する追加特性を満たすとき、$k$に最適に依存することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:14 GMT)
Generative Caching for Structurally Similar Prompts and Responses [15.5] 大きな言語モデル(LLM)は、様々なシナリオでタスクを計画、推論、実行するためにますます使われています。
リピータブルやエージェントの設定のようなユースケースでは、プロンプトは小さなバリエーションで再利用されることが多い。
構造的に類似したプロンプトに対して変動認識応答を生成する生成キャッシュである ourmethod を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:22:00 GMT)
Proceedings of the Second International Workshop on Next-Generation Language Models for Knowledge Representation and Reasoning (NeLaMKRR 2025) [15.4] 推論は人間の知性の本質的な要素であり、批判的に考える能力に不可欠な役割を担っている。
自然言語処理における最近の進歩は、トランスフォーマーに基づく言語モデルの出現とともに、これらのモデルが推論能力を示す可能性を示唆している。
これらのモデルが実際に推論できる範囲を明確にするのは、まだ容易ではない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:20:15 GMT)
Proceedings of the Second International Workshop on Next-Generation Language Models for Knowledge Representation and Reasoning (NeLaMKRR 2025) [15.4] 推論は人間の知性の本質的な要素であり、批判的に考える能力に不可欠な役割を担っている。
自然言語処理における最近の進歩は、トランスフォーマーに基づく言語モデルの出現とともに、これらのモデルが推論能力を示す可能性を示唆している。
これらのモデルが実際に推論できる範囲を明確にするのは、まだ容易ではない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:32 GMT)
VISTAv2: World Imagination for Indoor Vision-and-Language Navigation [15.3] VLN(Vision-and-Language Navigation)は、エージェントが現実世界の空間で行動している間に言語命令に従う必要がある。
以前のイメージイマジネーションに基づくVLNの研究は、離散パノラマの利点を示しているが、オンラインの行動条件予測に欠けている。
VISTAv2は、過去の観測に照らされた自我中心の将来の展望をロールアウトする生成的世界モデルである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:20:22 GMT)
Enantiodetection in a cavity QED setup with finite chiral molecules [15.2] 両エナンチオマー間の本質的大域的な$$-phase差を利用して破壊的および/または建設的干渉経路を工学する。
平均場を超えたメソスコピックな多分子効果を捉えるために、一般化された離散トラッピングウィグナー近似を用いる。
これらの結果は、現実的な量子光学的設定でエナンチオデテククションを実装するための道を開いた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:43 GMT)
SpikCommander: A High-performance Spiking Transformer with Multi-view Learning for Efficient Speech Command Recognition [15.0] スパイキングニューラルネットワーク(SNN)は、エネルギー効率の良い音声コマンド認識(SCR)への有望な道を提供する
既存のSNNベースのSCR手法は、しばしば音声から豊富な時間的依存や文脈情報を捉えるのに苦労する。
まず,マルチビュー・スパイキング・テンポラル・アウェア・セルフアテンション(MSTASA)モジュールを導入し,効果的にスパイキング・テンポラル・アウェア・アテンションとマルチビュー・ラーニング・フレームワークを組み合わせた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:24 GMT)
Utility of Pancreas Surface Lobularity as a CT Biomarker for Opportunistic Screening of Type 2 Diabetes [15.0] 2型糖尿病 (Type 2 Diabetes Mellitus, T2DM) は、世界中の数百万人に影響を与える慢性代謝疾患である。
T2DM症例における膵表面葉状度(PSL)の増加について検討した。
本報告では, 膵などの腹部構造, CT画像バイオマーカー, T2DMの経時的スクリーニングを完全自動で行う方法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:06 GMT)
Multi-Joint Physics-Informed Deep Learning Framework for Time-Efficient Inverse Dynamics [14.9] 多関節系における筋活動と筋力の時間効率評価は臨床評価と補助装置制御において重要である。
筋肉の活性化と力を直接運動学から推定する物理インフォームド・ディープラーニング・フレームワークを提案する。
PI-MJCA-BiGRUは,基本トラストラベルを必要とせず,従来の教師付き手法に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:10 GMT)
ScaleDL: Towards Scalable and Efficient Runtime Prediction for Distributed Deep Learning Workloads [14.9] ScaleDLはディープニューラルネットワーク(DNN)のための新しいランタイム予測フレームワーク
非線形層モデリングとグラフニューラルネットワーク(GNN)に基づく層間相互作用機構を組み合わせる。
実験の結果,ScaleDLは実行時の予測精度と一般化性を向上し,MREの6倍,RMSEの5倍の精度を実現した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:22 GMT)
EPO: Diverse and Realistic Protein Ensemble Generation via Energy Preference Optimization [14.9] 本稿では,事前学習したタンパク質アンサンブル生成体をエネルギ対応サンプリング器に変換するオンライン改良であるEnergy Preference Optimization (EPO)を提案する。
テトラペプチド、ATLAS、Fast-Foldingベンチマークでは、EPOは多様な物理的に現実的なアンサンブルを生成することに成功した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:36:31 GMT)
InData: Towards Secure Multi-Step, Tool-Based Data Analysis [14.7] データ分析のための大規模言語モデルエージェントは通常、データベース上で直接コードを生成し実行します。
センシティブなデータに適用すると、このアプローチは重大なセキュリティリスクを引き起こす。
我々は,LSMを直接コード生成やデータアクセスから制限する,セキュリティを動機とする代替案を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:15:41 GMT)
AlignSurvey: A Comprehensive Benchmark for Human Preferences Alignment in Social Surveys [14.7] 私たちはAlignSurveyを紹介します。AlignSurveyは、社会調査パイプライン全体を体系的に複製し、評価する最初のベンチマークです。
ソーシャル・ロール・モデリング、半構造化インタビュー・モデリング、態度・モデリング、アンケート・レスポンス・モデリングの4つの主要な調査段階に沿ったタスクを定義している。
また、個別レベルとグループレベルのアライメントの正確性、一貫性、公平性を評価するために、タスク固有の評価指標も提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:21 GMT)
Retrieval-Augmented Generation in Medicine: A Scoping Review of Technical Implementations, Clinical Applications, and Ethical Considerations [14.7] Retrieval-augmented Generation (RAG) 技術は臨床応用性を高める可能性がある。
本研究は医学におけるRAGの応用についてレビューした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:19 GMT)
Beyond Elicitation: Provision-based Prompt Optimization for Knowledge-Intensive Tasks [14.4] 本稿では,迅速な最適化を潜在的推論ではなく,体系的な知識統合として再構築する枠組みを提案する。
KPPOは、1)知識ギャップの識別と目的の修復のための知識ギャップ充足機構、2)パフォーマンス改善と分散安定性の両方を考慮したバッチワイドな候補評価アプローチ、3)パフォーマンスとトークン効率のバランスをとる適応的な知識刈取戦略、そして、最大29%のトークン使用率を削減します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:54 GMT)
The Riemann Hypothesis Emerges in Dynamical Quantum Phase Transitions [14.3] ゼータ関数の非自明な零点と動的量子相転移との直接対応を確立する。
この対応により、RHは特定の温度でのDQPTの出現と見なすことができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:56:16 GMT)
Prostate-VarBench: A Benchmark with Interpretable TabNet Framework for Prostate Cancer Variant Classification [14.2] VUS(Variants of Uncertain Significance)は前立腺癌ゲノムの臨床的有用性を制限する。
Prostate-VarBenchは、prostate固有のベンチマークを作成するための、キュレートされたパイプラインである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:33 GMT)
RWKV-PCSSC: Exploring RWKV Model for Point Cloud Semantic Scene Completion [14.1] 本稿では,RWKV(Receptance Weighted Key Value)メカニズムにヒントを得た,軽量なセマンティックシーン補完ネットワークRWKV-PCSSCを提案する。
RWKV-PCSSCはパラメータカウントを4.18$times$に減らし、メモリ効率を1.37$times$に改善する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:11 GMT)
Memory-Assisted Nonlocal Interferometer Towards Long-Baseline Telescopes [14.1] メモリアシスト非局所干渉計は、最大20kmのファイバーリンクベースラインを達成する。
天体観測における量子記憶の 将来の応用への道のりを舗装する
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:25:26 GMT)
Theory and computation for structured variational inference [13.7] 我々は,変分近似の存在,特異性,自己整合性に関する最初の結果を証明する。
そこで我々は,変分近似の計算の保証を保証した勾配に基づくアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:14 GMT)
SMART: A Surrogate Model for Predicting Application Runtime in Dragonfly Systems [13.7] 本稿では,グラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)を組み合わせて,ポートレベルのルータデータから空間的および時間的パターンを抽出する代理モデルを提案する。
我々のモデルは、既存の統計と機械学習のベースラインを上回り、正確なランタイム予測を可能にし、Dragonflyネットワークの効率的なハイブリッドシミュレーションをサポートする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:39:43 GMT)
MoETTA: Test-Time Adaptation Under Mixed Distribution Shifts with MoE-LayerNorm [13.6] テスト時間適応(TTA)は、単一領域の分散シフト下での性能低下を軽減するのに有効であることが証明されている。
我々は,Mixture-of-Expertsアーキテクチャを統合した,新しいエントロピーベースのTTAフレームワークであるMoETTAを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:24:06 GMT)
Exploring State Tracking Capabilities of Large Language Models [13.6] 大きな言語モデル(LLM)は、複雑なタスクを解くのに素晴らしい能力を示しています。
本稿では、複数のエンティティを管理する状態をモデルが追跡する必要がある問題である状態追跡に焦点を当てる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:33 GMT)
REACT-LLM: A Benchmark for Evaluating LLM Integration with Causal Features in Clinical Prognostic Tasks [13.5] 大言語モデル(LLM)と因果学習はそれぞれ、臨床意思決定(CDM)に強い可能性を秘めている
現実世界の医療では、結果に因果的影響のある特徴を特定することが、行動可能で信頼できる予測に不可欠である。
本稿では,LEMと因果的特徴の組み合わせが臨床予後を向上するかどうかを評価するためのベンチマークであるREACT-LLMを紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:27 GMT)
Adaptive Residual-Update Steering for Low-Overhead Hallucination Mitigation in Large Vision Language Models [13.3] LVLM(Large Vision-Language Models)は、しばしばオブジェクト幻覚に悩まされ、視覚入力と矛盾するテキストを生成する。
この問題を緩和するための既存の推論時間の介入は、難しいトレードオフをもたらします。
本稿では,LVLMを視覚的に生成するフレームワークであるResidual-Update Directed Decoding Regulation(RUDDER)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:05 GMT)
Exploiting Inter-Session Information with Frequency-enhanced Dual-Path Networks for Sequential Recommendation [13.3] 本稿では、シーケンシャルレコメンデーションのための周波数拡張デュアルパスネットワークであるFreqRecを提案する。
FreqRecは、学習可能な周波数ドメイン多層パーセプトロンを介して、セッション間およびセッション内動作をキャプチャする。
クロスエントロピーと周波数領域の整合性損失を組み合わせた合成目的の下で最適化されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:02:16 GMT)
LaoBench: A Large-Scale Multidimensional Lao Benchmark for Large Language Models [13.3] 大規模な言語モデル(LLM)を評価するための,最初の大規模,高品質,多次元ベンチマークデータセットであるLaoBenchを紹介する。
LaoBenchは、知識応用、K12基礎教育、ラオス語、中国語、英語のバイリンガル翻訳という3つの中核領域にまたがる17,000以上の精査されたサンプルで構成されている。
我々のデータ構築パイプラインは、専門家によるキュレーションと自動エージェント支援検証を統合し、言語的正確性、文化的妥当性、教育的価値を保証します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:13:07 GMT)
ParoQuant: Pairwise Rotation Quantization for Efficient Reasoning LLM Inference [13.3] 後学習量子化(PTQ)は、Large Language Models(LLM)の重みを低精度表現に圧縮し、メモリフットプリントを減らし、推論を加速する。
重みとアクティベーションにおける外れ値の存在は、しばしば大きな量子化誤差と深刻な精度低下をもたらす。
Pairwise Rotation Quantization (ParoQuant) を提案する。
ParoQuantは平均2.4%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:06 GMT)
GraphFaaS: Serverless GNN Inference for Burst-Resilient, Real-Time Intrusion Detection [13.2] プロヴァンスベースの侵入検知は、サイバーセキュリティにおけるグラフィカル機械学習の応用として、ますます人気が高まっている。
従来の静的にプロビジョンされたグラフネットワーク(GNN)は、侵入検出の2つの重要な要求を満たすには不十分である。
GNNベースの侵入検知に適したサーバーレスアーキテクチャであるGraphFを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:35 GMT)
PAS : Prelim Attention Score for Detecting Object Hallucinations in Large Vision--Language Models [13.2] 大型視覚言語モデル(LVLM)は強力だが、物体の幻覚のため信頼性が低い。
本研究では、多くの幻覚予測において、LVLMは画像を無視し、代わりに新しいオブジェクトを推論するために以前に生成された出力(プリミティブ)トークンに依存することを示す。
プリリムトークン上の注意重みから計算される軽量でトレーニング不要な信号であるプリリム注意スコア(PAS)を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:23:55 GMT)
ERMoE: Eigen-Reparameterized Mixture-of-Experts for Stable Routing and Interpretable Specialization [13.2] ERMoEは、学習したゲーティングログを"Eigenbasis Score"に置き換えるスパースなMoE変換器である
ERMoE は ImageNet 分類と クロスモーダル画像テキスト検索ベンチマークにおける最先端の精度を実現する。
3D MRI変異体(ERMoE-ba)は、脳年齢予測の精度を7%以上改善し、解釈可能な専門家の専門化をもたらす。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:31:37 GMT)
Better LLM Reasoning via Dual-Play [13.2] 大規模言語モデルのための新しいデュアルプレイフレームワークPasoDobleを紹介する。
パソドブルは、同じベースモデルから2つのモデルを逆行する。
実験結果から,PasoDobleはLCMの推理性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:19:07 GMT)
Boosted GFlowNets: Improving Exploration via Sequential Learning [13.1] Boosted GFlowNetsは、GFlowNetsのアンサンブルを逐次訓練する手法で、それぞれが、以前のモデルで既に捕獲された質量を補償する残留報酬を最適化する。
本稿では, マルチモーダル合成ベンチマークとペプチド設計タスクにおいて, GFlowNetsの探索とサンプルの多様性を著しく向上することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:55 GMT)
RI-Loss: A Learnable Residual-Informed Loss for Time Series Forecasting [13.1] 時系列予測は、過去のデータから将来の値を予測することに依存する。
MSEには2つの根本的な弱点がある:そのポイントワイドエラーは時間的関係を捉えるのに失敗し、データに固有のノイズを考慮しない。
我々は,Hilbert-Schmidt Independence Criterion(HSIC)に基づく新たな目的関数であるResidual-Informed Loss(RI-Loss)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:34:00 GMT)
EmbryoDiff: A Conditional Diffusion Framework with Multi-Focal Feature Fusion for Fine-Grained Embryo Developmental Stage Recognition [13.1] EmbryoDiffは、2段階の拡散に基づくフレームワークで、条件付きシーケンス記述プロセスとしてタスクを定式化する。
具体的には、まずフレームレベルのエンコーダをトレーニングし、凍結し、堅牢な多焦点特徴を抽出する。
第2段階では、焦点面にまたがる情報を集約して3次元形態素表現を構築するマルチフォーカス特徴融合戦略を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:27:02 GMT)
Can LLMs Detect Their Own Hallucinations? [13.1] 大規模言語モデル(LLM)は、流動的な応答を生成するが、時には幻覚的な事実を生成する。
文の分類タスクとして幻覚検出を定式化する。
本研究では,LLMの幻覚検出能力を評価するためのフレームワークと,そのパラメータから知識を抽出するためにChain-of-Thought (CoT) を用いた分類手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:03:09 GMT)
Unlocking Dynamic Inter-Client Spatial Dependencies: A Federated Spatio-Temporal Graph Learning Method for Traffic Flow Forecasting [13.0] Federated Spatio-Temporal Graph with Dynamic Inter-Client Dependencies (FedSTGD)は、フェデレート学習における動的クライアント間空間依存をモデル化し、再構築するためのフレームワークである。
4つの実世界のデータセットの実験は、FedSTGDが最先端のベースラインよりも優れたパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:19 GMT)
Depth-Consistent 3D Gaussian Splatting via Physical Defocus Modeling and Multi-View Geometric Supervision [13.0] 本稿では,フィールド深度監視と多視点整合性監視を統合した新しい計算フレームワークを提案する。
マルチビュー幾何学的制約でデフォーカス物理を統一することにより,最先端のPSNR法よりも0.8dBのPSNRを改良した深度忠実度を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:14 GMT)
Sat2RealCity: Geometry-Aware and Appearance-Controllable 3D Urban Generation from Satellite Imagery [12.9] Sat2RealCity(サット2RealCity)は、現実世界の衛星画像から3D都市を生成するための幾何学的・外観制御可能なフレームワークである。
空間トポロジからビルディングインスタンスへの解釈可能な幾何学的生成を実現するためのOSMベースの空間先行戦略を導入する。
MLLMを用いた意味誘導型生成パイプラインを構築し,意味解釈と幾何学的再構成を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:42:03 GMT)
STaR: Towards Cognitive Table Reasoning via Slow-Thinking Large Language Models [12.7] 本稿では、認知テーブル推論を実現するための新しいフレームワークSTaR(slow-thinking for table reasoning)を提案する。
STaRはステップバイステップ思考と不確実性認識推論を明示的にモデル化する。
ベンチマーク実験により、STaRは優れた性能を示し、推論安定性が向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:34:17 GMT)
SEBA: Sample-Efficient Black-Box Attacks on Visual Reinforcement Learning [12.7] 視覚的RLエージェントに対するブラックボックス敵攻撃のための,サンプル効率のよいフレームワークSEBAを提案する。
SEBAは、敵対的な条件下で累積報酬を推定するシャドウQモデル、視覚的に知覚できない摂動を生成する生成逆ネットワーク、および実世界のクエリを減らすために環境力学をシミュレートする世界モデルを統合する。
MuJoCoとAtariベンチマークの実験では、SEBAは累積報酬を著しく減らし、視覚的忠実性を保ち、環境相互作用を大幅に減らしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:08 GMT)
Demystify, Use, Reflect: Preparing students to be informed LLM-users [12.7] このコースでは、構造化され、批判的、実践的な方法で、LLM(Large Language Models)を導入します。
それは、学生がAIと有意義かつ責任を持って関与するために必要なスキルを開発するのを助けることを目的としている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:43:49 GMT)
SplineSplat: 3D Ray Tracing for Higher-Quality Tomography [12.7] 任意の射影幾何学を用いて3次元線積分を計算するレイトレーシングアルゴリズムを提案する。
我々のアルゴリズムの構成要素の1つは、基底関数の寄与を効率的に計算するニューラルネットワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:51:42 GMT)
Beyond Flatlands: Unlocking Spatial Intelligence by Decoupling 3D Reasoning from Numerical Regression [12.6] 既存の視覚言語モデル(VLM)は、現実世界の空間知能を理解するのに苦労している。
GEODEは2つの特別なプラグアンドプレイモジュールでメインVLMを拡張している。
これらのモジュールの相乗効果により、1.5Bパラメータモデルは高レベルのセマンティックディスパッチとして機能します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:42:07 GMT)
Honesty over Accuracy: Trustworthy Language Models through Reinforced Hesitation [12.5] 現代の言語モデルでは、誤った回答が破滅的な結果をもたらす場合でも、自信ある幻覚が生じることを示す。
RLVR(Reinforceed Hesitation)は,2進法ではなく3進法を用いた強化学習(Reinforcement Learning from Verifiable Rewards, RLVR)の修正である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:20:45 GMT)
GEA: Generation-Enhanced Alignment for Text-to-Image Person Retrieval [12.5] TIPR(Text-to- Image Person Retrieval)は、自然言語による人物画像の検索を目的とする。
これらの制約に対処するため、生成的観点からジェネレーション・エンハンスメント・アライメント(GEA)を提案する。
我々は,3つの公開TIPRデータセットであるCUHK-PEDES,RSTPReid,ICFG-PEDESについて広範な実験を行い,GAAの性能評価を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:35:34 GMT)
Boosting Adversarial Transferability via Ensemble Non-Attention [12.4] 我々は,新たなアンサンブル攻撃であるNAMEAを設計し,アンサンブルモデルの非アテンション領域からの勾配を反復的勾配最適化プロセスに統合する。
NAMEAは、最先端のアンサンブル攻撃であるAdaEAとSMERを平均15.0%、9.6%で上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:14 GMT)
Armadillo: Robust Single-Server Secure Aggregation for Federated Learning with Input Validation [12.3] Armadilloは、単一の強力なサーバが多くの弱いクライアントと反復的に対話し、クライアントのプライベートデータ上でモデルをトレーニングするフェデレートされた学習設定のために設計されている。
本稿では,悪意あるクライアントの連帯が,事前定義された正当範囲のプライベート入力を誤って報告することによってのみ,アグリゲーション結果に影響を及ぼすような,敵対的クライアントに対する破壊的な抵抗を有するセキュアアグリゲーションシステムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:16:53 GMT)
Optimizing Mixture of Block Attention [12.3] 我々は,MoBAの基盤となる力学を統計的に解析するモデルを開発した。
ブロックサイズを小さくし、キーに短い畳み込みを適用して関連する信号をクラスタ化する。
我々は,ハードウェア対応カーネルであるFlashMoBAを紹介した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:59:59 GMT)
W2S-AlignTree: Weak-to-Strong Inference-Time Alignment for Large Language Models via Monte Carlo Tree Search [12.1] W2S-AlignTreeは、プラグアンドプレイの推論時間アライメントフレームワークである。
モンテカルロ木探索(MCTS)とWak-to-Strong Generalizationパラダイムを初めて組み合わせている。
パラメータを変更することなく、強力なモデル生成時のきめ細かいガイダンスを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:42:02 GMT)
NOVA: An Agentic Framework for Automated Histopathology Analysis and Discovery [12.1] NOVAはPythonコードを反復的に生成して実行することで、科学的なクエリを実行可能な分析パイプラインに変換する。
NOVAは、オープンソースソフトウェア上に構築された49のドメイン固有ツールを統合し、アドホックな新しいツールを作成することもできる。
データ処理、定量的分析、仮説テストにまたがるベンチマークであるSlideQuestを紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:01:18 GMT)
Multi-agent Undercover Gaming: Hallucination Removal via Counterfactual Test for Multimodal Reasoning [12.1] 幻覚は、大きな言語モデルの推論能力において大きな障害となる。
以下、Multi-Adnt Undercover Gaming(MUG)プロトコルを紹介します。
MUGは、マルチモーダル・カウンターファクト・テスト(英語版)を用いることで、(幻覚に苦しむ)「アンダーカバー」エージェントを検出するプロセスとしてMADを再編成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:27:55 GMT)
DBGroup: Dual-Branch Point Grouping for Weakly Supervised 3D Instance Segmentation [12.0] 弱教師付き3Dインスタンスセグメンテーションは3Dシーン理解に不可欠である。
既存のメソッドは2つの弱い監視形式に依存している: 1-thing-one-lickアノテーションとバウンディングボックスアノテーションである。
我々は,2段階の弱教師付き3Dインスタンスセグメンテーションフレームワークである textbfDBGroup を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:11 GMT)
SEAL: Subspace-Anchored Watermarks for LLM Ownership [12.0] 大規模言語モデルのためのサブスペース型透かしフレームワークSEALを提案する。
SEALはモデルの潜在表現空間に直接マルチビットシグネチャを埋め込んで、ホワイトボックスとブラックボックスの検証シナリオをサポートする。
我々は、SEALの優れた効率、忠実性、効率、堅牢性を示すために、複数のベンチマークデータセットと6つの著名なLCMに関する包括的な実験を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:44:11 GMT)
Hyperpolarized Molecular Nuclear Spins Achieve Magnetic Amplification [11.9] 我々は超偏極分子核スピンの磁場への応答を研究するための新しいアプローチを開発する。
陽子スピンを持つ超偏極分子を用いて、線形および非線形型における磁気増幅の実現を報告する。
我々の研究は、新しい種類の量子センサーで使われる超分極分子核スピンの可能性を強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:43:55 GMT)
Torch-Uncertainty: A Deep Learning Framework for Uncertainty Quantification [11.9] ディープラーニングのための不確実性定量化(UQ)は、不確実性推定の信頼性を向上させることを目的としている。
我々はPyTorchとLightningベースのフレームワークであるTorch-Uncertaintyを紹介した。
分類,セグメンテーション,回帰タスクにまたがる様々なUQ手法をベンチマークする総合的な実験結果を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:32 GMT)
EDGC: Entropy-driven Dynamic Gradient Compression for Efficient LLM Training [11.9] 大規模言語モデル(LLM)の訓練は、計算資源とメモリ容量に関する重大な課題を提起する。
既存のアプローチは主に通信効率を高めるために静的勾配圧縮に依存している。
EDGCと呼ばれるエントロピー駆動の動的勾配圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:49 GMT)
iMAD: Intelligent Multi-Agent Debate for Efficient and Accurate LLM Inference [11.9] マルチエージェント・ディベート(MAD)は、構造化された議論に複数のエージェントを関与させる有望なフレームワークとして登場した。
トークン効率の高いフレームワークであるインテリジェントマルチエージェント・ディベート(iMAD)を提案する。
iMADはトークン使用率(最大92%)を大幅に削減し、最終回答精度(最大13.5%)も向上することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:50:51 GMT)
Questioning the Stability of Visual Question Answering [11.8] ビジュアル言語モデル(VLM)は目覚ましい進歩を遂げているが、その信頼性は小さく、意味を保った入力変更ではよく理解されていない。
視覚的・テキスト的摂動に配慮したVLMロバスト性の最初の大規模・系統的研究について述べる。
最新のシステム(例えば、GPT-4o、Gemini 2.0 Flash)は、少数のピクセルや無害なリフレージングでしばしば失敗することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:05:05 GMT)
TopoPerception: A Shortcut-Free Evaluation of Global Visual Perception in Large Vision-Language Models [11.8] LVLM(Large Vision-Language Models)は通常、エンコーダから学習済みのLarge Language Model(LLM)に視覚的特徴を合わせる。
本稿では,LVLMのグローバルな視覚知覚能力を評価するために,トポロジカルな特性を利用するベンチマークであるTopoPerceptionを紹介する。
TopoPerception上での最先端モデルの評価を行い、最も粗い知覚の粒度であっても、全てのモデルがランダムな確率よりは良くないことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:45:56 GMT)
LLM enhanced graph inference for long-term disease progression modelling [11.7] 本稿では,地域変数の相互作用に関する専門家ガイドとして,MsLL(Large Language Models)を用いた新たなフレームワークを提案する。
アルツハイマー病コホートからのtau-PET画像データを用いて病理伝播を推定し,新しいアプローチを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:03:10 GMT)
Constrained Shadow Tomography for Molecular Simulation on Quantum Devices [11.6] 本稿では,制約付きシャドウトモグラフィのための双方向半定値プログラミング手法を提案する。
この方法は$N$で表現可能な2-RDMを構築し、影の測定とエネルギーの最小化のバランスをとる。
数値的およびハードウェア的な結果は、このアプローチが精度、耐雑音性、拡張性を大幅に改善することを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:56 GMT)
Incremental Generation is Necessity and Sufficient for Universality in Flow-Based Modelling [11.6] 最大自然クラス自己マップ上でのフローベース生成にはインクリメンタルな生成が必要で十分であることを示す。
すべての保証は、基礎となる写像上で一様であり、したがって、標本と分布の両方において近似を暗示する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:24 GMT)
Spatial Reasoning in Multimodal Large Language Models: A Survey of Tasks, Benchmarks and Methods [11.5] 空間能力は入力形式によってのみ決定されるものではないと我々は主張する。
本調査では,認知的側面から空間知性を整理する分類法を紹介した。
トレーニングベースと推論ベースの両方にまたがる空間能力向上手法を解析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:43:17 GMT)
Benchmarking Diversity in Image Generation via Attribute-Conditional Human Evaluation [11.5] 現在のテキスト・トゥ・イメージ(T2I)モデルは、しばしば多様性を欠き、均一な出力を生成する。
この研究は、T2Iモデルにおける堅牢な多様性評価の必要性に対処するフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:27 GMT)
A Best-of-Both-Worlds Proof for Tsallis-INF without Fenchel Conjugates [11.5] 本稿では,Tsallis-INFマルチアームバンディットアルゴリズムのベスト・オブ・ボス・ワールド保証の導出について述べる。
特に、この証明はオンライン凸最適化の現代的なツールを使用し、共役関数の使用を避ける。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:10:23 GMT)
BuddyMoE: Exploiting Expert Redundancy to Accelerate Memory-Constrained Mixture-of-Experts Inference [11.5] 現代のMoEモデルのサイズが大きくなると、完全なパラメータセットがGPUメモリ容量を超える。
Prefetchingsは、どの専門家が必要なのかを予測することによって、このレイテンシを隠すことを目的としている。
重要な課題は、プレフェッチ失敗時に高い推論速度とモデルの精度を維持することである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:18 GMT)
FreDN: Spectral Disentanglement for Time Series Forecasting via Learnable Frequency Decomposition [11.5] 本稿では,周波数領域におけるトレンドと周期成分を直接分離する学習可能な周波数ディスタングルモジュールを提案する。
また,複素数値演算の複雑さを低減し,性能の維持を図るため,理論的に支持されたReIm Blockを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:13:24 GMT)
Tunable single-photon frequency converter in a waveguide with a giant V-type atom [11.5] 1次元(1D)導波路における1光子散乱と$V$型巨大原子(GA)の1つの遷移について検討する。
GAによる単光子の非弾性散乱は単光子の周波数変換を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:07 GMT)
ADI-20: Arabic Dialect Identification dataset and models [11.5] ADI-20は、以前発表されたADI-17アラビア方言識別(ADI)データセットの拡張である。
ADI-20はアラビア語圏のすべての方言をカバーしている。
このデータセットを用いて、さまざまな最先端ADIシステムのトレーニングと評価を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:09 GMT)
SMoFi: Step-wise Momentum Fusion for Split Federated Learning on Heterogeneous Data [11.4] Split Federated Learningは、モデルのパーティションをトレーニングするために、中央サーバでリッチなコンピューティングリソースを使用する。
サイロ間のデータの異質性は、グローバルモデルの収束速度と精度を損なう大きな課題である。
本稿では,勾配の発散に対処する効果的で軽量なフレームワークであるSMoFiについて紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:45 GMT)
Measuring Model Performance in the Presence of an Intervention [11.4] 社会的影響アプリケーションのための多くのAIでは、結果に影響を与える介入の存在は評価に偏っている。
RCTはランダムに介入を割り当て、制御グループからのデータをバイアスのないモデル評価に使用できる。
本研究では, 治療群からのデータを重み付けし, 結果が得られないサンプルの分布を再現する非バイアスモデル評価手法であるニュアンスパラメータ重み付け(NPW)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:24:12 GMT)
SOM Directions are Better than One: Multi-Directional Refusal Suppression in Language Models [11.4] 拒絶(Refusal)とは、安全に整合した言語モデルが有害または非倫理的なプロンプトを拒否できる機能的行動を指す。
最近の研究は、モデルの潜在空間における単一方向としての拒絶動作を符号化した。
本稿では,自己組織マップを利用して複数の拒絶方向を抽出する手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:50 GMT)
fastbmRAG: A Fast Graph-Based RAG Framework for Efficient Processing of Large-Scale Biomedical Literature [11.4] グラフベースの検索拡張生成(RAG)システムは、文脈推論を改善することができる。
FastbmRAGは、生物医学文献に最適化された高速グラフベースのRAGである。
評価の結果,fastbmRAGは既存のグラフRAGツールの10倍以上高速であることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:07 GMT)
Remember Me: Bridging the Long-Range Gap in LVLMs with Three-Step Inference-Only Decay Resilience Strategies [11.3] LVLM(Large Vision-Language Models)は、様々なタスクにおいて優れたパフォーマンスを実現している。
ロータリー位置決定(Rotary Positional Decay)の使用下では、長距離依存関係をモデル化する上で、依然として重要な課題に直面している。
この問題を軽減するため,T-DRS(Three-step Decay Resilience Strategies)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:22 GMT)
Beyond MSE: Ordinal Cross-Entropy for Probabilistic Time Series Forecasting [11.3] 現在のディープラーニングベースの予測モデルは、回帰モデリングにMean Squared Error(MSE)損失関数を用いる。
時系列予測のための新しい順序分類手法であるOCE-TSを提案する。
MSE と Mean Absolute Error (MAE) を評価指標として,OCE-TS がベンチマークモデルより一貫して優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:38:28 GMT)
MOBA: A Material-Oriented Backdoor Attack against LiDAR-based 3D Object Detection Systems [11.3] 既存のバックドア攻撃の主な制限は、物理的な実現可能性の欠如である。
物質指向バックドアアタック (Material-Oriented Backdoor Attack, MOBA) は、現実世界のトリガーの物質特性を明示的にモデル化することで、デジタル物理ギャップを埋める。
MOBAは93.50%の攻撃成功率を達成し、以前の手法を41%以上上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:02 GMT)
Detection of Bark Beetle Attacks using Hyperspectral PRISMA Data and Few-Shot Learning [11.2] 本稿では、衛星PRISMAハイパースペクトルデータを用いて、甲虫の寄生を検出するための数発の学習手法を提案する。
本手法は,従来のPRISMAスペクトルバンドとSentinel-2データよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:19:38 GMT)
Batch Matrix-form Equations and Implementation of Multilayer Perceptrons [11.2] 多層パーセプトロン(MLP)は現代のディープラーニングの基礎であるが、アルゴリズムの詳細は完全で明示的なEmphbatch行列形式で提示されることは滅多にない。
自動微分は等しく高い計算効率を達成するが、バッチ行列形式の使用により計算構造が明確になる。
本稿では,バッチ行列形式の勾配の数学的に厳密な実装仕様を提供することにより,そのギャップを埋める。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:52:27 GMT)
Automata-Based Steering of Large Language Models for Diverse Structured Generation [11.2] 大規模言語モデル(LLM)は、構造化された出力を生成するタスクが増えている。
構造的生成法は出力の多様性を欠くことが多い。
本稿では,オートマトンに基づく構造生成における多様性を高める新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:10:23 GMT)
Radiology Workflow-Guided Hierarchical Reinforcement Fine-Tuning for Medical Report Generation [11.1] 放射線医は、構造化されたワークフローを通して診断レポートを作成する。
既存の医療報告生成システムは、レポートをフラットなシーケンスとして扱い、この階層的な組織を見渡す。
本稿では,臨床報告の構造的性質を明示的にモデル化した階層型ワークフロー誘導強化フレームワークRadFlowを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:59 GMT)
Language Drift in Multilingual Retrieval-Augmented Generation: Characterization and Decoding-Time Mitigation [11.1] 複数のデータセット,言語,LLMのバックボーンにまたがる多言語RAGにおける出力言語ドリフトについて検討した。
実験の結果,デコーダレベルの崩壊によるドリフトの結果が明らかとなり,そこではトークン分布が支配的であり,高頻度の英文パターンが意図された生成言語を支配下に置くことがわかった。
そこで本研究では,対象言語を優雅に操る軽量でトレーニング不要なデコーディング戦略であるSoft Constrained Decoding (SCD)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:50 GMT)
HierRouter: Coordinated Routing of Specialized Large Language Models via Reinforcement Learning [11.0] 大規模言語モデル(LLM)は多くのタスクにまたがって最先端のパフォーマンスを提供するが、高い計算とメモリコストを課す。
特殊な軽量言語モデルのプールから推論パイプラインを動的に組み立てる階層的ルーティング手法であるHierを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:36 GMT)
Group Averaging for Physics Applications: Accuracy Improvements at Zero Training Cost [11.0] 等変法は採用されないことが多いが、それはおそらく訓練が困難であるとみなされるか、対称性が学習されることが予想されるためである。
グループ平均化はこれらの状況において利用可能なテクニックである。
これはテスト時に起こり、任意の訓練されたモデルは、その群のサイズに比例する(しばしば小さい)コストで、正確に同値なモデルを作ることができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:23 GMT)
Non-abelian Geometric Quantum Energy Pump [11.0] 非アーベル幾何学的量子エネルギーポンプは、遷移のない幾何学的量子ドライブによって実現される。
ポンプは量子トランスデューサまたはチャージャーとして機能し、量子状態の位相コヒーレンスを測定するための気象学ツールとして機能する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:20 GMT)
PATCHEVAL: A New Benchmark for Evaluating LLMs on Patching Real-World Vulnerabilities [10.9] ソフトウェアにおける脆弱性は、警戒速度で増加しています。
手作業のパッチは時間がかかり、リソースが集中的です。
自動脆弱性修復技術は 有効性に限界があります
大規模言語モデル(LLM)の最近の進歩は、脆弱性ベンチマークのための新しいパラダイムを開放した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:14:32 GMT)
MPCGNet: A Multiscale Feature Extraction and Progressive Feature Aggregation Network Using Coupling Gates for Polyp Segmentation [10.9] 本稿では,特定のモジュールの成分として結合ゲートを導入し,ノイズをフィルタし,特徴選択を行う。
MPCGNetは最近のネットワークより優れており、mDiceのスコアはETIS-LaribPolypDBとCVC-ColonDBデータセットの2番目に高いネットワークよりも2.20%と0.68%高い。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:37:24 GMT)
TruthfulRAG: Resolving Factual-level Conflicts in Retrieval-Augmented Generation with Knowledge Graphs [10.9] 本稿では,RAGシステムにおける事実レベルの知識紛争を解決するためにTrathfulRAGを提案する。
TruthfulRAGは、検索されたコンテンツからトリプルを体系的に抽出することで、知識グラフ(KG)を構築する。
大規模な実験により、TrathfulRAGは既存の手法より優れていることが判明した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:48 GMT)
Context-aware Adaptive Visualizations for Critical Decision Making [10.8] 我々は、インテリジェントでコンテキスト対応の適応可視化システムであるSymbiotikを紹介する。
我々は神経生理学的信号を用いて精神労働負荷(MWL)を推定し、強化学習(RL)を用いて視覚ダッシュボードを動的に適用する。
Symbiotikはスケーラブルでリアルタイムな適応アーキテクチャと、ニューロアダプティブなユーザインタフェースの検証された方法論を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:53:15 GMT)
PITE: Multi-Prototype Alignment for Individual Treatment Effect Estimation [10.7] textbITE推定のためのエンドツーエンドのMulti-to-end Multi-textbfPrototypeアライメント手法を提案する。
PITEはグループ内の局所構造を効果的に捕捉し、グループ間のアライメントを強制する。
13の最先端の手法を上回り、より正確で堅牢なITT推定を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:30 GMT)
ELYADATA & LIA at NADI 2025: ASR and ADI Subtasks [10.7] 本稿では,Elyadata & LIAによるNADI多言語アラビア語音声処理2025への共同提出について述べる。
ADIサブタスクでは1位,ASRサブタスクでは2位にランクインした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:31:32 GMT)
Adaptive Symmetrization of the KL Divergence [10.6] 機械学習における多くのタスクは、有限個のサンプル集合が与えられた確率分布を学習するために記述または縮小することができる。
一般的なアプローチは、(経験的)データ分布とパラメータ化された分布(例えば、正規化フロー(NF)やエネルギーベースモデル(EBM)との統計的分岐を最小化することである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:41:59 GMT)
Can You Tell the Difference? Contrastive Explanations for ABox Entailments [10.6] コントラッシブなAの説明の概念を導入し、「なぜCの例だが、bはそうではないのか?
我々は、より軽量で表現力豊かな記述論理を考慮し、異なる最適性基準の下で異なる変種に対する計算複雑性を解析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:16:43 GMT)
From Street to Orbit: Training-Free Cross-View Retrieval via Location Semantics and LLM Guidance [10.5] クロスビュー画像検索は、自律ナビゲーション、都市計画、GPSを用いた環境におけるローカライゼーションなどの応用において重要である。
我々は、事前学習された視覚エンコーダと大規模言語モデル(LLM)を利用した、シンプルで効果的なクロスビュー画像検索フレームワークを提案する。
しかし,提案手法は,ゼロショット設定下でのベンチマークデータセットに対する事前学習に基づくアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:19 GMT)
Investigating CoT Monitorability in Large Reasoning Models [10.5] 大規模推論モデル (LRM) は、最終解を出す前に拡張推論をすることで複雑なタスクにおいて顕著な性能を示す。
これらの詳細な推論トレースは、AI安全性、CoT Monitorabilityの新しい機会も生み出す。
しかし、CoT分析によってより効率的なモニターを構築しようとすると、2つの根本的な課題が生じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:46:12 GMT)
DoReMi: A Domain-Representation Mixture Framework for Generalizable 3D Understanding [10.3] DoReMiはMixture-of-Experts(MoE)フレームワークで、Domain-Aware Expertsブランチと統一されたRepresentationブランチを共同でモデル化する。
DoReMiはScanNet Valで80.1% mIoU、S3DISで77.2% mIoUを達成した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:32:45 GMT)
Drift Estimation for Diffusion Processes Using Neural Networks Based on Discretely Observed Independent Paths [10.2] 本稿では,時間均質拡散過程におけるコンパクト領域上のドリフト関数の非パラメトリック推定について述べる。
ニューラルネットワークに基づく推定器を提案し、非漸近収束率を導出し、トレーニング誤差、近似誤差、拡散関連項のスケーリングを$log N/N$とする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:56:52 GMT)
EcoAlign: An Economically Rational Framework for Efficient LVLM Alignment [10.2] LVLM(Large Vision-Language Models)は強力な推論能力を持つが、高度なジェイルブレイク脆弱性に悩まされている。
現在のアライメント手法は、安全性、実用性、運用コストのトレードオフに苦慮している。
我々は、経済的に合理的な探索としてアライメントを再構成する推論時フレームワークであるEcoAlignを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:38:13 GMT)
Lumos3D: A Single-Forward Framework for Low-Light 3D Scene Restoration [10.2] 我々は3次元低照度シーン復元のためのポーズレスフレームワークであるLumos3Dを紹介する。
幾何学的な基底を持つバックボーン上に構築されたLumos3Dは、通常の光の3Dガウス表現を再構成する。
実世界のデータセットの実験では、Lumos3Dは高忠実度低光度3Dシーンの復元を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:02 GMT)
Socrates-Mol: Self-Oriented Cognitive Reasoning through Autonomous Trial-and-Error with Empirical-Bayesian Screening for Molecules [10.2] 本稿では,言語モデルを経験的ベイズ推論に変換するフレームワークであるSocrates-Molを紹介する。
産業スクリーニングの優先順位に合わせたランキングタスクを導入し、5つの言語モデルにまたがる相互モデルの自己整合性を適用し、分散を低減する。
このフレームワークは、完全な微調整に比べてデプロイコストを70%以上削減し、分子特性予測のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:02:47 GMT)
A Compilation Framework for Quantum Circuits with Mid-Circuit Measurement Error Awareness [10.2] 中間回路計測(MCM)は量子プロセッサにおける量子ビットの再利用と動的制御の機能を提供する。
MCMは、測定によって引き起こされるクロストーク、アイドリング・キュービットのデコヒーレンス、リセットの不完全性など、いくつかのエラーの原因を導入している。
本稿では,MCMを意識したレイアウト,ルーティング,スケジューリングを行うコンパイルフレームワークMERAを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:17:08 GMT)
Towards Multiple Missing Values-resistant Unsupervised Graph Anomaly Detection [10.1] M$2$V-UGADは不完全グラフ上の複数の欠落値耐性非教師付きGADフレームワークである。
M$2$V-UGADは、既存の教師なしGAD法を、様々な欠落率で一貫して上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:37 GMT)
Non-Euclidean SGD for Structured Optimization: Unified Analysis and Improved Rates [10.0] 構造的滑らかさと勾配雑音仮定に基づく新しい統合収束解析法を開発した。
我々は,非ユークリッドSGDがヘッセンおよび勾配雑音上の上界の疎度や低ランク構造を利用することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:38:15 GMT)
Dual Riemannian Newton Method on Statistical Manifolds [10.0] 距離と2対のアフィン接続を持つ多様体上のニュートン型最適化アルゴリズムを提案する。
局所的な二次収束を確立し、代表的統計モデルの実験により理論を検証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:58:34 GMT)
VitalBench: A Rigorous Multi-Center Benchmark for Long-Term Vital Sign Prediction in Intraoperative Care [10.0] 術中のバイタルサイン予測に特化して設計された新しいベンチマークであるVitalBenchを紹介する。
VitalBenchには、2つの独立した医療センターで4000以上の手術を受けたデータが含まれている。
VitalBenchは、研究者がデータ処理の一貫性を確保しながら、アーキテクチャのイノベーションに集中できるようにする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:33:39 GMT)
TawPipe: Topology-Aware Weight Pipeline Parallelism for Accelerating Long-Context Large Models Training [9.9] 大規模言語モデル(LLM)のトレーニングは、デバイスメモリの制限とデバイス間通信のコストによって、基本的に制限されている。
分散クラスタにおける階層的帯域幅を利用して通信効率を向上させるTawPipeを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:20 GMT)
ScaleFormer: Span Representation Cumulation for Long-Context Transformer [9.8] 本稿では,既訓練エンコーダ-デコーダモデルを用いて長いシーケンス処理を行うプラグイン・アンド・プレイフレームワークを提案する。
我々のアプローチは、長い入力を重なり合うチャンクに分割し、デコーダの圧縮されたコンテキスト認識表現を生成する。
長期文書要約実験により,本手法は最先端手法と高い競争力を示し,その性能は高いことがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:03 GMT)
SemanticNN: Compressive and Error-Resilient Semantic Offloading for Extremely Weak Devices [9.8] 本稿では,セマンティックNNを提案する。セマンティックNNは,セマンティックレベルの正確性を追求するために,ビットレベルの誤りを許容するセマンティックNNである。
動的チャネル条件に適応するBER(Bit Error Rate)対応デコーダと、コンパクトな表現を学ぶためのSQ(Soft Quantization)ベースのエンコーダが組み込まれている。
我々は3つのモデルと6つのデータセットを用いてSTM32の広範囲な実験を行い、画像分類とオブジェクト検出を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:47:25 GMT)
Rethinking Visual Information Processing in Multimodal LLMs [9.7] 拡張ビジョン変換器としてLLaViT-Large Language Modelを提案する。
LLaViTは,多数のベンチマークにおいて,ベースラインのLLaVA法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:22 GMT)
Heterogeneous Attributed Graph Learning via Neighborhood-Aware Star Kernels [9.6] Neighborhood-Aware Star Kernel (NASK)は、属性グラフ学習用に設計された新しいグラフカーネルである。
NASKは肯定的であり、グラフニューラルネットワークのようなカーネルベースの学習フレームワークとの互換性を保証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:45:22 GMT)
Expandable and Differentiable Dual Memories with Orthogonal Regularization for Exemplar-free Continual Learning [9.6] 連続的な学習方法は、ニューラルネットワークにシーケンシャルなタスクを個別に処理させ、タスク間の有用な関係を活用できないようにする。
本稿では,2つの相補的記憶からなる,完全微分可能で模範のない拡張可能手法を提案する。
CIFAR-10, CIFAR-100, Tiny-ImageNetにおける実験により, 提案手法は, クラスインクリメンタル学習における14の最先端手法より優れていることを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:29 GMT)
Enhancing Robustness of Offline Reinforcement Learning Under Data Corruption via Sharpness-Aware Minimization [9.5] 実世界のデータ破損に弱いオフラインの強化学習。
我々はまず,オフラインRLのための汎用プラグアンドプレイとしてSharpness-Aware Minimization (SAM)を適用する。
IQLは、最高パフォーマンスのオフラインRLアルゴリズムであり、RIQLは、データ破壊の堅牢性のために特別に設計されたアルゴリズムです。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:11:13 GMT)
EmoVid: A Multimodal Emotion Video Dataset for Emotion-Centric Video Understanding and Generation [9.5] EmoVidは、クリエイティブメディア向けに設計された、最初のマルチモーダルな感情アノテーション付きビデオデータセットである。
視覚的特徴と感情的知覚を関連付ける空間的パターンと時間的パターンを明らかにする。
We developed a emotion-conditioned video generation technique by fine-tuning the Wan2.1 model。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:44:21 GMT)
MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism [9.5] 本稿では,エージェントパイプライン並列性を備えた新しい強化学習フレームワークであるMarsRLを提案する。
MarsRL は AIME2025 の精度を 86.5% から 93.3% に改善し、BeyondAIME は 64.9% から 73.8% に改善した。
これらの知見は、マルチエージェント推論システムを進化させるMarsRLの可能性を示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:52:34 GMT)
Proactive Hearing Assistants that Isolate Egocentric Conversations [9.4] 装着者の会話相手を自動的に識別・分離する能動的補聴器を導入する。
本システムは,エゴセントリックな音声で動作し,装着者の自発音声をアンカーとして利用する。
我々の研究は、会話のダイナミクスやエンゲージメントに積極的に適応する補聴器への一歩である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:44:48 GMT)
GEM+: Scalable State-of-the-Art Private Synthetic Data with Generator Networks [9.4] 本稿では,AIMの適応計測フレームワークとGEMのスケーラブルなジェネレータネットワークを統合したGEM+を紹介する。
実験の結果,GEM+はAIMよりも実用性とスケーラビリティに優れ,最先端の成果が得られていることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:31 GMT)
PRSM: A Measure to Evaluate CLIP's Robustness Against Paraphrases [9.4] Contrastive Language-Image Pre-Training (CLIP) は、大規模トレーニングを通じてテキストと画像表現を整列する多モーダルモデルである。
ゼロショットや少数ショットのタスクで強く機能するが、言語の変化、特にパラフレーズに対する頑健さはいまだに未発見のままである。
本稿では、CLIPのパラフレーズクエリに対する感度を定量化するための新しい尺度である、パラフレーズランキング安定度尺度(PRSM)を紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:19:04 GMT)
FactGuard: Event-Centric and Commonsense-Guided Fake News Detection [9.4] 大型言語モデル (LLMs) は偽ニュース検出のための未使用の金鉱である。
我々は,イベント中心のコンテンツ抽出にLLMを活用する,FactGuardと呼ばれる新しいフェイクニュース検出フレームワークを提案する。
私たちのアプローチは、堅牢性と正確性の両方において、既存の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:31 GMT)
Automated Side-Channel Analysis of Cryptographic Protocol Implementations [9.4] WhatsAppの最初の形式モデルを実装から抽出する。
コンパイル後セキュリティに対する既知のクローンアタックを特定します。
本稿では,暗号プロトコルの実装をサイドチャネル攻撃に対するレジリエンスとして解析する手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:13:49 GMT)
Provably Efficient Quantum Algorithms for Solving Nonlinear Differential Equations Using Multiple Bosonic Modes Coupled with Qubits [9.4] 我々は、ヒルベルト空間のディジタル化を避けるために、量子ビットに基づく適応測定を用いたボソニックモードに基づくアナログ連続変数アルゴリズムを提案する。
多くのアナログスキームとは異なり、このアルゴリズムは証明的に効率的である: 1次、$L$-grid点、$d$-dimensional、order-$K$ space-deivative、 degree-$r$-nonline。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:20:07 GMT)
DELICATE: Diachronic Entity LInking using Classes And Temporal Evidence [9.3] 本研究の目的は,人文科学分野における2つの主要な貢献による課題に対処することである。
最初の貢献は、歴史的イタリアにおけるELの新しいニューロシンボリックな方法であるDeLICATEである。
第2の貢献は、19世紀から20世紀にかけての2つの注釈付き版から抽出された、歴史的イタリアの半自動的な多領域ELコーパスであるENEIDEである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:18 GMT)
LoRaCompass: Robust Reinforcement Learning to Efficiently Search for a LoRa Tag [9.3] ロングランジ (Long-Range) プロトコルは、精神障害者(MIP)などが失う危険のあるタグに採用される傾向にある。
移動体センサが周期的に放送されるLoRaタグを、通常、未知の環境において最も少ない移動(ホップ)で見つけるためのシーケンシャルな意思決定過程について検討する。
本稿では,ロラタグの堅牢な活用と効率的な探索を実現するための強化学習モデルであるロラを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:37:36 GMT)
LocalBench: Benchmarking LLMs on County-Level Local Knowledge and Reasoning [9.3] 大規模言語モデル (LLM) は, マクロな地理的タスクにおいて広く評価されてきたが, 超局所的な知識を扱う能力はいまだによく理解されていない。
アメリカ合衆国全体での郡レベルの地域知識に基づいてLSMを評価するために設計された最初のベンチマークであるLocalBenchを紹介する。
LocalBenchを用いて、クローズドブックとWeb拡張設定の両方で、13の最先端LCMを評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:38 GMT)
WaterMod: Modular Token-Rank Partitioning for Probability-Balanced LLM Watermarking [9.2] WaterModは、透かしに対する確率対応のモジュラールールである。
ゼロビットとマルチビットの両方の設定で強い透かし検出性能が得られる。
これは自然言語生成、数学的推論、コード合成など、さまざまなタスクにまたがる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:38 GMT)
SPOT: Sparsification with Attention Dynamics via Token Relevance in Vision Transformers [9.2] 視覚変換器(ViT)内の冗長トークンを早期に検出するためのフレームワークとして,Token Relevance (SPOT) を用いた attentiOn dynamics を用いたSParsification を提案する。
SPOTはトークンスペーシフィケーションを通知し、そのようなトークンを除去し、性能を犠牲にすることなく計算効率を向上させる。
実験による評価では、通常のViTに比べて40%の効率向上が見られた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:17 GMT)
Impact of Layer Norm on Memorization and Generalization in Transformers [9.1] 本研究では,LayerNorm 変圧器の記憶と学習に及ぼすLayerNorm の影響について検討する。
我々は、LayerNormがPre-LayerNorm変換器における安定学習の重要な要素であるのに対して、Post-LayerNorm変換器ではメモリ化に影響を及ぼすことを確認した。
分析の結果,Pre-LayerNormモデルにおけるLayerNormパラメータの除去は記憶の悪化と学習の不安定化を招き,Post-LayerNormモデルでは本当のラベルを復元することで記憶の緩和を効果的に行うことがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:09 GMT)
FAST-CAD: A Fairness-Aware Framework for Non-Contact Stroke Diagnosis [8.9] 本稿では,FAST-CADを提案する。FAST-CADは,ドメイン・アドバイザリ・トレーニングと群分布的ロバストな最適化を組み合わせた理論的基盤を持つフレームワークである。
我々のアプローチは、領域適応とミニマックスフェアネス理論に基づいており、収束境界の保証とフェアネスを提供する。
実験により, 人口集団間の公平性を保ちながら, 診断性能が良好であることが確認された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:01:51 GMT)
On the Military Applications of Large Language Models [8.9] 我々は、軍事利用の事例や応用、その実施について検討する。
我々はGPTベースの言語モデルを作成し、軍事的応用の可能性について独自の知識を明らかにし、その情報を批判的に評価する。
言語モデルの要約と生成特性は、多くのアプリケーションを直接的に促進し、他の特徴が特定の用途を見出す可能性があると結論付けている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:31:52 GMT)
Do LLMs Really Struggle at NL-FOL Translation? Revealing their Strengths via a Novel Benchmarking Strategy [8.9] 第一次論理(英: First-Order Logic、FOL)は、自然言語(NL)で表される概念を表現するための強力な形式主義である。
NLをFOL(NL-FOL翻訳)に変換することは、人間と機械の両方にとって長年にわたる課題である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:11:41 GMT)
From Fact to Judgment: Investigating the Impact of Task Framing on LLM Conviction in Dialogue Systems [8.9] 本研究では,タスクが直接の事実クエリから会話的判断タスクにリフレームされると,LCMの信念がどう変化するかを検討する。
両条件に単純な反論(前の答えは正しくない)の形で圧力を適用する。
以上の結果から, GPT-4o-miniのようなモデルでは, 社会的フレーミング作業下でのシコファン性傾向が明らかにされているが, Llama-8B-Instructのようなモデルでは過度に批判的になる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:55:28 GMT)
Refine and Align: Confidence Calibration through Multi-Agent Interaction in VQA [8.9] 本稿では,視覚質問応答のための議論ベースのマルチエージェントフレームワークAlignVQAを紹介する。
よりキャリブレーションされた特殊エージェントは、より整合性のある信頼性を生み出す。
また、特殊エージェントを微調整するために、アライメントカルと呼ばれる、識別可能なキャリブレーション対応損失関数も導入した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:08:21 GMT)
Identifying Imaging Follow-Up in Radiology Reports: A Comparative Analysis of Traditional ML and LLM Approaches [8.9] 586例から6,393例の注釈付きコーパスを報告した。
我々は、ロジスティック回帰(LR)、サポートベクタマシン(SVM)、Longformer、そして完全に微調整されたLlama3-8B-インストラクトを含む従来の機械学習分類器を比較した。
GPT-4oとオープンソースのGPT-OSS-20Bを2つの構成で評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:55:44 GMT)
Dynamic Temperature Scheduler for Knowledge Distillation [8.9] 知識蒸留(KD)は、大規模で訓練済みの教師モデルを用いて、より小さな学生モデルを訓練する。
伝統的な方法は訓練を通して一定の温度を使い、それは準最適である。
本研究では,教師と学生のクロスエントロピー損失ギャップに基づいて動的に温度を調整する動的温度スケジューリングシステム(DTS)を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:03:22 GMT)
ConstrainedSQL: Training LLMs for Text2SQL via Constrained Reinforcement Learning [8.8] 不適切な報酬は報酬のハッキングにつながる可能性がある。モデルが報酬構造内の抜け穴を利用して、タスクを真に解決することなく高いスコアを達成する。
この研究は、自然で解釈可能な報酬と制約信号を含むText2の制約付きRLフレームワークについて検討し、トレーニング中にそれらのトレードオフを動的にバランスさせる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:37 GMT)
Intrinsic Dimensionality as a Model-Free Measure of Class Imbalance [8.8] 分類タスクの不均衡は、クラス間の例の濃度によって一般的に定量化される。
これは、冗長な例の存在と、授業の学習困難における固有の相違を無視している。
本稿では,データ固有次元性(ID)を計算容易かつモデルフリーな不均衡尺度として用いることを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:19 GMT)
Preference Elicitation for Step-Wise Explanations in Logic Puzzles [8.7] 我々は,非支配制約と高信頼な境界ベースの多様化を統合する新しいクエリ生成戦略であるMACHOPを紹介する。
本研究では,スドクパズルと論理グリッドパズルの解法を人工ユーザを用いて評価し,実ユーザによる評価を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:24 GMT)
PRISM: Diversifying Dataset Distillation by Decoupling Architectural Priors [8.7] PRISM (PRIors from various Source Models) は、合成中にアーキテクチャの先行を混乱させるフレームワークである。
ImageNet-1Kでは、PRISMは一貫して、再現的にシングルテラーメソッドより優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:41 GMT)
MINDS: A Cross-cultural Dialogue Corpus for Social Norm Classification and Adherence Detection [8.6] 我々は,Norm-RAGを提案する。Norm-RAGは,マルチターン対話におけるNorm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,Norm-RAG,N orm-RAG,Nor
実験により,ノルムRAGは標準検出と一般化を改善し,文化的適応性と社会的知的対話システムの性能向上を実証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:42 GMT)
GraphIF: Enhancing Multi-Turn Instruction Following for Large Language Models with Relation Graph Prompt [8.5] 対話を通した命令に従うインテリジェントな対話システムを構築するためには,マルチターンインストラクションが不可欠である。
既存のマルチターン命令の強化アプローチは、主に大規模なマルチターン対話データセットの収集や生成に依存している。
マルチターン対話を有向関係グラフとしてモデル化し,グラフプロンプトを活用して命令追従機能を向上させるための,プラグイン・アンド・プレイフレームワークであるGraphIFを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:56 GMT)
MultiTab: A Scalable Foundation for Multitask Learning on Tabular Data [8.4] タブラルデータ(Tabular data)は、金融、ヘルスケア、eコマースなど、世界でもっとも豊富なデータタイプである。
本稿では,大規模な表データに特化して設計された最初のマルチタスクトランスフォーマーアーキテクチャであるMultiTab-Netを紹介する。
我々は,MultiTab-Netが既存のMTLアーキテクチャや多分野にわたるシングルタスクトランスよりも高いマルチタスクゲインを達成することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:56 GMT)
Invisible Triggers, Visible Threats! Road-Style Adversarial Creation Attack for Visual 3D Detection in Autonomous Driving [8.4] 自律走行シナリオにおける現実的な敵攻撃について検討する。
本稿では,道路スタイルの多様なポスターを作成するためのAdvRoadを提案する。
我々は,攻撃効果を最大化するために,ロード・スタイル・アドバーサリー・ジェネレーションとシナリオ・アソシエイト・アダプティブ・アダプティブと呼ばれる2段階のアプローチを採用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:25:34 GMT)
FinNuE: Exposing the Risks of Using BERTScore for Numerical Semantic Evaluation in Finance [8.4] FinNuEは、決算報告、規制書類、ソーシャルメディア、ニュース記事などにわたる数値摂動を制御して構築された診断データセットである。
FinNuEを用いて、BERTScoreは意味論的に重要な数値の違いを区別できず、しばしば金銭的に異なるテキストペアに高い類似度スコアを割り当てることを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:52 GMT)
MuSc-V2: Zero-Shot Multimodal Industrial Anomaly Classification and Segmentation with Mutual Scoring of Unlabeled Samples [8.3] ゼロショット異常分類(AC/AS)のためのMutual Scoring framework(MuSc-V2)を提案する。
私たちのフレームワークは、完全なデータセットと、一貫して堅牢なパフォーマンスを持つ小さなサブセットの両方で柔軟に機能します。
新たなフレームワークの助けを借りて、MuSc-V2は大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:39 GMT)
CertMask: Certifiable Defense Against Adversarial Patches via Theoretically Optimal Mask Coverage [8.3] アドリアパッチ攻撃は、画像に局所的な摂動を注入し、ディープビジョンモデルを誤解させる。
我々は、パッチ効果を中和するために、証明可能な十分なバイナリマスクセットを構築する堅牢なディフェンスであるCertMaskを提案する。
ImageNet、ImageNette、CIFAR-10の実験では、CertMaskはPatchCleanserよりも最大で13.4%精度が向上している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:07 GMT)
Evaluating Latent Generative Paradigms for High-Fidelity 3D Shape Completion from a Single Depth Image [8.3] 拡散確率モデルと自己回帰因果変換の2つの有望な生成モデルを比較した。
連続潜伏剤を用いた拡散モデルは判別モデルと自己回帰的アプローチの両方より優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:46:11 GMT)
Opinion: Towards Unified Expressive Policy Optimization for Robust Robot Learning [8.3] 本稿では,大規模言語モデルの事前学習と微調整戦略に触発された統一型生成フレームワークUEPOを提案する。
筆者らの貢献は,(1)複数のモデルを訓練することなく,多種多様なモダリティを効率的に捉えるマルチシーズ対応拡散政策,(2)物理的に意味のある政策多様性を強制する動的分散正規化機構,(3)動的モデル一般化を強化する拡散型データ拡張モジュールの3つである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:31:10 GMT)
Using Certifying Constraint Solvers for Generating Step-wise Explanations [8.3] 本稿では,制約解法によって生成される証明をステップワイズな説明計算の出発点として利用する方法について検討する。
次に、証明をステップワイズな説明シーケンスに変換するいくつかの方法を提案する。
提案手法は,ステップワイドな説明系列の生成を著しく高速化することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:50:58 GMT)
Learning bounds for doubly-robust covariate shift adaptation [8.2] トレーニングドメインとテストドメイン間の分散シフトは、マシンラーニングにとって重要な課題である。
Doubly-robust (DR) 推定器は、密度比推定とパイロット回帰モデルを組み合わせる。
本稿では,DR推定器の非漸近学習境界を初めて確立する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:46:23 GMT)
ProbLog4Fairness: A Neurosymbolic Approach to Modeling and Mitigating Bias [8.1] 本稿では確率論理型プログラミング言語ProbLogのプログラムとしてバイアス仮定を定式化する。
ProbLogのニューロシンボリック拡張は、ニューラルネットワークのトレーニングプロセスにおいて、これらの仮定を簡単に統合できるようにする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:44 GMT)
MMA-Sim: Bit-Accurate Reference Model of Tensor Cores and Matrix Cores [8.0] MMAは、ディープニューラルネットワークの安定性と計算を損なうことができる数値的不整合と不整合をもたらす可能性がある。
本稿では,MMAの詳細な演算挙動を明らかにする最初のビット精度参照モデルであるMMA-Simを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:45:15 GMT)
Constrained Best Arm Identification with Tests for Feasibility [8.0] ベストアーム識別(BAI)は、各アームからサンプルを集めることで、一組のK$アームの中で最高のパフォーマンスのアームを識別することを目的としている。
本稿では,本アルゴリズムが問題の難易度に自然に適応できることを示すアルゴリズムを提案する。
我々のアルゴリズムは、合成と実世界の両方のデータセットにおいて、他の最先端のBAIアルゴリズムよりも優れていることを実証的に示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:41 GMT)
Robot Crash Course: Learning Soft and Stylized Falling [8.0] 我々は,ロボットのエンドポーズを制御しながら,ロボットの身体的損傷を軽減することを目的としている。
私たちの研究は、二足歩行ロボットでさえ制御された柔らかい転倒を実行できることを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:45 GMT)
NumPert: Numerical Perturbations to Probe Language Models for Veracity Prediction [7.9] 本稿では,数値クレームとエビデンスペアの精度予測のための最先端モデルの体系的評価を行う。
その結果、プロプライエタリなシステムの先駆者でさえ、特定の摂動の下で最大62%の精度低下を経験していることが示唆された。
これらの知見は、数値的な事実チェックにおける限界を浮き彫りにして、ロバスト性は現在の言語モデルにとってオープンな課題であり続けていることを示唆している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:57 GMT)
Defending Unauthorized Model Merging via Dual-Stage Weight Protection [7.9] フリーライダーは、微調整されたモデルを認可なしで新しいマルチキャパビリティモデルに組み合わせる。
MergeGuardは、タスクの忠実さを維持しながら、マージ互換性を損なうフレームワークである。
MergeGuardはマージモデルの精度を最大90%削減し、保護モデルの性能損失は1.5%以下であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:16:00 GMT)
Benchmarking Visual LLMs Resilience to Unanswerable Questions on Visually Rich Documents [7.8] 本稿では,VRD-UQA (viSUALLY RICH DOCUMENT UNANSWERABLE QUESTION ANSWERING) について述べる。
我々の研究は、VLLMsの頑健さを、証明不可能な疑問に当てはめている。
VLLMsの限界を明らかにし,VRD-UQAがレジリエントな文書VQAシステムの開発のための評価フレームワークとして機能することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:41:10 GMT)
SOSControl: Enhancing Human Motion Generation through Saliency-Aware Symbolic Orientation and Timing Control [7.8] 本稿では,身体部分の向きと動作タイミングを直感的に指定するためのプログラム可能なシンボルフレームワークであるSalient Orientation (SOS)スクリプトを紹介する。
また,SOSControlフレームワークを提案する。このフレームワークは,スパースSOSスクリプトで利用可能な向きのシンボルを,動作生成時にこれらの制約を満たすことを優先的に扱う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:59:13 GMT)
Mitigating Error Accumulation in Co-Speech Motion Generation via Global Rotation Diffusion and Multi-Level Constraints [7.7] 既存の生成法は、骨格構造に基づいて階層的に定義される局所的な関節回転で動作する。
これは生成中の累積誤差を生じさせ、エンドエフェクターにおける不可解な動きとして現れる。
我々は,グローバルな関節回転の空間で直接動作する拡散ベースのフレームワークであるGlobalDiffを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:35 GMT)
vMFCoOp: Towards Equilibrium on a Unified Hyperspherical Manifold for Prompting Biomedical VLMs [7.7] 共有超球面マニフォールド上のvon Mises-Fisher(vMF)分布を逆推定するフレームワークであるvMFCoOpを提案する。
vMFCoOpは、14の医療データセット、12の医療画像モダリティ、13の解剖学的領域で一貫した改善を示し、精度、一般化、臨床応用性において最先端の手法より優れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:20 GMT)
MosaicDoc: A Large-Scale Bilingual Benchmark for Visually Rich Document Understanding [7.7] MosaicDocは、ビジュアルリッチドキュメント理解(VRDU)の境界を押し上げるために設計された、大規模なバイリンガル(中国語と英語)リソースである。
72Kイメージと600KのQAペアを持つMosaicDocは、この分野における決定的なベンチマークとして機能する。
このベンチマークにおける最先端モデルの評価は、実際の文書の複雑さを扱う際の現在の限界を明らかにしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:47 GMT)
CaReTS: A Multi-Task Framework Unifying Classification and Regression for Time Series Forecasting [7.6] CaReTSは、分類と回帰タスクを組み合わせた新しいマルチタスク学習フレームワークである。
4つの変種(CaReTS1--4)がこのフレームワークの下でインスタンス化され、主流の時間モデリングエンコーダが組み込まれる。
実世界のデータセットの実験では、CaReTSが精度を予測するために最先端(SOTA)アルゴリズムより優れていることが示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:54 GMT)
Out-of-Context Misinformation Detection via Variational Domain-Invariant Learning with Test-Time Training [7.4] Out-of-context misinformation (OOC) は、ニュース報道における低コストな誤報形式である。
我々は,OOC誤情報検出のための領域適応能力を高めるために textbfVDT を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:37 GMT)
SPAN: Benchmarking and Improving Cross-Calendar Temporal Reasoning of Large Language Models [7.4] SPANは、経時的時間的推論のベンチマークである。
SPANには10カレンダの時間的推論方向、2つの推論タイプ、6つのカレンダーに2つの質問形式がある。
本研究では,動的インスタンス生成のためのテンプレート駆動型プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:48 GMT)
Improving LLM's Attachment to External Knowledge In Dialogue Generation Tasks Through Entity Anonymization [7.4] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがって印象的な結果を得たが、外部知識を活用できる能力はまだ探索されていない。
LLMは、しばしば内部知識に依存し、提供された知識グラフから切り離される。
まず,LLM-KATについて述べる。
第2に,LCMの外部知識の活用を促進するため,単純かつ効果的なエンティティ匿名化手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:37:35 GMT)
The Jasmin Compiler Preserves Cryptographic Security [7.3] Jasminは、効率的で正式に認証された暗号実装を開発するためのフレームワークである。
JasminコンパイラはRocq証明器で機能的に正しいことが証明されている。
Rocqの証明では、フロントエンドは暗号化のセキュリティを保っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:26:36 GMT)
LAET: A Layer-wise Adaptive Ensemble Tuning Framework for Pretrained Language Models [7.2] BloombergGPTやFinMAのような大規模言語モデル(LLM)は、さまざまな財務NLPタスクに対して新しいベンチマークを設定している。
我々は,LLMの最も効果的な層を選択的に微調整する新しい戦略であるLayer-wise Adaptive Ensemble Tuning (LAET)を提案する。
提案手法は,財務NLPタスクにおいて,既存のベンチマークや最先端のLCMよりも優れた結果を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:57:46 GMT)
HeatV2X: Scalable Heterogeneous Collaborative Perception via Efficient Alignment and Interaction [7.2] V2X(Van-to-Everything)コラボレーティブ・インセプションは、トランスミッションを通じて、単一車両の限界を超えて知覚を拡大する。
既存のフレームワークは、(1)参加エージェントは本質的にマルチモーダルで異種であり、(2)新しいエージェントに対応するためには、協調フレームワークはスケーラブルでなければならない。
スケーラブルな協調フレームワークであるHeatV2Xを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:33 GMT)
Viper-F1: Fast and Fine-Grained Multimodal Understanding with Cross-Modal State-Space Modulation [7.2] 本稿では,効率的な液体状態空間ダイナミクスに置き換えるハイブリッド状態空間ビジョンランゲージモデルであるViper-F1を紹介する。
その結果,Viper-F1は精度が高く,精度が大幅に向上することがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:21:48 GMT)
Completion of partial structures using Patterson maps with the CrysFormer machine learning model [7.1] 本稿では,タンパク質データバンクのエントリから抽出したタンパク質断片のデータセットについて紹介する。
本手法は結晶構造因子の位相改善と部分構造テンプレートから欠落する領域の完成に有効であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:31 GMT)
Bidirectional Bounded-Suboptimal Heuristic Search with Consistent Heuristics [7.0] 本稿では,解コストの最適値の上限を指定した有界-準最適双方向探索に焦点をあてる。
我々は、最先端の最適双方向探索アルゴリズムであるBAE*を構築し、境界-最適コンテキストに特化して、BAE*のいくつかの変種を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:37 GMT)
Forgetting-MarI: LLM Unlearning via Marginal Information Regularization [7.0] 既存の未学習のメソッドは、特定のデータを“忘れる”場合に必要以上の情報を取り除くことで、モデルのパフォーマンスを劣化させることが多い。
我々は,LLMアンラーニングフレームワークであるForgetting-MarIを紹介した。
限界情報をペナル化することにより、トレーニングされたモデルにおける未学習データセットの残差の影響を明示的に上限付けし、証明不能な検出を可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:48:39 GMT)
PALMS+: Modular Image-Based Floor Plan Localization Leveraging Depth Foundation Model [7.0] PALMSのような視覚ベースの手法は、フロアプランと静止スキャンのみを使用してインフラストラクチャフリーのローカライズを可能にする。
提案するPALMS$+$は,RGB画像からスケールアライメントされた3次元点雲を再構成することにより,これらの課題に対処するモジュール型画像ベースシステムである。
PalmS$+$は、直接またはシーケンシャルなローカライゼーションに使用できる位置と向きの後方を出力する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:12 GMT)
Position: On the Methodological Pitfalls of Evaluating Base LLMs for Reasoning [6.9] 既存の研究は、大きな言語モデル(LLM)の制約、人間のようなバイアス、基礎となるプロセスを明らかにするための推論能力について調査している。
基礎となるLCMの推論能力の評価は,既存の研究で見過ごされている方法論的懸念を提起する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:08 GMT)
Temporal Zoom Networks: Distance Regression and Continuous Depth for Efficient Action Localization [6.9] 時間的行動の局所化は、正確な境界検出と計算効率の両方を必要とする。
我々は、境界距離回帰(BDR)と適応時間制限(ATR)という2つの補完的なイノベーションを通じてこの問題に対処する。
THUMOS14では、ActionFormer++ (55.7% mAP@0.7 at 235G) よりも36%少ないFLOPを用いて、151GのFLOPで56.5% mAP@0.7を達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:42 GMT)
LLM-Guided Probabilistic Fusion for Label-Efficient Document Layout Analysis [6.9] 半教師あり学習の進歩にもかかわらず、文書レイアウトの理解はデータ集約的なままである。
本稿では、視覚的予測を構造的事前に融合させることにより、半教師付き検出を強化するフレームワークを提案する。
提案手法はモデルスケール間で一貫した利得を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:32:34 GMT)
AI-Integrated Decision Support System for Real-Time Market Growth Forecasting and Multi-Source Content Diffusion Analytics [6.9] 本研究では、ソーシャルメディアストリーム、マーケティング支出記録、消費者エンゲージメントログ、感情動態を統合したAI駆動意思決定支援システム(DSS)を提案する。
提案したDSSは、AIGCによるコンテンツの普及と市場成長パターンに対する解釈可能なリアルタイム洞察を提供することで、マーケティングの意思決定を強化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:21:40 GMT)
Predicate-Argument Structure Divergences in Chinese and English Parallel Sentences and their Impact on Language Transfer [6.8] 言語間自然言語処理は、低リソース環境で実用的なソリューションを提供する。
言語の違いは、特に類型的には遠い言語の間で、言語移動を妨げる。
本稿では、中国語と英語の同時文における述語句構造の分析について述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:08 GMT)
Robustness of LLM-enabled vehicle trajectory prediction under data security threats [6.8] 大型言語モデル(LLM)は、周囲の車両からデータを収集・変換することで、車両軌跡や車線変更意図を正確に予測することができる。
本研究では,LLM対応車両軌道予測の系統的脆弱性解析を行うことにより,このギャップを解消する。
高Dデータセットの実験では、小さな、物理的に妥当な摂動でさえ、モデル出力を著しく破壊する可能性があることが明らかになった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:26:51 GMT)
Human-Corrected Labels Learning: Enhancing Labels Quality via Human Correction of VLMs Discrepancies [6.6] 本稿では,VLM生成したノイズラベルを効率よく補正するHCL(Human-Corrected Labels)を提案する。
HCLは、VLMの相違のあるインスタンスに対してのみ人間の修正をデプロイし、高品質なアノテーションと労働コストの削減を実現している。
提案手法は, 分類性能が優れ, 騒音のラベル付けに頑健であり, 現実の弱い監督シナリオにおけるHCLの有効性を検証している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:52:29 GMT)
Quantum Simulation of Non-unitary Dynamics via Contour-based Matrix Decomposition [6.5] 非単体力学のスケーラブルなシミュレーションフレームワークである,輪郭型行列分解(CBMD)を導入する。
CBMDはコーシーの剰余定理を行列値関数に一般化し、非エルミート函数を直接ヘルミート函数の線型結合に分解する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:24 GMT)
Evaluating Large Language Models on Rare Disease Diagnosis: A Case Study using House M.D [6.5] ハウスM.D.から抽出した176の症状-診断ペアの新しいデータセットについて紹介する。
本研究では,4つの言語モデル(LLM)を,物語に基づく診断推論タスクで評価する。
結果は16.48%から38.64%の精度で大幅な性能変化を示し、新しいモデル世代は2.3倍の改善を示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:54:58 GMT)
Towards Robust Multimodal Learning in the Open World [6.4] 現在のニューラルネットワークベースのモデルは、固有の予測不能を特徴とするオープンワールド環境では不足することが多い。
人間は自然にこのようなダイナミックであいまいなシナリオに適応するが、人工知能システムは頑丈さの限界を示す。
本研究では,オープンワールド環境におけるマルチモーダル学習の堅牢性に関する基礎的課題について検討し,制御された実験性能と実践的展開要件のギャップを埋めることを目的とした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:17 GMT)
Evaluating Prompting Strategies with MedGemma for Medical Order Extraction [6.3] 本稿では、我々のチームがMEDIQA-OE-2025共有タスクを提出したことを詳述する。
構造化順序抽出のための新しいドメイン固有オープンソース言語モデルであるMedGemmaの性能について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:57 GMT)
Lost in Serialization: Invariance and Generalization of LLM Graph Reasoners [6.3] 本研究は,微調整が認識不能なタスクのエンコーディングや一般化に与える影響について検討する。
微調整によりノードの遅延に対する感度は低下するが、構造やフォーマットのバリエーションに増大する可能性がある。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:41 GMT)
Scalable Synthesis of distributed LLM workloads through Symbolic Tensor Graphs [6.2] grAph GEnerator(STAGE)は、高忠実度実行トレースを合成して、ワークロードの実行を正確にモデル化するフレームワークである。
STAGEは並列化戦略の包括的なセットをサポートしており、LLMアーキテクチャやシステム構成の幅広い範囲を探索することができる。
Symbolic STAGEは、分散機械学習システムにおけるさらなる研究を促進するために、一般公開される予定である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:45 GMT)
STAGE: A Symbolic Tensor grAph GEnerator for distributed AI system co-design [6.2] Symbolic(STAGE)は、高忠実度実行トレースを合成して、ワークロード実行を正確にモデル化するフレームワークである。
包括的な並列化戦略をサポートしており、LLMアーキテクチャやシステム構成の幅広い範囲を探索することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:58:00 GMT)
Multivariate Gaussian Representation Learning for Medical Action Evaluation [6.1] CPRE-6kは,臨床ラベルが22の6,372人の専門家によるビデオを含むマルチタイムビュー,マルチラベル医療行動ベンチマークである。
時間的時間的学習を通して医療行動分析を促進するための枠組みである「Act」を提示する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:38 GMT)
Root Cause Analysis for Microservice Systems via Cascaded Conditional Learning with Hypergraphs [6.1] マイクロサービスシステムにおけるルート原因分析では、ルート原因ローカライゼーション(RCL)と障害タイプ識別(FTI)という、2つのコアタスクが一般的である。
これらの手法は主に、共有情報を利用してトレーニング時間を短縮するために、RCLとFTIのジョイントラーニングパラダイムを採用する。
CCLHは,ケースド・コンディショナル・ラーニングに基づく診断タスクを編成する新しい根本原因分析フレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:20:02 GMT)
Sparse Methods for Vector Embeddings of TPC Data [6.0] タイムプロジェクションチャンバー(TPC)は、荷電粒子の軌道を電離媒体で再構成する汎用検出器である。
TPCデータ上での表現学習のための疎畳み込みネットワークについて検討する。
トレーニングされていないスパースResNetモデルでさえ、AT-TPCデータの有用な埋め込みを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:25:54 GMT)
A Robust Task-Level Control Architecture for Learned Dynamical Systems [6.0] 動的システム(DS)に基づく実演学習(LfD)は,ロボットシステムの動作空間における動作計画を生成する強力なツールである。
タスクレベルのロバスト制御アーキテクチャ L1-augmented Dynamical Systems (L1-DS) を提案する。
我々のフレームワークは、名目安定化コントローラとL1適応コントローラを備えたDSベースのLfDモデルを拡張します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:00 GMT)
Cooperative Local Differential Privacy: Securing Time Series Data in Distributed Environments [6.0] 本稿では,複数のユーザに対してノイズベクトルを分散させることにより,プライバシを高める,協調的局所微分プライバシー(CLDP)機構を提案する。
提案手法では、ノイズが協調的に生成され、全てのユーザのデータが集約されると、個々のプライバシーを保護しながら、全体の統計特性を保存することをキャンセルする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:48 GMT)
Estimating Total Effects in Bipartite Experiments with Spillovers and Partial Eligibility [5.9] 我々は、全てのユニットが相互作用を続けながら、処理側ユニットのサブセットのみを割り当てる2部システムにおけるランダム化実験について研究する。
適応性に制約のあるバイパートイト実験を形式化し,完全な展開に対応する推定値を定義する。
我々は、露出マッピング、一般化された確率スコア、フレキシブル機械学習を組み合わせた干渉対応アンサンブル推定器を開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:55:51 GMT)
Is nasty noise actually harder than malicious noise? [5.9] 本稿では,雑音の存在下での学習において,計算効率の高いアルゴリズムの相対的能力と限界について考察する。
分布非依存学習では、2つのノイズモデルの間に強い等価性を示す。
これらのアルゴリズムでは、悪質なノイズと悪質なノイズは、ノイズ率の最大2倍に等しいことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:31 GMT)
GRIN Transfer: A production-ready tool for libraries to retrieve digital copies from Google Books [5.8] 本報告ではGRIN Transferの初期リリースを紹介する。
GRIN Transferにより、パートナーライブラリは、GRINからGoogle Booksコレクションを効率的に取り出すことができる。
この記事では、Institutional Books 1.0パイプラインのアップデート版も紹介します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:16:04 GMT)
On the Detectability of Active Gradient Inversion Attacks in Federated Learning [5.8] フェデレートラーニング(FL)は、クライアントのデータを現場に保持しながら、機械学習(ML)モデルを協調的にトレーニングすることができる。
しかし、以前の研究では、FLトレーニング中に交換された勾配が、グラディエント・インバージョン・アタック(GIA)に対して脆弱であることが示されている。
これらの攻撃は、クライアントのローカルデータの再構築を可能にし、FLのプライバシーの約束を破る。
近年、新たな活発なGIAが出現し、これまでのアプローチよりもずっとステルス性が高いと主張している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:53 GMT)
Toward Generalized Detection of Synthetic Media: Limitations, Challenges, and the Path to Multimodal Solutions [5.8] 本研究は、AI生成メディア検出に関する24の最近の研究をレビューする。
マルチモーダルディープラーニングモデルは、より堅牢で一般化された検出を提供する可能性がある、と結論付けている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:44:44 GMT)
ARCTraj: A Dataset and Benchmark of Human Reasoning Trajectories for Abstract Problem Solving [5.8] 本稿では、複雑な視覚的タスクを通して人間の推論をモデル化するためのデータセットと方法論のフレームワークであるARCTrajを提案する。
ARCTrajは、人間が入力を出力に反復的に変換する方法をキャプチャする、時間的に順序付けられたオブジェクトレベルのアクションを記録することでギャップに対処する。
さらに、データ収集、アクション抽象化、マルコフ決定プロセス(MDP)の定式化、下流学習を含む統一推論パイプラインを定義する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:52:53 GMT)
6D Strawberry Pose Estimation: Real-time and Edge AI Solutions Using Purely Synthetic Training Data [5.8] 本稿では, レンダリング用プロシージャパイプラインから生成した純合成データを用いて, イチゴの6次元ポーズ推定に着目する。
速度と精度のバランスとエッジ推論のサポートで知られているYOLOXのバックボーンを利用したシングルショットアプローチであるYOLOX-6D-Poseアルゴリズムを採用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:51:24 GMT)
Predict-then-Optimize for Seaport Power-Logistics Scheduling: Generalization across Varying Tasks Stream [5.8] 現代の海港におけるパワーロジスティクスのスケジューリングは、予測に最適化されたパイプラインに従うのが一般的である。
予測モデルのトレーニングを下流の意思決定結果と整合させる決定中心の学習法が提案されている。
このギャップを、オンラインのスケジューリングタスクのストリームに適応する意思決定中心の継続的学習フレームワークで解決する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:11 GMT)
Augmenting The Weather: A Hybrid Counterfactual-SMOTE Algorithm for Improving Crop Growth Prediction When Climate Changes [5.7] 本稿では,気候変動に関する予測的問題を,クラス不均衡の問題による一因として扱う新しいデータ拡張手法を提案する。
CFA-SMOTEは、予測性能を改善するためにデータセットを増強する、異常な気候事象を表す合成データポイントを生成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:35:21 GMT)
Cycle Basis Algorithms for Reducing Maximum Edge Participation [5.6] 最大エッジ参加率の低いグラフのサイクルベース構築の問題について検討する。
この量は格子手術のオーバーヘッドに直接影響するため、量子フォールトトレランスにおいて重要な役割を果たす。
我々は、エッジ参加を最小限に抑えるために、頂点とエッジを適応的に選択する負荷認識のファミリーを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:59:52 GMT)
Discovering Meaningful Units with Visually Grounded Semantics from Image Captions [5.6] 視覚言語モデルにとって、現実世界をより深く理解するためには、きめ細かい知識が不可欠である。
トークンをグループ化することで、視覚言語モデルは、視覚と言語をより細かく理解できることが示される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:56:18 GMT)
Quantifying and Improving Adaptivity in Conformal Prediction through Input Transformations [5.6] コンフォーマル予測は、単一点予測の代わりにラベルの集合を構成する。
具体的困難への適応性は重要な特性である。
本稿では,推定困難度でサンプルをグループ化し,グループ条件の共形予測を適用した適応予測アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:42:42 GMT)
Computation-aware Energy-harvesting Federated Learning: Cyclic Scheduling with Selective Participation [5.6] 本稿では,ユーザのバッテリレベルに基づいたサイクリッククライアント参加を用いた,バッテリを意識したEHFLフレームワークであるFedBacysを提案する。
クライアントをクラスタ化し、それらを逐次スケジューリングすることで、FedBacysは冗長な計算を最小化し、システム全体のエネルギー使用量を削減し、学習安定性を向上させる。
また、FedBacys-Oddというよりエネルギー効率のよい変種を導入し、クライアントを選択的に参加させ、パフォーマンスを損なうことなくエネルギーコストをさらに削減します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:46:48 GMT)
T2IBias: Uncovering Societal Bias Encoded in the Latent Space of Text-to-Image Generative Models [5.6] テキスト・ツー・イメージ(T2I)生成モデルは、AIによる実世界のアプリケーションや価値創造に主に使用されている。
我々は、最先端T2Iモデルの事前訓練された潜在空間において、社会的バイアスが体系的に符号化されているかどうかを検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:31:13 GMT)
MAUGIF: Mechanism-Aware Unsupervised General Image Fusion via Dual Cross-Image Autoencoders [5.6] 本稿では,2つのクロスイメージオートエンコーダをベースとしたMAUGIF(Multior-Aware Unsupervised General Image fusion)法を提案する。
本稿では, 異なる核融合タスクのメカニズムに応じて, 加法的および乗法的融合の分類を導入する。
デコーダのアーキテクチャは、その融合機構によって異なり、性能と解釈性の両方が向上する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:32 GMT)
Evaluating Software Process Models for Multi-Agent Class-Level Code Generation [5.5] 大規模言語モデル(LLM)は、ソフトウェア開発の自動化にますます使われています。
本研究では,クラスレベルのコード生成のためのプロセス構造とロール形状のマルチエージェント特殊化について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:06 GMT)
Exposing Weak Links in Multi-Agent Systems under Adversarial Prompting [5.5] 本稿では,マルチエージェントシステムのセキュリティ評価を行うフレームワークであるSafeAgentsを提案する。
広く採用されている5つのマルチエージェントアーキテクチャについて検討する。
この結果から,一般的なデザインパターンには重大な脆弱性があることが判明した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:22:49 GMT)
SafeMIL: Learning Offline Safe Imitation Policy from Non-Preferred Trajectories [5.5] オフライン型安全な模倣学習(IL)の課題について検討する。
本稿では,状態-作用対が危険であるかどうかを予測するパラメータ化コストを学習するための新しい手法であるSafeMILを提案する。
学習したコストは、非推奨の行動を避けるために使用され、結果として安全を優先する方針が導かれる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:35:42 GMT)
Knowledge vs. Experience: Asymptotic Limits of Impatience in Edge Tenants [5.5] 2つの情報フィードが2つのM/M/1システムにおけるリネギングとジョッキーリングに与える影響について検討する。
不平等なサービス率と全時間忍耐のために、総待ち時間は直線的に増加し、放棄は避けられないことを示す。
穏やかなサブ線形誤差条件下では、両方の情報モデルが同じ限界(ロバスト性)を生じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:59:19 GMT)
LLM Inference Beyond a Single Node: From Bottlenecks to Mitigations with Fast All-Reduce Communication [5.5] 本稿では,GPU ベースのスーパーコンピュータ上での大規模言語モデル (LLM) を用いたマルチノード分散推論の性能評価を行った。
制御実験用に設計された研究指向のプロトタイプエンジンであるYALISとともに,いくつかの最先端推論エンジンを用いて実験を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:08 GMT)
Positional Bias in Multimodal Embedding Models: Do They Favor the Beginning, the Middle, or the End? [5.4] マルチモーダル表現モデルにおける位置バイアスについて,特に画像テキスト検索の文脈で検討する。
実験により,多モーダルモデルでは位置偏差がよく見られるが,モーダル性によって異なることが示されている。
このバイアスは、位置符号化方式、訓練損失、文脈の重要性、マルチモーダルトレーニングにおける画像とテキストのペアの使用の性質といった要素の組み合わせによって生じるか、増幅される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:15:46 GMT)
Inferring response times of perceptual decisions with Poisson variational autoencoders [5.4] 知覚的意思決定のイメージ計算可能なモデルを提案する。
我々はポアソン変分オートエンコーダを用いて視覚刺激の教師なし表現を学習する。
我々は知覚的意思決定の鍵となる経験的シグネチャを再現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:58:04 GMT)
Direct Raman observation of the quantum metric in a quantum magnet [5.4] 我々は、量子磁石K2Co(SeO3)2上で円偏光ラマン分光を行い、そこでは磁場の陽極分裂と中心周波数シフトが1つの曲線に崩壊する。
結果は、量子計量の直接プローブとしてラマン分光を確立し、単一の測定で量子幾何学の操作的な分解を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:14 GMT)
SynthTools: A Framework for Scaling Synthetic Tools for Agent Development [5.4] 合成ツールエコシステムを生成するためのフレキシブルでスケーラブルなフレームワークであるSynthToolsを紹介します。
私たちのフレームワークは3つのコアコンポーネントで構成されています。多種多様なツールの自動作成のためのツール生成、現実的なツールの振る舞いをエミュレートするツールシミュレーション、ツールシミュレーションの正確性と一貫性を保証するツール監査です。
スケーラブルで多様性があり、信頼性の高いツールエコシステムを実現することで、SynthToolsは大規模なトレーニングへの実践的なパスと、ツール使用エージェントの安定した評価を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:22 GMT)
End to End AI System for Surgical Gesture Sequence Recognition and Clinical Outcome Prediction [5.4] 組織分離ビデオをジェスチャーシーケンスに変換するエンドツーエンドシステムであるFrame-to-Outcome (F2O)を提案する。
F2Oは、ロボットによる根治的前立腺切除術の神経分離段階において、連続した短い(2秒)ジェスチャーを確実に検出する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:02:46 GMT)
LLM-YOLOMS: Large Language Model-based Semantic Interpretation and Fault Diagnosis for Wind Turbine Components [5.4] 本研究では, YOLOMSと大規模言語モデル(LLM)を組み合わせて, インテリジェントな故障解析と診断を行う統合フレームワークを提案する。
特に, YOLOMSでは, マルチスケール検出とスライディング・ウインドウ・クリーピングを採用し, 断層特徴抽出の高度化を実現している。
このモジュールは、YOLOMS検出結果を定性的属性と量的属性の両方に富んだ構造化テキスト表現に変換する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:01 GMT)
Privacy-Preserving Explainable AIoT Application via SHAP Entropy Regularization [5.4] 説明可能なAIoTアプリケーションにおけるプライバシー漏洩を軽減するため,SHAPエントロピー規則化に基づくプライバシ保護手法を提案する。
我々は、モデル説明出力を戦略的に活用して機密情報を推測するSHAPベースのプライバシ攻撃群を開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:07 GMT)
Feature Quality and Adaptability of Medical Foundation Models: A Comparative Evaluation for Radiographic Classification and Segmentation [5.3] 胸部X線解析のための8つの医用および一般領域FMから視線エンコーダを評価する。
リニアプローブと微調整による分類(気胸,心内膜)とセグメンテーション(気胸,心境界)のベンチマークを行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:27 GMT)
Correcting Mean Bias in Text Embeddings: A Refined Renormalization with Training-Free Improvements on MMTEB [5.3] そこで我々は,Renormalizationと呼ばれる,プラグアンドプレイでトレーニング不要で軽量なソリューションを提案する。
再正規化は既存のモデルの性能を継続的に統計的に向上させることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:51:59 GMT)
Revisiting Disaggregated Large Language Model Serving for Performance and Energy Implications [5.3] 我々は、異なるKV転送媒体と最適化戦略の下で、プリフィル・デコードデアグリゲーションを再評価する。
以上の結果から,プリフィル・デコード・デアグリゲーションによる性能向上は保証されず,要求負荷やKV転送媒体に依存することが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:42:27 GMT)
Superdiffusive transport protected by topology and symmetry in all dimensions [5.2] 量子モデルにおいて超拡散を誘導する新しいメカニズム、"nodal mechanism"が提案されている。
本稿では, 凝縮物質系で実現可能な超拡散生成モデルについて提案する。
本フレームワークは, 線形温度比抵抗の新たなメカニズムとして, 実験的に検証可能なシグネチャの集合を予測する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:54 GMT)
Towards a Human-in-the-Loop Framework for Reliable Patch Evaluation Using an LLM-as-a-Judge [5.2] 提案手法は,LLMに基づくパッチの妥当性判定にヒト・イン・ザ・ループ方式を導入する。
共有ルーブリックを用いた場合,人間の判断がより整合性が高いという観察から着想を得て,まず LLM を用いてバグごとのルーブリックを生成する。
本稿では,Googleのサニタイザツールが発見した問題に対して,バイナリ検証ラベルをパッチに割り当てる手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:22:04 GMT)
Prompt Triage: Structured Optimization Enhances Vision-Language Model Performance on Medical Imaging Benchmarks [5.2] ヴィジュアル言語基礎モデル(VLM)は様々なイメージングタスクを約束するが、しばしば医療ベンチマークでは性能が劣る。
我々は、医療ビジョン言語システムにおける構造化された自動プロンプト最適化のための宣言的自己改善Pythonフレームワークに適応する。
我々は,放射線学,消化器学,皮膚学にまたがる5つの医療画像処理のためのプロンプトパイプラインを実装し,4つのプロンプト最適化手法を用いて10個のオープンソースVLMを評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:01:08 GMT)
Hardware-Efficient Bosonic Module for Entangling Superconducting Quantum Processors via Optical Networks [5.2] マイクロ波-光間(M2O)トランスデューサは、周波数ミスマッチとクビットデコヒーレンスに起因する問題を引き起こす。
長寿命の3Dキャビティを持つブリルアンM2OトランスデューサにSNAILを用いたパラメトリック結合を用いたモジュラーアーキテクチャを提案する。
我々のキャビティベースのアプローチはトランスモンスキームよりも優れており、分散超伝導量子コンピューティングの実践的な経路を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:34 GMT)
Aligning Machiavellian Agents: Behavior Steering via Test-Time Policy Shaping [5.2] モデル誘導型ポリシー整形に基づくテストタイムアライメント手法を提案する。
我々は134のテキストベースのゲーム環境からなるMACHIAVELLIベンチマークを用いて,本手法の評価を行った。
我々の結果は、テストタイムポリシーの整形が非倫理的行動を緩和するための効果的でスケーラブルなソリューションを提供することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:42:18 GMT)
When to Stop Federated Learning: Zero-Shot Generation of Synthetic Validation Data with Generative AI for Early Stopping [5.1] フェデレートラーニング(FL)は、分散デバイス間の協調モデルトレーニングを可能にする。
モデル性能の監視に生成AIを活用するゼロショット合成検証フレームワークを導入する。
本手法では,最適ラウンド付近でのトレーニングを適応的に停止し,計算資源の保存を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:07:32 GMT)
D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel Spaces [5.0] D-GAP (Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel space) を提案する。
D-GAPはタスク勾配から周波数空間の感度マップを計算する。
4つの実世界のデータセットと3つのドメイン適応ベンチマークの実験は、D-GAPがジェネリックとデータセット固有の拡張の両方を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:22:10 GMT)
Temporal Properties of Conditional Independence in Dynamic Bayesian Networks [5.0] 本研究では,時間論理仕様に対する条件独立命題の検証について検討する。
CI命題が最終的に成立するかどうかを決めることは、線形反復列に対するスコーレム問題と同じくらい難しいことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:23 GMT)
Hi-DREAM: Brain Inspired Hierarchical Diffusion for fMRI Reconstruction via ROI Encoder and visuAl Mapping [5.0] Hi-DREAMは、皮質組織を明確にする条件拡散フレームワークである。
軽量で深度にマッチしたControlNetは、デノイング中にスケール固有のヒントを注入する。
実験により、Hi-DREAMは高レベルのセマンティックメトリクスで最先端のパフォーマンスを得ることができた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:05:44 GMT)
Learning the relative composition of EEG signals using pairwise relative shift pretraining [5.0] 自己教師付き学習(SSL)は、ラベルのないデータから脳波(EEG)表現を学習するための有望なアプローチを提供する。
PAirwise Relative Shift または PARS pretraining は、ランダムにサンプリングされたEEGウィンドウペア間の相対時間シフトを予測する新しいプリテキストタスクである。
PARS-pretrained transformer はラベル効率および転送学習設定において既存の事前学習戦略を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:30:37 GMT)
In-vacuum surface flashover of SiN, AlN, and etched SiO2 thin films at micrometre scales [4.9] SiO$, SiN, AlN薄膜の表面フラッシュオーバー電圧閾値をマイクロスケール長で調べた。
SiO$$未処理試料とフッ化水素またはトランスエンアルパドエッチ639でエッチングした試料との間には,有意な差は認められなかった。
SiNおよびAlN試料は、電極間隔の差が大きくなると、表面フラッシュオーバー電圧が5ドルで45%増加し、SiO$$の試料よりも大幅に向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:18 GMT)
Randomized batch-sampling Kaczmarz methods for general linear systems [4.9] ランダム化されたバッチサンプリングを行うKaczmarzフレームワークを,循環ブロック法と同じくらい低コストで採用する。
我々は収束保証を確立するための一般的な解析手法を開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:14:34 GMT)
SAMIRO: Spatial Attention Mutual Information Regularization with a Pre-trained Model as Oracle for Lane Detection [4.9] 実世界の環境課題は、効果的な車線検出に重大な障害をもたらす。
我々は,SAMIROと呼ばれるOracleの事前学習モデルを用いた空間的注意相互情報正規化を提案する。
SAMIROは、事前訓練されたモデルから知識を伝達し、ドメインに依存しない空間情報を保存することにより、車線検出性能を向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:20 GMT)
Revisiting Evaluation of Deep Neural Networks for Pedestrian Detection [4.9] 本研究では,歩行者検出のための8つの異なるエラーカテゴリを提案し,これらのエラーカテゴリに沿った性能比較のための新しい指標を提案する。
新しいメトリクスを使用して、APDの単純化されたバージョンで様々なバックボーンを比較し、特に安全性クリティカルなパフォーマンスにおいてモデルの比較をよりきめ細やかで堅牢な方法を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:50 GMT)
GraphToxin: Reconstructing Full Unlearned Graphs from Graph Unlearning [4.8] グラフアンラーニングに対する最初のグラフ再構成攻撃であるGraphToxinを提案する。
GraphToxinは、グラフアンラーニングによって期待される規制の保証を回避できることを実証する。
我々の研究は、この攻撃に対してより効果的で堅牢な防衛戦略を開発するための緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:52:00 GMT)
Architecting software monitors for control-flow anomaly detection through large language models and conformance checking [4.8] 本稿では,制御フロー異常検出のためのソフトウェアモニタの開発手法を提案する。
この方法論は、従来のV&Vを維持するために、既存のソフトウェア開発プラクティスに基づいています。
本手法は,欧州鉄道交通管理システム (European Railway Traffic Management System / European Train Control System) のケーススタディシナリオで検証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:26 GMT)
GHOST: Solving the Traveling Salesman Problem on Graphs of Convex Sets [4.8] 凸集合グラフ上に定義された旅行セールスマン問題(TSP)の新たな変種について検討する。
この設定では、エッジコストは固定されていないが、各凸領域から選択された特定の軌跡に依存している。
本稿では,ツアー探索と凸軌道最適化を組み合わせたGCS-TSPを最適に解く階層型フレームワークであるGHOSTを紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:16:37 GMT)
Operator Models for Continuous-Time Offline Reinforcement Learning [4.8] 環境との直接の相互作用は、しばしば安全でないか非現実的であり、歴史的データからオフラインの強化学習を動機付けている。
ハミルトン・ヤコビ・ベルマン方程式に強化学習をリンクし、演算子理論のアルゴリズムを提案することでこの問題に対処する。
具体的には、再生カーネルヒルベルト空間で学習した制御拡散過程の無限小生成という観点から世界モデルを表現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:16 GMT)
SALT-V: Lightweight Authentication for 5G V2X Broadcasting [4.8] 車両間通信(V2X)は重要な認証ジレンマに直面している。
5G New Radio (NR)-V2X の即時認証と計算効率の両面での厳密な要件を満たしていない。
本稿では,新たなハイブリッド認証フレームワークであるSALT-Vを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:32:21 GMT)
Data Heterogeneity and Forgotten Labels in Split Federated Learning [4.8] スプリット・フェデレート・ラーニング(SFL)における破滅的忘れ(CF)現象について検討する。
我々は,マルチヘッドニューラルネットワークにインスパイアされた新しい緩和手法であるHydraを提案し,SFLの設定に適応する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:08 GMT)
Regional Attention-Enhanced Swin Transformer for Clinically Relevant Medical Image Captioning [4.8] 軽量な地域アテンションモジュールを備えたSwin-BARTエンコーダデコーダシステムを提案する。
我々のモデルは、コンパクトで解釈可能なまま、最先端のセマンティック忠実性を達成する。
提案した設計は、正確な、臨床的に言い換えられたキャプションと透明な地域属性をもたらす。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:16:58 GMT)
How does My Model Fail? Automatic Identification and Interpretation of Physical Plausibility Failure Modes with Matryoshka Transcoders [4.7] 生成モデルにおける物理可視性の自動発見と解釈のための新しいフレームワークであるMatryoshka Transcodersを紹介する。
提案手法は,Matryoshka表現学習パラダイムをトランスコーダアーキテクチャに拡張し,階層的スパース特徴学習を複数のレベルで実現している。
得られた視覚パターンを用いて、生成モデルにおける物理的妥当性を評価するためのベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:32:05 GMT)
Histology-informed tiling of whole tissue sections improves the interpretability and predictability of cancer relapse and genetic alterations [4.7] デジタル病理パイプラインは、しばしば組織アーキテクチャを無視したグリッドベースのタイリングに依存している。
意味的セグメンテーションを用いてスライド画像から腺を抽出する組織学的インフォームド・タイリング(HIT)を導入する。
760 WSIsから380,000個の腺を抽出し,MILモデルAUCを10%改良し,上皮間葉移行(EMT)およびMYCに関連する遺伝子のコピー数変動(CNVs)を検出した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:11 GMT)
Enhancing PIBT via Multi-Action Operations [4.7] マルチアクション操作を組み込んだPIBTの拡張版を提案する。
本手法は,オンラインLMAPF-T設定における最先端性能を実現する方法を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:29:37 GMT)
Beyond Verification: Abductive Explanations for Post-AI Assessment of Privacy Leakage [4.6] 帰納的説明を用いてプライバシー漏洩を監査するための形式的枠組みを提案する。
我々のフレームワークは個人レベルのリークとシステムレベルのリークの両方を形式化する。
このアプローチは、人間の理解可能な説明を生み出しながら、厳格なプライバシー保証を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:34 GMT)
Algorithms Trained on Normal Chest X-rays Can Predict Health Insurance Types [4.6] 従来の胸部X線検査から,患者の健康保険タイプ,社会経済的地位の強力な指標を予測することが可能であることを示す。
年齢、人種、性別が制御された場合でも信号は持続し、モデルが単一の人種グループでのみ訓練された場合でも検出可能である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:34:29 GMT)
PressTrack-HMR: Pressure-Based Top-Down Multi-Person Global Human Mesh Recovery [4.6] textbfPressTrack-HMRは、圧力信号のみから多人数のグローバルなメッシュを復元するトップダウンパイプラインである。
本手法は圧力データを用いた多人数HMRにおいて89.2$mm$MPJPEと112.6$mm$WA-MPJPE$_100$で優れる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:27:59 GMT)
Towards an Agentic Workflow for Internet Measurement Research [4.6] 本稿では,エージェントが専門家の推論を模倣した測定を独立して生成できることを実証する最初のシステムであるArachNetを紹介する。
ArachNetは、問題分解からソリューション実装まで、専門家をミラーする4つの専門エージェントを通して運用されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:04 GMT)
MedPath: Multi-Domain Cross-Vocabulary Hierarchical Paths for Biomedical Entity Linking [4.6] 大規模およびマルチドメインのバイオメディカルEntity LinkingデータセットであるMedPathを提示する。
すべてのエンティティは、1)Unified Medical Language System(UMLS)の最新バージョンを使用して正規化され、2)他の62のバイオメディカル語彙にマッピングされた。
MedPathは、バイオメディカルNLPの新しい研究フロンティアを可能にし、セマンティックリッチで解釈可能なELシステムのトレーニングと評価を容易にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:24 GMT)
Data Complexity of Querying Description Logic Knowledge Bases under Cost-Based Semantics [4.5] コストベースセマンティクスに基づく不整合重み付き記述論理(DL)知識ベースを問合せする際のデータ複雑性について検討する。
簡単に言うと、この考え方は、各解釈に違反した公理と主張の重みに基づくコストを割り当てることである。
そこで本研究では,一階書き直しにより,一階書き直しによって,一階書き直しの解や連結クエリの解を計算できることを見出した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:50:37 GMT)
VoxTell: Free-Text Promptable Universal 3D Medical Image Segmentation [4.5] VoxTell (VoxTell) は、テキスト・プロップされたボリューム・メディカル・イメージ・セグメンテーションのためのヴィジュアル言語モデルである。
単一の単語から完全な臨床文章まで、自由形式の記述を3Dマスクにマッピングする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:20:07 GMT)
VISTA: A Vision and Intent-Aware Social Attention Framework for Multi-Agent Trajectory Prediction [4.4] マルチエージェント軌道予測のための目標条件変換器 VISTA を提案する。
高密度のMADRASベンチマークでは、VISTAは最先端の精度を実現し、衝突は大幅に少ない。
これらの結果から, VISTAは社会的に適合し, 目標を意識し, 解釈可能な軌道を生成することがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:38:40 GMT)
PustakAI: Curriculum-Aligned and Interactive Textbooks Using Large Language Models [4.4] LLM(Large Language Models)は、人間のようなコンテンツを理解し、生成する際、顕著な能力を示す。
我々は多くのインドの言語で「本」を意味する"PustakAI"footnotePustak"の枠組みを提示する。
メタプロンプト,少数ショット,CoTスタイルプロンプトなど,さまざまなプロンプト技術を用いてデータセットを評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:47:21 GMT)
PustakAI: Curriculum-Aligned and Interactive Textbooks Using Large Language Models [4.4] LLM(Large Language Models)は、人間のようなコンテンツを理解し、生成する際、顕著な能力を示す。
我々は多くのインドの言語で「本」を意味する"PustakAI"footnotePustak"の枠組みを提示する。
メタプロンプト,少数ショット,CoTスタイルプロンプトなど,さまざまなプロンプト技術を用いてデータセットを評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:09 GMT)
Data Race Detection by Digest-Driven Abstract Interpretation (Extended Version) [4.4] 音の静的解析は、2つの競合するメモリアクセスが同時に発生しないことを確立することで、データ競合がないことを証明することができる。
我々はダイジェストを使用して、競合するアクセスが並列に起こらない状況を把握する。
本稿では,静的解析器Goblintにおけるダイジェスト駆動型データ競合検出の実装について報告し,SV-COMPベンチマークスイートで評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:11:31 GMT)
Convergence and Stability Analysis of Self-Consuming Generative Models with Heterogeneous Human Curation [4.3] 不均一な嗜好を持つ自己消費生成モデルについて検討する。
このモデルは、実データとその前回の合成出力を用いて、ラウンドごとに再訓練される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:00 GMT)
A Novel Data-Dependent Learning Paradigm for Large Hypothesis Classes [4.3] 実験的な推定値の一様収束を真の損失に導くには大きすぎる候補モデルの集合を用いて学習する一般的な課題に対処する。
本稿では,経験的データのより強力な取り込みと,事前の仮定に基づくアルゴリズムによる決定の少ない学習パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:51 GMT)
VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing [4.3] VEDAは分散拡散とアニーリングを組み合わせて3D構造を生成するフレームワークである。
QM9とGEOM-DRUGSデータセットでは、VEDAはフローベースモデルのサンプリング効率と一致する。
VEDAの生成した構造は、緩和エネルギーによって測定されるように、驚くほど安定である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:16 GMT)
Simulating Misinformation Propagation in Social Networks using Large Language Models [4.3] ソーシャルメディア上の誤報は、人間の認知バイアスによって増幅される、驚き、感情、アイデンティティ駆動推論に基づいて成長する。
これらのメカニズムを解明するために、ユーザレベルの偏見、イデオロギー的アライメント、信頼誤報を模倣する合成エージェントとして、大規模言語モデル(LLM)ペルソナをモデル化する。
本セットアップでは,このようなエージェントのネットワークを介し,誤情報がどのように循環するかをシミュレートし,分析するための監査-条件付きノードフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:18 GMT)
BhashaKritika: Building Synthetic Pretraining Data at Scale for Indic Languages [4.3] Indic言語のための合成多言語事前学習データの生成と評価に関する体系的研究を行う。
大規模な合成データセットBhashaKritikaを構築し,10言語で5つの異なる手法を用いて540Bトークンを構成する。
我々は、プロンプト命令と文書のグラウンド化の両方において、言語選択がデータ品質にどのように影響するかを分析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:57 GMT)
PINGS-X: Physics-Informed Normalized Gaussian Splatting with Axes Alignment for Efficient Super-Resolution of 4D Flow MRI [4.2] 4D Flow MRIは狭窄や動脈瘤などの重要な疾患に対して高分解能を必要とする。
近年の研究では,超高分解能MRIデータに物理インフォームドニューラルネットワークを応用しているが,実用性は限られている。
軸整列ガウス表現を用いた高分解能流れ速度をモデル化する新しいフレームワークであるPINGS-Xを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:01:24 GMT)
CTRL-ALT-DECEIT: Sabotage Evaluations for Automated AI R&D [4.2] 機械学習(ML)エンジニアリングを行う際に,AIエージェントがユーザの興味に反して行動する能力について検討する。
現実的なMLタスクのベンチマークであるMLE-Benchを拡張し、バックドアを埋め込んだり、意図的に一般化の失敗を引き起こすようなコードサボタージュタスクを実行します。
我々は、不審なエージェントの挙動を検出するためにLMモニターを使用し、これらのモニターによって検出されることなく、モデル能力をサボタージュやサンドバッグに測定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:28 GMT)
Physics informed Transformer-VAE for biophysical parameter estimation: PROSAIL model inversion in Sentinel-2 imagery [4.2] 本稿では, キーキャノピーパラメータをSentinel-2データから同時推定するために, PROSAIL放射伝達モデルを逆変換する物理インフォームドトランスフォーマー-VAEアーキテクチャを提案する。
我々のモデルはシミュレーションデータにのみ訓練されるが、実際の画像を利用する最先端の手法と同等の性能を達成できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:21:20 GMT)
Physics informed Transformer-VAE for biophysical parameter estimation: PROSAIL model inversion in Sentinel-2 imagery [4.2] 本稿では, キーキャノピーパラメータをSentinel-2データから同時推定するために, PROSAIL放射伝達モデルを逆変換する物理インフォームドトランスフォーマー-VAEアーキテクチャを提案する。
我々のモデルはシミュレーションデータにのみ訓練されるが、実際の画像を利用する最先端の手法と同等の性能を達成できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:35 GMT)
Decomposing Direct and Indirect Biases in Linear Models under Demographic Parity Constraint [4.1] 本稿では,結果のバイアスを直接的(知覚的)成分と間接的(相関的)成分に分解する後処理フレームワークを提案する。
本手法は, 感度特性と非感度特性の両方を含むモデル係数が, 人口統計学的にどう影響するかを解析的に評価する。
私たちのフレームワークは、再トレーニングを必要とせず、モデル監査と緩和のために実行可能な洞察を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:27:54 GMT)
Interaction as Interference: A Quantum-Inspired Aggregation Approach [4.1] 我々は、相互作用を、エンジニアリングされた製品用語として、あるいは柔軟なモデルにおける創発的なパターンとして、量子的に着想を得たビューと捉えています。
最小線形振幅モデルでは、この交差項は因子設計における標準電位-出力相互作用コントラスト(_mathrmINT)と等しい。
我々はこのアイデアを軽量なemphInterference Kernel (IKC) にインスタンス化し、emphCoherent Gain (非一貫性プロキシよりもコヒーレントをlog-likelihood gain of coherent)とemphInterという2つの診断手法を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:28 GMT)
Finding Software Supply Chain Attack Paths with Logical Attack Graphs [4.1] 本稿では,SSC脅威伝搬解析とネットワークベースの脅威解析を統合したMulValの拡張を提案する。
新たなファクトとインタラクションルールは、SSC資産、依存関係、インタラクション、妥協、追加のセキュリティメカニズム、初期システム状態、既知の脅威をモデル化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:13:04 GMT)
SQuaD: The Software Quality Dataset [4.0] ソフトウェア品質データセット(Software Quality dataset、SQuaD)は、さまざまなエコシステムにわたる450の成熟したオープンソースプロジェクトから抽出された、ソフトウェア品質メトリクスのタイムアウェアなコレクションである。
9つの最先端の静的解析ツールを統合することで、SQuaDは700以上のユニークなメトリクスをメソッド、クラス、ファイル、プロジェクトレベルで統合する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:57:22 GMT)
Classifying Phonotrauma Severity from Vocal Fold Images with Soft Ordinal Regression [4.0] フォノトラウマの重症度の評価には、臨床医の専門的判断が伴う。
声帯画像から発声外傷の重症度を自動的に分類する最初の方法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:14 GMT)
Toward Multi-Fidelity Machine Learning Force Field for Cathode Materials [4.0] 計算結果のデータ効率を向上させるために,多要素機械学習力場フレームワークを開発した。
この研究は、より低いトレーニングデータセットコストでカソード材料に対する高精度なMLFFトレーニングを実現するのに役立ちます。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:46:07 GMT)
Density Estimation and Crowd Counting [4.0] 提案手法は,拡散過程を利用して高品質な群集密度マップを生成するデノベーション確率モデルを統合する。
回帰分岐は正確な特徴抽出のためにモデルに組み込まれ、縮合機構は類似度スコアに基づいてこれらのマップを組み合わせて堅牢な最終結果を生成する。
Farneback光フローアルゴリズムを用いたイベント駆動サンプリング手法を導入し,観衆運動の著しいフレームを選択的に捕捉する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:10 GMT)
QuCoWE Quantum Contrastive Word Embeddings with Variational Circuits for NearTerm Quantum Devices [4.0] ハードウェア効率の低いパラメータ化量子回路PQCを対照的なスキップグラムで学習することにより、量子ネイティブな単語埋め込みを学習するフレームワークを提案する。
制御されたリングエンタングルメント類似性を持つデータリロード回路によって単語を符号化し、量子状態フィデリティを介して計算し、ロジットフィデリティヘッドを通過する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:27 GMT)
M-DAIGT: A Shared Task on Multi-Domain Detection of AI-Generated Text [3.9] 本稿では,M-DAIGT(Multi-Domain Detection of AI-Generated Text)共有タスクを提案する。
M-DAIGTは、ニュース記事検出(NAD)とアカデミック記述検出(AWD)の2つのバイナリ分類サブタスクからなる。
合計46のチームが共有タスクに登録され、4つのチームが最終結果を提出した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:26:31 GMT)
MSMT-FN: Multi-segment Multi-task Fusion Network for Marketing Audio Classification [3.9] 大量のオーディオデータから顧客購入確率を効果的に分類することは依然として困難である。
本稿では,このビジネス需要に対応するために一意に設計された新しいマルチセグメント・マルチタスク・フュージョン・ネットワーク(MSMT-FN)を提案する。
当社のプロプライエタリなMarketCallsデータセットおよび確立されたベンチマークで実施された評価は、MSMT-FNが一貫してパフォーマンスを上回り、最先端の手法と一致していることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:51:30 GMT)
Adverbs Revisited: Enhancing WordNet Coverage of Adverbs with a Supersense Taxonomy [3.9] 副詞に対する言語的接地型スーパーセンス型について紹介する。
パイロット研究の結果は、これらのカテゴリーが自然文の副詞を広範囲にカバーしていることを示している。
本稿では,提案するスーパーセンスのカテゴリ,アノテーションの成果,今後の研究の方向性について述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:12:10 GMT)
How Worrying Are Privacy Attacks Against Machine Learning? [3.9] トレーニングされたモデルを考えると、トレーニングデータに推論を行うためにプライバシ攻撃をマウントする必要がある。
我々の議論は、これらの攻撃のほとんどは、関連する文献のプリマが示唆するよりも現実世界では効果が低いことを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:54 GMT)
Context-Emotion Aware Therapeutic Dialogue Generation: A Multi-component Reinforcement Learning Approach to Language Models for Mental Health Support [3.9] メンタルヘルスの病気は、社会経済的に重大な負担となる。
本稿では, GPT-2の対話生成能力を高めるために, 教師付き微調整・強化学習技術の応用について検討した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:32:10 GMT)
PCA recovery thresholds in low-rank matrix inference with sparse noise [3.7] スパースノイズによるランクワン信号の高次元推定について検討する。
ノイズは、大きなサイズ制限における有限平均接続性を持つ重み付き無向グラフの隣接行列としてモデル化される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:09:54 GMT)
CLIPPan: Adapting CLIP as A Supervisor for Unsupervised Pansharpening [3.7] そこで本研究では,CLIPをスーパーバイザーとして利用することにより,フル解像度でモデルトレーニングを行えるunsupervised pansharpening frameworkであるCLIPPanを提案する。
私たちはまず,CLIPに適応して低分解能マルチスペクトル,パンクロマチック,高分解能マルチスペクトル画像を認識する軽量な微調整パイプラインを提案する。
次に、セマンティック言語制約を統合した新しいテキストトロスを定式化し、画像レベルの融合遷移とプロトコルに沿ったテキストプロンプトを整合させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:16:19 GMT)
Gradient-Guided Exploration of Generative Model's Latent Space for Controlled Iris Image Augmentations [3.6] 生成モデルの潜時空間を潜時符号にトラバースすることで、新しいアイリス画像拡張戦略を導入する。
提案手法は、微分可能な損失項を定式化できる属性を操作するために容易に拡張できる。
GANインバージョンを用いて任意の虹彩画像を潜在空間に投影し、対応する潜在符号を得る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:41 GMT)
STELLAR: Scene Text Editor for Low-Resource Languages and Real-World Data [3.6] Scene Text Editor for Low-Resource LAnguages and Real-world data。
STELLARは、言語適応型グリフエンコーダとマルチステージトレーニング戦略を通じて、信頼できる多言語編集を可能にする。
また,STIPLAR(Scene Text Image Pairs of Low-Resource lAnguages and Real-world data)という新たなデータセットを構築し,評価を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:17:04 GMT)
STELLAR: Scene Text Editor for Low-Resource Languages and Real-World Data [3.6] Scene Text Editor for Low-Resource LAnguages and Real-world data。
STELLARは、言語適応型グリフエンコーダとマルチステージトレーニング戦略を通じて、信頼できる多言語編集を可能にする。
また,STIPLAR(Scene Text Image Pairs of Low-Resource lAnguages and Real-world data)という新たなデータセットを構築し,評価を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:22 GMT)
On the Information-Theoretic Fragility of Robust Watermarking under Diffusion Editing [3.6] 強力な拡散ベースの画像生成と編集技術は、堅牢なウォーターマーキングスキームに新たな脅威をもたらす。
生成中の透かし信号を明示的にターゲットし,消去する誘導拡散攻撃アルゴリズムを提案する。
我々は,近年の深層学習に基づく透かし手法に対するアプローチを評価し,攻撃後のほぼゼロに近い透かし回復率を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:41:24 GMT)
KGQuest: Template-Driven QA Generation from Knowledge Graphs with LLM-Based Refinement [3.6] 本稿では,知識グラフ(KG)から自然言語QAを生成するためのスケーラブルで決定論的パイプラインを提案する。
アプローチはまず、その関係に基づいてKG三重項をクラスタリングし、オブジェクトと関係のエンティティタイプから派生した自然言語規則を通じて再利用可能なテンプレートを作成する。
モジュールはLSMを利用してこれらのテンプレートを洗練し、事実の精度を維持しながら明確さとコヒーレンスを向上させる。
実験により、このハイブリッドアプローチは高い品質のQAペアを効率よく生成し、スケーラビリティと流速と言語的精度を組み合わせていることが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:54:01 GMT)
Arcee: Differentiable Recurrent State Chain for Generative Vision Modeling with Mamba SSMs [3.6] 状態空間モデル(SSM)は、長文シーケンスモデリングにますます採用されている。
最近の"Mamba-for-vision"変種は、非順序信号に対する厳密な因果関係を緩和するために、主に複数のスキャン順序を探索している。
Arceeはブロック間のリカレントステートチェーンであり、各ブロックの端末状態空間表現を再利用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:44:02 GMT)
LOCA-R: Near-Perfect Performance on the Chinese Physics Olympiad 2025 [3.6] 複雑な推論に適応したLOCAフレームワークの改良版であるLOCA-R(LOgical Chain Augmentation for Reasoning)を紹介する。
LOCA-Rは320点中313点をほぼ完全なスコアで達成し、最高成績の人間よりもしっかりと上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:49 GMT)
REAP: Enhancing RAG with Recursive Evaluation and Adaptive Planning for Multi-Hop Question Answering [3.5] サブタスクプランナー(SP)とファクトエクストラクタ(FE)が開発されている。
SPはグローバルな視点を維持し、全体的な推論方向を導き、タスク状態を評価する。
FEは、検索されたコンテンツに対してきめ細かい分析を行い、信頼できる回答と手がかりを抽出する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:32 GMT)
Towards Blind and Low-Vision Accessibility of Lightweight VLMs and Custom LLM-Evals [3.5] VLM(Large Vision-Language Models)は、ビデオ記述の理解と生成に優れるが、その高メモリ、計算、デプロイの要求は実用的な使用を妨げている。
AVCaps(屋外)とCharades(屋内)の2つの多様なデータセットで500Mと2.2Bパラメータを持つSmolVLM2変異体を評価する。
本稿では,BLVアクセシビリティ評価に特化して設計された2つの新しい評価フレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:08 GMT)
eXIAA: eXplainable Injections for Adversarial Attack [3.5] ポストホックな説明可能な人工知能(XAI)のための新しいブラックボックスモデル非依存的敵攻撃を示す。
攻撃の目的は、人間の目によって発見されず、予測されたクラスを維持しながら、元の説明を変更することである。
提案手法の低要件は、現在の説明可能性手法において重大な脆弱性を露呈し、安全クリティカルなアプリケーションにおける信頼性に関する懸念を提起する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:31:11 GMT)
LANE: Lexical Adversarial Negative Examples for Word Sense Disambiguation [3.5] きめ細かい単語の意味論は、ニューラルネットワークモデルにとって依然として重要な課題である。
本稿では,この制限に対処するため,LANEと呼ばれる新たな対人訓練戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:37:20 GMT)
Analysing Personal Attacks in U.S. Presidential Debates [3.5] 個人による攻撃は、アメリカ合衆国大統領討論会で顕著な特徴となっている。
我々は、米国大統領選挙における個人的攻撃を分析するための枠組みを提示する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:36:26 GMT)
The Data Fusion Labeler (dFL): Challenges and Solutions to Data Harmonization, Labeling, and Provenance in Fusion Energy [3.5] 核融合エネルギー研究は、異質なマルチモーダルデータセットを統合する能力にますます依存している。
Data Fusion Labeler (dFL) は、不確実性を認識したデータ調和、スキーマに準拠したデータ融合、および大規模な手動および自動ラベリングを実行する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:21 GMT)
Masked Mineral Modeling: Continent-Scale Mineral Prospecting via Geospatial Infilling [3.4] 本研究では,資源利用の地理空間地図をマスキングし,埋蔵することにより鉱物の位置を推定する学習手法を開発した。
本手法は, アメリカ合衆国における鉱物データを用いた実測実験と, 実測モデルを用いた実測実験である。
このような補助的特徴を利用することで推論性能が向上し, また, 記録鉱物のない地域でのモデル評価が可能となる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:09 GMT)
Probing Topological Stability with Nonlocal Quantum Geometric Markers [3.4] 空間的に解決された局所的な量子幾何学的マーカーは、長距離翻訳対称性を持たない位相位相の診断において重要な役割を果たす。
異なる位相遷移が定性的に異なる空間シグネチャを生成し、位相安定性の洗練されたクラス内部プローブを可能にすることを示す。
非局所的な量子幾何学的指標は、位相相転移の安定性を理解し予測するためのより効率的で汎用的なツールを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:00 GMT)
Utilizing LLMs for Industrial Process Automation: A Case Study on Modifying RAPID Programs [3.3] 本稿では,産業プロセス自動化分野におけるソフトウェアのための大規模言語モデルの有用性について検討する。
LLMで十分にサポートされていない言語において、単純な問題を解決するのに、数発のプロンプトアプローチが十分であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:56:55 GMT)
Spilling the Beans: Teaching LLMs to Self-Report Their Hidden Objectives [3.3] 提案手法は,実ミスを認めるようにモデルを訓練する手法である。
簡単な質問応答設定における事実誤りの認識は、隠れた不整合目的の認識に一般化されることを示す。
SRFTの後、モデルは尋問された際に隠された目的の詳細を告白する傾向にある。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:21:46 GMT)
Power Ensemble Aggregation for Improved Extreme Event AI Prediction [3.3] 本稿では、機械学習手法を用いて、気候極端事象、特に熱波の予測を改善することの課題に対処する。
機械学習に基づく天気予報モデルを生成させることにより、同じモデルからの典型的な平均予測よりも、極端な熱事象を予測する精度が向上する。
我々のパワーアグリゲーション法は、その最適性能が選択された量子しきい値によって変化し、より高い極値予測の有効性が向上することを示すため、持続性と適応性を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:11:02 GMT)
How Can We Effectively Use LLMs for Phishing Detection?: Evaluating the Effectiveness of Large Language Model-based Phishing Detection Models [3.3] 大型言語モデル(LLM)は、将来性のあるフィッシング検出メカニズムとして登場した。
本研究では, LLMのフィッシング検出への応用について検討した。
入力モダリティ(スクリーンショット,ロゴ,HTML,URL)の影響,温度設定,エンジニアリング戦略の促進について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:22 GMT)
CATCHFed: Efficient Unlabeled Data Utilization for Semi-Supervised Federated Learning in Limited Labels Environments [3.3] フェデレートラーニング(Federated Learning)は、データプライバシを保持しながら分散クライアントリソースを活用する、有望なパラダイムである。
既存のFLアプローチの多くは、クライアントがラベル付きデータを持っていると仮定しているが、現実のシナリオでは、クライアント側のラベルは利用できないことが多い。
クラス難易度を考慮したクライアント対応適応しきい値,疑似ラベル品質向上のためのハイブリッドしきい値を導入し,非擬似ラベルデータを用いて整合正則化を行うtextitCATCHFedを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:16:52 GMT)
A Multimodal Manufacturing Safety Chatbot: Knowledge Base Design, Benchmark Development, and Evaluation of Multiple RAG Approaches [3.3] 次世代安全訓練システムには,高精度,低レイテンシ,低コストの3つの必須要件がある。
これらの設計要件を満たす大規模言語モデルを用いたマルチモーダルチャットボットを提案する。
最高設定は86.66%、平均レイテンシは10.04秒、クエリ毎の平均コストは0.005ドルだった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:10:23 GMT)
MAFM^3: Modular Adaptation of Foundation Models for Multi-Modal Medical AI [3.2] 我々は,単一の基礎モデルを多様な領域,タスク,モダリティに拡張可能なフレームワークMAFM3を提案する。
新しいタスクやモダリティを個別に扱う従来の適応手法とは異なり、MAFM3は効率的なマルチタスクとマルチモーダル適応のための統一された拡張可能なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:10:59 GMT)
DenoGrad: Deep Gradient Denoising Framework for Enhancing the Performance of Interpretable AI Models [3.2] ノイズのあるサンプルを検出し,調整するための新しいインスタンスDenoiserフレームワークであるDenoGradを提案する。
DenoGradは、ノイズの多いインスタンスを動的に修正し、問題のデータ分散を保存し、AIモデルを改善する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:36:10 GMT)
Learning of Statistical Field Theories [3.2] 本稿では, 離散変数, 連続変数, ハイブリッド変数を持つシステムに一様に対応する逆問題に対するアプローチを提案する。
粗粒化下での手順の反復は, 完全な非摂動的再正規化群フローを再構築することを示す。
また、フルゲージ構成が不可能な現実的な設定に対処し、複数の場の理論に対する学習アルゴリズムを再構成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:21 GMT)
UAVBench: An Open Benchmark Dataset for Autonomous and Agentic AI UAV Systems via LLM-Generated Flight Scenarios [3.1] UAVBenchは、大規模言語モデル(LLM)によって生成されたUAV飛行シナリオのオープンベンチマークベンチマークである。
UAVBench_MCQは,10の認知的・倫理的推論スタイルにまたがる5万の多重選択質問を含む推論指向の拡張である。
GPT-5, ChatGPT-4o, Gemini 2.5 Flash, DeepSeek V3, Q3wenwenB, ERNIE 4.5 300B を含む32 の最先端 LLM を評価し, 認識・政策推論において高い性能を示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:51:48 GMT)
SOTFormer: A Minimal Transformer for Unified Object Tracking and Trajectory Prediction [3.1] 最小限の定メモリ時間変換器である textbfSOTFormer を導入する。
オブジェクト検出、トラッキング、短期水平軌道予測を単一のエンドツーエンドフレームワークに統合する。
Mini-LaSOT (20%)ベンチマークでは、SOTFormerは76.3 AUCと53.7 FPS(AMP、4.3GB VRAM)を達成した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:25:05 GMT)
EgoEMS: A High-Fidelity Multimodal Egocentric Dataset for Cognitive Assistance in Emergency Medical Services [3.1] EgoEMSは、最初のエンドツーエンド、高忠実、マルチモーダル、マルチパーソンのデータセットで、20時間以上の現実的、手続き的 EMS アクティビティをキャプチャする。
EgoEMSは、EMSの専門家と共同で開発され、国家標準に従って、オープンソースで低コストで複製可能なデータ収集システムを使用してキャプチャされる。
実時間マルチモーダルキーステップ認識と行動品質推定のためのベンチマークスイートを提案し,EMSのためのAI支援ツールの開発に不可欠である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:00 GMT)
ClinStructor: AI-Powered Structuring of Unstructured Clinical Texts [3.1] 我々は,ClinStructorについて述べる。ClinStructorは大規模言語モデル(LLM)を利用して,臨床自由テキストを予測モデルに先立って構造化されたタスク固有の質問応答ペアに変換するパイプラインである。
本手法は透明性と制御性を大幅に向上させ,予測性能の低下を招く。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:21:16 GMT)
Additive Large Language Models for Semi-Structured Text [3.1] CALMは半構造化テキストの解釈可能なフレームワークである。
各コンポーネントのコントリビューションの加算和として結果を予測する。
従来の大規模言語モデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:06:16 GMT)
Quality Assurance of LLM-generated Code: Addressing Non-Functional Quality Characteristics [3.1] 既存の研究は、生成したコードが品質に合格するかどうかではなく、テストに合格するかどうかに重点を置いている。
本研究は,108論文の体系的レビュー,複数組織の実践者による2つの業界ワークショップ,実世界のソフトウェア問題へのパッチ適用に関する実証分析の3つの相補的な調査を行った。
セキュリティとパフォーマンスの効率が学術的な注目を集めているのに対して、保守性やその他の品質が検討されていることがわかりました。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:35 GMT)
Coordinative Learning with Ordinal and Relational Priors for Volumetric Medical Image Segmentation [3.0] ボリューム画像の局所的構造と大域的構造の両方を捉えるために,コーディネーティブ・オーディショナル・リレーショナル・解剖学学習を提案する。
コーラルは、連続解剖学的類似性を活用するために、対照的なランク付けの目的を用いる。
コーラルは、学習した特徴分布と患者間での標準的な解剖学的進行を整合させ、グローバルな方向性整合を強制する順序的目的を取り入れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:11:58 GMT)
Bi-Level Contextual Bandits for Individualized Resource Allocation under Delayed Feedback [3.0] 本稿では,遅延フィードバック下での資源割り当てを個別化するための,新しい双方向コンテキスト帯域化フレームワークを提案する。
本研究は, 制度政策と社会福祉を改善するための遅延認識型意思決定システムの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:15:35 GMT)
Bi-Level Contextual Bandits for Individualized Resource Allocation under Delayed Feedback [3.0] 本稿では,遅延フィードバック下での資源割り当てを個別化するための,新しい双方向コンテキスト帯域化フレームワークを提案する。
本研究は, 制度政策と社会福祉を改善するための遅延認識型意思決定システムの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:18 GMT)
GridPrune: From "Where to Look" to "What to Select" in Visual Token Pruning for MLLMs [3.0] MLLM(Multimodal large language model)は、様々な視覚言語タスクにおいて顕著な機能を示す。
MLLMの効率を高めるための重要な技術として、視覚トークンプルーニングが登場している。
そこで本研究では,グローバルなTop-Kメカニズムを,GridPruneに置き換える手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:53 GMT)
CrossMed: A Multimodal Cross-Task Benchmark for Compositional Generalization in Medical Imaging [3.0] 医用視覚言語モデルの合成一般化(CG)を評価するベンチマークであるCrossMedを紹介する。
4つの公開データセットを統一的な視覚的質問応答(VQA)フォーマットに再構成し、20,200の複数選択QAインスタンスを生成する。
関連する分割で訓練されたモデルは83.2%の分類精度と0.75のセグメンテーションcIoUを実現し、非関連条件とゼロオーバーラップ条件では性能が著しく低下する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:41:01 GMT)
The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models [3.0] 静的および動的画像にまたがる767のウィキデータ由来の文化的参照にまたがる5つの拡散モデルを評価する。
私たちの研究は、拡散モデルの価値は、それらが再現するものだけでなく、文化的な知識を変換し、再テクスチャ化する方法にも関係していることを明らかにします。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:03:10 GMT)
Expert-Guided Prompting and Retrieval-Augmented Generation for Emergency Medical Service Question Answering [3.0] 本稿では,特定の臨床対象領域と認定レベルに基づいてチェーン・オブ・シント推論を規定するプロンプト戦略であるExpert-CoTを紹介する。
また,対象領域に整合した文書や実世界の患者データに応答する検索拡張型生成パイプラインであるExpertRAGを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:21:48 GMT)
Let the Experts Speak: Improving Survival Prediction & Calibration via Mixture-of-Experts Heads [3.0] 我々は、生存分析問題に対していくつかの離散時間深層混合(MoE)アーキテクチャを導入する。
そのうちの1つは、クラスタリング、キャリブレーション、予測精度のすべてを達成する。
より表現力のある専門家は、患者ごとの予測を調整し、固定されたグループのプロトタイプに依存する専門家より優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:15 GMT)
On the Notion that Language Models Reason [3.0] 言語モデル(LM)は推論を示すと言われているが、これは何を意味するのか?
提供される定義は、LMのトレーニング方法、情報処理、新しいトークンの生成方法と一致していない、と我々は主張する。
この見解は、LMが「統計的パターンマーカ」であるという主張を実証している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:04:24 GMT)
ProgRAG: Hallucination-Resistant Progressive Retrieval and Reasoning over Knowledge Graphs [3.0] 大きな言語モデル(LLM)は強い推論能力を示すが、幻覚と限られた透明性に苦しむ。
本稿では,複雑な質問をサブクエストに分解し,部分的推論経路を拡張するマルチホップ知識グラフ質問応答(KGQA)フレームワークであるProgRAGを提案する。
3つのよく知られたデータセットの実験により、ProgRAGはマルチホップKGQAで既存のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:03 GMT)
Ancilla-Free Fast-Forwarding Lindbladian Simulation Algorithms by Hamiltonian Twirling [2.9] 時間=t$進化写像は、ユニタリ軌道上のガウスのツワールを正確に表すことができる。
この構造的洞察により、リンドブラディアンシミュレーションのための高速フォワードアルゴリズムを設計できる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:42 GMT)
A Deep Learning Framework for Thyroid Nodule Segmentation and Malignancy Classification from Ultrasound Images [2.9] 本稿では,完全自動化された悪性度予測のための2段階のフレームワークを提案する。
本手法は,臨床的に関係のある領域にのみ集中させ,解釈可能性を実現する。
これは、超音波画像上で甲状腺結節を検出し、悪性度を予測するための、最初の完全なエンドツーエンドパイプラインである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:23:24 GMT)
Privacy Challenges and Solutions in Retrieval-Augmented Generation-Enhanced LLMs for Healthcare Chatbots: A Review of Applications, Risks, and Future Directions [2.8] 検索増強世代 (RAG) は, 大規模言語モデルを臨床・生物医療システムに統合するための転換的アプローチとして急速に発展してきた。
このレビューは、医療におけるRAGアプリケーションの現状を詳細に分析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:33:58 GMT)
Scaling Equitable Reflection Assessment in Education via Large Language Models and Role-Based Feedback Agents [2.8] 形式的フィードバックは、学生学習の最も効果的な要因の1つである。
大規模または低リソースのコースでは、インストラクターは学生のリフレクションのレビューや応答に必要な時間、スタッフ、帯域幅を欠いていることが多い。
本稿では,5つの協調型ロールベースLLMエージェントを用いて学習者の反射をスコアリングする理論基底システムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:46:21 GMT)
HealSplit: Towards Self-Healing through Adversarial Distillation in Split Federated Learning [2.8] Split Federated Learning (SFL)は、プライバシ保護のための分散学習のための新興パラダイムである。
ローカルな特徴、ラベル、スマッシュデータ、モデルウェイトをターゲットとした高度なデータ中毒攻撃には、依然として脆弱である。
本稿では,SFL用に開発された最初の統一防衛フレームワークであるHealSplitについて述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:42:11 GMT)
Beyond Single-Step Updates: Reinforcement Learning of Heuristics with Limited-Horizon Search [2.8] ヒューリスティックサーチはそのような問題を解決するための標準的な手法であり、任意の状態から目標に対するコストを見積もる関数に依存している。
この研究は、状態サンプリングと更新の両方を組み込んだ一般化されたアプローチを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:20 GMT)
A Fourier-Based Global Denoising Model for Smart Artifacts Removing of Microscopy Images [2.8] 高品質な画像を得るために顕微鏡制御をチューニングするのは、簡単で時間を要する作業である。
既存のデノイングモデルは、弱い信号をノイズとして一般化することに主に基づいている。
より弱いが物理的に重要な特徴を保ちながら、顕微鏡画像のアーティファクトを巧みに除去するグローバルデノナイジングモデル(GDM)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:51 GMT)
Requirements for Aligned, Dynamic Resolution of Conflicts in Operational Constraints [2.8] デプロイされた自律型AIシステムは、新規または未特定のコンテキストにおいて、複数のもっともらしい行動コースを評価する必要がある。
本稿では,これらの文脈におけるエージェント決定の要件を特徴付ける。
また、目標を達成し、人間の期待に沿うために、意思決定を堅牢にするために必要な知識エージェントの種類を特定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 04:33:15 GMT)
SurvBench: A Standardised Preprocessing Pipeline for Multi-Modal Electronic Health Record Survival Analysis [2.7] 本稿では、SurvBenchについて述べる。SurvBenchは、生のPhyloNetデータセットをマルチモーダルサバイバル分析のためのモデル対応テンソルに変換する、包括的でオープンソースの前処理パイプラインである。
SurvBenchは、MIMIC-IV、eICU、MC-MEDの3つの主要なクリティカルケアデータベースにデータローダを提供する。
パイプラインは厳格なデータ品質管理、データ漏洩を防止するための患者レベルの分割、明確な欠陥追跡、標準化された時間的集約を実装している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:19:14 GMT)
Discrete Time Crystals in Noninteracting Dissipative Systems [2.7] 多体量子系は時間-翻訳対称性の破れを示し、離散時間結晶(DTC)相で落ち着く。
非相互作用系におけるDTC相の安定性と環境散逸を両立させる手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:04 GMT)
Pack-A-Mal: A Malware Analysis Framework for Open-Source Packages [2.7] 本稿では、静的解析よりも動的解析の方が、より深い洞察を提供するが、実行中のソフトウェア動作を理解するのにリソース集約的であることを強調する。
動的解析ツールであるパッケージ分析を強化し、実行されたコマンド、アクセスされたファイル、ネットワーク通信を含む主要なランタイム動作をキャプチャします。
この修正により、gVisorのようなコンテナサンドボックス技術を使用することで、ホストシステムを著しく損なうことなく、潜在的に悪意のあるパッケージを分析することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:21:31 GMT)
MajinBook: An open catalogue of digital world literature with likes [2.7] MajinBookは、シャドウライブラリの使用を容易にするために設計されたオープンカタログである。
我々は3世紀にわたる英語の書籍に539,000点を超える高精度のコーパスを作成した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:44:27 GMT)
SHRUG-FM: Reliability-Aware Foundation Models for Earth Observation [2.7] 地球観測のための地球空間基盤モデルは、事前訓練中に過小評価されている環境では確実に機能しないことが多い。
SHRUG-FMは3つの相補的な信号を統合する信頼性を考慮した予測フレームワークである。
我々は,OODスコアが特定の環境条件下での低い性能と相関していることを示し,不確実性に基づくフラグは,多くの性能の悪い予測を捨てる助けとなることを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:43 GMT)
nuPlan-R: A Closed-Loop Planning Benchmark for Autonomous Driving via Reactive Multi-Agent Simulation [2.6] 我々は、新しいリアクティブクローズドループ計画ベンチマークであるnuPlan-Rを提案する。
本ベンチマークでは,ルールベースのIMMエージェントをノイズ分離型拡散型反応性エージェントに置き換える。
ベンチマークを2つの追加メトリクスで拡張し、計画性能をより包括的な評価を可能にします。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:17 GMT)
Flash-Fusion: Enabling Expressive, Low-Latency Queries on IoT Sensor Streams with LLMs [2.6] Flash-Fusionは、IoTデータ収集と分析の負担を軽減する、エンドツーエンドのエッジクラウドシステムである。
高品質なレスポンスを維持しながら、95%のレイテンシ削減とトークン使用率とコストの98%の削減を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:34:28 GMT)
KarmaTS: A Universal Simulation Platform for Multivariate Time Series with Functional Causal Dynamics [2.6] KarmaTSはグラフィカル時系列(MTS)シミュレーションのための実行可能な因果モデルを構築するためのインタラクティブフレームワークである。
アクセス制限された生理データの挑戦によって、KarmaTSは既知の因果ダイナミクスを持つ合成MSSを生成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:44:14 GMT)
AI-Open-RAN for Non-Terrestrial Networks [2.6] 非地上ネットワーク(NTN)のためのオールインワン無線アクセスネットワーク(RAN)であるAIO-RAN-NTNの概念を提案する。
このアプローチは、次世代通信における相互運用性、柔軟性、インテリジェンスを向上させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:41:52 GMT)
Contextual morphologically-guided tokenization for Latin encoder models [2.6] 形態学的に豊かな言語であるラテン語のトークン化について検討する。
形態的に誘導されたトークン化は、下流4つのタスクにおける全体的なパフォーマンスを改善する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:33 GMT)
An Efficient Training Pipeline for Reasoning Graphical User Interface Agents [2.6] この作業では,モデルベースのデータフィルタリングとパラメータ効率のよい微調整を組み合わせた,効率的なトレーニングパイプラインを導入している。
4.8Mの合成例から、1Kのクリーンで多様なインスタンスは、まず難しいケースを特定し、不整合を取り除き、多様なマルチモーダルインスタンスを選択してキュレートされる。
フィルタリングされたデータと軽量なトレーニング戦略でトレーニングされたモデルは、ScreenSpot、Multimodal-Mind2Web、AndroidControlなどのベンチマークで、より大きなベースラインにマッチするか、超える。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:05:18 GMT)
An Efficient Training Pipeline for Reasoning Graphical User Interface Agents [2.6] この作業では,モデルベースのデータフィルタリングとパラメータ効率のよい微調整を組み合わせた,効率的なトレーニングパイプラインを導入している。
4.8Mの合成例から、1Kのクリーンで多様なインスタンスは、まず難しいケースを特定し、不整合を取り除き、多様なマルチモーダルインスタンスを選択してキュレートされる。
フィルタリングされたデータと軽量なトレーニング戦略でトレーニングされたモデルは、ScreenSpot、Multimodal-Mind2Web、AndroidControlなどのベンチマークで、より大きなベースラインにマッチするか、超える。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:03 GMT)
Leveraging Large Language Models for Use Case Model Generation from Software Requirements [2.6] 提案手法はオープンウェイト LLM を統合し,ソフトウェア要件からアクターやユースケースを体系的に抽出する。
その結果, モデリング時間を60%削減し, 大幅な加速が得られた。
モデリング効率の改善に加えて,参加者は,この手法がプロセスに価値あるガイダンスを提供することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:46:43 GMT)
General Intelligence-based Fragmentation (GIF): A framework for peak-labeled spectra simulation [2.4] General Intelligence-based Fragmentation (GIF)は、構造化プロンプトと推論を用いたスペクトルシミュレーションを通じて、事前訓練されたLCMをガイドする。
GPT-4o と GPT-4o-mini はそれぞれ、シミュレーションされたスペクトルと真のスペクトルの間に 0.36 と 0.35 のコサイン類似性が得られる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:20 GMT)
Multitask GLocal OBIA-Mamba for Sentinel-2 Landcover Mapping [2.4] 本稿では,Sentinel-2分類を改良した新しいマルチタスクローカルOBIA-Mamba(MSOM)を提案する。
提案手法は、カナダのアルバータ州のSentinel-2画像に対して、いくつかの高度な分類手法と比較して試験される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:45 GMT)
FairReweighing: Density Estimation-Based Reweighing Framework for Improving Separation in Fair Regression [2.4] 透明性の欠如は、データインフォームドAIソフトウェアがすべての人種、性別、年齢グループに対する公平性を保証するかどうかという懸念を提起している。
公平な分類でリウィーリングアルゴリズムを動機付け, 密度推定に基づくFairReweighingプリプロセッシングアルゴリズムを提案する。
提案したFairReweighingアルゴリズムは,データ独立仮定の下でトレーニングデータの分離を保証できることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:31:21 GMT)
Analogical Structure, Minimal Contextual Cues and Contrastive Distractors: Input Design for Sample-Efficient Linguistic Rule Induction [2.4] 我々は、類似構造、コントラスト学習、最小限の文脈的手がかりという3つの認知に着想を得た原理を実装した計算手法を開発する。
提案手法は,モデルが類似パターンから正しい文補完を識別する構造的補完タスクを用いて検証する。
この結果から,類似パラダイムの組織は,従来の手法よりも桁違いに少ないデータで,競争力のある言語規則学習を可能にすることが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:33 GMT)
Model Class Selection [2.4] モデルクラス選択(MCS)の考え方を紹介する。
MCSでは、複数のモデルコレクションが評価され、少なくとも1つの最適なモデルを含む全てのコレクションが識別のために検索される。
直接的な結果として、特定のデータセットに対して、より単純で解釈可能な統計モデルのクラスが、より複雑なブラックボックス機械学習モデルと同等に実行できるかどうかを調査することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:43:26 GMT)
GraphSB: Boosting Imbalanced Node Classification on Graphs through Structural Balance [2.4] 非平衡ノード分類はグラフ学習において重要な課題であり、既存のほとんどの手法はグラフニューラルネットワーク(GNN)を用いてノード表現を学習する。
ノード合成の前に基盤となる不均衡グラフ構造に対処するための鍵となる戦略として,構造バランスを組み込んだ新しいフレームワークであるGraphSBを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:54 GMT)
TomoGraphView: 3D Medical Image Classification with Omnidirectional Slice Representations and Graph Neural Networks [2.3] 3次元医用画像分類は、複雑な空間的関係と、アクセス可能なデータに固有の長距離依存のため、依然として困難な課題である。
近年の研究では、医用画像解析のための強力な特徴抽出器として、当初自然画像に基づいて訓練された2次元視覚基盤モデルの可能性を強調している。
我々は,全方向ボリュームスライシングと球面グラフに基づく特徴集約を統合した新しいフレームワークである TomoGraphView を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:21 GMT)
RF-Squad: A radiofrequency simulator for quantum dot arrays [2.3] 本稿では,量子ドットアレイの高周波反射率測定を現実的に再現する物理シミュレーションであるRF-Squadを紹介する。
RF-Squadは高い計算速度を実現し、52.1$pm$0.2ミリ秒で二重量子ドット(DQD)の100×100ピクセルの電荷安定性図をシミュレーションできる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:25:08 GMT)
Solvaformer: an SE(3)-equivariant graph transformer for small molecule solubility prediction [2.3] Solvaformer は、独立なSE(3)対称性を持つ複数の分子として解をモデル化する幾何学的なグラフ変換器である。
我々はSolvaformerに、量子力学データと実験的測定に基づいて訓練する交互バッチレギュレータを用いて、溶解度(log S)と溶解自由エネルギーの両方を予測するように訓練する。
Solvaformerは学習したモデルの中で最強の総合性能を達成し、DFT支援勾配ブースティングベースラインにアプローチする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:58 GMT)
Entanglement Phase Transition in Chaotic non-Hermitian Systems [2.3] スピンスピン結合項が非エルミート項と可換であるカオス非エルミートスピン鎖のクラスについて検討する。
我々の研究は、カオス的非エルミート系における新しい絡み合い遷移を明らかにしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:49 GMT)
Strategic Opponent Modeling with Graph Neural Networks, Deep Reinforcement Learning and Probabilistic Topic Modeling [2.2] 本稿では,主にグラフニューラルネットワーク,深層強化学習,確率論的トピックモデリング手法について概説する。
我々は、現実世界のアプリケーションケースで非常によく見られる2つの特徴である不確実性と不均一性を扱う能力を分析します。
特定のオープンな課題、特に非定常環境に適合する必要性を特定します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:20:26 GMT)
Strategic Opponent Modeling with Graph Neural Networks, Deep Reinforcement Learning and Probabilistic Topic Modeling [2.2] 本稿では,主にグラフニューラルネットワーク,深層強化学習,確率論的トピックモデリング手法について概説する。
我々は、現実世界のアプリケーションケースで非常によく見られる2つの特徴である不確実性と不均一性を扱う能力を分析します。
特定のオープンな課題、特に非定常環境に適合する必要性を特定します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:52 GMT)
Textual understanding boost in the WikiRace [2.2] WikiRaceゲームは、ウィキペディアの記事の間をハイパーリンクだけでナビゲートするゲームで、複雑な情報ネットワークにおけるゴール指向検索の魅力的なベンチマークとして機能する。
本稿では,グラフ理論的構造(重心性),意味的意味(モデル埋め込み),ハイブリッドアプローチによって導かれるエージェントを比較検討し,本課題に対するナビゲーション戦略の体系的評価を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:07 GMT)
Social LSTM with Dynamic Occupancy Modeling for Realistic Pedestrian Trajectory Prediction [2.2] 本稿では,新しい動的空間損失関数を用いたソーシャルLSTMを改良した新しい深層学習モデルを提案する。
この損失関数は学習における社会的LSTMを導いており、群衆密度の異なる変位誤差を増大させることなく現実的な衝突を避けることができる。
提案したモデルは、ほとんどのテストセットにおいて、最先端のディープラーニングモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:53 GMT)
Dynamic Sparsity: Challenging Common Sparsity Assumptions for Learning World Models in Robotic Reinforcement Learning Benchmarks [2.1] 環境力学の因果グラフがスパースか (ii) 状態依存か (iii) 局所系力学がスパースに変化するか (ii) について検討する。
この結果から,グローバルな分散性は稀であるが,その代わりに,局所的かつ状態に依存した分散性を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:15:33 GMT)
Trotterized Variational Quantum Control for Spin-Chain State Transfer [2.0] スピン鎖における高忠実度状態伝達を目的とした量子最適制御のためのハイブリッド変分フレームワークを提案する。
本研究では,スライスあたりの共有パラメータの少ないコンパクトなグローバルスキームと,サイトワイズ角度の局所スキームの2つのパラメータ化について検討する。
その結果、表現性-安定性のトレードオフを明確にし、ノイズ中間量子(NISQ)互換制御合成へのスケーラブルな経路を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:11 GMT)
Heterogeneous Multisource Transfer Learning via Model Averaging for Positive-Unlabeled Data [2.0] 本研究では,異種データソースからの情報を直接データ共有なしで統合するトランスファー学習フレームワークを提案する。
各ソースドメインタイプに対して、調整されたロジスティック回帰モデルを実行し、平均化によって知識をPUターゲットドメインに転送する。
提案手法は,特にラベル付きデータや異種環境において,予測精度とロバスト性において,他の比較手法よりも優れる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:15:31 GMT)
Massively Parallel Proof-Number Search for Impartial Games and Beyond [2.0] In this present the first massively parallel version of Proof-Number Search which is presented the first of Proof-Number Search。
我々のソルバは1024コアで動作する場合の332.9$times$ speedupを大幅に改善した。
ゲームツリーサイズは指数関数的に増加するものの,42の新たな位置でSprouts Conjectureを検証し,既知の結果の2倍近い結果を得た。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:59 GMT)
Spontaneous Macroscopic Quantum Synchronization in an Ensemble of Two-level Systems [2.0] 自発的なマクロスケール量子同期は創発的な現象である。
2レベルシステム(TLS)のアンサンブルを研究し、関連する非線形量子マスター方程式を確立する。
自然周波数の異なるTLS群間の完全同期と部分同期を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:16:53 GMT)
Generalizing PDE Emulation with Equation-Aware Neural Operators [1.9] 偏微分方程式(PDE)の解法は、従来の数値法では違法に高価である。
ディープラーニングベースのサロゲートモデルは通常、固定パラメータを持つ単一のPDEを専門とする。
本稿では,PDEを一般化する方程式認識エミュレーションの枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:27 GMT)
A Computational Method for Solving the Stochastic Joint Replenishment Problem in High Dimensions [1.9] 本研究では,高次元関節補充問題に対する離散時間定式化について考察する。
我々は、インパルス制御問題を解決するために、ディープニューラルネットワークに依存する新しいシミュレーションベースの計算手法を開発した。
これまでの調査では、私たちのメソッドは最高のベンチマークにマッチするか、打ち負かしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:45:23 GMT)
Geospatial Chain of Thought Reasoning for Enhanced Visual Question Answering on Satellite Imagery [1.9] 衛星画像における視覚質問応答(VQA)の進行には,空間的思考連鎖(CoT)推論が不可欠である。
本稿では,CoT推論をDPO(Direct Preference Optimization)と統合し,解釈性,堅牢性,精度を向上させるVQAフレームワークを提案する。
実験の結果、CoTの監督は直接ベースラインよりも34.9%精度が向上し、DPOは精度と推論品質が向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:54:05 GMT)
Leveraging Large Language Models for Identifying Knowledge Components [1.8] 知識コンポーネント(KC)は適応学習システムの基礎であるが、ドメインの専門家による手動の識別は重要なボトルネックである。
本研究は、まず「シミュレーション教科書」 LLM を646質問のより大きなデータセットに拡張し、これらの制限に対処する。
冗長性の問題に対処するため,コサイン類似性に基づいて意味論的に類似したKCラベルをマージする手法を提案し,評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:53 GMT)
The Grand Challenge of Quantum Applications [1.8] この視点は、有用な量子コンピューティングアプリケーションを開発するための、有望な経路と重要な障害を概説している。
本稿では,量子的優位性の理論的な探索から,コンパイルと資源推定のマイルストーンまで,このプロセスのための5段階のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:04 GMT)
Revisit to the Bai-Galbraith signature scheme [1.8] Dilithiumは、NISTが承認した格子ベースのシグネチャスキームの1つである。
本項では、BG14で提案されたBai-Galbraithシグネチャスキームについて述べる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:43 GMT)
Faster Symmetry Breaking Constraints for Abstract Structures [1.8] それらの表現をよりうまく活用することで抽象構造の対称性を破る新しい不完全な方法を示す。
本手法は、一般的に発生する対称性の一種である、識別不能な物体から生じる対称性を破ることに適用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:34:23 GMT)
Human-AI collaborative autonomous synthesis with pulsed laser deposition for remote epitaxy [1.8] 仮説生成と解析のための大規模言語モデルを統合したヒューマンAI協調ワークフロー(HAIC)を開発し,展開する。
HAICは仮説形成と実験設計を加速し、成長空間をグラフェン損傷に効率的にマッピングした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:48:52 GMT)
Large Language Models and 3D Vision for Intelligent Robotic Perception and Autonomy: A Review [1.8] 3Dビジョンを備えた大規模言語モデル(LLM)は、ロボットセンシング技術の強化に対する変革的なアプローチとして現れている。
本稿では,LLMと3Dビジョンの交わりにおける最先端の方法論,応用,課題を包括的に分析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:32:25 GMT)
Physics-informed Machine Learning for Static Friction Modeling in Robotic Manipulators Based on Kolmogorov-Arnold Networks [1.7] 摩擦モデリングはロボットオペレーティングシステムにおいて高精度な動作制御を実現する上で重要な役割を担っている。
本稿では,ロボット関節の静的摩擦モデリングのためのKAN(Kolmogorov Arnold Network)に基づく物理インスパイアされた機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:42 GMT)
Generalizing Fair Clustering to Multiple Groups: Algorithms and Applications [1.6] 本研究は,グループ数(2以上)の任意の設定に対して,最良クラスタリング問題の研究を一般化する。
任意のサイズの複数グループを効率的に扱うニア線形時間近似アルゴリズムを提案する。
我々は,複数のグループ(2つ以上のグループ)を含むEmphfairコンセンサスクラスタリング問題に対して,近似アルゴリズムを初めて提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:19:18 GMT)
Studies with impossible languages falsify LMs as models of human language [1.6] Futrell と Mahowald [arXiv:2501.17047] によると、幼児と言語モデル(LM)は、不自然な構造を持つ不可能な言語よりも、証明された言語を学習しやすくする。
文献をレビューし、LMが証明された言語と多くの不可能な言語を等しく学習することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:18:26 GMT)
DiffPro: Joint Timestep and Layer-Wise Precision Optimization for Efficient Diffusion Inference [1.6] DiffProはデプロイに使用する正確な整数カーネルと連携し、Diffusion Transformer(DiT)のタイムステップと層ごとの精度を共同調整することで、トレーニングなしでレイテンシとメモリを削減できる。
実験では、DiffProは最大6.25倍のモデル圧縮、50%のタイムステップ、標準ベンチマークでDelta FID = 10の2.8倍高速な推論を実現している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:14:58 GMT)
Geometry Induced Chiral Transport and Entanglement in $AdS_2$ Background [1.6] 本稿では,AdS$とAdS$$のブラックホール背景におけるディラックフェルミオンのリアルタイムカイラルダイナミクスについて検討する。
時空曲率によってスピン接続項が生成され、有効磁場と位置依存キラル化学ポテンシャルとして機能する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:50 GMT)
Binary Verification for Zero-Shot Vision [1.6] 市販のVLMを用いたゼロショットビジョンのためのトレーニング不要バイナリ検証ワークフローを提案する。
我々は、オープンエンドの視覚クエリをMCQに量子化し、さらにTrue/False検証に二項化する方法を定式化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:05:43 GMT)
OpenSR-SRGAN: A Flexible Super-Resolution Framework for Multispectral Earth Observation Data [1.6] 我々は、地球観測における単一画像超解像のためのオープンでモジュラーなフレームワークOpenSR-SRGANを提案する。
OpenSR-SRGANは、ジェネレータ、識別器、損失関数、および簡潔な設定ファイルによるトレーニングスケジュールを公開する。
一般的なリモートセンシングシナリオのための準備の整った設定が付属する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:52:43 GMT)
An explainable Recursive Feature Elimination to detect Advanced Persistent Threats using Random Forest classifier [1.6] 本稿では,Recursive Feature Elimination(RFE)とRandom Forest(RF)を統合し,APT(Advanced Persistent Threats)の検出を向上させるための説明可能な侵入検出フレームワークを提案する。
実験の結果,RF-RFEは検出精度99.9%を達成し,従来の分類器と比較して偽陽性・計算コストを低減できた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:17 GMT)
RLSLM: A Hybrid Reinforcement Learning Framework Aligning Rule-Based Social Locomotion Model with Human Social Norms [1.6] 不快を生じさせることなく、人口の多い環境をナビゲートすることは、社会的に認識されるエージェントにとって重要な能力である。
本稿では,ルールに基づくソーシャルロコモーションモデルを強化学習フレームワークに統合したハイブリッド強化学習フレームワーク RLSLM を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:59:40 GMT)
Rediscovering the Lunar Equation of the Centre with AI Feynman via Embedded Physical Biases [1.5] この研究は、物理学に着想を得たAI Feynmanシンボリック回帰アルゴリズムを用いて、天文学の基本方程式を自動的に再発見する。
データ前処理と探索空間制限によってシステムの物理的性質に対応する観測的および帰納的バイアスを導入することにより、AI Feynmanはこの方程式の1次解析形式を月のエフェメライドデータから回復することに成功した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:23:44 GMT)
Robust Object Detection with Pseudo Labels from VLMs using Per-Object Co-teaching [1.5] この研究は、効率的でリアルタイムな物体検出器を訓練するための擬似ラベルを自動的に生成する新しいパイプラインを導入している。
私たちの重要な革新は、VLM生成ラベルに固有のノイズを緩和する、オブジェクトごとのコティーチングベースのトレーニング戦略です。
全体として、私たちのパイプラインは、自律運転のための高性能物体検出器を訓練するための、効率的で堅牢でスケーラブルなアプローチを提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:21:28 GMT)
FocusSDF: Boundary-Aware Learning for Medical Image Segmentation via Signed Distance Supervision [1.5] 符号付き距離関数(SDF)に基づく新しい損失関数であるFocusSDFを導入する。
我々は,基礎モデルであるMedSAMを含む,最先端の5つの医用画像分割モデルに対して評価を行った。
実験結果は、既存の距離変換に基づく損失関数よりもFocusSDFの方が優れた性能を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:49:44 GMT)
From Synthetic Scenes to Real Performance: Enhancing Spatial Reasoning in VLMs [1.5] ファインチューニング・ビジョン・ランゲージ・モデル(VLM)は、アドホックなデータ収集と実世界のシーンのアノテーションに続いて、パフォーマンスを改善するための一般的な戦略である。
我々は、データの生成とそのアノテーションを制御し、バイアス、分散不均衡、アノテーションエラーを回避します。
我々は、最先端のVLMを微調整し、絶対位置タスク上の実世界のデータに対する性能伝達性を評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:07:18 GMT)
An improved clustering-based multi-swarm PSO using local diversification and topology information [1.5] クラスタリングに基づくマルチスワームアルゴリズムは、最も近い粒子を結合してニッチスワムを形成する最も効果的な手法の一つである。
本研究では,ピーク検出率を改善するための2つの改良を提案する。
まず,初期粒子を横断する予備的な局所探索を提案し,各局所領域が粒子の協調に先立って十分にスカウトされるようにした。
次に, 凹凸解析を行う探索的クラスタリング手法を提案し, 単一クラスタ内でのいくつかのサブニッチの可能性を評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:40:40 GMT)
Observation and Manipulation of Optical Parametric Down-Conversion in the Langevin Regime [1.5] チップ上での光パラメトリックダウンコンバージョンを実験的に実現したことを報告する。
揺らぎに本質的に結びついている損失を正確に制御することにより、非対称なHong-Ou-Mandel dipを観察する。
これらの発見は、量子ゆらぎ、量子状態、およびシステム-貯留層相互作用の操作の道を開く。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:39 GMT)
MoCap2Radar: A Spatiotemporal Transformer for Synthesizing Micro-Doppler Radar Signatures from Motion Capture [1.5] 我々は、モーションキャプチャー(MoCap)データからレーダースペクトログラムを合成するための純粋な機械学習プロセスを提案する。
我々は、変換器モデルを用いて、MoCap-to-spectrogram変換をウィンドウ化されたシーケンス-to-Sequenceタスクとして定式化する。
実験により,提案手法は視覚的かつ定量的に測定可能なドップラーレーダ分光図を生成することが示された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:35:14 GMT)
GovScape: A Public Multimodal Search System for 70 Million Pages of Government PDFs [1.5] GovScapeは、連邦政府のPDF10,015,993件のマルチモーダル検索をサポートする公開検索システムである。
本稿では,検索能力,組み込みパイプライン,システムアーキテクチャ,オープンソースなど,GovScapeの構成コンポーネントについて詳述する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:54:48 GMT)
RodEpil: A Video Dataset of Laboratory Rodents for Seizure Detection and Benchmark Evaluation [1.4] そこで我々は,うっ血性事象の自動検出のための実験用歯列のキュレートされたビデオデータセットを紹介した。
データセットには、クリップレベルで正常な活動または発作とラベル付けされた個々のネズミの短い(10秒)トップダウンとサイドビューのビデオクリップが含まれている。
10,101件の陰性サンプルと19人の被験者から採取された2,952件の陽性サンプルを含んでいる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:42:45 GMT)
Real-Time Speech Enhancement via a Hybrid ViT: A Dual-Input Acoustic-Image Feature Fusion [1.4] 音声品質と知性はノイズの多い環境で著しく劣化する。
本稿では,単一チャネル雑音抑圧問題に対処するトランスフォーマーに基づく新しい学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:27:42 GMT)
Why Open Small AI Models Matter for Interactive Art [1.4] このポジションペーパーは、インタラクティブなアートプラクティスのための創造的独立性において、オープンな小さなAIモデルの重要性を論じている。
ローカルにデプロイ可能なこれらのモデルは、支配的な大規模でクローズドソースの企業システムとは異なり、アーティストにインフラストラクチャとコードに対する重要なコントロールを提供する。
本稿では,対話型アートにおけるオープンな小さなAIモデルの利用の実践的応用と意義を考察し,それらをクローズドソースの代替品と対比する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:44 GMT)
DermAI: Clinical dermatology acquisition through quality-driven image collection for AI classification in mobile [1.4] 本稿では,皮膚病変のリアルタイムキャプチャ,アノテーション,分類を可能にするスマートフォンベースの軽量アプリケーションDermAIを紹介する。
DermAI臨床データセットは、幅広い皮膚のトーン、倫理性、ソースデバイスを含んでいる。
予備実験では、公開データセットでトレーニングされたモデルがサンプルに一般化できず、局所データによる微調整により性能が向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:31:51 GMT)
DermAI: Clinical dermatology acquisition through quality-driven image collection for AI classification in mobile [1.4] 本稿では,皮膚病変のリアルタイムキャプチャ,アノテーション,分類を可能にするスマートフォンベースの軽量アプリケーションDermAIを紹介する。
DermAI臨床データセットは、幅広い皮膚のトーン、倫理性、ソースデバイスを含んでいる。
予備実験では、公開データセットでトレーニングされたモデルがサンプルに一般化できず、局所データによる微調整により性能が向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:38 GMT)
Sample-based training of quantum generative models [1.4] 我々は、量子モデルに対する対照的な発散の原理を拡張するトレーニングフレームワークを導入する。
回路構造を導出し、構成のための一般的なレシピを提供することで、パラメータ更新に必要なサンプルを生成する量子回路を得る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:00:02 GMT)
Pretrained Joint Predictions for Scalable Batch Bayesian Optimization of Molecular Designs [1.4] バッチベイズ最適化における結合親和性のスケーラブルな確率的サロゲートを得る方法を示す。
これにより、設計間のヘッジと、それらを近似するために共同予測密度から素早くサンプリングする能力の並列取得関数が要求される。
この研究の鍵となるのは、ENNにおける先行ネットワークの重要性と、下流のパフォーマンスを改善するために合成データでそれらを事前訓練する方法の調査である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:52:01 GMT)
Pretrained Joint Predictions for Scalable Batch Bayesian Optimization of Molecular Designs [1.4] バッチベイズ最適化における結合親和性のスケーラブルな確率的サロゲートを得る方法を示す。
これにより、設計間のヘッジと、それらを近似するために共同予測密度から素早くサンプリングする能力の並列取得関数が要求される。
この研究の鍵となるのは、ENNにおける先行ネットワークの重要性と、下流のパフォーマンスを改善するために合成データでそれらを事前訓練する方法の調査である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:14 GMT)
LiteAttention: A Temporal Sparse Attention for Diffusion Transformers [1.3] LiteAttentionは時間的コヒーレンスを利用して、デノナイジングシーケンスを横断する進化的計算スキップを可能にする。
我々はFlashAttention上に高度に最適化されたLiteAttentionカーネルを実装し、プロダクションビデオ拡散モデルにかなりのスピードアップを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:26:55 GMT)
A Workflow for Full Traceability of AI Decisions [1.3] AIシステムの最先端は、意思決定プロセスの適切なドキュメントに関してほとんど努力しません。
本稿では、自動化された意思決定のトレーニングや推論に進む各コンポーネントのドキュメンテーションを強制することによって、この問題に対して急進的で実践的なアプローチをとる。
これは、AI決定の改ざん、検証、徹底的なトレースの生成をサポートする最初の実行ワークフローを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:10:45 GMT)
How Small Can You Go? Compact Language Models for On-Device Critical Error Detection in Machine Translation [1.3] We benchmark sub-2B model (LFM2-350M, Qwen-3-0.6B/1.7B, Llama-3.2-1B-Instruct, Gemma-3-1B) across WMT21, WMT22, SynCED-EnDe-2025。
我々のフレームワークはプロンプトを標準化し、軽量なロジットバイアス校正と多数決を適用し、セマンティック品質(MCC, F1-ERR/F1-NOT)と計算メトリクス(VRAM,レイテンシ,スループット)の両方を報告する。
Gemma-3-1Bは最高の品質と効率のトレードオフを提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:40 GMT)
History Rhymes: Macro-Contextual Retrieval for Robust Financial Forecasting [1.3] 我々は、歴史的に類似したマクロ経済体制において、各予測を基礎づける検索強化予測フレームワークであるマクロコンテキスト検索を導入する。
AAPL (2024) と XOM (2024) の17年間のS&P 500データ(2007-2023) をトレーニングし, CV と OOD のパフォーマンスギャップを一貫して狭めている。
金融史は繰り返しではなく、しばしば韻律である」という原則を運用することにより、マクロ認識検索が分布変化の下で頑健で説明可能な予測をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:59 GMT)
Multi-Agent Legal Verifier Systems for Data Transfer Planning [1.3] AIによるデータ転送計画における法的コンプライアンスは、厳格なプライバシー規制の下でますます重要になっている。
本稿では,法令解釈,ビジネスコンテキスト評価,リスク評価のために,コンプライアンスチェックを専門エージェントに分解するマルチエージェント法定検証手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:32:08 GMT)
Ordinary lattice defects as probes of topology [1.3] ユビキタスな通常の格子欠陥は、電子ブロッホバンドの非自明な位相の普遍的なプローブとして機能することを示す。
欠陥バウンドの中ギャップモードは、弱い点のような電荷不純物に対して堅牢であることも示されている。
我々の理論と実験を組み合わせた研究は、任意の対称性と次元の結晶においてゲルマンであるべきトポロジーのプローブとして、通常の格子欠陥を定めている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:01:10 GMT)
Towards Usable Privacy Management for IoT TAPs: Deriving Privacy Clusters and Preference Profiles [1.3] IoT Trigger-Action Platforms(TAP)は通常、粗い粒度のパーミッションコントロールを提供する。
本稿では,異なるタイプのユーザに対して,プライバシクラスタとプロファイルを導出することで,TAPのユーザプライバシ管理に寄与する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:08:58 GMT)
Motor Imagery Classification Using Feature Fusion of Spatially Weighted Electroencephalography [1.3] Brain Computer Interface (BCI) は人間の脳と外界を繋ぎ、直接通信路を提供する。
脳波信号は、運動機能活動に関連する認知パターンを反映するために一般的にBCIで使用される。
本研究では,脳領域特異的チャネル選択とマルチドメイン特徴融合に基づく新しい手法を提案し,分類精度を向上する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:36:08 GMT)
Probing universal imaginary-time relaxation critical dynamics with infinite projected entangled pair states [1.3] 2種類の初期状態を持つ臨界点付近での緩和過程について検討する。
完全な偏極状態に対しては、磁化は虚時進化において$Mpropto -/(z)$をスケーリングするパワー法則を示す。
ほぼ常磁性状態の場合、緩和過程は、臨界初期すべり指数である$Mpropto $と$=0. 1958$の振る舞いを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:41:38 GMT)
CLUE: Controllable Latent space of Unprompted Embeddings for Diversity Management in Text-to-Image Synthesis [1.2] テキストと画像の合成モデルは、安定性を維持しながら多様な画像を生成する能力を必要とする。
本稿では,固定形式プロンプトによる安定性を維持しつつ,多様な生成を実現する生成モデルフレームワークであるCLUEを提案する。
その結果、CLUEは限られたデータセットから多種多様な安定な画像生成を可能にし、ドメイン固有のアプリケーションに有効なデータ拡張手法として機能することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:30:58 GMT)
Impacts of Decoder Latency on Utility-Scale Quantum Computer Architectures [1.2] 並列空間と時間ウィンドウの復号法に基づいて,デコーダの遅延を再現する反応時間モデルを構築した。
反応時間に関して論理的マイクロアーキテクチャをどのように最適化できるかを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:43 GMT)
How Data Quality Affects Machine Learning Models for Credit Risk Assessment [1.2] 信用リスク評価に使用される機械学習モデルの予測精度に及ぼすデータ品質問題の影響について検討する。
実験により,データ劣化の性質と重大性に基づくモデルロバスト性に有意な差異が認められた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:18:43 GMT)
Constructing Political Coordinates: Aggregating Over the Opposition for Diverse News Recommendation [1.2] ニュースレコメンデーターシステム(NRS)は、政治の混乱と情報過負荷を最小限に抑えるのに有用であることが示されている。
NRSは、読者の関心を記事の読み史における党派的偏見と区別することが多い。
相互作用の延長により、これはフィルターバブルの形成とユーザパルチザンの分極をもたらす。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:04:04 GMT)
From Retinal Pixels to Patients: Evolution of Deep Learning Research in Diabetic Retinopathy Screening [1.2] 糖尿病網膜症(DR)は予防可能な失明の主要な原因であり、早期発見は世界中で視力喪失を減少させるのに重要である。
ディープラーニングはDRスクリーニングを転換し、プライベートデータセットでトレーニングされた初期の畳み込みニューラルネットワークから、クラスの不均衡、ラベルの不足、ドメインシフト、解釈可能性に対処する高度なパイプラインへと進化した。
このサーベイは、2016-2025年のDR研究を初めて体系的に合成し、50以上の研究と20以上のデータセットから結果を統合した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:31:42 GMT)
Regular Games -- an Automata-Based General Game Playing Language [1.2] 規則ゲーム(RG)と呼ばれる新しい汎用ゲームプレイング(GGP)システムを提案する。
RGの主な目標は、計算効率が良く、ゲーム設計に便利なことである。
RGのエコシステムには、LSPを使ったエディタ、自動視覚化、ベンチマークツール、ゲーム記述変換のデバッガが含まれる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:17 GMT)
FLEX: Feature Importance from Layered Counterfactual Explanations [1.2] FLEX (Feature importance from Layered counterfactual Explanations) は,反事実の集合を特徴変化頻度スコアに変換するモデルおよびドメインに依存しないフレームワークである。
交通事故の重大度予測とローン承認の2つの対照的なタスクにおいてFLEXを評価し、FLEXとSHAPとLIMEの特徴重要度を比較した。
その結果, (i) FLEXのグローバルランキングは, (i) 追加ドライバを仮定しながらSHAPと相関し, (ii) 地域分析により, グローバルサマリーが見逃す文脈特異的要因が明らかになった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:48:24 GMT)
Epistemic Error Decomposition for Multi-step Time Series Forecasting: Rethinking Bias-Variance in Recursive and Direct Strategies [1.1] 予測される多段階予測誤差を,既約雑音,構造近似ギャップ,推定分散項の3つの部分に分解する。
線形予測器の場合、構造的ギャップは任意のデータセットに対してゼロであることを示す。
しかし、非線形予測器では、再帰に使用される繰り返し合成はモデル表現性を高めることができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:32:42 GMT)
Anomaly Detection in High-Dimensional Bank Account Balances via Robust Methods [1.1] ロバスト統計は、外れ値のフラグ付けとデータ分散パラメータの推定に有用である。
中高次元および高次元のデータセットにおいて計算効率が良いいくつかの頑健なアプローチを実証的に提案し,評価する。
当社のアプリケーションは、匿名ユーザの銀行口座残高の日次記録を約260万件処理しています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:19:26 GMT)
Unlocking Advanced Graph Machine Learning Insights through Knowledge Completion on Neo4j Graph Database [1.1] 本稿では,GDB-GMLアプリケーションに知識補完フェーズを統合する革新的なアーキテクチャを提案する。
隠れた知識を明らかにすることがデータセットの振る舞いやメトリクスにどのように影響するかを示します。
実験結果から,我々の直観はトポロジと全体データセットのダイナミックスの両方に大きく反することがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:27:31 GMT)
Error-Mitigation Enabled Multicomponent Quantum Simulations Beyond the Born-Oppenheimer Approximation [1.1] 分子系の量子シミュレーションのための多成分一元結合クラスタフレームワークを提案する。
我々は、水素化ポジトロニウムと水素水素の量子陽子によるmcUCCアンスターゼを構築し、異なる励起トランケーションのハードウェア要件を分析する。
その結果,量子ハードウェア上での誤差緩和型多成分相関シミュレーションの最初の実証結果が得られた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:31:40 GMT)
Diffusion annealed Langevin dynamics: a theoretical study [1.1] 生成モデル理論において最近導入されたスコアベース拡散過程について検討した。
ポアンカレの不等式を対数的ソボレフ不等式にするとモデルの効率が向上することを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:29 GMT)
National Institute on Aging PREPARE Challenge: Early Detection of Cognitive Impairment Using Speech -- The SpeechCARE Solution [1.0] アルツハイマー病と関連する認知症は、60歳以上の成人の5人に1人に影響を与えるが、認知低下した人の半数以上が未診断のままである。
SpeechCAREは、認知障害に関連する微妙な音声関連手がかりをキャプチャするマルチモーダル音声処理パイプラインである。
その堅牢な前処理には、自動転写、大規模言語モデル(LLM)に基づく異常検出、タスク識別が含まれる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:29 GMT)
Prompt Engineering vs. Fine-Tuning for LLM-Based Vulnerability Detection in Solana and Algorand Smart Contracts [1.0] 本稿では,大規模言語モデル(LLM)がスマートコントラクトの脆弱性を検出する能力について検討する。
SolanaとAlgorandのスマートコントラクトエコシステムに注力しています。
この結果から,LLMに基づくアプローチはスマートコントラクトの静的脆弱性検出に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:50:36 GMT)
Go-UT-Bench: A Fine-Tuning Dataset for LLM-Based Unit Test Generation in Go [1.0] GO UT Benchは、5264のコードとユニットテストのベンチマークデータセットである。
以上の結果から,精細化されたモデルは,75%以上のベンチマークタスクにおいて,ベースモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:35:00 GMT)
SeQuant Framework for Symbolic and Numerical Tensor Algebra. I. Core Capabilities [1.0] SeQuant は可換(スカラー)環と非可換(演算)環上のテンソルのシンボリック代数のオープンソースライブラリである。
その機能の大部分をサポートする重要な革新は、グラフ理論テンソルネットワーク標準化器である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:20:19 GMT)
RodEpil: A Video Dataset of Laboratory Rodents for Seizure Detection and Benchmark Evaluation [0.9] そこで我々は,うっ血性事象の自動検出のための実験用歯列のキュレートされたビデオデータセットを紹介した。
データセットには、クリップレベルで正常な活動または発作とラベル付けされた個々のネズミの短い(10秒)トップダウンとサイドビューのビデオクリップが含まれている。
10,101件の陰性サンプルと19人の被験者から採取された2,952件の陽性サンプルを含んでいる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:09 GMT)
Sheaf Cohomology of Linear Predictive Coding Networks [0.9] 予測符号化(PC)は、グローバルなバックプロパゲーションを重みとアクティベーションの局所的な最適化に置き換える。
線形PCネットワークはセルシーブとして自然な定式化を許すことを示す。
フィードバックループが内部矛盾を生じさせる再帰的トポロジを解析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:11:38 GMT)
VLF-MSC: Vision-Language Feature-Based Multimodal Semantic Communication System [0.9] Vision-Language Feature-based Multimodal Semantic Communication (VLF-MSC) は、単一の視覚言語表現を送信し、受信機での画像生成とテキスト生成をサポートする統一システムである。
基礎モデルを活用することにより,意味的忠実性を維持しつつ,チャネルノイズに対する堅牢性を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:30:32 GMT)
Hail to the Thief: Exploring Attacks and Defenses in Decentralised GRPO [0.9] 本稿では,分散GRPOにおける最初の敵攻撃について述べる。
敵の攻撃は、訓練後の良性ノードに容易に毒を塗布でき、攻撃成功率は最大で50回の反復で100%に達することが示される。
我々は、すべてのユーザが同じモデルをトレーニングしているか、異なるモデルをトレーニングするかによって、これらの攻撃を防御する方法を2つ提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:30 GMT)
CAT-Net: A Cross-Attention Tone Network for Cross-Subject EEG-EMG Fusion Tone Decoding [0.9] 本稿では,新たなクロスオブジェクトマルチモーダルBCIデコーディングフレームワークを提案する。
脳波とEMG信号を融合させ、4つのマンダリン音を可聴音と無声音の両方で分類する。
脳波-EMGチャネルを最小化したトーンレベルのデコーディングは,被験者間で実現可能であり,潜在的に一般化可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:50:54 GMT)
Improving Continual Learning of Knowledge Graph Embeddings via Informed Initialization [0.9] 多くのKG(Knowledege Graphs)が頻繁に更新され、KGE(Knowledege Graph Embeddings)がこれらの変更に対応せざるを得なくなった。
この問題に対処するため、KGEの継続学習技術は、新しいエンティティへの埋め込みを取り入れ、古いエンティティを更新する。
我々は,KGEの既存の継続学習手法にシームレスに統合可能な,新しい情報埋め込み戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:48:24 GMT)
Leveraging Exogenous Signals for Hydrology Time Series Forecasting [0.8] 本研究は,水文降雨流出モデルのための時系列モデルにドメイン知識を統合する役割について考察する。
671箇所の降雨・流出データを含むCAMELS-USデータセットを用いて,ベースラインモデルと基礎モデルを比較した。
その結果, 包括的入力を含むモデルは, 基礎モデルを含むより限定的なアプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:12:29 GMT)
Simplicial covering dimension of extremal concept classes [0.8] トポロジカル次元の概念(ルベーグ被覆)を二項概念クラスに適用する。
有限概念クラスに対して、この単純被覆次元がリストの複製可能性数を正確に特徴付けることを証明する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:20:59 GMT)
Assessing Finite Scalability in Early Fault-Tolerant Quantum Computing for Homogeneous Catalysts [0.8] 量子プロセッサがサイズと深さをスケールする能力は、達成可能なパフォーマンスを形作る重要な要素となっている。
本研究では, 開殻触媒系のシミュレーションにおいて, 有限スケーラビリティが資源要求に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:48:42 GMT)
Navigating the Ethics of Internet Measurement: Researchers' Perspectives from a Case Study in the EU [0.8] プライバシーと同意の問題、意図しない害の可能性、セキュリティと説明責任との透明性のバランス、不確実な倫理的境界、倫理的レビュープロセスのハードルである。
研究者は、倫理的要件は機関、司法、会議によって異なっており、倫理審査委員会はインターネット測定研究を評価するための技術知識を欠いていることが多い。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:49:35 GMT)
One-Shot Transfer Learning for Nonlinear PDEs with Perturbative PINNs [0.8] 非線形偏微分方程式を解くための枠組みを提案する。
i) 非線形ODEからPDEへのワンショット変換学習の拡張、(ii) 新しいPDEインスタンスに適応するためのクローズドフォームソリューションの導出、(iii) 正準非線形PDEの精度と効率の実証である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:12:50 GMT)
Community-Aligned Behavior Under Uncertainty: Evidence of Epistemic Stance Transfer in LLMs [0.8] ロシアとウクライナの軍事談話と米国のパルチザンのTwitterデータを用いて、一致したLLMは不確実性に対処するための安定したコミュニティ固有の行動パターンを維持していることがわかった。
これらの結果は、アライメントが表面の模倣を越えて構造化され、一般化可能な振る舞いを符号化する証拠となる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:04:52 GMT)
Multi-Horizon Time Series Forecasting of non-parametric CDFs with Deep Lattice Networks [0.8] 時系列予測における単調に制約された同時/単純量子化回帰に対する深層格子ネットワーク(DLN)への適応を提案する。
実験の結果,DLNの適応性は,制約のないアプローチと同等かそれ以上に優れていることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:06:34 GMT)
Say It Differently: Linguistic Styles as Jailbreak Vectors [0.8] 我々は、恐怖や好奇心などの言語スタイルが有害な意図を再構築し、整列モデルから安全でない反応を誘発する方法について研究する。
3つの標準データセットからのプロンプトを11の異なる言語スタイルに変換することで、スタイル拡張されたjailbreakベンチマークを構築する。
恐怖、好奇心、慈悲心といったスタイルは最も効果的で、文脈化された書き直しはテンプレート化されたバリエーションよりも優れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:59 GMT)
On the Measure of a Model: From Intelligence to Generality [0.8] ARC、Ravenにインスパイアされたテスト、Blackbird Taskなどのベンチマークは、大規模言語モデル(LLM)のインテリジェンスを評価するために広く使われている。
しかし、インテリジェンスの概念は、安定した定義が欠如しており、質問応答や要約、コーディングといった実践的なタスクのパフォーマンスを予測できない。
我々の見解では、評価は抽象的な知性の概念よりも一般性に根ざすべきである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:46:48 GMT)
Building the Web for Agents: A Declarative Framework for Agent-Web Interaction [0.7] 我々は、WebサイトがAIエージェントの信頼性、監査可能、プライバシ保護機能を公開できるWebネイティブフレームワークVOIXを紹介した。
VOIXはツール>とコンテキスト>タグを導入し、開発者は利用可能なアクションと関連する状態を明確に定義できる。
16人の開発者を対象とした3日間のハッカソン研究で,本フレームワークの実用性,学習性,表現性を評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:23:34 GMT)
Chatsparent: An Interactive System for Detecting and Mitigating Cognitive Fatigue in LLMs [0.7] 認知疲労を表面化し緩和するインタラクティブなデモを紹介する。
当社のシステムはChatsparent, リアルタイム, トークンレベルの疲労信号, 注目とプロンプトの崩壊, 埋め込みドリフト, エントロピー崩壊を計測する。
インタフェースにより、ユーザーは注意リセット、エントロピー規則化された復号化、自己回帰チェックポイントなどの軽量な介入を起動することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:08:53 GMT)
Short-Window Sliding Learning for Real-Time Violence Detection via LLM-based Auto-Labeling [0.7] 本稿では,CCTV映像におけるリアルタイム暴力検出のためのショートウィンドウスライディング学習フレームワークを提案する。
提案手法は,動画を1~2秒のクリップに分割し,Large Language Model(LLM)に基づく自動キャプションラベリングを適用し,詳細なデータセットを構築する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:29:31 GMT)
Multi-View Polymer Representations for the Open Polymer Prediction [0.7] 相補表現を利用した多視点設計により, 高分子特性の予測に対処する。
本システムでは, (i) RDKit/Morgan記述子, (ii) グラフニューラルネットワーク, (iii) 3次元インフォームド表現, (iv) 事前訓練されたSMILES言語モデルという4つのファミリーを統合した。
このアプローチは、NeurIPS 2025で開かれたOpen Polymer Prediction Challengeで2241チーム中9位にランクインした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:14:07 GMT)
One-to-N Backdoor Attack in 3D Point Cloud via Spherical Trigger [0.7] 我々は,新しい球面トリガに基づく3次元視覚のための最初の1対Nのバックドア・フレームワークを提示する。
我々は3Dで1対Nのバックドア攻撃の理論的基盤を確立し、有害なモデルが異なるターゲットラベルに異なるトリガー構成をマッピングできることを実証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:10:22 GMT)
Deep Learning for Short-Term Precipitation Prediction in Four Major Indian Cities: A ConvLSTM Approach with Explainable AI [0.7] インドの主要都市4都市において,短期降水予測のための解釈可能なディープラーニングフレームワークを開発した。
根平均二乗誤差(RMSE)は0.21mm/日(ベンガル)、0.52mm/日(ムンバイ)、0.48mm/日(デルヒ)、1.80mm/日(コルカタ)である。
この研究は、様々な都市環境における降水パターンに対する正確な予測と透明な洞察を提供するための説明可能なAI(xAI)の方法を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:30:01 GMT)
Automatic Grid Updates for Kolmogorov-Arnold Networks using Layer Histograms [0.6] Kolmogorov-Arnold Networks (KAN)は、近年の論文で注目を集めているニューラルネットワークのクラスである。
Kansはパラメータ化された訓練可能なアクティベーション関数を活用し、解釈可能性の向上やシンボル方程式の学習精度の向上など、いくつかの利点を提供している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:30 GMT)
Towards Autoformalization of LLM-generated Outputs for Requirement Verification [0.6] 非公式な文を形式論理に翻訳するプロセスであるオートフォーマル化は、強力な大規模言語モデルの出現により、新たな関心を集めている。
本稿では,LLMをベースとした簡易なオートフォーマライザを用いて,LLM生成した出力を少数の自然言語要求に対して検証する。
この結果から, LLM出力の完全性と論理的整合性を確保する上で, 自己形式化が有意な可能性を示唆した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:45:17 GMT)
Volatility in Certainty (VC): A Metric for Detecting Adversarial Perturbations During Inference in Neural Network Classifiers [0.6] ニューラルネットワーク分類器をデプロイする上で、相反する堅牢性は依然として重要な課題である。
本稿では,モデル信頼度における不規則性を定量化するラベルフリー計量であるtextitVolatility in Certainty (VC)について検討する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:51:04 GMT)
From Local Nonclassicality to Entanglement: A Convexity Law for Single-Excitation Dynamics [0.6] 我々は励起保存相互作用に対する単純な力学則を証明した。
局所的なウィグナー負の和は、初期励起状態によって設定された固定予算によって上界される。
要約された局所負性率の予測軌道は、実用的なハードウェア計量を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:13 GMT)
Masking criteria for selecting an imputation model [0.5] マスキング・ワン・アウト(MOO: masking-one-out)は、観測されたエントリをマスキングし、インプットされた値と比較する手法である。
本稿では,この手順の最適性について検討し,欠落したデータ仮定に一般化する。
データの性質を適切に考慮した計算モデルを選択することができるように、ランク変換、エネルギー距離、可能性原理に基づく3つの修正MOO基準を導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:28:40 GMT)
Compiling to linear neurons [0.5] ニューラルネットワークを直接プログラムするわけではない。代わりに、学習アルゴリズムがデータから学習することでニューラルネットワークの機能を決定する、間接的なスタイルに依存している。
これらのアルゴリズムがネットワークの学習に役立つとしても、ほとんどのアルゴリズムをニューラルネットワークにコンパイルすることはできない。
型付きで高階の線形プログラミング言語であるtextsfCajal$を紹介します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:19:50 GMT)
Belief Net: A Filter-Based Framework for Learning Hidden Markov Models from Observations [0.5] この研究は、勾配に基づく最適化を通じて隠れマルコフモデルを学ぶ新しいフレームワークであるBelief Netを紹介している。
ブラックボックストランスフォーマーモデルとは異なり、Belief Netの学習可能なウェイトは、初期分布、遷移行列、放出行列のロジットである。
合成HMMデータにおいて、Belief NetはBaum-Welchに比べて収束速度が優れ、不完全条件と過完全条件の両方でパラメータの回復に成功している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:17 GMT)
A Systematic Analysis of Out-of-Distribution Detection Under Representation and Training Paradigm Shifts [0.5] 本稿では,CLIP層間におけるアウト・オブ・ディストリビューション(OOD)検出手法の系統的比較について述べる。
実験では、スクラッチから訓練されたCNNと微調整された視覚変換器(ViT)の2つの表現パラダイムをカバーしている。
学習した特徴空間がOODの有効性を決定づけていることが判明した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:18:13 GMT)
Enhancing Password Security Through a High-Accuracy Scoring Framework Using Random Forests [0.5] 4つの機械学習モデルを比較し,パスワード強度スコアリングシステムの実装と評価を行った。
私たちの主な貢献は、標準メトリクスで見逃されたニュアンスのある脆弱性をキャプチャする、新しいハイブリッド機能エンジニアリングアプローチです。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:35 GMT)
Variable Neighborhood Search for the Electric Vehicle Routing Problem [0.5] EVRP(Capacitated Green Vehicle Routing Problem、CGVRP)は、2020年のIEEE World Congress on Computational Intelligenceにおいて開催されたCEC-12コンペティションの焦点である。
本稿では,変数近傍探索(VNS)メタヒューリスティックに基づいて,競争に勝つアプローチを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:19 GMT)
Large-scale modality-invariant foundation models for brain MRI analysis: Application to lesion segmentation [0.5] 大規模ファンデーションモデル事前トレーニングは、神経イメージングタスクにおける数ショットのパフォーマンスを改善する解剖学の事前学習を可能にする。
ほとんどのSSLフレームワークは自然画像に適合しており、マルチモーダルMRI情報をキャプチャするための適応はいまだに未調査である。
本研究は, モダリティ不変な表現学習装置を提案し, 脳卒中とてんかん病変のセグメンテーションにおけるその有効性を評価する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:56:07 GMT)
SoK: Security Evaluation of Wi-Fi CSI Biometrics: Attacks, Metrics, and Systemic Weaknesses [0.5] Wi-Fi Channel State Information (CSI) はバイオメトリック・モダリティとして何度も提案されてきた。
このSoKは、セキュリティの観点からCSIベースの生体認証を調べ、センサーインフラストラクチャ間で既存の作業がどのように異なるかを分析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:04:22 GMT)
Multimodal Posterior Sampling-based Uncertainty in PD-L1 Segmentation from H&E Images [0.5] 本稿では,H&E染色組織像から直接PD-L1の発現を推定するベイズ分類フレームワークnnUNet-Bを提案する。
肺扁平上皮癌のデータセットを用いて,本手法は確立された基線に対する競合性を示す。
これらの結果は、不確実性を考慮したH&EベースのPD-L1予測が、スケーラブルで解釈可能なバイオマーカー評価への有望なステップであることを示唆している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:05:13 GMT)
DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting [0.5] 本稿では,確率的降雨今流への競争的かつ効率的なアプローチを提案する。
予め訓練された衛星ビジョンエンコーダにビデオプロジェクタを取り付け、エンコーダトークンを4時間蓄積した降雨の離散的なCDFにマッピングする。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025ベンチマークにおいて、提案手法は、最高の3D-UNETに対して26%の効率向上を示す 3.5102 (CRPS) のCRPSで有望な性能を達成した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:14:08 GMT)
Maximizing Efficiency of Dataset Compression for Machine Learning Potentials With Information Theory [0.5] 機械学習原子間ポテンシャル(MLIP)は密度汎関数理論計算と比較して高い精度と低コストのバランスをとる。
大規模なデータセットはモデルの精度と一般化を改善するが、生産と訓練には計算コストがかかる。
我々は,データセット圧縮手法の効率を定量化する情報理論フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:45 GMT)
Neuronal Fluctuations: Learning Rates vs Participating Neurons [0.5] 本研究では,ニューラルネットワークにおける学習速度の変化が重みやバイアス変動の大きさや特性に与える影響を系統的に検討する。
本研究の目的は,学習率の価値,結果のゆらぎパターン,モデル全体の性能の明確な関連性を確立することである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:21 GMT)
MP-GFormer: A 3D-Geometry-Aware Dynamic Graph Transformer Approach for Machining Process Planning [0.4] 本稿では,3次元幾何学的表現をDGLに統合した3次元幾何学的動的グラフMP-GFormerを提案する。
本手法では,初期3次元設計における境界表現法を用いて,各加工操作後の部分の3次元形状を表すステレオリソグラフィ表面メッシュを利用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:58:39 GMT)
Local arrows of time in quantum many-body systems [0.4] 時間的局所矢印は、ハミルトン進化によって誘導される大域的時間$t$と異なることがある。
量子多体系内では、時間の流れは各観測者または各局所サブシステムに対して相対的である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:07 GMT)
Beyond the Laplacian: Interpolated Spectral Augmentation for Graph Neural Networks [0.4] 補間ラプラシアン埋め込み (iles) はグラフ行列の単純かつ表現力のある族に由来する。
私たちの研究は、ノード機能に制限がある場合に、実践者のスペクトル拡張ツールキットを拡張する、単純で実践的なアプローチを提供します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:11:22 GMT)
Towards Emotionally Intelligent and Responsible Reinforcement Learning [0.4] 本稿では,感情的・文脈的理解と倫理的考察を統合したレスポンシブル強化学習フレームワークを提案する。
本稿では,短期的行動参加と長期的ユーザの幸福感のバランスをとる多目的報酬関数を提案する。
本稿では, 行動保健, 教育, デジタル治療など人間中心の領域におけるこのアプローチの意義について論じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:19 GMT)
Improved Offline Reinforcement Learning via Quantum Metric Encoding [0.4] 限られたサンプルを持つ強化学習(RL)は、現実世界の応用では一般的である。
量子メートル法(QME)を導入することで,限られたサンプルを扱う方法を考える。
この方法論では、RLフレームワークを元の状態と報酬に直接適用するのではなく、状態をよりコンパクトで意味のある表現に埋め込む。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:55 GMT)
Explainable Deep Convolutional Multi-Type Anomaly Detection [0.4] ほとんどの説明可能な異常検出法は、しばしば異常を識別するが、異常の種類を区別する能力は欠如している。
提案するMultiTypeFCDDは,説明可能な多型異常検出のための実用的な代替手段として設計された,シンプルで軽量な畳み込みフレームワークである。
提案手法をReal-IADデータセット上で評価し,最先端の複雑なモデルと競合する結果をもたらす。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:04:34 GMT)
PepTriX: A Framework for Explainable Peptide Analysis through Protein Language Models [0.4] PepTriXは1次元(1D)配列の埋め込みと3次元(3D)構造特徴をグラフアテンションネットワークを介して統合する新しいフレームワークである。
予測的堅牢性と解釈可能なバリデーションの両方を提供し、パフォーマンス駆動ペプチドレベルモデル(PLM)とペプチド研究におけるドメインレベルの理解のギャップを埋める。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:08 GMT)
CephRes-MHNet: A Multi-Head Residual Network for Accurate and Robust Cephalometric Landmark Detection [0.4] 本稿では,多頭部残差畳み込みネットワークであるCephRes-MHNetについて紹介する。
Aarizometric data of 1,000 radiographsで訓練され、CephRes-MHNetは平均半径誤差(MRE)が1.23mm、成功検出率(SDR)が85.5%に達した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:08 GMT)
General quantum backflow in realistic wave packets [0.3] 量子バックフロー(Quantum backflow)は、量子粒子の確率密度がその運動量に対して伝播する反直感現象である。
任意の運動量分布に適用可能な量子逆流の一般的な定式化を導入する。
この過剰は13%近くに達することができ、標準のバックフローを3倍以上上回っていることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:35:47 GMT)
Soiling detection for Advanced Driver Assistance Systems [0.3] 自動車用カメラの土壌検出は、高度な運転支援システムの重要な部分である。
本稿では,土壌検出を意味的セグメンテーション問題とみなす。
タイルレベルの分類手法と比較しながら,性能上の優位性を示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:14 GMT)
Knowledge Graphs Generation from Cultural Heritage Texts: Combining LLMs and Ontological Engineering for Scholarly Debates [0.3] 本稿では,大規模言語モデルに基づく知識抽出のための体系的5段階手法であるATR4CHを紹介する。
本研究は,信頼性評価に関する議論のケーススタディを通じて,方法論の検証を行う。
ATR4CHは、文化遺産機関がテキスト知識をクエリ可能な知識グラフに体系的に変換することを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:46:52 GMT)
CORE - A Cell-Level Coarse-to-Fine Image Registration Engine for Multi-stain Image Alignment [0.3] COREは、多様なマルチモーダル全スライディング画像(WSI)データセット間の正確な核レベル登録のための粗大なフレームワークである。
発光顕微鏡および免疫蛍光顕微鏡WSIの一般性,精度,ロバスト性の観点から,COREは現在の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:45 GMT)
Do LLMs Give Good Romantic Relationship Advice? A Study on User Satisfaction and Attitude Change [0.3] 大きな言語モデル(LLM)は、ロマンチックな関係のような個人的なドメインでのサポートとアドバイスを提供するために、ますます使われています。
本研究は, LLM生成のロマンチックな関係において, 人々がいかにアドバイスを評価するかを検討した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 05:19:14 GMT)
Evolution of A4L: A Data Architecture for AI-Augmented Learning [0.3] AI強化学習のためのアーキテクチャ(A4L)は、成人学習者のためのオンライン教育の分析とパーソナライズを支援する。
データパイプラインには、データ取り込み、前処理、組織化、分析、可視化のためのモジュールが含まれている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:12:37 GMT)
Ethical conundrums: Hacked data in the study of far-right violent extremism [0.3] この記事は、オンラインの極右暴力的過激主義を調査するためにハックされたデータを利用することを考える際に生じた倫理的議論の概要を概説する。
特定の状況下では、研究者はハッキングされたデータを使って倫理的な研究ができると主張している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:27:09 GMT)
Quantum Period-Finding using One-Qubit Reduced Density Matrices [0.3] 量子周期フィニング(QPF)アルゴリズムは、よく知られた古典的アルゴリズムよりも指数関数の周期を高速に計算することができる。
ここでは、QPFに対する異なるアプローチについて検討する。
以上の結果から,1-RDMは1-O(n)=1-qubitの限界値として$-$であり,周期を再構築するのに十分な情報を含んでいることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:17:13 GMT)
Oya: Deep Learning for Accurate Global Precipitation Estimation [0.3] 本研究は、静止衛星(GEO)からの可視・赤外観測の全スペクトルを利用した、新しいリアルタイム降水探索アルゴリズムであるOyaを紹介する。
Oyaは2段階の深層学習アプローチを採用し、降水検知と量的降水推定(QPE)という2つのU-Netモデルを組み合わせて、雨と無雨のイベントの固有のデータ不均衡に対処している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:48 GMT)
Scaling Open-Weight Large Language Models for Hydropower Regulatory Information Extraction: A Systematic Analysis [0.3] 大規模言語モデルを用いた規制文書からの情報抽出は、性能と計算資源間の重要なトレードオフを示す。
実験的な展開ガイダンスを提供するために,水力ライセンス文書上で7つのオープンウェイトモデル(0.6B-70Bパラメータ)を評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:23:25 GMT)
zkStruDul: Programming zkSNARKs with Structural Duality [0.2] zkStruDulは、入力変換を統一し、定義を単一の複合抽象化に述語する言語である。
我々は、ソースレベルのセマンティクスを提供し、その振る舞いが予測されたセマンティクスと同一であることを証明する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:08 GMT)
Multiple Treatments Causal Effects Estimation with Task Embeddings and Balanced Representation Learning [0.2] 治療の組み合わせから生じる単一治療効果と相互作用治療効果を推定することが重要である。
従来の研究では、対話のための独立した成果ネットワークを用いた研究が提案されている。
本稿では,タスク埋め込みネットワークと,バランスペナルティを備えた表現学習ネットワークを組み込んだ新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:54 GMT)
Tight Robustness Certification through the Convex Hull of $\ell_0$ Attacks [0.2] 画像のいくつかのピクセルを変更することで、ロバスト性検証器を誤認する画素は少ない。
凸船体上の境界を正確に計算する線形境界伝播を示す。
この有界伝播は、最も挑戦的なベンチマークで最先端の検証器を1.24x-7.07xスケールし、幾何学平均は3.16である。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:29 GMT)
Variational Quantum Algorithms for Particle Track Reconstruction [0.2] 複数層検出システムにおける直線トラック識別のための2つの異なる定式化法について検討する。
第1のアプローチは基底状態エネルギー問題として定式化され、第2のアプローチは線形方程式のシステムとして定式化される。
そこで我々はモンテカルロ木探索に基づく量子アーキテクチャ探索法を用いて量子回路の設計を行った。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:24:59 GMT)
TrackHHL: A Quantum Computing Algorithm for Track Reconstruction at the LHCb [0.2] 将来の高輝度LHC時代において、高エネルギー物理実験は、事象再構成のための前例のない計算課題に直面している。
本稿では,行列逆転を用いた荷電粒子軌道再構成のための新しい手法について検討する。
線形系に対するHHL(Harrow-Hassidim-Lloyd)量子アルゴリズムのエクスプロイトは、古典的な入力ヒット数に対する指数的な高速化を約束している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:31:14 GMT)
Robust Bidirectional Associative Memory via Regularization Inspired by the Subspace Rotation Algorithm [0.2] 双方向バックプロパゲーション (B-BP) で訓練された双方向連想記憶 (BAM) は、しばしば頑健さが悪く、ノイズや敵の攻撃に対する高い感度に悩まされる。
本稿では,BAMの頑健性と収束性を大幅に向上させる,新しい勾配なし学習アルゴリズムである双方向部分空間回転アルゴリズム(B-SRA)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:15:07 GMT)
EnvTrace: Simulation-Based Semantic Evaluation of LLM Code via Execution Trace Alignment -- Demonstrated at Synchrotron Beamlines [0.2] EnvTraceは、セマンティックコード等価性を評価するために実行トレースを評価するシミュレーションベースの手法である。
計器制御符号の評価を容易にするために、ビームライン制御論理デジタルツインを用いて実証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:08 GMT)
Learning to Refine: An Agentic RL Approach for Iterative SPARQL Query Construction [0.2] 現在のメソッドでは、リアルタイム実行フィードバックに基づいてクエリを動的にデバッグするために必要なアダプティブポリシーが欠如している。
本稿では,LLMが繰り返しSPARQL構築のシーケンシャルなプロセスに対してレジリエントなポリシーを学習する,新しいエージェント・フレームワークを提案する。
結果駆動型強化学習(GRPO)によってのみ訓練されたコンパクトな3B-パラメータモデルが,このタスクの効果的なポリシを学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:44:58 GMT)
AI Annotation Orchestration: Evaluating LLM verifiers to Improve the Quality of LLM Annotations in Learning Analytics [0.2] 大規模言語モデル(LLM)は、学習相互作用の注釈付けにますます使われていますが、信頼性に関する懸念は彼らのユーティリティを制限します。
検証指向のオーケストレーション・プロンプティングモデルが自身のラベル(自己検証)をチェックしたり、相互に監査(相互検証)するかどうかを検証し、学習談話の質的コーディングを向上させるかを検証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:38 GMT)
Advancing Annotat3D with Harpia: A CUDA-Accelerated Library For Large-Scale Volumetric Data Segmentation [0.1] この作業は、Harpiaを通じてAnnotat3Dに新しい機能を導入している。
このライブラリは、スケーラブルでインタラクティブなセグメンテーションをサポートし、大規模3Dデータセットをハイパフォーマンスコンピューティングでサポートするように設計されている。
このシステムのインタラクティブなヒューマン・イン・ザ・ループインタフェースは、効率的なGPUリソース管理と組み合わせて、特に協調的な科学的イメージングに適している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 21:45:02 GMT)
Adaptive Intrusion Detection for Evolving RPL IoT Attacks Using Incremental Learning [0.1] RPLネットワークにおける侵入検知のための実践的かつ適応的な手法としてインクリメンタルラーニングを検討する。
我々の分析では、漸進的な学習が新たな攻撃クラスの検出性能を回復し、以前に学習した脅威の破滅的な忘れを緩和することを強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:35:48 GMT)
Vector magnetometry using cavity-enhanced microwave readout in nitrogen-vacancy diamond [0.1] 電子レンジ(MW)キャビティに結合した単結晶ダイヤモンド中の窒素空孔(NV)中心のアンサンブルを用いた4ドルのステラディアンベクトル磁場センシング。
MWキャビティはスピン光子カップリングを強化し、MW尋問による高速かつ高コントラストなスピン状態読み出しを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:54:05 GMT)
Bridging Local and Federated Data Normalization in Federated Learning: A Privacy-Preserving Approach [0.1] データを複数のパーティに分散したフェデレーション学習では、正規化がユニークな課題を提示します。
従来のメソッドは、独立したクライアントサイド処理か、パーティに配布する前にデータセット全体を正規化します。
フェデレートされた設定に合わせた、新しい同型暗号化された$k$-thランキング要素(および中央値)の計算を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:48:58 GMT)
Improving Graduate Outcomes by Identifying Skills Gaps and Recommending Courses Based on Career Interests [0.1] 本稿では,コースレコメンデーションシステムの設計と開発について述べる。
データ分析技術と機械学習アルゴリズムを使用して、現在の業界動向や要件に沿ったコースを推奨する。
提案システムは,生涯学習や職業的進歩を促進する上で,学生,インストラクター,キャリアアドバイザーにとって有用なツールとなる可能性がある。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:05 GMT)
Learning Fair Representations with Kolmogorov-Arnold Networks [0.1] 予測モデルは、しばしば辺縁化群に対する差別的行動を示す。
現在の公正学習モデルはバイアスを軽減することを目的としているが、公平性と正確性の間の最適なトレードオフを達成することは依然として課題である。
本稿では,KAN(Kolmogorov-Arnold Networks)を公正な対角学習フレームワークに統合することにより,これらの問題を回避しようとしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:51:56 GMT)
Cooling the Sachdev-Ye-Kitaev model using thermofield double states [0.1] 我々は、Sachdev-Ye-Kitaevモデル(SYK)を低温に冷却するためのシンプルで効率的なプロトコルを解析する。
本稿では, 冷却プロトコルの有効性を顕微鏡的に説明するための固有状態熱化に基づく理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:44 GMT)
AI Agent-Driven Framework for Automated Product Knowledge Graph Construction in E-Commerce [0.1] 本稿では、非構造化製品記述から直接製品知識グラフを構築するための、完全に自動化されたAIエージェント駆動フレームワークを紹介する。
本研究では,実環境におけるエアコン製品記述のデータセットを用いて評価を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:09:13 GMT)
A Large-Scale Collection Of (Non-)Actionable Static Code Analysis Reports [0.1] 静的コード分析(SCA)ツールは、しばしば圧倒的な数の警告を発生させます。
この過剰なアラートは、開発者が警告に嫌がらせされ、潜在的に重大な問題を見落とし、最終的には生産性とコード品質を損なう現象である。
我々は、SCA警告の収集と分類のための新しい方法論を導入し、非動作可能な警告と効果的に区別する。
我々は、NASCAR: (Non-)Actionable Static Code Analysis Reportsという、100万以上のJavaソースコード警告の大規模なデータセットを生成します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:33 GMT)
3D Gaussian and Diffusion-Based Gaze Redirection [0.1] DiT-Gazeは、3D視線リダイレクトモデルを強化するフレームワークである。
実験により、DiT-Gazeは知覚的品質とリダイレクト精度の両方において、新しい最先端を設定できることが示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:32:22 GMT)
Collective Enhancement of Photon Blockade via Two-Photon Interactions [0.1] 光子遮断は、1つの光子の存在がその後の光子の伝達を妨げる重要な量子光学効果である。
光と物質が2光子相互作用によって結合されている場合、単光子と多光子の両方の遮断は、集合的な拡張の恩恵を受けることが示される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:26:34 GMT)
Koopman Invariants as Drivers of Emergent Time-Series Clustering in Joint-Embedding Predictive Architectures [0.0] JEPA(Joint-Embedding Predictive Architectures)は、その基盤となる動的システマティクスによって時系列データをクラスタする、説明のつかない能力を示す。
本稿では,JEPAの予測対象が暗黙的にシステムのクープマン作用素の不変部分空間を学習させるという仮説を,この現象の新たな理論的説明として提案する。
この研究はJEPAsの重要な振舞いを解き、現代の自己教師付き学習と動的システム理論の原則的なつながりを提供し、より堅牢で解釈可能な時系列モデルの設計を知らせる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:09:36 GMT)
Synergy vs. Noise: Performance-Guided Multimodal Fusion For Biochemical Recurrence-Free Survival in Prostate Cancer [0.0] マルチモーダルディープラーニングは、計算病理学における変換的アプローチとして登場した。
高い性能のモダリティを組み合わせることで、単調なアプローチよりも優れた性能が得られることを示す。
性能の悪いモダリティと他の高性能なモダリティを統合することは、予測精度を低下させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:20:44 GMT)
Computationally-efficient deep learning models for nowcasting of precipitation: A solution for the Weather4cast 2025 challenge [0.0] 本研究では,ConGvRI(Conal Gated Recurrent Units)をベースとした,気象4Cast 2025コンペティションにおける短期降雨予測のためのトランスファーラーニングフレームワークを提案する。
入力には1つのSEVIRI赤外チャネル(10.8m波長)が使用され、これは1時間に4回観測される。
2段階のトレーニング戦略を適用し、最大4時間前に降雨予測を生成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:51:59 GMT)
Edge Machine Learning for Cluster Counting in Next-Generation Drift Chambers [0.0] エッジ(あるいはセルレベルの読み出し)での機械学習は、高粒度ドリフトチャンバーのオフ検出器データレートを劇的に削減することができる。
将来のドリフトチャンバーのリアルタイム読み出しにおけるクラスタカウントのための機械学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:49 GMT)
YOLO-Drone: An Efficient Object Detection Approach Using the GhostHead Network for Drone Images [0.0] 本稿では,GhostHead Network と呼ばれる YOLOv11 アルゴリズムのヘッドネットワークの拡張について紹介する。
この改良を取り入れたモデルはYOLO-Droneと呼ばれている。
実験の結果, YOLO-Droneは従来のYOLOv11に比べて精度, リコール, F1-Score, mAP (0.5) などのキー検出精度を著しく向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:32:57 GMT)
Workload Schedulers -- Genesis, Algorithms and Differences [0.0] 本稿では,オペレーティング・システム・プロセス・スケジューラ,クラスタ・システム・ジョブ・スケジューラ,ビッグデータ・スケジューラの3つのクラスについて解説する。
提案するスケジューラのクラス間の違いについて論じ,その時系列的展開について論じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:54 GMT)
Work distribution and fluctuation theorem in AdS/CFT [0.0] これは、仕事分布のホログラム的処方薬を提供するだけでなく、量子重力の「メソスコピック」的な側面も捉えることが期待されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:39 GMT)
Weak Relation Enforcement for Kinematic-Informed Long-Term Stock Prediction with Artificial Neural Networks [0.0] 我々は,長期の株価予測のために,KINN(Kinematic-Informed Artificial Neural Networks)における時系列点間の速度関係の損失関数週間適用を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:33 GMT)
Volumetric Ergodic Control [0.0] 本稿では,体積状態表現を用いた空間被覆を最適化するエルゴディック制御式を提案する。
本手法は,エルゴディック制御のカバレッジ保証を保護し,リアルタイム制御に最小限の計算オーバーヘッドを付加し,任意のサンプルベース容積モデルをサポートする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:10:40 GMT)
Utilizing a Geospatial Foundation Model for Coastline Delineation in Small Sandy Islands [0.0] 我々は,NASAとIBMのPrithvi-EO-2.0モデルの初期評価を行った。
我々は2つのモルディブ島の225のマルチスペクトル画像のデータセットをキュレートし、ラベル付けした。
5~181画像のトレーニングサブセットに対して,Prithviの3Mと6Mのパラメータバージョンを微調整した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:17 GMT)
Unsupervised Segmentation of Micro-CT Scans of Polyurethane Structures By Combining Hidden-Markov-Random Fields and a U-Net [0.0] Hidden Markov Fields (HMRF) は、近傍分布やクラス分布の概念を取り入れた教師なしのセグメンテーション手法である。
本稿では,HMRF理論とCNNセグメンテーションを統合し,教師なし学習と高速セグメンテーション時間という両領域の利点を活用する手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:01:27 GMT)
Unlearning Imperative: Securing Trustworthy and Responsible LLMs through Engineered Forgetting [0.0] 機密性の高いドメインの大規模な言語モデルは、プライベート情報が永久に忘れられることを保証できません。
最初からのトレーニングは違法に費用がかかる。
既存の未学習のメソッドは断片化され、検証が困難で、回復に脆弱であることが多い。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:13:12 GMT)
Uncovering and Circumventing Noise in Quantum Algorithms via Metastability [0.0] ノイズはフォールトトレラント量子コンピュータを実現する上で最大の課題である。
メタスタビリティ現象を利用した新しいノイズ回避戦略を実験的に検証した。
量子ハードウェアノイズが転移性を示す場合、ディジタルアルゴリズムとアナログアルゴリズムの両方がノイズ認識方式で設計可能であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:24 GMT)
Unconditional and exponentially large violation of classicality [0.0] 補間サンプリングに基づくゲームを用いて,非古典性をテストすることを提案する。
我々は,量子システムモデル H2 のトラップイオン量子コンピュータ上でゲームを実行する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:53:00 GMT)
Ultrafast quantum gates with fully quantized free-electron quantum optics [0.0] 自由電子量子光学は、量子レベルで電子を操作するための汎用的なプラットフォームを提供する。
完全量子化自由電子量子光学のための格子型アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:58:36 GMT)
Two-Mode Janus States: non-Gaussian generalizations of thermofield double [0.0] Two-Mode Janus State (TMJS) は、2つの異なるTwo-Mode Squeezed State (TMSS) のコヒーレント重ね合わせとして定義される非ガウス量子状態である。
TMSSはUnruh-DeWitt検出器の応答をエンジニアリングし、相対論的設定で非ガウス物理学を探索するための汎用的で干渉強化されたプラットフォームを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:05:21 GMT)
Two Americas of Well-Being: Divergent Rural-Urban Patterns of Life Satisfaction and Happiness from 2.6 B Social Media Posts [0.0] 人口26億のソーシャルメディア投稿を用いて、アメリカ合衆国における生活満足度と幸福度を郡レベルで示す指標を構築した。
都市部では幸福感が増す一方、農村部では生活満足感が増している。
我々は、この2つを主観的幸福、評価的対ヘドニックの異なる層として扱い、それぞれの地図が場所、政治、時間に対して異なるものであることを示すことで、これを和解する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:51 GMT)
Tuning the Critical Current in Toroidal Superfluids via Controllable Impurities [0.0] 不純物が環状ボース・アインシュタイン凝縮体の最大超流動に与える影響について検討する。
我々の研究は、超流動安定化と崩壊の普遍的なメカニズムを探求するための原始的なプラットフォームとして原子超流動を確立する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:31 GMT)
Towards Mitigating Systematics in Large-Scale Surveys via Few-Shot Optimal Transport-Based Feature Alignment [0.0] 本稿では,学習した特徴を分布内(ID)と分布外(OOD)に整合させる手法を提案する。
本手法をMNISTデータセット上で実験的に検証し,アライメント損失について検討した。
以上の結果から, 最適輸送は, ID と OOD サンプルのパリティが不明な場合, OOD の特徴の整合に特に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:24:15 GMT)
Topological states and flat bands in exactly solvable decorated Cayley trees [0.0] 選択された2次元ユークリッド格子のツリーアナログを構成する装飾されたケイリー木の完全なスペクトルを導出する。
ツリーアナログは、対応するエネルギーに対して、ほぼ平らまたはほぼ平らなエネルギーバンドを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:56:10 GMT)
Three Stage Narrative Analysis; Plot-Sentiment Breakdown, Structure Learning and Concept Detection [0.0] 本稿では,映画脚本の感情弧を解析し,関連するキャラクターの文脈に関する拡張分析を行うフレームワークを提案する。
辞書に基づく感情分析を用いて,LabMTsimple storylabモジュールで構築した独自の語彙を適用した。
このフレームワークは、Wards階層的クラスタリング技術を用いて、類似の感情プロットをクラスタリングすることで分析を前進させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:30:18 GMT)
The Role of Advanced Computer Architectures in Accelerating Artificial Intelligence Workloads [0.0] 人工知能(AI)の顕著な進歩は、コンピュータアーキテクチャにおける同時革命と基礎的に結びついている。
AIモデル、特にDeep Neural Networks(DNN)が複雑化するにつれ、その膨大な計算要求により、従来のアーキテクチャは限界に達している。
本稿では、現代のAIワークロードを加速するために設計されたアーキテクチャのランドスケープを分析し、この共進化の構造化されたレビューを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:42 GMT)
The Algorithmic Phase Transition in Symmetric Correlated Spiked Wigner Model [0.0] 本研究では,一対のスパイクされたウィグナー行列における相関信号の検出と推定の計算タスクについて検討する。
アルゴリズムはスパイク間の相関を利用して、$X$から$x$を効率よく回収するか、$Y$から$y$を効率よく回収するかのどちらかが計算不可能な状態であっても信号を検出して推定することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:35:57 GMT)
Temporal quantum interference in many-body programmable atom arrays [0.0] 我々は、多体ストッケルベルク干渉により、最大100個の原子からなるプログラム可能なリドベルクアレイにおいて、制御可能な真空状態凍結を実験的に達成した。
大規模プラットフォーム上での予測多体状態工学を実現するため,Floquet制御のためのスケーラブルな顕微鏡機構として時間的干渉が確立された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:58 GMT)
Taught by the Flawed: How Dataset Insecurity Breeds Vulnerable AI Code [0.0] アウトプットをセキュアにするための重要な要因は、大規模な言語モデルを構築するために使用されるトレーニングデータセットに脆弱性が存在することだ。
静的解析ツールを用いて既存のPythonコーパスをフィルタリングしてセキュアなデータセットを構築し,脆弱性のない機能のみを保持する。
以上の結果から,計算したデータセットでトレーニングしたモデルは,同等の機能的正しさを維持しつつ,より少ないセキュリティ問題でアウトプットを生成した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:25 GMT)
Subradiant Decay in 2D and 3D Atomic Arrays [0.0] サブラディアンス(Subradiance)は、結合したエミッタが独立したエミッタよりも遅い速度で光を放射する現象である。
本研究では、2次元および3次元正則配列の固有モデムを、無限大系と超大系の両方に使用できる方法を用いて特徴づける。
我々の結果は、順序付けられた原子配列における量子記憶とトポロジカル効果に興味深い応用をもたらすかもしれない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:54:50 GMT)
Study of Quantum Confinement inside a Viral Capsid [0.0] 本研究では、超対称性量子力学(SQM)を用いた新しい量子アプローチを導入し、ウイルスの量子閉じ込め効果について検討する。
この結果から、量子効果は単なる限界ではなく、キャプシド内の重要な過程を理解するために必須であり、古典物理学の範囲を超えて新たな洞察を与えることが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:57:35 GMT)
Specification, Application, and Operationalization of a Metamodel of Fairness [0.0] 本稿では,フェアネスのシナリオを形式的に表現し,分析し,比較することを目的としたARフェアネスメタモデルを提案する。
フェアネスのさまざまな定義を表現するために相互接続可能なモジュールコンポーネントを提供するTilesフレームワークを使用します。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:21:07 GMT)
Solving a Nonlinear Eigenvalue Equation in Quantum Information Theory: A Hybrid Approach to Entanglement Quantification [0.0] エンタングルメントの幾何学的測度を評価するためのハイブリッド解析および数値的枠組みを提案する。
結合した非線形固有構造を等価乗算器の定常性を証明することによって明示する。
得られたハイブリッドソルバは、標準3キュービットベンチマークの正確な最適化を再現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:36:47 GMT)
Slice-Aware Spoofing Detection in 5G Networks Using Lightweight Machine Learning [0.0] 本研究では,5Gネットワークスライス内のスプーフィング攻撃を検出するためのスライス対応軽量機械学習フレームワークを提案する。
このフレームワークは再現可能なOpen5GSとsrsRANテストベッド上に実装された。
その結果、セキュリティインテリジェンスとスライスバウンダリとの整合性は、検出の信頼性を高め、運用上の分離を維持できることが示されている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:29 GMT)
Shortcuts to adiabaticity for coherent atom transport in an adjustable family of two-dimensional optical lattices [0.0] 2次元光学格子の調整可能な族におけるコヒーレント原子輸送について検討する。
我々は, 短絡から断熱への原子輸送を可能にする動的格子軌道を得る。
我々は、関連する時間依存シュレーディンガー方程式の数値解から計算された輸送忠実度を用いて、結果の原子動力学を定量化する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:53:15 GMT)
Separating Semantic Expansion from Linear Geometry for PubMed-Scale Vector Search [0.0] 本稿では,意味論的解釈を計量幾何学から分離する尺度検索フレームワークについて述べる。
大きな言語モデルは、自然言語クエリを簡潔なバイオメディカルフレーズに拡張する。
Retrieval は固定的で平均自由で、ほぼ等方的な埋め込み空間で機能する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:55:16 GMT)
Semi-Unified Sparse Dictionary Learning with Learnable Top-K LISTA and FISTA Encoders [0.0] 本稿では,古典的なスパースモデルと近代的な深層建築のギャップを埋める半統一的なスパース辞書学習フレームワークを提案する。
具体的には、厳格なTop-K$ LISTAとその凸FISTAベースの変種(LISTAConv)をLC-KSVD2モデルに統合する。
この統一された設計は、効率的で差別化可能なトレーニングの恩恵を受けながら、従来のスパースコーディングの解釈可能性を維持している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:24 GMT)
Securing Generative AI in Healthcare: A Zero-Trust Architecture Powered by Confidential Computing on Google Cloud [0.0] Confidential Zero-Trust Framework (CZF) は、Zero-Trust ArchitectureとConfidential Computingのハードウェア強化データアイソレーションを組み合わせたセキュリティパラダイムである。
CZFは、ハードウェアベースのTrusted Execution Environment内で使用中にデータが暗号化される詳細なアーキテクチャを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 19:56:52 GMT)
Search Is Not Retrieval: Decoupling Semantic Matching from Contextual Assembly in RAG [0.0] 本稿では,細粒度検索表現と粗粒度検索コンテキストを区別する2層アーキテクチャである検索-Is-Not-Retrieve(SINR)フレームワークを紹介する。
SINRは、小さな意味論的に正確な検索チャンクをより大きく、文脈的に完全なチャンクに直接接続することで、検索システムの構成可能性、拡張性、コンテキスト忠実性を向上する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:59 GMT)
Scaling of free cumulants in closed system-bath setups [0.0] 固有状態熱化仮説(ETH)は、量子多体系の熱化を理解するための基礎として確立されている。
ランダムなマトリクス浴を用いた理想的なケースと,浴槽を欠陥Ising鎖としてモデル化するより現実的なシナリオを考慮し,システムバスに解析を拡張した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:11:30 GMT)
SUPER Decoder Block for Reconstruction-Aware U-Net Variants [0.0] スキップ接続型エンコーダデコーダアーキテクチャ (U-Net variants) は、逆問題に対して広く採用されているが、情報損失に悩まされている。
本稿では、ウェーブレットの完全復元(PR)特性を利用して情報劣化を防止する選択的抑圧完全再構成(Super)を提案する。
Superは様々なU-Net変種のためのプラグイン・アンド・プレイ・デコーダブロックとして機能し、固有の再構築ボトルネックを排除し、表現豊かさを高める。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:06:10 GMT)
Robustness and Imperceptibility Analysis of Hybrid Spatial-Frequency Domain Image Watermarking [0.0] デジタルメディアの普及は、著作権保護とコンテンツ認証のための堅牢な方法を必要とする。
本稿では、フーリエ領域(Least Significant Bit - LSB)、周波数領域(Discrete Transform - DFT)、および新しいハイブリッド(LSB+DFT)アプローチを用いて実装されたデジタル画像透かし技術について包括的な研究を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:11 GMT)
Robust inverse material design with physical guarantees using the Voigt-Reuss Net [0.0] 本稿では, ハード物理保証を伴う前方および逆機械的均質化のためのスペクトル正規化サロゲートを提案する。
バイファシック・マイクロ構造のオープンデータセット上の3次元線形弾性では、完全に接続されたVoigt-Reussネットは、236のイソトロピーインディスクリプタを持つFFTベースのラベルでトレーニングされている。
全体として、Voigt-Reussネットは、大バッチで制約に一貫性のある逆設計で正確で物理的に許容できる前方予測を統一する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:17:37 GMT)
Reusability Report: Optimizing T-count in General Quantum Circuits with AlphaTensor-Quantum [0.0] 我々はAlphaTensor-Quantumの機能を拡張し、様々な量子ビット数を持つランダム量子回路を単純化する。
実験の結果,5ビットから8ビットの回路でトレーニングした汎用エージェントは,従来手法よりもTカウントの低減を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:21:09 GMT)
Rethinking Science in the Age of Artificial Intelligence [0.0] 我々は、ピアレビュー、倫理的評価、検証のような学術的学問において、AIは強化されるが人間の判断に取って代わるものではないと論じる。
本稿では、透明性、妥当性、説明責任を促進する政策を通じて、科学実践におけるAIの故意導入を訴える。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:07 GMT)
Relativistic Maxwell-Bloch Equations with Applications to Astrophysics [0.0] 本研究では, 放射光系の応答は, 系の静止フレームと観測者の相対速度が異なる値で保存されていることを示す。
異なる速度を走行するエミッタ群間のコヒーレンスレベルが、すべての参照フレームで変化しないことを検証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:39:30 GMT)
Relative entropy for locally squeezed states [0.0] 相対エントロピーは、量子情報理論と量子場理論の両方において、状態の区別可能性の基本的な尺度として機能する。
局所的に圧縮された状態と真空の間の相対エントロピーは一般的に分岐するが、スキューズングは小さい。
これは、局所的に圧縮された状態が自由量子場の状態空間の well-defined 要素であるが、真空とは無限に異なることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:02:10 GMT)
Random Text, Zipf's Law, Critical Length,and Implications for Large Language Models [0.0] 我々は、故意に単純で完全に非言語的なテキストモデルについて研究する。
単語は、非空間シンボルの最大ブロックとして定義される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:05:59 GMT)
Quantum limit cycles and synchronization from a measurement perspective [0.0] 連続ヘテロダイン測定における量子極限サイクルと同期について検討した。
結果として生じる量子軌道、すなわち、測定結果に基づいて条件付けられた量子状態の時間発展は、量子極限サイクルを明らかにする。
我々の研究は、量子系の極限サイクルに関する洞察を提供し、ノイズを受ける古典的な極限サイクルと類似性を強調する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:01:25 GMT)
Quantum Phase Gradient Imaging Using a Nonlocal Metasurface System [0.0] 量子位相イメージングは、厚さと屈折率の変動のある透明な試料の分析を可能にする。
非線形準曲面の最近の進歩は、量子光の生成と操作のためのコンパクトな解を提供する。
光子対を生成するためのリチウムニオブ酸リチウム(LiNbO3)と、位相勾配抽出のためのシリコン(Si)とを組み合わせた小型量子位相イメージングシステムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:18:57 GMT)
Quantum Frustration as a Protection Mechanism in Non-Topological Majorana Qubits [0.0] 2つのMajoranaモードで符号化された$$-junction qubitのデコヒーレンスを分析する。
トポロジカルに保護されていないが、クビットは異なる空間プロファイルを利用して2対の独立した環境浴を行う。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:52 GMT)
Quantum Electron Clouds near Black Holes: Black Atoms and Molecules [0.0] 我々は、高度に湾曲した空間、すなわちブラックホールの近くで量子力学的波動関数を研究する。
シュワルツシルト近傍のシュルディンガー方程式とライスナー・ノルドストラムブラックホール幾何学を導出する。
ブラックホールは一般的に波動関数を引き寄せ、電子が閉じ込められる可能性が最も高い地平線付近でそれらの位置を定めている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:15:10 GMT)
Quantum Computational Structure of $SU(N)$ Scattering [0.0] 我々は、$SU(N)$大域対称性に従う粒子の散乱を研究する。
任意の$N$に対して、全ての2-2散乱チャネルは$mathbbZ_2$環のスパンから現れる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:31 GMT)
Quantum Algorithms for Computing Maximal Quantum $f$-divergence and Kubo-Ando means [0.0] 最大量子$f$-divergencesと演算子理論行列 Kubo--Ando を計算するための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:51 GMT)
Proof-of-principle demonstration of a Polarization-Circulation Speed Meter [0.0] 偏光循環速度計の初の実験的実装について述べる。
偏光循環キャビティを安定させるためにグリーンロック方式を用い, 速度計操作を実現するためにロック取得方式を実証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:40:11 GMT)
Prompt-Based Value Steering of Large Language Models [0.0] 提案手法は,素早い候補が生成したテキストを特定の人的価値に向けて効果的に操れるかどうかを評価するための,実用的で再現可能な,モデルに依存しない手順である。
我々は,人間の基本値の理論と対話データセットによる構造化評価を用いて,ウィザード・ヴィクナ言語モデルの変種に適用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:45:41 GMT)
Private Frequency Estimation Via Residue Number Systems [0.0] 本報告では,ローカル・ディファレンシャル・プライベート(LDP)周波数推定のための新しいアルゴリズムであるtextsfModularSubsetSelection (MSS) を提案する。
私たちの$varepsilon$-LDPメカニズムは、サイズが$k$と$n$のユーザに与えられたら、それぞれの入力をResidue Number System (RNS)経由で$ell$ペアワイズ・コプライム・モジュリでエンコードします。
MSS は評価された全ての LDP プロトコルの中で最小の再構成攻撃成功率を達成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:58:41 GMT)
Preview, Accept or Discard? A Predictive Low-Motion Interaction Paradigm [0.0] この研究は、予測的AI支援入力が、物理的なポインティングを画面上のランク付けされた提案に置き換えることで、その動きを減らすことができるかどうかを調査する。
ユーザエージェンシーを維持するため,ゼロクリックインタラクションパラダイムであるPreview Accept Discard(PAD)を導入する。
PADをブラウザベースの電子メールクライアントとISO 9241-9キーボード予測タスクの2つの設定で評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:26 GMT)
Pk-IOTA: Blockchain empowered Programmable Data Plane to secure OPC UA communications in Industry 4.0 [0.0] OPC UAプロトコルは、産業用4.0マシン間通信のデファクトスタンダードになりつつある。
以前の研究では、安全なOPC UAデプロイメントを実際にセットアップする上で、依然として課題が存在することが示されていた。
我々は、OPC UA通信をセキュアにするための自動化ソリューションであるPk-IOTAを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:17 GMT)
Photonic-integrated quantum sensor array for microscale magnetic localisation [0.0] 窒素空洞センター(NV)は、物質科学からバイオテクノロジーまで幅広い用途に固体ナノスケールセンサーを約束している。
シリコン-窒化ケイ素フォトニック集積回路にNVを組み込むことにより,配列内の8個の局所化NVセンサのスケーラブルな動作を実現する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:19:04 GMT)
Photon transport and blockade based on non-Markovian interactions between a microring resonator and waveguide [0.0] 導波路をマイクロリング共振器に2つの異なる点で結合するアーキテクチャに基づいて光子輸送と遮断について検討する。
非マルコフ力学は、2つの結合点間の導波路における光子伝達遅延によって引き起こされる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:41:51 GMT)
Photon correlation Fourier spectroscopy of a B center in hBN [0.0] 六方晶窒化ホウ素(hBN)では、青色発光色中心(またはB中心)が量子コヒーレンスにおいて好ましいと考えられている。
ここでは、連続波状態におけるB中心からの発光のコヒーレンスとスペクトル拡散について検討する。
我々の研究は、hBNにおけるこの卓越した量子エミッタファミリーの非コヒーレンス過程の理解を深める。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:56:37 GMT)
Phase-Coded Memory and Morphological Resonance: A Next-Generation Retrieval-Augmented Generator Architecture [0.0] トークンの埋め込みの代わりに、システムは振幅-位相構造を持つ複雑な波のパターンとして意味を符号化する。
この論文は、理論的基礎、擬似コードの実装、および関連する複素数値ニューラルモデルによる実験的証拠を概説する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:12:24 GMT)
Perovskite Nanocrystals as Emerging Single-Photon Emitters: Progress, Challenges, and Opportunities [0.0] 金属ハロゲン化ペロブスカイトナノ結晶(PNC)が次世代量子エミッタの候補として浮上している。
PNCは、高輝度の量子収率、調整可能な放出、短い放射寿命、環境条件下では記録的な高い単一光子純度を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:19:19 GMT)
Perfect displacement of a superconducting resonator via fast-forward scaling theory [0.0] コヒーレントドライブ下での超伝導共振器の高速フォワード特性と時間スケーリング特性について検討した。
駆動振幅の変調による超伝導共振器の完全変位推定法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:13:35 GMT)
Parametric resonance in a spin-1/2 chain: dynamical effects of nontrivial topology [0.0] 強磁場中のスピン-1/2鎖の場合、結果として生じる励起は、北エフ鎖のフェルミオン励起にマッピングできる。
変調ターンオンに対する応答により、周期鎖の非自明な位相の動的側面を明らかにすることができることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:04:09 GMT)
PIRA: Preference-Oriented Instruction-Tuned Reward Models with Dual Aggregation [0.0] リワードモデルは、大規模言語モデル(LLM)と人間の嗜好の整合に不可欠である。
PIRAは3つの戦略を通じてこれらの問題に対処する訓練パラダイムである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:22:49 GMT)
PI-NAIM: Path-Integrated Neural Adaptive Imputation Model [0.0] 本稿では,新しい二重パスアーキテクチャであるPI-NAIMを提案する。
1)低損失サンプルを効率的な統計計算(MICE)と複雑なパターンに誘導するインテリジェントパスルーティングを、時間的分析を伴う強力なニューラルネットワーク(GAIN)に統合する。
MIMIC-IIIとマルチモーダルベンチマークの実験では、最先端の性能を示し、RMSEは0.108、下流タスクは0.812のAUROCで大幅に向上した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:38:40 GMT)
Owlgorithm: Supporting Self-Regulated Learning in Competitive Programming through LLM-Driven Reflection [0.0] 競争プログラミング(CP)における自己統制学習(SRL)を支援する教育プラットフォームを提案する。
Owlgorithmは、個々の学生の提出に合わせた、文脈対応のメタプロンプトを生成する。
学生評価とTAフィードバックを探索的に評価した結果,有望なメリットと顕著な制限が認められた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:22:55 GMT)
Orbital-Optimized Unitary Coupled Cluster for Indirect Nuclear Spin-Spin Coupling Constants within a Quantum Linear Response Framework [0.0] 間接核スピンスピン結合定数を計算するための量子線形応答(qLR)手法を提案する。
軌道最適化の役割について検討し、ooUCCが計算された結合に顕著に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:28 GMT)
Optomechanical Cooling without Residual Heating [0.0] 我々は、受動的・能動的非線形性の両方を取り入れた普遍空洞ハミルトニアンを記述するために、光学的冷却のための半古典的モデルを一般化する。
従来のスキームを制限した有限温度のフロアを克服することで、我々の手法は機械システムに対する前例のない量子制御の道を開くことができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:45:25 GMT)
Optimal Interpolation of Entanglement Purification Protocols [0.0] 両端の絡み合いの浄化は、2つの分離されたパーティ間で共有される弱い絡み合いのペアのコピーを、局所的な操作と古典的なコミュニケーションのみを使用して、より少ない数の強い絡み合いの共有ペアに変換することである。
我々は、この分布を選択して、与えられた忠実度を持つキュービット対をベル状態に最大化するか、または、同等に、与えられた速度で生成されたキュービット対のベル状態への忠実度を最大化するかを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:32 GMT)
On universality of hardware-efficient ansatzes [0.0] ハードウェア効率アンサッツ(英: hardware- efficient ansatz, HEA)は、量子コンピューティングの短期的応用のための最も重要なパラメタライズド量子回路の1つである。
HEAのいくつかの主要なクラスをシミュレートする問題は、関連する量子回路がそれらのクラスのHEA回路として効率的に表現できることを明確に示して、BQP完全であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:15:50 GMT)
On the Convergence of Overparameterized Problems: Inherent Properties of the Compositional Structure of Neural Networks [0.0] 本稿では,ニューラルネットワークの構成構造が最適化ランドスケープとトレーニングダイナミクスをどう形成するかを検討する。
グローバル収束特性は、適切な実解析的なコスト関数に対して導出可能であることを示す。
これらの知見が、シグモダルアクティベーションを持つニューラルネットワークにどのように一般化されるかについて議論する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:48 GMT)
On the Classical Shadow Nonparametric Bootstrap [0.0] 本稿では,ブートストラップ再サンプリング手法を用いた古典的シャドウ手法を提案する。
ブートストラップ分布はガウス近似とは大きく異なることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:21:18 GMT)
On the Classical Shadow Nonparametric Bootstrap [0.0] 本稿では,ブートストラップ再サンプリング手法を用いた古典的シャドウ手法を提案する。
ブートストラップ分布はガウス近似とは大きく異なることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:05 GMT)
On compromising freedom of choice and subjective [0.0] 機能的アプローチを基礎として,否定的自由と肯定的自由という概念のバランスをとる妥協手法を導入する。
本稿では,アクセス可能な選択肢の多様性に対する個人の嗜好を取り入れた,機能セット評価のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:58:12 GMT)
Nonequilibrium Probes of Quantum Geometry in Gapless Systems [0.0] ギャップのない多体量子系の理解の多くは、共形場の理論としての低エネルギーの記述に由来する。
これは特に 1+1 次元において真であり、そのような理論はその共形対称性によって誘導される無限次元のパラメータ空間を持つ。
時間依存型共形変換によって駆動される有限系を考えることにより、関連する量子幾何学を明らかにする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:06 GMT)
NeuroLingua: A Language-Inspired Hierarchical Framework for Multimodal Sleep Stage Classification Using EEG and EOG [0.0] 我々は、睡眠を構造化生理言語として概念化する言語に着想を得たフレームワークであるNeuroLinguaを提案する。
睡眠を構成言語とすることで、NeuroLinguaは階層的なシーケンスモデリングとマルチモーダル融合を統一する。
NeuroLingua は、Sleep-EDF Expanded と ISRUC-Sleep データセットで評価される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:57 GMT)
Mutual information as a measure of renormalizability [0.0] 運動量空間における無限小シェル間の相関を特徴付けるために相互情報を用いる。
モード分離を伴う相互情報の対数微分は,大きなモード分離において,再正規化可能性の尺度であることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:49 GMT)
Multistability of Self-Attention Dynamics in Transformers [0.0] 機械学習において、自己アテンションダイナミクス(セルフアテンションダイナミクス、英: self-attention dynamics)とは、変圧器の注意機構の連続的時間的マルチエージェントのようなモデルである。
我々は,シングルヘッドの自己認識システムの平衡を,コンセンサス,二部構成コンセンサス,クラスタリング,平衡という4つのクラスに分類する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:45:22 GMT)
Modification of Hanle and polarization recovery curves under interplay of hopping and quantum measurement back action [0.0] 電離電子のスピン偏極が横磁場と縦磁場への依存性について述べる。
これにより、実験結果の幅広い範囲を記述し、量子測定の基本的な効果を研究することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:37 GMT)
Modeling X-ray photon pile-up with a normalizing flow [0.0] 明るいX線源の解析は、高入射光子フラックスによるいわゆるパイルアップによって複雑になる。
シミュレーションに基づく推論フレームワークを用いて,重畳されたeROSITAデータから物理パラメータの後方分布を推定できる機械学習ソリューションを提案する。
正規化フローは従来の緩和技術よりも制約された後部密度を発生し,より多くのデータを活用することができることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:46:32 GMT)
Modeling Novel Oral Nicotine Use Among Adolescents [0.0] 高校生の間では、ニコチンポーチの使用は2021年から倍になり、2024年には2.4%が現在の使用を報告している。
2022~2024年のフロリダ・ユース・タバコ調査データを分析し,流行傾向について検討した。
我々は,将来の軌道を計画し,介入戦略を評価するための,段階的構成構成モデルを開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:07:33 GMT)
Mapping Game Theory to Quantum Systems: Nash Equilibria via Neutral Atom Computing [0.0] ナッシュ均衡は、経済学、物理学、生物学、コンピュータ科学におけるゲーム行動とシステムを理解するために不可欠である。
単位ディスクグラフ上での最大独立集合(MIS)とナッシュ平衡の対応を利用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:31 GMT)
Mailing address aliasing as a method to protect consumer privacy [0.0] メールアドレスエイリアスという概念を導入し、コストを抑え、場合によってはより制御しやすいものも提案する。
メーリングアドレスのエイリアス化は、物理的または仮想的なPOボックスよりもはるかに、未分離のメールを減らしがちである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:25:08 GMT)
Magnetic flux and its topological effects in Aharonov-Bohm effect [0.0] アハロノフ・ボーム効果(Aharonov-Bohm effect)は、荷電粒子の量子状態が位相シフトを取得する物理現象である。
この明らかな非局所性の基礎となる物理を説明する説明を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:52:22 GMT)
Machine-Learning Based Detection of Coronary Artery Calcification Using Synthetic Chest X-Rays [0.0] 冠動脈石灰化は心血管イベントの強力な予測因子である。
デジタル再構成ラジオグラフ(DRR)は、CTボリュームをCXRライクな画像に投影することで、スケーラブルな代替手段を提供する。
CAC検出のための補助訓練領域としてDRRを初めて体系的に評価した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:11:41 GMT)
MALBO: Optimizing LLM-Based Multi-Agent Teams via Multi-Objective Bayesian Optimization [0.0] この論文では、マルチエージェントAIチームの効率的な構成を自動化するように設計された、体系的なフレームワークであるMALBOを紹介している。
タスクの精度と推論コストの間の設定の前面を特定することを目的として,多目的最適化問題として代入課題を定式化する。
その結果、ベイズ最適化フェーズは、初期ランダム検索と比較して、平均構成コストを45%以上削減しつつ、同等な平均性能を維持した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:01:08 GMT)
Low-Bit, High-Fidelity: Optimal Transport Quantization for Flow Matching [0.0] Flow Matching (FM) 生成モデルは、効率的なシミュレーションなしのトレーニングと決定論的サンプリングを提供するが、その実践的展開は高精度なパラメータ要求によって困難である。
我々は、最適輸送(OT)に基づくポストトレーニング量子化をFMモデルに適用し、量子化とオリジナルウェイトの間の2-ワッサーシュタイン距離を最小化し、その一様、一様、対数量子化スキームに対する効果を体系的に比較する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:49:36 GMT)
Lorentz Transformation in Quantum Mechanics [0.0] 特殊相対性理論と量子力学の互換性は、いくつかの著者によって疑問視されている。
まず、時空における一般的な波動関数に対するローレンツ変換の効果について論じる。
次に、相対論的不変性に従う量子力学の程度を分析するために、思考実験をほとんど考慮しない。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:28:14 GMT)
Looking Forward: Challenges and Opportunities in Agentic AI Reliability [0.0] この章では、動的環境、一貫性のないタスク実行、予測不可能な緊急行動、リソース集約的な信頼性メカニズムなど、研究上の課題と機会について光を当てている。
さらに,エージェントAIシステムの信頼性試験と信頼性評価に関するいくつかの研究方針についても論じる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:05:43 GMT)
Local Hybrid Retrieval-Augmented Document QA [0.0] クラウドベースのAIシステムを採用するが、データのプライバシを侵害する、あるいはセキュリティを保証するが精度の低いローカル処理を維持する。
意味理解とキーワードの精度を組み合わせた質問応答システムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:44:18 GMT)
Lithological Controls on the Permeability of Geologic Faults: Surrogate Modeling and Sensitivity Analysis [0.0] 断層帯は複雑で不均一な透水性構造を示す。
PreDICTフレームワークを用いて,リソロジー制御が断層透過性に与える影響について検討する。
フローベースアップスケーリングステップをエミュレートするために,ニューラルネットワークサロゲートを開発した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:03:46 GMT)
Learnable Total Variation with Lambda Mapping for Low-Dose CT Denoising [0.0] Learnable Total Variation (LTV)フレームワークは、データを駆動するLambda Mapping Network (LambdaNet)と、ピクセルごとの正規化マップを予測するアンロールTVソルバを結合する。
LTVはブラックボックスCNNの解釈可能な代替手段を提供し、3Dおよびデータ一貫性駆動の再構築の基礎を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:54:49 GMT)
Language-Aided State Estimation [0.0] 自然言語で表現された人間の観察を活用することで,物理系の状態推定の問題に対処する。
本研究では,自然言語処理による人間の観察を解析し,状態推定の更新ステップに組み込む言語支援粒子フィルタ(LAPF)を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:18:37 GMT)
Know Your Limits: Entropy Estimation Modeling for Compression and Generalization [0.0] 本稿では,より優れた訓練効率特性を示すエンコーダ拡張因果デコーダモデルアーキテクチャを提案する。
提案手法は, 提案手法を用いて訓練した因果関係モデルにおいて, エントロピーを考慮せずに訓練したモデルよりも, 精度の高い一般化が期待できることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:12 GMT)
Khmer Spellchecking: A Holistic Approach [0.0] 本稿では,Khmerスペルチェック問題に対する包括的アプローチを提案する。
Khmerサブワードセグメンテーション、Khmer NER、Khmer grapheme-to-phoneme(G2P)変換、そしてこれらの課題に取り組むためにKhmer言語モデルを統合する。
実験の結果,提案手法は最先端のKhmerスペルチェックの精度を94.4%まで向上することがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:10:52 GMT)
Intrinsic Dimension Estimation for Radio Galaxy Zoo using Diffusion Models [0.0] 我々は、スコアベース拡散モデルを用いて、RGZデータセットの固有次元(iD)を推定する。
アウト・オブ・ディストリビューション・ソースは、より高いiD値を示し、RGZの全体的なiDは、通常、自然言語データセットで報告されるiDを上回ることが判明した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:09:01 GMT)
Interferometric Braiding of Anyons in Chern Insulators [0.0] 電子のコヒーレント制御とブレイディングは、トポロジカルに保護された量子演算を実現する上で重要な課題である。
本稿では, チャーン絶縁体中のエノンに付随する幾何位相を直接アクセスするためのラムゼー干渉プロトコルを提案する。
本研究は, 量子シミュレータにおける直接陽子ブレイディング実験の実現可能な経路として不純物系干渉計を確立した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 09:46:30 GMT)
Information phases of partial projected ensembles generated from random quantum states [0.0] ホルレヴォの情報は、ハールランダム状態における部分射影アンサンブルにおいてどのようにスケールされているかを示す。
あるフェーズでは、ホレボの情報はシステムサイズと指数関数的に崩壊し、もう一方では線形に成長する。
指数関数的に崩壊する相は、測定不能な量子相関相の存在を厳格に確立する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:23 GMT)
Improving Neutrino Oscillation Measurements through Event Classification [0.0] イベントをその基盤となるインタラクションタイプに応じて分類することで、この構造を組み込む戦略を導入する。
準弾性散乱, 中間子交換電流, 共鳴生成, 深部非弾性散乱過程の内在的差異を利用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:26:51 GMT)
Improving Conditional VAE with approximation using Normalizing Flows [0.0] 変分オートエンコーダと生成逆数ネットワークは2022年までSOTA(State-of-the-art)生成モデルのままであった。
その結果、従来のモデルを改善する努力は停滞した。
従来の方法では,条件付き変分オートエンコーダ(CVAE)を用いた画像生成を探索し,画像に所望の属性を組み込む。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:19:34 GMT)
Improved coherence time of a non-Hermitian qubit in a $\mathcal{PT}$-symmetric Environment [0.0] 本研究では、非エルミート的$PT$対称力学の下での量子ビットのコヒーレンスについて検討する。
この効果は、システムと環境の両方が$PT$対称性を示すときに特に顕著である。
これらの発見は、デコヒーレンスを管理するための有望な戦略を示しており、量子情報処理へのアプローチを大幅に前進させる可能性がある。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:24:36 GMT)
History-Aware Trajectory k-Anonymization Using an FPGA-Based Hardware Accelerator for Real-Time Location Services [0.0] 本稿では,歴史を意識したk-匿名化手法を提案し,それを実現するためのFPGAベースのハードウェアアーキテクチャを提案する。
我々の新しいアーキテクチャは6000レコード/秒以上のリアルタイムスループットを実現し、過去最短パスのみの設計と比較して最大1.2%データ保持を改善し、主要な動脈路をより効率的に保存する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:04:26 GMT)
High-Energy Decays and Weak Quantum Measurements [0.0] 減衰キネマティクスは、親スピン状態に関する部分的、非射影的な情報を符号化した重なり合う角分布を持つ連続ポインター変数として機能する。
この枠組みはスピントモグラフィ、絡み合ったデカイ相関、スピン相関アルゴリズムを統一し、相対論的崩壊がスピンの情報の弱い測定を実現することを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:38:17 GMT)
HeatGen: A Guided Diffusion Framework for Multiphysics Heat Sink Design Optimization [0.0] ジオメトリは複数のフィンの境界表現を用いて表現される。
本研究では, 偏波拡散確率モデルを訓練し, 観測値と一致した特性のヒートシンクを生成する。
我々は2つの異なる残留ニューラルネットワークを訓練し、各幾何学における圧力降下と表面温度を予測する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:35 GMT)
Hamiltonian simulation with explicit formulas for Digital-Analog Quantum Computing [0.0] デジタルアナログ(Digital-analog)は、量子演算を実装するために単一の量子ビットゲートと組み合わさったエンタングリングリソースとして、システムの自然な相互作用であるハミルトニアンを用いる量子計算パラダイムである。
デジタルゲートベースの場合と同様に、最適な量子リソースを使用するデジタルアナログ回路を設計するには、非常に大きな古典的な計算時間が必要となることが多い。
任意のイジング・ハミルトニアンの局所ユニタリ変換の和として任意の二体ハミルトニアンを表現する問題の正確な解を与える。
これにより、私たちはデジタルを設計できます。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:32:05 GMT)
Gynopticon: Consensus-Based Cheating Detection System for Competitive Games [0.0] オンラインゲームはゲーム業界にとって大きな脅威となる。
これまでのほとんどの研究は、MMORPGs(Massively Multiplayer Online Role-Playing Games)に集中している。
GYNOPTICONは,ユーザのコンセンサスを利用して異常行動を識別する,新しい不正検出フレームワークである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:28:24 GMT)
Grid-STIX: A STIX 2.1-Compliant Cyber-Physical Security Ontology for Power Grid [0.0] Grid-STIXは、電力網サイバーセキュリティアプリケーションのためのSTIX 2.1のドメイン固有の拡張である。
Grid-STIXは、物理資産、運用技術コンポーネント、サイバー物理関係、セキュリティポリシーを含むモジュラーアーキテクチャを採用している。
このフレームワークは、攻撃パターンの体系的表現、サプライチェーンリスク、ドメイン間影響分析を通じて脅威モデリング機能を提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:48:59 GMT)
Green Function Invariants for Floquet Topological Superconductivity Induced by Proximity Effects [0.0] 超伝導-半導体ハイブリッド系におけるフロケット位相のグリーン関数による予測
Floquetバンド構造、各レベル拡張、および位相不変量を得る。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:19 GMT)
Green AI: A systematic review and meta-analysis of its definitions, lifecycle models, hardware and measurement attempts [0.0] この記事では、持続可能なAIとは異なる、グリーンAIの統一された運用定義を確立する。
ライフサイクルアセスメント段階にマッピングされた5つのフェーズライフサイクルを形式化し、エネルギー、炭素、水、エンボディドインパクトを第一級に設定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:39:30 GMT)
Graph Attention Network for Predicting Duration of Large-Scale Power Outages Induced by Natural Disasters [0.0] 本稿では,GTA(Graph Attention Networks)による重症気象による停電期間を推定する新しい手法を提案する。
我々のネットワークは、教師なし事前訓練から半教師付き学習までの単純な構造を用いており、米国南東部の8州で501ドルの郡に影響を及ぼす4つの主要なハリケーンのフィールドデータを用いています。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:21:30 GMT)
Gradient Flow Equations for Deep Linear Neural Networks: A Survey from a Network Perspective [0.0] 本論文は, 深い線形ニューラルネットワークに付随する勾配流方程式の動的および損失景観の理解における最近の進歩について調査する。
ロスランドスケープは、無限に多くの大域的ミニマ点とサドル点によって特徴づけられる。
論文で使用した隣接行列表現は、商空間構造の存在を強調することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:47:23 GMT)
Governance, Risk, and Regulation: A Framework for Improving Efficiency in Kenyan Pension Funds [0.0] 本研究では,ケニアにおける企業経営,リスク管理,産業規制が年金計画効率に及ぼす影響について検討した。
役員会における従業員代表者の存在と効果的なリスク管理は、効率に有意な影響を及ぼす。
本稿では, 従業員の選任プロセスにおいて, 計画効率を徐々に向上させる自己浄化機構を導入することを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 06:41:30 GMT)
Geometric foundations of thermodynamics in the quantum regime [0.0] 本稿では、接触幾何学と主繊維束に基づく量子熱力学の包括的幾何学的定式化について述べる。
密度演算子の多様体上の主ファイバー束は、量子状態構造と熱力学ラベルを区別する。
擬リーマン計量と主バンドル上の接続を通して定式化された非平衡拡張は、循環過程における不可逆性を定量化する曲率誘起ホロノミーを導入する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:51 GMT)
Generative Artificial Intelligence Adoption Among Bangladeshi Journalists: Exploring Journalists' Awareness, Acceptance, Usage, and Organizational Stance on Generative AI [0.0] 本研究は、バングラデシュのジャーナリストの認識、受容、利用パターン、およびそのメディア組織によるGenAIに対する態度を明らかにする。
バングラデシュのジャーナリストは、制度的な支援やAI政策の欠如にもかかわらず、西欧の同僚と同様、GenAIに高い信頼を抱いている。
この研究は、非西洋のジャーナリズムにおいて、文脈要因が技術導入の軌跡をどう形成するかを理解するのに寄与する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 00:14:38 GMT)
Generalizing quantum dimensions: Symmetry-based classification of local pseudo-Hermitian systems and the corresponding domain walls [0.0] 共形場理論(CFT)とその分類を現代的観点から研究する。
我々は(擬)エルミート系と(非)ユニタリ CFT に関連する量子次元の自然な一般化を求める。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:17:29 GMT)
Generalized coherent states with shifted (displaced) arguments [0.0] 我々は、シフトした引数で一般化されたコヒーレントな状態を構築する手順を開発する。
シフトした引数を持つコヒーレント状態の特性を調べるために、通常の演算子順序付け技術(DOOT)の規則を用いた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:43:35 GMT)
From Heisenberg and Schrödinger to the P vs. NP Problem [0.0] このエッセイは、ヴェルナー・ハイゼンベルク、マックス・ボーン、パスカル・ヨルダン、ポール・ディラック・アーウィン・シュルディンガー、ポール・エレンフェスト、ヴォルフガング・パウリの導出によって量子力学の数学的歴史を再構築している。
ハイゼンベルクのアルゴリズム的な定式化をシュルディンガーの表現と組み合わせることで、それらの分岐は科学的な推論自体の構造的特徴を明らかにしていると論じている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:35 GMT)
From Euler to Today: Universal Mathematical Fallibility A Large-Scale Computational Analysis of Errors in ArXiv Papers [0.0] 本稿では,ArXivレポジトリによる数学論文の大規模解析結果について述べる。
自動解析システムでは、複数の数学カテゴリにまたがって37,000以上の論文を処理し、エラー率と品質分布を明らかにした。
数値解析 (math.NA) では, 誤差率9.6% (23,761論文で2,271件) , 幾何トポロジー (math.GT) では6.5% (13,209論文で862件) であった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:56:58 GMT)
Frequency Spectra of Isolated Laser Pulse Envelopes [0.0] 本稿では, 有限時間間隔で, エンベロープ関数が0の孤立レーザーパルスを扱う。
この関数のフーリエ変換を数値計算し、その挙動を高周波で研究する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:20 GMT)
Framing the Hacker: Media Representations and Public Discourse in Germany [0.0] この調査は2017年1月から2020年1月までの報告をカバーしている。
結果は、ハッカーを犯罪、国家安全保障の脅威、デジタル戦争に結びつけるネガティブな意味と劇的なフレームの強い優位性を明らかにしている。
この分析は、ハッカーを取り巻く社会的物語を形成する上でのアジェンダ設定、フレーミング、メディア現実の役割を強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:24 GMT)
FlowCast: Advancing Precipitation Nowcasting with Conditional Flow Matching [0.0] 本研究では,コンディショナルフローマッチング(CFM)を降水処理に適用する最初のモデルであるFlowCastを紹介する。
拡散とは異なり、CFMは直接ノイズ・ツー・データマッピングを学習し、機能評価が大幅に少ない高速かつ高忠実なサンプル生成を可能にする。
実験の結果,FlowCastは予測精度で新たな最先端技術を確立していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:06:29 GMT)
Fixed-Persona SLMs with Modular Memory: Scalable NPC Dialogue on Consumer Hardware [0.0] LLM(Large Language Models)は、人間のようなテキストを生成する際、顕著な能力を示したが、コンピュータゲームにおける対話システムへの適用性はまだ限られている。
本稿では,Small Language Models (SLM) を利用したモジュール型NPC対話システムを提案する。
我々のアプローチはゲーム分野のアプリケーションに動機付けられているが、モジュラー設計とペルソナ駆動のメモリアーキテクチャは、バーチャルアシスタント、カスタマーサポートボット、インタラクティブな教育システムなど、表現力のあるスケーラブルでメモリに富んだ対話エージェントを必要とする領域で広く採用される大きな可能性を秘めている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:57 GMT)
First and second quantized digital quantum simulations of bosonic systems [0.0] 我々は、M$モードのN$粒子からなるシステムにおいて、第1および第2量子化ボソニックマッピングの基本的なリソース要件を比較した。
二項第一量子化写像は、N$とM$の現実的な組み合わせに対して、二項二項二項二項二項二項二項二項二項二項の量子化写像よりも少ないゲートを必要とすることを示す。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:33:50 GMT)
Finite-size quantum key distribution rates from Rényi entropies using conic optimization [0.0] レニイエントロピーに基づく量子鍵分布の一般的なセキュリティ証明が導入された。
これらのアプローチはより柔軟で、フォン・ノイマンのエントロピーに基づく伝統的な定式化よりも秘密鍵レートに厳密な境界を与える。
この問題を解決するために,非対称コニック最適化に基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:59:05 GMT)
Fermi-Dirac Wigner function for massive spin-1/2 particles in local equilibrium [0.0] 我々は、フェルミ・ディラック・ウィグナー関数から構築されたマクロ電流が、適切に定義された生成関数の微分として得られることを示す。
同定された生成関数はまた、基礎となるフレームワークが発散型理論に分類できることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:41 GMT)
Facial Expression Recognition with YOLOv11 and YOLOv12: A Comparative Study [0.0] 本研究では, FER の統一検出・分類フレームワークにおいて, YOLOv11n と YOLOv12n の2つの軽量モデルの性能について検討した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:57:21 GMT)
Entanglement Structure of Nonlocal Field Theories [0.0] 非局所性は、従来の時空の幾何学的モデルが短くなるような複雑さの量子状態を引き起こすことを示す。
我々の結果は、非局所性は、従来の時空の幾何学的モデルが短くなるような複雑さの量子状態を引き起こすことを示した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:55:19 GMT)
Enhancing Group Recommendation using Soft Impute Singular Value Decomposition [0.0] グループレコメンダシステムは、利用可能なデータの空間性と高次元性のためにしばしば苦労する。
ソフトインプット特異値分解を利用してグループレコメンデーションを強化するグループソフトインプットSVDというグループレコメンデーションシステムを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:13:56 GMT)
Enhancing Graph Representations with Neighborhood-Contextualized Message-Passing [0.0] 本稿では,注目変数の重要な性質に根ざした近傍文脈化の概念を定式化する。
NCMPのパラメトリゼーションと運用のための簡易で実用的で効率的な方法を提案する。
合成二分ノード分類問題に関する予備的解析は、提案したGNNアーキテクチャの表現性と効率性の両方を強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 08:00:19 GMT)
Enhancing Efficiency of Pension Schemes through Effective Risk Governance: A Kenyan Perspective [0.0] 本研究は,ケニアにおける企業経営と年金制度の効率性との関連性に対するリスクマネジメントの影響について検討した。
調査によると、リスクマネジメントは、理事会の従業員代表者間の関係を著しく仲介している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:46:13 GMT)
Enhanced Anonymous Credentials for E-Voting Systems [0.0] 電子投票システムにおける永遠のプライバシーを達成するためのシンプルで実用的な方法は、匿名投票者の認証情報を使用することである。
本稿では, 匿名認証機構の簡易化について検討し, 完全に隠蔽されたコミットメントを用いて, その認証情報を有権者の身元にリンクする。
発行された投票が投票者の身元に繋がらないよう保証するが、投票と投票監査の間に必要な一貫性チェックを可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:42:21 GMT)
Enabling Predictive Maintenance in District Heating Substations: A Labelled Dataset and Fault Detection Evaluation Framework based on Service Data [0.0] 本稿では,EnergyFaultDetectorで実装されたサービスレポート検証公開データセット,正確性,信頼性,公平性に基づく評価手法,ベースライン結果を組み合わせたオープンソースフレームワークを提案する。
このデータセットには、2つのメーカーにわたる93のサブステーションからの一連の運用データが含まれており、障害やメンテナンス動作による障害のリストがアノテートされている。
本研究では,3つの指標を用いてEnergyFaultDetectorを評価した。正常な動作を認識する精度,エラーアラームが少ない信頼性障害検出のためのFスコア,早期検出のためのEnergyFaultDetector,早期検出のためのEnergyFaultDetectorである。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 13:31:24 GMT)
Emergent spin order and steady-state superradiance in one-dimensional baths [0.0] 駆動原子アンサンブルにおける自発的な集団崩壊は、平衡から遠く離れたコヒーレンスを生成することができる。
2つのモデルを用いて1次元電磁浴に結合した原子を解析する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:00:55 GMT)
Electrical thermography via centimetre-scale fiber-based distributed temperature sensing [0.0] Raman-based Distributed Temperature Sensor (RDTS) with centimetre-scale resolution for thermographic analysis of Electronic circuits (特集:電子回路)
温度は、カスタムプリント基板にルーティングされた単一モードファイバーに沿って測定される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:29:36 GMT)
Efficient computation of quantum time-optimal control [0.0] 本稿では,量子ブラキストロン法とラックス対法を組み合わせた量子系の時間-最適制御法を提案する。
結合の2乗の固定和で、最も近い近傍に結合した無限大の量子ビット格子において、単一粒子の励起を転送する最も高速な方法を見出すことにより、本手法について説明する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:29:16 GMT)
Efficient circuits for leaf-separable state preparation [0.0] 本稿では,葉分離可能な量子状態の効率向上のために,対数深さディック状態回路とハミング重みエンコーダを組み合わせた状態準備アルゴリズムを提案する。
本研究では, 4 から 15 キュービットのランダムに生成したターゲット状態に対して, 数値シミュレーションによりアルゴリズムの性能を評価する。
これらの結果は、ディック状態やニアディッケ状態のような構造化入力を必要とする量子アルゴリズムのスケーラブルな状態準備に寄与する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 12:30:08 GMT)
Efficient Automated Diagnosis of Retinopathy of Prematurity by Customize CNN Models [0.0] 我々は,高精度かつ効率的なROP検出のためのCNNベースのアプローチの精細化と評価に重点を置いている。
その結果, 事前訓練したモデルよりもCNNモデルの方が優れており, 精度が向上し, F1スコアが向上した。
我々は、これらのモデルを専用のソフトウェアやハードウェア構成にデプロイする可能性を示し、臨床現場で貴重な診断支援として有用であることを強調した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:26:55 GMT)
Differentiation Strategies for Acoustic Inverse Problems: Admittance Estimation and Shape Optimization [0.0] JAX-FEM の自動微分 (AD) は, スパース圧力測定から複素境界アプタンスを直接的に推定できることを示す。
JAX-FEMを前方シミュレーションに、PyTorch3DをADによるメッシュ操作に組み合わせ、ランダム化有限差分を音響形状最適化に適用する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:46:05 GMT)
Differences in the Moral Foundations of Large Language Models [0.0] ジョナサン・ハイト(Jonathan Haidt)の影響力のある道徳的基礎理論(MFT)を用いて、幅広いモデルの合成実験を行う。
本調査では,ヒトのベースラインに対する大きな言語モデル応答のバイアスとばらつきについて報告する。
私の結果は、モデルが互いに異なる道徳的基盤と全国的に代表される人間のベースラインに依存していることを示唆し、モデル能力が増大するにつれて、これらの違いが増加することを示唆している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:21:22 GMT)
Deep Learning-Enhanced Analysis for Delineating Anticoagulant Essay Efficacy Using Phase Microscopy [0.0] 体から血液を引き出した後の血液の凝固は、血液学的分析において重要な課題となる。
本稿では,デジタルホログラフィー顕微鏡(DHM)を用いた抗凝固薬の生体内効果を規定する深層学習フレームワークを提案する。
本研究では,ヒト血液サンプルを解析し,正確な細胞数測定と形態学的推定が可能なラベルレス非侵襲的アプローチを実証する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:39:21 GMT)
Data-efficient U-Net for Segmentation of Carbide Microstructures in SEM Images of Steel Alloys [0.0] textbf10アノテート走査型電子顕微鏡画像からトレーニングした軽量なU-Net(30.7Mパラメータ)を用いたデータ効率のセグメンテーションパイプラインを提案する。
限られたデータにもかかわらず、我々のモデルである textbfDice-Srensen は0.98 の係数を達成し、冶金分野の最先端を著しく上回っている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:01:02 GMT)
Data-driven strategic sensor placement for detecting disinfection by-products in water distribution networks [0.0] 消毒副産物はヒトの健康に長期的な影響をもたらす汚染物質である。
本稿では,消毒副生成物を検出するための戦略的センサ配置を支援するシミュレーションソフトウェアDBPFinderを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 10:37:21 GMT)
Crossing Symmetry and Entanglement [0.0] 局所量子場理論における2-2$散乱における交叉対称性と絡み合いの相互作用について検討する。
我々は、$SU(N)$大域対称性を実現する相互作用量子場理論は、少なくとも1つの散乱チャネルにおいて絡み合わなければならないと主張する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:41 GMT)
Cost Transparency of Enterprise AI Adoption [0.0] 本研究では,言語スタイルの微妙な変化が,応答品質に影響を与えることなく,出力トークンの数を変化させることを示す。
非政治的なプロンプトは、企業コストの上昇とOpenAIのさらなる収益につながるアウトプットトークンを著しく増加させる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:51:31 GMT)
Contrasting GHZ and W-state Entanglement Dynamics due to Correlated Markov Noise [0.0] ノイズ源間の相関が,マルチパーティント絡みの力学に影響を及ぼすことを示す。
環境相互作用にも拘わらず,マルチパーティの絡み合いが持続できる体制を同定する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:56 GMT)
Continuum limit of gauged tensor network states [0.0] ある種のゲージ付きテンソルネットワークの連続極限がよく定義されることを示す。
このことは、連続体におけるゲージ理論の非摂動研究に役立つかもしれない新しい状態のクラスに繋がる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:37:57 GMT)
Constrained Network Slice Assignment via Large Language Models [0.0] ネットワークスライシングのための無線リソース割り当てにLarge Language Models (LLMs) を用いる方法について検討する。
ゼロショットプロンプトであっても、LLMはスライス代入の合理的な第1ドラフトを生成することができることを示す。
次に、LLMのサービス要求に対する理解を最適化解決器に組み込んで、改善されたアロケーションを生成する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 07:47:42 GMT)
Computing the Formal and Institutional Boundaries of Contemporary Genre and Literary Fiction [0.0] 本研究は,ジャンルの音質を形式的指定として探索するために,計算手法を用いる。
我々は、ロマンス、ミステリー、SF小説を含む文学とジャンルのフィクションのコーパスを組み立てる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:57:21 GMT)
Competing Localizations on Disordered Non-Hermitian Random Graph Lattice [0.0] 一般化ランダムグラフグラフ上でのタイトな結合モデルを用いて,非エルミート皮膚効果(NHSE)の局在化と非局在化遷移と挙動について検討した。
以上の結果から,スキンエフェクト駆動とアンダーソン駆動によるパラメータの局在の競合が示唆された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:35:51 GMT)
Compact cavity-dressed Hamiltonian framework at arbitrarily strong light-matter coupling [0.0] 量子化場モード(キャビティ)に強く結合した量子系に対する非摂動ハミルトン写像法を提案する。
完全極限に収束する一連のコンパクトモデルを構築し、挑戦的共鳴と超強光マター状態においても従来のアプローチより優れている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:17:50 GMT)
Cogent argument extensions are weakly admissible but not vice versa [0.0] 我々は2つの非許容的議論フレームワークセマンティクス(コジェントと弱許容的セマンティクス)の関係を示す。
コージェント拡大は弱許容可能であるが、逆は真ではないことを証明している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:01:14 GMT)
Closing the Gap: Data-Centric Fine-Tuning of Vision Language Models for the Standardized Exam Questions [0.0] 高品質なデータによる教師付き微調整は、プロプライエタリなアプローチと競合する可能性があることを示す。
以上の結果から,データ合成と表現構文がマルチモーダル推論において決定的な役割を果たすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:28:14 GMT)
CertiA360: Enhance Compliance Agility in Aerospace Software Development [0.0] CertiA360は、チームが要求の成熟度を改善し、トレーサビリティの変更を自動化し、規制の目的に合わせるために設計されたツールである。
このツールは航空宇宙業界の専門家との密接なコラボレーションで設計され、実際の応用と実生活の有効性を確保するために彼らのフィードバックを用いて評価された。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 18:41:11 GMT)
Causal measurement in quantum field theory: spacetime [0.0] 本研究は,時間拡張可観測物の測定が自分自身に逆反応し,その因果未来における他の測定値との相関関係を導出することを示す。
我々のフレームワークは時空で完全に構成されており、瞬時観測値の測定に関する以前の結果を拡張している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:47 GMT)
CardioEmbed: Domain-Specialized Text Embeddings for Clinical Cardiology [0.0] 本研究は,7つの総合心臓学教科書のキュレートコーパスを用いたコントラスト学習を用いて,Qwen3-Embedding-8Bに基づくドメイン特化埋め込みモデルであるCardioEmbedを訓練した。
このモデルでは、InfoNCE損失とバッチ内の負の値を使い、心特異的なセマンティック検索タスクにおいて99.60%の精度を達成している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 03:38:48 GMT)
CVChess: A Deep Learning Framework for Converting Chessboard Images to Forsyth-Edwards Notation [0.0] 本稿では,チェスボード画像をForsyth-Edwards Notation (FEN)に変換するフレームワークであるCVChessを提案する。
本手法では,スマートフォンカメラ画像から断片認識を行うために,残層を有する畳み込みニューラルネットワーク(CNN)を用いる。
結果として得られる分類はFEN文字列としてエンコードされ、最も最適な動きを生成するためにチェスエンジンに入力することができる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:50:35 GMT)
CORONA-Fields: Leveraging Foundation Models for Classification of Solar Wind Phenomena [0.0] 主な宇宙気象要因は太陽風とコロナ質量放出である。
我々は、太陽物理学の基礎モデルを適用し、太陽風構造解析に適した埋め込みを作成する。
最初の概念実証として、より信頼性の高い宇宙天気予報に向けた将来の改善の土台を築いている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:36 GMT)
Bridging Hidden States in Vision-Language Models [0.0] VLM(Vision-Language Models)は、画像コンテンツと自然言語を結びつける新しいモデルのファミリーである。
両エンコーダの上部付近に配置された,クロスオンリーで双方向の注意層を複数配置した軽量核融合モジュールを提案する。
エンコーダは非因果的であり、理解するために強く、生成はオプションのデコーダを介してクリーンに分離される。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:55:25 GMT)
Bridging Constraints and Stochasticity: A Fully First-Order Method for Stochastic Bilevel Optimization with Linear Constraints [0.0] この研究は、一階法のみを用いた線形制約付き双レベル最適化に対する最初の有限時間収束保証を提供する。
線形制約、雑音、有限時間解析を両レベル最適化において同時に扱うという前例のない課題に対処する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:12:42 GMT)
Brian Intensify: An Adaptive Machine Learning Framework for Auditory EEG Stimulation and Cognitive Enhancement in FXS [0.0] 本稿では、周波数特異的聴覚刺激による神経振動の変調を目的とした、適応型機械学習ベースの脳-コンピュータインタフェース(BCI)を提案する。
教師付き機械学習フレームワークは、脳波応答を予測し、刺激パラメータを動的に調整し、リアルタイム、主題固有の適応を可能にする。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:08:40 GMT)
Binary BPE: A Family of Cross-Platform Tokenizers for Binary Analysis [0.0] 本稿では,バイナリの大規模なコーパス上でトレーニングされた実行可能ファイルに対して,クロスプラットフォームなトークン化を行うBinary BPEトークン化ファミリを紹介する。
我々は,4K,8K,16K,32K,64Kトークンの語彙で訓練されたトークンライザをリリースし,体系的スケーリング研究と実践的展開の両立を可能にした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:53:03 GMT)
Bidimensional measurements of photon statistics within a multimodal temporal framework [0.0] 我々は,ピコ秒分解能を持つ2次元空間におけるコヒーレント光子統計と熱光子統計の区別が可能であることを示す。
同時に、回収された分布は、真空汚染の結果、理想的な分布から逸脱することがわかった。
このことは、2次元光子統計量を測定するための堅牢なアプローチを確立し、そのような測定の忠実さを制限する基本的な要因を明らかにしている。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 15:30:03 GMT)
Beyond the Hype: Critical Analysis of Student Motivations and Ethical Boundaries in Educational AI Use in Higher Education [0.0] 学生の92%が、主に時間を節約し、仕事の質を向上させるためにAIツールを使用しています。
我々は、技術スキルと倫理的推論を統合する包括的なAIリテラシープログラムを採用する必要があると主張している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 14:49:29 GMT)
Balancing Centralized Learning and Distributed Self-Organization: A Hybrid Model for Embodied Morphogenesis [0.0] 本研究では,学習可能な脳様のコントローラを細胞様のグレースコット基質に結合して,最小限の努力でステアパターン形成を行う方法について検討する。
コンパクトな畳み込みポリシは、微分可能なPyTorch反応拡散シミュレータに埋め込まれる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:32:44 GMT)
Autonomous Underwater Cognitive System for Adaptive Navigation: A SLAM-Integrated Cognitive Architecture [0.0] 本稿では,複雑な海洋環境下での適応航法を実現するために,自律型水中認知システム(AUCS)を提案する。
AUCSは、動的オブジェクトと静的オブジェクトを区別するために、意味理解、適応センサー管理、メモリベースの学習を取り入れている。
この研究は、次世代の認知潜水システムの基礎を築き、深海探査における安全性、信頼性、自律性を改善した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:07:56 GMT)
Automated Analysis of Learning Outcomes and Exam Questions Based on Bloom's Taxonomy [0.0] 本稿では,ブルームの分類に基づく試験質問と学習結果の自動分類について検討する。
6つの認知カテゴリをラベル付けした600文の小さなデータセットを、従来の機械学習(ML)モデルを用いて処理した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 02:31:12 GMT)
Assessing the Applicability of Natural Language Processing to Traditional Social Science Methodology: A Case Study in Identifying Strategic Signaling Patterns in Presidential Directives [0.0] 本研究では、自然言語処理(NLP)を用いて、より大規模な文書データから主要なトピックを抽出する方法について検討する。
アナリストとNLPはともに関連文書を特定し、大規模なコーパスを含む研究におけるNLPの潜在的有用性を示した。
また,本症例におけるNLPの有効性を評価するために,NLPと人為的ラベル付け結果の相違点を明らかにした。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:07:12 GMT)
Answering Students' Questions on Course Forums Using Multiple Chain-of-Thought Reasoning and Finetuning RAG-Enabled LLM [0.0] 本稿では,検索拡張生成法(RAG)を用いた大規模言語モデルに基づく質問応答システムを提案する。
本研究は,オープンソースのLarge Language Model (LLM) を用いた質問応答システムを設計し,関連するコースデータセットに基づいて微調整することに焦点を当てる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:11:55 GMT)
Analysis of the TAIGA-HiSCORE Data Using the Latent Space of Autoencoders [0.0] 広範囲のエアシャワー分析(EAS)の目的は、シャワーを発生させた一次粒子の物理的パラメータを再構築することである。
現在、IACTとAIGA-HiSCOREのデータを分析するために、記録信号から各検出器タイプ固有の補助パラメータのセットを算出する。
本稿では,AIGA実験データの解析にオートエンコーダ(AE)を用い,従来の補助パラメータをAE潜在空間のパラメータに置き換えることを提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:24 GMT)
An Efficient and Almost Optimal Solver for the Joint Routing-Assignment Problem via Partial JRA and Large-α Optimization [0.0] JRA(Joint Routing-Assignment)最適化問題は、プレースホルダーへのアイテムの割り当てと、各ノードペアを正確に1度訪問するハミルトンサイクルを決定する。
これまでの研究では、データセットとGurobi実装とともに、正確な混合整数プログラミング(MIP)ソルバが導入されていた。
本研究は, 大規模JRA問題に対する高精度, ほぼ最適解を実現する新しい, より効率的な手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:00:10 GMT)
An Analysis of Architectural Impact on LLM-based Abstract Visual Reasoning: A Systematic Benchmark on RAVEN-FAIR [0.0] GPT-4.1-Miniは全アーキテクチャで最高精度を達成した。
それぞれのモデルは、アーキテクチャ設計に対して異なる感度パターンを示し、推論の有効性がモデル固有のものであることを強調した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 22:50:22 GMT)
Alignment Debt: The Hidden Work of Making AI Usable [0.0] このアライメント負債は、AIシステムが文化的、言語的、インフラ的、または疫学的な文脈と整合しない場合に生じるユーザー側の負担である。
我々はケニアとナイジェリアの411人のAIユーザーを対象に、アライメント負債の4つの分類法を開発し、検証した。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:02:59 GMT)
AI as a component in the action research tradition of learning-by-doing [0.0] 我々は行動研究、ハッキング、発見、調査、学習・バイ・ドーピングを通じて数学を学ぶことを検討する。
自己認識、型、関数、構造化図面、形式図に基づく学習モデルは、ドリルと練習の弱点に対処する。
この伝統は対話と数学の役割を強調している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 16:14:57 GMT)
A Neuromorphic Architecture for Scalable Event-Based Control [0.0] 本稿では、スケーラブルなニューロモルフィック制御アーキテクチャの基本要素として、リバウンドなWinner-Take-All(RWTA)のモチーフを紹介する。
本稿では,ヘビロボットの神経系設計を通じて,アーキテクチャの汎用性,堅牢性,モジュール性について説明する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 23:08:56 GMT)
A Leakage-Aware Data Layer For Student Analytics: The Capire Framework For Multilevel Trajectory Modeling [0.0] 本稿では,学生軌跡分析のための漏洩認識データ層を提案する。
N1(個人的・社会経済的属性)、N2(エントリーモーメントと学術的歴史)、N3(曲的摩擦と性能)、N4(制度的・マクロコンテキスト変数)の4つのレベルに予測者を編成する特徴工学設計を提案する。
長期サイクルエンジニアリングプログラム(学生1,343人、57%のドロップアウト)における実証的な応用は、VOT制限されたマルチレベル特徴が堅牢な考古学的発見をサポートすることを示している。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 20:52:22 GMT)
A Comparison of Lightweight Deep Learning Models for Particulate-Matter Nowcasting in the Indian Subcontinent & Surrounding Regions [0.0] 本論文は,Weather4Cast2025相補汚染課題の提出である。
PM$_1$、PM$_2.5$、PM$_10$をインド亜大陸とその周辺地域で6時間リードタイム・ナッシングするための効率的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 11:30:12 GMT)
A Comparative Evaluation of Prominent Methods in Autonomous Vehicle Certification [0.0] 1997年にスウェーデン議会によって導入された「ビジョンゼロ」政策は、交通事故による死者と重傷を除去することを目的としている。
この目標を達成するために、交通における自動運転車の利用を想定し、自動運転車の認定のロードマップを決定することを目的としている。
本稿では,自動運転車の認証プロセスに使用される重要な手法の比較評価に焦点をあてる。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 17:00:40 GMT)
3DFETUS: Standardizing Fetal Facial Planes in 3D Ultrasound [0.0] 我々は,注釈付き解剖学的ランドマークを用いて,標準的な顔面を3DUSボリュームから推定する頑健なアルゴリズムであるGT++と,その3DUSボリュームのローカライゼーションを自動化するディープラーニングモデルである3DFETUSを提案する。
提案手法は平均翻訳誤差4.13mmと平均回転誤差7.93°を達成し、3DUSボリュームの他の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Nov 2025 01:50:00 GMT)