Variation-Bounded Loss for Noise-Tolerant Learning [105.2] 本稿では,損失関数のロバスト性に関連する新しい特性として,変分比を導入する。
本稿では,有界変動比を特徴とする,ロバストな損失関数である変分境界損失(VBL)を新たに提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:15:29 GMT)
Calibrated Multimodal Representation Learning with Missing Modalities [100.6] マルチモーダル表現学習は、それらを統一潜在空間に整列させることにより、異なるモダリティを調和させる。
最近の研究は、従来のクロスモーダルアライメントを一般化して、強化されたマルチモーダル・シナジーを生成するが、すべてのモダリティを共通の例に含める必要がある。
我々は、アンカーシフトの観点から、この問題に関する理論的洞察を提供する。
モーダルの欠如に起因する不完全なアライメントを校正するために,マルチモーダル表現学習のためのCalMRLを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:01:43 GMT)
Reward and Guidance through Rubrics: Promoting Exploration to Improve Multi-Domain Reasoning [79.4] マルチドメイン推論のためのフレームワークである $textbfRGR-GRPO (Reward and Guidance through rubrics) を提案する。
RGR-GRPOは、代替の報酬スキームやオフラインガイダンスにのみ依存するRLメソッドよりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:14:51 GMT)
AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing [79.0] 我々はTeleSalesCorpusをリリースした。
次に、デュアルステージアーキテクチャを特徴とする新しいフレームワークであるAI-Salesmanを提案する。
提案したAI-Salesmanは,自動測定と総合的な人的評価の両方において,ベースラインモデルを大幅に上回ることを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:44:42 GMT)
Teaching Prompts to Coordinate: Hierarchical Layer-Grouped Prompt Tuning for Continual Learning [69.2] 連続学習のための階層型階層型プロンプトチューニング手法を提案する。
i) 同じグループの層がほぼ同じプロンプトを共有し、位置符号化によって調整される。
単一のタスク固有のルートプロンプトを使用して、各レイヤグループのサブプロンプトを生成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:15:51 GMT)
Sparse by Rule: Probability-Based N:M Pruning for Spiking Neural Networks [66.6] スパイキングニューラルネットワーク(SNN)は、イベント駆動のスパース計算を通じてエネルギー効率の高いインテリジェンスを約束するが、より深いアーキテクチャはパラメータと計算コストを増大させ、エッジデプロイメントを妨げている。
SNNプルーニングの最近の進歩は、この負担を軽減するのに役立っているが、既存の取り組みは、スパシティが高いが一般的なハードウェアでは加速が難しいインハン構造化プルーニング(emphunstructured pruning)と、デプロイが容易だが柔軟性に欠けるエンハン構造化プルーニング(emphstructured pruning)の2つのファミリーに限られる。
最初のSNNであるbfSpikeNMを紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:23:20 GMT)
Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.2] Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:39:22 GMT)
AttackVLA: Benchmarking Adversarial and Backdoor Attacks on Vision-Language-Action Models [60.4] VLA(Vision-Language-Action)モデルは、ロボットが自然言語の命令を解釈し、多様なタスクを実行することを可能にするモデルである。
このようなモデルを攻撃することへの関心は高まっているが、既存の手法の有効性は依然として不明である。
我々はVLA開発ライフサイクルに合わせて統合されたフレームワークであるAttackVLAを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:30:46 GMT)
Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought Explanations [60.3] 系統的な推論連鎖の摂動とデリバリートーンの操作による道徳シナリオにおけるCoT(Chain-of-Thought)の説明の役割について検討した。
1) 利用者は, 根拠に欠陥がある場合でも, 信頼感を保ち, 結果合意を信頼する傾向がみられた。
これらの結果は、CoTの説明が同時に明確化と誤解を招き、視覚的信頼よりも精査と批判的思考を奨励する説明を提供するNLPシステムの必要性を強調している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:38:49 GMT)
Mixture of States: Routing Token-Level Dynamics for Multimodal Generation [60.2] マルチモーダル拡散モデルのための新しい融合パラダイムであるMoS(Mixture of States)を紹介する。
MoSは学習可能なトークン指向ルータで、遅延時間ステップと入力依存のインタラクションを生成する。
我々は,画像のテキスト生成と編集による設計の検証を行い,その結果を得た。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:24:57 GMT)
GCAgent: Long-Video Understanding via Schematic and Narrative Episodic Memory [59.9] GCAgent(Global-Context-Aware Agent)は,広義の長ビデオ理解を実現する新しいフレームワークである。
これは、イベントとその因果関係と時間的関係を、簡潔で組織化されたコンテキストに構造的にモデル化するものです。
実験により、GCAgentは、強力なMLLMベースライン上でのVideo-MME Long分割において、最大23.5%の精度向上を実現した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:29:00 GMT)
Mobile-Agent-RAG: Driving Smart Multi-Agent Coordination with Contextual Knowledge Empowerment for Long-Horizon Mobile Automation [57.1] モバイルエージェントは膨大な可能性を示しているが、現在のSoTA(State-of-the-art)エージェントは、現実世界、長期的、クロスアプリケーションタスクに不適切な成功率を示す。
本稿では,新しい階層型マルチエージェントフレームワークであるMobile-Agent-RAGを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:22:42 GMT)
Look As You Think: Unifying Reasoning and Visual Evidence Attribution for Verifiable Document RAG via Reinforcement Learning [55.2] Look As You Think (LAT)は、モデルをトレーニングし、一貫した帰属性を持った検証可能な推論パスを生成するための強化学習フレームワークである。
LATはシングルイメージとマルチイメージの両方でバニラモデルを一貫して改善し、平均ゲインは8.23%、IoU@0.5では47.0%となる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:50:23 GMT)
On the Entropy Calibration of Language Models [52.5] 本研究では,言語モデルのエントロピーが人間のテキスト上でのログ損失と一致しているかを問うエントロピーキャリブレーションの問題について検討する。
観測されたスケーリングの挙動は、単純化された設定によって予測されるものと類似していることがわかった。
将来的なテキストのエントロピーを予測するために,モデルに適合するブラックボックスへのアクセスを前提にすれば,それが可能であることが証明できる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:33:03 GMT)
GateRA: Token-Aware Modulation for Parameter-Efficient Fine-Tuning [51.8] GateRAは、PEFT更新の強度を動的に調整するトークン対応変調を導入する統一フレームワークである。
適応ゲーティングを標準のPEFTブランチに組み込むことで、Gateraは選択的でトークンレベルの適応を可能にする。
複数のコモンセンス推論ベンチマークの実験により、GateRAはPEFT法よりも一貫して優れ、一致していることが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:55:47 GMT)
LiDAR-GS++:Improving LiDAR Gaussian Reconstruction via Diffusion Priors [51.7] 実時間および高忠実度再シミュレーションのための拡散前処理により強化された再構成手法であるLiDAR-GS++を提案する。
具体的には、粗い外挿レンダリングを条件とした制御可能なLiDAR生成モデルを導入し、余分な幾何整合性スキャンを生成する。
再構成を未適合領域にまで拡張することにより,外挿的視点に対するグローバルな幾何整合性を確保することができる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:33:12 GMT)
PriVi: Towards A General-Purpose Video Model For Primate Behavior In The Wild [50.7] 大規模な霊長類中心のビデオ事前トレーニングデータセットであるPriViを紹介する。
大規模ビデオモデルであるV-JEPAをPriVi上でプレトレーニングし、霊長類固有の表現を学習する。
その結果、霊長類中心の事前学習はデータ効率と一般化を大幅に改善することが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:24:28 GMT)
ZoomEarth: Active Perception for Ultra-High-Resolution Geospatial Vision-Language Tasks [50.0] 既存の動的解像度とトークンプルーニング法は受動的知覚パラダイムによって制約される。
本稿では,UHR RS処理におけるアクティブな認識に適した大規模ベンチマークデータセット LRS-GRO を提案する。
ZoomEarthは,より詳細なガイダンスを提供する新しい地域誘導報酬を用いた適応的収穫・造粒フレームワークである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:47:46 GMT)
PAN: A World Model for General, Interactable, and Long-Horizon World Simulation [49.8] PANは、汎用的で対話性があり、長い水平世界モデルである。
歴史と自然言語のアクションを前提とした高品質なビデオシミュレーションにより、将来の世界の状態を予測します。
実験により, PANは行動条件付き世界シミュレーション, 長期予測, シミュレーション推論において高い性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:07:10 GMT)
Suppressing VLM Hallucinations with Spectral Representation Filtering [49.5] 視覚言語モデル(VLM)は、画像に存在しないオブジェクト、属性、関係の記述の形で幻覚をしばしば生成する。
本稿では,モデル表現の共分散構造を解析し,補正することにより,このような幻覚を抑制するための軽量な訓練不要な手法であるスペクトル表現フィルタ(SRF)を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:49:27 GMT)
AlignTree: Efficient Defense Against LLM Jailbreak Attacks [48.8] 大規模言語モデル(LLM)は、安全ガイドラインをバイパスし有害なコンテンツを生成する敵攻撃に対して脆弱である。
最小限の計算オーバーヘッドを維持しながらモデルアライメントを向上させるAlignTreeディフェンスを導入する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:42:22 GMT)
Debate over Mixed-knowledge: A Robust Multi-Agent Framework for Incomplete Knowledge Graph Question Answering [47.6] Debate over Mixed-knowledge (DoM)は構造化知識と非構造化知識の動的統合を可能にする新しいフレームワークである。
DoMは専門エージェントを割り当て、知識グラフや外部テキストに対する推論を行う。
実世界の知識更新を活用して構築した,新しいデータセットである不完全知識グラフWebQuestionsを導入する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:31:42 GMT)
A novel strategy for multi-resource load balancing in agent-based systems [45.9] 本稿では,エージェントベースシステム内で利用可能なマルチリソースロードバランシング戦略を提案する。
エージェントの社会的行動とその適応能力を適用して、所定の設定に対して最適な設定を決定する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:05:23 GMT)
Seeing is Believing: Rich-Context Hallucination Detection for MLLMs via Backward Visual Grounding [44.7] VBackCheckerは参照なし幻覚検出フレームワークである。
これは、推論と参照セグメンテーション機能を備えたピクセルレベルのグラウンディングLLMを活用することで機能する。
また,MLLMの新しい幻覚ベンチマークR2-HalBenchを作成した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:11:13 GMT)
MAVIS: A Benchmark for Multimodal Source Attribution in Long-form Visual Question Answering [44.4] マルチモーダルソース属性システムを評価するための最初のベンチマークであるMAVISを紹介する。
我々のデータセットは157Kの視覚的QAインスタンスで構成されており、各回答にはマルチモーダル文書を参照したファクトレベルの引用が注釈付けされている。
本研究では,情報性,接地性,流感の3次元に沿って細粒度自動測定値を作成し,人間の判断と強い相関関係を示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:14:59 GMT)
Learning Time in Static Classifiers [44.4] 本稿では,標準フィードフォワード分類器と時間的推論を併用した,シンプルで効果的なフレームワークを提案する。
本稿では, 時間的コヒーレントなトラジェクトリに学習データを構造化するSEQ学習パラダイムを提案する。
我々のアプローチは静的および時間的学習をモジュール的でデータ効率のよい方法でブリッジし、事前抽出された機能の上に単純なものだけを必要とする。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:42:51 GMT)
OmniSparse: Training-Aware Fine-Grained Sparse Attention for Long-Video MLLMs [43.8] OmniSparseは、長時間ビデオMLLMのための、トレーニング対応のきめ細かなスパークアテンションフレームワークである。
実験結果から,OmniSparseはプリフィル時の2.7倍,デコード時の2.4倍のメモリ削減を実現しつつ,全注目性能と一致していることがわかった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:14:17 GMT)
CrossVid: A Comprehensive Benchmark for Evaluating Cross-Video Reasoning in Multimodal Large Language Models [35.3] クロスビデオ推論(CVR)は、複数のビデオの同時理解を必要とし、ビデオのグループ間で情報を集約し比較する。
既存のビデオ理解ベンチマークのほとんどはシングルビデオ分析に重点を置いており、マルチモーダルな大規模言語モデル(MLLM)が様々な動画を同時に推論できる能力の評価に失敗している。
最近のベンチマークでは、同一シーンの異なる視点を捉えたマルチビュービデオにおいてMLLMの能力を評価している。
我々は,MLLMの空間時間推論能力をクロスビデオ・コンテキストで包括的に評価する最初のベンチマークであるCrossVidを紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:41:38 GMT)
SenseRay-3D: Generalizable and Physics-Informed Framework for End-to-End Indoor Propagation Modeling [35.3] SenseRay-3Dは、RGB-Dスキャンから直接3Dパスロスヒートマップを予測するエンドツーエンドフレームワークである。
合成屋内伝播データセットは、将来の研究の標準ベンチマークとして機能するように開発されている。
SenseRay-3Dは、目に見えない環境で平均4.27dBの絶対誤差を達成し、サンプルあたり217msのリアルタイム推論をサポートする。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:17:49 GMT)
Adaptive Diagnostic Reasoning Framework for Pathology with Multimodal Large Language Models [34.3] 本稿では,自己学習パラダイムを確立するための解釈可能なフレームワークRECAP-PATHを提案する。
既成のマルチモーダルな大規模言語モデルから、受動的パターン認識からエビデンスにリンクされた診断推論へと移行する。
この自己学習アプローチでは、小さなラベル付きセットのみを必要とし、がん診断を生成するためのホワイトボックスアクセスやウェイト更新は不要である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:06:59 GMT)
Learning from Dense Events: Towards Fast Spiking Neural Networks Training via Event Dataset Distillatio [33.3] イベントカメラは明るさの変化を感知し、バイナリ非同期イベントストリームを出力する。
彼らのバイオインスパイアされたダイナミクスはニューラルネットワーク(SNN)とよく一致しており、従来のビジョンシステムに代わる有望なエネルギー効率の代替手段を提供する。
本稿では,SNNにおける最初のデータセット蒸留フレームワークであるbfPACE(text-Aligned Condensation for Events)を紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:20:47 GMT)
ViTE: Virtual Graph Trajectory Expert Router for Pedestrian Trajectory Prediction [32.3] ViTE (Virtual graph Trajectory Expert router) は歩行者軌道予測のための新しいフレームワークである。
ViTEは2つの重要なモジュールで構成されている。ダイナミックな仮想ノードを導入し、GNNスタックを含まない長距離および高次のインタラクションをモデル化する仮想グラフと、ソーシャルコンテキストに基づいてインタラクションエキスパートを適応的に選択するエキスパートルータだ。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:36:07 GMT)
MF-Speech: Achieving Fine-Grained and Compositional Control in Speech Generation via Factor Disentanglement [31.8] 本稿では,MF-SpeechEncoderとMF-SpeechGeneratorの2つのコアコンポーネントからなる,MF-Speechと呼ばれる新しいフレームワークを提案する。
MF-SpeechEncoderは、元の音声信号をコンテンツ、音色、感情の非常に純粋な表現に分解するために、多目的最適化戦略を採用する。
MF-SpeechGeneratorは導体として機能し、動的融合と階層的スタイル適応正規化を通じてこれらの因子の精密で構成可能できめ細かい制御を実現する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:30:51 GMT)
Mitigating Negative Flips via Margin Preserving Training [30.1] AIシステムの連続バージョン間の矛盾を最小限に抑えることは、全体的なエラーを減らすのと同じくらい重要である。
画像分類において、そのような矛盾は負のフリップとして現れ、更新されたモデルは以前に正しく分類されたテストサンプルを誤って分類する。
本稿では,改良版を学習しながら,オリジナルモデルのマージンを保存する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:15:28 GMT)
Finding Time Series Anomalies using Granular-ball Vector Data Description [29.6] グラニュラーボールワンクラスネットワーク(GBOC)は、グラニュラーボールベクトルデータ記述(GVDD)と呼ばれるデータ適応型表現に基づく新しいアプローチである。
GVDDは、潜在空間をグラニュラーボールで表されるコンパクトで高密度な領域に分割する。
推論中、最も近いグラニュラーボールまでの距離に基づいて異常スコアが計算される。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:24:53 GMT)
Breaking the Modality Wall: Time-step Mixup for Efficient Spiking Knowledge Transfer from Static to Event Domain [28.7] Time-step Mixup Knowledge Transfer (TMKT)は、確率論的なTime-step Mixup(TSM)戦略を備えたクロスモーダルトレーニングフレームワークである。
TMKTは、RGBとDVSの入力を様々な時間ステップで補間してスムーズなカリキュラムを作成することで、SNNの非同期性を利用する。
TMKTは、よりスムーズな知識伝達を可能にし、トレーニング中のモダリティミスマッチを緩和し、スパイク画像分類タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:31:22 GMT)
Learning to Trust: Bayesian Adaptation to Varying Suggester Reliability in Sequential Decision Making [28.7] 我々は、部分的に観測可能な環境において、様々な提案者信頼性を学習し、適応するフレームワークを導入する。
まず,エージェントの信念表現に直接プロジェクタの品質を組み込むことで,エージェントが提案への依存を推論し,調整することができる。
第二に、エージェントが重要な瞬間に戦略的に提案をリクエストできる明示的な質問行動を導入する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:50:20 GMT)
Rethinking Bias in Generative Data Augmentation for Medical AI: a Frequency Recalibration Method [27.7] AI生成モデルを用いた生成データ拡張(GDA)は、現実的な医療画像を合成するためのソリューションを提供する。
本稿では、信頼できないGDAの根底にある重要な要因の一つとして、実画像と合成画像の周波数ずれを同定する。
FreRecは、任意の生成モデルと互換性があり、一般的な医療用GDAパイプラインとシームレスに統合できるスタンドアロンの後処理ステップである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:28:26 GMT)
PRISM of Opinions: A Persona-Reasoned Multimodal Framework for User-centric Conversational Stance Detection [27.6] マルチモーダル・コンバーショナル・スタンス検出(MCSD)は,複雑な議論の中で特定のターゲットに対するユーザの態度を解釈することを目的としている。
最初のユーザ中心のMCSDデータセットである**U-MStance**を導入し、6つの現実世界のターゲットに対して40万以上の注釈付きコメントを含む。
PRISM, a **P*ersona-*R*easoned mult*I**modal **S**tance **M**odel for MCSD。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:35:58 GMT)
HCPO: Hierarchical Conductor-Based Policy Optimization in Multi-Agent Reinforcement Learning [27.2] 本稿では,共同政策の表現能力を直接強化する指揮者型共同政策枠組みを提案する。
また,導体とエージェントのポリシー更新を,性能改善に対応する方向に指示する階層的導体に基づくポリシー最適化アルゴリズムを開発した。
その結果,HCPOは協調効率と安定性に関して,競争力のあるMARLベースラインよりも優れていた。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:19:41 GMT)
KrwEmd: Revising the Imperfect-Recall Abstraction from Forgetting Everything [26.9] 本稿では,この問題に対処する最初の実用的なアルゴリズムであるKrwEmdを提案する。
我々はまずk-recall Winrate機能を導入し、将来と重要な歴史的ゲーム情報の両方を活用することで信号観測情報セットを質的に区別するだけでなく、それらの類似性を定量的に捉える。
そこで我々はKrwEmdアルゴリズムを開発し、地球移動器距離を用いて信号観測インフォセットをクラスタリングし、特徴間の不一致を計測する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:15:50 GMT)
ComLQ: Benchmarking Complex Logical Queries in Information Retrieval [26.6] 情報検索システムは,様々なアプリケーションにまたがる情報過負荷をナビゲートする上で重要な役割を担っている。
これらのベンチマークは、現実世界のシナリオにおける複雑なクエリ上でのIRモデルの性能を十分に評価するためには使用できない。
大規模言語モデル(LLM)を利用してtextbfComplex textbfLogical textbfQueries 用の新しいIRデータセット textbfComLQ を構築する手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:58:21 GMT)
SynWeather: Weather Observation Data Synthesis across Multiple Regions and Variables via a General Diffusion Transformer [26.5] 我々はSynWeatherについて紹介する。SynWeatherは、統一されたマルチリージョンおよび多変量気象観測データ合成のために設計された最初のデータセットである。
SynWeatherは、米国大陸、ヨーロッパ、東アジア、熱帯サイクロンの4つの代表地域をカバーしている。
これは、複合レーダ反射率、時間的降水、可視光、マイクロ波明度温度など、主要な気象変数の高分解能な観測を提供する。
さらに,Diffusion Transformerフレームワーク上に構築された一般確率型気象合成モデルであるSynWeatherDiffを導入する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:42:18 GMT)
Improved Masked Image Generation with Knowledge-Augmented Token Representations [25.5] マスク付き画像生成(MIG)は、並列トークン予測を可能にすることにより、顕著な効率と高忠実度画像を示す。
我々は,トークンレベルのセマンティック依存関係の明示的な知識を導入する,KA-MIGという新しい知識付加型マスケッド画像生成フレームワークを提案する。
提案手法は,セマンティック依存関係をキャプチャするモデルの能力を効果的に向上し,生成品質が向上することを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:53:21 GMT)
AMaPO: Adaptive Margin-attached Preference Optimization for Language Model Alignment [25.5] オフライン優先最適化は、言語モデルを調整するためのRLHFのよりシンプルでより安定した代替手段を提供する。
本稿では,単純なアルゴリズムであるAdaptive Margin-attached Preference Optimization (AMaPO)を提案する。
AMaPOは、Z正規化と指数的スケーリングによって洗練され、不正なサンプルの勾配を増幅し、それらを正しいものに抑えることによって、学習の取り組みを動的に再配置する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:40:53 GMT)
Continuous-time Discrete-space Diffusion Model for Recommendation [25.4] CDRecは、新しいContinuous-time Discrete-space Diffusion Recommendationフレームワークである。
これは推奨精度と計算効率の両方において優れている。
実世界のデータセットの実験は、推奨精度と計算効率の両方においてCDRecの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:06:57 GMT)
More Than Irrational: Modeling Belief-Biased Agents [25.3] 本稿では,認知的拘束力のあるエージェントに対して,偏見的信念の下で最適に作用する計算合理的(CR)ユーザモデルについて紹介する。
受動的観察から、潜伏するユーザ固有の境界を識別し、バイアスのある信念状態を推定するという課題に対処する。
CRモデルはメモリ容量の異なるレベルに対応する直感的に妥当な振る舞いを生成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 21:14:37 GMT)
Good-for-MDP State Reduction for Stochastic LTL Planning [24.9] 線形時間論理(LTL)で指定された目標を持つ決定過程(MDP)の計画問題について検討する。
最先端のアプローチはマルコフの公式をグッド・フォー・MDP(GFM)オートマトンに変換し、非決定論の制限形式を特徴とする。
本稿では,オートマチック状態の数を大幅に削減する新しいGCM状態空間削減手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:35:24 GMT)
CURE: Cultural Understanding and Reasoning Evaluation - A Framework for "Thick" Culture Alignment Evaluation in LLMs [24.6] 大規模言語モデル(LLM)は、文化的に多様な環境にますます展開されている。
既存の方法は、非文脈的正当性や強制選択判断に重点を置いている。
現実的な状況下でモデルを提示するベンチマークのセットを紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:39:13 GMT)
CriticSearch: Fine-Grained Credit Assignment for Search Agents via a Retrospective Critic [24.4] CriticSearchは詳細なクレジット割り当てフレームワークで、振り返りの批判メカニズムを通じて、密集したターンレベルのフィードバックを提供する。
様々なマルチホップ推論ベンチマークの実験結果は、CriticSearchが既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:06:57 GMT)
Cross-view Joint Learning for Mixed-Missing Multi-view Unsupervised Feature Selection [24.0] 混合損失問題に対処する新しいIMUFS法であるCLIM-FSを提案する。
非負の行列因数分解に基づく特徴選択モデルに、欠落したビューと変数の両方の命令を統合する。
コンセンサスクラスタ構造とクロスビューな局所幾何学構造をフル活用して、シナジスティック学習プロセスを強化する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:34:52 GMT)
No-Regret Strategy Solving in Imperfect-Information Games via Pre-Trained Embedding [23.9] 本稿では,埋め込み空間内でIIEFGの戦略を解くための新しい手法であるEmbedding CFRを提案する。
このアルゴリズムは、孤立した情報集合の機能を相互接続された低次元連続空間に事前訓練し、埋め込みする。
ポーカーの実験では、同じ空間的オーバーヘッドで、エンベディングCFRは、はるかに高速なエクスプロイラビリティ収束を実現する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:04:19 GMT)
Chemistry-Enhanced Diffusion-Based Framework for Small-to-Large Molecular Conformation Generation [23.6] 拡散モデルに基づくフレームワークであるStoLを導入し、小分子データから大規模分子構造を迅速かつ無知識に生成する。
StoLは、トレーニング中にターゲット分子やそれに相当する大きさの構造を見ることなく、LEGOスタイルの分子をゼロから組み立てる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:20:13 GMT)
Multi-Value Alignment for LLMs via Value Decorrelation and Extrapolation [23.4] MVA(Multi-Value Alignment)と呼ばれる新しいフレームワークを提案する。
相互情報の最小化により、多様な人の値間のパラメータ干渉によるアライメントを緩和する。
MVAは、LLMを複数の人間の値と整列させることで、既存のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:33:26 GMT)
ReCast: Reliability-aware Codebook Assisted Lightweight Time Series Forecasting [23.3] 新たなtextbfReliability 対応 textbfCodebook-textbfASsisted textbfTime series forecasting framework (textbfReCast) を提案する。
ReCastは、学習可能なコードブックを使用して、パッチワイドな量子化を通じて、ローカルパターンを個別の埋め込みにエンコードする。
ReCastは、精度、効率、分散シフトへの適応性において、最先端(SOTA)モデルよりも優れていることを示した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:11:05 GMT)
WITNESS: A lightweight and practical approach to fine-grained predictive mutation testing [23.0] WITNESSは、新しい微細な予測突然変異試験手法である。
トレーニングと予測には軽量な古典的機械学習モデルを使用する。
さまざまなシナリオにわたる最先端の予測パフォーマンスを一貫して達成します。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:38:00 GMT)
NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling [23.0] 非統一論理的B-スプライン(NURBS)を用いてテキストから直接高忠実度3DCADモデルを生成する最初のフレームワークであるNURBGenを提案する。
これを実現するために、大言語モデル(LLM)を微調整し、自由形式のテキストをNURBS曲面パラメータを含むキュレートされた表現に変換する。
また,非トリミングなNURBSと解析的プリミティブを組み合わせたハイブリッド表現を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:52:56 GMT)
BudgetLeak: Membership Inference Attacks on RAG Systems via the Generation Budget Side Channel [21.7] メンバーシップ推論攻撃(MIA)は、そのようなリスクを評価するための一般的な手法である。
我々は、RAGシステムにおいて、未探索のサイドチャネルであるジェネレーション予算を特定した。
BudgetLeakは、異なる予算下で応答を探索する新しいメンバーシップ推論攻撃である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:25:04 GMT)
Learning to Hear by Seeing: It's Time for Vision Language Models to Understand Artistic Emotion from Sight and Sound [21.4] 芸術は視覚的要素と聴覚的要素のジョイントデザインを通じて感情を伝えるが、初期の作品のほとんどは人間中心または単一モダリティである。
本稿では,VLMを限定的な事前学習で視聴する2段階のフレームワークであるVision Anchored Audio-Visual Emotion LLM(VAEmotionLLM)を紹介する。
VAEmotionLLMはArtEmoBenchmarkの最先端の結果を達成し、オーディオのみ、ビジュアルのみ、オーディオ視覚ベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:42:02 GMT)
LithoSeg: A Coarse-to-Fine Framework for High-Precision Lithography Segmentation [21.2] リソグラフィセグメンテーションに適した粗大なネットワークLithoSegを提案する。
粗い段階では、最小限の監督力で堅牢性を実現するために、SAM(Segment Anything Model)のためのHuman-in-the-Loopブートストラップ方式を導入する。
その後の微粒化では、粗いマスクを用いて溝幅プロファイルをサンプリングすることにより、2次元分割を1次元回帰問題として再キャストする。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:58:48 GMT)
Consistency Is the Key: Detecting Hallucinations in LLM Generated Text By Checking Inconsistencies About Key Facts [21.1] 大規模言語モデル(LLM)は、しばしば幻覚を生じさせ、現実の知識に根ざしていない事実的誤りのテキストを生成する。
これは、医療、金融、顧客サポートといった分野に深刻なリスクをもたらす。
外部知識ベースを活用できない効率的な検出手法であるCONFACTCHECKを紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:33:02 GMT)
Point Cloud Quantization through Multimodal Prompting for 3D Understanding [20.4] 本稿では,ポイントクラウド解析のための簡易なマルチモーダルプロンプト駆動量子化フレームワークを提案する。
1) 事前訓練されたモデルからのテキスト埋め込みは、視覚的意味論を本質的にエンコードする。
我々は、量子化空間を維持しながら微分可能な離散化を実現するために、Gumbel-Softmax緩和を用いる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:51:10 GMT)
CLAReSNet: When Convolution Meets Latent Attention for Hyperspectral Image Classification [20.4] CLAReSNetは、マルチスケールの畳み込み抽出と、適応的な潜在ボトルネックによるトランスフォーマースタイルの注意を統合するハイブリッドアーキテクチャである。
インド・パインズとサリナスのデータセットで実施された実験は、最先端のパフォーマンスを示し、全体の精度は99.71%と99.96%である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:25:59 GMT)
UniABG: Unified Adversarial View Bridging and Graph Correspondence for Unsupervised Cross-View Geo-Localization [20.3] クロスビュージオローカライゼーションは、クエリ画像と地理的に対応する反対ビュー画像とを一致させる。
我々は,新しい2段階の非教師付きジオローカライズフレームワークであるtextitUniABG$を提案する。
実験は最先端の教師なしのパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:32:52 GMT)
FIA-Edit: Frequency-Interactive Attention for Efficient and High-Fidelity Inversion-Free Text-Guided Image Editing [20.0] FIA-Editは、高忠実で意味論的に正確な編集を実現する、新しいインバージョンフリーフレームワークである。
私たちは、テキストガイド画像編集を臨床応用に拡張した最初の人です。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:45:52 GMT)
Heterogeneous Graph Neural Networks for Assumption-Based Argumentation [19.7] Assumption-Based Argumentation (ABA)における信頼度を近似する最初のグラフニューラルネットワーク(GNN)アプローチを提案する。
GNNを活用するために,仮定やクレーム,ルールをノードとして符号化する依存性グラフ表現を通じて,ABAフレームワークをモデル化する。
我々の研究は、構造化議論におけるスケーラブルな近似推論のための新しい道を開く。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:44:03 GMT)
FaNe: Towards Fine-Grained Cross-Modal Contrast with False-Negative Reduction and Text-Conditioned Sparse Attention [19.5] False Negatives (FaNe) は意味論的に類似したテキストによって誘導され、微粒なクロスモーダルアライメントが不十分である。
FaNeは画像分類、オブジェクト検出、セマンティックセグメンテーションにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:37:21 GMT)
DCMM-Transformer: Degree-Corrected Mixed-Membership Attention for Medical Imaging [19.3] 本稿では,DCMM(Degree-Corrected Mixed-Membership)モデルを自己注意の付加バイアスとして組み込んだ,医用画像解析のための新しいViTアーキテクチャであるDCMM-Transformerを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:55:01 GMT)
DCA-LUT: Deep Chromatic Alignment with 5D LUT for Purple Fringing Removal [18.7] DCA-LUTは紫のフリング除去のための最初のディープラーニングフレームワークである。
この問題の物理的ルーツにインスパイアされた我々は、新しいクロマティック・アウェア・コーディネート・トランスフォーメーション(CA-CT)モジュールを導入する。
学習した5Dルックアップテーブル(5D LUT)により最終色補正を行う。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:11:49 GMT)
Fine-Grained DINO Tuning with Dual Supervision for Face Forgery Detection [18.6] DINOv2のためのDeepFake Fine-Grained Adapter (DFF-Adapter)を提案する。
本手法では,軽量なマルチヘッドLORAモジュールをトランスブロックに組み込む。
提案手法は,現在の複雑な最先端手法に匹敵する,あるいは超越した精度で検出を行う。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:57:21 GMT)
MovSemCL: Movement-Semantics Contrastive Learning for Trajectory Similarity [18.5] 軌道類似性計算のための運動セマンティック・コントラスト学習フレームワークであるMovSemCLを提案する。
MoveSemCLは、生のGPS軌跡を移動セマンティックな特徴に変換し、それらをパッチに分割する。
MoveSemCLは、局所的およびグローバルな軌道パターンを符号化するために、パッチ内およびパッチ間注意を用いており、効率的な階層表現と計算コストの削減を可能にしている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:56:40 GMT)
One target to align them all: LiDAR, RGB and event cameras extrinsic calibration for Autonomous Driving [18.5] 本稿では,イベントカメラ,LiDAR,RGBカメラ間の相対的なポーズを同時に推定する,新しいマルチモーダル外部キャリブレーションフレームワークを提案する。
提案手法のコアとなる3次元キャリブレーションターゲットは,3つのセンシングモードすべてで同時に認識できるように特別に設計・構築されている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:57:39 GMT)
PipeDiT: Accelerating Diffusion Transformers in Video Generation with Task Pipelining and Model Decoupling [18.1] 拡散トランス (DiT) ベースのモデルでは、マーク可能な能力が実証されている。
しかし、彼らの実践的なデプロイメントは、推論速度の遅いことと、メモリ消費の増大によって妨げられている。
ビデオ生成を高速化するために,PipeDiTという新しいパイプラインフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:46:40 GMT)
HQ-SVC: Towards High-Quality Zero-Shot Singing Voice Conversion in Low-Resource Scenarios [18.0] HQ-SVCは高品質なゼロショット音声変換のための効率的なフレームワークである。
HQ-SVCはまず、疎結合モデルを用いて、共同コンテンツと話者の特徴を抽出する。
その後、ピッチやボリュームモデリングを通じて忠実度を高め、重要な音響情報を保存する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:29:38 GMT)
OAD-Promoter: Enhancing Zero-shot VQA using Large Language Models with Object Attribute Description [17.7] 大規模言語モデル(LLM)は、視覚質問応答(VQA)において重要なツールとなっている。
大規模なトレーニングデータセットへの依存はしばしば、知識獲得時に言語バイアスを継承する。
OAD-Promoterは,言語バイアスを緩和し,ドメインシフトの堅牢性を改善することで,LLMベースのVQAを向上するための新しいアプローチである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:37:12 GMT)
SpaceVLM: Sub-Space Modeling of Negation in Vision-Language Models [17.2] 視覚言語モデルの埋め込み空間は意味的に一貫した部分空間に分割できることを示す。
単一点ではなく結合埋め込み空間における部分空間として否定をモデル化する学習自由フレームワークを提案する。
提案手法は,従来手法よりも平均約30%の否定的理解を向上する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 19:18:40 GMT)
Image-POSER: Reflective RL for Multi-Expert Image Generation and Editing [16.9] Image-POSERは、事前訓練されたテキスト・ツー・イメージの専門家とイメージ・ツー・イメージの専門家の多様なレジストリをオーケストレーションする。
動的タスクの分解を通じて、エンドツーエンドのプロンプトを処理します。
人間の評価において常に好まれる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:15:34 GMT)
SemanticStitch: Enhancing Image Coherence through Foreground-Aware Seam Carving [16.9] 伝統的なシーム彫刻法は意味情報を無視し、前景の連続性を混乱させる。
深層学習に基づくフレームワークであるSemanticStitchを導入する。このフレームワークは,前景オブジェクトの意味的先行を組み込んで,その完全性を維持し,視覚的コヒーレンスを高める。
本手法は,有意な物体の意味的整合性を強調し,縫合品質を著しく向上する新規な損失関数を含む。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:05:29 GMT)
A Reasoning Paradigm for Named Entity Recognition [16.9] 名前付きエンティティ認識のための推論フレームワークが提案されている。
フレームワークは、Chain of Thought(CoT)生成、CoTチューニング、推論強化の3つのステージで構成されている。
実験では、ReasoningNERがNERタスクにおける印象的な認知能力を示し、競争性能を達成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:31:43 GMT)
DINOv3-Guided Cross Fusion Framework for Semantic-aware CT generation from MRI and CBCT [16.8] 凍結自己制御型DINOv3トランスフォーマーとトレーニング可能なCNNエンコーダデコーダを統合したDINOv3-Guided Cross Fusionフレームワークを提案する。
階層的にトランスフォーマーのグローバルな表現とCNNのローカルな特徴を融合させ、バランスの取れたローカルな外観と文脈的な表現を実現する。
SynthRAD2023 pelvicデータセットの実験では、DGCFがMS-SSIM、PSNR、セグメンテーションベースのメトリクスで最先端のパフォーマンスを達成したことが示されている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:26:48 GMT)
Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies [16.3] 臨床的に有効な治療トラジェクトリを生成する新しいデータ拡張フレームワークであるMessage Stitchingを提案する。
TreatStitchは、異なる軌跡にまたがる類似の患者状態を特定し、それぞれのセグメントを縫合する。
これらの合成軌道を元のデータセットに拡張することで、オフラインRLはより多様なデータセットから学習することができる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:37:49 GMT)
MetaGDPO: Alleviating Catastrophic Forgetting with Metacognitive Knowledge through Group Direct Preference Optimization [16.3] 大きな言語モデルは強力な推論能力を示し、より小さなモデルに効果的に圧縮できる。
既存のデータセットと微調整アプローチは依然として、破滅的な忘れ込みにつながる課題に直面している。
本稿では,データと微調整の両方の観点から,破滅的な忘れを緩和する包括的ソリューションを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:06:23 GMT)
Multi-Agent Collaborative Fuzzing with Continuous Reflection for Smart Contracts Vulnerability Detection [16.2] SmartFuzzは、スマートコントラクト脆弱性検出のための新しいコラボレーティブリフレクティブファザである。
ファジングエンジンとして大きな言語モデル駆動エージェントを採用し、学習と反映によって継続的に改善されている。
30分以内に5.8%-74.7%以上の脆弱性を検出し、(ii)偽陰性を最大80%減少させる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:21:56 GMT)
GeoMVD: Geometry-Enhanced Multi-View Generation Model Based on Geometric Information Extraction [15.7] マルチビュー画像生成はコンピュータビジョンにおいて重要な応用価値を持つ。
単一画像の拡張に依存する既存の手法では、クロスビューの一貫性を維持する上で、注目すべき計算課題に直面している。
本稿では,多視点幾何情報を抽出する機構を組み込んだ幾何誘導多視点拡散モデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:17:18 GMT)
RulePilot: An LLM-Powered Agent for Security Rule Generation [15.6] ルールベースの検出は、事前に定義された文法論理に基づいて悪意のあるログを識別することが多い。
本稿では, LLMをベースとしたエージェントを用いて, 人間の専門知識を模倣したルールパイロットを提案する。
RulePilotを使用すると、セキュリティアナリストは文法に従うルールを書き留める必要はなく、単にアノテーションを提供するだけである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:59:16 GMT)
ProAV-DiT: A Projected Latent Diffusion Transformer for Efficient Synchronized Audio-Video Generation [15.6] ProAV-DiT (ProAV-DiT) は、高効率かつ同期化されたオーディオビデオ生成用に設計された投射潜時拡散変換器である。
ProAV-DiTは、マルチスケールのデュアルストリーム時空間オートエンコーダ(MDSA)を採用している。
ProAV-DiTは、生成品質と計算効率の両方において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:24:17 GMT)
TIMERIPPLE: Accelerating vDiTs by Understanding the Spatio-Temporal Correlations in Latent Space [15.5] 本稿では,vDiTsにおける自己注意の促進を,潜在空間における時間的再利用の相関を利用して行う。
また,vDiT内の注意パターンは,主にトークンチャネルレベルでの空間的・時間的相関が支配的であることが示唆された。
本稿では,個別チャネルに沿った部分的注意スコアを空間的あるいは時間的に相関したトークンに再利用することにより,注意計算を近似する軽量かつ適応的な戦略を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:07:31 GMT)
A Disease-Aware Dual-Stage Framework for Chest X-ray Report Generation [15.3] 胸部X線レポート生成のための新しい2段階疾患認識フレームワークを提案する。
ステージ1では,特定の病理カテゴリに対応する病的意味トークン(DAST)を学習する。
ステージ2では,病を意識した表現と視覚的特徴を統合するために,病的・視覚的注意融合モジュールを導入する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:31:51 GMT)
Leveraging Large Language Models for Career Mobility Analysis: A Study of Gender, Race, and Job Change Using U.S. Online Resume Profiles [15.3] 本稿では,大学生のキャリアモビリティの大規模分析について述べる。
我々は、ジェンダー、人種、仕事の変化オプションが上向きのモビリティとどのように関連しているかを検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:26:57 GMT)
Beyond World Models: Rethinking Understanding in AI Models [15.2] 世界モデルは、外界の側面をシミュレートする内部表現である。
AIモデルに類似した表現の証拠を見つけることは、これらのモデルが人間のような方法で世界を「理解」していることを示しているかもしれない。
本稿では,世界モデルフレームワークが人間レベルの理解を適切に特徴付けるかどうかを批判的に検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:45:26 GMT)
MME-RAG: Multi-Manager-Expert Retrieval-Augmented Generation for Fine-Grained Entity Recognition in Task-Oriented Dialogues [15.2] MME-RAGは、エンティティ認識を2つの調整段階に分解するフレームワークである。
各エキスパートはKeyInfoレトリバーによってサポートされ、推論中にセマンティックに整列された、数発の例を注入し、追加のトレーニングなしで正確なドメイン適応抽出を可能にする。
CrossNER、MIT-Movie、MIT-Restaurant、および新たに構築したマルチドメインのカスタマーサービスデータセットに関する実験は、MME-RAGが最近のほとんどのドメインのベースラインよりも優れたパフォーマンスを示していることを示している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:35:55 GMT)
Actionable Warning Is Not Enough: Recommending Valid Actionable Warnings with Weak Supervision [15.0] この研究は、Top-500 GitHub Cリポジトリから68,274のリバージョンをマイニングすることで、最初の大規模なアクション可能な警告データセットを構築する。
次に、実際のバグである可能性に関して、各アクション可能な警告を弱いラベルに割り当てることで、さらに一歩踏み出します。
次に,実際のバグの発生確率の高い動作可能な警告を自動的に推奨する,ACWRecommenderという2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:10:56 GMT)
From Scaling to Structured Expressivity: Rethinking Transformers for CTR Prediction [15.0] クリックスルーレート(CTR)予測のためのディープモデルは、しばしば急速に減少するリターンを示す。
我々は根本原因を構造上のミスアライメントとみなしている。
本研究ではフィールド・アウェア・トランスフォーマー(FAT)について述べる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:55:50 GMT)
Rethinking Deep Alignment Through The Lens Of Incomplete Learning [14.3] 自己回帰訓練中の位置依存的勾配弱化は信号減衰を引き起こし,不完全安全性学習につながることを示す。
不完全な安全学習の計算指標として,基本条件付きトークンを導入する。
Llama と Qwen モデルファミリ間の実験的評価により, 対向ロバスト性は劇的に向上した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:53:03 GMT)
Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression [14.0] オフライン強化学習(RL)は、環境のさらなる相互作用なしに、固定データセットからポリシー学習を可能にする。
Extreme $Q$-Learning (XQL)は、Extreme Value Theoremを使用してBellmanエラーをモデル化する、最近のオフラインRLメソッドである。
軽度仮定下での量子回帰による温度係数$$を推定する原理的手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:10:05 GMT)
To Align or Not to Align: Strategic Multimodal Representation Alignment for Optimal Performance [13.5] トレーニング中のアライメント強度を正確に操作できる制御可能なコントラスト学習モジュールを提案する。
この結果から, 単調モデルの性能に対する明示的アライメントの影響は, データの特性と関係があることが示唆された。
混合情報分布におけるモダリティ固有信号と共有冗長性のバランスをとる最適アライメント強度を同定する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:15:53 GMT)
Improving Autoformalization Using Direct Dependency Retrieval [13.2] ステートメントの自動形式化は、非公式な記述を機械で検証可能な表現に変換することを目的としている。
既存の方法はしばしば文脈認識の欠如に悩まされ、形式的定義や定理の幻覚に繋がる。
文の自動形式化のためのDDR(textitDirect Dependency Retrieval)に基づく新しい検索拡張フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:05:11 GMT)
RadarMP: Motion Perception for 4D mmWave Radar in Autonomous Driving [13.0] RadarMPは、2つの連続するフレームからの低レベルレーダエコー信号を用いた3次元映像の正確な映像知覚のための新しい手法である。
また,RadarMPは,様々な気象条件と照明条件にまたがって,信頼性の高い動作知覚を実現する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:09:29 GMT)
Codebook-Centric Deep Hashing: End-to-End Joint Learning of Semantic Hash Centers and Neural Hash Function [13.0] ハッシュセンタに基づくディープハッシュ手法は,各クラスに固定ハッシュセンタを学習対象として割り当てることで,ペアワイズあるいはトリプルトベースのアプローチを改善する。
本稿では,ハッシュ関数を協調最適化しながら,事前に設定したコードブックからハッシュセンタを$textbfdynamicで再割り当てするエンドツーエンドフレームワークを提案する。
3つのベンチマーク実験により、CRHは意味論的に意味のあるハッシュセンターを学習し、検索タスクにおける最先端のディープハッシュ手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:14:09 GMT)
VPHO: Joint Visual-Physical Cue Learning and Aggregation for Hand-Object Pose Estimation [13.0] 単一のRGB画像から手とオブジェクトの3Dポーズを推定することは、基本的な問題ですが、難しい問題です。
本研究では,手動ポーズ推定のための視覚的および身体的手がかりを協調的に統合する新しいフレームワークを提案する。
提案手法は, 精度, 物理的妥当性の両面において, 既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:47:30 GMT)
How Far Do SSL Speech Models Listen for Tone? Temporal Focus of Tone Representation under Low-resource Transfer [12.8] 我々は,ビルマ語,タイ語,ラオス語,ベトナム語という,複雑で多様な音調を持つ4つの言語を研究する。
ビルマ州とタイ州で約100ms,ラオスとベトナムでは約180msと推定した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:38:09 GMT)
Scaling Law Analysis in Federated Learning: How to Select the Optimal Model Size? [12.8] 高品質で精度の高いトレーニングデータの枯渇に対する懸念が高まっている。
Federated Learningにおけるトレーニングデータセットの分散化は、大規模なモデルをスケールする上での課題を導入している。
本稿では,従来のモデルスケーリング体験をフェデレートした学習シナリオに一般化するための洞察を提供する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:41:25 GMT)
LSS3D: Learnable Spatial Shifting for Consistent and High-Quality 3D Generation from Single-Image [12.7] 我々は,多視点不整合と非正面入力ビューを扱うために,学習可能な空間シフトを用いた高品質な画像から3次元画像へのアプローチ LSS3D を提案する。
具体的には、各ビューに学習可能な空間シフトパラメータを割り当て、再構成メッシュでガイドされた空間的に一貫したターゲットに対して各ビューを調整する。
提案手法は, よりフレキシブルな入力視点における幾何学的, テクスチャ的評価指標の双方において, 導出結果を一貫して達成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:14:25 GMT)
Do LLMs and Humans Find the Same Questions Difficult? A Case Study on Japanese Quiz Answering [12.7] 本研究では,ブザー設定におけるキズの難易度がLLMと人間との違いについて検討した。
実験の結果、LLMは人間に比べて、正しい回答をウィキペディアのエントリでカバーしていないクイズに苦戦していることがわかった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:23:00 GMT)
Preference Learning from Physics-Based Feedback: Tuning Language Models to Design BCC/B2 Superalloys [12.6] 新規構造合金の言語モデル誘導設計作業に好み学習を適用した。
安定な無機結晶を創出することに焦点を当てた以前の研究とは対照的に,本手法は特定のクラスBCC/B2超合金を合成可能である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:08:22 GMT)
BitSnap: Checkpoint Sparsification and Quantization in LLM Training [12.4] 大規模言語モデル(LLM)は、サイズと複雑さを増し続けている。
LLMトレーニングでは、ストレージ、メモリ使用量、耐障害性を管理する上で、効率的なチェックポイントの保存とロードが重要になっている。
本稿では,異なるトレーニングステージやモデルアーキテクチャに動的に適用可能な,新しいチェックポイントスペーシングと量子化手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:48:59 GMT)
Striking the Right Balance between Compute and Copy: Improving LLM Inferencing Under Speculative Decoding [12.3] 本稿では,Balancing Memory and Compute (BMC) と呼ばれる新しいKVキャッシュ割り当て機構を提案する。
BMCは、rイテレーション毎に、r冗長な行を持つKVテンソルを割り当て、それらのイテレーションのオーバーヘッドをコピーすることなく、インプレース更新を可能にする。
BMCは、最先端の推論サーバvLLMとDeepSpeedで最大1.36倍と2.29倍のスループットを達成している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:49:23 GMT)
PCA++: How Uniformity Induces Robustness to Background Noise in Contrastive Learning [12.1] 高次元データは、しばしば構造化背景雑音によって隠蔽される低次元信号を含む。
対照的な学習によって動機づけられた我々は、正のペアから共有信号部分空間を復元する問題、同じ信号を共有するが、バックグラウンドで異なるペアの観測に対処する。
我々のベースラインであるPCA+は、アライメントのみのコントラスト学習を使用し、背景変動が穏やかな場合に成功するが、強いノイズや高次元の条件下では失敗する。
我々は,PCA++を紹介した。PCA++は制約の厳しいコントラスト型PCAで,投影された特徴に対して同一性共分散を強制する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:11:39 GMT)
Adaptive Begin-of-Video Tokens for Autoregressive Video Diffusion Models [11.9] ほとんどのビデオ拡散モデル(VDM)は自己回帰的な方法でビデオを生成し、それに続く繰り返しフレームを生成する。
本稿では,自動回帰VDMのためのAdaptive Begin-of-Video Tokens(ada-BOV)を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:29:14 GMT)
AGGRNet: Selective Feature Extraction and Aggregation for Enhanced Medical Image Classification [11.7] 我々は,詳細な視覚パターンを理解するために,情報的・非情報的特徴を抽出するAGGRNetフレームワークを提案する。
KvasirデータセットのSOTAモデルよりも5%向上した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:01:09 GMT)
Cross-View Cross-Modal Unsupervised Domain Adaptation for Driver Monitoring System [11.7] ドライバーの気晴らしは依然として道路交通事故の主要な原因であり、世界中で毎年数千人の死者を出している。
深層学習に基づく運転行動認識手法は,このような注意散逸を検出する上で有望であるが,現実の展開におけるその有効性は2つの重要な課題によって妨げられている。
本稿では,この課題をリアルタイム運転監視データと協調的に解決する,2段階のクロスビュー・クロスモーダルなドメイン適応フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:04:35 GMT)
Fusionista2.0: Efficiency Retrieval System for Large-Scale Datasets [11.7] Fusionista2.0は、スピードとユーザビリティに最適化されたビデオ検索システムである。
コアモジュールは効率向上のために再設計された。
光文字認識はVintern-1B-v3.5を用いて頑健な多言語テキスト認識を行う。
軽量な視覚言語モデルは、大型モデルの重いコストを伴わずに迅速な応答を提供する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:23:44 GMT)
Changes in Real Time: Online Scene Change Detection with Multi-View Fusion [11.4] 既存のオンラインシーン変更検出手法は、オフラインアプローチよりもはるかに精度が低い。
ポーズに依存しない,ラベルのない,マルチビューの一貫性を保証する,最初のオンラインSCDアプローチを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:12:16 GMT)
ExplainableGuard: Interpretable Adversarial Defense for Large Language Models Using Chain-of-Thought Reasoning [11.3] 大規模言語モデル(LLM)は、出力を微妙に操作できる敵攻撃に対して、ますます脆弱である。
本稿では,DeepSeek-Reasonerのチェーン・オブ・シント(CoT)推論機能を活用した,解釈可能な敵防衛フレームワークであるExplainableGuardを紹介する。
GLUE BenchmarkとIMDB Movie Reviewsデータセットの予備的な結果は、防衛効果が有望であることを示している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:11:07 GMT)
Bridging Vision and Language for Robust Context-Aware Surgical Point Tracking: The VL-SurgPT Dataset and Benchmark [11.0] VL-SurgPTは,手術シーンにおけるポイント状態のテキスト記述と視覚的トラッキングをブリッジする,最初の大規模マルチモーダルデータセットである。
データセットは、組織追跡のための754と、計測器追跡のための154を含む、908のin vivoビデオクリップで構成されている。
視覚的に困難な状況下でのロバスト性を改善するために意味記述を活用するテキスト誘導型トラッキング手法TG-SurgPTを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:26:34 GMT)
GenSIaC: Toward Security-Aware Infrastructure-as-Code Generation with Large Language Models [10.9] 本稿では,セキュリティを意識したIaCコード生成におけるLarge Language Models(LLM)の可能性について検討する。
我々はまず,IaCコードの生成と検査において,IaCのセキュリティ上の重大な欠陥を認識するために,ベースLSMの包括的な評価を行う。
次に、LLMの潜在的なセキュリティ弱点を認識する能力を改善するために設計された命令微調整データセットであるGenSIaCを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:23:52 GMT)
MARC: Multimodal and Multi-Task Agentic Retrieval-Augmented Generation for Cold-Start Recommender System [10.7] エージェント検索・拡張生成(RAG)に基づくマルチモーダル・マルチタスクカクテル推薦システム MARC を提案する。
提案システムは,タスク認識ルータとリフレクション処理という2つのコアプロセスを通じて,高品質で適切な回答を生成する。
評価はLLM-as-a-judgeと人的評価の両方を用いて、グラフデータベースによって生成された回答が、品質の観点から単純なベクトルデータベースよりも優れていることを示した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:48:55 GMT)
Deep Reinforcement Learning for Automated Stock Trading: An Ensemble Strategy [10.7] 我々は、投資リターンの最大化による株式トレーディング戦略の学習に、深い強化策を取り入れたアンサンブル戦略を提案する。
我々は、深い強化学習エージェントを訓練し、3つのアクター批判に基づくアルゴリズムを用いてアンサンブル取引戦略を得る。
提案したディープアンサンブル戦略はシャープ比によって測定されたリスク調整されたリターンにおいて,3つのアルゴリズムと2つのベースラインより優れていることを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:15:10 GMT)
MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images [10.2] 我々はMEMR-Seg(Multi-Round Entity-Level Medical Reasoning)を紹介する。
MEMR-Segは、エンティティレベルの推論を備えたマルチラウンドクエリを通じてセグメンテーションマスクを生成する必要がある新しいタスクである。
MR-MedSegは、ラウンドごとのエンティティベースの推論を特徴とする、177Kのマルチラウンド医療セグメント対話の大規模データセットである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:59:21 GMT)
Fast Reasoning Segmentation for Images and Videos [9.5] 本稿では,知覚を推論から切り離すデジタル双対表現を用いたFastReasonSegを提案する。
FastReasonSegは最先端の推論セグメンテーションのパフォーマンスを達成する。
この効率性により、リソース制約のある環境へのデプロイが可能になり、リアルタイムな推論セグメンテーションが可能になる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:06:29 GMT)
Constructing and Interpreting Digital Twin Representations for Visual Reasoning via Reinforcement Learning [9.5] 複雑な視覚入力のディジタル双対表現を構築するために,大規模言語モデルを訓練する強化学習フレームワークDT-R1を提案する。
DT-R1は最新のタスク固有モデルよりも一貫して改善されていることを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 21:57:25 GMT)
Selecting Fine-Tuning Examples by Quizzing VLMs [9.4] 低ランク適応(LoRA)のための画像選択フレームワークQZLoRAを提案する。
我々はQZLoRAがより整列したフォトリアリスティックな画像をより少ないサンプルで生成できることを実証した。
この結果から,自動視覚推論とパラメータ効率の微調整を併用したトピック適応生成モデルの実現が期待できる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:48:48 GMT)
From Classification to Cross-Modal Understanding: Leveraging Vision-Language Models for Fine-Grained Renal Pathology [9.3] 臨床的に現実的な数ショット問題として,細粒度糸球体サブタイプをモデル化した。
この条件下では、病理特化モデルと汎用視覚言語モデルの両方を評価する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:44:11 GMT)
FedSDA: Federated Stain Distribution Alignment for Non-IID Histopathological Image Classification [8.8] フェデレートラーニング(FL)は、分散データリソース間のモデルを協調的にトレーニングすることに成功している。
近年の進歩にもかかわらず、非IID(非独立で同一の分散)データはFLの使用を妨げる必然的な課題となる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:40:00 GMT)
Rethinking Multimodal Point Cloud Completion: A Completion-by-Correction Perspective [8.3] ポイント雲の完成は、部分的な観測から完全な3次元形状を再構築することを目的としている。
ほとんどのメソッドは、いまだにCompletion-by-Inpaintingパラダイムに従っている。
完全形状から始まるコンプリーション・バイ・コレクション(Completion-by-Correction)を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:51:13 GMT)
TM-UNet: Token-Memory Enhanced Sequential Modeling for Efficient Medical Image Segmentation [8.2] TM-UNetは、トークンシーケンスモデリングと効率的な医療セグメント化のための効率的なメモリメカニズムを統合する、新しい軽量フレームワークである。
我々のMSTMブロックは、線形複雑度で長距離依存関係をキャプチャする動的知識ストアとして機能する。
広範な実験により、TM-UNetは、計算コストを大幅に削減し、様々な医学的セグメンテーションタスクにまたがる最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:49:30 GMT)
Reasoning Text-to-Video Retrieval via Digital Twin Video Representations and Large Language Models [8.1] 本稿では,従来の検索を推論による暗黙的なクエリ処理に拡張するパラダイムである推論テキスト・ビデオ検索を紹介する。
視覚言語モデルを直接依存するのではなく,映像コンテンツをデジタルツインとして表現することを提案する。
我々は、手動で135本の動画と1000本の動画のより難しいバージョンで暗黙的なクエリを作成した447のベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:12:43 GMT)
MoralReason: Generalizable Moral Decision Alignment For LLM Agents Using Reasoning-Level Reinforcement Learning [7.8] そこで,Moral-Reason-QAを提案する。このデータセットは,フレームワーク固有の推論トレースを備えた,680人の注釈付き高曖昧なモラルシナリオを拡張したデータセットである。
我々の学習アプローチでは、意思決定アライメントとフレームワーク固有の推論プロセスを同時に最適化する複合報酬を備えたグループ相対ポリシー最適化を採用しています。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:52:10 GMT)
A Code Smell Refactoring Approach using GNNs [7.7] コードの臭いはソフトウェアにおいて大きな課題であり、遅延設計や実装上の欠陥を示している。
本研究では,コードの臭いに対するグラフに基づく深層学習手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:21:26 GMT)
MMSense: Adapting Vision-based Foundation Model for Multi-task Multi-modal Wireless Sensing [7.6] MMSenseは統合無線センシングのためのマルチモーダル・マルチタスク基礎モデルである。
我々のフレームワークは、画像、レーダー、LiDAR、テキストデータを視覚に適合する表現に変換することで統合する。
モダリティゲーティング・メカ・ニムはこれらの表現を適応的に融合させ、視覚ベースの大きな言語モデルバックボーンは特徴整合化を可能にする。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:35:39 GMT)
EARL: Entropy-Aware RL Alignment of LLMs for Reliable RTL Code Generation [7.5] Reinforcement Learning with Verifiable Rewards (RLVR)は、モデル能力と実世界のRTL設計のギャップを埋める、有望なアプローチを提供する。
We present EARL, a Entropy-Aware Reinforcement Learning framework for Verilog generation。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:00:07 GMT)
Out-of-Context Misinformation Detection via Variational Domain-Invariant Learning with Test-Time Training [7.4] Out-of-context misinformation (OOC) は、ニュース報道における低コストな誤報形式である。
我々は,OOC誤情報検出のための領域適応能力を高めるために textbfVDT を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:56:38 GMT)
Intelligent Collaborative Optimization for Rubber Tyre Film Production Based on Multi-path Differentiated Clipping Proximal Policy Optimization [7.2] 深層強化学習アルゴリズムについて紹介する:MPD-PPO(Multipathiated Different Clipping Proximal Policy Optimization)
MPD-PPOはチューニング精度と操作効率の両方で大幅に改善されている。
このフレームワークは、高次元性、多目的トレードオフ、動的適応など、重要な課題にうまく取り組みます。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:53:27 GMT)
Software Supply Chain Security of Web3 [7.0] ブロックチェーン技術に基づいて構築されたWeb3アプリケーションは、分散アプリケーション(dApps)とスマートコントラクトを通じて、数十億ドルのデジタル資産を管理する。
これらのシステムは、重大なセキュリティ脆弱性をもたらす複雑なソフトウェアサプライチェーンに依存している。
本稿では、従来のWeb2ソフトウェアサプライチェーン問題とブロックチェーン技術の不変かつ高い性質が交わる、Web3エコシステム特有のソフトウェアサプライチェーンセキュリティ上の課題について検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:02:14 GMT)
Reinforcement Learning for Charging Optimization of Inhomogeneous Dicke Quantum Batteries [6.9] 本稿では,非均一なDicke電池に対する一括充電ポリシーを最適化するために強化学習を用いる。
完全可観測性は, 部分可観測性の下では, 単一TLSエネルギーやエネルギーのみにのみアクセスでき, 完全に観測されたベースラインの後方に1次平均遅延が生じる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:06:59 GMT)
EgoCogNav: Cognition-aware Human Egocentric Navigation [6.8] EgoCogNavは、遅延状態として認識されるパスの不確実性を予測するマルチモーダルなエゴセントリックナビゲーションフレームワークである。
EgoCogNavは、見えない環境に一般化しつつ、スキャン、鎮静、バックトラッキングといった人間的な行動と非常に相関する認識の不確かさを学習している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:59:36 GMT)
BlinDNO: A Distributional Neural Operator for Dynamical System Reconstruction from Time-Label-Free data [6.8] 時間ラベルのない環境で量子力学系の逆問題について検討する。
マルチスケールなU-Netエンコーダとアテンションベースのミキサーを統合した置換不変アーキテクチャであるBlinDNOを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:15:37 GMT)
TSGDiff: Rethinking Synthetic Time Series Generation from a Pure Graph Perspective [6.8] 拡散モデルはデータ生成において非常に有望であるが、時系列データを生成することは依然として困難である。
グラフベースの観点から時系列生成を再考する新しいフレームワークである textitTSGDiff を提示する。
グラフニューラルネットワークに基づくエンコーダデコーダアーキテクチャを用いて、潜在空間を構築する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:58:25 GMT)
TEMPO: Global Temporal Building Density and Height Estimation from Satellite Imagery [6.7] 深層学習モデルを用いた高解像度衛星画像から得られた建物密度と高さのグローバル・時間分解データセットTEMPOを提案する。
我々は,4分の1のPlanetScopeベースマップ衛星画像とビルのフットプリントと高さデータを組み合わせて,ビルの密度と高さを37.6m/ピクセルの解像度で予測するマルチタスク深度学習モデルを訓練する。
このモデルを2018年第1四半期から2025年第2四半期にかけてのグローバルなPlanetScopeベースマップに適用し、建物密度と高さのグローバルな時間マップを作成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:48:34 GMT)
DeiTFake: Deepfake Detection Model using DeiT Multi-Stage Training [6.7] ディープフェイクはデジタルメディアの完全性にとって大きな脅威だ。
DeiTをベースとしたトランスフォーマーと,拡張複雑性を増大させる新しい2段階のプログレッシブトレーニング戦略を提案する。
DeiTFakeはステージ1以降の98.71%、ステージ2以降のAUROCでは99.22%の精度で、最新のOpenForensicsベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:55:09 GMT)
Channel-Constrained Markovian Quantum Diffusion Model from Open System Perspective [6.6] 本稿では,チャネル制約付きマルコフ量子拡散モデルを提案する。
我々のモデルは、前方拡散過程を量子マスター方程式を用いて自然デコヒーレンスと解釈する一方、逆デノナイズは逆量子チャネルを学習することによって達成される。
この研究は、量子拡散が制御されたマルコフ進化として特徴づけられることを確認し、環境相互作用はデコヒーレンスの源であるだけでなく、高忠実な量子状態合成を達成するためにも利用できることを示した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:52:15 GMT)
Enhancing Remote Magnon-Magnon Entanglement with Quantum Interference [6.5] 圧縮真空場をマイクロ波キャビティに注入することにより、2つの遠隔マグノンモード間のマクロな絡み合いを発生・向上する。
2つのSVF間の量子干渉は、位相制御された絡み合いの増強を可能にし、空洞の散逸と熱雑音に対するロバスト性を大幅に改善する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:12:17 GMT)
Ground Plane Projection for Improved Traffic Analytics at Intersections [6.4] 自動回転運動のためのコンピュータビジョンシステムは、通常、インフラストラクチャーカメラの画像平面における視覚解析に依存する。
ここでは、1台以上のインフラカメラで検出されたバックプロジェクティング車両を地上に設置し、実世界の3D座標を解析する潜在的な利点について検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:02:29 GMT)
MMDCP: A Distribution-free Approach to Outlier Detection and Classification with Coverage Guarantees and SCW-FDR Control [6.4] ラベルシフト下でのマルチクラス分類と外乱検出のための統一的なフレームワークを提案する。
修正マハラノビス距離等角予測(MMDCP)は、クラス固有の距離測度と完全な等角予測を組み合わせてスコア関数を構築する。
オラクルと経験的コンフォーマルな$p$-値のギャップを初めて理論的に評価し、クラスワイド偽発見率(CW-FDR)の有効なカバレッジと効果的な制御を確実にする。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:48:44 GMT)
Detection of Cyberbullying in GIF using AI [6.4] ソーシャルメディア上では、テキストメッセージ、コメント、画像、GIFまたはステッカーの共有、オーディオとビデオが使用される。
GIFやステッカーでサイバーいじめを検出する研究はほとんどない。
われわれはTwitterからGIFデータセットを収集し、データセットからサイバーいじめを検出するためのディープラーニングモデルを適用した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:46:40 GMT)
Don't Think of the White Bear: Ironic Negation in Transformer Models Under Cognitive Load [6.2] do not mention $X$"のような否定命令は、人間の思考における$X$のアクセシビリティをパラドックス的に向上させる。
概念を抑えるには内部で活性化する必要があるか検討するが、これは避ける代わりにプライムリバウンドとなる可能性がある。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:00:56 GMT)
Incremental Maintenance of DatalogMTL Materialisations [6.0] 本稿では,有界区間を持つデータログMTLの逐次推論アルゴリズムであるDRedMTLを提案する。
我々のアルゴリズムは、データログプログラムの実体化を漸進的に更新する古典的DRedアルゴリズムに基づいている。
このアプローチを実装し、いくつかの公開データセットでテストしました。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:45:19 GMT)
FairGSE: Fairness-Aware Graph Neural Network without High False Positive Rates [5.6] グラフ表現学習の主流パラダイムとして,グラフニューラルネットワーク(GNN)が登場している。
2次元構造エントロピー (2D-SE) を最大化し, 偽陽性を伴わない公平性を向上するフレームワークである, 構造エントロピー (textbfFairGSE) によるFair GNNを提案する。
いくつかの実世界のデータセットの実験では、FairGSEはFPRを39%削減している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:40:47 GMT)
T2IBias: Uncovering Societal Bias Encoded in the Latent Space of Text-to-Image Generative Models [5.6] テキスト・ツー・イメージ(T2I)生成モデルは、AIによる実世界のアプリケーションや価値創造に主に使用されている。
我々は、最先端T2Iモデルの事前訓練された潜在空間において、社会的バイアスが体系的に符号化されているかどうかを検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:37:58 GMT)
Entanglement degradation of static black holes in effective quantum gravity [5.2] 第三型ブラックホール幾何学におけるスカラー場とディラック場の量子絡み合いの劣化について検討する。
我々は、一意に絡み合った検出器対の量子絡み合いと相互情報を計算する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:55:05 GMT)
MTMed3D: A Multi-Task Transformer-Based Model for 3D Medical Imaging [5.2] 本稿では,MTMed3Dを提案する。MTMed3Dは,単一タスクモデルの制約に対処するための,エンドツーエンドのマルチタスクトランスフォーマーモデルである。
我々のモデルは、共有エンコーダとしてTransformerを使用して、CNNベースのタスク固有デコーダに続き、マルチスケール機能を生成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:27:49 GMT)
Active Learning of Symbolic Automata Over Rational Numbers [4.9] Angluinの$L*$アルゴリズムは、必要最低限の教師が与えられたときに有限状態オートマトン(DFAs)を学習する。
我々は$L*$を拡張して、遷移が有理数、すなわち無限かつ高密度なアルファベット上の述語を使用するシンボリックオートマトンを学ぶ。
提案アルゴリズムは,遷移数に対して最も線形な教師に対して,述語の表現サイズに関して,質問数を求めるという意味で最適である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:04:36 GMT)
Distillation Dynamics: Towards Understanding Feature-Based Distillation in Vision Transformers [4.7] 蒸留力学」と呼ばれる新しい分析枠組みを通じて、この現象を包括的に分析する。
特徴蒸留における負の伝達の根本原因を,教師と学生のモデル間の基本的な表現パラダイムのミスマッチと同定する。
この結果から,ViTsにおける知識伝達の成功には,これらの基本的表現制約を尊重する手法へのナイーブな特徴模倣を超越する必要があることが明らかとなった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:34:36 GMT)
Can LLMs Create Legally Relevant Summaries and Analyses of Videos? [4.7] 我々はLLMに、各ドメインの法的な問題を示す120本のYouTubeビデオに基づいて、法的文書の要約と草案作成を依頼する。
全体としては、71.7%が高品質、中質と評価されており、これは有望な結果である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:30:39 GMT)
Exploring AI in Steganography and Steganalysis: Trends, Clusters, and Sustainable Development Potential [4.6] 本研究では,AIによるステガノグラフィーに基づくデータ隠蔽手法のサイエントメトリック解析を行った。
2017年から2023年にかけての合計654の論文が検討されている。
この研究は、主に、ステガノグラフィー画像データ隠蔽、ディープイメージステガナリシス、ニューラルウォーターマーク、言語ステガノグラフィーモデル、音声ステガナリシスアルゴリズム、隠蔽通信ネットワーク、ビデオステガノグラフィー技法の7つのテーマを識別する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 06:12:46 GMT)
RTMol: Rethinking Molecule-text Alignment in a Round-trip View [4.6] 分子キャプションとテキストからSMILES生成を自己教師付きラウンドトリップ学習により統合する双方向アライメントフレームワークであるRTMolを提案する。
実験により、RTMolは様々なLLMに対して、双方向アライメント性能を最大47%向上させることが示された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:55:55 GMT)
Hybrid second-order gradient histogram based global low-rank sparse regression for robust face recognition [4.6] 低ランク回帰モデルは、照明変動に対する堅牢性から、顔認識において広く採用されている。
既存の手法は、しばしば、不十分な特徴表現と、サンプル間で構造化された腐敗の限定的なモデリングに悩まされる。
本稿では,Hybrid 2次勾配ヒストグラムに基づくGlobal Low-Rank Sparse Regressionモデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:41:36 GMT)
Known Meets Unknown: Mitigating Overconfidence in Open Set Recognition [4.4] Open Set Recognition (OSR) は、既知のクラスを正確に分類し、未知のサンプルを効果的に拒否するモデルを必要とする。
未知のサンプルが既知のクラスとセマンティックに類似している場合、特徴空間におけるクラス間オーバーラップは、しばしばモデルに不当に高い信頼を割り当てる。
クラス間重複に起因する過信を明示的に緩和するフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:56:44 GMT)
Quantum Amplitude-Amplification Eigensolver: A State-Learning-Assisted Approach beyond Energy-Gradient-Based Heuristics [4.2] 基底状態の推定は、幅広い量子シミュレーションの中心にある。
量子振幅増幅固有解法(QAAE)を開発した。
QAAEは、量子振幅増幅により、試験状態を基底状態に向けてコヒーレントに駆動する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:00:00 GMT)
Constrained and Robust Policy Synthesis with Satisfiability-Modulo-Probabilistic-Model-Checking [4.1] 本稿では,任意の構造制約を受けるロバストポリシを効果的に計算するための最初のアプローチを提案する。
数百のベンチマークの実験は、制約付きかつ堅牢なポリシー合成の実現可能性を示している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:59:10 GMT)
AugAbEx : Way Forward for Extractive Case Summarization [4.0] 本研究の目的は,抽象要約を含む既存の7つの事例要約データセットを,対応する抽出要約を組み込むことで拡張することである。
我々は、研究コミュニティが使うために、パブリックドメインで拡張データセットをリリースすることを約束します。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:49:42 GMT)
Assessing On-Demand Mobility Services and Policy Impacts: A Case Study from Chengdu, China [3.8] 本研究は,中国成都市における配車サービスをシミュレーションするために,グラフ理論に基づく走行車マッチング機構と実際の走行タクシー運用データを統合する。
配車サービスの性能に及ぼす艦隊規模管理、ジオフェンシング、需要管理の影響について検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:08:04 GMT)
Optimal Self-Consistency for Efficient Reasoning with Large Language Models [3.7] 自己整合性(英: Self-Consistency, SC)は、チェーンオブソート推論の性能向上のためのテスト時間推論手法である。
本稿では,SCのスケーリング行動とその変種を網羅的に分析し,モード推定と投票理論に基づく。
Blend-ASCは自己整合の新たな変種であり、推論中に動的にサンプルを問合せに割り当てる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:45:42 GMT)
Concept-Based Interpretability for Toxicity Detection [3.7] ターゲットクラスに対する概念の不均等な帰属は、しばしば分類エラーを引き起こす。
本研究では,概念グラディエント(CG)法に基づく解釈可能性手法を提案する。
テキスト分類モデルにおける誤分類に寄与する有毒な単語のキュレーションを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:53:23 GMT)
Bridging Constraints and Stochasticity: A Fully First-Order Method for Stochastic Bilevel Optimization with Linear Constraints [3.6] この研究は、一階法のみを用いた線形制約付き双レベル最適化に対する最初の有限時間収束保証を提供する。
線形制約、雑音、有限時間解析を両レベル最適化において同時に扱うという前例のない課題に対処する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:26:13 GMT)
Cacheback: Speculative Decoding With Nothing But Cache [3.4] Cachebackはトレーニング不要でモデルに依存しない投機的復号法である。
言語における局所性を利用して、LLM(Large Language Model)推論を加速する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:32:32 GMT)
Educators on the Frontline: Philosophical and Realistic Perspectives on Integrating ChatGPT into the Learning Space [3.1] ジェネレーティブAIの急速な台頭、特にChatGPTは、教育の未来に関する世界的な議論を引き起こした。
本研究では,主要な利害関係者グループ(大学教育者)の構造的,基盤的視点について検討する。
7つの部分空間からなる「学習空間」として教育環境を概念化する新しい理論モデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:15:41 GMT)
EgoEMS: A High-Fidelity Multimodal Egocentric Dataset for Cognitive Assistance in Emergency Medical Services [3.1] EgoEMSは、最初のエンドツーエンド、高忠実、マルチモーダル、マルチパーソンのデータセットで、20時間以上の現実的、手続き的 EMS アクティビティをキャプチャする。
EgoEMSは、EMSの専門家と共同で開発され、国家標準に従って、オープンソースで低コストで複製可能なデータ収集システムを使用してキャプチャされる。
実時間マルチモーダルキーステップ認識と行動品質推定のためのベンチマークスイートを提案し,EMSのためのAI支援ツールの開発に不可欠である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:05:41 GMT)
Supervised Multilabel Image Classification Using Residual Networks with Probabilistic Reasoning [3.1] 本研究は,COCO-2014データセットとResNet-101アーキテクチャを改良したマルチラベル画像の分類手法を提案する。
このモデルは、マルチラベル分類における最先端の結果に対する先行技術やアプローチよりも優れている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:56:15 GMT)
Calibrated Decomposition of Aleatoric and Epistemic Uncertainty in Deep Features for Inference-Time Adaptation [3.0] ほとんどの推定器は、全ての不確実性モードを単一の信頼スコアに分解し、いつより多くの計算を割り当てるか、あるいは推論を調整するべきかについての信頼性の高い推論を防ぐ。
非確実性誘導推論時間選択(Uncertainty-Guided Inference-Time Selection)は,データ駆動型(データ駆動型)とモデル駆動型不確実性を,深い特徴空間で直接的に解消する軽量な推論時間フレームワークである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:47:30 GMT)
Sangam: Chiplet-Based DRAM-PIM Accelerator with CXL Integration for LLM Inferencing [3.0] 推論、特にデコードフェーズは、メモリバウンドGEMVまたはフラットGEMM操作によって支配される。
既存のインメモリソリューションは、メモリ容量の削減などの限界に直面している。
この作業は、これらの制限に対処するチップレットベースのメモリモジュールを提供する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:39:51 GMT)
Benchmarking that Matters: Rethinking Benchmarking for Practical Impact [3.0] 本稿では,実世界のベンチマーク,実践者が利用できる機能空間,コミュニティが維持するパフォーマンスデータベースを中心にしたビジョンを提案する。
現実の洞察とともに進化し、科学的理解と産業的利用の両方をサポートする生きたベンチマークエコシステム。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:42:15 GMT)
Reducing Hallucinations in LLM-Generated Code via Semantic Triangulation [2.9] 我々はセマンティックトライアングルを導入し、解間の正確な検証可能なマッピングを保持する方法でプログラミング問題を変換する。
LiveCodeBenchとCodeEloのベンチマークでは、セマンティックトライアングルによって生成されたコードの信頼性が21%向上している。
また、複数の有効だが等価でない解を持つタスクに対して、真のコンセンサスを一貫して形成する唯一のアプローチでもある。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:45:14 GMT)
Locally Optimal Solutions to Constraint Displacement Problems via Path-Obstacle Overlaps [2.8] 本稿では,ロボットが制約や障害物を減らして実現可能な経路を見つけるような制約変位問題に対する統一的なアプローチを提案する。
制約変位問題の2つの異なるクラスに対するアプローチの実証に成功しているいくつかの例が提示されている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:14:30 GMT)
Survival of Hermitian Criticality in the Non-Hermitian Framework [2.7] 複素値逆場を受ける一次元異方性XYモデルにおける多体相転移について検討する。
生物直交系内では基底状態相関関数と絡み合いエントロピーを計算し、それらのスケーリング挙動がエルミートXYモデルと同一であることを確認する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:55:14 GMT)
MMRINet: Efficient Mamba-Based Segmentation with Dual-Path Refinement for Low-Resource MRI Analysis [2.7] MMRINetは、二次複雑度注意を線形複雑度Mamba状態空間モデルに置き換える軽量アーキテクチャである。
on the BraTS-Lighthouse SSA 2025, our model to strong volumetric performance with a average Dice score (0.752) and a average HD95 of (12.23) with only 2.5M parameters。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:57:25 GMT)
Data-Efficient Self-Supervised Algorithms for Fine-Grained Birdsong Analysis [2.6] この研究は、Residual-MLP-RNNと呼ばれる鳥の鳴き声アノテーションのための軽量で高性能なニューラルネットワークアーキテクチャを提供する。
専門的な最小限の労力で、信頼できる深海鳥の音節検出装置を開発するための、堅牢な3段階の訓練パイプラインを提供する。
このデータ効率のアプローチのパフォーマンスは、極端なラベル・スカシティのシナリオにおいて、カナリアの複雑な歌に対して実証される。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:04:01 GMT)
CITADEL: A Semi-Supervised Active Learning Framework for Malware Detection Under Continuous Distribution Drift [2.6] CITADELは,Androidマルウェア検出のための,堅牢な半教師付き能動学習フレームワークである。
我々は,現実的なドリフト挙動をシミュレートするマルウェア特異的拡張,Bernolliビットフリップとマスキングを導入する。
CITADELは, F1スコアが1%以上, 3%, 7%, 14%以上であり, ラベル付きサンプルは40%に過ぎなかった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:34:15 GMT)
Efficient Mathematical Reasoning Models via Dynamic Pruning and Knowledge Distillation [2.6] 本稿では,ダイナミックアテンションヘッドプルーニングと知識蒸留を統合した軽量な最適化手法を提案する。
Math23k と ASDiv-A で行った実験により,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:21:44 GMT)
ViConBERT: Context-Gloss Aligned Vietnamese Word Embedding for Polysemous and Sense-Aware Representations [2.5] ViConBERTはベトナムの文脈化埋め込みを学習するための新しいフレームワークである。
ViConBERTは、コントラスト学習(SimCLR)とグロスベースの蒸留を統合して、単語の意味をよりよく捉えている。
またベトナムにおける意味理解を評価するための,最初の大規模合成データセットであるViConWSDについても紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:11:52 GMT)
Scalable quantum error mitigation with phase-cycled dynamical decoupling [2.4] 動的デカップリングのための非マルコフ量子誤差緩和法としてアダマール位相サイクルを構築した。
準磁性分子やダイヤモンド中の窒素空孔中心に埋め込まれた固体電子スピン量子ビットをアンサンブルするために,その誤差軽減能力を利用する。
スケーラブルな量子エラー軽減と抑制の統合により、ノイズの多い量子ビットと制御ハードウェアを備えた量子技術の開発が容易になる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:04:54 GMT)
BackWeak: Backdooring Knowledge Distillation Simply with Weak Triggers and Fine-tuning [2.3] BackWeakはシンプルで代理なしの攻撃パラダイムです。
弱引き金で良心的な教師を微調整するだけで、強力なバックドアを埋め込むことができることを示す。
BackWeakは、従来の精巧なアプローチよりも効率的で、シンプルで、しばしばステルス性が高い。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:53:15 GMT)
UpBench: A Dynamically Evolving Real-World Labor-Market Agentic Benchmark Framework Built for Human-Centric AI [2.1] UpBenchは、グローバルなUpworkの労働市場から引き出された実際の仕事に関するベンチマークだ。
各タスクは検証されたクライアントトランザクションに対応し、実際の作業活動と財務成果の評価をアンロックする。
UpBenchはルーリックベースの評価フレームワークを採用しており、専門家フリーランサーは各ジョブを詳細かつ検証可能な受け入れ基準に分解し、基準ごとのフィードバックでAI申請を評価する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:39:37 GMT)
Transitional Bell Correlation from Dirac Wavepackets [2.0] 我々は、絡み合った反伝播電子のベル-CHSH相関の閉形式式を導出した。
ベル違反はディラック波の伝播の局所的な重なりを反映していることを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:30:34 GMT)
AURA: Development and Validation of an Augmented Unplanned Removal Alert System using Synthetic ICU Videos [1.9] 集中治療室 (ICUs) における非計画的外挿 (UE) の重要性
AURA(Augmented Unplanned removal Alert)は、完全に合成されたビデオデータセットに基づいて開発・検証された視覚ベースのリスク検出システムである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:52:37 GMT)
ProofWright: Towards Agentic Formal Verification of CUDA [1.9] 大規模言語モデル(LLM)は、最適化されたカーネルを自動生成するためにますます使われている。
高速な生成にもかかわらず、これらのカーネルには微妙な修正バグがあり、正式な安全保証がないことが多い。
本稿では,このギャップを埋めるエージェント検証フレームワークProofWrightについて述べる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:06:50 GMT)
Dynamic Anomaly Identification in Accounting Transactions via Multi-Head Self-Attention Networks [1.9] 本研究では,会計取引における動的異常検出の問題に対処する。
そこで本研究では,トランスフォーマーを用いたリアルタイム検出手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:18:32 GMT)
QMA Complete Quantum-Enhanced Kyber: Provable Security Through CHSH Nonlocality [1.5] 量子後暗号は、量子敵に対する大規模通信システムを確保する必要がある。
本稿では,鍵交換相に直接量子非局所性検証を組み込む,最初のClauser-e-Shimony-Holt(CHSH)認証Kyberプロトコルを紹介する。
結果として生ずるCHSH強化キバースキームは、数学的に厳密でハイブリッドなポスト量子フレームワークを確立する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:31:36 GMT)
Dyadic-Chaotic Lifting S-Boxes for Enhanced Physical-Layer Security within 6G Networks [1.5] 第6世代(6G)無線ネットワークは、何十億ものリソース制限されたデバイスと時間クリティカルなサービスを相互接続する。
物理層セキュリティ(PLS)は、軽量で情報理論的な保護を提供するために重要である。
PLSのための最初のカオスリフト置換箱(S-box)を紹介する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 19:00:29 GMT)
FUSE : Failure-aware Usage of Subagent Evidence for MultiModal Search and Recommendation [1.4] マルチモーダルなクリエイティブアシスタントは、ユーザ目標を分解し、レイアウト、スタイリング、検索、生成のためのサブエージェントにタスクをルーティングする。
FUSEはコンテキスト圧縮、連鎖推論、ミニショット最適化、検索拡張コンテキスト、2段階処理、ゼロショット最小化という7つのコンテキスト予算戦略を実装している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:55:51 GMT)
Dynamic Reward Scaling for Multivariate Time Series Anomaly Detection: A VAE-Enhanced Reinforcement Learning Approach [1.3] 本稿では、変分オートエンコーダ(VAE)、LSTMベースのディープQネットワーク(DQN)、動的報酬形成、これらの問題に一元化学習フレームワークで対処するためのアクティブ学習モジュールを組み合わせた深部強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:36:20 GMT)
Bayesian--AI Fusion for Epidemiological Decision Making: Calibrated Risk, Honest Uncertainty, and Hyperparameter Intelligence [1.2] 本稿ではベイズ予測とベイズハイパーパラメータ最適化を組み合わせたベイズとAIの統合フレームワークを提案する。
我々はベイジアン・ロジスティック・レグレッションを用いて、ピマ・インディアンズ・ダイアベテス・データセットの校正された個人レベルの病気リスクと信頼区間を得る。
これは、リスクを後続分布として表現するベイズ予測層と、モデル選択をブラックボックスの目的に対する推論として扱うベイズ最適化層である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:42:49 GMT)
irace-evo: Automatic Algorithm Configuration Extended With LLM-Based Code Evolution [1.1] irace-evoは、大きな言語モデル(LLM)を通じてコード進化を統合するiraceの拡張である
可変サイズバンドル問題(VSBPP)に対するCMSAメタヒューリスティックによるirace-evoの評価を行った。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:42:18 GMT)
From Phonemes to Meaning: Evaluating Large Language Models on Tamil [1.0] ILAKANAMは、スリランカの学校レベルのタミル語検定論文から820の質問を手作業で収集した最初のタミル語別言語評価ベンチマークである。
我々の結果は、Gemini 2.5が全体的なパフォーマンスを最高に達成し、オープンソースモデルは遅れていることを示している。
モデル全体の性能と言語カテゴリーを識別する能力の間に強い相関関係は見られず、実際の理解よりも露出によってパフォーマンスが引き起こされる可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:41:16 GMT)
Improving Graph Embeddings in Machine Learning Using Knowledge Completion with Validation in a Case Study on COVID-19 Spread [1.0] グラフ埋め込み(GE)は、知識グラフ(KG)からベクトル空間にマッピングすることで、ノード分類やリンク予測といったタスクを可能にする。
本稿では,埋め込み前の潜在データセットのセマンティクスを明らかにするために,知識コンプリートフェーズを統合したGMLパイプラインを提案する。
実験により、GMLパイプラインは埋め込み空間の幾何学を著しく変化させ、その導入は単なるエンリッチメントではなく、グラフ表現の質を再定義する変換ステップであることを示した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:24:00 GMT)
BdSL-SPOTER: A Transformer-Based Framework for Bengali Sign Language Recognition with Cultural Adaptation [1.0] ベンガル手話(BdSL)の正確かつ効率的な認識のためのポーズベースのトランスフォーマーフレームワークであるBdSL-SPOTERを紹介する。
BdSL-SPOTERは、SPOTERパラダイムを拡張し、文化的な前処理と、学習可能な位置符号化を最適化したコンパクトな4層トランスフォーマーエンコーダである。
BdSLW60ベンチマークでは、97.92%のTop-1バリデーションが達成され、Bi-LSTMベースラインよりも22.82%改善された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:45:21 GMT)
Model Inversion Attack Against Deep Hashing [0.9] DHMIは、ディープハッシュ用に設計された最初の拡散ベースのモデル反転フレームワークである。
最も難しいブラックボックス設定下でさえ、高解像度で高品質な画像を再構成する。
提案手法は,ブラックボックスシナリオにおける既存の最先端モデル逆転攻撃よりも優れる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:21:16 GMT)
A Novel AI-Driven System for Real-Time Detection of Mirror Absence, Helmet Non-Compliance, and License Plates Using YOLOv8 and OCR [0.9] 道路安全は重要な世界的な問題であり、ヘルメット法や車両安全基準のマニュアルが資源集約的で矛盾している。
本稿では,交通違反検出を自動化し,実施効率と道路安全を著しく向上するAIを利用したシステムを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:18:17 GMT)
A Review of Statistical and Machine Learning Approaches for Coral Bleaching Assessment [0.9] 世界のサンゴ礁の半分以上が過去30年間に漂白されたり死んだりしている。
データ駆動戦略は効果的なサンゴ礁管理に不可欠である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:22:56 GMT)
Stochastic Shadow Descent: Training Parametrized Quantum Circuits with Shadows of Gradients [0.8] パラメタライズド量子回路(PQC)におけるパラメータ最適化の課題に着目する。
同時摂動近似(SPSA)のような一般的なアルゴリズムは、回路内のパラメータの数に関係なく、回路実行回数を繰り返し毎に2つに制限する。
理論的にも数値的にも、これがPQCを訓練する不安定性を引き起こす可能性があることを示す。
パラメータを反復的に更新するためにランダムプロジェクションを使用するシャドウDescent(textttSSD)を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:36:15 GMT)
Reflections on the design, applications and implementations of the normative specification language eFLINT [0.8] 法的な実践は、解釈や資格のような主観的なプロセスを含む。
法則による計算推論には、法学とソフトウェアの専門知識の両方を含む学際的なプロセスが必要である。
本稿では,ドメイン固有のソフトウェア言語であるeFLINTについて考察する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:09:31 GMT)
JobSphere: An AI-Powered Multilingual Career Copilot for Government Employment Platforms [0.7] 本稿では,PGRKAMと呼ばれるPunjabの雇用プラットフォームを再定義する,AIを活用したキャリアアシスタントであるJobSphereを紹介する。
JobSphereはRetrieval-Augmented Generation (RAG)アーキテクチャを採用しており、英語、ヒンディー語、パンジャービ語で利用できる。
主なイノベーションとしては、アシスタントとの音声対応インタラクション、自動モックテスト、スキル認識による再開解析、組み込みベースのジョブレコメンデーションなどがある。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:08:33 GMT)
Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams [0.7] 本稿では,車両がエージェントとして機能し,局地的な目標や観測に基づいて選択的にコミュニケーションできる分散マルチエージェント強化学習(MARL)フレームワークを提案する。
この目標対応コミュニケーション戦略により、エージェントは関連する情報のみを共有することができ、可視性制限を尊重しながらコラボレーションを強化することができる。
その結果,本手法は作業成功率を大幅に改善し,非協調的ベースラインに比べて時間とゴールを短縮することがわかった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:11:31 GMT)
Rapid Machine Learning-Driven Detection of Pesticides and Dyes Using Raman Spectroscopy [0.5] 農薬や合成染料は、食品の安全性、人間の健康、環境の持続可能性に重大な脅威をもたらす。
ラマン分光法は分子特異的な指紋を提供するが、スペクトルノイズ、蛍光背景、バンドオーバーラップに悩まされている。
本稿では,ラーマン分光法(MLRaman)から農薬や染料を検出するためのResNet-18特徴抽出に基づくディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:35:55 GMT)
On the Security and Privacy of AI-based Mobile Health Chatbots [0.2] この研究は、Google Play Storeから特定された16のAIベースのmHealthチャットボットを実証的に評価する。
われわれの調査では、セキュリティ上の脆弱性、プライバシー上の問題、Google Playのポリシーに準拠していないことが判明した。
これらの推奨事項は、データ処理プロセスの改善、開示、ユーザセキュリティに重点を置いている。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:49:07 GMT)
Compression and Inference of Spiking Neural Networks on Resource-Constrained Hardware [0.2] スパイキングニューラルネットワーク(SNN)は、連続的なアクティベーションではなく、離散的なスパイクを介して時間内に通信する。
エッジデバイス上でのSNN推論のための軽量なC言語ランタイムを提案する。
我々は,無活動ニューロンやシナプスを刺激するスパーススパイク活性を利用して,上流の畳み込み層での計算を縮小する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:02:23 GMT)
Enhancing Road Safety Through Multi-Camera Image Segmentation with Post-Encroachment Time Analysis [0.2] 本稿では,PET(Post-Encroachment Time)計算によるリアルタイム安全性評価のための,新しいマルチカメラコンピュータビジョンフレームワークを提案する。
4つの同期カメラが連続的な視覚的カバレッジを提供し、各フレームはNVIDIA Jetson AGX Xavierデバイスで処理される。
PETアルゴリズムは固定された細胞に依存することなく車両の位置を計測し、ダイナミックなヒートマップを通してきめ細かなハザードを可視化する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:06:24 GMT)
Human-aligned Quantification of Numerical Data [0.2] 数値データを定量化するための情報圧縮とシルエット係数に基づいて,メトリクスの適用性を評価する。
以上の結果から,数値データを別カテゴリに分類する能力は,0.65以上のシルエット係数と0.5以下のディップテストに関連があることが示唆された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 04:44:18 GMT)
Exploring Parameter-Efficient Fine-Tuning and Backtranslation for the WMT 25 General Translation Task [0.1] 本研究では,日本語コーパスにおける逆翻訳と微調整の相乗効果が翻訳品質を著しく向上させることを示す。
このアプローチは、低リソースの言語ペアを改善するための軽量で強力な戦略を提供します。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:59:18 GMT)
Impact of UK Postgraduate Student Experiences on Academic Performance in Blended Learning: A Data Analytics Approach [0.1] ブレンドラーニングは、イギリスや世界中の高等教育において、主要な教育モデルとなっている。
本稿では,学生の学習経験の異なる次元と学業成績の相互作用について検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:42:43 GMT)
eFPE: Design, Implementation, and Evaluation of a Lightweight Format-Preserving Encryption Algorithm for Embedded Systems [0.0] eFPEは8ラウンドのFeistel暗号であり、このドメイン用に特別に設計された "novel lightweight Pseudorandom Function (PRF)" を備えている。
eFPEは、任意の長さの十進文字列をパディングや複雑な変換なしで直接暗号化し、標準的な前提の下でIND-CCA2セキュリティを目指している。
eFPEは、データフォーマットの整合性、リソースフットプリントの最小化、運用遅延の低減が最重要である金融端末、医療センサ、産業用IoTデバイスなどのアプリケーションに適している。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:00:23 GMT)
The conditional probabilities and the empirical laws in a free scalar QFT in curved spacetime [0.0] 我々は、QFTCSの実証法則の一部を記述するために、事前条件確率の概念を用いる。
これは初期状態に関する情報のない量子条件確率として解釈される。
より一般的には、量子物理学において、この概念は状態還元に関する概念的な問題から解放されているように思われる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:50:15 GMT)
Stimulated Hawking effect and quasinormal mode resonance in a polariton simulator of field theory on curved spacetime [0.0] 外部からの地平線上のコヒーレントプローブインシデントを用いて,エファン刺激ホーキング効果を数値的に検討した。
刺激されたホーキング効果は地平線内の負エネルギーのボゴリューボフチャネルへの透過として現れる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 19:41:57 GMT)
Skyrmionic qubits stabilized by Dzyaloshinskii-Moriya interaction as platforms for qubits and quantum gates [0.0] 量子計算は、決定論的、ビットベースの処理という古典的なパラダイムからかけ離れている。
本稿では,ジアロシンスキー-モリヤ相互作用によって安定化されたスカイミオン状態に基づく量子化の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:14:10 GMT)
SCI: An Equilibrium for Signal Intelligence [0.0] 本稿では,解釈可能性の制御状態としてモデル化する制御理論フレームワークであるSCIを提案する。
SCIは解釈誤差DeltaSPを定式化し、[0,1]のSP(t)を目標に向かってアクティブに駆動する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 14:48:17 GMT)
Reinforcement Learning for Chemical Ordering in Alloy Nanoparticles [0.0] 我々はRL剤をトレーニングし、コサヘドラルナノ粒子の構造に対して組成保存原子スワップ作用を行う。
ランダム化された$Ag_XAu_309-X$合成と順序で一度訓練されたエージェントは、以前に確立された基底状態構造を発見する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:33:20 GMT)
Recursive Threshold Median Filter and Autoencoder for Salt-and-Pepper Denoising: SSIM analysis of Images and Entropy Maps [0.0] 本稿では,中央フィルタ (MF) と簡易3層オートエンコーダ (AE) を用いた画像からの塩とペッパーのノイズ除去について検討する。
復調画像とクリーン画像の標準的な構造類似度指数SSIMImgと、新たに適用された計量SSIMMapの2つの指標を用いて、復調性能を評価する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:35:53 GMT)
Random-Key Metaheuristic and Linearization for the Quadratic Multiple Constraints Variable-Sized Bin Packing Problem [0.0] 本稿では,QMC-VSBPPの2次多重制約可変サイズバンドル問題に対処する。
この問題は、複数のキャパシティ次元、異種ビンタイプ、アイテム間の二次的相互作用コストを組み込むことで、古典的なビンパッキングを一般化する。
現状を推し進める2つの補完手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:05:53 GMT)
RAA-MIL: A Novel Framework for Classification of Oral Cytology [0.0] 本稿では,患者の口腔内サイトロジー全体像の診断を行うための,第1の弱教師付き深層学習フレームワークについて紹介する。
本研究は, 口腔細胞診における患者レベルの弱監督型ベンチマークを初めて確立し, 信頼性の高いAI支援型デジタル病理学へ向けたものである。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:48:36 GMT)
Quantum Phase Gradient Imaging Using a Nonlocal Metasurface System [0.0] 量子位相イメージングは、厚さと屈折率の変動のある透明な試料の分析を可能にする。
非線形準曲面の最近の進歩は、量子光の生成と操作のためのコンパクトな解を提供する。
光子対を生成するためのリチウムニオブ酸リチウム(LiNbO3)と、位相勾配抽出のためのシリコン(Si)とを組み合わせた小型量子位相イメージングシステムを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:45:09 GMT)
QuaRT: A toolkit for the exploration of quantum methods for radiation transport [0.0] QuaRTは、天体物理学と宇宙論の問題における放射移動の量子シミュレーションのためのPythonライブラリである。
格子ボルツマン法では、非散乱媒質中の星のような物体のシミュレーションの等方性を改善する新しい角再分布法が特徴である。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:57:58 GMT)
Prompt-Conditioned FiLM and Multi-Scale Fusion on MedSigLIP for Low-Dose CT Quality Assessment [0.0] 本稿では,FiLM (Feature-wise Linear Modulation) とマルチスケールプーリングにより,テキスト先行を注入するプロンプト条件付きフレームワークを提案する。
我々はPLCC = 0.9575, SROCC = 0.9561, KROCC = 0.8301 を達成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:26:59 GMT)
Privacy-Preserving Prompt Injection Detection for LLMs Using Federated Learning and Embedding-Based NLP Classification [0.0] 本稿では,フェデレート学習と埋め込みに基づく分類に基づくプライバシー保護型インジェクション検出フレームワークを提案する。
その結果, 生データを露出することなく効果的なインジェクション検出が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:11:14 GMT)
Photonic spin Hall effect in $\mathcal{PT}$-symmetric non-Hermitian cavity magnomechanics [0.0] 非エルミートキャビティマグノメカニクス(CMM)は、マグノンフォトンとマグノンフォノンの相互作用を同時に組み込む。
これらの相互作用は弱いプローブ場の光学応答に重要な影響を与え、量子技術における新しい応用の道を開く。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:56:18 GMT)
Optimal Multiparameter Quantum Estimation of Magnonic Couplings in a Magnomechanical Cavity [0.0] 本稿では,結合の同時推定精度を$G_mc$と$G_mb$で向上させる実験的な手法を提案する。
また, ある条件下では, ヘテロダイン検出がQFIMの最終的な精度に近づきやすいことを示す。
このことから, ヘテロダイン検出に基づく測定戦略は, 結合を推定するための効率的かつ実用的な経路を提供する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 20:45:26 GMT)
Open Banking Foundational Model: Learning Language Representations from Few Financial Transactions [0.0] 我々は、構造化属性と非構造化テキスト記述を統一表現に統合する金融取引の基本モデルを導入する。
提案手法は,古典的特徴工学や離散イベントシーケンス法よりも優れていることを示す。
その結果、不正防止や信用リスクから顧客インサイトまで、自己監督型モデルによる金融応用を推し進める可能性が浮き彫りになった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:52:39 GMT)
Non-perturbative 2D spatial measurements of electric fields within a plasma sheath [0.0] アルゴンプラズマに添加された微量のルビジウム蒸気は、スペクトル的に狭い電場感光共鳴を作り出すことができる。
照明領域から蛍光を収集することにより、電界の大きさの2次元空間プロファイルを30$mの解像度で再構成する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:46:55 GMT)
Multimodal RGB-HSI Feature Fusion with Patient-Aware Incremental Heuristic Meta-Learning for Oral Lesion Classification [0.0] 深部RGB埋め込み,高スペクトル再構成,手作りのスペクトル音声ディスクリプタ,人口統計メタデータを統合した4種類の口腔病変分類器を提案する。
以上の結果から,ハイパースペクトル再構成と不確実性を考慮したメタラーニングにより,実世界の口腔病変検診におけるロバストネスが著しく向上することが示唆された。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:48:28 GMT)
Multimodal AI for Body Fat Estimation: Computer Vision and Anthropometry with DEXA Benchmarks [0.0] DEXAスキャンのようなゴールドスタンダードの手法は高価であり、ほとんどの人にとっては利用できない。
本研究では,前頭体画像と基本的な人文計測データを用いて,人工知能(AI)モデルの実現可能性について,低コストな代替手段として評価する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:20:24 GMT)
Mesh-based Super-resolution of Detonation Flows with Multiscale Graph Transformers [0.0] 反応流のメッシュベース超解像のためのマルチスケールグラフトランスフォーマ手法を開発した。
SR-GTは、従来のSRスキームと比較して、フローフィールドの特徴に反応する高解像度の精度と優れた性能を提供する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 05:20:01 GMT)
Measurement-Based Quantum Computation Using the Spin-1 XXZ Model with Uniaxial Anisotropy [0.0] 一軸異方性、単イオン異方性$D$、イジング異方性$J$のスピン-1 XXZ鎖の基底状態は、単一量子ビットゲートを実装した測定ベースの量子計算の資源状態として機能する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 02:38:34 GMT)
Leveraging Quantum-Based Architectures for Robust Diagnostics [0.0] 本研究の目的は, 腎臓のCT画像を用いて腎臓結石, 嚢胞, 腫瘍の診断と鑑別を行うことである。
我々は、事前訓練されたResNet50エンコーダと量子畳み込みニューラルネットワーク(QCNN)を組み合わせて、量子支援診断を探索する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 23:36:58 GMT)
LLMLagBench: Identifying Temporal Training Boundaries in Large Language Models [0.0] 大規模言語モデル(LLM)は、特定の時間的カットオフまでのテキストデータに基づいて事前訓練される。
LLMは必然的に時代遅れのタイムセンシティブな情報を推論タスク中に一般的な知識とブレンドすることができる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:08:10 GMT)
LLM-Assisted Formalization Enables Deterministic Detection of Statutory Inconsistency in the Internal Revenue Code [0.0] 本研究では, 複素法則の不整合を決定論的に検出する, ハイブリッド型ニューロシンボリック・フレームワークを提案する。
我々は、米国内国歳入法(IRC)をケーススタディとして使用しています。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:05:02 GMT)
LILogic Net: Compact Logic Gate Networks with Learnable Connectivity for Efficient Hardware Deployment [0.0] 勾配に基づく手法を用いてバイナリ論理ゲートのネットワークをトレーニングする方法を示す。
特定のデータセットに適合するために必要な論理ゲートの数を大幅に削減する方法を示す。
256,000のゲートを持つ当社最大のアーキテクチャでは、LILogicNetはCIFAR-10で60.98%のテスト精度を実現しています。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 19:44:37 GMT)
Hybrid Predictive Quantum Feedback: Extending Qubit Lifetimes Beyond the Wiseman-Milburn Limit [0.0] 振幅減衰は、エネルギーと情報を環境に不可逆的に漏らすことによって、基本的に量子ビット寿命を制限する。
Standard Wiseman--Milburnのフィードバックは、単一の測定クアチュアに作用し、その補正ドライブがループ遅延によって劣化するため、わずかに改善されている。
i) ホモダイン電流を受信し、そのシステム上でエンファンタムをコヒーレントにフィードバックするコヒーレント結合型エンファンシラ量子ビット。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:45:47 GMT)
Hashpower allocation in Pay-per-Share blockchain mining pools [0.0] 本稿では、プール管理者が共有難易度と管理手数料の両方を調整できるペイ・パー・シェア(PPS)報酬システムについて検討する。
鉱夫に対する簡易的な富モデルを用いて、鉱夫は異なる鉱夫プール間でどのように計算資源を割り当てるべきかを探求する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 13:42:59 GMT)
Fusion-ResNet: A Lightweight multi-label NILM Model Using PCA-ICA Feature Fusion [0.0] 非侵入負荷監視(NILM)は、家庭の総消費電力を個々の家電の消費に分解するためにデータ駆動アルゴリズムを使用する。
本研究では、高周波ラベル付きデータ、特徴抽出方法、軽量ニューラルネットワークからなるNILM分類タスクのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:10:46 GMT)
From Laplacian-to-Adjacency Matrix for Continuous Spins on Graphs [0.0] 低温および高温における自由エネルギー$T$は、グラフ理論による2つの重要な物体のスペクトルによって決定されることを示す。
装飾された格子に対して、自由エネルギーの特異部分はラプラシアスペクトルによって支配されるが、これは0温度制限においてのみ完全自由エネルギーに対して当てはまる。
ループレスグラフ上の量子スピンモデルの結果も提示する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 19:14:35 GMT)
FGM optimization in complex domains using Gaussian process regression based profile generation algorithm [0.0] この原稿は、任意の形のドメインに対して機能的にグレードされた材料(FGM)を設計するという課題に対処する。
提案アルゴリズムは複雑な形状のドメインを処理し、滑らかなFGMプロファイルを生成する。
GPRから得られる設計空間は、様々なプロファイルで構成され、最適な構成を発見する可能性を高める。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 11:53:02 GMT)
Explainable Transformer-Based Email Phishing Classification with Adversarial Robustness [0.0] フィッシングと関連するサイバー脅威は、より多様で技術的に進んでいる。
最近の脅威、特に人工知能(AI)によるフィッシング攻撃は、フィッシング検出器のシステム全体のレジリエンスを低下させている。
本研究では,メール分類におけるBERT変換モデルの小型,高速,軽量バージョンであるDistilBERTを用いたハイブリッド手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 08:05:47 GMT)
Evaluation of Multi- and Single-objective Learning Algorithms for Imbalanced Data [0.0] 機械学習タスクは、単体ではなく、しばしば反対する一連の基準のためにうまく機能するモデルを見つけることを目的としている。
1つの解決策は、集合的学習基準を提案し、多目的学習課題を単一基準最適化問題に還元することである。
本稿では,単一解を返す手法を用いた多目的アルゴリズムに基づく,新しい信頼性の高いアルゴリズム評価手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:54:17 GMT)
Evaluation of Attention Mechanisms in U-Net Architectures for Semantic Segmentation of Brazilian Rock Art Petroglyphs [0.0] ブラジルの考古学遺跡から得られた岩石アートペトログリフのセマンティックセマンティックセグメンテーションのための3つのU-Netアーキテクチャについて検討した。
ブラジルのピオウにあるポオ・ダ・ベビディンハ考古学複合体(Poo da Bebidinha Archaeological Complex)の5倍のクロスバリデーションを用いて、実験を行った。
Attention-Residual BEGL-UNetは、Dice Scoreで0.710、バリデーション損失0.067、リコール率0.854で最高のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 00:12:51 GMT)
Enhanced Nonreciprocal Quantum Battery Performance via Nonlinear Two-Photon Driving [0.0] 非相反動力学を特徴とする2光子駆動型量子電池モデルを提案する。
提案したモデルは実験的に実現可能であり、複数の量子プラットフォームで実装できる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 09:10:55 GMT)
Emergent synchronization mode in coupled Rydberg atomic chains [0.0] 2つの結合した散逸性Rydberg原子鎖における新しい振動形態を,その間隔を変調することによって報告する。
2種類の連続時間結晶が共存する相を見つけ, ホップおよびピッチフォーク分岐の遷移を認識する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 01:49:42 GMT)
Deep Unfolded BM3D: Unrolling Non-local Collaborative Filtering into a Trainable Neural Network [0.0] BM3Dは、非局所的な自己相似性プリミティブをデノナイジングに利用しているが、固定パラメータに依存している。
U-Netのような深層モデルはより柔軟であるが、解釈可能性に欠け、ノイズレシエーションをまたいだ一般化に失敗することが多い。
我々は,BM3Dを学習可能なU-Netデノイザに置き換えることで,BM3Dをトレーニング可能なアーキテクチャにアンロールするハイブリッドフレームワークであるDeep Unfolded BM3D(DU-BM3D)を提案する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:06:47 GMT)
Decision and Gender Biases in Large Language Models: A Behavioral Economic Perspective [0.0] 大規模言語モデル(LLM)は、経済や組織プロセスの仲介をますます進める。
本研究では,高度なLCMが合理的なエージェントとして振る舞うか,古典的意思決定問題に直面した場合の人間の行動傾向を再現するかを検討する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 18:38:17 GMT)
DataOps-driven CI/CD for analytics repositories [0.0] この観点では、DataOpsに準拠したバリデーションフレームワークの質的な設計を提案している。
フレームワークはLint、Optimize、Parse、Observeの5つのステージで構成されている。
要求トレーサビリティマトリックス(RTM)は、各ハイレベル制御が具体的なパイプラインチェックによってどのように実施されるかを示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 16:09:47 GMT)
Cultural Awareness, Stereotypes and Communication Skills in Intercultural Communication: The Algerian Participants Perspective [0.0] 本研究は,多文化環境で働くアルジェリア人の文化意識,ステレオタイプ,コミュニケーションスキルの関連について検討した。
その結果、文化意識は概して高いが、ある種のステレオタイプが他者の知覚に影響を与えていることが判明した。
高い文化意識を持つ参加者はコミュニケーションスキルが向上し、ステレオタイピングのレベルが低かった。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 22:09:06 GMT)
Bayesian Optimization in Language Space: An Eval-Efficient AI Self-Improvement Framework [0.0] 大規模言語モデル(LLM)は、最近、自己改善型AI、すなわち、自身の成果を反復的に生成し、評価し、洗練するAIを可能にした。
多くの社会的応用において、第一の限界は、新しい解を生成するのではなく、それらを評価することである。
本稿では, 単純かつ広く使用されているBest-of-N選択戦略と単純なテキスト勾配の組み合わせが, 標準 UCB 取得関数上の勾配の挙動を統計的にエミュレートすることを証明することで, この課題を克服する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:04:44 GMT)
Arbitrary High Order Low-rank Completely Positive and Trace Preserving (CPTP) Schemes for Lindblad Equations with Time-dependent Hamiltonian [0.0] 我々は、時間依存ハミルトニアンを持つリンドブラッド方程式の任意の高階低ランクスキームを設計するための枠組みを開発する。
我々のアプローチはネストされた反復ピカード(NPI)に基づいており、完全に正かつトレース保存(CPTP)であるクラウス形式のスキームをもたらす。
これらのスキームは低階定式化に順応可能であり、密度行列の行列ランクが小さい問題に適合する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 03:37:23 GMT)
Application of optical squeezing to microresonator based optical sensors [0.0] 高Q光マイクロ共振器は、低損失と高光エネルギーを小さな有効モード体積で結合する。
光は全内部反射によってマイクロ共振器に閉じ込められるが、光場の一部(エバネッセント場として知られる)は外側に広がる。
スクリュッド量子状態のプローブ光を準備することにより、ショットノイズ限界を超えることが可能であることを実証した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 10:10:29 GMT)
Application of Graph Based Vision Transformers Architectures for Accurate Temperature Prediction in Fiber Specklegram Sensors [0.0] 本研究は,0から120セルシウスの範囲のスペックルグラムデータから温度を予測するためのトランスフォーマーアーキテクチャを用いて検討した。
その結果、ViTは1.15の平均絶対誤差(MAE)を達成し、CNNのような従来のモデルを上回った。
この研究には、アテンションマップやサリエンシマップなど、説明可能なAI(XAI)技術が組み込まれ、トランスフォーマーモデルの意思決定プロセスに関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:56:15 GMT)
An Improved Quantum Anonymous Notification Protocol for Quantum-Augmented Networks [0.0] 量子拡張ネットワーク(Quantum Augmented Networks、Quantum Augmented Networks、Quantum Augmented Networks)は、従来のネットワークインフラストラクチャに量子コンポーネントを統合することで、堅牢性とエンドツーエンドのセキュリティを改善する。
本稿では,共有GHZ状態上での回転操作を利用した改良型量子匿名通知(QAN)プロトコルを提案する。
本稿では,この修正QANプロトコルの動作を強調ノイズモデルにより検討し,従来のQAN手法よりも強い耐震性を示す。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 17:59:11 GMT)
An Improved Ensemble-Based Machine Learning Model with Feature Optimization for Early Diabetes Prediction [0.0] 糖尿病は世界中で深刻な健康問題であり、早期発見に依存している。
広範囲にわたる健康調査データを用いて、正確かつ理解可能な糖尿病分類のための機械学習フレームワークを作成する。
本研究では,早期糖尿病予測をサポートするために,Python Flaskバックエンドを備えたReact Nativeベースのアプリケーションを提案し,開発した。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 07:42:31 GMT)
AI-Powered Data Visualization Platform: An Intelligent Web Application for Automated Dataset Analysis [0.0] このシステムは、データ駆動環境のコンテキストからAIベースの分析と可視化のプロセスを確立する。
主なコントリビューションは、自動的でインテリジェントなデータのクリーニング、欠落した値の計算、異常値の検出である。
最初の分析はデータセット上で10万行までリアルタイムに行われ、クラウドベースの需要プラットフォームは要求を満たすためにスケールした。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 15:56:25 GMT)
AI-Enhanced IoT Systems for Predictive Maintenance and Affordability Optimization in Smart Microgrids: A Digital Twin Approach [0.0] 本研究は、スマートマイクログリッドにおける予測保守と可売性最適化のためのAI強化型IoTフレームワークを提案する。
提案システムは,リアルタイムセンサデータ,機械学習に基づく故障予測,コストを考慮した運用分析を統合し,信頼性とエネルギー効率を向上させる。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:06:47 GMT)
A Fractional Variational Approach to Spectral Filtering Using the Fourier Transform [0.0] 蛍光信号とノイズの干渉は、ラマンスペクトル分析において重要な課題である。
画像復調法に類似した変分法にインスパイアされた本手法では,分数微分を伴う関数を最小化する。
論文参考訳(メタデータ) (Sat, 15 Nov 2025 12:42:04 GMT)