GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models [194.6] GLM-4.5はオープンソースのMixture-of-Experts(MoE)大言語モデルであり,総パラメータは355B,アクティベートパラメータは32Bである。
23Tトークンのマルチステージトレーニングと、エキスパートモデルのイテレーションと強化学習による総合的なポストトレーニングを通じて、GLM-4.5はエージェント、推論、コーディングタスクにわたって強力なパフォーマンスを実現している。
GLM-4.5(355Bパラメータ)とGLM-4.5-Air(106Bパラメータ)をそれぞれリリースし、推論とエージェントAIシステムの研究を進めた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:21:06 GMT)
gpt-oss-120b & gpt-oss-20b Model Card [128.1] 精度と推論コストのフロンティアを推し進める2つのオープンウェイト推論モデルを提案する。
モデルは効率的な混合型変圧器アーキテクチャを使用しており、大規模な蒸留と強化学習を用いて訓練されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:24:38 GMT)
Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation [117.5] Open X-Embodiment (OXE)のような大規模データセットでトレーニングされた汎用的なロボットポリシーは、幅広いタスクにわたって強力なパフォーマンスを示している。
彼らはしばしば、トレーニングデータの分布を超えて一般化するのに苦労する。
我々は,ショートカット学習を一般化の鍵となる障害として認識する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:14:01 GMT)
Self-Steering Language Models [114.0] DisCIPL は "self-steering" 言語モデル (LM) の手法である。
DisCIPLは、Followerモデルの集団によって実行されるタスク固有の推論プログラムを生成する。
我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:58:01 GMT)
CodeXEmbed: A Generalist Embedding Model Family for Multiligual and Multi-task Code Retrieval [103.1] CodeXEmbedは400Mから7Bパラメータの大規模なコード埋め込みモデルのファミリーである。
我々の新しいトレーニングパイプラインは、複数のプログラミング言語を統合し、様々なコード関連タスクを共通の検索フレームワークに変換する。
私たちの7Bモデルは、コード検索において新しい最先端(SOTA)を設定し、以前の主要なモデルであるVoyage-CodeをCoIRベンチマークで20%以上上回っています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:35:26 GMT)
CoAct-1: Computer-using Agents with Coding as Actions [95.0] CoAct-1はGUIベースの制御と直接プログラム実行を組み合わせた新しいマルチエージェントシステムである。
我々は、CoAct-1が60.76%の最先端の成功率を達成したOSWorldベンチマークで、我々のシステムを評価した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:56:37 GMT)
AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [92.5] 本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:43:12 GMT)
Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.1] 本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:52:24 GMT)
LeakAgent: RL-based Red-teaming Agent for LLM Privacy Leakage [78.3] LeakAgentは、プライバシー漏洩のための新しいブラックボックスレッドチームフレームワークである。
我々のフレームワークは、敵のプロンプトを生成するための攻撃エージェントとして強化学習を通じてオープンソースのLLMを訓練する。
我々は,LeakAgentが既存のルールベースのデータ抽出手法と,システムリーク時の自動手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:27:21 GMT)
Hypothesis-Driven Theory-of-Mind Reasoning for Large Language Models [76.6] エージェントの精神状態を追跡するための推論時間推論アルゴリズムである思考トレースを導入する。
提案アルゴリズムは,ベイズ理論をモデルとした。
本研究は,様々なベンチマークにおける思考トレーシングを評価し,大幅な性能向上を実証した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:00:51 GMT)
impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.4] 我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:01:16 GMT)
BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent [74.1] BrowseComp-Plus(BrowseComp-Plus)は、BrowseCompから派生したベンチマークである。
このベンチマークは、ディープリサーチエージェントと検索方法の総合的な評価とアンタングル解析を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:55:11 GMT)
MagicGUI: A Foundational Mobile GUI Agent with Scalable Data Pipeline and Reinforcement Fine-tuning [74.0] MagicGUIは、現実のモバイルGUI環境における認識、接地、推論における重要な課題に対処するために設計された、基本的なモバイルGUIエージェントである。
フレームワークには、包括的で正確なデータセット、知覚と接地能力の強化、包括的で統一されたアクション空間、計画指向の推論メカニズムを含む6つの重要なコンポーネントが含まれている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:25:14 GMT)
LightSwitch: Multi-view Relighting with Material-guided Diffusion [73.6] LightSwitchは、新しいファインチューニングされたマテリアルライティング拡散フレームワークである。
我々の2Dリライティング予測品質は、画像から直接リライティングする過去の最先端リライティングよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:59:52 GMT)
Memp: Exploring Agent Procedural Memory [72.4] LLM(Large Language Models)ベースのエージェントは様々なタスクをこなすが、静的パラメータで手動で設計または絡み合うような不安定なプロシージャメモリに悩まされる。
本稿では,過去のエージェントの軌跡をステップバイステップの細粒度と高レベルなスクリプトライクな抽象化の両方に蒸留するMempを提案する。
メモリレポジトリが洗練されるにつれて、エージェントは着実に高い成功率と類似タスクの効率を達成できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:20:56 GMT)
SwiftVideo: A Unified Framework for Few-Step Video Generation through Trajectory-Distribution Alignment [70.0] 拡散ベースまたはフローベースモデルは、ビデオ合成において大きな進歩を遂げているが、複数の反復サンプリングステップが必要である。
本稿では, トラジェクトリ保存と分散マッチングの利点を組み合わせた, 統一かつ安定な蒸留フレームワークを提案する。
提案手法は高品質なビデオ生成を維持しつつ,推論ステップの数を著しく削減する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:26:34 GMT)
Can Test-Time Scaling Improve World Foundation Model? [67.8] 我々は世界基盤モデル(WFM)に適したテストタイムスケーリングフレームワークであるSWIFTを紹介する。
SWIFTは、高速トークン化、確率ベースのTop-Kプルーニング、効率的なビームサーチを含むプロセスレベルの推論戦略とWFM評価ツールキットを統合した。
その結果,テストタイムスケーリング法則はWFMに対して有効であり,SWIFTはモデルサイズを調整・増大させることなく,WFM推論を改善するためのスケーラブルで効果的な経路を提供することがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:55:21 GMT)
Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method [64.1] 表情認識(FER)モデルは、ヒューマンコンピュータのインタラクションや医療モニタリングなど、多くのビデオベースの感情コンピューティングアプリケーションで採用されている。
ディープFERモデルは、しばしば微妙な表現と高いオブジェクト間の変動に悩まされ、現実世界のアプリケーションでの性能を制限します。
本稿では、ソースデータが適応できない難題に対処し、中性表現のみからなるラベル付きターゲットデータのみを利用可能とする。
潜在空間を翻訳することで、PFTは表情生成の複雑さやノイズを回避し、分類に最適化された識別的埋め込みを生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:13:50 GMT)
Deepfake Detection that Generalizes Across Benchmarks [63.3] この研究は、事前訓練されたCLIPビジョンエンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
2019年から2025年にかけて,13のベンチマークデータセットについて広範な評価を行った。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:03:56 GMT)
CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation [63.2] CRUST-Benchは100のCリポジトリのデータセットで、それぞれが安全なRustとテストケースで手書きのインターフェースとペアリングされている。
我々は、このタスクで最先端の大規模言語モデル(LLM)を評価し、安全で慣用的なRust生成が依然として難しい問題であることを確認した。
最高のパフォーマンスモデルであるOpenAI o1は、ワンショット設定で15タスクしか解決できない。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:45:47 GMT)
The Docking Game: Loop Self-Play for Fast, Dynamic, and Accurate Prediction of Flexible Protein-Ligand Binding [63.0] 本稿では,タンパク質-リガンド相互作用をドッキングゲームと呼ばれる2人プレイヤゲームとしてモデル化する新しいゲーム理論フレームワークを提案する。
LoopPlayは従来の最先端の方法と比較して,正確なバインディングモードの予測において約10%の改善を実現している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:23:13 GMT)
MAHL: Multi-Agent LLM-Guided Hierarchical Chiplet Design with Adaptive Debugging [61.8] 大きな言語モデル(LLM)は2.5Dに拡張することを約束している。
LLMはフラットな設計、高い検証コスト、不正確なパラメータ最適化といった課題に直面している。
階層型LLMベースのチップレット設計生成フレームワークであるMAHLを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:47:31 GMT)
Uncertainty-quantified Rollout Policy Adaptation for Unlabelled Cross-domain Temporal Grounding [59.1] Video Temporal Groundingは、長いビデオの中で自然言語の記述と一致するビデオセグメントを時間的に見つけることを目的としている。
本稿では,データ効率のよいクロスドメイン時間グラウンド法を提案する。
この方法では、ターゲットアノテーションの必要性を排除し、計算とストレージの両方のオーバーヘッドをリアルタイムで実行できるほど低く保つ。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:47:00 GMT)
SoK: The Security-Safety Continuum of Multimodal Foundation Models through Information Flow and Game-Theoretic Defenses [58.9] MFM(Multimodal foundation model)は、多種多様なデータモダリティを統合し、複雑で広範囲なタスクをサポートする。
本稿では,モデル行動とシステムレベルの相互作用の両方から生じる致命的な脅威を特定することで,MFMの文脈における安全性とセキュリティの概念を統一する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:43:58 GMT)
Context-Aware Hierarchical Merging for Long Document Summarization [57.0] 本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:23:01 GMT)
Restage4D: Reanimating Deformable 3D Reconstruction from a Single Video [56.8] ビデオ条件付き4D再生のための幾何学保存パイプラインである textbfRestage4D を紹介する。
DAVIS と PointOdyssey 上のRestage4D の有効性を検証し,幾何整合性,運動品質,3次元追跡性能の向上を実証した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:31:51 GMT)
Bifrost-1: Bridging Multimodal LLMs and Diffusion Models with Patch-level CLIP Latents [55.8] Bifrost-1は、事前訓練されたマルチモーダルLLM(MLLM)と拡散モデルをブリッジする統合フレームワークである。
予め訓練したMLLMと拡散モデルとパッチレベルのCLIPラプタントをシームレスに統合することにより,高忠実度制御可能な画像生成を実現する。
実験の結果,Bifrost-1は視覚的忠実度やマルチモーダル理解の観点から,従来の手法と同等あるいは優れた性能を達成できた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:38:47 GMT)
Learning Causal Structure Distributions for Robust Planning [53.8] 構造情報の不確実性を考慮しながら,機能的関係を学習することで,より堅牢な力学モデルがもたらされることがわかった。
これは、因果構造を無視し、ロボットシステムにおける相互作用の空間性を活用するのに失敗する一般的なモデル学習手法とは対照的である。
本稿では,本モデルを用いてロボットの力学を学習し,新しい環境下での新たな作業を行うためのサンプリング・ベース・プランナーを併用することを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:43:17 GMT)
POMATO: Marrying Pointmap Matching with Temporal Motion for Dynamic 3D Reconstruction [53.2] POMATOは時間運動と一致する点マップを結合して動的3次元再構成を実現するための統合フレームワークである。
具体的には,RGB画素を動的および静的の両方の領域から3次元ポイントマップにマッピングすることで,明示的なマッチング関係を学習する。
本稿では,複数の下流タスクにまたがる顕著な性能を示すことによって,提案したポイントマップマッチングと時間融合のパラダイムの有効性を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:01:59 GMT)
Training Plug-n-Play Knowledge Modules with Deep Context Distillation [52.9] 本稿では,文書レベルの知識モジュール(KM)をトレーニングすることで,知識をモジュール化する手法を提案する。
KMはパラメータ効率のよいLoRAモジュールとして実装された軽量コンポーネントで、新しいドキュメントに関する情報を格納するように訓練されている。
提案手法は,2つのデータセットにまたがって,標準的な次世代予測および事前指導訓練技術より優れる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:39:42 GMT)
Aligning Effective Tokens with Video Anomaly in Large Language Models [52.6] 本稿では,様々なビデオにおける異常事象の要約と局所化を目的とした新しいMLLMであるVA-GPTを提案する。
提案手法は,視覚エンコーダとLCM間の有効トークンを2つの重要なモジュールを通して効率的に整列する。
本研究では,ビデオアノマ対応MLLMの微調整のための命令追従データセットを構築した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:30:05 GMT)
LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [51.8] 拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:58:06 GMT)
Turning Logic Against Itself : Probing Model Defenses Through Contrastive Questions [51.5] 非倫理的反応を引き起こすために、対照的な推論を利用する新しいジェイルブレイク手法であるPOATEを導入する。
PoATEは意味論的に意図に反し、敵のテンプレートと統合し、有害なアウトプットを驚くほど微妙に操る。
これに対応するために、悪意のある意図と理性を検出するためにクエリを分解して、有害な応答を評価し、拒否するIntent-Aware CoTとReverse Thinking CoTを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:18:49 GMT)
Using Imperfect Synthetic Data in Downstream Inference Tasks [50.4] モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を改善することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:32:52 GMT)
VQAThinker: Exploring Generalizable and Explainable Video Quality Assessment via Reinforcement Learning [50.3] 映像品質評価は、知覚的品質劣化を客観的に定量化することを目的としている。
既存のVQAモデルには2つの限界がある。
推論に基づくVQAフレームワークである textbfVQAThinker を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:16:23 GMT)
ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation [49.8] ThematicPlaneは,ユーザが高レベルのセマンティック概念をナビゲートし操作できるシステムである。
このインターフェースは、暗黙の創造意図とシステム制御のギャップを埋める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:57:14 GMT)
Semantic Item Graph Enhancement for Multimodal Recommendation [49.7] マルチモーダルレコメンデーションシステムは、商品のマルチモーダル情報を活用することで、パフォーマンスの向上に注目が集まっている。
先行する手法は、しばしばモダリティ固有のアイテム・イテム意味グラフを生のモダリティの特徴から構築する。
これらのセマンティックグラフは、アイテム間の協調信号のモデリングが不十分ななど、セマンティックな欠陥に悩まされている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:20:50 GMT)
In-Context Reinforcement Learning via Communicative World Models [49.0] この研究は、2エージェントの緊急通信問題としてICRLを定式化する。
これは、転送可能な通信コンテキストを学ぶフレームワークであるCORALを紹介している。
実験により,本手法により,CAが試料効率を大幅に向上できることが実証された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:23:23 GMT)
DreamVE: Unified Instruction-based Image and Video Editing [48.6] 本稿では,DreamVEを紹介した。DreamVEは命令ベースの画像編集とビデオ編集の統一モデルである。
本稿では,まず画像編集,次にビデオ編集という2段階の学習戦略を提案する。
我々はコラージュベースおよび生成モデルベースデータ合成を含む包括的トレーニングデータパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:20:30 GMT)
DrVoice: Parallel Speech-Text Voice Conversation Model via Dual-Resolution Speech Representations [48.2] 本稿では,共同自己回帰モデルに基づくパラレル音声音声対話モデルであるDrVoiceを提案する。
提案手法は,LLMの入力周波数を5Hzに低減する。
Spoken Question Answeringベンチマークの実験結果は、D RVOICEが新しい最先端(SOTA)性能を確立することを示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:35:44 GMT)
Live Music Models [47.3] 我々は,ライブ音楽モデルと呼ばれる音楽生成モデルの新たなクラスを導入する。
これらのモデルは、同期されたユーザ制御で、リアルタイムで音楽の連続的なストリームを生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:28:13 GMT)
Sample-Efficient Reinforcement Learning from Human Feedback via Information-Directed Sampling [46.0] 本研究では,大規模言語モデルの学習において重要な課題である,人間からのフィードバック(RLHF)による強化学習の課題について検討する。
我々の主な貢献は、情報指向サンプリング(IDS)に基づく新しいサンプル効率RLHFアルゴリズムの設計である。
本研究は、強化学習と大規模言語モデルの訓練における情報理論の価値を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:36:58 GMT)
CUB: Benchmarking Context Utilisation Techniques for Language Models [45.8] 言語モデル(LM)は、時代遅れのパラメトリックメモリと矛盾する関連情報を無視したり、無関係なコンテキストに邪魔されることがある。
CUB(Context Utilisation Benchmark)は、実践者が異なるコンテキスト条件下でCMTを診断するのを助けるために設計された、最初の総合的なベンチマークである。
以上の結果から,既存のCMTでは,実世界の検索拡張シナリオで発生するコンテキストタイプの全スペクトルを扱うのに苦労していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:36:59 GMT)
eSASRec: Enhancing Transformer-based Recommendations in a Modular Fashion [45.8] SASRecやBERT4Recのようなトランスフォーマーベースのモデルは、シーケンシャルレコメンデーションの一般的なベースラインとなっている。
我々は、SASRecのトレーニング目標、LiGRトランスフォーマー層、Sampred Softmax Lossを使用する非常に強力なモデルを特定する。
一般的な学術ベンチマークでは、最新の最先端モデルと比較して、eSASRecは23%有効であることが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:49:03 GMT)
Survey on the Evaluation of Generative Models in Music [45.7] 本稿では,システム出力とモデル利用の両方を評価するための共通評価対象,方法論,メトリクスの学際的検討を行う。
我々はこれらのアプローチの利点と限界について,音楽学,工学,HCIの観点から検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:02:06 GMT)
Rank1: Test-Time Compute for Reranking in Information Retrieval [45.4] Rank1はテスト時間計算を活用するためにトレーニングされた最初のリグレードモデルである。
我々は、MS MARCOのクエリやパスからのR1推論トレースの600,000以上のサンプルのデータセットを収集し、オープンソース化する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:48:31 GMT)
Pushing the Envelope of LLM Inference on AI-PC [45.1] ウルトラロービットモデル(1/1.58/2-bit)は、同じモデルサイズを用いて、その完全精度のモデルのパープレキシティとエンドタスクのパフォーマンスとを一致させる。
最先端の推論ランタイム(例えばbitnet)の計算効率は未調査のままである。
まず1ビットと2ビットのマイクロカーネルを設計・実装し,計算効率の最大化を実現した。
我々は、現在のSOTAランタイムビットネットよりも優れた2ビットモデルを用いて、エンドツーエンドの推論結果を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:33:38 GMT)
Interference Between Electromagnetic and Mechanical Waves [45.0] 物理特性の異なる波の干渉、特に電磁・機械的干渉について検討する。
我々は,光パルスが音波の通過を制御するような,トランジスタやウェーブパケットのフィルタなどの新しいハイブリッド量子デバイスを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:15:59 GMT)
Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset [44.9] 白血病は世界で10番目に頻繁に診断されるがんであり、がん関連死亡の原因の1つとなっている。
医学画像の深層学習の進歩にもかかわらず、白血病解析には多種多様なマルチタスクデータセットが欠けている。
大規模WBCデータセットと,その属性を用いてWBCを検出する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:06:04 GMT)
One Size Does Not Fit All: A Distribution-Aware Sparsification for More Precise Model Merging [44.6] マージ手法の鍵となるテクニックはスパーシフィケーション(sprsification)であり、タスクベクトルから冗長なパラメータを抽出して干渉を緩和する。
textbfTADrop(textbfTensor-wise textbfAdaptive textbfDrop)を導入する。
グローバル比の代わりに、TADropはその分布特性に基づいて各パラメータテンソルに調整された空間レベルを割り当てる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:33:08 GMT)
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists? [44.6] 言語モデル(LM)エージェントは、自律的な意思決定者としてますます使われている。
LMの因果関係を探索・推測する能力について検討する。
LMは共通で直感的な因果関係を確実に推測するが、体系的には特異だが等しく、共役関係を証明している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:06:10 GMT)
SAM Encoder Breach by Adversarial Simplicial Complex Triggers Downstream Model Failures [43.2] Segment Anything Model (SAM) は、ゼロショット能力で対話的なセグメンテーションを変換する。
SAM固有の脆弱性は単一ポイントのリスクを示し、多くのダウンストリームアプリケーションの障害につながる可能性がある。
本稿では,SAMのエンコーダのみを利用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:47:26 GMT)
Prosocial Behavior Detection in Player Game Chat: From Aligning Human-AI Definitions to Efficient Annotation at Scale [43.0] 社会性は、信頼と安全システムにとって、新しくてますます重要な課題である。
有毒な内容の検出とは異なり、社会性には明確な定義やラベル付きデータがない。
本稿では,スケーラブルで高精度なプロソシエタリコンテンツ分類を可能にする,実用的な3段階パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:04:14 GMT)
ReGLA: Refining Gated Linear Attention [43.0] 線形注意は、標準変圧器に固有の2次時空の複雑さを減らすように設計されている。
我々は、以前の提案が見落としていたいくつかの重要な問題に対処する機能マッピング機能を開発した。
また, ゲーティング機構の飽和現象を探索し, 精製モジュールで補強した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:42:33 GMT)
Budgeted Embedding Table For Recommender Systems [42.9] BET(Budgeted Embedding Table)は、メモリ予算を満たすように保証されたテーブルレベルのアクションを生成する新しい方法である。
BETは、メモリ予算の異なる3つの一般的な推奨モデルと組み合わせられている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:20:29 GMT)
SuperRL: Reinforcement Learning with Supervision to Boost Language Model Reasoning [42.5] まばらな報酬のある環境では、強化学習は軌道のサンプリングに苦労する。
我々は、RLとSFTを代替する統合トレーニングフレームワークであるSuperRLを紹介する。
実験により、スーパーRLは、サンプル効率の向上、一般化の強化、スパース報酬下での堅牢性の向上により、バニラRLを超えることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:03:03 GMT)
HASD: Hierarchical Adaption for pathology Slide-level Domain-shift [41.6] スライドレベルドメインシフト(HASD)のための階層的適応フレームワークを提案する。
HASDはマルチスケールの特徴整合性と計算効率のよいスライドレベルドメイン適応を実現する。
5つのデータセットにまたがる2つのスライドレベルのタスクに対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:04:58 GMT)
Beyond Prompt-Induced Lies: Investigating LLM Deception on Benign Prompts [41.5] 大規模言語モデル(LLM)は、推論、計画、意思決定のタスクに広くデプロイされている。
本稿では,虚偽の可能性を定量化するために,心理学的原理から得られた統計的指標を紹介する。
その結果,最も先進的なLCMでさえ,複雑な問題に対処する上で,騙しの傾向が高まっていることが判明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:46:35 GMT)
Automated Privacy Information Annotation in Large Language Model Interactions [40.9] 実際の識別子の下で大きな言語モデル(LLM)と対話するユーザは、プライベート情報の開示を無意識にリスクを負うことが多い。
既存のプライバシ検出方法は、異なる目的とアプリケーションドメインのために設計されている。
249Kのユーザクエリと154Kの注釈付きプライバシフレーズを備えた大規模多言語データセットを構築した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:06:38 GMT)
Efficient Multimodal Streaming Recommendation via Expandable Side Mixture-of-Experts [40.8] マルチモーダルストリーミングレコメンダシステムは、ユーザの関心が時間とともに変化する現実世界のアプリケーションに広くデプロイされている。
マルチモーダルストリーミングレコメンデーションのためのメモリ効率の高いフレームワークであるXSMoE(Expandable Side Mixture-of-Experts)を提案する。
XSMoEは、凍結したトレーニング済みエンコーダに軽量なサイドチューニングモジュールをアタッチし、ユーザのフィードバックの進化に応じて徐々に拡張する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:00:05 GMT)
Adacc: An Adaptive Framework Unifying Compression and Activation Recomputation for LLM Training [40.4] 大きな言語モデル(LLM)のトレーニングは、GPUメモリの制限によって制限されることが多い。
Adaccはアクティベーション再計算とデータ圧縮を統合する最初の適応型メモリ最適化フレームワークである。
Adaccは、最先端のフレームワークと比較して、トレーニングのスループットを1.01倍から1.37倍改善している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:49:52 GMT)
Generative AI for Cel-Animation: A Survey [40.2] GenAIは、技術的な障壁を減らし、幅広いクリエイターへのアクセシビリティを広げることで、伝統的なアニメーションに革命をもたらしている。
その可能性にもかかわらず、一貫性、スタイリスティックなコヒーレンス、倫理的考察といった課題が続いている。
本稿では,AI支援アニメーションの今後の方向性について考察する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:38:42 GMT)
The Baby Universe is Fine and the CFT Knows It: On Holography for Closed Universes [39.6] 本稿では,AdS/CFTでビッグバン/ビッグクランチクローズド宇宙が実現可能であることを示す。
十分にバルク絡み合いがあれば、閉宇宙のバルクヒルベルト空間は CFT でホログラフィックに符号化することができる。
本稿では,初期状態と最終状態の射影が与えられた宇宙における時間矢印の出現モデルを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:29:08 GMT)
Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs [38.6] オープンウェイトAIシステムは、ウェイトやアクティベーションを変更することで有害な振る舞いを効果的に引き出すことができる攻撃の改ざんに弱い。
既存の安全ファインチューニング手法は、数十段階以上の敵のファインチューニングに抵抗するオープンウェイトモデルを作るのに苦労している。
スケーラブルなデータフィルタリングのためのマルチステージパイプラインを導入し、バイオスリートプロキシの知識を最小化するための、トラクタブルで効果的な方法を提供していることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:59:47 GMT)
A Markov Random Field model for Hypergraph-based Machine Learning [38.4] 本稿では,ハイパーグラフ上でのデータ生成プロセスをモデル化する上での課題について述べる。
提案したデータ生成プロセスは、様々なハイパーグラフ機械学習タスクに価値ある帰納バイアスを与える。
本稿では,1)HGSIという独自のハイパーグラフ構造推論フレームワーク,2)ハイパーグラフ上のノード分類のためのHypergraph-MLPという新しい学習フレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:22:42 GMT)
Can Large Models Fool the Eye? A New Turing Test for Biological Animation [38.2] 大規模言語モデル(LLM)とマルチモーダル大規模言語モデル(MLLM)を視覚的アニメーションで評価するための新しいフレームワークであるBioMotion Arenaを紹介する。
本手法は,生物特有の運動パターンの視覚的知覚からインスピレーションを得ている。
我々は,90の生物運動変種に対して,ペアワイズ比較評価を用い,53のメインストリームLLMとMLLMの45k以上を収集した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:10:17 GMT)
Temporal Self-Rewarding Language Models: Decoupling Chosen-Rejected via Past-Future [38.2] 自己回帰言語モデル(Self-Rewarding Language Models)は、LLM-as-a-Judgeプロンプトを通じて、大きな言語モデル(LLM)が応答を生成し、独自の出力を評価するアーキテクチャを提案する。
本研究では,過去,現在,将来のモデル世代を戦略的に調整し,学習信号を持続するテキストbf自己回帰言語モデルを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:25:54 GMT)
Are Your LLMs Capable of Stable Reasoning? [38.0] G-Pass@$k$は、複数のサンプリング試行においてモデル性能を継続的に評価する新しい評価指標である。
私たちはG-Pass@$k$と最先端の大規模言語モデルを使って、その潜在能力と運用上の一貫性に関する包括的な洞察を提供しています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:28:01 GMT)
Hybrid Physics-Machine Learning Models for Quantitative Electron Diffraction Refinements [37.7] 本稿では,ニューラルネットワークに微分可能な物理シミュレーションを統合するハイブリッド物理機械学習フレームワークを提案する。
我々は3次元電子回折(3D-ED)構造改善への応用を通して,この枠組みを実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:13:12 GMT)
ExploreGS: Explorable 3D Scene Reconstruction with Virtual Camera Samplings and Diffusion Priors [37.5] 本稿では3DGSをベースとしたパイプラインを提案し,再現性を高めるための追加のトレーニングビューを生成する。
細調整された3Dガウスの視界は、再建の質を著しく向上させる。
実験により,本手法は既存の3DGS法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:01:17 GMT)
FedMeNF: Privacy-Preserving Federated Meta-Learning for Neural Fields [37.2] ニューラルネットワークのマッピングを学ぶには、大量のトレーニングデータと計算が必要です。
従来のFederated Meta-Learningアプローチは、プライバシー漏洩に悩まされている。
本稿では,ローカルメタ最適化におけるプライバシー漏洩を制御するFedMeNFを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:24:57 GMT)
From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models [36.7] 大規模言語モデル (LLM) は、数学的推論に関わる幅広い問題を解くために学習する。
オープンウェイトLLMの数学的推論能力は,事前学習と後学習の間にどのように発達するかを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:07:40 GMT)
DanceGRPO: Unleashing GRPO on Visual Generation [36.4] 強化学習(Reinforcement Learning, RL)は, 微調整型生成モデルにおいて有望なアプローチである。
DDPOやDPOKのような既存の手法は、大規模で多様なプロンプトセットへのスケーリングにおいて基本的な制限に直面している。
本稿では,グループ相対政策最適化の革新的適応を通じて,これらの制約に対処するフレームワークであるDanceGRPOを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:40:34 GMT)
Meta-Reasoner: Dynamic Guidance for Optimized Inference-time Reasoning in Large Language Models [35.8] 大規模言語モデル(LLM)は、推論時間の間に高い計算時間とエラーの伝播に苦労する。
提案するMeta-Reasonerは,LLMが推論時間における推論方法の戦略を調整することで,推論計算を最適化するための新しいフレームワークである。
提案手法は,従来のSOTA法よりも9~12%向上し,推論時間を28~35%短縮する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:01:34 GMT)
One ruler to measure them all: Benchmarking multilingual long-context language models [35.8] 我々は26言語にわたる長文言語モデルを評価するために設計された多言語ベンチマークONERULERを提案する。
英語は、長文タスク(26語中6位)における最高のパフォーマンス言語ではなく、ポーランド語が最上位言語として登場した。
異なる言語で命令とコンテキストが現れる言語間シナリオでは、命令言語によってパフォーマンスが最大20%変動する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:05:14 GMT)
Can Large Pretrained Depth Estimation Models Help With Image Dehazing? [35.5] 現実のシーンにおけるヘイズの性質が空間的に異なるため、画像のデハージングは依然として困難な問題である。
本稿では,様々なデハージングアーキテクチャとシームレスに統合可能なRGB-D融合モジュールを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:04:26 GMT)
Discerning minds or generic tutors? Evaluating instructional guidance capabilities in Socratic LLMs [34.9] 本研究は,単なる質問生成からより広範な指導指導能力へと焦点を移す。
実際の教育対話を基盤としたベンチマークである GuideEval を提案する。
実験の結果,既存のLLMは適応的な足場を効果的に提供できないことが判明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:02:44 GMT)
Observation Interference in Partially Observable Assistance Games [34.5] 我々は,人間とAIアシスタントが部分的な観察を行うことを可能にする,人間-AI値アライメント問題のモデルについて検討する。
最適なアシスタントは、人間が最適に演奏している場合でも、観察干渉行動をとる必要がある。
不合理性のボルツマンモデルに従えば、これはアシスタントが観察に干渉するインセンティブを生じさせることが示される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:51:07 GMT)
AnimateScene: Camera-controllable Animation in Any Scene [34.0] 近年,3Dシーンの再構築と4Dアニメーションが急速に進歩し,広く採用されている。
重要な難点は、人間を適切な場所に配置し、現場にスケールさせることである。
もう一つの課題は、人間と背景が異なる照明とスタイルを示し、非現実的な合成物を生み出すことである。
AnimateSceneは、上記の問題に統一されたフレームワークで対処する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:28:17 GMT)
Causal Mechanism Estimation in Multi-Sensor Systems Across Multiple Domains [34.0] 本稿では,複数の領域にまたがる異種データから因果関係を推定する新しい3段階のアプローチを提案する。
因果転移学習(Causal Transfer Learning, CTL)の原理を活用することで, CICMEは十分なサンプルが与えられた場合に, ドメイン不変因果機構を確実に検出することができる。
CICMEは、プールされたデータに因果探索を適用し、各ドメインのデータに繰り返し適用することで利点を生かし、特定のシナリオ下では両方のベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:28:53 GMT)
SABER: Switchable and Balanced Training for Efficient LLM Reasoning [34.0] 大言語モデル(LLM)は、複雑なタスクにおいて、チェーン・オブ・シークレット推論によって強化され、印象的な精度を達成している。
しかし、すべての問題に一様に適用されると、過剰な推論コストとレイテンシに悩まされる。
本稿では,LSMにユーザ制御可能なトークン予算推論を付与する強化学習フレームワークであるSABERを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:27:48 GMT)
WildSAT: Learning Satellite Image Representations from Wildlife Observations [33.7] 種の分布は、貴重な生態情報と環境情報をエンコードする。
衛星画像と地球にタグ付けされた何百万もの野生生物の観察を、市民科学プラットフォームで容易に利用できるようにするWildSATを紹介した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:58:18 GMT)
LLM Unlearning Without an Expert Curated Dataset [33.2] 言語モデル自体を用いて高品質な忘れセットを生成するために,スケーラブルで自動化されたアプローチを導入する。
提案手法は,入力としてドメイン名のみを必要とする構造化プロンプトパイプラインを通じて,教科書形式のデータを合成する。
我々の合成データセットは、ベースライン合成の代替品よりも一貫して優れており、専門家による合成データセットに匹敵するものであることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:30:08 GMT)
ART: Adaptive Relation Tuning for Generalized Relation Prediction [33.2] 視覚的関係検出(VRD)は、シーン内のオブジェクト間の関係を識別するタスクである。
プロンプトチューニングは視覚言語モデル(VLM)をVRDに適用するために使われてきたが、手作りのプロンプトを使用し、新規または複雑な関係に苦戦している。
我々は、多様な命令データに基づいてVLMを微調整することで、命令チューニングがより効果的なソリューションとなることを論じる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:31:57 GMT)
Synthetic Data Generation and Differential Privacy using Tensor Networks' Matrix Product States (MPS) [33.0] マトリックス製品状態(MPS)を用いたプライバシー保護のための高品質な合成データ生成手法を提案する。
我々は,MPSベースの生成モデルをCTGAN,VAE,PrivBayesといった最先端モデルと比較した。
以上の結果から,MPSは特に厳格なプライバシー制約の下で,従来のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:14:57 GMT)
LLMCARE: Alzheimer's Detection via Transformer Models Enhanced by LLM-Generated Synthetic Data [33.0] アルツハイマー病と関連する認知症は、米国の約500万人の高齢者に影響を及ぼす。
音声に基づく自然言語処理(NLP)は、早期認知低下を検出するための有望でスケーラブルなアプローチを提供する。
本研究は, トランスフォーマーの埋め込みと手作り言語的特徴を融合させるスクリーニングパイプラインを開発した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:44:55 GMT)
Humans overrely on overconfident language models, across languages [32.7] 5言語にわたる多言語言語(ミス)校正,過信,過信のリスクについて検討した。
私たちの研究によると、言語全体で過度に信頼されるリスクが高いことが分かりました。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:50:04 GMT)
Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge [32.7] 建築年数の推定は、持続可能性の向上に不可欠である。
持続可能な都市計画は、エネルギー消費を減らし、気候変動を緩和するために正確な建設年代データに依存している。
本研究では,新しいマルチモーダルベンチマークデータセットであるMapYourCityを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:08:54 GMT)
PREF: Reference-Free Evaluation of Personalised Text Generation in LLMs [32.3] ユーザ中心の情報システムにはパーソナライズドテキスト生成が不可欠である。
textbfPersonalized textbfReference-free textbfEvaluation textbfFrameworkを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:32:31 GMT)
UW-3DGS: Underwater 3D Reconstruction with Physics-Aware Gaussian Splatting [31.8] UW-3DGS, 3D Gaussianting (3DGS) をロバストな水中再構築に応用した新しいフレームワークについて紹介する。
主なイノベーションは,(1) 空間的減衰と後方散乱にボクセルによる回帰を用いた, 学習可能な水中画像形成モジュールである。
SeaThru-NeRFとUWBundleデータセットの実験では、PSNRが27.604、SSIMが0.868、LPIPSが0.104、浮動小天体が65%減少している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:36:32 GMT)
A variational approach to dimension-free self-normalized concentration [31.2] 我々は、様々なよく知られた分布を含む尾条件であるsub-$psi$プロセスのバウンダリに焦点を当てる。
本研究の結果は, 行列式境界と条件数に基づく値との差を埋めるものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:44:09 GMT)
CISO: Species Distribution Modeling Conditioned on Incomplete Species Observations [31.0] 種分布モデル(SDM)は、種の地理的分布を予測するために広く用いられている。
CSISは、不完全種観測に基づく種分布モデリングのための深層学習に基づく手法である。
我々は,異なる種群を表す3つのデータセットを用いたアプローチを実証した。植物のためのsOpen,鳥類のためのSatBird,蝶のためのSatButterfly。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:15:12 GMT)
Not All Data Are Unlearned Equally [30.9] 未学習の成功は、モデルの事前学習データにおいて、学習したい知識の頻度に依存するかを検討する。
確率と生成に基づくアンラーニング評価のミスアライメントを発見し、モデルが大きくなるにつれてこの問題が悪化することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:18:44 GMT)
GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning [30.8] 隠れゴール条件付き正規化(HGR)は、隠れゴールに基づいて行動正規化前処理を生成する手法である。
提案手法により, 外部RLアルゴリズムによる体験利用の最大化が可能となる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:12:14 GMT)
Computing Efficiently in QLDPC Codes [30.7] 我々はCliffordグループを効率的にコンパイルできる新しいQLDPCコード群を紹介する。
我々は深度126論理回路の回路レベルシミュレーションを行い、QLDPC符号の論理演算がニアメモリ性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:05:24 GMT)
A Semantic Segmentation Algorithm for Pleural Effusion Based on DBIF-AUNet [30.1] 胸水セマンティックセグメンテーションは臨床診断と治療の精度とタイムラインを大幅に向上させる可能性がある。
既存の手法は、様々な画像のバリエーションや複雑なエッジに悩まされることが多い。
本稿では,これらの課題に対処するため,Dual-Branch Interactive Fusion Attention Model (DBIF-AUNet)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:14:51 GMT)
MathReal: We Keep It Real! A Real Scene Benchmark for Evaluating Math Reasoning in Multimodal Large Language Models [29.7] MathRealは2000の数学的質問と、ハンドヘルドモバイルデバイスが実際のシナリオで捉えた画像からなるデータセットである。
MathRealは5つの中核的な知識と能力のカテゴリにまたがっており、3つの質問タイプを含み、3つの困難レベルに分けられる。
実世界のシナリオにおける最先端MLLMのマルチモーダル数学的推論能力を評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:39:16 GMT)
iTFKAN: Interpretable Time Series Forecasting with Kolmogorov-Arnold Network [29.3] 信頼性のある時系列予測のための新しい解釈可能なモデルiTFKANを提案する。
iTFKANは、モデルシンボル化によって達成される解釈可能性により、モデル決定の論理と基礎となるデータパターンのさらなる探索を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:14:54 GMT)
Web3 x AI Agents: Landscape, Integrations, and Foundational Challenges [29.3] Web3テクノロジとAIエージェントの収束は、分散化されたエコシステムを再形成する、急速に進化するフロンティアを表している。
本稿では, ランドスケープ, 経済, ガバナンス, セキュリティ, 信頼メカニズムの5つの重要な側面について, Web3 と AI エージェントの交わりについて, 初めてかつ最も包括的な分析を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:05:32 GMT)
AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection [29.1] AnomalyMoEは、Mixture-of-Expertsアーキテクチャに基づいた、新しく普遍的な異常検出フレームワークである。
我々の重要な洞察は、複雑な異常検出問題を3つの異なる意味階層に分解することである。
AnomalyMoEはパッチ、コンポーネント、グローバルレベルで3つの専用の専門家ネットワークを使用している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:33:18 GMT)
CoDe-NeRF: Neural Rendering via Dynamic Coefficient Decomposition [29.0] 動的係数分解に基づくニューラルネットワークレンダリングフレームワークを提案する。
我々のアプローチは、複雑な外観を、固有の材料特性を符号化する共有静的ニューラルネットワークベースに分解する。
提案手法は,既存の手法と比較して,よりシャープでリアルなスペクトルハイライトを生成できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:30:02 GMT)
Fourier-VLM: Compressing Vision Tokens in the Frequency Domain for Large Vision-Language Models [28.8] Vision-Language Models (VLM) は通常、定義された画像プレースホルダートークンをイメージエンコーダの視覚的特徴に置き換え、バックボーンのLarge Language Model (LLM) への入力を形成する。
本稿では,周波数領域における視覚表現を圧縮するシンプルで効率的なFourier-VLMを提案する。
我々のアプローチは、視覚エンコーダから出力される視覚特徴が低周波成分に集中したエネルギーを示すという観察に動機づけられている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:49:42 GMT)
Embodied Intelligence for 3D Understanding: A Survey on 3D Scene Question Answering [28.7] 3D Scene Question Answeringは、3D視覚認識と自然言語処理を統合した学際的なタスクである。
大規模マルチモーダルモデリングの最近の進歩は、多様なデータセットの作成を促している。
われわれは3D SQAの総合的かつ体系的なレビューを行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:24:11 GMT)
DAVSP: Safety Alignment for Large Vision-Language Models via Deep Aligned Visual Safety Prompt [27.9] LVLM(Large Vision-Language Models)は、様々なアプリケーションで顕著な進歩を遂げているが、悪意のあるクエリには弱いままである。
既存のアライメントアプローチは、悪意のあるクエリを効果的に保存しながら、悪意のあるクエリに抵抗することができない。
本稿では、入力画像の周囲にトレーニング可能なパディング領域を付加するDeep Aligned Visual Safety Prompt (DAVSP)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:35:47 GMT)
E-React: Towards Emotionally Controlled Synthesis of Human Reactions [27.2] 既存の人間の動き生成フレームワークは感情の影響を考慮していない。
異なる感情的手がかりに反応して多様な反応運動を発生させるという,新しい課題を導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:36:32 GMT)
Efficient Knowledge Probing of Large Language Models by Adapting Pre-trained Embeddings [27.1] 大規模言語モデル(LLM)は、科学、歴史、地理など様々な分野の知識を取得する。
これらの手法は、特定の事実に関する LLM の知識を調査するために、基礎となるモデルを前方通過する必要がある。
LLMのプロキシとしてテキストやグラフとして事実知識を効果的にエンコードする埋め込みモデルを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:32:31 GMT)
Reconsidering the Performance of GAE in Link Prediction [27.0] リンク予測のためのグラフニューラルネットワーク(GNN)は、高度なトレーニング技術とモデルアーキテクチャを導入している。
この問題に対処するために、近年の手法でモデルに依存しないトリックを適用することにより、グラフオートエンコーダ(GAE)を体系的に探索する。
改良されたGAEは、近年の洗練されたモデルの性能に匹敵し、広く使われているリンク予測ベンチマークに優れた計算効率を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:01:13 GMT)
ConlangCrafter: Constructing Languages with a Multi-Hop LLM Pipeline [26.9] 我々は,現代のLLMを,エンドツーエンドのコンラン生成のための計算クリエイティビティ支援として活用する。
言語設計をモジュールステージに分解するマルチホップパイプラインであるConlangCrafterを紹介します。
ConlangCrafterはコヒーレンスとタイポロジーの多様性を測定する指標として評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:36:48 GMT)
SDEval: Safety Dynamic Evaluation for Multimodal Large Language Models [25.6] 安全ベンチマークの分布と複雑さを制御的に調整するテキストファースト安全性動的評価フレームワークであるtextbfSDEvalを提案する。
SDEvalは主にテキスト、画像、テキストイメージの3つの動的戦略を採用し、オリジナルのベンチマークから新しいサンプルを生成する。
安全ベンチマーク、MLLMGuard、VLSBench、能力ベンチマーク、MMBench、MMVetによる実験では、SDEvalは安全性評価に大きく影響を与え、データの汚染を軽減し、MLLMの安全性制限を公開する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:01:56 GMT)
KnapFormer: An Online Load Balancer for Efficient Diffusion Transformers Training [25.1] 我々は、Diffusion Transformer (DiT) の分散トレーニングにおけるワークロード分散とシーケンス並列性を組み合わせたフレームワークであるKnapFormerを提案する。
KnapFormerは、列の並列性とランク間の重要なトークンの不均衡に対処する必要性の間に強いシナジーが存在するという洞察に基づいている。
ストラグラー効果を排除し、2倍から3倍のスピードアップを実現し、FLUXのような最先端の拡散モデルを混合解像度と画像-ビデオの関節データコーパスでトレーニングする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:06:08 GMT)
Nyay-Darpan: Enhancing Decision Making Through Summarization and Case Retrieval for Consumer Law in India [25.1] Nyay-Darpanは、消費者の事例ファイルを要約した新しいフレームワークで、消費者の紛争解決における意思決定を支援するために、同様の事例判断を検索する。
本システムでは, 類似事例の予測において75%以上の精度と, 資料要約評価指標の約70%の精度を達成している。
Nyay-Darpanフレームワークとデータセットを公開して、この未調査だが影響のある領域におけるさらなる研究を促進し、促進します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:25:37 GMT)
More Is Better: A MoE-Based Emotion Recognition Framework with Human Preference Alignment [24.6] MER2025における半教師付き学習トラック(MER-SEMI)のソリューションを提案する。
より優れた」という原則に基づく包括的枠組みを提案し,より堅牢なMixture of Experts (MoE)感情認識システムを構築する。
我々のアプローチは、独立した専門家として多様な入力モダリティを統合する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:44:26 GMT)
CF3: Compact and Fast 3D Feature Fields [24.2] 3D Gaussian Splatting (3DGS)は2Dファンデーションモデルから豊富な情報を取り入れ始めた。
本稿では,コンパクトかつ高速な3次元ガウス特徴場,すなわちCF3を構築するためのトップダウンパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:35:45 GMT)
Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation [24.1] Open-Vocabulary Part (OVPS) は、未確認のカテゴリにおいて、きめ細かい部分を認識するための新興分野である。
OVPSの主な課題は,部分レベルの画像テキスト対応の整合性の難しさと,分割対象部分の構造的理解の欠如である。
本稿では,DINOから,オブジェクト認識型部分的コストアグリゲーション,構成的損失,構造的ガイダンスを統合した新しいフレームワークであるPartCATSegを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:51:23 GMT)
Q-CLIP: Unleashing the Power of Vision-Language Models for Video Quality Assessment through Unified Cross-Modal Adaptation [23.9] VLM(Vision-Language Models)は、幅広い視覚タスクにまたがる顕著な一般化機能を示す。
ビデオ品質評価(VQA)のための完全なVLMベースのフレームワークQ-CLIPを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:36:01 GMT)
Graph Federated Learning for Personalized Privacy Recommendation [23.6] 本稿では,個人化プライバシ勧告のためのグラフフェデレーション学習(GFed-PP)を提案する。
GFed-PPは、レコメンデーションパフォーマンスを改善しながら、異なるプライバシ要件に適合する。
5つのデータセットで既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:44:33 GMT)
Affordance-R1: Reinforcement Learning for Generalizable Affordance Reasoning in Multimodal Large Language Model [23.6] Affordance Groundingは、ロボットが実行するアクションに関連するオブジェクトの特定の領域を予測することに焦点を当てている。
既存のモデルは、しばしば異なるオブジェクト間で共有される余裕を無視する。
Affordance-R1は,認知的CoT誘導グループ相対的政策最適化を統合した,最初の統合型アプライアンス基盤フレームワークである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:39:04 GMT)
Symmetry breaking for inductive logic programming [23.3] 仮説空間における対称性を破る手法を提案する。
視覚的推論やゲームプレイなど,複数の領域に対する実験により,本手法が1時間以上から17秒に短縮できることが判明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:28:42 GMT)
Meta-Learning for Speeding Up Large Model Inference in Decentralized Environments [23.1] 分散AIシステムにおける推論促進のためのメタラーニングベースのフレームワークを提案する。
従来の手法とは異なり,本フレームワークは各タスクの特徴に基づいて,最適な加速度戦略を体系的に同定する。
我々の結果は、分散AIシステムにおける推論加速の可能性を強調した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:53:53 GMT)
Foundation versus Domain-specific Models: Performance Comparison, Fusion, and Explainability in Face Recognition [23.1] すべての顔ベンチマークデータセットでは、ドメイン固有のモデルはゼロショット基礎モデルよりも優れていた。
ファウンデーションモデルとドメイン固有の顔認識モデルとの単純なスコアレベル融合により、偽マッチング率の低い精度が向上した。
GPT-4oやGrok-4のような基礎モデルは、顔認識パイプラインに説明可能性を提供することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:43:22 GMT)
AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models [23.0] AVA-Benchは、14のAtomic Visual Abilities(AVA)を明示的にアンタングルする最初のベンチマークである。
AVAを分離し、それぞれのトレーニングとテスト分布を一致させることで、VA-Bench は VFM が引き寄せる位置を正確に特定する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:33:21 GMT)
X-EcoMLA: Upcycling Pre-Trained Attention into MLA for Efficient and Extreme KV Compression [23.0] MLA(Multi-head Latent attention)は、KVキャッシュメモリを低ランクキー値のジョイント圧縮により最適化するように設計されている。
提案手法は,ベンチマークの性能を保ちながら,KVキャッシュを効果的に圧縮できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:16:33 GMT)
CPT-Interp: Continuous sPatial and Temporal Motion Modeling for 4D Medical Image Interpolation [22.9] 4D医療画像からの運動情報は、臨床評価と放射線治療計画のための患者解剖学の動的変化に関する重要な洞察を提供する。
しかし、画像ハードウェアの物理的および技術的な制約は、時間分解能と画質の妥協を必要とすることが多い。
暗黙的神経表現を用いた患者解剖運動を連続的にモデル化するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:07:51 GMT)
A dataset of primary nasopharyngeal carcinoma MRI with multi-modalities segmentation [22.9] このデータセットは、T1重み付き、T2重み付き、およびコントラスト強化T1重み付きシーケンスを含み、合計で831スキャンである。
対応する臨床データに加えて、経験者による手動注釈とラベル付きセグメンテーションは、未処理の一次NPCから高品質なデータ資源を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:55:53 GMT)
DONOD: Efficient and Generalizable Instruction Fine-Tuning for LLMs via Model-Intrinsic Dataset Pruning [22.7] 大規模言語モデル(LLM)のアドホック命令の微調整は、ドメイン固有の適応に広く採用されている。
本研究では,軽量なモデル固有データ解析手法であるDONODを提案する。
データセット全体の70%をフィルタリングすることで、ターゲットドメインの精度を14.90%、クロスドメインの精度を5.67%向上させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:29:20 GMT)
FIT-Print: Towards False-claim-resistant Model Ownership Verification via Targeted Fingerprint [22.4] モデルフィンガープリントは、オープンソースモデルの知的財産権を保護するために広く採用されているアプローチである。
本稿では, 相手が第三者モデルの所有権を誤って主張する, 虚偽のクレーム攻撃に対して脆弱であることを明らかにする。
これらの知見に触発され,疑似クレーム攻撃に対処するための指紋認証パラダイム(FIT-Print)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:02:54 GMT)
Adaptive Backtracking for Privacy Protection in Large Language Models [22.3] 本稿では,企業指向のプライバシに関する新たな目的について紹介する。
データ・サニタイズなどの既存の手法では、モデルの性能が著しく低下する。
隠れ状態モデルを活用するトレーニングフリーのメカニズムであるABackを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:29:33 GMT)
Learning to Detect Unknown Jailbreak Attacks in Large Vision-Language Models: A Unified and Accurate Approach [22.2] 本稿では、異常検出としてジェイルブレイク検出を定式化する、新しい教師なしフレームワークを提案する。
LoDは最先端の性能を達成し、平均的なAUROCは0.9951で、最強のベースラインよりも最小のAUROCは38.89%向上した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:13:28 GMT)
Feedback-Guided Extraction of Knowledge Base from Retrieval-Augmented LLM Applications [22.2] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の知識境界を拡張する
エージェントベースのブラックボックス攻撃であるCopyBreakRAGを提案する。
実験結果から,CopyBreakRAGは,チャンク抽出比において,最先端のブラックボックスアプローチを平均45%上回った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:56:30 GMT)
A Federated Learning Framework for Handling Subtype Confounding and Heterogeneity in Large-Scale Neuroimaging Diagnosis [22.0] 本稿では,ニューロイメージングCADシステムに適した新しいフェデレーション学習フレームワークを提案する。
私たちのアプローチには、最も適切なローカルモデルにサンプルをルーティングする動的ナビゲーションモジュールが含まれています。
1300名以上のMDD患者のfMRIデータと1100名の健常者を対象とした。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:19:49 GMT)
The Alternative Annotator Test for LLM-as-a-Judge: How to Statistically Justify Replacing Human Annotators with LLMs [22.0] LLM-as-an-judge」パラダイムは、人間が伝統的に行ってきたタスクにおいて、アノテータ、審査員、評価役としてLarge Language Models(LLM)を用いる。
研究結果や洞察を形成する上での役割にもかかわらず、LLMがヒトのアノテーターを置き換えることができるかどうかを判断するための標準的あるいは厳格な手順は存在しない。
LLMアノテーションの使用を正当化するために、アノテーション付きサンプルの控えめなサブセットだけを必要とする新しい統計手法である代替アノテーションテスト(alt-test)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:36:34 GMT)
From Values to Tokens: An LLM-Driven Framework for Context-aware Time Series Forecasting via Symbolic Discretization [21.8] 時系列予測は、エネルギー、医療、金融など、幅広い重要な応用において意思決定を支援する上で重要な役割を担っている。
我々は,言語に基づく記号表現を文脈対応時系列予測のための統合仲介手段として活用する,LLM駆動のフレームワークであるTokenCastを提案する。
具体的には、TokenCastは離散トークン化器を使用して、連続する数値列を時間トークンに変換し、言語ベースの入力と構造的アライメントを可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:51:08 GMT)
SC-Captioner: Improving Image Captioning with Self-Correction by Reinforcement Learning [21.7] SC-Captionerはイメージキャプションモデルの自己修正を可能にする強化学習フレームワークである。
初期字幕と自己修正字幕のセット間の設定差を計算し、追加要素と削除要素を識別する。
大規模な視覚言語モデルにSC-Captionerを適用すると、様々なシナリオでより良い画像キャプションが生成される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:45:52 GMT)
Generating, Fast and Slow: Scalable Parallel Video Generation with Video Interface Networks [21.7] 本稿では,ビデオ・インタフェース・ネットワーク (VIN) と呼ばれる新しいパラダイムを導入し,ビデオ・チャンクの並列推論を可能にする抽象化モジュールでDiTを拡張した。
VINは局所チャンクのノイズの多い入力と符号化された表現からグローバルセマンティクスをエンコードする。
フルジェネレーションよりも25~40%少ないFLOPを用いて,最先端動作のスムーズさを実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:06:08 GMT)
MPG-SAM 2: Adapting SAM 2 with Mask Priors and Global Context for Referring Video Object Segmentation [21.4] ビデオオブジェクトセグメンテーション(RVOS)の参照は、ビデオ内のオブジェクトをテキスト記述に従ってセグメントすることを目的としている。
Segment Anything Model 2 (SAM2)は、様々なビデオセグメンテーションタスクにおいて大きな効果を示している。
本稿では,これらの課題に対処する新しいRVOSフレームワークMPG-SAM 2を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:17:56 GMT)
Effective Training Data Synthesis for Improving MLLM Chart Understanding [21.3] グラフ生成のモジュール化と視覚的詳細の多様化により、チャート理解能力が向上することを示す。
特に、5段階のデータ合成パイプラインを設計し、単一のプロット生成のためにデータと関数を分離する。
このアプローチにより、微調整データセットの生成を合理化できます。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:59:10 GMT)
EfficientEQA: An Efficient Approach to Open-Vocabulary Embodied Question Answering [21.1] 大規模視覚言語モデル(VLM)は、EQA(Embodied Question Answering)を約束している。
既存のアプローチでは、アクティブな探索をせずに静的なビデオ質問応答として扱うか、あるいはクローズドな選択に対する回答を制限するかのどちらかである。
EfficientEQAは,効率的な探索と自由形式の回答生成を両立させる新しいフレームワークである。
実験結果から,EQAの解答精度は15%以上向上し,最先端手法よりも20%以上の探索ステップが要求されることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:10:26 GMT)
SpeakerLM: End-to-End Versatile Speaker Diarization and Recognition with Multimodal Large Language Models [20.7] 話者ダイアリゼーションと認識タスクは、音声クリップ内で「誰がいつ何を話したか」を予測することを目的としている。
既存のSDRシステムは一般的に、話者ダイアリゼーション(SD)と自動音声認識(ASR)を組み合わせたカスケードフレームワークを採用している。
SpeakerLMは、SDとASRをエンドツーエンドで共同で実行するSDR用の統合マルチモーダル大言語モデルである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:04:00 GMT)
Adaptive Heterogeneous Graph Neural Networks: Bridging Heterophily and Heterogeneity [20.7] 不均一グラフ(HGs)は実世界のシナリオで一般的であり、しばしば不均一性を示す。
本稿では,これらの課題に対処するための適応不均一グラフニューラルネットワーク(AHGNN)を提案する。
AHGNNはホップとメタパスの両方に特有のヘテロフィリー分布を考慮に入れたヘテロフィリー認識の畳み込みを採用している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:39:58 GMT)
InterAct-Video: Reasoning-Rich Video QA for Urban Traffic [20.5] ディープラーニングは、質問応答(VideoQA)モデルを通じて、高度なビデオベースのトラフィック監視を実現する。
既存のVideoQAモデルは、現実世界の交通シーンの複雑さに悩まされている。
InterAct VideoQAは、トラフィック監視タスクのためのVideoQAモデルをベンチマークし、拡張するために設計された、キュレートされたデータセットである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:54:31 GMT)
ClimateSOM: A Visual Analysis Workflow for Climate Ensemble Datasets [20.5] ClimateSOMは、気候アンサンブルデータセットのインタラクティブな探索と解釈をサポートするビジュアル分析ワークフローである。
これにより、アンサンブルモデル実行間の変動を調査し、パターンを特定し、アンサンブルモデルの実行を比較およびクラスタ化することができる。
気候SOMの有用性を実証するため、カリフォルニアとアメリカ合衆国北西部の降水量予測のアンサンブルデータセットにワークフローを適用した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:15:43 GMT)
Contrastive Regularization over LoRA for Multimodal Biomedical Image Incremental Learning [20.5] 本手法は,モーダリティ内知識の共有性を高めるために,コントラスト正規化を取り入れつつ,モーダリティ特化LoRAモジュールを微調整する手法であるMSLoRA-CRを提案する。
提案手法は大規模視覚言語モデル(LVLM)上に構築され,事前学習したモデルを凍結させつつ,各モータリティやタスクに対して新たなLoRAモジュールを漸進的に適用する。
MSLoRA-CRは、制約なしのインクリメンタル学習法に比べて、全体的なパフォーマンスが1.88%向上している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:10:06 GMT)
Optimizing Prompt Sequences using Monte Carlo Tree Search for LLM-Based Optimization [20.4] 大規模言語モデル(LLM)は、コード生成と構造化推論において顕著な能力を示した。
本稿では,モンテカルロ木探索によって導かれる逐次決定過程として,選択を高速化するニューラルシンボリックフレームワークを提案する。
本手法は,コード生成品質の向上を目的として,複数ステップのプロンプトシーケンスを探索・精査する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:01:24 GMT)
CANVAS: Commonsense-Aware Navigation System for Intuitive Human-Robot Interaction [20.0] 本稿では,コモンセンス認識ナビゲーションのための視覚的および言語的指示を組み合わせたフレームワークであるCANVASを提案する。
その成功は模倣学習によって引き起こされ、ロボットは人間のナビゲーション行動から学ぶことができる。
実験の結果,CANVASはすべての環境において,強力なルールベースシステムであるROS NavStackよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:20:36 GMT)
Real-time scattering and freeze-out dynamics in Rydberg-atom lattice gauge theory [19.2] 1+1)次元U(1)ゲージ理論における実時間散乱とフリーズアウトダイナミクスを観察する。
我々の研究は、非摂動ゲージ力学を探索するための高分解能なアプローチを確立している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:36:20 GMT)
Recurrent Deep Differentiable Logic Gate Networks [19.0] 本稿では,Recurrent Deep Differentiable Logic Gate Networks (RDDLGN)の最初の実装について述べる。
トレーニング中の5.00 BLEUと30.9%の精度を実現し、GRU性能(5.41 BLEU)と推論中の優雅な劣化(4.39 BLEU)に近づいた。
この研究は、リカレント論理に基づくニューラル計算を実行可能なものとして確立し、シーケンシャルモデリングにおけるFPGAアクセラレーションの研究方向を開放する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:49:38 GMT)
Rethinking the Bias of Foundation Model under Long-tailed Distribution [18.8] 本稿では,事前学習による不均衡が長時間の下流作業にどのように影響するかを検討する。
下流タスクの基盤モデルで継承される不均衡バイアスはパラメータ不均衡とデータ不均衡である。
本稿では,入力サンプルとラベル間の真の因果関係を学習する新しいバックドア調整手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:04:58 GMT)
DP-SPRT: Differentially Private Sequential Probability Ratio Tests [18.8] 我々は、プライバシー制約の下で2つの単純な仮説のシーケンシャルなテストのために、ウォルドの有名なシークエンシャル確率比テストを再検討する。
所望のエラー確率とプライバシ制約を達成するために校正可能なラッパーであるDP-SPRTを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:09:13 GMT)
Roll Your Eyes: Gaze Redirection via Explicit 3D Eyeball Rotation [18.6] 本稿では,明快な3次元眼球構造を利用した新しい3次元視線リダイレクトフレームワークを提案する。
本手法は, 3次元眼球構造を明示的に回転・翻訳することにより, 所望の視線方向を忠実に再現するフォトリアリスティック画像を生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:56:51 GMT)
Are Large Language Models Robust in Understanding Code Against Semantics-Preserving Mutations? [18.5] 最大8Bのパラメータを持つ最先端の大規模言語モデルがPythonプログラムを推論できるのか、それとも単純に推測できるのかを評価する。
変数のリネーム、比較式のミラー化、if-elseブランチのスワップ、ループの while への変換、ループアンロールの5つのコード変異を適用します。
以上の結果から,LLMは10%から50%の症例において,欠陥推論に基づいて正しい予測を導出できることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:42:24 GMT)
UR$^2$: Unify RAG and Reasoning through Reinforcement Learning [18.3] 大規模言語モデル(LLM)は2つの相補的パラダイムを通じて顕著な能力を示してきた: 検索-拡張生成(RAG)と、検証リワード(RLVR)からの強化学習(Reinforcement Learning)である。
我々は、強化学習による検索と推論を統一する一般的なフレームワークUR2(Unified RAG and Reasoning)を提案する。
オープンドメインQA、MMLU-Pro、医学、数学的推論タスクにわたる実験では、UR2が既存のRAG法やRL法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:33:20 GMT)
AALC: Large Language Model Efficient Reasoning via Adaptive Accuracy-Length Control [18.3] 大きな推論モデル(LRM)は、長いチェーン・オブ・シークレットを生成することで印象的な推論能力を達成する。
我々は、強化学習に組み込まれた軽量で精度の高い長さの報酬であるALCを紹介する。
提案手法は,元の精度を維持したり改善したりしながら,応答長を50%以上削減することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:23:42 GMT)
AICrypto: A Comprehensive Benchmark For Evaluating Cryptography Capabilities of Large Language Models [18.2] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著な機能を示している。
本ベンチマークでは, 複数選択質問135件, キャプチャー・ザ・フラッグ(CTF)150件, 証明問題18件からなる。
LLMをリードする17のモデルの評価は、最先端のモデルが暗号概念を記憶する上で、人間の専門家と一致しているか、さらに上回っていることを示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:47:59 GMT)
CLIPin: A Non-contrastive Plug-in to CLIP for Multimodal Semantic Alignment [18.1] 大規模な自然画像テキストデータセットは、監督の弱いため、しばしば緩やかなセマンティックアライメントに悩まされる。
私たちはCLIPスタイルのアーキテクチャにシームレスに統合できる統合された非コントラストプラグインであるCLIPinを提案する。
2つの共有ロバスト性事前プロジェクタは、コントラスト学習と非コントラスト学習の統合を容易にするために、それぞれ画像とテキストのモダリティのために設計されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:23:05 GMT)
MoDA: Multi-modal Diffusion Architecture for Talking Head Generation [18.0] 任意のアイデンティティと音声を頭で話すことは、仮想メタバースの領域において重要な問題である。
1) 動きの生成とニューラルレンダリングをブリッジするジョイントパラメータ空間を定義し、フローマッチングを活用して拡散学習を単純化する。
実験により,MoDAは映像の多様性,リアリズム,効率性を向上し,実世界の応用に適していることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:58:08 GMT)
DiffCap: Diffusion-based Real-time Human Motion Capture using Sparse IMUs and a Monocular Camera [18.0] 本稿では,人間の動作先を学習するための拡散型ソリューションを提案する。
逐次視覚情報は全体として考慮され、条件埋め込みに変換される。
システム設計の有効性とポーズ推定における最先端性能について実験を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:00:40 GMT)
DAFMSVC: One-Shot Singing Voice Conversion with Dual Attention Mechanism and Flow Matching [17.8] Singing Voice Conversionの鍵となる課題は、音質を損なうことなくソースオーディオに、目に見えないスピーカーの音色を適応させることだ。
そこで本研究では,ソースオーディオからの自己教師付き学習機能を,ターゲットオーディオから最も近いSSL機能に置き換えるDAFMSVCを提案する。
また、話者埋め込み、メロディ、および言語内容の適応的な融合のための二重のクロスアテンション機構も組み込まれている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:24:19 GMT)
M$^2$IV: Towards Efficient and Fine-grained Multimodal In-Context Learning via Representation Engineering [17.8] マルチモーダル・インコンテキスト・ラーニング(ICL)は、LVLM(Large Vision-Language Models)と、複数のユーザが提供するデモを通じて新しいタスクに適応する能力を備えている。
しかし、その効果はマルチモーダル入力のトークン集約性や、クロスモーダルな数ショット推論の複雑さによって制約されている。
textbfM$2$IVは、明示的なトークンレベルのデモを学習可能なマルチモーダル・インコンテキストベクトルの集合に置き換える新しい表現工学手法である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:59:21 GMT)
Towards Robust Red-Green Watermarking for Autoregressive Image Generators [17.8] 本稿では,自己回帰(AR)画像モデルにおける世代内透かしの利用について検討する。
ARモデルは、視覚トークンのシーケンスを自動回帰予測して画像を生成し、それをピクセルにデコードする。
大規模言語モデルの赤緑色の透かしに着想を得て,次の予測に偏ったトークンレベルの透かし方式を検討した。
類似したトークンを同じ集合に割り当てるために、視覚トークンクラスタリングに依存する2つの新しい透かし手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:14:22 GMT)
Measuring Dependencies between Biological Signals with Self-supervision, and its Limitations [17.7] この手法は、2つの信号が依存している場合、時間的に整合したセグメントと不整合したセグメントを区別できるという観察に着想を得たものである。
fMRI、生理的、行動的な信号を用いた実験では、コンカレンス(英語版)がこのような広い範囲の信号間の関係を露呈する最初のアプローチであることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:09:20 GMT)
Just Say the Word: Annotation-Free Fine-Grained Object Counting [17.6] 細粒度オブジェクトカウントは、クラスに依存しないカウントモデルにとって依然として大きな課題である。
カテゴリ名を与えられた場合、テキスト・ツー・イメージ拡散モデルによって生成された合成画像と擬似ラベルを用いて、プロンプトからコンパクトな概念を組み込む。
この埋め込み条件は、凍結したカウンタからの生のオーバーカウントを、実際のイメージや人間のアノテーションを必要とせずに、正確にカテゴリ固有の推定テキストに洗練する特殊化モジュールである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:19:48 GMT)
Play Favorites: A Statistical Method to Measure Self-Bias in LLM-as-a-Judge [17.4] 大規模言語モデル(LLM)は、他の出力の迅速かつ信頼性の高い評価を提供する裁判官として機能する。
LLMは、自己バイアス(self-bias)として知られる、過度に好ましい評価を自身のアウトプットに体系的に割り当てる。
本稿では,自己バイアスを特定・推定できる仮定を明示的に定式化する統計的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:22:12 GMT)
Extract-and-Abstract: Unifying Extractive and Abstractive Summarization within Single Encoder-Decoder Framework [17.4] 本稿では,単一エンコーダ-デコーダモデルにおいて,抽出および抽象的要約タスクを協調的かつシームレスに実行するExtAbsを提案する。
ExtAbsでは、バニラエンコーダを増設して塩分を抽出し、バニラデコーダを提案された塩分マスクで修正してサマリーを生成する。
実験により、ExtAbsは抽出タスクのベースラインよりも優れたパフォーマンスを達成でき、抽象タスクのバニラモデルよりも同等か、さらに優れていることが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:21:23 GMT)
EvolvR: Self-Evolving Pairwise Reasoning for Story Evaluation to Enhance Generation [17.4] 本稿では,ストーリー評価のための自己進化的ペアワイズ推論(EvolvR)フレームワークを提案する。
フレームワークはまず、マルチペルソナ戦略を通じてスコア整合型Chain-of-Thought(CoT)データを自己合成する。
精巧なデータに基づいて訓練された評価器を報奨モデルとして展開し、ストーリー生成タスクを誘導する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:10:47 GMT)
LLMs for Resource Allocation: A Participatory Budgeting Approach to Inferring Preferences [17.1] 大規模言語モデル(LLM)は、複雑な意思決定タスクを扱うことがますます期待されているが、構造化されたリソース割り当てを実行する能力はいまだ探索されていない。
i) LLMに基づく資源配分の実践的設定と, (ii) それらの推論能力を評価するための適応ベンチマークとして, PB(Participatory Budgeting)を活用する2目的フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:45:07 GMT)
Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation [17.0] 本稿では,SPS(Spectrum Projection Score)について紹介する。これは,検索した要約のセマンティックアライメントとその隠蔽表現を測る,軽量で監督不要なメトリクスである。
SPS上に構築されたxCompressは、動的にサンプリングし、ランク付けし、検索要約候補を圧縮する推論時コントローラフレームワークである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:13:48 GMT)
Position: Lifetime tuning is incompatible with continual reinforcement learning [16.9] 連続RLでは、学習を終わらないエージェントが望まれます。
RLの標準的なプラクティスは、エージェントの全生涯にわたって、デプロイ環境への未使用のアクセスを仮定することである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:28:26 GMT)
You Don't Need Pre-built Graphs for RAG: Retrieval Augmented Generation with Adaptive Reasoning Structures [16.9] 大型言語モデル(LLM)はしばしば幻覚に悩まされ、知識を超えた質問を処理する際に、事実的に誤った文を生成する。
Retrieval-augmented Generation (RAG)は、LLM推論をサポートするために、知識ベースからクエリ関連コンテキストを取得することで、この問題に対処する。
既存のGraphベースのRAGメソッドは、コーパスをグラフに変換するためのコストの高いプロセスに依存しており、圧倒的なトークンコストとアップデートのレイテンシを導入している。
本稿では,推論時に推論構造を動的に抽出し,事前に構築したグラフを使わずに適応検索を誘導するLogicRAGを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:07:40 GMT)
Multivariate Fields of Experts [16.8] 我々は,画像事前学習のための新しいフレームワークである,専門家の多変量分野を紹介する。
提案手法の有効性を,画像のデノイング,デブロアリング,圧縮型磁気共鳴画像,コンピュータ断層撮影など,様々な逆問題にまたがって示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:58:25 GMT)
Learning Logical Rules using Minimum Message Length [16.8] 本稿では,雑音データから最小メッセージ長プログラムを学習するベイズ帰納論理プログラミング手法を提案する。
ゲームプレイやドラッグデザインなどいくつかの分野での実験を行った結果,本手法が従来の手法よりも優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:23:58 GMT)
Can Multimodal Large Language Models Understand Spatial Relations? [16.8] 我々はCOCO 2017をベースとした人間アノテーション付き空間関係推論ベンチマークであるSpatialMQAを紹介する。
その結果、現在の最先端MLLMの精度は48.14%に過ぎず、人間レベルの精度は98.40%をはるかに下回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:55:18 GMT)
Society of Mind Meets Real-Time Strategy: A Hierarchical Multi-Agent Framework for Strategic Reasoning [16.4] 我々は,Strategic Planner (SP) と呼ばれるメタコントローラの下で,特殊模倣学習エージェントを利用する階層型マルチエージェントフレームワークを提案する。
専門家によるデモンストレーションによって、各特殊エージェントは、航空支援や防御演習のような独特の戦略を学び、一貫性のある、構造化された多段階のアクションシーケンスを生成する。
SPはこれらの提案を1つの環境適応プランに編成し、局所的な決定が長期的な戦略と整合することを保証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:57:12 GMT)
Latent Fusion Jailbreak: Blending Harmful and Harmless Representations to Elicit Unsafe LLM Outputs [16.3] 本稿では、有害なクエリペアから隠れた状態を補間し、禁止された応答を誘発する表現ベースの攻撃であるLatent Fusion Jailbreak(LFJ)を紹介する。
AdvBenchやMaliciousInstructといったベンチマークによるVicunaやLLaMA-2などのモデルの評価では、平均攻撃成功率(ASR)は94.01%となり、既存の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:29:16 GMT)
SPARTA: Advancing Sparse Attention in Spiking Neural Networks via Spike-Timing-Based Prioritization [16.1] 現在のスパイキングニューラルネットワーク(SNN)は、スパイクベースの処理に固有の時間的ダイナミクスを弱めている。
本研究では、ヘテロジニアスニューロンのダイナミクスとスパイク刺激情報を活用して効率的なスパースアテンションを実現するフレームワークであるSPARTAを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:16:24 GMT)
ATM: Improving Model Merging by Alternating Tuning and Merging [16.1] タスクベクトルの理論的モチベーションは、単一エポックな全バッチ勾配勾配下では、それらはマルチタスクと同値であることが強調される。
この洞察は、モデルマージを、チューニングとマージを交互に行う反復的な手順の1つのステップとして再解釈することにつながります。
本稿では,(1)データ共有が制限されたシナリオにおけるマルチタスク学習の代替として,(2)小さな検証セットを用いて既存のモデルマージ手法を改善するための軽量化ステップとして,ATMの2つの応用を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:13:09 GMT)
HapticLLaMA: A Multimodal Sensory Language Model for Haptic Captioning [16.0] HapticLLaMA(ハプティックラーマ)は、振動信号を与えられた感覚、感情、または連想のカテゴリーの記述に解釈する多モーダル感覚言語モデルである。
HapticLLaMAは,(1)LLaMAアーキテクチャを用いた教師付き微調整,(2)人間からのフィードバックからの強化学習による微調整の2段階で訓練される。
HapticLLaMA は触覚振動信号を解釈する強力な能力を示し、それぞれ 59.98 の METEOR スコアと 32.06 の BLEU-4 スコアを達成している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:25:37 GMT)
PA-HOI: A Physics-Aware Human and Object Interaction Dataset [16.0] PA-HOIモーションキャプチャーデータセットを導入し、物体の物理的特性が人間の運動力学に与える影響を強調した。
データセットは、人間と物体の相互作用の592の動作シーケンスと、異なる性別の被験者によって実行される各シーケンスから構成される。
このデータセットは、異なる物体の物理的属性が人間の姿勢、速度、運動スケール、相互作用戦略にどのように影響するかを理解するために、既存の物体の範囲を大きく広げることで際立っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:36:23 GMT)
MambaEviScrib: Mamba and Evidence-Guided Consistency Enhance CNN Robustness for Scribble-Based Weakly Supervised Ultrasound Image Segmentation [15.8] スパースアノテーションに基づく弱教師付き学習(WSL)は、性能向上を実現している。
本研究は,超音波画像分割作業におけるスクリブルベースWSLの導入を試みる。
本稿では,意思決定境界付近の予測を効果的に活用することを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:18:44 GMT)
MBA-SLAM: Motion Blur Aware Gaussian Splatting SLAM [15.8] 本稿では、重度動きブルレッド入力を処理し、画像ブルリングを強化するために、濃密な視覚ディブルSLAMパイプライン(MBA-SLAM)を提案する。
提案手法では,効率的な運動ぼかし対応トラッカーをニューラルネットワークとガウススプラッティングベースのマッパーに統合する。
実験では,MBA-SLAMがカメラのローカライゼーションとマップ再構成の両方において,従来の最先端手法を上回ることを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:42:49 GMT)
RANA: Robust Active Learning for Noisy Network Alignment [15.7] ノイズの多いネットワークアライメントのためのロバスト能動学習フレームワークであるRANAを提案する。
RANAは、アンカーリンクアノテーションの幅に対処しながら、構造ノイズとラベルノイズの両方に効果的に取り組む。
RANAはアライメント精度において最先端の能動的学習法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:30:10 GMT)
IOCC: Aligning Semantic and Cluster Centers for Few-shot Short Text Clustering [15.7] クラスタリングタスクでは、特徴空間を明確で分離された分布に構造化することが不可欠である。
本稿では,クラスタセンターとセマンティックセンターのアライメントを実現するための,数発のコントラスト学習手法であるIOCCを提案する。
IOCCは従来の手法より優れており、バイオメディカルデータセットの課題に対して最大7.34%の改善が達成されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:47:13 GMT)
FLUX-Text: A Simple and Advanced Diffusion Transformer Baseline for Scene Text Editing [15.6] シーンテキスト編集は、背景に整合したテキストの忠実さと全体的な視覚的品質を確保しながら、画像上のテキストを修正または追加することを目的としている。
最近の手法は主にUNetベースの拡散モデルに基づいており、シーンテキストの編集結果が改善されたが、複雑なグリフ構造に苦戦している。
単純かつ高度な多言語シーンテキスト編集用DiT法である textbfFLUX-Text を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:34:05 GMT)
VISTAR:A User-Centric and Role-Driven Benchmark for Text-to-Image Evaluation [15.5] 本稿では,テキスト・ツー・イメージ(T2I)評価のためのユーザ中心の多次元ベンチマークであるVISTARを提案する。
物理的に定量化できる属性に対して決定論的でスクリプト可能なメトリクスを使用する。
ベンチマークは、2,845のプロンプトを15,000以上の人間対比較で検証している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:15:02 GMT)
NEP: Autoregressive Image Editing via Next Editing Token Prediction [15.5] 本稿では,自動回帰画像生成に基づくNext Editing-token Prediction(NEP)として画像編集を定式化することを提案する。
我々のモデルは、ゼロショット方式でその生成を反復的に精錬することで、テスト時間スケーリング(TTS)を自然にサポートします。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:06:34 GMT)
Bounding Distributional Shifts in World Modeling through Novelty Detection [15.4] 本研究では, 学習モデルが学習データ分布から逸脱しないように, 新規性検知器として変分オートエンコーダを用いる。
提案手法は,データ効率の観点から最先端のソリューションを改良する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:42:14 GMT)
Hand by Hand: LLM Driving EMS Assistant for Operational Skill Learning [15.2] 操作スキル学習は、本質的には身体的であり、手持ちの練習や審美的フィードバックに頼っているが、大きな言語モデル(LLM)をサポートする訓練では、まだ効果的に再現されていない。
本研究は, LLMによる審美支援の人間の経験を探求するものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:05:47 GMT)
Can Large Language Models Adequately Perform Symbolic Reasoning Over Time Series? [15.1] 実世界の時系列のシンボリック推論を評価するためのベンチマークであるSymbolBenchを紹介する。
以前の取り組みとは異なり、SymbolBenchは様々な複雑さを持つ様々な記号形式にまたがっている。
本稿では,大規模言語モデルと遺伝的プログラミングを統合し,閉ループシンボリック推論システムを構築する統一フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:41:16 GMT)
MCA: 2D-3D Retrieval with Noisy Labels via Multi-level Adaptive Correction and Alignment [15.0] 頑健な2D-3D textbfMulti-level cross-modal adapt textbfCorrection and textbfAlignment framework (MCA)を提案する。
MCAは従来の3Dベンチマークと現実的な3Dベンチマークの両方で最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:06:43 GMT)
A Survey on Task Scheduling in Carbon-Aware Container Orchestration [15.0] ソフトウェアエコシステムやクラウドデータセンタのエネルギー需要の増加は、エネルギー消費と炭素フットプリントを前例のないレベルに押し上げた。
産業とアカデミックは、より効率的なタスクスケジューリングとインフラオーケストレーションを通じて、クラウドコンピューティングに関連する二酸化炭素排出量を減らす努力を増している。
本稿では,クラウドタスクスケジューリング研究のための総合的な分類法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:20:16 GMT)
Post-training for Efficient Communication via Convention Formation [15.0] 人間は言語を適応させ、アドホックな慣習を形成することで、多ターンインタラクションにおける効率の向上と通信する。
以前の研究は、LLMがこの振る舞いを自然に示さないことを示している。
我々は,対象とする微調整により,この能力を育成するための後学習プロセスを開発する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:42:16 GMT)
When AIOps Become "AI Oops": Subverting LLM-driven IT Operations via Telemetry Manipulation [15.0] 敵はシステムテレメトリを操作してAIOpsエージェントを誤解させ、管理するインフラストラクチャの整合性を損なう行動をとることができる。
我々の攻撃手法であるAIOpsDoomは、完全に自動化された偵察、ファジィ、LLM駆動の敵入力生成であり、ターゲットシステムの事前の知識なしで動作します。
我々は,その構造的性質とユーザ生成コンテンツの最小の役割を活かして,テレメトリデータを衛生化する防衛機構であるAIOpsShieldを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:25:31 GMT)
StepFun-Prover Preview: Let's Think and Verify Step by Step [14.9] 本稿では,ツール統合推論による形式定理証明のための大規模言語モデルであるStepFun-Prover Previewを提案する。
提案手法は,実時間環境フィードバックに基づく証明を反復的に精錬することにより,人間的な問題解決戦略をエミュレートすることを可能にする。
miniF2F-testベンチマークでは、StepFun-Proverがパス@1成功率70.0%$を達成した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:58:11 GMT)
Large Language Model Data Generation for Enhanced Intent Recognition in German Speech [14.8] 音声コマンドのインテント認識(IR)は人工知能(AI)アシスタントシステムに不可欠である。
本稿では,高齢者のドイツ語音声を微調整したWhisper ASRモデルを組み合わせた新しい手法を提案する。
合成音声をテキスト音声モデルで生成し、広範囲なクロスデータセットテストを行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:54:09 GMT)
InfoCausalQA:Can Models Perform Non-explicit Causal Reasoning Based on Infographic? [14.4] 本稿ではインフォグラフィックに基づく因果推論を評価するための新しいベンチマークであるInfoCausalQAを紹介する。
第1タスクは推論された数値傾向に基づく定量的因果推論に焦点を当て,第2タスクは5種類の因果関係を含む意味因果推論を対象とする。
実験の結果,現在のビジョン・ランゲージモデルでは,計算的推論の能力に限界があり,意味的因果推論の能力にも限界があることが明らかとなった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:03:23 GMT)
Hybrid-TTA: Continual Test-time Adaptation via Dynamic Domain Shift Detection [14.4] 継続的テスト時間適応(CTTA)は、制御されたトレーニング環境と実世界のシナリオの間のドメインギャップを埋めるための重要なアプローチとして登場した。
本稿では,最適適応のためのインスタンスワイドチューニング手法を動的に選択する総合的手法であるHybrid-TTAを提案する。
提案手法は,Cityscapes-to-ACDCベンチマークデータセットにおけるmIoUの1.6%改善を実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:49:55 GMT)
Membership Inference Attack with Partial Features [14.3] 本研究では,各サンプルの部分的な特徴のみを相手が観察する推論シナリオについて検討する。
MRAD (Memory-Guided Reconstruction and Anomaly Detection) は2段階攻撃フレームワークである。
MRADはさまざまなデータセットで有効であり、市販の異常検出技術との互換性を維持している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:56:13 GMT)
Lightweight Quad Bayer HybridEVS Demosaicing via State Space Augmented Cross-Attention [14.3] ハイブリッドイベントベースのビジョンセンサー(HybridEVS)のようなイベントカメラは、フレームの代わりに非同期の"イベント"として明るさの変化を捉え、モバイル写真に高度な応用を提供する。
課題は、Quad Bayer Color Filter Array (CFA)センサーと、色情報を欠いたイベントピクセルを組み合わせることで発生し、ダウンストリームアプリケーション前の分解プロセスでエイリアスとアーティファクトが発生する。
textbfState space augmented cross-textbfAttentionにより、イベントピクセルを処理できる軽量のtextbfTwo-stage ネットワークである textbfTSANet を導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:40:59 GMT)
PASG: A Closed-Loop Framework for Automated Geometric Primitive Extraction and Semantic Anchoring in Robotic Manipulation [14.3] 本稿では,タスク意味論と幾何学的特徴のギャップを埋めるために,Primitive-Aware Semantic Grounding (PASG)を提案する。
手動アノテーションに匹敵する性能を達成し,多様なシナリオにまたがる実用的なロボット操作タスクにおけるPASGの有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:23:33 GMT)
Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing [14.2] Diffusion Large Language Models (dLLMs) は、テキスト生成のための自動回帰(AR) LLM に代わる有望な代替品として登場した。
本稿では、離散拡散強制(D2F)と呼ばれる単純かつ効果的な戦略に基づいて、この障壁を破る。
このようにして、バニラdLLMは効率的な推論のためにAR拡散ハイブリッドパラダイムに再構成される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:51:37 GMT)
Fewer Denoising Steps or Cheaper Per-Step Inference: Towards Compute-Optimal Diffusion Model Deployment [14.1] PostDiffは、トレーニング済みの拡散モデルを加速するためのトレーニング不要のフレームワークである。
我々はPostDiffが最先端拡散モデルの忠実性と効率のトレードオフを大幅に改善できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:29:37 GMT)
Generative Video Bi-flow [14.1] ニューラル正規微分方程式(ODE)の流れとして時間変化を頑健に学習する新しい生成ビデオモデルを提案する。
様々なビデオデータセットに対して,非条件のビデオ生成をストリーミング方式で実演する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:54:32 GMT)
ETA: Energy-based Test-time Adaptation for Depth Completion [13.9] 本研究では,事前訓練した深度完了モデルの試験時間適応法を提案する。
本手法の要点は,震源データ分布に含まれる深度予測の可能性の定量化にある。
本手法は屋内3つのデータセットと屋外3つのデータセットにまたがって評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:51:24 GMT)
Sample-efficient LLM Optimization with Reset Replay [13.7] Reset Replay (LoRR) は、任意の好みベースの最適化フレームワークにおいて、サンプリング効率を高めるために設計されたプラグインである。
LoRRは、ネットワークの可塑性を保存する初期データを再利用する定期的なリセット戦略を取り入れている。
実験により,LoRRは数学的および一般的な推論ベンチマークにおいて,様々な選好最適化手法の性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:56:49 GMT)
CycleDiff: Cycle Diffusion Models for Unpaired Image-to-image Translation [13.5] ペアトレーニングデータがない場合に拡散型クロスドメイン画像トランスレータを導入する。
拡散と翻訳過程を整合させる新しい共同学習フレームワークを提案する。
提案手法は,両プロセスのグローバルな最適化,最適性の向上,忠実度の向上,構造整合性の実現を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:13:56 GMT)
Mitigating Distribution Shift in Graph-Based Android Malware Classification via Function Metadata and LLM Embeddings [13.5] グラフベースのマルウェア分類器は、標準のAndroidデータセットで94%以上の精度を達成できる。
しかし、これまで見つからなかった同じ家系のマルウェアについて評価すると、正確さは最大45%低下する。
本稿では,コンテキスト特徴を持つ関数呼出グラフを強化する,ロバストなセマンティックエンリッチメントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:16:57 GMT)
Fact2Fiction: Targeted Poisoning Attack to Agentic Fact-checking System [13.4] 最先端のファクトチェックシステムは、自律エージェントを駆使して、大規模な誤情報と戦う。
この研究は、エージェントファクトチェックシステムをターゲットにした最初の中毒攻撃フレームワークであるFact2Fictionを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:44:57 GMT)
Comparing Knowledge Injection Methods for LLMs in a Low-Resource Regime [13.2] 大規模言語モデルに小さな非構造化情報を注入する作業について検討する。
制限されたデータに対する事前トレーニングを継続するだけで、控えめな改善が得られます。
私たちは、小さなデータ体制における忘れる現象に光を当て、新しいコンテンツ学習と既存の能力維持の微妙なバランスを図った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:48:32 GMT)
Pruning the Unsurprising: Efficient Code Reasoning via First-Token Surprisal [13.0] 大規模推論モデル(LRM)は、Chain-of-Thought(CoT)の長さをスケールアップすることによって、コード推論において顕著な能力を示した。
我々は,CoT圧縮のための新しい粗大なフレームワークであるASAP(Anchor-guided, Surprisal-based Pruning)を提案する。
ASAPは、トレーニングと推論コストを大幅に削減しつつ、複数のコード生成ベンチマークで最先端の精度を実現している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:46:21 GMT)
Fast Motion Estimation and Context-Aware Refinement for Efficient Bayer-Domain Video Vision [12.9] ビデオコンピュータビジョンシステムの効率性は、ビデオ内の時間的冗長性が高いため、依然として困難な課題である。
コンピュータビジョンの効率化のために既存の作業が提案されているが、時間的冗長性を完全に低減し、フロントエンドの計算オーバーヘッドを無視するものではない。
本稿では,効率的な映像コンピュータビジョンシステムを提案する。まず,画像信号処理装置を取り除き,バイアフォーマットデータを直接ビデオコンピュータビジョンモデルに入力することで,フロントエンドの計算を省く。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:55:19 GMT)
X-VFL: A New Vertical Federated Learning Framework with Cross Completion and Decision Subspace Alignment [12.9] Vertical Federated Learning (VFL)は、複数のクライアント/パーティから分離した機能サブセットを統合することで、協調学習を可能にする。
X-VFLは、非整列データサンプルに欠落した特徴を扱えるように設計された新しいVFLフレームワークである。
X-VFLは、各クライアントに対する新しいデータサンプルのローカル独立推論をサポートする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:51:19 GMT)
Federated Quantum Kernel-Based Long Short-term Memory for Human Activity Recognition [12.8] 本稿では,Fed-QK-LSTM(Federated Quantum Kernel-Based Long Short-term Memory)フレームワークを紹介する。
Fed-QK-LSTMフレームワーク内では,プライバシに敏感な環境下でのヒューマンアクティビティ認識(HAR)を強化する。
我々は、実世界のアプリケーションにおいて、堅牢でプライバシーに配慮した人間の活動認識のためのFed-QK-LSTMフレームワークの可能性を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:17:40 GMT)
Graph is a Natural Regularization: Revisiting Vector Quantization for Graph Representation Learning [12.7] 本稿では,ベクトル量子化をグラフデータに適用した場合に,コードブックの崩壊が一貫して起こることを示す最初の実証的研究を示す。
グラフトポロジと特徴的類似性を明示的な正規化信号として統合し,コードブックの利用率を高め,トークンの多様性を促進する新しいフレームワークであるRGVQを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:33:45 GMT)
Echoes of Automation: The Increasing Use of LLMs in Newsmaking [12.6] 本研究では,大手メディア,地方メディア,大学ニュースメディアの4万件以上のニュース記事を対象としたAI生成コンテンツについて検討する。
近年のGenAI利用は,特に地域ニュースや大学ニュースで顕著に増加している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:38:33 GMT)
TEFormer: Texture-Aware and Edge-Guided Transformer for Semantic Segmentation of Urban Remote Sensing Images [12.6] 都市リモートセンシング画像(URSI)のセマンティックセグメンテーションのためのテクスチャ認識とエッジ誘導機構を統合したテクスチャ認識・エッジ誘導変換器(TEFormer)を提案する。
テクスチャ認識モジュール(TaM)は、視覚的に類似したカテゴリ間の微妙なテクスチャの相違を捉え、セマンティック識別を高めるように設計されている。次いで、エッジ誘導三分岐デコーダ(Eg3Head)を構築して、局所的なエッジと詳細をマルチスケールのコンテキスト認識のために保存する。最後に、エッジ誘導機能融合モジュール(EgFFM)は、コンテキストと詳細情報をエッジ情報で融合する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:08:31 GMT)
Lightweight Auto-bidding based on Traffic Prediction in Live Advertising [12.6] 軽量入札アルゴリズムであるBibinary Constrained Bidding (BiCB)を提案する。
BiCBは、数学的解析によって与えられる最適な入札公式と将来の交通量推定の統計的手法をうまく組み合わせている。
オフラインおよびオンラインでの十分な実験は、BiCBの優れた性能と低いエンジニアリングコストを証明している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:05:35 GMT)
MetaOcc: Spatio-Temporal Fusion of Surround-View 4D Radar and Camera for 3D Occupancy Prediction with Dual Training Strategies [12.5] 本稿では,Omni指向の3次元占有予測のための新しいマルチモーダルフレームワークであるMetaOccを紹介する。
レーダーデータにエンコーダを直接適用することの限界に対処するため,レーダハイト自己保持モジュールを提案する。
高価な点クラウドへの依存を軽減するため,オープンセットセグメンタに基づく擬似ラベル生成パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:34:29 GMT)
MESAHA-Net: Multi-Encoders based Self-Adaptive Hard Attention Network with Maximum Intensity Projections for Lung Nodule Segmentation in CT Scan [12.4] マルチエンコーダをベースとした自己適応型ハードアテンションネットワーク(MESAHA-Net)をCTスキャンの高精度な肺結節分割のための効率的なエンドツーエンドフレームワークとして提案する。
MESAHA-Netは、肺結節のスライス・バイ・スライス2Dセグメンテーションを反復的に行い、各スライス内の結節領域に着目して肺結節の3Dセグメンテーションを生成する。
LIDC-IDRIデータセットは,肺結節セグメンテーションのための最大公用データセットである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:44:22 GMT)
Fine-Grained Safety Neurons with Training-Free Continual Projection to Reduce LLM Fine Tuning Risks [12.2] 本研究では,FGSN (Fen-Grained Safety Neurons) をトレーニング不要連続投射法で提案し,微調整安全性リスクの低減を図る。
FGSNは本質的に、安全層と神経細胞の間のマルチスケールの相互作用を統合し、スペーサーとより精密な安全ニューロンを局在させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:20:25 GMT)
Event2Vec: Processing neuromorphic events directly by representations in vector space [12.2] ニューロモルフィックイベントカメラは、従来のカメラと比較して時間分解能、電力効率、ダイナミックレンジに利点がある。
しかし、イベントカメラは、メインストリームのコンピュータビジョンやディープラーニング手法と互換性のない、非同期、スパース、不規則なイベントを出力する。
本稿では,従来のグラフ/イメージ/ボクセルベース表現よりも優れたパラメータ効率,精度,速度を示すベクトル(event2vec)表現の最初のイベントを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:28:33 GMT)
LoRA in LoRA: Towards Parameter-Efficient Architecture Expansion for Continual Visual Instruction Tuning [12.2] MLLMにおけるCVITに適した,高効率なアーキテクチャ拡張手法LiLoRAを紹介する。
LiLoRAはタスク間でLoRA行列Aを共有して冗長性を低減し、タスク固有のパラメータを最小化するために行列Bに追加の低ランク分解を適用し、コサイン規則化された安定性損失を組み込んで時間の経過とともに一貫性を維持する。
実験の結果,LiLoRAは逐次的タスク学習において一貫した性能を実現し,既存の手法に比べてパラメータ効率を著しく向上することがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:32:38 GMT)
Quantifying Conversation Drift in MCP via Latent Polytope [12.0] Model Context Protocol(MCP)は、外部ツールを統合することで、大きな言語モデル(LLM)を強化する。
逆向きに作られたコンテンツは、ツール中毒や間接的なプロンプト注射を誘発し、会話のハイジャック、誤情報伝播、データ流出につながる。
本稿では,会話のドリフト,空間軌跡の偏差を,対向的外部知識により検出し,定量化するフレームワークであるSecMCPを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:05:27 GMT)
Efficient RAW Image Deblurring with Adaptive Frequency Modulation [11.9] RAW画像の劣化は、特に周波数依存のぼかしを扱う際、ユニークな課題を示す。
本稿では、RAW-to-RAWデブロアリング用に設計されたフレームワークである周波数拡張ネットワーク(FrENet)を提案する。
実験により,FrENetはRAW画像の劣化における最先端の劣化手法を超越していることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:15:36 GMT)
LLM-Meta-SR: In-Context Learning for Evolving Selection Operators in Symbolic Regression [11.8] 大規模言語モデル (LLM) はアルゴリズム開発に革命をもたらしたが、シンボリック回帰への応用は限定的である。
進化的シンボリック回帰アルゴリズムの選択演算子を自動的に設計するメタラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:50:37 GMT)
When a Paper Has 1000 Authors: Rethinking Citation Metrics in the Era of LLMs [11.5] 著者レベルの引用メトリクスは、複雑な研究エコシステムにおける学術的影響の実践的で解釈可能でスケーラブルなシグナルを提供する。
過去5年間、大規模な言語モデルと基礎モデルの分野において、大規模な出版物が急速に出現してきた。
本稿では,SBCIインデックスを提案し,その理論的特性を分析し,その挙動を合成出版データセット上で評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:18:26 GMT)
Reinforcement Learning Based Sensor Optimization for Bio-markers [11.5] 本稿では、新しい強化学習に基づく2成分粒子群最適化(RLBPSO)を用いたIDC型RFセンサの感度向上について検討する。
RLBPSO法は,現在の最先端手法と比較して,様々な周波数域に最適化された設計法を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:12:23 GMT)
BoostTransformer: Enhancing Transformer Models with Subgrid Selection and Importance Sampling [11.2] BoostTransformerは、サブグリッドトークンの選択と重要度の高いサンプリングを通じて、トランスフォーマーを強化します。
提案手法はトランスパイプラインに直接最小2乗推進目標を組み込むことで,より効率的なトレーニングと性能向上を実現している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:33:30 GMT)
ElementaryNet: A Non-Strategic Neural Network for Predicting Human Behavior in Normal-Form Games [11.1] 行動ゲーム理論モデルは、人間の意思決定の仕組みに関する洞察を得ることと、人々が新しい戦略的な環境でどのように振る舞うかを予測することである。
GameNetと呼ばれるシステムは、反復しない同時移動ゲームの設定において人間の振る舞いを予測する技術の現状を表す。
本研究では,プライマリネットの特徴を変化させ,そのパラメータを解釈することにより,人間の行動に関する洞察を導き出すことが可能であることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:36:46 GMT)
ActMiner: Applying Causality Tracking and Increment Aligning for Graph-based Cyber Threat Hunting [11.0] 証明グラフに基づく既存の脅威狩りシステムは、高い偽陰性、高い偽陽性、低い効率の課題に直面している。
本稿では,記述グラフ上のサイバー脅威インテリジェンスレポートの正確な関係からクエリグラフを構築するActorminerを提案する。
アクティナーは偽陽性を39.1%減らし、偽陰性をすべて排除し、敵の攻撃を効果的に阻止することを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:01:40 GMT)
Secure Hybrid Key Growing via Coherence Witnessing and Bipartite Encoding [10.8] 量子原理に基づくHKG(Hybrid Key Growing)プロトコルを提案する。
我々は、量子光子数と光子時間ビン自由度(DoFs)を利用する。
本プロトコルは,エンティティ認証を統合し,実用的な実装のために設計されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:12:45 GMT)
Topic Over Source: The Key to Effective Data Mixing for Language Models Pre-training [10.8] マルチステージプロセスで生成された詳細なトピックラベルを利用するトピックベースのデータミキシング戦略を提案する。
我々は、トピックによって混合されたデータに基づいて事前訓練された言語モデルは、ソースによって混合されたデータで訓練された言語よりも一貫して優れていることを示した。
理論的解析により,トピックベースのデータは,ソースベースのアプローチに比べて検証損失が著しく低いことがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:38:49 GMT)
Text as Any-Modality for Zero-Shot Classification by Consistent Prompt Tuning [10.7] 汎用表現モデルを構築するためのスケーラブルなアプローチであるTaAM-CPT(Consistent Prompt Tuning)を用いてテキストをAny-Modalityとして提示する。
TaAM-CPTは、事前訓練されたモデルからモダリティ・プロンプト・プール、テキスト構成、モダリティ・アライン・テキスト・エンコーダを構成する。
異なるモダリティ間の学習を調和させるため、TaAM-CPTはモーダル内およびモーダル間学習の目的を設計する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:13:05 GMT)
Spatio-Temporal Partial Sensing Forecast for Long-term Traffic [10.6] 交通予測は、選択した場所に設置されたセンサによる最近の計測を使用して、将来の道路交通を予測する。
本稿では,一部の地域でのみセンサが利用できることを前提として,長期交通量の部分的検知予測に焦点をあてる。
トラフィック予測のためのS-temporal-Long-term partial Forecast(SLPF)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:02:23 GMT)
Understanding Inconsistent State Update Vulnerabilities in Smart Contracts [10.2] 不整合状態更新問題は、非同期的な修正などの理由で発生する可能性がある。
本稿では,不整合状態更新脆弱性に関する大規模な実証的研究を行う。
実世界のスマートコントラクトプロジェクト352において、116の一貫性のない状態更新脆弱性を調査した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:15:29 GMT)
GLIDR: Graph-Like Inductive Logic Programming with Differentiable Reasoning [10.1] 本稿では,従来の手法よりも表現力のある構文で論理規則の推論をモデル化する,微分可能なルール学習手法であるGLIDRを紹介する。
GLIDRは、従来のチェーンライクなルール学習手法を一般化する、微分可能なメッセージパッシング推論アルゴリズムを使用する。
GLIDRモデルの重みから説明論理規則を抽出し、シンボリック・ソルバで使用することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:31:55 GMT)
Multi-Omics Analysis for Cancer Subtype Inference via Unrolling Graph Smoothness Priors [10.1] マルチオミクス癌サブタイプ分類(GTMancer)のためのグラフ変換器というフレームワークを提案する。
このフレームワークは、GNN最適化問題の上に構築され、複雑なマルチオミクスデータに応用範囲を広げる。
7つの実世界のがんデータセットに関する実証実験は、GTMancerが既存の最先端アルゴリズムより優れていることを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:22:36 GMT)
Improving Diagnostic Accuracy for Oral Cancer with inpainting Synthesis Lesions Generated Using Diffusion Models [10.0] 本研究は, 現実的な口腔癌病変を合成することにより, 診断精度を高めるための新しいアプローチを提案する。
複数のソースから包括的なデータセットを収集し,さまざまな口腔癌像を収録した。
本手法は, 実際の病変に対して高い視覚的忠実度を示す合成病変を生成し, 診断アルゴリズムの性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:15:02 GMT)
TRUST: Leveraging Text Robustness for Unsupervised Domain Adaptation [9.9] 視覚モデルの適応を導くために,言語モダリティの堅牢性を活用する新しいUDAアプローチを導入する。
視覚と言語の特徴空間を整合させるマルチモーダルなソフトコントラスト学習損失を提案する。
我々のアプローチは従来の手法よりも優れており、従来の(DomainNet)ドメインシフトと複雑な(GeoNet)ドメインシフトに新しい最先端の設定を施しています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:51:44 GMT)
SIFThinker: Spatially-Aware Image Focus for Visual Reasoning [9.9] SIFThinkerは、人間の視覚知覚を模倣する空間的に認識可能な「思考とイメージ」フレームワークである。
SIFThinkerは、奥行き強化されたバウンディングボックスと自然言語をインターリーブすることによって、注目の補正と画像領域の強調を可能にする。
実験では、SIFThinkerは空間的理解ときめ細かい視覚知覚において最先端の手法より優れている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:26:20 GMT)
Community-Aware Social Community Recommendation [9.8] ソーシャルレコメンデーションは、ユーザ間のソーシャルな結びつきを活用して、ユーザとイテムの相互作用のスパース性の問題を軽減する。
既存のソーシャルレコメンデーションモデルは、主にブログ、画像、製品などのレコメンデーションアイテムを推奨するために考案されている。
本稿では,コミュニティレコメンデーションに特化して設計された新しい効果的なモデルであるCASOについて述べる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:02:05 GMT)
Mediator-Guided Multi-Agent Collaboration among Open-Source Models for Medical Decision-Making [9.8] 多様な視覚言語モデル(VLM)の盲目の組み合わせは、誤った結果の解釈を増幅することができる。
医療マルチモーダル意思決定のためのメディエータ誘導型マルチエージェント協調フレームワークであるMedOrchを提案する。
我々は、異なるVLMエージェント内の協調が、個々のエージェントの能力を超えることができることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:02:10 GMT)
Post-apocalyptic computing from cellular automata [9.6] セルオートマトン(セルオートマトン)は、有限個の状態に存在する有限状態機械の配列である。
本稿では,セルオートマトンにおける動的状態空間構成を通じて,アルゴリズムが表現される新しい視点を提案する。
このアプローチは、非従来型コンピューティングデバイスの将来的な開発への道を開くものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:40:58 GMT)
Fusing Cross-Domain Knowledge from Multimodal Data to Solve Problems in the Physical World [9.6] センサやデバイス,システム,人など,さまざまなソースが生成するマルチモーダルデータを融合して,現実の問題を解決することが不可欠である。
既存の研究は、単一のドメインにマルチモーダルデータを格納することに重点を置いており、異なるデータセットからの知識を仮定することは本質的に一致している。
ドメイン層,リンク層,モデル層,データ層からなる4層フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:46:45 GMT)
SLIP: Soft Label Mechanism and Key-Extraction-Guided CoT-based Defense Against Instruction Backdoor in APIs [9.6] ブラックボックスのバックドア攻撃は、ホワイトボックスアクセスに依存する既存の防御を容易にバイパスする。
SLIP(Soft Label)機構と鍵抽出誘導CoTによるAPIのインストラクションバックドアに対する防御機構を提案する。
SLIPは非常に効果的で、平均攻撃成功率(ASR)を90.2%から25.13%に下げる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:17:33 GMT)
LLMs vs. Chinese Anime Enthusiasts: A Comparative Study on Emotionally Supportive Role-Playing [9.6] 大きな言語モデル(LLM)は、ロールプレイングの会話において印象的な能力を示している。
本研究は,アニメのキャラクターをケーススタディとして取り上げる。
本稿では,最初の感情支援型ロールプレイングデータセットChatAnimeを紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:17:24 GMT)
Bridging the Last Mile of Prediction: Enhancing Time Series Forecasting with Conditional Guided Flow Matching [9.5] Conditional Guided Flow Matching (CGFM) は、補助的な予測モデルから出力を統合することで、フローマッチングを拡張するモデルに依存しないフレームワークである。
CGFMは、歴史的データを条件とガイダンスの両方に取り入れ、一方の条件付きパスを使用し、アフィンパスを用いて経路空間を拡大する。
データセットとベースラインにわたる実験は、CGFMが常に最先端のモデルより優れており、予測が進んでいることを示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:50:27 GMT)
Differentially Private Federated Clustering with Random Rebalancing [9.3] フェデレートされたクラスタリングは、類似のクライアントをクラスタにグループ化し、クラスタ毎に1つのモデルを生成することを目的としている。
本稿では,多くのフェデレートクラスタリングアルゴリズムに対する軽量なアドオンとみなすことができるRR-Clusterを提案する。
プライバシノイズのばらつきの低減と、不正な割り当てによるバイアスの増加とのトレードオフを分析する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:56:47 GMT)
Position: Intelligent Coding Systems Should Write Programs with Justifications [9.3] これらのシステムは、コードを生成するだけでなく、モデル推論とユーザ理解を橋渡しする明確な一貫性のある正当化も生み出すべきだ、と私たちは主張する。
我々は, 正当性生成のためのニューロシンボリックなアプローチを提唱し, トレーニング中の行動とプログラムセマンティクスが神経表現によって豊かになるように, 象徴的制約を導出する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:04:47 GMT)
Exploring Superior Function Calls via Reinforcement Learning [9.3] 本稿では,グループ相対的政策最適化を強化するための新しい強化学習フレームワークを提案する。
機能呼び出しにおける3つの重要な課題に対処する: 政策学習における不十分な探索、連鎖生成における構造的推論の欠如、パラメータ抽出の不十分な検証。
本フレームワークは,86.02%の精度でオープンソースモデル間の最先端性能を実現し,複雑な多機能シナリオにおいて標準GRPOを最大6%上回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:50:45 GMT)
CAMEF: Causal-Augmented Multi-Modality Event-Driven Financial Forecasting by Integrating Time Series Patterns and Salient Macroeconomic Announcements [9.2] 金融予測のための多モードフレームワークであるCAMEF(Causal-Augmented Multi-Modality Event-Driven Financial Forecasting)を提案する。
1)政策文書と歴史的価格データの因果関係を捉えたマルチモーダル・フレームワーク,(2)2008年から2024年4月までの6種類のマクロ経済学的リリースを含む新たな金融データセット,および5つの米国主要金融資産の高周波実取引データ,(3)LLMに基づく対実イベント拡張戦略。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:44:22 GMT)
A New Lens on Homelessness: Daily Tent Monitoring with 311 Calls and Street Images [9.1] 本研究では,サンフランシスコのホームレステントのトレンドを追跡し,予測するために,クラウドソーシングによる公開データを用いた新しいアプローチを提案する。
我々の予測モデルは、日次や近隣の詳細な変動を捉え、伝統的に見落とされがちなパターンを明らかにする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:53:29 GMT)
Your other Left! Vision-Language Models Fail to Identify Relative Positions in Medical Images [8.8] 医用画像上の相対的な位置を正確に決定できる最先端のビジョンランゲージモデル(VLM)の能力を評価する。
解剖学的構造の上に置かれるアルファ数値や着色マーカーなどの視覚的プロンプトが、性能を高めることができるかどうかを検討する。
以上の結果から,医用画像では,VLMは実際の画像内容よりも解剖学的知識に頼っていることが示唆された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:17:05 GMT)
The Fair Game: Auditing & Debiasing AI Algorithms Over Time [8.8] Fair Game"は、AuditorとDebiasingアルゴリズムをMLアルゴリズムのループにまとめる。
フェアゲーム(Fair Game)は、フェアネスの目標を時間とともに適応できるユニークなフレームワークを提供する。
これにより、フレキシブルでアダプティブなオーバータイムのフレームワークを開発し、Fair MLシステムの構築とデプロイ後の開発を可能にします。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:36:16 GMT)
Execution-Feedback Driven Test Generation from SWE Issues [8.7] 本稿では,e-Otter++と呼ばれる新しい再生テストジェネレータに実装した,実行フィードバックを活用する新しい手法を提案する。
TDD-Bench Verifiedベンチマークでは、平均的なフェール・ツー・パス率63%のテストを生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:49:36 GMT)
Inference-Aware Prompt Optimization for Aligning Black-Box Large Language Models [8.6] 既存のプロンプト最適化アプローチは推論戦略に依存しない。つまり、デプロイ中に使用される推論戦略によらず、プロンプトを最適化する。
我々は、推論予算と異なるタスク目標を意識しながら、プロンプトと推論のスケールを協調的に最適化する、IAPOという統合された新しいフレームワークを導入する。
我々は、PSSTと呼ばれるIAPOの固定予算トレーニングアルゴリズムを開発し、エラー確率の有限予算保証を分析する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:45:53 GMT)
A Generic Complete Anytime Beam Search for Optimal Decision Tree [8.5] CA-DL8.5は汎用的で完全かつ任意のビーム探索アルゴリズムである。
LDS-DL8.5とTopk-DL8.5を一般化する。
他のCA-DL8.5とBlossomアルゴリズムよりも優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:53:50 GMT)
What Builds Effective In-Context Examples for Code Generation? [8.5] In-Context Learning (ICL) は、LLM(Large Language Models)のコード生成能力を向上するための有望なソリューションとして登場した。
本稿では,制御アブレーション研究を通じて,様々なコード特徴がICLに与える影響をコード例で系統的に検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:58:11 GMT)
Rethinking Key-frame-based Micro-expression Recognition: A Robust and Accurate Framework Against Key-frame Errors [8.5] CausalNetはキーフレームインデックスエラーに直面する堅牢なマイクロ圧縮認識(MER)を実現するための新しいフレームワークである。
CausalNetはいくつかの標準MERベンチマークで最先端(SOTA)メソッドを上回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:40:07 GMT)
Learning 3D Texture-Aware Representations for Parsing Diverse Human Clothing and Body Parts [8.4] 本稿では,部分レベルのピクセル解析(身体部分と衣服)とインスタンスレベルのグループ化のための統一ネットワークを提案する。
入力画像から,I2Tx拡散モデルを用いて人体内部の特徴を抽出する。
トレーニングが完了すると、Spectrumは、目に見える身体の部分と衣服のカテゴリごとにセマンティックセグメンテーションマップを生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:36:20 GMT)
Evaluation of Noise and Crosstalk in Neutral Atom Quantum Computers [8.4] ニュートラル原子量子コンピュータはアナログハミルトンシミュレーションのための有望なプラットフォームである。
マルチテナント環境下で複数のシミュレーションを実行することは、ノイズやクロストークによって制限される。
本研究は,シミュレーションによる騒音が時間とともにどのように変化するかを解析し,空間的コロケーションがシミュレーションの忠実度に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:18:21 GMT)
SynSeg: Feature Synergy for Multi-Category Contrastive Learning in Open-Vocabulary Semantic Segmentation [8.3] 既存の弱い教師付き手法は、しばしば、カテゴリー固有の監督と、対照的な学習のための不適切な特徴的構築方法に依存している。
本研究では,この課題に対処するために,より弱い教師付きアプローチであるSynSegを提案する。
一般的に、SynSegは、弱い監督下でのセマンティックローカライゼーションと差別の能力を効果的に改善する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:26:41 GMT)
Explaining the Behavior of Black-Box Prediction Algorithms with Causal Learning [8.3] ブラックボックス予測モデルのポストホック説明可能性に対する因果的アプローチは、ますます人気が高まっている。
因果図形表現を学習し、特徴間の任意の非計測的共起を可能にする。
我々のアプローチは、適切な説明が介入論的な意味で「異論者」である要因を示唆する因果説明の反実理論によって動機付けられている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:21:22 GMT)
Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens [8.2] 魚眼画像に対する基礎的単眼深度推定器(FMDE)の拡張手法を提案する。
本手法は,魚眼画像と視線画像とを符号化した潜伏埋め込みの分布を一致させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:01:17 GMT)
Resource-Efficient Automatic Software Vulnerability Assessment via Knowledge Distillation and Particle Swarm Optimization [8.1] 本稿では,知識蒸留と粒子群最適化を統合し,自動脆弱性評価を実現する新しい資源効率フレームワークを提案する。
まず、粒子群最適化を用いて、コンパクトな学生モデルのアーキテクチャを最適化する。
第2に,大きな教師モデルから最適化された学生モデルへの重要な脆弱性評価知識の伝達に,知識蒸留を適用した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:51:44 GMT)
Non-asymptotic estimates for accelerated high order Langevin Monte Carlo algorithms [8.1] 我々は,高次元対象分布からサンプルを得るための新しいアルゴリズム,すなわちaHOLA aHOLLAを提案する。
ワッサーシュタインシュタインにおける aHOLA の非同相収束を確立する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:35:12 GMT)
"What" x "When" working memory representations using Laplace Neural Manifolds [8.0] 簡単な実験で作業記憶の特性について検討する。
時間に対する指数基底関数を持つラプラス空間を「逆ラプラス」空間に結合した特定の選択について検討する。
線形射影によってそれらが互いに関連しているにもかかわらず、ラプラスの個体群は安定な刺激特異的部分空間を示すのに対し、逆ラプラスの個体群は回転ダイナミクスを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:56:52 GMT)
Architecture-Aware Generalization Bounds for Temporal Networks: Theory and Fair Comparison Methodology [8.0] 深部時間モデルに対する非空でないアーキテクチャを意識した最初の一般化境界を提供する。
指数関数的に$beta$-mixing列の場合、$O!Bigl(R,sqrttfracD,p,n,log NNBigr)、$D$はネットワーク深さ、$p$カーネルサイズ、$n$入力次元、$R$ウェイトノルムとなる。
我々の遅延フィードバックブロッキング機構は、O(1/log N)のみを捨てながら、依存するサンプルを事実上独立したものに変換する
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:57:49 GMT)
ACTIVA: Amortized Causal Effect Estimation via Transformer-based Variational Autoencoder [8.0] 本稿では,アモータライズされた因果推論のための条件付き変分自動エンコーダアーキテクチャであるACTIVAを提案する。
ACTIVAは、観測入力と介入クエリに条件づけられた潜伏表現を学習し、ゼロショット推論を可能にする。
我々は、ACTIVAが観察的に等価な因果モデルよりも混合として介入分布を予測することを示す理論的洞察を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:12:06 GMT)
Probing Syntax in Large Language Models: Successes and Remaining Challenges [7.9] 構造的要因や統計的要因がこれらの構文的表現に体系的に影響を及ぼすかどうかは不明である。
3つの制御されたベンチマーク上で構造プローブの詳細な解析を行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:56:44 GMT)
Towards Unified Image Deblurring using a Mixture-of-Experts Decoder [7.9] 多様なぼかし劣化による画像の復元を効率的に行うことのできる,最初のオールインワンデブロアリング手法を提案する。
本稿では,画像特徴を認識されたぼかし劣化に基づいて動的にルーティングするMix-of-experts (MoE)デコーディングモジュールを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:15:45 GMT)
MyCulture: Exploring Malaysia's Diverse Culture under Low-Resource Language Constraints [7.8] MyCultureは、マレーシアの文化に関する大規模言語モデル(LLM)を総合的に評価するために設計されたベンチマークである。
従来のベンチマークとは異なり、MyCultureは未定義のオプションなしで、新しいオープンエンドの複数選択質問フォーマットを採用している。
構造化された出力と自由形式出力のモデル性能を比較して構造バイアスを解析し、多言語的プロンプト変動による言語バイアスを評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:24:20 GMT)
Trustworthy Pedestrian Trajectory Prediction via Pattern-Aware Interaction Modeling [7.8] InSynはTransformerベースの新しいモデルで、多様なインタラクションパターンをキャプチャする。
SSOSは、数値時系列予測における初期段階のばらつきの一般的な問題を緩和する訓練戦略である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:17:07 GMT)
FVGen: Accelerating Novel-View Synthesis with Adversarial Video Diffusion Distillation [7.7] 本稿では,ビデオ拡散モデル(VDM)を用いた高速な新規ビュー合成を可能にするフレームワークであるFVGenについて,わずか4つのサンプリングステップで述べる。
我々のフレームワークは、サンプリング時間を90%以上削減しつつ、類似の(あるいはさらに良い)視覚的品質で、同じ数の新規ビューを生成します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:22:41 GMT)
EvoMakeup: High-Fidelity and Controllable Makeup Editing with MakeupQuad [7.7] 非ミークアップ顔、参照、編集結果、テキストメイク記述を備えた大規模で高品質なデータセットであるMakeupQuadを紹介した。
多段蒸留における画像劣化を緩和する統合トレーニングフレームワークであるEvoMakeupを提案する。
EvoMakeupは、合成データのみに訓練されているが、実世界のベンチマークにおいて、事前の手法をうまく一般化し、性能を上回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:00:45 GMT)
AdaptInfer: Adaptive Token Pruning for Vision-Language Model Inference with Dynamical Text Guidance [7.6] 視覚言語モデル(VLM)は、視覚的質問応答(VQA)のような多モーダル推論タスクにおいて印象的な性能を達成した。
プリフィル段階で処理される多数の視覚トークンのために、それらの推論コストは依然として大きな課題である。
既存のプルーニング手法は、しばしばアテンションパターンや静的テキストプロンプトガイダンスを直接使用することに依存し、推論時に発生する動的内部信号の活用に失敗する。
InVLMにおける適応型視覚トークンプルーニングのためのプラグイン・アンド・プレイフレームワークであるAdaptInferを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:27:26 GMT)
Simulating Floquet non-Abelian topological insulator with photonic quantum walks [7.6] Floquet non-Abelian topological insulator is characterized by non-Abelian topological charge and feature multifold bulk-boundary correspondence。
我々は、高次元フォトニック量子ウォークを用いてFNATIをシミュレートし、キーシグネチャを示す動的測定手法を開発した。
この実験はFNATIの初めての実験的特徴であり、非アベリア位相に関する一般的な知見を提供するものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:14:50 GMT)
Harnessing Light for Cold-Start Recommendations: Leveraging Epistemic Uncertainty to Enhance Performance in User-Item Interactions [7.5] 本稿では,Cold-Start Recommendation on Epistemic Uncertainty (CREU) frameworkを提案する。
CREUはPairwise-Distance Estimators (PaiDEs) にインスパイアされ、てんかんの不確かさを効率的に正確に測定する。
提案手法は,公開データセット上での広範囲なオフライン実験により評価される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:15:21 GMT)
Probabilistic Circuits for Knowledge Graph Completion with Reduced Rule Sets [7.4] 知識グラフ補完のためのルールベースの手法は、説明可能な結果を提供するが、しばしば競争性能を達成するために非常に多くのルールを必要とする。
トレーニングデータからルールコンテキスト(意味のあるルールのサブセット)を発見し、これらのルールコンテキスト上で学習された確率分布(確率回路)を用いて、完全なルールセットのパフォーマンスをより早く達成する。
我々のフレームワークは確率論的論理のよく知られたセマンティクスに基づいており、独立性の仮定を必要とせず、抽出可能な推論手順は、与えられたクエリの近似的な下限と正確な確率の両方を提供することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:17:03 GMT)
Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection [7.4] ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
本稿では,一組のエキスパートモデルを用いて,それぞれが特定の異常型をキャプチャする新しいフレームワークを提案する。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:48:48 GMT)
Learning to Match Unpaired Data with Minimum Entropy Coupling [7.4] 最小エントロピー結合(Minimum Entropy Coupling)は、限界の制約を満たすとともに、合同エントロピーを最小化する。
本稿では、よく知られた生成拡散モデルを用いて、連続MEC問題の解法を提案する。
我々は,本手法が汎用的であり,課題解決に容易に利用できることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:49:00 GMT)
Overconfidence in LLM-as-a-Judge: Diagnosis and Confidence-Driven Solution [7.4] 大規模言語モデル(LLM)は自動化された判断として広く使われており、実際的な価値は正確さと信頼性の高いリスク認識の判断の両方に依存する。
既存のアプローチは主に正確さに焦点を合わせ、よく校正された信頼の必要性を見越す。
我々は、精度中心の評価から信頼性駆動型、リスク対応型LCM-as-a-Judgeシステムへの移行を提唱する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:11:22 GMT)
Graph-Powered Defense: Controller Area Network Intrusion Detection for Unmanned Aerial Vehicles [7.3] 無人航空機(UAV)はサイバー攻撃に対して、特に制御エリアネットワーク(CAN)バスでは十分に頑丈ではない。
本研究では,新しいグラフベースの侵入検知システムを開発することにより,UAVの最も重要なセキュリティ脆弱性を解決することに注力する。
我々は,CANバス上でのサイバー攻撃を検出するために,様々なグラフベース機械学習モデルを適用した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:45:18 GMT)
Arbitrarily-high-dimensional reconciliation via cross-rotation for continuous-variable quantum key distribution [7.3] 多次元回転は、情報の整合性を高める強力なツールとして機能する。
本稿では,任意の高次元での和解を可能にするクロスローテーション方式を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:12:34 GMT)
In-Training Defenses against Emergent Misalignment in Language Models [7.2] ファインチューニングにより、実践者は新しいドメインに対して、整列した大きな言語モデル(LLM)を再利用できる。
最近の研究は、創発的不整合(EMA: emergent misalignment)を明らかにしている。
本報告では,API経由で微調整を行うプロバイダに対して,EMAに対するイントレーニングセーフガードを実践する最初の体系的な研究について述べる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:10:28 GMT)
A Game-Theoretic Foundation for Bitcoin's Price: A Security-Utility Equilibrium [7.2] 本稿では,Bitcoinのような分散型デジタル資産の価値を評価するための構造ゲーム理論モデルを提案する。
それは、Rational-Expectations Security-Utility Nash Equilibrium (RESUNE)における資産の価格を規定している。
我々は、RESUNEの存在を証明し、その特異性と安定性の条件を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:09:21 GMT)
Dome-DETR: DETR with Density-Oriented Feature-Query Manipulation for Efficient Tiny Object Detection [7.2] Dome-DETRは、高効率Tinyオブジェクト検出のための密度指向の特徴クエリ操作を備えた新しいフレームワークである。
Dome-DETRは最先端の性能(AI-TOD-V2では+3.3 AP、VisDroneでは+2.5 AP)を達成し、計算の複雑さとコンパクトなモデルサイズを維持している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:40:27 GMT)
Entropy Causal Graphs for Multivariate Time Series Anomaly Detection [7.1] 本研究では,多変量時系列異常検出のためのエントロピー因果グラフであるCGADを提案する。
CGADは転送エントロピーを利用して時系列データ間の因果関係を明らかにするグラフ構造を構築する。
CGADは、9%の平均的な改善で、実世界のデータセット上で最先端の手法より優れています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:01:47 GMT)
Detectability of post-Newtonian classical and quantum gravity via quantum clock interferometry [7.1] 本稿では,ニュートン後の重力が量子システムにどう影響するかを実験的に検討する手法を提案し,理論的に分析する。
我々は、(i)回転質量の重力場を検出するために設計された量子クロック干渉計と、(ii)重力誘起絡みを発生させるためにそのような効果が使えるかどうかを探索するスキームの2つの設定を考察する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:03:15 GMT)
GeoLaux: A Benchmark for Evaluating MLLMs' Geometry Performance on Long-Step Problems Requiring Auxiliary Lines [7.0] GPSは、図の理解、論理的推論、知識応用、数値計算、補助線構築をマスターするモデルを必要とする。
MLLMの幾何学的スキルを評価するための既存のベンチマークは、補助的なライン構築を見越し、きめ細かいプロセス評価を欠いている。
計算問題と証明問題の両方を取り入れた2,186の幾何問題からなるGeoLauxベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:11:37 GMT)
Probabilistic Foundations for Metacognition via Hybrid-AI [7.0] 本稿では「エラー検出・修正規則」として知られるハイブリッドAIアプローチについてレビューする。
従来の実証研究に厳密さを加える確率的枠組みを導入する。
我々はこの枠組みを用いてメタ認知改善に必要な十分な条件について結果を証明している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:24:32 GMT)
SCAR: State-Space Compression for AI-Driven Resource Management in 6G-Enabled Vehicular Infotainment Systems [7.0] 本稿では,車載インフォテイメントにおけるスケジューリングと公平性を最適化するためのSCAR(State-Space Compression for AI-Driven Resource Management)を提案する。
SSCARはMLベースの圧縮技術(クラスタリングやRBFネットワークなど)を用いて、CQIデータサイズを削減し、重要な特徴を保存する。
その結果、SCARベースのクラスタリングはCQIクラスタリングの歪みを10%削減し、その効率性を確認した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:53:18 GMT)
Learning Representations of Satellite Images with Evaluations on Synoptic Weather Events [7.0] 本研究では,衛星画像に表現学習アルゴリズムを適用し,各種気象事象の分類による学習潜在空間の評価を行った。
実験結果から, CAEが学習した潜伏空間は, 全分類タスクに対して常に高い脅威スコアを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:42:18 GMT)
Are you In or Out (of gallery)? Wisdom from the Same-Identity Crowd [6.8] 1対多の顔認証における中心的な問題は、プローブ画像の人物がギャラリーに登録された画像を持っているかしないかである。
我々は、ランク1の結果がイン・ギャラリー/アウト・オブ・ギャラリーであるかどうかを予測するために、ランク1の結果を付加的に登録した画像を用いて新しいアプローチをとる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:39:29 GMT)
REFS: Robust EEG feature selection with missing multi-dimensional annotation for emotion recognition [6.8] 感情的な脳とコンピュータのインターフェースは、感情的な相互作用と感情的な知性にとって重要な技術である。
マルチタイプ脳波の特徴の高次元性は、比較的少数の高品質脳波サンプルと相まって、感情認識の課題を提起する。
本研究では,多次元感情認識の欠如に対する新しい脳波特徴選択法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:53:46 GMT)
CodeARC: Benchmarking Reasoning Capabilities of LLM Agents for Inductive Program Synthesis [6.8] 既存の評価プロトコルは、静的なサンプルセットとホールドアウトテストに依存しており、合成された関数が正しくない場合にフィードバックを提供する。
エージェントが隠れたターゲット関数と対話する新しい評価フレームワークであるCodeARCを提案する。
1114の関数を特徴とする汎用帰納的プログラム合成のための,最初の大規模ベンチマークを構築した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:13:11 GMT)
Classification is a RAG problem: A case study on hate speech detection [6.7] Retrieval-Augmented Generation (RAG) を用いた分類法を提案する。
RAGは従来の分類タスクを、推論時に検索した文脈的知識に関連してコンテンツを評価するようにシフトする。
ヘイトスピーチ検出では、これはタスクを「ヘイトスピーチか?」から「ヘイトスピーチポリシーに違反しているのか?」に変換する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:35:41 GMT)
CDI: Blind Image Restoration Fidelity Evaluation based on Consistency with Degraded Image [6.7] 本稿では,Blind Image Restoration (BIR) 法における非特異性・劣化不確定問題について再検討する。
本稿では,CDI(Consistency with Degraded Image)を算出し,忠実度を評価するBIR IQAシステムを提案する。
さらに,参照画像のないBIR忠実度評価が可能な参照非依存CDIを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:05:14 GMT)
Text Embedded Swin-UMamba for DeepLesion Segmentation [6.7] 大きな言語モデル(LLM)を病変分割ワークフローに統合することで、画像特徴と放射線診断レポートからの病変特性の記述を組み合わせることができる。
本研究では,病変分割作業におけるSwin-UMambaアーキテクチャへのテキスト統合の可能性について検討した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:54:06 GMT)
HERGC: Heterogeneous Experts Representation and Generative Completion for Multimodal Knowledge Graphs [6.6] マルチモーダル知識グラフ(MMKG)は、画像やテキストなどの多様なモダリティを統合することで、伝統的な知識グラフ(KG)を豊かにする。
マルチモーダル知識グラフ補完(MMKGC)は、欠落した事実を推測するためにこれらの異種信号を活用する。
HERGCはMMKGのためのフレキシブルな異種エキスパート表現および生成コンプリートフレームワークである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:42:44 GMT)
Evaluating Style-Personalized Text Generation: Challenges and Directions [6.6] BLEUやROUGEのような広く採用されている評価指標の有効性を疑問視する。
我々は、スタイルの埋め込みやLCM-as-judgeといった他の評価パラダイムを探索し、スタイルのパーソナライズされたテキスト生成タスクを全体的評価する。
我々は,多様な評価指標のアンサンブルを取り入れ,個人化されたテキスト生成を効果的に評価する決定的な証拠を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:07:31 GMT)
ASLSL: Adaptive shared latent structure learning with incomplete multi-modal physiological data for multi-dimensional emotional feature selection [6.6] 適応型共有潜在構造学習(ASLSL)と呼ばれる不完全多モード生理学的信号特徴選択法を提案する。
類似した特徴が類似した感情的ラベルを共有する性質に基づいて、ASLSLは適応的な共用潜在構造学習を用いて、不完全な多モード生理的信号と多次元感情的ラベルに共有される共通の潜時空間を探索する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:54:02 GMT)
CARE: Enhancing Safety of Visual Navigation through Collision Avoidance via Repulsive Estimation [6.2] 本稿では,学習に基づく視覚ナビゲーション手法の堅牢性を向上させるため,CARE(Collision Avoidance via Repulsive Estimation)を提案する。
CAREは、ローカルなロボット軌道を生成するRGBベースのナビゲーションモデルにシームレスに統合することができる。
我々は、様々なロボットプラットフォームにまたがる最先端のビジュアルナビゲーションモデルと統合することで、CAREを評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:39:13 GMT)
AURA: Affordance-Understanding and Risk-aware Alignment Technique for Large Language Models [6.1] AURAは論理的一貫性と安全性を認識した総合的、段階的な評価を提供する。
本フレームワークは, 内省的自己批判, きめ細かいPRM評価, 適応型安全認識復号をシームレスに結合する。
この研究は、アライメントに敏感なアプリケーションのための新しいベンチマークを設定することで、より安全で責任があり、コンテキストに敏感なAIに向けた重要なステップである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:43:24 GMT)
Learning More by Seeing Less: Line Drawing Pretraining for Efficient, Transferable, and Human-Aligned Vision [6.0] 本稿では,よりコンパクトで一般化可能な視覚表現を誘導するために,ライン描画を構造第一事前学習モードとして用いることを提案する。
線図上に事前訓練されたモデルは、より強い形状バイアス、より集中した注意力、データ効率を向上させる。
ラインプレトレーニングされた教師から蒸留された学生は、着色教師の訓練を受けた教師よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:44:33 GMT)
EvidenceBench: A Benchmark for Extracting Evidence from Biomedical Papers [6.0] バイオメディカルペーパーにおける仮説に関連する証拠を自動的に発見する作業について検討する。
このタスクでモデルのパフォーマンスを測定するために、EvidenceBenchを導入します。
複数の人間-専門家のアノテーションを用いて,パイプラインの妥当性と精度を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:40:07 GMT)
Feature-Space Oversampling for Addressing Class Imbalance in SAR Ship Classification [6.0] 本稿では,M2m$_f$,M2m$_u$,Major-to-minor(M2m)法にヒントを得た2つの新しいアルゴリズムを提案する。
アルゴリズムはOpenSARShip(6クラス)とFuSARShip(9クラス)の2つの公開データセットでテストされ、3つの最先端モデルを使って特徴抽出を行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:08:37 GMT)
A Classification-Aware Super-Resolution Framework for Ship Targets in SAR Imagery [6.0] 高解像度画像は、分類、検出、セグメンテーションといった視覚認識タスクのパフォーマンス向上に重要な役割を果たしている。
これを解決するために、低解像度入力から高解像度画像を再構成しようとする超解像度(SR)技術が広く採用されている。
本稿では,画像品質と分類性能の両方を考慮した損失関数を最適化することにより,合成開口レーダ画像の分解能を向上させる手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:50:40 GMT)
Space and Time Cost of Continuous Rotations in Surface Codes [5.9] クリフォード演算は、フォールトトレラント量子コンピュータで比較的容易に実装できる。
連続回転ゲートは 典型的な量子アルゴリズムにおいて 重要なボトルネックのままです
ハンミング重畳や触媒塔など、回転のT数やT深度を減らすために、いくつかの技術が開発されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:38:41 GMT)
ViPro-2: Unsupervised State Estimation via Integrated Dynamics for Guiding Video Prediction [5.9] ViProは、最初から完全な真理状態を提供することなく、観測結果から状態を推測できることを示す。
実際のシナリオとのギャップを埋めるために、オリジナルのOrbitsデータセットを3D変種で拡張します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:10:26 GMT)
Transfer Learning from Visual Speech Recognition to Mouthing Recognition in German Sign Language [5.9] この研究は、音声言語において、口語インスタンスを対応する単語に直接分類する。
ドイツ語手話における視覚音声認識から音声認識への変換学習の可能性について検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:11:13 GMT)
What Voting Rules Actually Do: A Data-Driven Analysis of Multi-Winner Voting [5.9] 本稿では,様々な選好分布における投票規則が公理に違反する頻度を評価するためのデータ駆動型フレームワークを提案する。
投票ルールとして機能するニューラルネットワークは、公理違反を最小限に抑える従来のルールより優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:54:09 GMT)
SCALEFeedback: A Large-Scale Dataset of Synthetic Computer Science Assignments for LLM-generated Educational Feedback Research [5.8] 現在、学生の課題に関する大規模なオープンソースデータセットは存在せず、詳細な課題記述、ルーブリック、学生への提出が含まれている。
我々はLLM生成教育フィードバック研究(SCALEFeedback)のための大規模コンピュータサイエンス・アサインメントデータセットを構築した。
オープンソースのデータセットには、59の大学レベルのコンピュータサイエンスコースで155の課題にまたがる1万の合成学生の応募が含まれている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:37:20 GMT)
Dean of LLM Tutors: Exploring Comprehensive and Automated Evaluation of LLM-generated Educational Feedback via LLM Feedback Evaluators [5.8] LLM フィードバック評価器を用いて,LLM チュータが生成したフィードバックを自動的に,包括的に評価する手法を提案する。
これにより、低品質なフィードバックを拒否することができ、LLMチューターが評価結果に基づいて生成されたフィードバックを改善することができる。
その結果,o3-proはフィードバックのゼロショットラベリングにおいて最高の性能を示し,o4-miniは数ショットラベリングにおいて最高の性能を示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:36:23 GMT)
Cyberbullying Detection via Aggression-Enhanced Prompting [5.8] 本研究では,大規模言語モデル(LLM)のサイバーバブル検出における一般化と性能を高めるため,統合トレーニングフレームワークにおける補助的タスクとしての攻撃検出の統合について検討した。
予備的な結果は、濃縮されたプロンプトパイプラインが標準のLoRA微調整よりも一貫して優れていることを示している。
本研究は、ソーシャルネットワーク上での安全クリティカルなアプリケーションのためのLCMの一般化を改善するため、攻撃検出などの補助的タスクの可能性を強調した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:46:05 GMT)
TD3Net: A Temporal Densely Connected Multi-Dilated Convolutional Network for Lipreading [5.8] バックエンドアーキテクチャとして高密度スキップ接続と時間畳み込みを組み合わせた時間密結合型多進化ネットワークTD3Netを提案する。
2つの大きな公開データセットであるLRW(Lip Reading in the Wild)とLRW-1000(Lip Reading in the Wild)を用いた単語レベルの読解処理の実験結果から,提案手法が最先端の手法に匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:34:50 GMT)
MAATS: A Multi-Agent Automated Translation System Based on MQM Evaluation [5.8] MAATSは複数の専門的なAIエージェントを採用しており、それぞれが独自のMQMカテゴリに焦点を当てている。
特に意味的正確性、局所的適応、言語学的に離れた言語対において優れている。
モジュールエージェントの役割を解釈可能なMQM次元に合わせることで、MAATSはブラックボックスLLMと人間の翻訳のギャップを狭める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:49:43 GMT)
Generative AI for Intent-Driven Network Management in 6G: A Case Study on Hierarchical Learning Approach [5.7] 我々は、Intent-Driven Networks(IDN)の3段階すべてにまたがってGenAIを導入する階層的なフレームワークを提案する。
提案するIDN管理アーキテクチャの有効性を示すために,Mambaという最新のGenAIアーキテクチャに基づくケーススタディを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:06:52 GMT)
A Tight Lower Bound for the Approximation Guarantee of Higher-Order Singular Value Decomposition [5.7] 我々は、高階特異値分解(HOSVD)の古典的な近似保証がきついことを証明した。
また、Vannieuwenhoven et al. (2012) の ST-HOSVD アルゴリズムと、De Lathauwer et al. (2000b) の高階直交反復 (HOOI) が厳密であることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:34:57 GMT)
Classical Commitments to Quantum States [5.7] 量子状態に対する古典的なコミットメントスキームの概念を定義する。
量子証明器は量子状態に対する古典的なコミットメントを計算し、後に各量子ビットを標準またはアダマール基底で開くことができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:27:43 GMT)
Detecting and explaining postpartum depression in real-time with generative artificial intelligence [5.6] この研究は、自然言語処理、機械学習、大規模言語モデルを組み合わせたインテリジェントなPDDスクリーニングシステムに貢献している。
その結果,すべての評価指標に対するpd検出の90%を達成し,文献における競合する解よりも優れた結果を得た。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:57:05 GMT)
CAST: Cross Attention based multimodal fusion of Structure and Text for materials property prediction [5.6] クロスアテンションに基づくモデルは、グラフ表現と資料のテキスト記述を統合する。
CASTは4つの重要な材料特性で既存のベースラインモデルを上回っている。
本研究は,材料科学において,より正確かつグローバルに情報を得た予測モデルを開発するためのマルチモーダル学習フレームワークの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:06:09 GMT)
A 3DGS-Diffusion Self-Supervised Framework for Normal Estimation from a Single Image [5.6] 空間次元情報の欠如は、単一画像からの正規推定において依然として課題である。
近年の拡散法は2次元から3次元の暗黙マッピングにおいて有意なポテンシャルを示した。
本稿では,SINGADを提案する。SINGADは,単一画像から正規推定のための新しい自己教師型フレームワークである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:32:33 GMT)
Confidence Estimation for Text-to-SQL in Large Language Models [5.6] 大規模言語モデル(LLM)の文脈において,モデルの重み付けや勾配へのアクセスがしばしば制約される問題について検討する。
ブラックボックスとホワイトボックスの信頼度評価戦略について検討し、クロスドメインベンチマーク上での有効性を評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:09:45 GMT)
Generalizing Scaling Laws for Dense and Sparse Large Language Models [5.5] 本稿では,高密度かつスパースな大言語モデルに対する一般化スケーリング法則を提案する。
提案法則を既存のスケーリング法則と比較し,その有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:07:11 GMT)
Train It and Forget It: Merge Lists are Unnecessary for BPE Inference in Language Models [5.5] 標準バイトペア。
(BPE)トークン化は、学習したトークン語彙と詳細なマージリストとのペアリングによってテキストを圧縮する。
近年の研究では、このマージリストが、言語モデルのトレーニングデータに関する情報を抽出する潜在的攻撃面を公開することが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:10:03 GMT)
MuSpike: A Benchmark and Evaluation Framework for Symbolic Music Generation with Spiking Neural Networks [5.5] 我々は、ニューラルネットワーク(SNN)をスパイクするための統合ベンチマークおよび評価フレームワークであるMuSpikeを紹介する。
MuSpike氏は、確立された客観的メトリクスと大規模なリスニングスタディを組み合わせることで、包括的な評価を強調している。
その結果、異なるSNNモデルが評価次元にまたがって異なる強度を示すことが明らかとなった。
異なる音楽背景を持つ参加者は多様な知覚パターンを示し、専門家はAIによって構成された音楽に対してより寛容であることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:43:38 GMT)
GMF-Drive: Gated Mamba Fusion with Spatial-Aware BEV Representation for End-to-End Autonomous Driving [5.5] 本稿では, GMF-Driveを紹介した。これは2つの原則的イノベーションを通じて, 課題を克服するエンドツーエンドフレームワークである。
まず、情報制限ヒストグラムに基づくLiDAR表現を、幾何学的に拡張された柱形式で置き換える。
第二に,高効率空間認識状態空間モデルを用いた高価な変圧器を代替する新しい階層型マンバ融合アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:17:18 GMT)
Should you use LLMs to simulate opinions? Quality checks for early-stage deliberation [5.4] そこで我々は,LLMを模擬したQuality Controlアセスメントを提案する。
この評価は2つの重要なテストから成っている。
どのモデルやメソッドも完全な評価をパスせず、いくつかの障害モードを明らかにします。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:37:08 GMT)
Topology Generation of UAV Covert Communication Networks: A Graph Diffusion Approach with Incentive Mechanism [5.4] 本稿では,グラフ拡散に基づくポリシー最適化(GDPO)とStackelberg Game(SG)ベースのインセンティブ機構を組み合わせた,自己組織型UAVネットワークフレームワークを提案する。
GDPO法は生成AIを使用して、疎だが十分に接続されたトポロジを動的に生成し、ノード分布の変更やGU要求への柔軟な適応を可能にする。
Stackelberg Game(SG)ベースのインセンティブメカニズムは、自己関心のUAVに対して、協調をサポートし、隠蔽コミュニケーションを強化するリレー行動と隣のリンクを選択するように誘導する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:06:49 GMT)
Schema-Guided Scene-Graph Reasoning based on Multi-Agent Large Language Model System [5.4] マルチエージェント大規模言語モデル(LLM)に基づく反復ガイド付シーングラフ推論フレームワークを提案する。
2つのモジュールが反復的に協調し、シーケンシャルな推論とグラフ情報への適応的な注意を可能にする。
我々のフレームワークは,従来のLCMベースのアプローチや,ベースラインの単一エージェント,ツールベースのReason-while-Retrieve戦略を超越した数値Q&Aと計画タスクを実現している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:55:03 GMT)
ECMF: Enhanced Cross-Modal Fusion for Multimodal Emotion Recognition in MER-SEMI Challenge [5.2] 我々は,MER2025コンペティションにおけるMER-SEMI課題に,新しいマルチモーダル感情認識フレームワークを提案する。
大規模事前学習モデルを用いて視覚、音声、テキストのモダリティから情報的特徴を抽出する。
提案手法は,MER2025-SEMIデータセットのオフィシャルベースラインに対して,大幅な性能向上を実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:55:25 GMT)
DeToNATION: Decoupled Torch Network-Aware Training on Interlinked Online Nodes [5.2] 大規模なニューラルネットワークモデルのトレーニングには、大規模な計算リソースが必要で、多くの場合、複数のノードやアクセラレータに分散する。
我々はFlexDeMoを導入し、ノードが異なるアクセラレータ間で局所的に完全にシャードなモデルパラメータを割り当てる。
我々はFlexDeMoがAdamWを用いたハイブリッドシャードデータ並列トレーニングと完全な勾配同期と同様の検証損失が得られることを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:43:08 GMT)
Multi-Objective Instruction-Aware Representation Learning in Procedural Content Generation RL [4.9] コンテンツ生成のための多目的表現学習手法MIPCGRLを提案する。
提案手法は,最大13.8%の制御性向上を実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:41:42 GMT)
Towards More Realistic Extraction Attacks: An Adversarial Perspective [4.9] 言語モデルはトレーニングデータを記憶する傾向があり、抽出攻撃に対して脆弱である。
本稿では,敵対的観点からの抽出攻撃を再考する。
抽出トレンド、すなわちプロンプトへの直感的な変更や、より小さなモデルをターゲットにする際の大きな混乱が見られます。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:09:37 GMT)
Systemizing Multiplicity: The Curious Case of Arbitrariness in Machine Learning [4.9] アルゴリズムモデリングは、目に見えないシナリオの結果を外挿するためにデータ内の限られた情報に依存しており、しばしばその決定に任意の要素を埋め込む。
最近注目されたこの仲裁性に関する一考察 -「良いモデル」の集合における仲裁性の研究-
a) モデル設計の選択に関する用語の形式化とその任意性への貢献、(b) 多重性の定義を拡張して、単に予測や説明以上の未表現の形式を取り入れ、(d) 多重性の利点と潜在的なリスクを蒸留する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:57:59 GMT)
Towards Reliable Generative AI-Driven Scaffolding: Reducing Hallucinations and Enhancing Quality in Self-Regulated Learning Support [4.9] 我々は、学生に提示する前に、個人化されたSRL足場を評価するためのGenAI対応アプローチを提案する。
信頼性評価のためのマルチエージェントシステムアプローチを開発し、スキャフォールドが関連するSRLプロセスに対して正確にターゲットする範囲を評価する。
第2のアプローチは「LLM-as-a-Judge」技術を用いて,LLM生成足場を学生支援に役立てるための品質評価を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:40:10 GMT)
Time-Prompt: Integrated Heterogeneous Prompts for Unlocking LLMs in Time Series Forecasting [4.9] 時系列予測は、変数間の時間的依存関係を将来の状態推論のためにモデル化することを目的としている。
近年の研究では,大規模言語モデル (LLM) が時系列予測において有望な性能を達成することが示されている。
マルチプロンプト情報とモーダル間セマンティックアライメントを組み合わせたLLMベースの時系列予測フレームワークLLM-Promptを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:18:59 GMT)
Robust Target Speaker Diarization and Separation via Augmented Speaker Embedding Sampling [4.9] 本研究は、ターゲット話者の埋め込みを自動的に識別し、発話分離とダイアリゼーションを同時に行うための新しいアプローチを導入する。
提案モデルでは,頑健な話者表現特徴を学習するための2段階学習パイプラインを採用している。
重なり合う音声フレームにおけるダイアリゼーション精度を高めるために, 重なり合うスペクトル損失関数を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:24:10 GMT)
A Graph Sufficiency Perspective for Neural Networks [4.9] 本稿では,グラフ変数と統計的十分性を用いてニューラルネットワークを解析する。
ニューラルネットワーク層をグラフベースの変換として解釈し、ニューロンが入力と学習アンカーポイントのペア機能として機能する。
我々のフレームワークは、完全に接続された層、一般的なペアワイズ関数、ReLUとシグモノイドの活性化、畳み込みニューラルネットワークを網羅している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:39:33 GMT)
Radiative Heat Transfer and 2D Transition Metal Dichalcogenide Materials [4.9] 遷移金属ジアルコゲナイド単分子膜のH-およびT-対称性における放射熱力について検討した。
解析モデルとabinitioシミュレーションの特性を組み合わせたアプローチは, 放射熱伝達のための材料データベースを構築するために他の材料ファミリに利用することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:20:32 GMT)
Local Diffusion Models and Phases of Data Distributions [4.8] 本稿では,データ分布の位相に関する新たな視点を紹介し,計算コストを削減したローカルデノイザの構築について考察する。
逆の復調過程は、初期自明な位相と後期データ位相から成り、局所的な復調器が失敗する急激な位相遷移をサンドイッチすることを示す。
この研究は拡散モデルのより単純で効率的なアーキテクチャを示唆している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:01:01 GMT)
Advanced Deep Learning Techniques for Accurate Lung Cancer Detection and Classification [4.8] 肺がんは最も頻繁に診断されるがんの1つであり、世界中で男性や女性にとって最も多い死因の1つである。
CT画像は,低コスト,高速な処理により,最も望ましい診断法である。
本稿では,DenseNet201モデルに基づくCT画像からのLC検出と分類のための革新的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:09:52 GMT)
Adversarial Topic-aware Prompt-tuning for Cross-topic Automated Essay Scoring [4.8] 横断的自動エッセイスコア(英語版)(AES)は、対象トピックに関するエッセイを効果的に評価できる伝達可能なモデルを開発することを目的としている。
本稿では,AESを改善するために,ATOP(Adversarial Topic-aware Prompt-tuning)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:43:01 GMT)
Direct Robot Configuration Space Construction using Convolutional Encoder-Decoders [4.7] コンフィグレーション空間に高精度な近似を計算するための畳み込みエンコーダ・デコーダ・フレームワークを適用した。
両腕ロボットを用いた2次元ロボットワークスペースのtextC_textfree$と$textC_textclsn$を予測するための平均97.5%のF1スコアが得られた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:17:11 GMT)
ADT4Coupons: An Innovative Framework for Sequential Coupon Distribution in E-commerce [4.7] クーポン配信は、オンラインプラットフォームが収益を高め、ユーザーエンゲージメントを高めるために使う重要なマーケティング戦略である。
既存のクーポン配信戦略は、プラットフォームとユーザ間の複雑なシーケンシャルな相互作用を効果的に活用するには程遠い。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:03:17 GMT)
Mildly Conservative Regularized Evaluation for Offline Reinforcement Learning [4.7] オフライン強化学習は、さらなる環境相互作用を伴わずに、静的データセットから最適なポリシーを学習しようとする。
過大評価を防ぐために、値関数は保守的でなければならない。
本稿では保守主義と性能のバランスをとる軽度に保守的な正規化評価(MCRE)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:48:26 GMT)
ActivityDiff: A diffusion model with Positive and Negative Activity Guidance for De Novo Drug Design [4.6] ActivityDiffは拡散モデルの分類器誘導技術に基づく生成的アプローチである。
その結果,ActivityDiffは重要な薬物設計タスクを効果的に処理することがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:48:47 GMT)
FIVA: Federated Inverse Variance Averaging for Universal CT Segmentation with Uncertainty Estimation [4.5] 本研究は,多様な腹部CTデータセットにまたがる普遍的なセグメンテーションを実現するための,新しいフェデレーション学習手法を提案する。
提案手法はモデル重みから不確かさを伝搬することにより予測の不確かさを定量化する。
実験により, フェデレーションアグリゲーションと不確実性重み付け推論の品質向上に本手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:34:01 GMT)
Neural Field Representations of Mobile Computational Photography [4.5] 複雑な幾何学と照明効果をコンパクトに表現する神経磁場モデルの設計方法を示す。
収集したモバイル写真データから直接、深度推定、層分離、画像縫合などのアプリケーションを有効にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:03:46 GMT)
Reshaping MOFs text mining with a dynamic multi-agents framework of large language model [4.3] 原記事や結晶コードを読み取って,それらを標準化された合成表に変換する,大規模言語駆動システムMOFh6を提案する。
MOFh6は、99%の抽出精度を達成し、5大出版社で94.1%の短縮を解決し、0.93 +/- 0.01の精度を維持した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:35:50 GMT)
Learning to Forget with Information Divergence Reweighted Objectives for Noisy Labels [4.3] ノイズラベルに基づく学習のための新しい目的クラスであるAntiDOTEを紹介する。
提案手法は,学習中の雑音ラベルによるサンプルの影響を適応的に低減することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:10:16 GMT)
Generative AI and the Future of the Digital Commons: Five Open Questions and Knowledge Gaps [4.2] 生成AIは、コミュニティによって作成、共有、維持される、自由でオープンなオンラインコンテンツの膨大なコレクションであるデジタルコモンズに大きく依存している。
GenAIの相互依存関係、デジタルコモンズの長期的な持続可能性、そして現在のAI開発プラクティスのエクイティを検討することが不可欠である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:20:45 GMT)
Learning interactions between Rydberg atoms [4.2] グラフニューラルネットワーク(GNN)を用いたハミルトン学習へのスケーラブルなアプローチを提案する。
我々は、GNNモデルがトレーニング領域を超えて外挿できることを実証した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:02:32 GMT)
Toward Inclusive Low-Code Development: Detecting Accessibility Issues in User Reviews [4.1] ローコードアプリケーションは、カラーブラインドやロービジョンのような視覚障害のあるユーザーを意図せずに排除することができる。
我々は、アクセシビリティ関連レビューと非アクセシビリティ関連レビューからなる、ローコードアプリケーションレビューの包括的なデータセットを構築した。
提案したハイブリッドモデルは,アクセシビリティ関連問題の検出において精度とF1スコアを78%向上させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:41:05 GMT)
Structural Equation-VAE: Disentangled Latent Representations for Tabular Data [4.1] 可変オートエンコーダの設計に直接測定構造を組み込む新しいアーキテクチャであるSE-VAE(Structural Equation-Variational Autoencoder)を導入する。
構造方程式モデリングにインスパイアされたSE-VAEは、潜在部分空間を既知の指標群と整列させ、構造特異的な共役変異を分離するために大域的ニュアンスラデントを導入する。
SE-VAEは、係数回復、解釈可能性、およびニュアンス変動に対する堅牢性において、オルタナティブよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:21:20 GMT)
MX-AI: Agentic Observability and Control Platform for Open and AI-RAN [4.1] 我々は,5G Open RANテストベッドを実演する初のエンドツーエンドエージェントシステムMX-AIを紹介する。
50のリアルなオペレーショナルクエリでは、MX-AIの平均回答品質は4.1/5.0で、決定アクションの精度は100%である。
エージェントグラフ、プロンプト、評価ハーネスを公開して、AIネイティブRANのオープンな研究を加速します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:15:47 GMT)
Learning by Teaching: Engaging Students as Instructors of Large Language Models in Computer Science Education [4.1] 大規模言語モデル(LLM)はコンピュータサイエンス(CS)教育における仮想チューターとしてよく用いられる。
本稿では,このモデルを逆転させる新たな教育パラダイムについて述べる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:25:19 GMT)
Learning to Initialize Trajectory Optimization for Vision-Based Autonomous Flight in Unknown Environments [4.1] 未知環境における自律飛行のためのニューラル・エンハンスト・トレイ・プランナー(NEO-Planner)を提案する。
NEO-Plannerは、生のセンサー観測から直接軌道の空間的および時間的パラメータを予測することを学ぶ。
最適化を20%削減し、純粋な最適化手法と比較して軌道時間も26%減少する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:33:07 GMT)
DP-LLM: Runtime Model Adaptation with Dynamic Layer-wise Precision Assignment [4.0] DP-LLMは入力値に基づいて各層に動的に精度を割り当てる機構である。
DP-LLMは,従来の手法よりも優れた性能・遅延トレードオフを実現することを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:57:04 GMT)
Noosemia: toward a Cognitive and Phenomenological Account of Intentionality Attribution in Human-Generative AI Interaction [4.0] 本稿では,ヒトと生成型AIシステムとの相互作用から生じる新しい認知・現象学的パターンであるNoosemiaを紹介し,形式化する。
特定の条件下では、ユーザが意図性、エージェンシー、さらにはシステムの内部性をどう評価するかを説明するための多分野のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:44:11 GMT)
Stepwise Fine and Gray: Subject-Specific Variable Selection Shows When Hemodynamic Data Improves Prognostication of Comatose Post-Cardiac Arrest Patients [4.0] 心停止後のコマトミー患者の予後は、ICUの臨床的意思決定に直接影響を与える重要な課題である。
本稿では、神経学的結果の予測を改善するために、段階的に動的に競合するリスクモデルを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:20:30 GMT)
Evaluating and Designing Sparse Autoencoders by Approximating Quasi-Orthogonality [3.9] 近似的特徴アクティベーション(AFA)の定式化に基づく新しいアクティベーション関数 Top-AFA を導入する。
3つの中間層上のSAEをトレーニングして、OpenWebTextデータセットから8000万以上のトークンに対して、GPT2の隠れ埋め込みを再構築することにより、このアプローチの実証的なメリットを実演する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:47:22 GMT)
VL-MedGuide: A Visual-Linguistic Large Model for Intelligent and Explainable Skin Disease Auxiliary Diagnosis [3.8] 本稿では,視覚言語大モデル(LVLM)の強力なマルチモーダル理解と推論機能を活用した新しいフレームワークであるVL-MedGuideを紹介する。
Derm7ptデータセットの実験は、VL-MedGuideが疾患診断と概念検出の両方で最先端のパフォーマンスを達成することを示した。
人間の評価は、生成された説明の明快さ、完全性、信頼性を裏付けるものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:13:34 GMT)
MA-CBP: A Criminal Behavior Prediction Framework Based on Multi-Agent Asynchronous Collaboration [3.8] 公共の場での犯罪行為は、社会保障にとってますます深刻な脅威となる。
リアルタイムビデオストリームをフレームレベルのセマンティック記述に変換するフレームワークであるMA-CBPを提案する。
結果として生じる行動決定には、事象の主題、場所、原因などの重要な要素が含まれ、潜在的な犯罪行為の早期警告を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:12:00 GMT)
Parameter-free Optimal Rates for Nonlinear Semi-Norm Contractions with Applications to $Q$-Learning [3.7] 平均逆テキストit$Q$-learningとtextitTD-learningを解くアルゴリズムは、半ノルムの収縮を伴うことが多い。
本研究では, 非線形摂動を含む線形再帰として平均誤差をリキャストし, 半ノルムの縮約と好ましく誘導されるノルムの単調性とを結合することにより非線形性をテームする。
パラメータフリーな$tildeO (1/sqrtt)$$Q$学習の最適レートは、平均逆および指数関数的に割引された設定の両方で得られる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:35:29 GMT)
El Agente: An Autonomous Agent for Quantum Chemistry [3.7] El Agente Qは、自然言語のユーザプロンプトから量子化学を生成し、実行するマルチエージェントシステムである。
El Agente Qは6つの大学レベルのコース演習と2つのケーススタディでベンチマークされ、堅牢な問題解決性能を示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:58:12 GMT)
Survival Modeling from Whole Slide Images via Patch-Level Graph Clustering and Mixture Density Experts [3.6] スライド画像全体(WSI)から癌特異的生存を予測するためのモジュラーフレームワークを提案する。
大規模なWSIに対処するために,Quantile-based thresholding を用いた動的パッチ選択を用いて予後情報組織領域を分離する。
第3に、局所的な特徴を文脈化するために、クラスタ内関係とクラスタ間関係の両方をモデル化する注意機構を用いる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:21:54 GMT)
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.6] 本稿では,シャドウ除去用に設計された最初のマンバモデルであるShadowMambaを提案する。
実験の結果,提案手法はAISTD, ISTD, SRDデータセットにおいて, 従来の主流手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:58:53 GMT)
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning [3.6] 強化学習(RL)は様々な最適化問題を解く上で有望である。
本研究では,コンテナの出荷におけるRLの利用に焦点を合わせ,マスタ・ストージ・プランニングにおける重要な課題に対処する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:52:16 GMT)
SlimInfer: Accelerating Long-Context LLM Inference via Dynamic Token Pruning [3.5] SlimInferは、フォワードパス中にあまり重要でないプロンプトトークンを直接プルーニングすることで推論を加速することを目的としている。
SlimInferは最大$mathbf2.53times$ time-to-first-token(TTFT)スピードアップと$mathbf1.88times$ end-to-end latency reduction for LLaMA3.1-8B-Instructを実現する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:42:38 GMT)
FMCE-Net++: Feature Map Convergence Evaluation and Training [3.5] FMCE-Net++は、事前訓練された凍結されたFMCE-Netを補助ヘッドとして統合する訓練フレームワークである。
このモジュールはFMCS予測を生成し、タスクラベルと組み合わせてバックボーン最適化を共同で監督する。
MNIST、CIFAR-10、FashionMNIST、CIFAR-100で行った実験は、FMCE-Net++が一貫してモデル性能を向上させることを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:15:26 GMT)
Khan-GCL: Kolmogorov-Arnold Network Based Graph Contrastive Learning with Hard Negatives [3.4] Khan-GCL は Kolmogorov-Arnold Network (KAN) を GCL エンコーダアーキテクチャに統合する新しいフレームワークである。
我々は、KAN係数パラメータ内に埋め込まれたリッチな情報を利用して、2つの新しい重要な特徴識別技術を開発した。
これらの手法により、各グラフ表現に対して意味論的に有意な強陰性サンプルを生成することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:14:32 GMT)
WGAST: Weakly-Supervised Generative Network for Daily 10 m Land Surface Temperature Estimation via Spatio-Temporal Fusion [3.3] 筆者らは,MODIS,Landsat 8,Sentinel-2のSSupervise-Temporal Fusionによる1日10mLST分解能の弱い遺伝的ネットワークWGASTを提案する。
特徴抽出、融合、LST再構成、ノイズ抑制の4段階からなる、条件付き生成対向アーキテクチャを採用する。
実験により、WGASTは定量評価と定性評価の両方において既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:49:46 GMT)
ME$^3$-BEV: Mamba-Enhanced Deep Reinforcement Learning for End-to-End Autonomous Driving with BEV-Perception [3.3] 本稿では,ディープラーニング強化(DRL)を用いた自律運転の新しいアプローチを提案する。
我々は,BEVに基づく知覚と時間的特徴モデリングのためのMambaフレームワークを組み合わせた,効率的な時間的特徴抽出ネットワークであるtextttMamba-BEV モデルを提案する。
そこで我々は,動的な都市運転シナリオにおいて,優れた性能を実現するためのtextttME$3$-BEVフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:13:28 GMT)
Auto-TA: Towards Scalable Automated Thematic Analysis (TA) via Multi-Agent Large Language Models with Reinforcement Learning [3.3] 先天性心疾患(CHD: Congenital heart disease)は、従来の臨床指標では示されていない、複雑で寿命の長い課題である。
本稿では,臨床物語のエンド・ツー・エンドのセマンティック分析を行う,完全自動大規模言語モデル(LLM)パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:52:29 GMT)
Low-Bit Data Processing Using Multiple-Output Spiking Neurons with Non-linear Reset Feedback [3.2] ニューロモルフィックコンピューティングにおける重要なアルゴリズムツールは、スパイクニューラルネットワーク(SNN)である
リセットによる一般SSM状態遷移と非線形フィードバック機構を組み合わせた新しい多出力スパイクニューロンモデルを提案する。
本研究は, リセット機構が不安定性を克服し, 神経力学の線形部分が不安定である場合でも学習を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:12:13 GMT)
Formal Local Implication Between Two Neural Networks [3.2] 我々は、入力領域全体のDにおいて、2つのネットワーク、すなわちN2がN1を意味する2つのネットワーク間の公式な局所的含意の基盤を確立する。
そこで本稿では,そのような局所的な意味を形式的に検証(確実に正しい)するために,音の定式化を提案する。
MNIST, CIFAR10, および2つの実世界の医療データセットに基づいて定式化を評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:25:59 GMT)
Symbolic Execution in Practice: A Survey of Applications in Vulnerability, Malware, Firmware, and Protocol Analysis [3.2] 記号実行は、すべてのプログラムパスの体系的な探索を可能にする強力なプログラム解析技術である。
本稿では,複雑なソフトウェアシステム上でのシンボリックな実行を可能にする戦略の体系的な分類法を提案する。
脆弱性分析,マルウェア解析,ファームウェア再ホスト,ネットワークプロトコル解析など,いくつかの領域におけるシンボル実行の応用を調査した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:43:45 GMT)
A Practical Introduction to Kernel Discrepancies: MMD, HSIC & KSD [3.2] 本稿では、最大平均離散性(MMD)、Hilbert-Schmidt Independence Criterion(HSIC)、Kernel Stein Discrepancy(KSD)に焦点をあてる。
一般的なV統計学やU統計学など、これらの相違点の様々な推定器が提示される。
カーネル帯域幅の選択の重要性は強調され、それが不一致推定の振る舞いにどのように影響するかを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:58:30 GMT)
Transferring Social Network Knowledge from Multiple GNN Teachers to Kolmogorov-Arnold Networks [3.1] Kolmogorov-Arnold Networks (KAN) は強い非線形表現性と効率的な推論を提供する。
我々は、KGAT、KSGC、KAPPNPの3つの新しいモデルにおいて、kansをGAT、SGC、APPNPの3つの一般的なGNNアーキテクチャに統合する。
本研究は,GNN表現性を向上し,グラフのない効率的な推論を可能にするkansの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:26:31 GMT)
Spatial Association Between Near-Misses and Accident Blackspots in Sydney, Australia: A Getis-Ord $G_i^*$ Analysis [3.1] 車両テレマティクスの普及は、積極的な安全へのパラダイムシフトの機会を与える。
本稿では,事故記録とニアミスイベントの一致と不一致を解析するための空間統計的枠組みを提案する。
結果は、トランスポート当局がリアクティブから積極的な安全管理戦略に移行するための、データ駆動の方法論を提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:56:49 GMT)
Simulation in Cybersecurity: Understanding Techniques, Applications, and Goals [3.0] 本稿では,サイバーセキュリティ研究におけるモデリングとシミュレーションの現状について概説する。
レビューされた論文は、アプリケーションドメイン、サイバー脅威の種類、採用したシミュレーション技術、シミュレーションの主な目的の4つの次元に基づいて分類される。
このレビューでは、異なるアプローチの強みと限界について論じ、シミュレーションベースの調査に最も適しているサイバー脅威を特定するとともに、特定のサイバーセキュリティ問題に最も適しているモデリングパラダイムを分析している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:11:13 GMT)
Surviving the Narrative Collapse: Sustainability and Justice in Computing Within Limits [3.0] 持続可能性駆動型コンピューティングの研究は、多くの社会政治の文脈で起こされたり、危険なものとして、ますます否定されている。
本稿では,これらの緊張関係を,異なるジャンルや視点で論じる創造的ストーリーリテリング手法であるFictomorphosisを通して探求する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:57:58 GMT)
Data Collaboration Analysis with Orthonormal Basis Selection and Alignment [2.9] Data Collaboration (DC)は、複数のパーティがプライベートデータセットを公開することなく、モデルを共同でトレーニングすることを可能にする。
既存の理論は、秘密の基地と同じ部分空間にまたがる任意の標的基底は十分であると主張する。
我々は、秘密ベースとターゲットベースの両方で正規性制約を明示的に強制する新しいDCフレームワークであるOrthonormal Data Collaboration(ODC)を紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:55:06 GMT)
HALO: Hindsight-Augmented Learning for Online Auto-Bidding [2.9] デジタル広告プラットフォームはリアルタイム入札(RTB)システムを通じてミリ秒レベルのオークションを運営している。
このダイナミックなメカニズムは、正確なオーディエンスターゲティングを可能にするが、深い運用上の複雑さをもたらす。
HALO: オンライン自動入札のための隠れた学習法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:37:04 GMT)
A spin-embedded diamond optomechanical resonator with mechanical quality factor exceeding one million [2.9] 組み込みカラーセンタースピンを備えたダイヤモンド光学結晶(OMC)デバイスは、量子センシング、ネットワーク、コンピューティングアプリケーションのための有望なプラットフォームである。
ここでは、低温下で106ドルを超える機械的品質因子を有するサイドバンド分解ダイヤモンドOCCを実証する。
組込み窒素空孔 (NV) センターのコヒーレンス時間を最大$T$ = $mu$s とする。
量子状態におけるハイブリッドスピンメカニカルデバイスのためのこのプラットフォームの可能性について論じる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:03:01 GMT)
Watermarking Kolmogorov-Arnold Networks for Emerging Networked Applications via Activation Perturbation [2.9] Kolmogorov-Arnold Networks (KAN) に適したCosine Transform-based Discrete Activation Watermarking (DCT-AW) 法を提案する。
DCT-AWは、離散コサイン変換を用いて活性化出力を摂動させ、多様なタスクとの互換性を確保し、タスク独立を達成することで、透かしを埋め込む。
実験により,DCT-AWはモデル性能に小さな影響を与え,各種ウォーターマーク除去攻撃に対して優れたロバスト性を提供することが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:51:59 GMT)
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline [2.8] YouTube ShortsやTikTokのようなショートビデオプラットフォームは、著作権の遵守という大きな課題に直面している。
侵害者は、しばしば任意のバックグラウンド音楽(BGM)を、不明瞭なオリジナルサウンドトラック(OST)に埋め込む。
音楽音源分離(MSS)と相互モーダルビデオ音楽検索(CMVMR)を統合した新しいパイプラインを提案する。
提案手法は、任意のBGMを元のOSTから効果的に分離し、真のビデオオーディオトラックの復元を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:28:16 GMT)
MeanAudio: Fast and Faithful Text-to-Audio Generation with Mean Flows [2.8] MeanAudioはMeanFlowベースの新しいモデルで、高速で忠実なテキスト・オーディオ生成に適している。
トレーニング中の平均速度場を後退させ、フロー軌跡の始点から終点へ直接マッピングすることで、高速な生成を可能にする。
実験により、MeanAudioは1ステップの音声生成において最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:49:59 GMT)
Crop Pest Classification Using Deep Learning Techniques: A Review [2.8] 昆虫害虫は世界中の作物に深刻な脅威をもたらし続けている。
ディープラーニングは強力なソリューションとして登場し、畳み込みニューラルネットワーク(CNN)やビジョントランスフォーマー(ViT)、害虫検出を自動化するハイブリッドモデルといったテクニックが普及している。
このレビューでは、2018年から2025年にかけて、慎重に選択された37の研究が、AIベースの害虫分類に焦点を当てている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:34:39 GMT)
FedX: Explanation-Guided Pruning for Communication-Efficient Federated Learning in Remote Sensing [2.7] フェデレーション学習はリモートセンシング(RS)画像分類タスクに適した学習パラダイムである。
FLをRSタスクに適用する上で重要な課題は、クライアントと中央サーバ間の大規模なモデル更新の頻繁な交換に起因する通信オーバーヘッドである。
我々は、説明誘導プルーニングを用いて通信オーバーヘッドを低減する新しい戦略(FedX)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:21:58 GMT)
LLM Serving Optimization with Variable Prefill and Decode Lengths [2.7] 本研究では,各要求が不均一なプレフィルとデコード長を持つLLM要求(Large Language Model)を提供する問題について検討する。
この問題は、配置制約の相互運用、優先関係、メモリ使用量の線形増加などによりNPハードであることが示される。
本稿では,時間とともに効率よくバッチを生成する新しい選択基準に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:54:21 GMT)
Can a Crow Hatch a Falcon? Lineage Matters in Predicting Large Language Model Performance [2.6] 本稿では,大規模言語モデル間の祖先関係を符号化する線形正規化行列因子化フレームワークを提案する。
マルチホップ親子接続を利用することで、LRMFは従来の行列分解法や協調フィルタリング法より一貫して優れている。
私たちの大規模な調査には、公開可能なHugging Faceモデル2,934、主要なベンチマークで21,000以上のインスタンスが含まれています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:53:19 GMT)
Synthetic Data-Driven Multi-Architecture Framework for Automated Polyp Segmentation Through Integrated Detection and Mask Generation [2.6] 本研究は,大腸内視鏡画像中のポリープ検出を自動化する,ユニークな多方向性アーキテクチャフレームワークを提案する。
この研究は、安定拡散の強化を通じて合成データを生成する包括的なシステムを実装している。
この研究は、U-Net、PSPNet、FPN、LinkNet、MANetを含む5つの最先端セグメンテーションモデルを評価した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:37:03 GMT)
Intelligent Sampling of Extreme-Scale Turbulence Datasets for Accurate and Efficient Spatiotemporal Model Training [2.6] 能率学習のためのスパース知的キュレーションフレームワークであるSICKLEを開発した。
予備処理ステップとしてのサブサンプリングにより,モデル精度が向上し,エネルギー消費が大幅に低減できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:55:25 GMT)
Clinically-guided Data Synthesis for Laryngeal Lesion Detection [2.6] そこで本研究では,Lyngeal endoscopic image-annotation pairを生成するために,Latent Diffusion Model(LDM)とControlNetアダプタを併用した新しいアプローチを提案する。
提案手法はCADx/eモデルのトレーニングデータセットの拡張に有効であり,喉頭科学における評価プロセスの強化に有効である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:55:54 GMT)
Nonparametric Learning Non-Gaussian Quantum States of Continuous Variable Systems [2.6] ノイズの多いデータから量子状態を再構成するための非カーネル量子状態推定フレームワークを導入する。
KQSEは、様々な基底における密度行列の推定と、純度、より高いモーメント、重なり合い、トレース距離などのトレース量を得る。
KQSEはマルチモーダルで非ガウス状態に対して堅牢であり、量子科学に不可欠な状態の特徴付けに特に適している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:19:58 GMT)
Exploring the Evidence-Based SE Beliefs of Generative AI Tools [2.3] 実験ソフトウェア工学(SE)による5つの生成AIツールを対象とした17のエビデンスに基づくクレームを調査する。
我々の研究結果は、生成型AIツールは、研究の主張に関して曖昧な信念を持ち、回答を支援するための信頼できる証拠が欠如していることを示しています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:39:15 GMT)
Pretraining on the Test Set Is No Longer All You Need: A Debate-Driven Approach to QA Benchmarks [2.3] 本稿では、既存のQAデータセットを構造化された敵対的議論に変換する議論駆動評価パラダイムを提案する。
我々は,(1)QAタスクを議論に基づく評価に体系的に変換する評価パイプライン,(2)MMLU-Pro質問のサブセットにおけるパラダイムの有効性を示す公開ベンチマークの2つの主要な貢献を行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:56:30 GMT)
Introducing Fractional Classification Loss for Robust Learning with Noisy Labels [2.3] 適応的ロバスト損失であるフラクタル分類損失 (FCL) を導入し, トレーニング中, ラベルノイズに対するロバストさを自動的に校正する。
FCLは手動のハイパーパラメータチューニングを必要とせずに最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:20:52 GMT)
Explicit decoders using fixed-point amplitude amplification based on QSVT [2.3] 分離条件が満たされたときに量子情報を復元できる2つのデコーダを提供する。
これらは絡み合い支援と非付き合い設定の両方に適用できる。
ノイズの多いチャネルでは、デコーダを使用して、量子容量に任意に近い通信速度を達成できます。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:34:41 GMT)
Depth Jitter: Seeing through the Depth [2.3] Depth-Jitterは、自然深度の変化をシミュレートして一般化を改善する、新しい深度に基づく拡張手法である。
提案手法は, 合成深度摂動を生成するために, 奥行き変動閾値によって誘導される適応深度オフセットを適用した。
FathomNetとUTDAC 2020の2つのベンチマークデータセットでDepth-Jitterを評価した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:14:57 GMT)
Are Vision Foundation Models Ready for Out-of-the-Box Medical Image Registration? [2.2] 大規模な画像データセットで事前トレーニングされたファンデーションモデルは、最近ゼロショット画像登録の可能性を示している。
患者の解剖学的変化が著しいため,特に乳房MRIの登録は困難である。
ドメイン固有のトレーニングが登録にどのように影響するかを理解し、グローバルアライメントと微細構造精度の両方を改善する戦略を検討するためには、さらなる作業が必要である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:15:59 GMT)
DeepMDV: Global Spatial Matching for Multi-depot Vehicle Routing Problems [2.2] オンライン小売と電子商取引の急速な成長は、効果的かつ効率的な車両ルーティング問題(VRP)ソリューションを不可欠にしてきた。
需要の増加に対応するために、企業はより多くのデポを追加し、VRP問題をMulti-Depot VRPの複雑な最適化タスクに変更した。
本稿では,これらの相互依存に対処するMDVRPの解法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:27:26 GMT)
Improving Table Retrieval with Question Generation from Partial Tables [2.2] 本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:35:56 GMT)
SKATE, a Scalable Tournament Eval: Weaker LLMs differentiate between stronger ones using verifiable challenges [2.2] 大規模言語モデル(LLM)が互いに検証可能なタスクを生成することによって競合する新しい評価フレームワークであるSKATEを紹介する。
私たちのコアは、タスクセットとソルバの両方のモデルとしての評価をゲームとして扱うことです。
TrueSkillベースのランキングシステムを用いて、6つのLCMを評価し、(1)より弱いモデルでは、より強力なモデルを確実に識別し、スコア付けすることができ、(2)LSMベースのシステムは、自己参照の振る舞いを可能とし、自己の能力に合わせた質問を生成し、(3)SKATEは自動的に、きめ細かな表面を呈する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:16:40 GMT)
A Fuzzy Logic Prompting Framework for Large Language Models in Adaptive and Uncertain Tasks [2.2] 動的でユーザ中心のタスクにまたがる大規模言語モデル(LLM)のより安全で適応的な利用をサポートするモジュール型プロンプトフレームワークを導入する。
本手法は,ファジィな足場論理と適応規則を符号化した制御スキーマと,自然言語境界プロンプトを組み合わせる。
シミュレーションされたインテリジェントなチューター設定では、このフレームワークは、複数のモデル間の足場品質、適応性、命令的アライメントを改善し、標準のベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 23:50:48 GMT)
Quality over Quantity: An Effective Large-Scale Data Reduction Strategy Based on Pointwise V-Information [2.1] 我々は、ポイントワイドV情報(PVI)に基づく効果的なデータ削減戦略を提案する。
実験の結果、データの10%から30%が削除された場合、分類器の性能は0.0001%から0.76%の精度で維持されることがわかった。
我々は,これまで英語のデータセットに限られていたPVIフレームワークを,さまざまな自然言語処理(NLP)タスクやベースモデルに適用した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:00:37 GMT)
EVA-S2PLoR: Decentralized Secure 2-party Logistic Regression with A Subtly Hadamard Product Protocol (Full Version) [2.1] 本稿では, 効率的な, 検証可能な, 正確なセキュリティ2パーティロジスティック回帰フレームワーク(EVA-S2PLoR)を提案する。
下位にセキュアなハダマード製品プロトコルとその導出プロトコルを通じて正確な非線形機能を実現する。
浮動小数点数上の非同期フローと少数の固定通信ラウンドによって、高い効率と精度が保証される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:33:48 GMT)
Study of Robust Features in Formulating Guidance for Heuristic Algorithms for Solving the Vehicle Routing Problem [2.1] 車両問題ルーティング(VRP)は、多くの現実世界のアプリケーションにおいて、メタヒューリスティックアルゴリズムを用いて解決される複雑な最適化問題である。
近年の研究では、最適化における解の構造的特性として機械学習が利用できることが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:50:03 GMT)
Enhancing Software Vulnerability Detection Through Adaptive Test Input Generation Using Genetic Algorithm [2.0] 本研究では, 遺伝的アルゴリズムを用いた入力生成手法を提案する。
遺伝的演算子と適応学習を統合し、ソフトウェアの脆弱性検出を強化する。
結果は、より深くより複雑な脆弱性を検出する方法の能力を強調している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:03:22 GMT)
Can Diffusion Models Bridge the Domain Gap in Cardiac MR Imaging? [2.0] そこで本研究では,所定の基準に類似した人工心臓MR画像を生成するソースドメイン上で訓練された拡散モデルを提案する。
合成データは、空間的および構造的忠実性を維持し、ソースドメインと類似性を確保し、セグメンテーションマスクとの互換性を確保する。
ドメイン一般化、ドメイン不変セグメンテーションモデルは、合成ソースドメインデータに基づいて訓練され、ドメイン適応では、DMを用いてターゲットドメインデータをソースドメインへシフトする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:57:48 GMT)
Bench-2-CoP: Can We Trust Benchmarking for EU AI Compliance? [2.0] 現在のAI評価プラクティスは、確立されたベンチマークに大きく依存しています。
この研究は、この「ベンチマーク・規制ギャップ」を定量化する緊急の必要性に対処する。
評価のエコシステムは、その焦点の大部分を狭い行動規範に捧げています。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:16:34 GMT)
$Δ$-AttnMask: Attention-Guided Masked Hidden States for Efficient Data Selection and Augmentation [2.0] 視覚インストラクションファインタニング(VIF)は、訓練後の視覚言語モデル(VLM)において重要である
VIFはまた、共同で視覚とテキストの理解を可能にするためにマルチモーダルデータを必要とする。
$Delta$-AttnMaskは、モデルの隠れ状態の注意誘導マスキングを通じてサンプル品質を定量化する。
$Delta$-AttnMaskは20%のデータで最先端のパフォーマンスを実現し、トレーニングを5倍に加速し、全データセットベースラインを+10.1%の精度で上回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:25:30 GMT)
DamageCAT: A Deep Learning Transformer Framework for Typology-Based Post-Disaster Building Damage Categorization [2.0] 本稿では,類型分類による損傷評価を行うフレームワークであるDanceCATを紹介する。
筆者らは,(1)ハリケーン・アイダの衛星画像トリプレットを含むBD-TypoSATデータセットと,(2)事前および事後画像ペアを処理するための階層的U-Netトランスフォーマアーキテクチャを提案する。
本モデルでは,Hurricane Harvey,Florence,Michaelデータ間での遷移性を評価することで,0.737 IoUと0.846 F1スコアを達成した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:48:22 GMT)
LLM meets ML: Data-efficient Anomaly Detection on Unstable Logs [2.0] 不安定なログ(ULAD)の異常検出は、より現実的で、未検討の課題である。
現在のアプローチは主に機械学習(ML)モデルを採用しており、トレーニングには広範なラベル付きデータを必要とすることが多い。
我々は、アンサンブル学習を通じて、決定木、k-アネレスト隣人、フィードフォワードニューラルネットワークといったMLモデルを組み合わせた、ULADのための新しいハイブリッドアプローチであるFlexLogを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:25:24 GMT)
Enhancing Construction Site Analysis and Understanding with 3D Segmentation [2.0] 本稿では,2つの高度な3Dセグメンテーション手法であるSAMとMask3Dの屋外および屋内環境への応用を批判的に評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:57:39 GMT)
Layers at Similar Depths Generate Similar Activations Across LLM Architectures [1.9] 我々は24個のオープンウェイトLDMの異なる層での活性化によって誘導される近接関係について検討した。
1)モデル内のレイヤによって異なる傾向があり、2)モデルの対応するレイヤ間でほぼ共有されていることが分かりました。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:45:03 GMT)
Dirty Bits in Low-Earth Orbit: The Carbon Footprint of Launching Computers [1.9] 低地球軌道(LEO)衛星は通信や軌道内計算のためにますます提案されている。
本稿では,軌道上からの打ち上げから再突入までのライフサイクルエミッションに着目し,宇宙における計算の炭素フットプリントについて検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:14:20 GMT)
Implementation and topological characterization of Weyl exceptional rings in quantum-mechanical systems [1.9] ワイル例外環(WER)の最初の量子力学的実装を報告する。
多様体のサイズを縮めることによって引き起こされる位相遷移を実演する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:49:32 GMT)
Measuring Stereotype and Deviation Biases in Large Language Models [1.8] 大規模言語モデル(LLM)は多様なドメインに広く適用されており、その制限や潜在的なリスクに対する懸念を提起している。
本研究では, LLMが示す2種類のバイアス, ステレオタイプバイアスと偏差バイアスについて検討した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:03:57 GMT)
MS-IMAP -- A Multi-Scale Graph Embedding Approach for Interpretable Manifold Learning [1.8] 本稿では,スペクトルグラフウェーブレットに基づくマルチスケールグラフネットワークの埋め込みフレームワークを提案する。
提案した埋め込みの重要な利点は、埋め込みと入力特徴空間の対応性を確立する能力である。
下流タスクにおける複数の公開データセットに対するグラフ埋め込みフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:16:59 GMT)
End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation [1.8] 従来のアプローチでは、直接変換タスクとしてテキストからクエリをモデル化する。
大規模言語モデル(LLM)の最近の進歩は翻訳精度を大幅に改善した。
本稿では,ユーザの意図するデータベースを識別する3段階のエンドツーエンドテキスト・ツー・エンド・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:16:36 GMT)
A Systematic Literature Review of Retrieval-Augmented Generation: Techniques, Metrics, and Challenges [1.8] このRAG(Research-augmented Generation)に関する研究文献の体系的なレビューは、2020年から2025年にかけて発行された最も高度に引用された研究の焦点を絞った分析である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:37:14 GMT)
SQUID G.A.M.E.: Gamma, Atmospheric, and Mono-Energetic Neutron Effects on Quantum Devices [1.8] 超伝導体(SQUID)の放射発生に対する応答を解析する。
実験によると、SQUIDは2つの中性子場に敏感であり、1.25MeVのガンマ線は影響を受けていない。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:46:44 GMT)
Contemplative Artificial Intelligence [1.7] 我々は、AIシステムにレジリエントなWise World Modelを組み込むことができる4つの公理原理を示す。
第一にマインドフルネスは、創発的なサブゴールの自己監視と再調整を可能にする。
第二に、空の森は犬のゴールを固定し、厳格な事前を緩和する。
第三に、非二重性は敵の自己他の境界を解消する。
第4に、無制限のケアは、苦しみの普遍的な減少を動機づける。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:06:54 GMT)
Inequality in the Age of Pseudonymity [1.6] ジニ係数のような不平等対策は、政策決定を通知し動機づけするために用いられる。
デジタル時代においてよく見られる匿名設定における対策方法を分析する。
一部の俳優はプライバシーを守るためにそうするかもしれませんが、これは不平等の測定を不注意に妨げます。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:33:59 GMT)
SAR Strikes Back: A New Hope for RSVQA [1.6] リモートセンシング視覚質問回答(Remote Sensing Visual Question Answering、RSVQA)は、衛星画像から情報を抽出して自然言語で質問に答えるタスクである。
本稿では,SARに基づくRSVQAを実現するためのデータセットと,そのタスクのための2つのパイプラインを探索する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:09:52 GMT)
A Study of Gender Classification Techniques Based on Iris Images: A Deep Survey and Analysis [1.6] ジェンダーの分類は、監視と監視、企業プロファイリング、人間とコンピュータの相互作用など、様々な応用において魅力的なものである。
個人の身元は性別に関する情報から判断されることがあるが、これは柔らかい生体認証の一種である。
最も有名なものは、顔、指紋、ヤシ紋、DNA、耳、歩行、虹彩などの物理的特徴に基づいている。
本研究は,既存の性別分類手法の知識と分析を研究者に提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:18:06 GMT)
Semantic and Structural Analysis of Implicit Biases in Large Language Models: An Interpretable Approach [1.6] モデル出力に隠された社会的バイアスを特定するための解釈可能なバイアス検出手法を提案する。
この方法は、ネストされた意味表現と文脈的コントラスト機構を組み合わせる。
この評価は、バイアス検出精度、セマンティック一貫性、文脈感度など、いくつかの重要な指標に焦点を当てている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:21:10 GMT)
Scaling Personality Control in LLMs with Big Five Scaler Prompts [1.5] 制御可能なパーソナリティ特性を持つ大規模言語モデルを条件付けるための,プロンプトベースのフレームワークであるBig5-Scalerを提案する。
自然言語のプロンプトに数値特性値を埋め込むことで,学習を伴わずに微粒なパーソナリティ制御が可能となる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:11:05 GMT)
Comparative study of machine learning and statistical methods for automatic identification and quantification in γ-ray spectrometry [1.5] 種々のガンマスペクトル設定のシミュレーションデータセットを含むオープンソースベンチマークを提案する。
我々は、最先端のエンドツーエンド機械学習と、全スペクトルを用いた統計的アンミックスアプローチを比較した。
統計的アプローチは、すべての比較指標に対して、3つのシナリオすべてで機械学習アプローチを一貫して上回る。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:26:32 GMT)
Quantum Benchmarking of High-Fidelity Noise-Biased Operations on a Detuned-Kerr-Cat Qubit [1.5] 我々は、スケーラブルなノイズバイアス量子ビット(detuned Kerr-cat qubit)のための量子制御ツールボックスを開発した。
ゲートセットトモグラフィーと二面ランダム化ベンチマークを用いて,これらの動作の雑音構造を系統的に解析する。
以上の結果から,ビットフリップ時間と位相フリップ時間のみから推定される動作騒音バイアスの重大な過大評価が得られた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:32:18 GMT)
Diagonalizing large-scale quantum many-body Hamiltonians using variational quantum circuit and tensor network [1.5] TNVDは量子多体ハミルトニアンの全アイジネギースペクトルを行列積状態に符号化する。
N=100$スピンまでの数値ベンチマークが提供され、EDの計算限界をはるかに超えている。
我々の研究は、TNVDを大規模量子多体ハミルトニアンに対する強力でスケーラブルな対角化アプローチとして確立している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:29:17 GMT)
LLMDistill4Ads: Using Cross-Encoders to Distill from LLM Signals for Advertiser Keyphrase Recommendations at eBay [1.5] 本研究では,クリックデータから埋め込みベース検索モデル(EBR)をデバイアスするLLM-judgeを用いた新しい2段階LLM蒸留プロセスを提案する。
クロスエンコーダアシスタントを介してLLM教師からマルチタスクトレーニングアプローチを用いてバイエンコーダの学生に蒸留し、最終的には学生バイエンコーダを用いて関連する広告主キーフレーズを検索する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:55:01 GMT)
An Interpretable Multi-Plane Fusion Framework With Kolmogorov-Arnold Network Guided Attention Enhancement for Alzheimer's Disease Diagnosis [1.3] アルツハイマー病(英語: Alzheimer's disease、AD)は、認知機能や生活の質を著しく損なう進行性神経変性疾患である。
これらの制限を克服するために,多面体融合(MPF)を統合したMPF-KANSCという革新的なフレームワークを提案する。
ADNIデータセットの実験により、提案したMPF-KANSCがAD診断において優れた性能を発揮することが確認された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:26:49 GMT)
Aspheric lens design proposal for near-perfect mode-matching of a broadband quantum dot micropillar to a single-mode fibre [1.3] また, 非球状SiO2マイクロレンズは, モードマッチング損失を SMF の83.1% から0.1(0.1)% まで低減できることを示した。
これにより、96.4(0.1)%のエンドツーエンド効率を持つ単一の光子ソース設計が可能となり、スケーラブルなフォトニック量子技術への道を開くことができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:06:42 GMT)
Soft Dice Confidence: A Near-Optimal Confidence Estimator for Selective Prediction in Semantic Segmentation [1.3] 本稿では,画像全体の信頼度を1つに見積もるイメージレベルの棄損に焦点をあてて,この問題に対処する。
画像サイズを推定する最適な信頼度推定器を導出する。
次に、線形時間で計算可能な近似であるSoft Dice Confidence (SDC)を提案し、最適推定器に密接なバインドがあることを証明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:12:04 GMT)
DSConv: Dynamic Splitting Convolution for Pansharpening [1.3] 本稿では,コンボリューションカーネルを注意とともに動的に分割し,興味のある位置を選択し,元のコンボリューションカーネルを複数の小さなカーネルに分割するDSConvを提案する。
提案したDSConvは、より効果的に受容領域内の異なる位置の特徴を抽出し、ネットワークの一般化、最適化、特徴表現能力を向上する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:09:56 GMT)
Street View Sociability: Interpretable Analysis of Urban Social Behavior Across 15 Cities [1.3] マルチモーダル大言語モデルを用いて15都市の2,998のストリートビュー画像を解析した。
結果は長年の都市計画理論と一致している。
さらなる研究により、ストリートビューのイメージは、都市社会性を研究するためのスケーラブルでプライバシー保護ツールとして確立される可能性がある。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:15:58 GMT)
Single photon emission from lithographically-positioned engineered nanodiamonds for cryogenic applications [1.2] ナノダイヤモンド(ND)中の窒素空孔中心は、量子フォトニクスシステムに有望な資源を提供する。
ブロードバンド金属リフレクタ上にボールミネラルに富んだNDを光リソグラフィで位置決めするハイブリッド材料プラットフォームを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:11:41 GMT)
MMFformer: Multimodal Fusion Transformer Network for Depression Detection [1.2] うつ病は深刻な精神疾患であり、個人の健康と生活の質に大きな影響を及ぼす。
本稿では,マルチモーダルソーシャルメディア情報から時空間高レベルパターンを抽出するためのマルチモーダル検出ネットワークを提案する。
提案するネットワークは,2つの大規模うつ病検出データセットに基づいて評価される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:03:29 GMT)
Neural Contextual Reinforcement Framework for Logical Structure Language Generation [1.1] このフレームワークはカスタム報酬関数と動的コンテキストアライメント機構を統合している。
論理構造やセマンティックフローに対する人間の期待と密接に一致した出力を生成する。
さまざまなモデルサイズにわたるノイズの多い入力データとスケーラビリティを扱う上で、堅牢性を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:03:41 GMT)
MOR-VIT: Efficient Vision Transformer with Mixture-of-Recursions [1.0] MoR-ViTはトークンレベルの動的再帰機構を組み込んだ新しいビジョントランスフォーマーフレームワークである。
ImageNet-1Kと転送ベンチマークの実験は、MoR-ViTが最大70%のパラメータ還元と2.5倍の推論加速で最先端の精度を達成することを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:24:02 GMT)
Decompositional Reasoning for Graph Retrieval with Large Language Models [1.0] 大規模言語モデル(LLM)は多くのNLPタスクに優れるが、マルチホップ推論と現実の一貫性に苦しむ。
本稿では,テキスト知識グラフをクエリ分解によるLLM推論プロセスに統合する新しい検索手法を提案する。
本手法は,複雑な質問をサブクエストに分解し,関連するテキストのサブグラフを検索し,質問固有の知識グラフを作成して回答生成を誘導する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:26:47 GMT)
Few-Shot Prompting for Extractive Quranic QA with Instruction-Tuned LLMs [1.0] 複雑な言語、独特な用語、そしてテキストにおける深い意味に関する課題に対処する。
2つ目は、GeminiやDeepSeekのような命令調整された大きな言語モデルで、ほとんどショットプロンプトを使用しない。
スパン抽出のための特殊アラビアプロンプトフレームワークが開発されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:02:59 GMT)
The Dual Role of Low-Weight Pauli Propagation: A Flawed Simulator but a Powerful Initializer for Variational Quantum Algorithms [1.0] 変分量子アルゴリズム(VQA)は、パラメータ化量子回路をチューニングするために古典的な事前最適化器に依存する。
本稿では,VQA回路をシミュレーションするための古典的手法として,LWPPアルゴリズムについて検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:44:00 GMT)
An information-matching approach to optimal experimental design and active learning [0.9] 候補プールから最も情報に富むトレーニングデータを選択するために,フィッシャー情報行列に基づく情報マッチング基準を導入する。
本稿では,電力系統や水中音響など,様々な科学分野におけるモデリング問題に対するこのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:50:35 GMT)
Nondegenerate Josephson Mixers with Enhanced Bandwidth and Saturation Power for Quantum Signal Amplification and Transduction [0.9] 2つの異なる伝送線路共振器をジョセフソン環変調器(JRM)に結合して形成される非退化ジョセフソンミキサー(JMs)
JMは、量子信号の位相保存増幅を行い、2モード圧縮状態を生成し、ノイズのない周波数変換を行う。
帯域幅と飽和電力が限られているため、そのような共振器ベースのJMは一般に周波数多重信号の同時処理ができない。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:33:53 GMT)
EICAP: Deep Dive in Assessment and Enhancement of Large Language Models in Emotional Intelligence through Multi-Turn Conversations [0.9] 我々は,大規模言語モデル(LLM)に適した,統合的,心理的に基礎付けられた情緒的知能の4層分類法(EI)を導入する。
EICAP-BenchはオープンソースのLLMにおけるEI能力を評価するために設計された,新しいマルチターンベンチマークである。
統計的解析の結果,5つのEI層のうち,評価層のみがUCベースファインチューニングによる顕著な改善を示すことが明らかとなった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:22:19 GMT)
Optimal sampling for least-squares approximation [0.9] ランダムサンプルから(重み付けされた)最小二乗近似の解析において、クリスティーフェル関数を重要な量として導入する。
ほぼ最適なサンプル複雑性を持つランダムサンプリング戦略を構築するためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:34:08 GMT)
Matrix-Driven Instant Review: Confident Detection and Reconstruction of LLM Plagiarism on PC [0.9] 大きな言語モデル(LLM)のプラジャアライズは、オリジナルの開発者にとって大きな経済的、評判の害をもたらす可能性がある。
本研究では,大規模言語モデルにおける盗作検出手法であるMDIR(Matrix-Driven Instant Review)を提案する。
MDIRは、重み関係の正確な再構築を実現し、厳密な$p$値の推定を提供し、完全なモデル推論を必要とせず、重量類似性にのみ焦点をあてる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:35:40 GMT)
Zero-shot self-supervised learning of single breath-hold magnetic resonance cholangiopancreatography (MRCP) reconstruction [0.8] 磁気共鳴胆管膵管造影(MRCP)における呼吸保持時間短縮のためのゼロショット自己教師型学習再建の有用性について検討した。
ゼロショット学習再建は、圧縮されたセンシング再構成と比較して視覚的画質を著しく改善した。
浅部訓練は、従来のゼロショット訓練では271分に比べ、ほぼ同程度の再現時間で訓練時間11分であった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:59:20 GMT)
Machines Learn Number Fields, But How? The Case of Galois Groups [0.8] ガロア拡大のガロア群が次数 4, 6, 8, 9, 10 の$mathbbQ$ でどのように分類できるかを研究する。
機械学習の結果の解釈により、ゼータ係数の分布がガロア群に依存するかを理解することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:32:11 GMT)
Reducibility among NP-Hard graph problems and boundary classes [0.8] 多くのNPハードグラフ問題はグラフのクラスでは容易になる。
問題が残る最小限のサブ構造は何か。
このような問題の研究には境界クラスの概念を用いる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:11:59 GMT)
LinguaFluid: Language Guided Fluid Control via Semantic Rewards in Reinforcement Learning [0.8] 本研究では,現在状態と目標意味的指示とを一致させて報酬を計算できる意味的整合強化学習手法を提案する。
我々は,手作りの報酬関数がなくても,意味報酬は学習を指導して,競争力のある制御動作を実現することができることを示した。
このフレームワークは、エージェントの振る舞いを自然言語の目標と整合させるための新たな地平を開き、より大きな言語モデルのよりシームレスな統合の基礎となる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:23:56 GMT)
Early Detection of Pancreatic Cancer Using Multimodal Learning on Electronic Health Record [0.8] 膵管腺癌(PDAC)は最も致命的ながんの1つである。
早期発見は依然として大きな臨床課題である。
約4,700人の患者を対象とした実世界のデータセットの開発と評価を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:18:15 GMT)
Conditional Diffusion Models are Medical Image Classifiers that Provide Explainability and Uncertainty for Free [0.8] 本研究は,2次元医用画像分類のためのクラス条件拡散モデルの可能性を初めて探求するものである。
そこで我々は,医療拡散分類器の性能向上を図るために,新しい多数決方式を開発した。
CheXpertとISICのメラノーマ皮膚がんデータセットの実験は、基礎と訓練されたスクラッチ拡散モデルが競争力を発揮することを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:49:48 GMT)
Performance of Practical Quantum Oblivious Key Distribution [0.8] 本稿では,ランダム化量子オブリバスト転送の実用的な実現法を提案する。
このプロトコルは、識別不能なセキュリティの概念の下で安全であることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:07:26 GMT)
Mitigating Think-Answer Mismatch in LLM Reasoning Through Noise-Aware Advantage Reweighting [0.7] Group-Relative Policy Optimization (GRPO) は、大規模な推論モデルをトレーニングするための重要なテクニックである。
emphThink-Answer Mismatchというノイズの多い報奨信号が学習プロセスを損なうという致命的な脆弱性に悩まされている。
S-GRPO(Stable Group-Relative Policy Optimization, S-GRPO)を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:24:06 GMT)
Photon catalysis for general multimode multi-photon quantum state preparation [0.7] 多モード多光子状態は多くのフォトニック量子技術の中心にある。
我々は、マルチポート干渉計のみを用いて、正確にかつ制御された数ステップで、そのような状態を発生させる手順を導出する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:42:39 GMT)
Maximum Impact with Fewer Features: Efficient Feature Selection for Cold-Start Recommenders through Collaborative Importance Weighting [0.7] ユーザの行動情報を優先する特徴選択戦略を提案する。
本手法は協調行動データから相関関係を組み込むことにより特徴表現を向上させる。
このアプローチは最も影響力のある特徴を特定し、推奨精度と計算効率のバランスを崩す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:58:47 GMT)
Personalized Constitutionally-Aligned Agentic Superego: Secure AI Behavior Aligned to Diverse Human Values [0.7] スーパーエージェントがユーザー選択型「クリードコンスティチューション」を参考にAIプランニングを主導
リアルタイムコンプライアンス執行機関は、これらの憲法に対する計画を検証する。
システムは最大98.3%の有害スコアの減少とほぼ完全な拒絶率を達成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:29:52 GMT)
An ML-based Approach to Predicting Software Change Dependencies: Insights from an Empirical Study on OpenStack [0.7] 現代のソフトウェアシステムでは、依存関係はチーム間で複数のコンポーネントにまたがり、開発とデプロイメントの課題を生み出します。
2つのMLモデルを利用する半自動アプローチを提案する。
提案モデルでは,平均AUCスコアは79.33%,91.89%,Brierスコアは0.11,0.014であった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:37:25 GMT)
Two-stage deep learning framework for the restoration of incomplete-ring PET images [0.6] 約50%の偶然を欠いたデータから高品質な画像を復元する2段階のディープラーニングフレームワークを提案する。
また, 推論速度も向上し, 不完全リングPET画像の有効解が得られた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:02:39 GMT)
Emoji Reactions on Telegram Often Reflect Social Approval Over Emotional Resonance [0.6] 我々は、少なくとも1つの絵文字反応を受けた650万以上のTelegramメッセージを分析した。
メッセージの感情と反応の感情の間には系統的なミスマッチがあり、メッセージが中立でもネガティブでも肯定的な反応が支配的である。
我々はより大きな絵文字のエンゲージメントを予測するコミュニケーション戦略に光を当てた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:24:04 GMT)
Quantum Optimization on Rydberg Atom Arrays with Arbitrary Connectivity: Gadgets Limitations and a Heuristic Approach [0.5] 任意のグラフから単位ディスクインスタンスへの還元の複雑性-理論的限界について論じる。
このような減少は幾何数で爆発的に起こり、解近似の保証を低下させる。
現実的な代替手段として,プリド原子配置を利用する線形オーバーヘッドのみを持つ分割・分散器を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:50:29 GMT)
Grand Unification of All Discrete Wigner Functions on $d \times d$ Phase Space [0.5] ウィグナー関数は量子状態と力学を可視化し、量子情報の定量的解析をサポートする。
単一の$d$次元量子システムに対して、可能な$dtimes d$離散ウィグナー関数を全て排気するステンシルベースのフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:29:26 GMT)
Omni Geometry Representation Learning vs Large Language Models for Geospatial Entity Resolution [0.5] オームニ幾何学エンコーダを備えた地理空間ERモデル。
モデルは、既存のポイントオンリーのデータセットと、新しい多様な地理空間的ERデータセットで厳格にテストされている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:37:11 GMT)
Viewing protected superconducting qubits through the lens of the cat qubit [0.5] 保護された超伝導量子ビットとボソニック量子ビットの類似性は、フラクソニウムハミルトニアンをフォックベースで研究することによって得る。
猫量子にインスパイアされたバイアス保存の$X$と$$$qubitsについて説明する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:11:56 GMT)
Towards Integrated Alignment [0.5] 本稿では,AIアライメント分野の将来に向けた統合ビジョンを提案する。
戦略的な多様性、すなわちアライメントの展開とミスアライメント検出アプローチの重要性を強調します。
我々は、AIアライメント研究分野自体のさらなる統合のためのステップを推奨する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:16:56 GMT)
Do Biased Models Have Biased Thoughts? [0.5] 本稿では,モデルが応答する前のステップが公正性に与える影響について考察する。
質問に答えるために、フェアネスメトリクスを使用して5ドルのポピュラーな大言語モデルで実験を行い、モデルの思考と出力における11ドルの異なるバイアスを定量化します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:41:20 GMT)
Noise-robust proofs of quantum network nonlocality [0.4] トライアングルネットワーク上の量子分布のクラスに対して、ネットワーク量子非局所性のノイズロバストな証明を示す。
我々の研究は、量子ネットワーク非局所性の実践的な実装に向けた興味深い視点を開いている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:11:53 GMT)
The Fourth State: Signed-Zero Ternary for Stable LLM Quantization (and More) [0.4] 量子化は通常、計算要求を減らすために性能の質を交換する手段とみなされる。
本稿では2ビット量子化方式であるSigned-Zero Ternary(SZT)を導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:01:29 GMT)
Near-Heisenberg-limited parallel amplitude estimation with logarithmic depth circuit [0.4] 本稿では,並列化振幅推定(PAE)アルゴリズムを提案する。このアルゴリズムは,クエリの総数と回路深さのサブ線形スケーリングを同時に実現している。
提案アルゴリズムは,デバイス実装に適した分散量子コンピューティングの形式を有する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:38:14 GMT)
Improving the Developer Experience with a Low-Code Process Modelling Language [0.4] OutSystems Platformは、複数のDSLで構成される開発環境である。
ビジネスプロセス技術(BPT)は採用率が低く、導入を妨げるユーザビリティの問題があると考えられている。
我々はBPTの新バージョンを開発し、これらのインプットとOutsystemsのエンジニアの文化を考慮に入れた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:20:18 GMT)
LV-Net: Anatomy-aware lateral ventricle shape modeling with a case study on Alzheimer's disease, the Australian Imaging Biomarkers and Lifestyle flagship study of ageing [0.3] 我々は,脳MRIから3次元LVメッシュを生成するための新しいフレームワークであるLV-Netを紹介した。
セグメンテーションの不完全性が存在する場合でも,LV-Netはより優れた再構成精度が得られることを示す。
LV-Netをアルツハイマー病解析に適用し,LVサブリージョンの同定を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:25:18 GMT)
Crisp Attention: Regularizing Transformers via Structured Sparsity [0.3] SST-2感情分析タスクの微調整中に、DistilBERTモデルの注意機構に構造的、保温後間隔を導入する。
80%の注意間隔を持つモデルでは,高密度ベースラインに対する0.97%の絶対改善である91.59%の検証精度が得られた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:04:28 GMT)
Large Language Models for Oral History Understanding with Text Classification and Sentiment Analysis [0.3] 本稿では,日本人投獄口頭史における意味的・感情的アノテーションの自動化を目的とした,スケーラブルなフレームワークを提案する。
LLMを用いて、高品質なデータセットを構築し、複数のモデルを評価し、プロンプトエンジニアリング戦略をテストする。
感情分析では、ラマはQwen(82.66%)とChatGPT(82.29%)をわずかに上回り、全てのモデルで同等の結果を示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:06:23 GMT)
Fate of an impurity strongly interacting with a thermal Bose gas [0.1] 均一なボゾン浴(ボックストラッピングボースガス)に浸漬した移動不純物について検討した。
強い不純物-バス相互作用では、スペクトルは温度の上昇とともに狭くなり、不純物エネルギーシフトは抑制される。
凝縮の臨界温度付近では、多体効果が依然として重要な役割を担い、非退化浴の場合のみ、システムは古典的なボルツマンガスの挙動に近づく。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:59:50 GMT)
T-REX: Table -- Refute or Entail eXplainer [0.1] T-REX (T-REX: Table -- Refute or Entail eXplainer) は、マルチモーダルな多言語テーブル上でクレーム検証を行う最初のインタラクティブなツールである。
正確性と透明性のために設計されたT-REXは、高度なファクトチェック技術へのアクセスを提供することで、非専門家に権限を与える。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:00:36 GMT)
Quantum Algorithm for Estimating Intrinsic Geometry [0.1] 点雲の固有幾何を推定するための量子アルゴリズムを提案する。
これらの量は次元減少、特徴抽出、異常検出に不可欠である。
我々の研究は、幾何学的データ解析における効率的な量子応用に向けての新たな一歩である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:36:59 GMT)
AGI for the Earth, the path, possibilities and how to evaluate intelligence of models that work with Earth Observation Data? [0.1] 地球観測データがインテリジェントモデルに有用である理由を論じ、既存のベンチマークをレビューし、それらの制限を強調します。
本稿では、地球観測モデルを評価するためのより包括的なベンチマークの必要性を強調する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:28:58 GMT)
Data-Driven Density Steering via the Gromov-Wasserstein Optimal Transport Distance [0.1] 我々はGromov-Wasserstein 計量を用いて,データ駆動型確率密度ステアリング問題に取り組む。
結果は、様々なデータ駆動型スキームを通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:21:21 GMT)
From research to clinic: Accelerating the translation of clinical decision support systems by making synthetic data interoperable [0.1] 我々は,CDSSツールの開発とテストがより容易になるよう,EHRシステムで合成データを使用するアーキテクチャを提案する。
ノルウェーの患者登録所のデータを用いて、機械学習ベースのCDSSツールの動作実証を開発した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:07:29 GMT)
XAG-Net: A Cross-Slice Attention and Skip Gating Network for 2.5D Femur MRI Segmentation [0.0] XAG-Netは、ピクセルワイド・クロススライス・アテンション(CSA)とアテンション・ゲーティング(AG)機構を組み込んだ2.5D U-Netベースの新しいアーキテクチャである。
XAG-Netは2D, 2.5D, 3D U-Netモデルを計算効率を保ちながら大腿骨セグメンテーションの精度で上回っている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:25:52 GMT)
Variational volume reconstruction with the Deep Ritz Method [0.0] 本稿では,Deep Ritz法を用いて,スパース,ノイズの多いスライスデータから変量再構成を行う新しい手法を提案する。
本研究では,スライスデータが希薄でノイズの多い場合であっても,高品質な再構成ボリュームを数秒で確実に生成できることを実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:20:39 GMT)
Variational Tensor Network Simulation of Gaussian Boson Sampling and Beyond [0.0] 一般連続変数サンプリング問題に対する古典的シミュレーションツールを提案する。
我々はサンプリング問題を、単純な少数体ハミルトンの基底状態を見つけるための問題として再定式化する。
我々はガウスボソンサンプリングをシミュレートして手法を検証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:13:23 GMT)
Valley Splitting Correlations Across a Silicon Quantum Well [0.0] インテルが製造した1次元量子ドットアレイにおける谷分割のばらつきについて検討する。
本研究は,スケーラブルデバイス設計に必要なSi/SiGeヘテロ構造をメソスコピックで理解する手法を開発した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:13:06 GMT)
Unveiling Zero-Space Detection: A Novel Framework for Autonomous Ransomware Identification in High-Velocity Environments [0.0] 提案したZero-Space Detectionフレームワークは、教師なしクラスタリングと高度なディープラーニング技術により、潜時行動パターンを識別する。
高速度環境では多相フィルタリングとアンサンブル学習を統合して効率的な意思決定を行う。
実験的評価では、LockBit、Conti、Revil、BlackMatterなど、さまざまなランサムウェアファミリー間で高い検出率を示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:04:28 GMT)
Tree-Based Deep Learning for Ranking Symbolic Integration Algorithms [0.0] 木に基づくディープラーニングモデルを用いた機械学習(ML)アプローチを2段階アーキテクチャで提案する。
木構造として表現された数学的表現は,性能を著しく向上させる。
我々のモデルは70,000のサンプルホールトアウトテストセット上で最適な方法を選択する際に90%近い精度を達成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:13:39 GMT)
Transformer-Based Explainable Deep Learning for Breast Cancer Detection in Mammography: The MammoFormer Framework [0.0] MammoFormerフレームワークは、マルチ機能拡張コンポーネントとXAI機能を備えたトランスフォーマーベースのアーキテクチャを統一する。
CNN、Vision Transformer、Swin Transformer、ConvNextの7つの異なるアーキテクチャがテストされた。
MammoFormerフレームワークは、AIマンモグラフィシステムの臨床的採用障壁に対処する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:59:54 GMT)
Training 3D ResNets to Extract BSM Physics Parameters from Simulated Data [0.0] 角と運動の分布を擬似イメージに変換する新しいデータ表現を提案する。
概念実証として、34層の残留ニューラルネットワークをトレーニングし、これらの画像を回帰させ、Wilson Coefficient $C_9$ in Monte Carlo Simulations of $B0 rightarrow K*0mu+mu-$ decays(英語版)のWilson Coefficient $C_9$に関する情報を決定する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:48:36 GMT)
The loss tolerance of cat breeding for fault-tolerant grid state generation [0.0] 猫の繁殖プロトコルは、Gottesman-Kitaev-Preskill状態を決定論的に生成することができる。
光損失がプロトコルの全体的な成功確率を減少させることを示す。
また,光損失が4%を超えると,耐故障性GKP状態の調製が禁止されることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:15:31 GMT)
The Problem of Atypicality in LLM-Powered Psychiatry [0.0] 大規模言語モデル(LLM)は、世界的なメンタルヘルス危機に対するスケーラブルな解決策として、ますます提案されている。
彼らの精神医学的文脈への展開は、顕著な倫理的関心、すなわち非定型性の問題を引き起こす。
我々は、この構造的リスクを解決するには、迅速なエンジニアリングや微調整のような標準緩和戦略が不十分であると主張している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:36:42 GMT)
The Ensemble Kalman Update is an Empirical Matheron Update [0.0] Ensemble Kalman Filter (EnKF) は高次元システムにおけるデータ同化法として広く用いられている。
本稿は、この単純だが未公開な接続をコンパクトに紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:16:01 GMT)
The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks [0.0] 低レベル設計決定がトークンレベルXLTに与える影響について検討する。
最適化された選択により、XLT with WAは少なくともマーカーベースのメソッドに匹敵するパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:54:24 GMT)
Testing the Limits of Machine Translation from One Book [0.0] 現在の最先端モデルは、コンテキスト内学習を活用して、以前は目に見えない言語コンテキストに変換する能力を示している。
話者数が多いにも関わらず、最小限のデジタルリソースを持つ言語であるKanuriに焦点を当てる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:27:44 GMT)
Symmetry Packaging II: A Group-Theoretic Framework for Packaging Under Finite, Compact, Higher-Form, and Hybrid Symmetries [0.0] 各種コンクリート対称性の対称性パッケージングを記述するための群理論フレームワークを開発した。
ベル型パッケージ型絡み合い状態、色閉じ込め、ハイブリッドゲージ不変構成がすべて自然に起こることを示す。
我々のアプローチは、群論、ゲージ理論、トポロジカルな分類からツールを統一する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:00:07 GMT)
Supercoherence: Harnessing Long-Range Interactions to Preserve Collective Coherence in Disordered Systems [0.0] いくつかの長距離相互作用を導入することで、デコヒーレンスを緩和できることを示す。
超コヒーレンス(英語版)はコヒーレンスだけでなく、状態の他の全ての量子的性質を安定化させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:40:20 GMT)
Structured Convergence in Large Language Model Representations via Hierarchical Latent Space Folding [0.0] 高次元潜在空間におけるトークン表現は、しばしば冗長性を示し、計算効率を制限し、モデル層全体の構造的コヒーレンスを低減する。
本稿では,学習した埋め込みにおいて,マルチスケールの組織を強制する構造的変換機構を提案する。
経験的評価は、層間の表現分散の減少を示し、より安定したパープレキシティ分布に寄与し、テキスト生成における予測信頼性を高める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:06:51 GMT)
Structural Reformation of Large Language Model Neuron Encapsulation for Divergent Information Aggregation [0.0] 構造化ニューロンカプセル化(Structured Neuron encapsulation)は、情報のより効果的な集約と特殊化を可能にするモジュラーフレームワークを導入する。
このフレームワークによって修正されたモデルでは、パープレキシティスコアの改善、語彙の変動性の向上、論理的推論における一貫性の向上が示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:03:08 GMT)
Structural Perturbation in Large Language Model Representations through Recursive Symbolic Regeneration [0.0] シンボリック摂動は、モデルパラメータを直接修正することなく、神経表現に影響を与える新しいアプローチを提供する。
シンボル構造の再生は、潜伏埋め込みにおける構造変化を導入し、注意力学における制御的なシフトをもたらす。
注目重量分布の変化は、トークン依存の調整、応答の可変性への影響、長文生成の精細化における象徴的な修正の役割を強調している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:02:40 GMT)
Structural Embedding Projection for Contextual Large Language Model Inference [0.0] 構造化埋め込み変換は、言語モデル推論の効率性と一貫性を高めるための有望なアプローチを提供する。
構造埋め込み射影 (Structure Embedding Projection, SEP) の数学的定式化により、埋め込み空間は構造化された文脈関係を捉えることができる。
語彙の多様性に対するSEPの影響は、埋め込み修飾がモデルの語彙使用に影響を与えることを示唆している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:07:50 GMT)
Statistical Coherence Alignment for Large Language Model Representation Learning Through Tensor Field Convergence [0.0] 表現学習は、言語の統計的特性を捉えるために、内部埋め込みを構築する上で中心的な役割を果たす。
コヒーレンスアライメントはテンソル場収束を通じて構造化トークン表現を強制する手法として導入された。
経験的評価は、コヒーレンス制約の適用によりパープレキシティが向上し、分類精度が向上し、稀な単語の埋め込みが洗練されることを示している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:08:05 GMT)
State-adaptive quantum error correction and fault-tolerant quantum computing [0.0] 状態適応型量子誤り訂正(SAQEC)の理論的枠組みを提案する。
量子状態の知識を誤り訂正プロセスに組み込むことで、コヒーレントな情報ではなく、量子相互情報によって支配される新しいキャパシティ体制を確立する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:51:13 GMT)
Stabilizing Federated Learning under Extreme Heterogeneity with HeteRo-Select [0.0] Federated Learning(FL)は、クライアントデータの多様な性質のために、しばしばトレーニングの不安定さに悩まされる機械学習技術である。
本稿では,ハイパフォーマンスの維持と長期トレーニングの安定性確保を目的とした理論的HeteRo-Selectフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:33:34 GMT)
Simulating lattice fermion doubling with a Floquet drive [0.0] 最近発見された格子フェルミオンのスペクトルと周期的に駆動される量子系のスペクトルとの数学的対応を考察する。
私たちはそれを2つのシステム間の赤外線同値にします。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:23:06 GMT)
Shortcuts to adiabaticity with a quantum control field [0.0] 非断熱遷移は自律量子力学によって抑制できると主張する。
これは制御場の量子的性質が断熱性へのショートカットを実装するための鍵となる制御の素例である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:29:59 GMT)
Segmented Confidence Sequences and Multi-Scale Adaptive Confidence Segments for Anomaly Detection in Nonstationary Time Series [0.0] 我々は、SCS(Segmented Confidence Sequences)とMACS(Multi-Scale Adaptive Confidence Segments)の2つの新しい適応しきい値フレームワークを紹介し、実証的に評価する。
Wefer Manufacturingのベンチマークデータセットによる実験では、従来のパーセンタイルやローリング量子化アプローチと比較して、F1スコアの大幅な改善が見られた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:34:54 GMT)
ScamAgents: How AI Agents Can Simulate Human-Level Scam Calls [0.0] ScamAgentは、Large Language Models (LLMs)上に構築された自律マルチターンエージェントである。
我々は,ScamAgentが対話記憶を維持し,ユーザ応答のシミュレーションに動的に適応し,会話のターンにまたがる知覚的説得戦略を採用することを示す。
本研究は,多ターン型安全監査,エージェントレベル制御フレームワーク,および生成型AIによる会話の騙しを検知し,阻止する新たな手法の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:01:41 GMT)
Scaling Success: A Systematic Review of Peer Grading Strategies for Accuracy, Efficiency, and Learning in Contemporary Education [0.0] 本稿では、40年以上にわたるピアグレーディングに関する122のピアレビュー研究を体系的にレビューする。
本稿では,評価アプローチとレビュアー重み付け戦略という2つの重要な側面に沿って,ピアグレーディングシステムを編成する包括的分類法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:22:06 GMT)
Scalable Quantum State Preparation for Encoding Genomic Data with Matrix Product States [0.0] 本研究では,MPS(Matrix Product State)形式を用いてゲノムデータをエンコードするスケーラブルな量子回路の製作法を提案する。
この方法は、バクテリオファージ$Phi X174$のゲノムを15キュービットの状態に符号化し、MPS結合寸法、再構成誤差、および結果として生じる回路複雑性の間のトレードオフを分析することで示される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:02:53 GMT)
Scalable Differentially Private Sketches under Continual Observation [0.0] 線形スケッチは、データストリーム分析の基本的なツールである。
Lazy Sketchは遅延アップデートを採用し、各ステップでスケッチのごく一部だけを変更している。
実験により,本手法は前処理のスループットを最大250倍に向上することが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:06:17 GMT)
SMOGAN: Synthetic Minority Oversampling with GAN Refinement for Imbalanced Regression [0.0] 不均衡回帰とは、ターゲット変数が歪んだ予測タスクを指す。
この歪みは、高密度領域に集中する機械学習モデル、特にニューラルネットワークを妨げる。
不均衡回帰のための2段階オーバーサンプリングフレームワークであるSMOGANを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 01:49:27 GMT)
Role of Large Language Models and Retrieval-Augmented Generation for Accelerating Crystalline Material Discovery: A Systematic Review [0.0] 大規模言語モデル(LLM)は、ドメイン間の知識集約的なタスクのための強力なツールとして登場した。
Retrieval-augmented Generation(RAG)は、研究者が物質構造を予測する方法に革命をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:32:56 GMT)
Retrieval Augmented Large Language Model System for Comprehensive Drug Contraindications [0.0] 大規模言語モデル(LLM)の汎用性は、様々な分野にわたって検討されてきたが、医療への応用には課題がある。
本研究では,レトリーバル拡張生成(RAG)パイプラインを実装することにより,LLMの対位法に効果的に対応する能力を高める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:09:03 GMT)
Reservoir computing with large valid prediction time for the Lorenz system [0.0] 貯留層コンピュータ(RC)の有効予測時間(VPT)のハイパーパラメータ依存性について検討する。
慎重に選択された条件下では、RCはベンチマーク性能の約70%を達成できる。
我々は高VPT値(>30 Lyapunov times)を報告する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:07:36 GMT)
Refactoring-Aware Patch Integration Across Structurally Divergent Java Forks [0.0] 本稿では,14種類の派生型におけるパッチ統合障害に関する実証的研究を行い,RePatchを紹介した。
RePatchは、元々対称的なマージ用に設計されたRefMergeフレームワークを拡張し、非対称なパッチ転送をサポートする。
478のバグフィックスプルリクエストの評価では、構造的なミスアライメントのため、Git cherry-pickは64.4%のケースで失敗し、RePatchは、以前失敗したパッチの52.8%をうまく統合しました。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:34:05 GMT)
Reducing quantum resources for observable estimation with window-assisted coherent QPE [0.0] 本稿では,サブルーチンとして使用されるコヒーレントQPEのウィンドウ化により,アルゴリズム全体の精度が向上することを示す。
本研究では,ウィンドウアシスト型コヒーレントQPEをサブルーチンとして用いる観測可能量推定の量子タスクについて検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 20:00:19 GMT)
Quasi-stationary normal states for quantum Markov semigroups [0.0] 量子マルコフ半群の文脈で準定常状態(QSS)の概念を導入する。
直接的および間接的な量子測定の理論を用いたQSSの操作的解釈を提供する。
我々は、QSSと量子マルコフ半群のスペクトル特性の間に関係があることを証明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:28:39 GMT)
Quantum-impurity sensing of altermagnetic order [0.0] ダイヤモンド中の窒素空孔中心による量子緩和は、反磁性絶縁体の異方性スピンダイナミクスを明らかにすることができる。
スピン拡散応答における運動量空間異方性のシグネチャを符号化した量子不純物の距離および配向依存性緩和速度を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:33:41 GMT)
Quantum theory at the macroscopic scale [0.0] 我々は、マクロシステムの挙動が量子フォーマリズムのすべての側面を保持することができることを示した。
このマクロシステムに関する古典的な記述からの逸脱は、単に数学的ではなく概念的でもある。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:37:11 GMT)
Quantum Skyrmion Qudit in a Triangular-lattice magnet [0.0] フラストレーション磁石では、スカイミオンは量子情報を格納できるヘリカルな自由度によって特徴づけられる。
弱電場の極限では、この系は2レベル系、すなわちスカイミオン量子ビットとして記述できる。
我々は、系の状態が以前考えられていたようなスカイミオンキュービットではなく、スカイミオンキュービットであることを証明した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:06:10 GMT)
Quantum Dynamics and Information Measures in PT and Anti-PT-Symmetric Systems [0.0] 我々は、位相進化、デコヒーレンス、量子速度制限(QSL)、R'enyiエンタングルメントエントロピーに着目し、PTおよび反PT対称な非エルミートハミルトン多様体の下で量子ビットダイナミクスを研究する。
反PT対称系は、非コヒーレンスに対して強靭性を示し、エントロピー成長が遅く、PT対称系と比較してコヒーレンス時間も長い。
高次のR'enyiエントロピーは、反PT対称量子ビットが量子情報をより効率的に保存し、メモリや暗号アプリケーションに利点をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:20:48 GMT)
Quantum Annealing for the Set Splitting Problem [0.0] 本稿では,QUBO問題定式化を用いたセット分割問題の解法として,新しい量子アニール法を提案する。
この研究の貢献は、QUBOハミルトニアンの基底状態が入力部分集合を分割する有効な解に対応することを保証するペナルティ関数を定式化することにある。
提案した解の実証実験は, 繰り返し試行よりも高い精度で, 全球最適解への収束を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:55:30 GMT)
Privacy-Preserving Tabular Synthetic Data Generation Using TabularARGN [0.0] 本稿では,高品質な合成データを生成するニューラルネットワークアーキテクチャであるTabular Auto-Regressive Generative Network(TabularARGN)を紹介する。
離散化に基づく自己回帰手法を用いて、TabularARGNは計算効率を保ちながら高いデータ忠実性を達成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:57:23 GMT)
Pragmatics beyond humans: meaning, communication, and LLMs [0.0] 本論文は,言語が行動の道具として機能する動的インタフェースとして,プラグマティクスを再認識する。
論文は、この理解をさらに洗練し、方法論的に再考する必要があると主張している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:34:41 GMT)
PanelTR: Zero-Shot Table Reasoning Framework Through Multi-Agent Scientific Discussion [0.0] 構造化された科学的アプローチによる頑健なテーブル推論のためのフレームワークであるPanelTRを紹介する。
パネルTRのワークフローでは、エージェント科学者が個別の調査を行い、自己レビューを行い、ピアレビューの議論に参加する。
実験の結果、パネルTRはバニラLLMと競合する完全教師付きモデルより優れていた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:15:52 GMT)
PaPaformer: Language Model from Pre-trained Parallel Paths [0.0] 本稿では,デコーダのみのトランスフォーマーに基づく言語モデルを,日/週ではなく数時間で学習し,評価する方法について検討する。
我々は、デコーダのみのトランスフォーマーアーキテクチャの変種であるtextitPaPaformerを導入し、低次元の並列パスをより大きなモデルに組み合わせた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:55:08 GMT)
Optimizing Peer Grading: A Systematic Literature Review of Reviewer Assignment Strategies and Quantity of Reviewers [0.0] 本稿では, 査定の精度, 公平性, 教育的価値にどのような影響を与えるかを検討する。
我々は,ランダムな代入,能力に基づく代入,ソーシャル・ネットワークに基づく代入,入札という4つの一般的なレビュアー・アサインメント戦略を特定した。
レビューカウントでは、投稿ごとに3つのレビューを割り当てることが最も一般的なプラクティスとして現れます。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:28:39 GMT)
On Approximate MMS Allocations on Restricted Graph Classes [0.0] 本研究では,接続制約のある不特定商品群を公平に分割する問題について検討する。
完備グラフ、サイクル、固定された$d$に対する$d$-claw-freeグラフのようなグラフのクラスが実際に存在することは知られている。
このようなアロケーションは、ブロックグラフ、cacti、完全多部グラフ、分割グラフなど、よく研究されているクラスに存在していることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:17:44 GMT)
Numerical modeling for trapped-ion thermometry using dark resonances [0.0] 熱運動を受けるトラップイオンのスペクトルをシミュレーションするために, 単純化された動的方程式を用いたいくつかの技術について議論する。
また, 温度推定において, 熱的運動の影響を補うことは, 計算上非常に便利であるが, 重大な誤差を生じさせる可能性があることを観察した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:25:30 GMT)
Numerical Considerations in Weighted Model Counting [0.0] 本稿では,複数の数値表現を組み合わせることで,ユーザの指定した精度を達成することが保証される重み付きモデルカウントを効率的に計算する方法を示す。
我々は,標準のIEEE倍精度表現を64ビット指数で補うことで,重み付きモデルカウントでよく発生するアンダーフローやオーバーフローの問題を回避できることを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:28:49 GMT)
Nonstabilizerness in the unitary and monitored quantum dynamics of XXZ-staggered and SYK models [0.0] 我々は XXZ-staggered spin chain の量子状態拡散力学を考察する。
我々は、安定化器R'enyi entropy(SRE)を用いて、軌道に沿った非安定化剤性(マジック'とも呼ばれる)を評価する。
測定がない場合、SYKモデルのみが、時間平均SREがランダムな状態境界を飽和させる唯一のモデルであることが分かる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:31:13 GMT)
Nonreciprocal and Geometric Frustration in Dissipative Quantum Spins [0.0] 非相反的相互作用は非相反的フラストレーションだけでなく、非相反性に固有の幾何学的フラストレーションも引き起こすことを示す。
幾何学的および非相互的フラストレーションによって駆動される非相互相転移を同定する。
我々の予測は3成分BECキャビティシステムにとって重要な物理的意味を持つ。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:37:12 GMT)
Noisy Cyclic Quantum Random Walk [0.0] 等質巡回グラフ上の離散的量子ランダムウォークにおける静的ノイズを探索する。
退化スペクトルは正弦波確率分布を生じ、非退化スペクトルは平坦なプロファイルを生成する。
現場の静相雑音を解析し,その影響を2つの伝搬系で解析する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:30:14 GMT)
Neural Encrypted State Transduction for Ransomware Classification: A Novel Approach Using Cryptographic Flow Residuals [0.0] Neural Encrypted State Transduction (NEST) に基づくアプローチを導入し、暗号フローの残差を分析する。
NESTは状態遷移を動的にマップし、復号された実行トレースに直接アクセスすることなく、高信頼の分類を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:06:23 GMT)
Multi-Armed Bandits-Based Optimization of Decision Trees [0.0] 本稿では,マルチアーマッドバンド (MAB) に基づくプルーニング手法,強化学習 (RL) に基づく手法を提案する。
そこで我々はMABアルゴリズムを用いて各プルーニング動作からのフィードバックに基づいて最適な分岐ノードを見つける。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:43:45 GMT)
Modeling Spatial Extremal Dependence of Precipitation Using Distributional Neural Networks [0.0] 本稿では,降水量最大値の依存関係を決定するために生成ニューラルネットワークを用いたシミュレーションに基づく推定手法を提案する。
我々は2021-2023年の間、西ドイツの月次降雨極大調査にこの手法を用いた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:16:20 GMT)
Matrix Inversion by Quantum Walk [0.0] 行列反転のためのHHLアルゴリズムは、量子計算における画期的なアルゴリズムである。
位相推定を連続時間量子ウォークに置き換えることでアルゴリズムを大幅に単純化する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:00:05 GMT)
Mask & Match: Learning to Recognize Handwritten Math with Self-Supervised Attention [0.0] 我々は手書き数式(HMER)の認識のための自己教師型学習フレームワークを提案する。
我々のアプローチは、大域的および局所的なコントラスト的損失の組み合わせを用いて、画像エンコーダを事前訓練することから始まる。
この研究の重要な貢献は、プログレッシブな空間マスキング戦略を用いて訓練された、新しい自己監督型アテンションネットワークである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:11:36 GMT)
Magnetization-induced reordering of ground states phase diagram in a two-component Bose-Hubbard model [0.0] ダイアグラム上の特定の位相の位置と大きさは磁化に依存していることを示す。
非ゼロ磁化は、2つの成分それぞれに対して異なるモット絶縁体位相境界を導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:35:14 GMT)
Magnetic moments in the Poynting theorem, Maxwell equations, Dirac equation, and QED [0.0] 電気力学のどちらのバージョンにも磁気モーメント効果がどのように含まれているかを示す。
主な焦点は磁気双極子相互作用であり、磁気単極子相互作用は考慮されていない。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:27:16 GMT)
Magic Entropy in Hybrid Spin-Boson Systems [0.0] 位相空間量子化の枠組みにおける安定化器 R'enyi エントロピーについて論じる。
我々は、スピンおよびボゾンサブシステム間の量子魔法の分布を捉える、類似のハイブリッド魔法エントロピーと相互魔法エントロピーを定義する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 05:07:40 GMT)
Magic Boundaries of 3D Color Codes [0.0] 我々は,3次元カラーコードの境界について検討し,体系的な分類を101の異なる境界タイプに分類する。
最初のクラスは1つの境界で構成され、システム全体にわたって1(2D)$T$ドメインの壁を掃引することによって生成される。
第2のクラスは70のバウンダリで構成され、余次元-1のサブ多様体を越えて$S$ドメインの壁を掃くことによって生成される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:51:33 GMT)
MI9 -- Agent Intelligence Protocol: Runtime Governance for Agentic AI Systems [0.0] エージェントAIシステムの安全性とアライメントのための、最初の完全に統合されたランタイムガバナンスフレームワークであるMI9を紹介します。
MI9は、エージェントリスクインデックス、エージェントセマンティックテレメトリキャプチャー、継続的な認可監視、FSM(Finite-State-Machine)ベースのコンフォーマンスエンジン、目標条件ドリフト検出、および段階的封じ込め戦略の6つの統合コンポーネントを通じてリアルタイム制御を導入している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:18:04 GMT)
Less is More: Selective Reflection for Compatible and Efficient Knowledge Distillation in Large Language Models [0.0] 知識蒸留(KD)は、大規模言語モデル(LLM)をコンパクトで効率的な学生モデルに圧縮する技術である。
本稿では,新しいデータキュレーションフレームワークである選択反射蒸留(SRD)を提案する。
プラグ・アンド・プレイの強化として、SRDは様々なホワイトボックスKDアプローチで蒸留結果を改善する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:55:53 GMT)
Learning to stabilize nonequilibrium phases of matter with active feedback using partial information [0.0] 強化学習を用いた量子多体系の能動的フィードバック制御における情報の役割について検討する。
我々は,最大128量子ビットの(1+1)次元安定化回路における絡み合いを防止するために,部分状態情報を用いた強化学習エージェントを訓練する。
臨界情報しきい値を超えると、学習された準最適戦略は非グレードであり、量子ビットであり、容積法則の絡み合った定常状態を領域法則のスケーリングに還元する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:00:06 GMT)
Learning the Topic, Not the Language: How LLMs Classify Online Immigration Discourse Across Languages [0.0] 大規模言語モデル(LLM)は、スケーラブルで正確な分析を可能にすることによって、社会科学の研究を変革している。
我々は、移民関連ツイートを分類するために、モノリンガル、バイリンガル、マルチリンガルデータセット上の軽量LLaMA 3.2-3Bモデルを微調整する。
最小限の言語固有の微調整が言語間話題の検出を可能にするか、ターゲット言語を追加することで事前学習バイアスが修正されるかを評価する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:23:24 GMT)
Learning Internal Biological Neuron Parameters and Complexity-Based Encoding for Improved Spiking Neural Networks Performance [0.0] 本研究では、従来のパーセプトロンモデルを生物学的に誘発される確率論的メタニューロンモデルに置き換えることで、新しいアプローチを導入する。
第2の鍵となる貢献として、SNNとLe-Ziv可塑性(LZC)を一意に統合する、生物学的にインスパイアされた新しい分類フレームワークを提案する。
本稿では,バックプロパゲーション,スパイク刺激型アスペクト依存型可塑性(STDP),テンポトロン学習規則などの学習アルゴリズムを検討する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:14:49 GMT)
Learning AI Auditing: A Case Study of Teenagers Auditing a Generative AI Model [0.0] 14代の若者(14~15歳)を対象に2週間の参加型デザインワークショップを開催した。
彼らは、インタラクティブなTikTokフィルタを作成するツールであるTikTokのエフェクトハウスの背後にある生成AIモデルを監査した。
調査の結果,参加者は活動を通じて参加し,創造的であり,独立して新たな考察と探求を行った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:47:50 GMT)
Latent Structure Modulation in Large Language Models Through Stochastic Concept Embedding Transitions [0.0] 埋め込み遷移は、推論中にトークン表現を動的に調整する確率的メカニズムを導入する。
各トークンの埋め込みは確率的更新によって進化する移行フレームワークが提案された。
経験的評価では、語彙の多様性が向上し、生成コヒーレンスが向上し、低頻度語彙の保持が向上した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:05:12 GMT)
LLM Unlearning using Gradient Ratio-Based Influence Estimation and Noise Injection [0.0] 既存の経験的手法は、ローカライゼーションが不十分なため、不完全な忘れ物や意図しない無関係な知識の劣化をもたらすことが多い。
GRINは、忘れデータの記憶に最も寄与するパラメータを特定するための、勾配比に基づく新しい指標を導入した。
そして、微調整の前にこれらのパラメータに選択的ノイズ注入を行い、モデルユーティリティを維持しながら学習性能を向上させる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:15:32 GMT)
L1-Regularized Functional Support Vector Machine [0.0] バイナリ分類のための$L_1$-regularized functional support vector machineを提案する。
分類器に適合するように付随するアルゴリズムが開発された。
シミュレーションと1つの実世界の応用による数値的な結果から,提案した分類器は,予測と特徴選択の両方において良好な性能を示すことが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:29:10 GMT)
Intuition emerges in Maximum Caliber models at criticality [0.0] 直観は学習のメタスタブルなフェーズとして現れ、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。
この研究は、学習のメタスタブルなフェーズとして出現する原始的な直観を報告し、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:27:41 GMT)
Interpretable Rheumatoid Arthritis Scoring via Anatomy-aware Multiple Instance Learning [0.0] SvdH(Sharp/van der Heijde)スコアは慢性関節リウマチ(RA)における放射線損傷の定量化に広く用いられている。
両手ラジオグラフィーを用いた画像レベルのSvdHスコア予測のための2段階パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:56:14 GMT)
Interferometric sorting of temporal Hermite-Gauss modes via temporal Gouy phase [0.0] 我々は,マッハ・ツェンダー干渉計を$mで構成し,各モードで得られた時間的グーイ位相を調整して,第1の時間的ハーマイト・ガウスモードの光通過のソートを実現する装置を提案する。
自発パラメトリックダウンコンバージョンで発生する光子対のシュミットモードを2つの干渉計でソートし、5.5%のクロストーク確率で理論的に低い結合を求める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:01:10 GMT)
Integration of a high-fidelity model of quantum sensors with a map-matching filter for quantum-enhanced navigation [0.0] 原子干渉計を用いた重力勾配計の高忠実度モデルの実現について報告する。
量子重力勾配計を用いた地図マッチングによるナビゲーション支援により,安定した軌道が導かれることを示す。
センサの傾きを3.3度以下に抑えるなど,これらの誤差を軽減するための要件を導出する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:41:04 GMT)
Integrating large language models and active inference to understand eye movements in reading and dyslexia [0.0] 本稿では,階層型能動推論を用いた新しい計算モデルを提案し,視線と視線の動きをシミュレートする。
我々のモデルは、不適応な予測処理が、失読症に関連する読解障害をいかに生み出すかを理解するのに役立つ可能性がある。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:19:44 GMT)
Identity Increases Stability in Neural Cellular Automata [0.0] そこで本研究では,NCAが培養した生物の安定性を,訓練中に簡単な制約のある「同一性」層を導入することにより向上させる手法を提案する。
その結果, NCAの近縁栽培は, 従来のNCAモデルよりも安定であることが示唆された。
この研究は、人工生物の細胞レベルでの社会的相互作用を研究するための基礎を築き上げた。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:18:01 GMT)
ICT Within Limits Is Bound To Be Old-Fashioned By Design [0.0] 電気・電子機器(WEEE)からの信頼できない廃棄物の排他的利用に基づくITアーキテクチャを提案する。
再生可能エネルギー、自律的、堅牢で、適応可能で、バトルテスト済みのオープンソースソフトウェアで構築されたこのソリューションは、最終的には使用が減少すると予想します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:24:43 GMT)
Hypergraph Neural Network with State Space Models for Node Classification [0.0] 状態空間モデル(HGMN)を用いた新しいハイパーグラフニューラルネットワークを提案する。
HGMNはロール認識表現をGNNと状態空間モデルに効果的に統合する。
このモデルは、最先端のGNN手法と比較してノード分類タスクにおいて顕著な性能向上を実現している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:54:12 GMT)
Hierarchical Pattern Decryption Methodology for Ransomware Detection Using Probabilistic Cryptographic Footprints [0.0] このフレームワークは、高度なクラスタリングアルゴリズムと機械学習を組み合わせて、ランサムウェアによる異常を分離する。
偽陽性率を低く保ちながら、悪意のある暗号化操作と良心的な活動とを効果的に区別する。
リアルタイム異常評価の導入により、ランサムウェア検出における致命的なレイテンシ問題に対処し、迅速な応答能力が保証される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:06:01 GMT)
Hierarchical Entropy Disruption for Ransomware Detection: A Computationally-Driven Framework [0.0] エントロピー変動のモニタリングは、不正なデータ修正を識別するための代替アプローチを提供する。
階層的エントロピー破壊を利用したフレームワークを導入し,エントロピー分布の偏差を解析した。
複数のランサムウェアにまたがるフレームワークの評価は、高い検出精度を達成する能力を示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:03:22 GMT)
Hierarchical Cryptographic Signature Mapping for Ransomware Classification: A Structural Decomposition Approach [0.0] 構造暗号特性を分析するために設計された階層型分類フレームワークは、悪意のある暗号化を識別するための新しいアプローチを提供する。
本研究は,暗号的特徴マッピングによって分類精度が向上することを示す。
階層構造解析は、さらに法医学的な調査を強化し、セキュリティアナリストが暗号を解読して攻撃源を追跡できるようにする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:04:40 GMT)
Growth in products of matrices: fastest, average, and generic [0.0] ランダム行列積に関する3つの疑問に答える。
第3の質問に対して、リャプノフ指数の上界を生成する非常に単純な方法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:40:15 GMT)
Graph-based Robot Localization Using a Graph Neural Network with a Floor Camera and a Feature Rich Industrial Floor [0.0] グラフベースの表現とグラフ畳み込みネットワーク(GCN)を用いて,フロアリング特性を利用した革新的なフレームワークを提案する。
提案手法では, 床面の特徴をグラフで表現することで, 個々の画像特徴を比較するよりも, より正確に(0.64cmの誤差) かつ効率的にロボットをローカライズすることができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:46:28 GMT)
Gradient-Regularized Latent Space Modulation in Large Language Models for Structured Contextual Synthesis [0.0] 本稿では、潜在空間における構造化制約の適用を通じて、テキスト生成を導くための新しいパラダイムを提案する。
勾配に基づく正規化の統合は、潜在表現の突然の変動を緩和する。
このフレームワークは、ニューラルネットワークに固有の生成的柔軟性を維持しながら、構造上の不整合を著しく低減する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:05:38 GMT)
Geometric-k-means: A Bound Free Approach to Fast and Eco-Friendly k-means [0.0] Gk-平均の本質は幾何学的原理、特にスカラー射影の活発な利用にある。
合成、実世界のデータセット、高次元データセットにまたがる実験では、Gk-meansは従来のk-meansの亜種よりもはるかに優れていることを示した。
Gk平均は、エネルギーフットプリントの減少によって証明されるように、より良い資源効率を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:32:42 GMT)
Generative Artificial Intelligence Extracts Structure-Function Relationships from Plants for New Materials [0.0] 大規模言語モデル(LLM)は、知識検索と創造的思考に対する新しいアプローチを可能にすることによって、研究の景観を再構築した。
本稿では, 植物科学, バイオミメティクス, 材料工学などの非連結分野の文献と, 生成AIを統合した第一種フレームワークを提案する。
花粉系材料やRhapis Exelsaの葉などの湿度応答性システムに着目し, 自覚的, 適応的性能を示した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:41:03 GMT)
Gaining confidence on the correct realization of arbitrary quantum computations [0.0] 本稿では,任意の普遍量子計算を実現するための検証プロトコルを提案する。
プロトコルの導出は、古典的に効率的にシミュレートできるマッチゲート計算が、追加のリソースを補うと普遍になるという事実に基づいている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:19:36 GMT)
From Explainable to Explanatory Artificial Intelligence: Toward a New Paradigm for Human-Centered Explanations through Generative AI [0.0] 説明的AI(Explanatory AI)は、人間の理解のための説明的パートナーとして機能するために、生成的AI能力を活用するパラダイムである。
本研究では,物語コミュニケーション,適応的パーソナライゼーション,進歩的開示原則を通じて,説明型AIを識別する概念モデルを開発する。
本研究は,アルゴリズムによるイントロスペクションではなく,人間の理解を目的としたAIシステムの実践的緊急性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:32:41 GMT)
Fractal Language Modelling by Universal Sequence Maps (USM) [0.0] ユニバーサルシーケンスマップ(Universal Sequence Map、USM)は、記号列を埋め込み数値空間にエンコードする反復関数である。
本報告では, 反復過程に影響を及ぼす発芽バイアスを解消することにより, ユニバーサルシーケンスマップ(USM)によるフラクタル符号化を推し進める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 18:41:13 GMT)
Fourier Optics and Deep Learning Methods for Fast 3D Reconstruction in Digital Holography [0.0] コンピュータ生成ホログラフィー(CGH)は、デジタルホログラムを用いたユーザ定義の有望な波形である。
パフォーマンス指標は、HoloNetのディープラーニングCGHと同様に、2Dの中央値を使用して改善されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:14:36 GMT)
Formal Concept Analysis: a Structural Framework for Variability Extraction and Analysis [0.0] 形式的概念分析(FCA)は、知識表現と発見のための数学的枠組みである。
本稿では,変数解析に不可欠なフレームワークの特性の選択を収集することで,ギャップを埋める試みを行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:30:14 GMT)
First Ask Then Answer: A Framework Design for AI Dialogue Based on Supplementary Questioning with Large Language Models [0.0] First Ask Then Answer (FATA) は応答生成に先立ってユーザに対して多次元補足質問を生成する。
既存の明確化アプローチとは対照的に、FATAは完全性とユーザ参加を重視している。
実験の結果,FATAはB-Promptを約40%上回った。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:39:47 GMT)
Federated Online Learning for Heterogeneous Multisource Streaming Data [0.0] フェデレートラーニングは、プライバシの懸念の下で分散マルチソースデータ分析に不可欠なパラダイムとして登場した。
本稿では,分散マルチソースストリーミングデータ解析のためのFOL手法を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:08:53 GMT)
Fast, Convex and Conditioned Network for Multi-Fidelity Vectors and Stiff Univariate Differential Equations [0.0] ニューラルPDEソルバの精度は、悪条件による最適化が不十分なため、しばしば低下する。
制御方程式の成分は、高度に条件のない活性化ベクトルを生成できることを示す。
我々は、凸性を維持しながら行列ランクと表現率を増大させる、単純で効果的な活性化フィルタリングステップであるShifted Gaussianを導入する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:51:38 GMT)
Fast simulations of continuous-variable circuits using the coherent state decomposition [0.0] 連続可変量子回路シミュレーションのためのオープンソースのPythonライブラリであるttexttlcg_plusを提案する。
我々の枠組みはガウス的方法論と任意の非ガウス的状態のコヒーレントな状態分解との線形結合を融合する。
フォールトトレラントなフォトニック量子コンピュータを構築する上で重要な要素であるクンノート状態の生成を最適化することで,この手法の有用性を実証する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 09:44:58 GMT)
Exploring the feasibility of probabilistic and deterministic quantum gates between T centers in silicon [0.0] シリコンのT中心欠陥は、量子技術の魅力的なプラットフォームを提供する。
2つの確率光子干渉に基づくスキームを含む,単一T中心間のゲートプロトコルについて検討する。
フィードバックによる光子干渉に基づくスキームは、競争効率と忠実性を達成する可能性がある。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:23:22 GMT)
Exploring Synaptic Resonance in Large Language Models: A Novel Approach to Contextual Memory Integration [0.0] 新しいメカニズム、Synaptic Resonanceは、トレーニングと推論中に関連する記憶経路を動的に強化するために導入された。
オープンソースの言語モデルを用いて行った評価は、パープレキシティの低減、文脈的コヒーレンスの向上、入力雑音に対するロバスト性の向上を示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:04:08 GMT)
Exploring Contextual Flux in Large Language Models: A Novel Approach to Self-Modulating Semantic Networks [0.0] 自己変調機構は言語モデル内で動的適応機能を導入する。
コンテキスト適応戦略は、拡張シーケンスにわたるトークン埋め込み軌跡に影響を与える。
自己規制は、生成の柔軟性を維持しながら、テキスト生成の一貫性を高める。
適応的な埋め込み更新はコヒーレンスの特定の側面を改善するが、その影響はモデルのキャパシティと入力の複雑さに及ばない。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:07:33 GMT)
Exploiting Kubernetes' Image Pull Implementation to Deny Node Availability [0.0] 我々は、K8sクラスタにおけるDenial of Service攻撃として、ステータス情報の欠如がどのように活用できるかを示す。
このような攻撃がワーカノードに与える影響、最大95%の平均CPU使用率の生成、新しいコンテナイメージのダウンロードの防止、潜在的に無制限な時間でのI/Oおよびネットワーク使用量の増加などを示す。
停止ギャップの解決法として,攻撃の可能性を検知・停止するeBPFに基づく概念実証手法MAGIを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:32:51 GMT)
Exact Sum Rules and Zeta Generating Formulas from the ODE/IM correspondence [0.0] 我々は、$cal PT$-symmetric potential $V_cal PT(x) = x2K (ix)varepsilon with $K,varepsilon in mathbbN, and as the Hermitian potential $V_cal H(x) = x2K$ with $K in mathbb N + 1$によって定義される量子力学の正確な和則(ESRs)とゼータ生成公式(ZGFs)を定式化する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:51:59 GMT)
Evaluation of LLMs in AMR Parsing [0.0] AMRは意味論的フォーマリズムであり、ノードが概念を表現し、エッジが意味論的関係を表す根付き、有向、非巡回グラフとして意味をエンコードする。
本稿では,Phi 3.5,Gemma 2,LLaMA 3.2,DeepSeek R1 LLaMA Distilledの4つの異なるLLMアーキテクチャを微調整して総合評価する。
以上の結果から,デコーダのみの直進微調整により,複雑なSOTA AMRに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:47:19 GMT)
Entanglement and private information in many-body thermal states [0.0] 量子暗号の概念を用いて、多体混合状態における絡み合いと相関関数を関連づける。
熱状態については, 盗聴者に対してアクセス可能な情報とシステムの線形応答との単純な関係を導出する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 06:43:23 GMT)
Ensemble-Based Graph Representation of fMRI Data for Cognitive Brain State Classification [0.0] 両脳状態分類タスクのためのアンサンブルに基づくグラフ表現法を提案する。
提案手法は,複数のベース機械学習モデルを活用することでグラフを構築する。
提案手法は,fMRIグラフ表現のエッジレベルの解釈可能性を維持し,マルチクラスおよび回帰タスクに適用可能であり,他の画像モダリティにも拡張可能である。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:32:46 GMT)
Enhancing the Scalability of Classical Surrogates for Real-World Quantum Machine Learning Applications [0.0] 量子機械学習(QML)は、初期の産業採用の可能性を秘めているが、量子ハードウェアへのアクセス制限は、QMLソリューションの展開において重要なボトルネックである。
この研究は、量子モデルの軽量な古典的表現構築を可能にする技術である、この制限を回避するために古典的サロゲートの使用を探求する。
本研究では,実世界のエネルギー需要予測問題に対する本手法の有効性を実証し,シミュレーションおよび量子ハードウェア上での性能と計算要求の厳密な検証を行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 08:51:01 GMT)
Dual Signal Decomposition of Stochastic Time Series [0.0] 研究論文は、分解された時系列を2つの信号を表す3つの時系列に分解する。
機械学習は、元の時系列に適合することと二重信号の不規則性を罰することの間に妥協する損失関数を最小化する。
提案した分解は時系列の平均と分散に対する平滑化アルゴリズムとして適用することができる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:30:41 GMT)
Don't Trust A Single Gerrymandering Metric [0.0] これらの指標のそれぞれが,ゲーリーマンダリングを検出するために,単一の孤立量として使用する場合,ゲーム可能であることを示す。
我々は,山登り法を用いて,メートル法上の境界に制約された地区計画を生成するとともに,当事者が獲得した地区数を最大又はほぼ最大化する。
これらの結果の明らかな結果の1つは、ゲーリーマンダリングを避けるために、再分権委員会が満たさなければならないメートル法上の事前境界を指定することの事実を示すことである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:07:51 GMT)
Do Ethical AI Principles Matter to Users? A Large-Scale Analysis of User Sentiment and Satisfaction [0.0] 本稿では,倫理的AIとユーザ満足度との関係を,G2から10万以上のAI製品のユーザレビューを分析して検討する。
トランスフォーマーベースの言語モデルを用いて、信頼できるAIのためのEU倫理ガイドラインによって定義された7つの倫理的次元の感情を測定する。
この結果は,ユーザの視点から倫理的AI設計の重要性を強調し,ユーザの役割や製品タイプ間の文脈的差異を考慮に入れる必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 00:27:50 GMT)
Diverse Neural Sequences in QIF Networks: An Analytically Tractable Framework for Synfire Chains and Hippocampal Replay [0.0] 本研究では,時間的に非対称なヘッビアン則を介し,シーケンスを組み込んだ準連続積分・消火ニューロンの擬似ネットワークを提案する。
以上の結果より, 持続的シンファイア様連鎖や一過性海馬リプレイ様バーストなどの連続的活動のスペクトルを強く再現し, リップル内周波数調節(IFA)を呈することが示唆された。
これらの結果は, TAH接続性を有するQIFネットワークを, 脳内の連続神経活動の出現, 安定性, 多様性を調査するための, 解析的かつ生物学的に妥当なプラットフォームとして確立する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:27:47 GMT)
Dimensional Characterization and Pathway Modeling for Catastrophic AI Risks [0.0] 本稿では, CBRN, サイバー攻撃, 制御の突然の喪失, 制御の段階的喪失, 環境リスク, 地政学的リスクの6つのAI破滅的リスクについて検討する。
我々は、これらのリスクを、意図、能力、実体、極性、線形性、到達、順序という7つの重要な次元にまたがって特徴づける。
我々は、初期危険から結果として生じる害へのステップバイステップの進行をマッピングしてリスク経路モデリングを行う。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:56:05 GMT)
Digital generation of the 3-D pore architecture of isotropic membranes using 2-D cross-sectional scanning electron microscopy images [0.0] 多孔膜イメージングにおける2次元走査電子顕微鏡の最大の限界は、3次元の細孔構造と相互接続性を解決することができないことである。
本研究では,重要な統計特性を維持し,複雑な細孔形態を正確に再現する改良された再構成アルゴリズムを開発した。
このツールは、これらの細孔をSEMで可視化できる限り、いかなる孔径の等方性多孔膜構造にも容易に適用できる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:26:33 GMT)
Detecting entanglement between quantum emitters using directional emission [0.0] 本研究では,光子放出方向とエミッタ・エミッタの絡み合いが広いパラメータ範囲でモノトニックな関係を示すことを示す。
この結果から、状態準備段階における光子放出の方向性は、エミッタ間の絡み合いを決定するのに有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:46:26 GMT)
Design and analysis of a set of discrete variable protocols for secure quantum communication [0.0] 量子ID認証(QIA)プロトコルは過去30年間に提案されてきた。
この論文は、2つの新しいQKDプロトコルを示し、絡み合いや理想的な単一光子源の必要性を排除している。
これらのプロトコルは、インターセプトと特定の集団攻撃を含む様々な攻撃に対して安全であることが厳格に証明されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:12:29 GMT)
Deep Language Geometry: Constructing a Metric Space from LLM Weights [0.0] 本稿では,現代大規模言語モデル (LLM) の内部重み付けの活性化を利用して,計量空間を構築する新しいフレームワークを提案する。
本手法は,適応型プルーニングアルゴリズムを用いて,重み付け重み付けスコアを演算することで,高次元ベクトル表現を自動的に導出する。
多様なデータセットと多言語LLMにまたがるアプローチを検証し、106言語をカバーする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:48:26 GMT)
Decorrelated feature importance from local sample weighting [0.0] 局所的なサンプル重み付け(losaw)は、多くの機械学習アルゴリズムに統合して、特徴重要度(FI)スコアを改善することができる。
決定木に基づくML手法やニューラルネットワークのミニバッチトレーニングにロソーをどのように組み込むかを示す。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:11:18 GMT)
Decoherence of Majorana qubits by 1/f noise [0.0] 超伝導体-半導体ナノワイヤにおけるマヨラナゼロモード(MZM)に基づく量子ビットは、実用規模の量子コンピューティングのプラットフォームとして大きな関心を集めている。
これらの誤差率は、ナノワイヤ長の増大や温度の低下とともに指数関数的に抑制されることが期待されている。
ここでは、この期待に挑戦する基本的なデコヒーレンスメカニズムを特定します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:22:35 GMT)
DKG-LLM : A Framework for Medical Diagnosis and Personalized Treatment Recommendations via Dynamic Knowledge Graph and Large Language Model Integration [0.0] 医療診断とパーソナライズされた治療レコメンデーションのためのDKG-LLMフレームワークを提案する。
このフレームワークは、動的知識グラフ(DKG)とGrok 3の大規模言語モデルを統合する。
評価の結果,DKG-LLMの診断精度は84.19%,治療推奨精度は89.63%であった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:04:40 GMT)
CountQA: How Well Do MLLMs Count in the Wild? [0.0] MLLM(Multimodal Large Language Models)は、視覚シーンの理解において顕著な急激さを示す。
それらは、基本的な認知スキル、すなわちオブジェクトのカウントに欠如している。
この盲点は、現実世界のアプリケーションにおける信頼性を著しく制限します。
この欠損を調査するために設計された、挑戦的な新しいベンチマークであるCountQAを紹介します。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 04:23:04 GMT)
Contrastive Analysis of Constituent Order Preferences Within Adverbial Roles in English and Chinese News: A Large-Language-Model-Driven Approach [0.0] 本稿では,副詞的役割を持つ機能的チャンクの観点から,英語・中国語ニュースの構成順序の相違について検討する。
英語のニュースはまずコア情報の線形な物語を好んでおり、機能的チャンクはほとんどポストポジションである。
この研究は、単語順は体系的嗜好と動的適応性の両方を持ち、英語と中国語の情報構造を対照的に研究するための新たな実証的支援を提供することを明らかにした。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:20:22 GMT)
Continuous-Time Quantum Markov Chains And Discretizations Of p-Adic Schrödinger Equations: Comparisons And Simulations [0.0] 我々は,p-進シュリンガー方程式とそれに関連するCTQMCの大規模なクラスについて検討する。
シミュレーションにより、量子マルコフ連鎖の極限分布は、古典的連鎖の定常確率よりも大きいことが示された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 21:28:18 GMT)
Contextual Reinforcement in Multimodal Token Compression for Large Language Models [0.0] トークン圧縮は、ますます複雑で多様なデータセットを扱うためにモデルをスケーリングする上で、依然として重要な課題である。
相互依存や意味的関連性を通じてトークンの重要度を動的に調整する,コンテキスト強化に基づく新しいメカニズムを導入する。
このアプローチは,情報表現の品質と一貫性を維持しつつ,トークン使用量の大幅な削減を可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:06:37 GMT)
Contextual Morphogenesis in Large Language Models: A Novel Approach to Self-Organizing Token Representations [0.0] 文脈形態形成は、学習された文脈依存に基づいてトークン境界を再構成する自己組織化機構を確立する。
経験的評価は、動的に調整されたトークン化が表現安定性を維持しながら複雑度を低下させることを示す。
異なる言語コーパス間の比較評価は、適応的トークン化は解釈可能性を維持しつつ、文脈的手がかりとの整合性を改善することを示唆している。
構造安定性の精製と予測性能における文脈形態形成の有効性は、従来のトークン化法に代わるものとしての生存性を強調している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:07:22 GMT)
Context-Preserving Tensorial Reconfiguration in Large Language Model Training [0.0] CPTR(Context-Preservingial Reconfiguration)は、構造的因子化と適応的収縮による重みテンソルの動的複雑さを実現する。
実証的な評価は、CPTRが拡張配列間のコヒーレンス保持を改善することを示している。
性能比較の結果,CPTR強化モデルでは計算効率が向上し,メモリ消費が減少した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:02:57 GMT)
Constrained PSLQ Search for Machin-like Identities Achieving Record-Low Lehmer Measures [0.0] 本稿では,PSLQ整数相関アルゴリズムと数理論フィルタを結合して低測度関係を発見するためのフレームワークを提案する。
我々の探索は、レマー測度と新しい5項と6項の関係をもたらす。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:08:13 GMT)
Comment on "Unifying Aspects of Generalized Calculus" [0.0] Czachor の最近の提案は非ニュートン計算の形式を導入している。
物理的な観点から見れば、深刻な概念上の問題に陥る。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 15:23:21 GMT)
Cognitive Workspace: Active Memory Management for LLMs -- An Empirical Study of Functional Infinite Context [0.0] 大きな言語モデル(LLM)は、コンテキスト管理の基本的な制限に直面します。
我々は、従来の検索強化世代(RAG)を超越した新しいパラダイムである認知ワークスペースを提案する。
認知ワークスペースは、(1)意図的な情報キュレーションを伴うアクティブメモリ管理、(2)永続的な作業状態を実現する階層的な認知バッファ、(3)タスク駆動型コンテキスト最適化の3つの革新を通じて、これらの制限に対処する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:32:47 GMT)
Cavity-based optical switching via phase modulation in warm rubidium vapor [0.0] 光スイッチングは、スケーラブルなフォールトトレラントフォトニック量子コンピューティングにおける重要な課題である。
この制限を克服し、22 nsの上昇時間、2.4 dBの挿入損失、17.5 dBの絶滅率を示す空洞ベースの光スイッチを提案する。
我々のスイッチの最終的な性能は、速度と効率の両方を組み合わせて、アクティブな多重化、ループベースの量子メモリ、量子エラー訂正プロトコルのフィードフォワードに応用される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:21:27 GMT)
Can a Quantum Computer Simulate Nuclear Magnetic Resonance Spectra Better than a Classical One? [0.0] 核磁気共鳴(NMR)分光実験で測定されたスペクトルのシミュレーションは、計算的に非自明な問題である。
このような問題を解決するために設計された古典的解法をベンチマークする。
実験パラメータの一般的な規則を超越しても、うまく機能することがわかった。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:43:18 GMT)
Benchmarking Pretrained Molecular Embedding Models For Molecular Representation Learning [0.0] 事前学習されたニューラルネットワークは化学や小さな分子の薬物設計に大きな関心を集めている。
本研究は,25データセットにまたがる25モデルについて,これまでで最も広範な比較を行ったものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:29:24 GMT)
Benchmarking Deception Probes via Black-to-White Performance Boosts [0.0] 偽装プローブが実際に偽装を検出するのにどれほど効果的かは不明です。
我々は、ホワイトボックスモニタリング(モニターがトークンレベルのプローブアクティベーションにアクセス可能な場所)とブラックボックスモニタリング(そのようなアクセスなしで)を比較した。
既存の騙しプローブから、弱いが奨励される黒と白のパフォーマンスが向上する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 02:19:16 GMT)
Autonomous Structural Memory Manipulation for Large Language Models Using Hierarchical Embedding Augmentation [0.0] 本研究では,マルチレベルセマンティック構造を通じてトークンの表現を再定義する手段として,階層的な埋め込み拡張を導入する。
その結果、より長い入力シーケンスに対して処理オーバーヘッドが大幅に削減され、計算効率が大幅に向上した。
トークン表現とメモリ構成を動的に調整する能力は、様々な予測不可能な入力条件下でモデルの堅牢性に寄与した。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:05:25 GMT)
Automated Creation of the Legal Knowledge Graph Addressing Legislation on Violence Against Women: Resource, Methodology and Lessons Learned [0.0] 法律知識グラフ(KGs)は、法的情報へのアクセスを容易にする貴重なツールである。
本稿では, 自動KG構築のための2つの補完的アプローチを提案する。
このソリューションは、構造化データ抽出、オントロジー開発、セマンティックエンリッチメントを統合し、女性に対する暴力を含む訴訟に適したKGを生成する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:59:54 GMT)
Attainable quantum speed limit for N-dimensional quantum systems [0.0] 量子速度制限(Quantum speed limit, QSL)は、量子力学において、進化時間に低い境界を与える概念である。
本稿では,オープン量子系とクローズド量子系の両方に対して,新しい状態距離を求める。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 03:50:13 GMT)
Architectural Fusion Through Contextual Partitioning in Large Language Models: A Novel Approach to Parameterized Knowledge Integration [0.0] 本稿では,パラメータの動的セグメンテーションをコンテキスト対応領域に分割することで,大規模計算モデルのアーキテクチャ設計を強化するための革新的なアプローチを提案する。
実験による評価は、様々な言語課題における精度、難易度、文脈的コヒーレンスを大幅に改善したことを示す。
これらの知見は、多様かつ複雑な領域における計算言語アーキテクチャのスケーラビリティと適応性を再定義するコンテキスト分割の可能性を示すものである。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:03:53 GMT)
AntiCheatPT: A Transformer-Based Approach to Cheat Detection in Competitive Computer Games [0.0] 反チートシステムは、ユーザのシステムに侵入的措置を課すことなく、不正行為を進化させる方法に追従する際の課題に直面している。
本稿では,ゲームプレイデータを用いて,カウンターストライク2における不正行為を検出するためのトランスフォーマーベース機械学習モデルであるAntiCheatPT_256を提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:22:41 GMT)
Analysis of Schedule-Free Nonconvex Optimization [0.0] 大規模学習アルゴリズムの根底にある一階法であるが、その収束性は慎重にスケジュールされたステップのヒンジを保証し、前例のないスケジュール自由地平線に依存する。
我々の$Oレートが$O(log T)$に束縛されていることを示す。
我々の研究はSFの地平線を拡張し、最適な非滑らかな速度で将来の方向をグラフ化する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 22:54:35 GMT)
Analysis and Constructive Criticism of the Official Data Protection Impact Assessment of the German Corona-Warn-App [0.0] 2020年6月15日、ドイツ・コロナ・ワーン・アプリ(CWA)の公式データ保護影響評価(DPIA)が公開された。
本稿では,CWAの初期DPIAの,少なくとも具体的な方法論的,技術的,法的欠点について述べる。
本論文の著者らも、最初のリリースについて、建設的な批判と提案を概説している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 12:34:47 GMT)
An Implemention of Two-Phase Image Segmentation using the Split Bregman Method [0.0] 我々はGoldstein, Bresson, Osherによって提案された2相画像分割アルゴリズムをcitegold:breで実装した。
このアルゴリズムは、与えられた2d画像の領域を前景領域と背景領域に分割し、画像の各ピクセルをこれらの2つの領域の1つに割り当てる。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:30:10 GMT)
Algorithmic Segmentation and Behavioral Profiling for Ransomware Detection Using Temporal-Correlation Graphs [0.0] テンポラル相関グラフを利用して、悪意ある操作に固有の複雑な関係と時間パターンをモデル化する新しいフレームワークが導入された。
実験では、さまざまなランサムウェアファミリーにまたがるフレームワークの有効性を、常に高い精度、リコール、全体的な検出精度で実証した。
この研究は、動的グラフ分析と機械学習を統合して、脅威検出における将来のイノベーションを実現することによって、サイバーセキュリティ技術の進歩に貢献している。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:07:06 GMT)
Aggregate-Combine-Readout GNNs Are More Expressive Than Logic C2 [0.0] GNN が C2 をはるかに上回っていることを証明した。
私たちの研究は、無限論理の表現力に関する純粋に論理的な洞察につながります。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 07:35:35 GMT)
Advancing Welding Defect Detection in Maritime Operations via Adapt-WeldNet and Defect Detection Interpretability Analysis [0.0] 石油・ガス産業における配管システムの安全性と信頼性を確保するために溶接欠陥検出が不可欠である。
従来の非破壊テスト(NDT)手法は微妙な欠陥や内部の欠陥を検知できないことが多く、潜在的な障害やコストダウンの原因となる。
Adapt-WeldNetは溶接欠陥検出のための適応フレームワークである。
システム透過性を高めるためにDDIA(Defect Detection Interpretability Analysis)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 11:27:44 GMT)
Accelerating Quantum Monte Carlo Calculations with Set-Equivariant Architectures and Transfer Learning [0.0] そのステップを劇的に加速したり、バイパスしたりするために、set-transformerアーキテクチャをどのように利用できるかを示します。
本稿では,古典的イジングモデルから長距離相互作用を持つ量子システムまで,複雑さの増大を示す一連の例を紹介する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 16:33:19 GMT)
Accelerating Fleet Upgrade Decisions with Machine-Learning Enhanced Optimization [0.0] レンタルベースのビジネスモデルとサステナビリティ要件の増大は、大規模なマシンおよび車両の更新とアップグレードを管理するための効率的な戦略の必要性を高める。
従来のフリート最適化はアップグレードオプションを考慮せず、指数関数的なランタイムスケーリングを備えた整数プログラミングに基づいている。
この貢献はまず、最適な更新とアップグレードの決定を決定する拡張整数プログラミングアプローチを提案する。
計算負荷は、タスクを混合離散連続最適化問題に変換する第2の機械学習ベースの方法によって対処される。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 14:31:18 GMT)
AI-Assisted Conversational Interviewing: Effects on Data Quality and User Experience [0.0] 本研究では,AIによる対話型面接の枠組みを紹介する。
我々は1,800人の参加者をランダムにAI 'チャットボット'に割り当てるウェブサーベイ実験を行った。
この結果から,チャットボットなどのAI手法を用いて,Webサーベイにおけるオープンエンドデータ収集を向上する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 17:43:37 GMT)
A scalable photonic quantum interconnect platform [0.0] 合成ダイヤモンドは、ナノフォトニック構造におけるコヒーレント光学界面と長いスピンコヒーレンス時間を保持する色中心をホストする。
フォトニック結晶キャビティは、同一のハンドリングチップに結合した複数の膜に確実に作製可能であることを示す。
これらの進歩は、光学的に処理可能な量子メモリアレイのスケーラブルな組み立てへの道を開く。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:48:30 GMT)
A nonlinear elasticity model in computer vision [0.0] 本稿では,著者らが2つの画像を比較するために導入した非線形弾性モデルについて解析する。
アフィン写像に関連付けられた画像については、積分は変換の行列式に依存する必要があることが示されている。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:07:09 GMT)
A disputable assumption behind the empirical equivalence between pilot-wave theory and standard quantum mechanics [0.0] 我々は、絶対的不確実性とPOVM定理の導出は、「情報は常に構成的に基礎づけられている」という疑わしい仮定に依存すると論じる。
このような仮定の背後にある提案された根拠が不十分である理由を詳細に説明し、それを解き放たなければならない結果について考察する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 19:28:54 GMT)
A Study on Regularization-Based Continual Learning Methods for Indic ASR [0.0] インドにおける言語多様性は、包括的自動音声認識(ASR)システムを開発する上で大きな課題となっている。
すべての言語データへの同時アクセスを必要とする従来の多言語モデルは、データのシーケンシャルな到着とプライバシ制約のため、現実的ではない。
継続学習(Continuous Learning)は、モデルがそれまでの知識を忘れずに、新しい言語を逐次学習できるようにすることによって、ソリューションを提供する。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 13:02:19 GMT)
A Calibration Tool for Refractive Underwater Vision [0.0] 水中屈折式カメラキャリブレーションツールボックスのオープンソース実装を初めて提供する。
カメラ、ステレオ、ハウジングのキャリブレーションを含む水中視覚システムのエンドツーエンドのキャリブレーションを可能にする。
論文参考訳(メタデータ) (Fri, 08 Aug 2025 10:20:06 GMT)