Perceiving and Acting in First-Person: A Dataset and Benchmark for Egocentric Human-Object-Human Interactions [110.4] 本稿では、手動支援タスクを視覚言語アクションフレームワークに組み込み、そのアシスタントは、自我中心のビジョンとコマンドに従ってインストラクターにサービスを提供する。
この設定の下で、我々は、マルチモーダルデータの11.4時間1.2Mフレームを持つ、最初の大規模人・物・人間のインタラクションデータセットであるInterVLAを達成した。
我々は,エゴセントリックな人の動き推定,相互作用合成,および包括的分析による相互作用予測に関する新しいベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:46:23 GMT)
Analyzing and Mitigating Object Hallucination: A Training Bias Perspective [108.1] 我々は,LVLMのトレーニングデータから,特定の対象を隠蔽した反ファクト画像からなる新しいベンチマークPOPEv2を提案する。
現在のLVLMはトレーニングバイアスに悩まされており、トレーニングデータを完全に活用できず、トレーニング中に見られる画像に対してより頻繁に幻覚を与えることができません。
Obliviateは,学習バイアスアンラーニングによる物体幻覚の軽減を目的とした,効率的で軽量な未学習手法である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:51:02 GMT)
OS Agents: A Survey on MLLM-based Agents for General Computing Devices Use [101.6] アイアンマンの架空のJ.A.R.V.I.Sほど有能で多用途なAIアシスタントを作る夢は、長い間想像力に恵まれてきた。
マルチモーダル(multi-modal)な大きな言語モデル((M)LLMs)の進化により、この夢は現実に近づいている。
本調査は,OSエージェント研究の現状を整理し,学術調査と産業開発の両方の指針を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:33:45 GMT)
Stochastic Encodings for Active Feature Acquisition [100.5] Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。
目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。
一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。
我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:06:54 GMT)
One Model For All: Partial Diffusion for Unified Try-On and Try-Off in Any Pose [99.1] textbfOMFA (emphOne Model For All) は仮想トライオンとトライオフの両方のための統合拡散フレームワークである。
フレームワークは完全にマスクフリーで、単一のポートレートとターゲットのポーズのみを入力として必要とします。
試着タスクと試着タスクの両方で最先端の結果が得られ、仮想衣料合成のための実用的で一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:46:01 GMT)
Analyzing the Usage of Donation Platforms for PyPI Libraries [92.0] 本研究では,PyPIエコシステムにおける寄付プラットフォームの導入状況について分析した。
GitHub Sponsorsが支配的なプラットフォームであるが、多くのPyPIリストのリンクは時代遅れである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:08:48 GMT)
RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization [86.3] 大規模言語モデル(LLM)のための新しいハイブリッド政治最適化手法RL-PLUSを提案する。
RL-PLUSは、外部データと内部エクスプロイトを相乗化して、より強力な推論能力を達成し、ベースモデルのバウンダリを超える。
提案手法の優位性と一般化性を示すため,理論解析と広範な実験を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:36:42 GMT)
AVG-LLaVA: An Efficient Large Multimodal Model with Adaptive Visual Granularity [85.4] 入力画像と命令に基づいて適切な視覚的粒度を適応的に選択できるLMMであるAVG-LLaVAを導入する。
大規模な実験と分析により、AVG-LLaVAは11ベンチマークで優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:03:19 GMT)
CreatiLayout: Siamese Multimodal Diffusion Transformer for Creative Layout-to-Image Generation [78.2] 拡散モデルは、視覚的に魅力的であるだけでなく、芸術的品質の高い画像を生成する能力で認識されている。
レイアウト・ツー・イメージ生成は、より正確で制御可能な生成を可能にするために、地域固有の位置と記述を活用するために提案されている。
本稿では、レイアウトモデル、データセット、プランナを統合した、創造的なレイアウト・ツー・イメージ生成のための体系的なソリューションを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:10:06 GMT)
Multi-module GRPO: Composing Policy Gradients and Prompt Optimization for Language Model Programs [77.2] グループ相対政策最適化(GRPO)は、後学習言語モデル(LM)に有効なツールであることが証明されている。
GRPOの単純なマルチモジュールであるmmGRPOを提案する。
自動的なプロンプト最適化によって構成されたmGRPOは,分類,多項目検索,プライバシー保護デリゲートタスクなどを通じて,平均11%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:28:31 GMT)
$\texttt{Droid}$: A Resource Suite for AI-Generated Code Detection [75.6] $textbf$textttDroidCollection$$は、機械生成コード検出器のトレーニングと評価のためのオープンデータスイートである。
これには100万以上のコードサンプル、7つのプログラミング言語、43のコーディングモデルからの出力、3つの実世界のコーディングドメインが含まれている。
また、$textttDroidCollection$$でマルチタスクでトレーニングされたエンコーダのみの検出器も開発しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:26:28 GMT)
Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.2] MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:27:53 GMT)
SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience [71.8] 本稿では,コンピュータ利用エージェントが不慣れなソフトウェアとのインタラクションを通じて進化することを可能にするエージェント型自己進化フレームワークSEAgentを提案する。
我々は、OS-World内の5つの新しいソフトウェア環境におけるSEAgentの有効性を検証する。
当社のアプローチは,競合するオープンソースCUAに比べて,11.3%から34.5%という,23.2%の大幅な改善を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:58:46 GMT)
Continual Learning for VLMs: A Survey and Taxonomy Beyond Forgetting [70.8] 視覚言語モデル(VLM)は、大規模事前学習を活用することで、多様なマルチモーダルタスクにおいて優れたパフォーマンスを実現している。
VLMは、クロスモーダル機能ドリフト、共有アーキテクチャによるパラメータ干渉、ゼロショット機能侵食など、ユニークな課題に直面している。
本調査は、生涯の視覚言語システムを開発する研究者にとって、包括的かつ診断的な基準となることを目的としている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:03:10 GMT)
Hulk: A Universal Knowledge Translator for Human-Centric Tasks [69.9] 我々は、最初のマルチモーダルな人間中心ジェネラリストモデルであるハルクを提示する。
2Dビジョン、3Dビジョン、スケルトンベース、そしてタスク固有の微調整なしで視覚言語タスクに対処する。
Hulkは11のベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:40:31 GMT)
True Multimodal In-Context Learning Needs Attention to the Visual Context [69.6] MLLM(Multimodal Large Language Models)は、新しいタスクに適応したMICL(Multimodal In-Context Learning)を実現する。
現在のMLLMは、視覚的手がかりを無視し、テキストパターンを過度に無視する傾向にあり、真のマルチモーダル適応よりも単なるテキスト模倣に繋がる。
視覚的コンテキストへのモデルへの参加を促す,効率的な微調整戦略であるDynamic Attention Reallocation (DARA)を紹介した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:36:34 GMT)
VLM4D: Towards Spatiotemporal Awareness in Vision Language Models [66.8] V4DLMは視覚言語モデル(VLM)を評価するために設計された最初のベンチマークである。
本ベンチマークは,質問応答対を慎重にキュレートした,多様な実世界および合成ビデオで構成されている。
我々は,既存のモデルにおける基本的欠陥を浮き彫りにして,人間のベースラインと比較して重要なパフォーマンスギャップを識別する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:21:50 GMT)
The Relative Instability of Model Comparison with Cross-validation [65.9] クロスバリデーションは、安定した機械学習アルゴリズムのテストエラーに対する信頼区間を提供するために使用できる。
相対安定性は、単純なアルゴリズムであっても、既存の安定性の結果から容易に導き出すことはできない。
ソフトスレッディングまたはラッソを用いた場合、試験誤差差に対するCV信頼区間の無効性を実証的に確認する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:54:56 GMT)
ChartM$^3$: Benchmarking Chart Editing with Multimodal Instructions [65.2] 本稿では,ユーザ意図を自然言語と視覚指標の組み合わせで表現する,マルチモーダルチャート編集のための新しいパラダイムを提案する。
マルチモードチャート編集のための新しいベンチマークであるChart$textM3$を,マルチレベル複雑度とマルチパースペクティブ評価で提示する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:05:00 GMT)
PTQ1.61: Push the Real Limit of Extremely Low-Bit Post-Training Quantization Methods for Large Language Models [64.8] 大規模言語モデル(LLM)は、非常に低ビット(2ビット未満)の量子化に直面した場合、性能が著しく低下する。
我々はPTQ1.61と呼ばれる極低ビットのPTQ法を提案し、これによって初めて1.61ビットの重み量子化が可能となる。
実験により、PTQ1.61は極低ビット量子化において最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:02:06 GMT)
Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.4] 本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:16:58 GMT)
Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [64.4] 大規模言語モデル(LLM)は、専門的な深層モデルから汎用的な基礎モデルへと進化してきた。
LLMは、ローカルデータセットの微調整と、ネットワークエッジ上のデプロイメントのためのかなりのメモリを必要とする。
LLMは、画像、オーディオ、ビデオ、マルチモーダルコンテンツを作成するために、テキスト生成を超えて拡張されている。
LLMの持続的成長を支援するため,モデル微調整およびモデル圧縮技術が開発されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:19:06 GMT)
RoboTron-Drive: All-in-One Large Multimodal Model for Autonomous Driving [63.9] 大規模マルチモーダルモデル(LMM)は、自律運転(AD)における例外的理解と解釈能力を示した
本稿では,多種多様なデータ入力を処理するための汎用大規模マルチモーダルモデルであるRoboTron-Driveを提案する。
我々は6つの公開ベンチマークで評価を行い、3つの未確認データセットでゼロショット転送を行い、RoboTron-Driveはすべてのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:18:39 GMT)
X-SAM: From Segment Anything to Any Segmentation [63.8] 大きな言語モデル(LLM)は、広い知識表現において強力な能力を示すが、本質的にはピクセルレベルの知覚的理解において不十分である。
テキスト化からテキスト化まで,セグメンテーションパラダイムを拡張したマルチモーダル大規模言語モデルフレームワークであるX-SAMを提案する。
インタラクティブな視覚的プロンプトで全てのインスタンスオブジェクトをセグメンテーションし、視覚的グラウンドでピクセルワイドな解釈能力を持つMLLMに権限を与える、Visual GrounDed (VGD)セグメンテーションと呼ばれる新しいセグメンテーションタスクを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:19:10 GMT)
SVGen: Interpretable Vector Graphics Generation with Large Language Models [61.6] 本稿では,自然言語記述と組み合わせた高品質なSVGの大規模データセットであるSVG-1Mを紹介する。
我々は、セマンティックガイダンスを強化するために、Chain of Thoughtアノテーション付きのサブセットを含む、SVGトレーニングペアに整合したテキストを作成する。
このデータセットに基づいて,自然言語入力からSVGコードを生成するエンド・ツー・エンド・モデルであるSVGenを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:00:24 GMT)
Think Before You Segment: An Object-aware Reasoning Agent for Referring Audio-Visual Segmentation [61.4] Ref-AVSは、対象のオブジェクトを所定の参照表現に基づいて可聴ビデオに分割することを目的としている。
本稿では,タスクをThink-Ground-Segmentプロセスに分解するTGS-Agentを提案する。
Ref-Thinkerはマルチモーダル言語モデルであり、テキスト、視覚、聴覚の手がかりを推論することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:05:09 GMT)
CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation [59.8] 境界表現(B-Rep)に基づくCAD生成のための最初のマルチモーダルフレームワークであるトポロジ予測器(CMT)を用いたカスケードMARを提案する。
具体的には、カスケードMARは、B-Repsに必須のエッジカウンタ面の先行情報を効果的にキャプチャすることができる。
マルチモーダルアノテーション付きB-Repモデルを含む大規模マルチモーダルCADデータセットmmABCを開発した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:07:52 GMT)
Beyond Brainstorming: What Drives High-Quality Scientific Ideas? Lessons from Multi-Agent Collaboration [59.4] 本稿では,構造化マルチエージェントの議論が独創的思考を超えうるかどうかを考察する。
研究提案を作成するための協調型マルチエージェントフレームワークを提案する。
エージェントベースのスコアリングと,新規性,戦略的ビジョン,統合深度といった領域にわたるヒューマンレビューを備えた包括的プロトコルを採用している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:59:18 GMT)
Neutralizing Token Aggregation via Information Augmentation for Efficient Test-Time Adaptation [59.1] TTA(Test-Time Adaptation)は、視覚変換器(ViT)を追加のトレーニングデータなしで分散シフトに適応するための有効なソリューションとして登場した。
推論コストを削減するために、プラグイン・アンド・プレイのトークン・アグリゲーション手法はViTに冗長なトークンをマージし、全処理されたトークンを減らす。
我々はこの問題をETTA(Efficient Test-Time Adaptation)として定式化し、推論遅延を低減しつつTTAの適応性を維持する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:16:17 GMT)
Thompson Exploration with Best Challenger Rule in Best Arm Identification [59.0] 本稿では,バンドイットフレームワークにおける固定信頼度最良腕識別問題について検討する。
我々は、トンプソンサンプリングと、ベストチャレンジャールールとして知られる計算効率の良いアプローチを組み合わせた新しいポリシーを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:59:38 GMT)
Improved Unbiased Watermark for Large Language Models [59.0] 本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:07:38 GMT)
RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.4] RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:59:34 GMT)
Dual-Expert Consistency Model for Efficient and High-Quality Video Generation [57.3] 本稿では,パラメータ効率の高いtextbfDual-Expert Consistency Model (DCM) を提案する。
提案手法は, ビデオ拡散モデル蒸留における専門的専門化の有効性を実証し, サンプリング工程を大幅に短縮して, 最先端の視覚品質を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:03:38 GMT)
Audio-Assisted Face Video Restoration with Temporal and Identity Complementary Learning [56.6] 各種のストリーミングビデオ歪みに対処するGAVN(General Audio-assisted Face Video Restoration Network)を提案する。
GAVNはまず、低解像度空間におけるフレーム間の時間的特徴をキャプチャし、フレームを粗く復元し、計算コストを節約する。
最後に、再構成モジュールは時間的特徴とアイデンティティ機能を統合し、高品質な顔ビデオを生成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:38:27 GMT)
DS$^2$Net: Detail-Semantic Deep Supervision Network for Medical Image Segmentation [55.9] 医用画像セグメンテーションのためのDetail-Semantic Deep Supervision Network (DS$2$Net)を提案する。
低レベルの詳細な機能と高レベルのセマンティック機能の両方をナビゲートする。
医用画像解析の最先端手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:57:36 GMT)
READ: Real-time and Efficient Asynchronous Diffusion for Audio-driven Talking Head Generation [55.6] 本稿では,最初のリアルタイム拡散変換器を用いた音声ヘッド生成フレームワークREADを提案する。
提案手法はまず,VAEを用いて高度に圧縮されたビデオ潜時空間を学習し,音声生成におけるトークン数を大幅に削減する。
また,READは,実行時間を大幅に短縮した競合する音声ヘッドビデオを生成することにより,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:50:17 GMT)
CryoGS: Gaussian Splatting for Cryo-EM Homogeneous Reconstruction [55.2] 低温電子顕微鏡(cryo-EM)は、分子構造をほぼ原子の分解能で決定するのに役立つ。
単一粒子Cryo-EMにおける中心的な計算課題は、分子の3次元静電ポテンシャルを再構築することである。
本稿では,GMMをベースとしたGMM法であるCryoGSを紹介し,Gaussian splattingとCryo-EM画像形成の物理を融合させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:24:43 GMT)
CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering [55.1] 非教師付き異常検出(UAD)は、通常のサンプルに対して入力画像の異常マスクをローカライズしようとする。
古典的マッチングタスクから借用したコストフィルタリングの概念をUAD問題に導入する。
本稿では,複数の特徴層にまたがるアテンションクエリとして,入力観測によって導かれるコストボリュームフィルタリングネットワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:20:56 GMT)
Charting Uncertain Waters: A Socio-Technical Framework for Navigating GenAI's Impact on Open Source Communities [53.8] 我々は、ソフトウェアプラクティス、ドキュメンテーション、コミュニティエンゲージメント、ガバナンスの4つの領域にわたるOSS開発をGenAI主導で破壊する中で、McLuhan氏のTetradにインスパイアされた社会技術的フレームワークを使用して、シナリオ駆動で概念的な探索を行い、コミュニティのレジリエンスのリスクと機会の両方を明らかにする。
このレンズを採用することで、OSSのリーダーや研究者は、単に技術的な不況に反応するのではなく、自分たちのエコシステムの未来を積極的に形作ることができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:54:15 GMT)
ToolGrad: Efficient Tool-use Dataset Generation with Textual "Gradients" [53.8] 以前の作業では、まずユーザクエリを生成し、続いてDFSのような複雑なツール使用アノテーションを使用して、ツール使用のLLMデータセットを合成する。
ToolGradはこのパラダイムを逆転させるエージェントフレームワークであるToolGradを紹介します。
このアプローチは、より複雑なツールの使用、低コスト、100%パスレートで生成されたデータセットであるToolGrad-5kにつながった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:04:00 GMT)
Forgetting: A New Mechanism Towards Better Large Language Model Fine-tuning [53.4] Supervised Fine-tuning (SFT) は、事前訓練された大規模言語モデル (LLM) において重要な役割を果たす。
各コーパス内のトークンを、モデルパフォーマンスを改善するのに有用かどうかに基づいて、正と負の2つの部分に分類することを提案する。
我々は、よく確立されたベンチマークで実験を行い、この忘れるメカニズムが全体のモデル性能を向上するだけでなく、より多様なモデル応答を促進することを発見した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:22:23 GMT)
Bridging Diffusion Models and 3D Representations: A 3D Consistent Super-Resolution Framework [53.3] 3次元超解像(3DSR)
新しい3Dガウス平滑型超解像フレームワーク。
MipNeRF360およびLLFFデータを用いた3DSRの評価を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:12:02 GMT)
QuantVSR: Low-Bit Post-Training Quantization for Real-World Video Super-Resolution [53.1] 実世界のビデオ超解像(VSR)のための低ビット量子化モデルを提案する。
キャリブレーションデータセットを用いて各レイヤの空間的および時間的複雑さを計測する。
我々はFPおよび低ビット分岐を改良し、同時最適化を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:35:59 GMT)
SimMLM: A Simple Framework for Multi-modal Learning with Missing Modality [52.9] モーダルを欠くマルチモーダル学習のためのシンプルで強力なフレームワークであるSimMLMを提案する。
SimMLMは、動的で学習可能なゲーティング機構を備えたDMoME(Dynamic Mixture of Modality Experts)アーキテクチャで構成されている。
SimMLMの主な革新はMoFe(MoFe)ランキングの損失の増加であり、より多くのモダリティが利用可能になるにつれてタスクの精度が向上または安定し続けることを保証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:01:13 GMT)
Self-Questioning Language Models [51.8] 本稿では,提案者がトピックを与えられ,解答者に対する質問を生成する非対称なセルフプレイフレームワークを提案する。
提案者と解答者はともに強化学習を通じて訓練される。
3桁の乗算、OMEGAベンチマークの代数問題、Codeforcesのプログラミング問題である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:23:53 GMT)
NEARL-CLIP: Interacted Query Adaptation with Orthogonal Regularization for Medical Vision-Language Understanding [51.6] textbfNEARL-CLIP (iunderlineNteracted quunderlineEry underlineAdaptation with ounderlineRthogonaunderlineL regularization)は、VLMベースの新しい相互モダリティ相互作用フレームワークである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:44:01 GMT)
DSOcc: Leveraging Depth Awareness and Semantic Aid to Boost Camera-Based 3D Semantic Occupancy Prediction [51.4] カメラによる3Dセマンティックアクセシビリティ予測(DSOcc)を促進するために,奥行き認識とセマンティック支援を活用することを提案する。
我々は,非学習法によりソフトな占有率の信頼度を算出し,画像特徴に乗じてボクセルに奥行きを知らせる,占有状態と占有階級推定を共同で行う。
特徴学習を向上する代わりに、よく訓練されたイメージセマンティックセグメンテーションと、その占有確率で複数のフレームを融合させて、占有率のクラス推論を支援する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:20:39 GMT)
RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation [51.4] RPCANet++は、RPCAの解釈可能性と効率的なディープアーキテクチャを融合したスパースオブジェクトセグメンテーションフレームワークである。
我々のアプローチは、緩やかなRPCAモデルを背景近似モジュール(BAM)、対象抽出モジュール(OEM)、画像復元モジュール(IRM)からなる構造化ネットワークに展開する。
さまざまなデータセットの実験では、RPCANet++がさまざまなイメージングシナリオの下で最先端のパフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:19:37 GMT)
From Cluster Assumption to Graph Convolution: Graph-based Semi-Supervised Learning Revisited [51.2] グラフベースの半教師付き学習(GSSL)は、長い間ホットな研究トピックだった。
グラフ畳み込みネットワーク (GCN) は, 有望な性能を示す主要な技術となっている。
本稿では3つの単純だが強力なグラフ畳み込み法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:01:32 GMT)
CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2] 本稿では,実行すべきタスクを実演する少数のユーザ記述型少数ショットを前提として,合成データセットを生成する手法を提案する。
我々は, CRAFTが生物, 医学, 常識質問応答(QA)の4つのタスクに対して, 大規模タスク特化学習データセットを効率的に生成できることを実証した。
実験の結果, CRAFT を用いたモデルでは, 一般 LLM をQA タスクで上回ったり, 一致させたりしていることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:15:05 GMT)
Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation [50.4] 現在の自己回帰拡散モデルは、ビデオ生成時に優れるが、一般的には短時間の時間に限られる。
長期ビデオ生成のためのマクロからマイクロプランニング(MMPL)を主眼としたプランニング・テーマ・ポピュレーション・フレームワークを提案する。
MMPLは、マイクロプランニングとマクロプランニングという2つの階層的なステージを通じて、ビデオ全体のグローバルなストーリーラインをスケッチします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:21:19 GMT)
Identity Theft in AI Conference Peer Review [50.2] 人工知能(AI)研究における科学的ピアレビュープロセスにおいて,新たに発見されたID盗難事例について論じる。
論文評価の操作に不正なレビュアープロファイルを作成することにより、不正直な研究者がピアレビューシステムをどのように活用するかを詳述する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:36:52 GMT)
CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [50.1] 本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:53:49 GMT)
STARE: Predicting Decision Making Based on Spatio-Temporal Eye Movements [49.9] 本稿では,意思決定環境の画像に生視や眼球修正の時系列から様々な消費者選択行動を予測するためのディープラーニングアーキテクチャを提案する。
STAREと複数のデータセット上の最先端の代替手段を比較し,眼球運動から消費者選択行動を予測することを目的とした。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:20:31 GMT)
RiemanLine: Riemannian Manifold Representation of 3D Lines for Factor Graph Optimization [49.8] 本稿では,3次元ラインの最小限の統一表現である textbfRiemanLine を紹介する。
私たちのキーとなるアイデアは、各行のランドマークをグローバルなコンポーネントとローカルなコンポーネントに分離することです。
ICL-NUIM, TartanAir, および総合ベンチマークを用いた実験により, 提案手法はより精度の高いポーズ推定とライン再構成を実現することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:27:38 GMT)
Hierarchical Event Memory for Accurate and Low-latency Online Video Temporal Grounding [49.5] オンラインビデオ時間グラウンド(OnVTG)の課題に取り組み、ビデオストリーム内で所定のテキストクエリに関連するイベントを特定する必要がある。
通常のビデオ時間グラウンドとは異なり、OnVTGは将来のフレームを観察することなく予測を行うモデルを必要とする。
イベントレベルの情報を様々な期間でモデル化するイベント提案に基づいて予測を行うイベントベースOnVTGフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:33:49 GMT)
Human Bias in the Face of AI: Examining Human Judgment Against Text Labeled as AI Generated [48.7] 本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。
ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:16:54 GMT)
OccLE: Label-Efficient 3D Semantic Occupancy Prediction [48.5] 3Dセマンティック占有予測は、直感的で効率的なシーン理解を提供する。
既存のアプローチは、完全な監督や、限られたガイダンスを提供し、最適以下のパフォーマンスを得るセルフスーパービジョンに依存している。
我々は,画像とLiDARを入力とし,限られたボクセルアノテーションで高い性能を維持するラベル効率のよい3Dセマンティックアクセシビリティ予測OccLEを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:55:08 GMT)
DOGR: Towards Versatile Visual Document Grounding and Referring [47.7] グラウンディングと参照機能は、詳細な理解とフレキシブルなユーザインタラクションを達成するために注目を集めています。
本稿では,2種類の高品質な文書データを生成するDOGR-Engineを提案する。
DOGR-Engineを用いて,3つの文書タイプにまたがる7つのグラウンドと参照タスクをカバーするベンチマークであるDOGR-Benchを構築した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:02:43 GMT)
Automated Bug Frame Retrieval from Gameplay Videos Using Vision-Language Models [47.6] 報告されたバグ記述に最もよくマッチする単一のフレームに、各動画を縮小するパイプラインを導入する。
このアプローチは手作業を大幅に削減し、トリアージと回帰チェックを高速化します。
ゲーム業界全体で品質保証チームや開発者に実践的なメリットを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:52:15 GMT)
Distributional Soft Actor-Critic with Three Refinements [47.5] 強化学習(Reinforcement Learning, RL)は、複雑な意思決定と制御タスクの解決に顕著な成功を収めた。
多くのモデルなしRLアルゴリズムは、不正確な値推定による性能劣化を経験する。
本稿では,これらの制限を克服し,Q値推定精度を向上させるために,DSACv1に3つの重要な改良点を導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:37:01 GMT)
Beyond the Leaderboard: Rethinking Medical Benchmarks for Large Language Models [46.8] MedCheckは、医療ベンチマーク用に設計された最初のライフサイクル指向アセスメントフレームワークである。
我々のフレームワークは、設計からガバナンスまで、ベンチマークの開発を5つの連続的な段階に分解し、46の医学的基準の包括的なチェックリストを提供する。
本分析では,臨床実践からの深い切り離し,無害な汚染リスクによるデータの整合性の危機,モデルロバスト性や不確実性認識といった安全クリティカルな評価の側面を体系的に無視することなど,全身的な問題を明らかにする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:11:40 GMT)
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs [46.5] ProMは,2つの異なるビット幅を選択的に使用することにより,奥行き分離可能な畳み込みネットワークを定量化するための簡単な手法である。
具体的には、ポイントワイズ畳み込みは3次重みに量子化され、残りの加群は8ビット重みを使用する。
PROMは、深度的に分離可能な畳み込みネットワークを3次と8ビットの重みに量子化する課題に対処する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:03:03 GMT)
SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild [46.3] ロングチェーン・オブ・シント(CoT)推論は、ルールベースの報酬を持つ単純な強化学習フレームワークを通じて自然に現れる。
LLama3-8B,Mistral-7B/24B,DeepSeek-Math-7B,Qwen2.5-math-7B,およびQwen2.5モデル0.5Bから32Bを含む10種類のベースモデルを対象としたゼロRLトレーニングについて検討した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:42:32 GMT)
On-Device Recommender Systems: A Comprehensive Survey [45.6] 従来のレコメンデータシステムは、過剰なリソース消費、応答遅延、およびプライバシとセキュリティリスクに悩まされている。
デバイス上のレコメンデータシステム(デバイスRS)は、エッジデバイスの能力を活用して、集中的なデータストレージ要件を最小化する。
DeviceRSの急速な普及にもかかわらず、これらの手法を体系的に導入し、分類し、対比するタイムリーな文献レビューが明らかに欠落している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:23:30 GMT)
Millions of inequivalent quadratic APN functions in eight variables [45.0] 偶数次元におけるほぼ完全非線形(APN)置換の唯一の例は、特定の二次APN関数にCCZ等価性を適用することで得られる。
我々は次元8の2次APN関数で3,775,599を構成し、総数は約600万と見積もる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:08:13 GMT)
Quantum Resource Management in the NISQ Era: Implications and Perspectives from Software Engineering [45.0] NISQデバイスの利用における資源の役割を分析し、量子ソフトウェア工学におけるその意義と意義を明らかにする。
我々は、量子資源推定(QRE)の分野を強化し、スケーラブルで信頼性の高い量子ソフトウェア開発へと進むことを目指している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:15:57 GMT)
Generative AI in Training and Coaching: Redefining the Design Process of Learning Materials [45.0] 我々は、AIが学習材料の設計プロセスにどのように統合され、その効率、教育的品質、そして人間のトレーナーとコーチの進化的な役割に与える影響を評価する。
教育と企業研修の専門職との質的なインタビューを通じて、以下の主要なトピックを特定した。
GenAIをベースにしたツールが、個人、組織、システム、戦略的レベルでトレーナーやコーチにうまく実装できるかを導出します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:42:43 GMT)
DBSCAN in domains with periodic boundary conditions [45.0] 本稿では,DBSCANアルゴリズムに基づく周期領域に埋め込まれたデータにクラスタリングアルゴリズムを適用する手法を提案する。
本研究では, 1次元, 2次元, 3次元の合成データを用いた提案手法の動作を実例に適用し, 乱流中の気泡のクラスター化を含む実例に適用する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:47:22 GMT)
CHARM: Collaborative Harmonization across Arbitrary Modalities for Modality-agnostic Semantic Segmentation [44.5] Modality-Agnostic Semantic (MaSS) は入力モダリティの任意の組み合わせにまたがる堅牢なシーン理解の実現を目的としている。
我々は、モダリティに特有な利点を保ちつつ、暗黙的にコンテンツをアライメントする新しい補完学習フレームワークであるCHARMを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:42:11 GMT)
Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment [44.5] Agnosticsは、言語毎のエンジニアリングを排除する、言語に依存しないポストトレーニングパイプラインである。
キーとなるアイデアは、外部から観測可能な振る舞いだけでコードを判断することであり、単一の検証者が任意の言語で記述されたソリューションをテストすることができる。
私たちは、言語に依存しないトレーニングデータセット(Ag-MBPP-X、Ag-Codeforces-X、Ag-LiveCodeBench-X)、トレーニングコード、使用可能な設定をリリースします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:30:55 GMT)
AD-FM: Multimodal LLMs for Anomaly Detection via Multi-Stage Reasoning and Fine-Grained Reward Optimization [43.9] 2つのシナジスティックな革新を通して制限に対処する包括的フレームワークを提案する。
まず、地域識別から集中検査までモデルをガイドする多段階議論的推論プロセスを導入する。
第2に、分類精度と局所化監督を組み込んだ微粒化報酬機構を開発する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:00:27 GMT)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [43.7] 大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。
これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。
モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。
エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:27:31 GMT)
OpenScan: A Benchmark for Generalized Open-Vocabulary 3D Scene Understanding [43.7] Open-vocabulary 3D scene understandingは、オブジェクトクラスの閉じたセットを超えて、新しいオブジェクトをローカライズし、分類することを目的としている。
既存のアプローチとベンチマークは、主にオブジェクトクラスのコンテキスト内のオープンな語彙の問題に焦点を当てている。
我々は、オブジェクトクラスを超えたオープンな語彙問題を探索するために、汎用オープン語彙3Dシーン理解(GOV-3D)と呼ばれるより困難なタスクを導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:38:53 GMT)
Stepsize anything: A unified learning rate schedule for budgeted-iteration training [43.5] 予算設定訓練は、所定の予算内で最適な学習を実現することを目的としている。
学習率のスケジュールは異なるネットワークやタスクのパフォーマンスを左右するが、その設計は理論的な基礎をほとんど欠いている。
本稿では,Unified Budget-Aware (UBA) スケジュールを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:37:34 GMT)
Unveiling the Landscape of Clinical Depression Assessment: From Behavioral Signatures to Psychiatric Reasoning [43.3] うつ病は世界中の何百万もの人に影響を及ぼす広範な精神疾患である。
ほとんどの研究は、限定的または非クリニカルな検証データに依存しており、実世界の有効性よりも複雑なモデル設計を優先することが多い。
C-MIND (C-MIND) は, 臨床神経精神医学的マルチモーダル診断データセットであり, 実際の病院訪問から2年以上経過した。
参加者は3つの構造化された精神医学タスクを完了し、情報的オーディオ、ビデオ、転写、機能的近赤外分光(fNIRS)信号が記録された専門家臨床医から最終診断を受ける。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:13:24 GMT)
ReferEverything: Towards Segmenting Everything We Can Speak of in Videos [42.9] 本稿では、自然言語で記述可能な、幅広い概念をビデオにセグメント化するためのフレームワークREMを提案する。
我々のキーとなる洞察は、生成モデルのアーキテクチャ全体を、ノイズの予測からマスクの潜伏率の予測にシフトさせることで、保存することである。
REMは、Ref-DAVISのようなドメイン内データセットの最先端のデータセットと同等に動作し、最大12IoUポイントのドメインを上回ります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:46:52 GMT)
TurboTrain: Towards Efficient and Balanced Multi-Task Learning for Multi-Agent Perception and Prediction [42.5] TurboTrainは、マルチエージェント認識と予測のための、新しくて効率的なトレーニングフレームワークである。
トレーニングプロセスの合理化によって、我々のフレームワークは、複雑なマルチステージトレーニングパイプラインを手動でチューニングし、チューニングする必要がなくなる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:46:40 GMT)
CaPulse: Detecting Anomalies by Tuning in to the Causal Rhythms of Time Series [42.5] 本稿では,時系列データの因果パルスに合わせた因果関係に基づく新しいフレームワークCaPulseを導入し,異常を効果的に検出する。
そこで本研究では,新しいマスク機構を備えた周期正規化フローを提案する。
7つの実世界のデータセットの実験は、CaPulseが既存のメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:57:06 GMT)
I$^3$-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation [42.4] textbfI$3$-MRecは、textbfModality textbfRecommendationのボトルネック原理を用いて、textbfInvariant Learningを使用する。
I$3$-MRec は、様々なモダリティを欠くシナリオで既存の最先端の MRS メソッドを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:29:50 GMT)
On the effectiveness of multimodal privileged knowledge distillation in two vision transformer based diagnostic applications [42.2] マルチモーダル特権知識蒸留(英: multimodal privileged knowledge distillation, MMPKD)は、モダリティを付加し、一様視覚モデル(unimodal vision model)を導出する訓練戦略である。
MMPKDは、入力画像中のROIをローカライズするアテンションマップのゼロショット機能を改善することができることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:14:54 GMT)
Deep Neural Network-Driven Adaptive Filtering [42.1] 本稿では、適応フィルタリング(AF)における長年にわたる一般化課題に対処するディープニューラルネットワーク(DNN)駆動のフレームワークを提案する。
コスト関数設計を明示的に重視する従来のAFフレームワークとは対照的に,提案フレームワークはパラダイムを直接的な勾配獲得に転換する。
この枠組みは、非ガウス的シナリオのスペクトルにわたる広範な数値実験によって検証される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:42:40 GMT)
Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL [41.8] CoA(Chain-of-Agents)は、大規模言語モデル(LLM)推論の新しいパラダイムであり、ネイティブなエンドツーエンドの複雑な問題解決を可能にする。
我々は, エージェント制御微調整のための多エージェント蒸留フレームワークを導入し, 最先端のマルチエージェントシステムをチェーン・オブ・エージェント・トラジェクトリに蒸留する。
次に、検証可能なエージェントタスクに対するエージェント強化学習を用いて、チェーン・オブ・エージェントの問題解決におけるモデルの能力をさらに向上する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:01:02 GMT)
Harnessing Large Language Models for Group POI Recommendations [41.8] グループPOIレコメンデーションシステムは、複数のユーザの集団的嗜好を満たすことを目的としている。
既存のアプローチは、2つの大きな課題に直面している。
グループPOIレコメンデーションに大規模言語モデルを活用する新しいフレームワークであるLLMGPRを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:45:47 GMT)
DeMo++: Motion Decoupling for Autonomous Driving [41.6] 動作意図を2つの異なるコンポーネントに分離するフレームワークであるDeMo++を提案する。
隣接するシーンにおける動き間の関係を探索するために,クロスシーンの軌道間相互作用機構を導入する。
DeMo++は、モーション予測(Argoverse 2とnuScenes)、モーション計画(nuPlan)、エンドツーエンド計画(SIM)など、さまざまなベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:07:17 GMT)
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference [40.7] 本稿では, 科学的普及, 株式, 地域福祉の基本的な目標を脅かす構造的危機をデータ駆動で診断する。
1) 著者一人当たりの出版率が過去10年で2倍以上に増加し, 毎年4.5紙以上になる, 2) 環境面では1回の会議の二酸化炭素排出量が1日当たりの排出を上回っている, (3) 心理的には, オンラインコミュニティの71%が否定的な感情を反映し, 35%がメンタルヘルスの懸念を反映している,という4つのストレス領域を同定した。
これに対し、ピアレビュー、プレゼンテーションを分離したCommunity-Federated Conference(CFC)モデルを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:08:27 GMT)
Live Music Models [40.6] 我々は,ライブ音楽モデルと呼ばれる音楽生成モデルの新たなクラスを導入する。
これらのモデルは、同期されたユーザ制御で、リアルタイムで音楽の連続的なストリームを生成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:18:21 GMT)
Deep Learning-based Scalable Image-to-3D Facade Parser for Generating Thermal 3D Building Models [40.4] 早期の改修計画には、レベル・オブ・ディテール(LoD)3の熱3Dモデルに基づくシミュレーションが必要である。
本稿では,コンピュータビジョンとディープラーニングの両方を用いて画像からジオメトリを抽出し,LoD3熱モデルを生成するパイプラインを提案する。
典型的なスウェーデンの住宅で試験され、SI3FPは約5%の誤差を窓と壁の比率で達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:48:53 GMT)
From Learning to Unlearning: Biomedical Security Protection in Multimodal Large Language Models [40.1] トレーニングサンプルは、個人情報や誤った知識を容易に含んでいる。
バイオメディジンのためのマルチモーダル大規模言語モデル学習のための最初のベンチマークを提案する。
MLLMU-Medに対する5つの非学習的アプローチを評価し,これらの手法が有害な知識の除去に限られた効果を示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:22:55 GMT)
BEVCon: Advancing Bird's Eye View Perception with Contrastive Learning [39.9] 本稿では,自律運転におけるバードアイビュー(BEV)知覚を改善するために設計された,対照的な学習フレームワークであるBEVConを紹介する。
BEVConは、最先端のベースラインよりも最大2.4%のmAP改善を達成し、一貫したパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:59:37 GMT)
BrainSegDMlF: A Dynamic Fusion-enhanced SAM for Brain Lesion Segmentation [39.7] 脳画像における実質的な脳病変は、病変領域と正常な脳組織の間に不明瞭な境界を持つ高い異種性を示す。
単一スライスにおける小病変の同定は困難であり, 異常領域の正確な再現性セグメンテーション, 特徴記述は非常に複雑である。
既存の手法には次のような制限がある: 1) 診断に一般的に使用されるマルチモーダル情報を無視し、学習に単一モーダル情報のみに依存する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:58:16 GMT)
Foundation Neural-Networks Quantum States as a Unified Ansatz for Multiple Hamiltonians [39.5] Foundation Neural-Network Quantum States (FNQS)は、量子多体システムを研究するための統合パラダイムである。
FNQSは基礎モデルの鍵となる原理を活用し、単一の汎用アーキテクチャに基づいて変動波動関数を定義する。
FNQSは、訓練中に遭遇した以上の物理ハミルトニアンに一般化することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:28:11 GMT)
Occupancy Learning with Spatiotemporal Memory [39.4] 本稿では,時間的整合性のある3次元占有特徴を効果的に学習するシーンレベルの占有表現学習フレームワークを提案する。
提案手法は,多フレーム入力間の時間的依存性を利用して,3次元占有予測タスクの時間的表現を著しく向上させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:59:52 GMT)
Bob's Confetti: Phonetic Memorization Attacks in Music and Video Generation [36.2] 生成モデルにおける記憶は、冗長テキストの再生をはるかに超えている。
我々は、これらのタスクで訓練されたモデルが著作権のあるコンテンツを漏洩する、新しい種類のモダリティ記憶方法を明らかにした。
音韻的に類似するが意味的に無関係な歌詞を用いて、記憶された曲を再学習するよう促すことができることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:06:47 GMT)
Uni3R: Unified 3D Reconstruction and Semantic Understanding via Generalizable Gaussian Splatting from Unposed Multi-View Images [36.1] スパース2Dビューから3Dシーンを再構築し、意味的に解釈することは、コンピュータビジョンの根本的な課題である。
本稿では,オープンな語彙意味論に富んだ統一された3次元シーン表現を共同で再構築する,新しいフィードフォワードフレームワークであるUni3Rを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:42:59 GMT)
Gradient-Based Multi-Objective Deep Learning: Algorithms, Theories, Applications, and Beyond [35.8] 本稿では,多目的深層学習のための勾配に基づく手法を包括的に調査する。
既存のアルゴリズムを出力に基づいて体系的に分類する。
この分類に加えて、この調査は理論分析、重要な応用、実践的資源をカバーし、今後の研究に向けたオープンな課題と有望な方向性を強調している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:47:04 GMT)
Low-skilled Occupations Face the Highest Upskilling Pressure [34.8] 我々は,新しい技術がタスクに取って代わるにつれて,仕事の内容をいかに進化させるかを検討する。
近年の研究では、2010年代におけるSTEMの職業にとって、スキル要件の変更が最も重要であることが判明している。
スキル間の距離を考慮に入れれば,低いスキルを持つ職業にとって,スキル変革が最善であることが分かっています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:33:03 GMT)
Reliable Evaluation Protocol for Low-Precision Retrieval [34.7] スコア変動を低減するために,より堅牢な検索評価プロトコルを提案する。
本研究は,(1)計算コストを最小に抑えるため最終採点段階を高い精度に引き上げるHPS(High-Precision Scoring),(2)予測スコア,範囲,偏差を報告するTRM(Tie-Aware Retrieval Metrics)から構成される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:48:59 GMT)
EmoSteer-TTS: Fine-Grained and Training-Free Emotion-Controllable Text-to-Speech via Activation Steering [34.6] EmoSteer-TTSは、きめ細かい音声感情制御を実現するための、新しい訓練不要のアプローチである。
EmoSteer-TTSは、音声感情のきめ細かな、解釈可能な、連続的な制御を可能にし、最先端(SOTA)よりも優れている
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:54:21 GMT)
Static and Plugged: Make Embodied Evaluation Simple [34.4] 身体的知性は急速に進歩し、効率的な評価の必要性が増している。
現在のベンチマークは通常、インタラクティブなシミュレートされた環境や現実世界のセットアップに依存している。
静的シーン表現を用いた統一評価を可能にするプラグイン・アンド・プレイベンチマークであるStaticEmbodiedBenchを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:42:56 GMT)
Surf3R: Rapid Surface Reconstruction from Sparse RGB Views in Seconds [34.4] Surf3Rは、カメラのポーズを見積もることなく、スパースビューから3D表面を再構築するエンドツーエンドのフィードフォワードアプローチである。
提案手法では,複数参照ビューが共同で再構成プロセスをガイドするマルチブランチ・マルチビューデコーディングアーキテクチャを採用している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:53:42 GMT)
UltraSTF: Ultra-Compact Model for Large-Scale Spatio-Temporal Forecasting [34.0] 我々は,超コンパクトな形状のバンクコンポーネントとクロス周期予測コンポーネントを統合したUltraSTFを提案する。
本モデルでは,形状バンク成分の注意機構を用いて時系列の繰り返しパターンを効率的にキャプチャする。
UltraSTFは、LargeSTベンチマークの最先端のパフォーマンスを達成し、第2のベストメソッドで要求されるパラメータの0.2%未満を活用している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:04:42 GMT)
State-Agnostic Approach to Certifying Electron-Photon Entanglement in Electron Microscopy [33.7] 本稿では,コヒーレントカソードルミネッセンス過程から自然に生じる電子と光子の絡み合いを証明するためのプロトコルを提案する。
我々の研究は、フォトニック量子情報技術と電子顕微鏡を統合している。
原子スケールでの絡み合いに基づくイメージングの基礎を確立し、放射線被曝を減らすための潜在的経路を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:03:44 GMT)
A Comprehensive Framework for Uncertainty Quantification of Voxel-wise Supervised Models in IVIM MRI [33.7] 混合密度ネットワーク(MDN)のディープアンサンブルに基づく確率論的ディープラーニングフレームワークを提案する。
MDNはDとfのパラメータに対してより校正され、よりシャープな予測分布を生み出したが、D*ではわずかに過信が観察された。
本稿では,信頼できない推定値の同定と解釈を可能にする,不確実な定量化を伴うIVIMの包括的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:08:55 GMT)
A Lazy Resynthesis Approach for Simultaneous T Gate and Two-Qubit Gate Optimization of Quantum Circuits [33.6] T数削減のための最先端量子回路最適化(QCO)アルゴリズムは、しばしば2量子ゲート数(2Qカウント)を大幅に増加させる。
本稿では, クリフォード+T回路におけるTカウント最適化時に導入される2Qゲートのサージを著しく軽減する, 現代の卓上型QCO流に対する新しい遅延再合成手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:21:14 GMT)
Adaptive Coded Federated Learning: Privacy Preservation and Straggler Mitigation [33.6] トラグラーの負の影響を軽減するために、符号化された連合学習フレームワークが提案されている。
本稿では,この欠点を克服するために,適応符号化フェデレーション学習(ACFL)という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:37:24 GMT)
HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs [33.5] HiD-VAEは、2つのコアイノベーションを通じて階層的に切り離されたアイテム表現を学ぶ新しいフレームワークである。
第一に、HiD-VAEは階層的に制御された量子化プロセスの先駆者であり、離散コードとマルチレベルアイテムタグを整列する。
第二に、HiD-VAEは表現の絡み合いと戦うために、遅延空間の重なりを直接罰する新しい特異性損失を取り入れている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:45:05 GMT)
P-Aligner: Enabling Pre-Alignment of Language Models via Principled Instruction Synthesis [33.5] 大規模言語モデル(LLM)は、人間のユーザとのインタラクションにおいて、安全で有用な、誠実なコンテンツを生み出すことが期待されている。
LLMはしばしば、欠陥のある命令が与えられたとき、そのような値と一致しない。
P-Aligner(P-Aligner)は、より人間に好まれる形で表現されながら、オリジナルのインテントを保存する命令を生成する軽量モジュールである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:51:38 GMT)
Large Language Models Reasoning Abilities Under Non-Ideal Conditions After RL-Fine-Tuning [33.3] 脳科学的な知見によって導かれる新たな研究の方向性を紹介する。
本稿では,3つの大規模言語モデル (LLM) と,RL(Reinforcement Learning) を用いた最先端の大規模視覚言語モデル (LVLM) を代表的なポリシー勾配アルゴリズムを用いて微調整する。
その結果、RLファインチューニングは、理想的な設定下でのベースライン推論を改善するが、3つの非理想シナリオ全てで性能は著しく低下することがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:51:29 GMT)
LayerT2V: Interactive Multi-Object Trajectory Layering for Video Generation [33.3] テキスト・トゥ・ビデオ(T2V)生成における物体の運動軌跡の制御は困難であり、比較的探索されていない領域である。
本稿では、背景と前景のオブジェクト層を層別に合成することで、ビデオを生成するための第1のアプローチであるLayerT2Vを紹介する。
実験では、複雑なマルチオブジェクトシナリオを生成する上でLayerT2Vが優れていることを示し、mIoUとAP50のメトリクスがSOTA(State-of-the-art)メソッドよりも1.4倍、4.5倍改善されていることを示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:03:16 GMT)
Context-Adaptive Multi-Prompt Embedding with Large Language Models for Vision-Language Alignment [33.2] 本稿では,視覚言語によるコントラスト学習における意味表現を豊かにするための新しい手法を提案する。
プリトレーニング済みのLLMをCLIPフレームワーク内のテキストエンコーダとして利用し、すべてのプロンプトを1つのフォワードパスで共同処理します。
結果として得られる即時埋め込みは統一されたテキスト表現に統合され、視覚的特徴とのセマンティックにリッチなアライメントを可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:51:06 GMT)
Audio Does Matter: Importance-Aware Multi-Granularity Fusion for Video Moment Retrieval [33.1] Video Moment Retrieval (VMR)は、特定のクエリに関連する特定のモーメントを検索することを目的としている。
既存のVMRメソッドの多くは、補完的ではあるが重要なオーディオのモダリティを無視しながら、視覚的およびテキスト的モダリティにのみ焦点をあてている。
本稿では,VMRの音声ビジョンコンテキストを動的かつ選択的に集約する,新しいImportance-Aware Multi-Granularity fusion Model (IMG)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:58:43 GMT)
$\text{S}^2$Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation [32.9] ビデオ拡散モデル(V-DM)は非常に長いトークンシーケンスをもたらし、高いキャリブレーション分散と学習課題をもたらす。
textbf$textS2$Q-VDiTは、textbfSalientデータとtextbfSparseトークンの蒸留を利用するV-DMのトレーニング後量子化フレームワークである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:12:29 GMT)
Diffusion Models are Secretly Exchangeable: Parallelizing DDPMs via Autospeculation [32.7] 本稿では,広く使われている投機的復号アルゴリズムをDDPMに拡張したemphAutospeculative Decoding (ASD)を紹介する。
我々の理論的分析は、ASDが$tildeO (Kfrac13)$並列実行速度を$K$ステップDDPMで達成していることを示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:30:24 GMT)
RAIDX: A Retrieval-Augmented Generation and GRPO Reinforcement Learning Framework for Explainable Deepfake Detection [32.5] RAIDXはRetrieval-Augmented Generation (RAG)とGroup Relative Policy Optimization (GRPO)を統合した新しいディープフェイク検出フレームワークである。
RAGは、検出精度を向上させるために外部知識を取り入れ、GRPOを使用して、詳細なテキスト説明とサリエンシマップを自律的に生成する。
複数のベンチマークの実験では、RAIDXが実または偽の識別に有効であることを示し、テキスト記述と正当性マップの両方に解釈可能な有理性を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:08:16 GMT)
Pinco: Position-induced Consistent Adapter for Diffusion Transformer in Foreground-conditioned Inpainting [32.0] ピンコ (Pinco) は、テキストアライメントの優れた高品質な背景を生成する、前景条件の塗装アダプターである。
本手法は, 前景塗装における優れた性能と効率性を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:14:21 GMT)
Data Dependency Inference for Industrial Code Generation Based on UML Sequence Diagrams [31.9] 本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:58:28 GMT)
SPADE-S: A Sparsity-Robust Foundational Forecaster [31.8] SPADE-Sは、マグニチュードとスパシティベースの体系的バイアスを著しく低減し、全体的な予測精度を向上させる頑健な予測アーキテクチャである。
本研究では,SPADE-Sが予測精度を最大15%向上できることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:19:32 GMT)
Assessing Agentic Large Language Models in Multilingual National Bias [31.7] 推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。
この研究は、このギャップに最初に対処する。
複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:46:39 GMT)
VISO-Grasp: Vision-Language Informed Spatial Object-centric 6-DoF Active View Planning and Grasping in Clutter and Invisibility [31.5] VISO-Grasp(VISO-Grasp)は、厳しい環境下での把握のための可視性制約に対処するために設計された視覚インフォームドシステムである。
マルチビュー不確実性駆動型グリップ融合機構を導入し, グリップ信頼度と方向の不確実性をリアルタイムに改善する。
VISO-Graspは、目標指向のグリップにおいて87.5%の成功率を達成し、ベースラインを上回る最少のグリップの試みを達成している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:19:50 GMT)
OmniDepth: Bridging Monocular and Stereo Reasoning with Latent Alignment [31.1] OmniDepthはモノクロおよびステレオのアプローチを3次元推定にブリッジする統合フレームワークである。
その中核として、新しいクロスアテンタティブアライメント機構は、ステレオ仮説表現とモノクロコンテキストキューを動的に同期させる。
この相互アライメントは、立体幾何学で単分子の深さを精製しながら単分子構造を前もって注入することにより、立体の曖昧さ(例えば、特異面)を解消する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:31:22 GMT)
Uncertainty Quantification for Surface Ozone Emulators using Deep Learning [31.1] 2023年時点で、世界の人口の94%が安全でない汚染にさらされている。
従来の物理学に基づくモデルは、人間の健康への影響に関連するスケールの実践的使用において不足している。
我々は,マルチmOdelマルチcOnstituent Chemicalデータ同化モデルの表面オゾン残差を予測するために,不確実性を考慮したU-Netアーキテクチャを実装した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:22:06 GMT)
Leveraging Deep Learning for Physical Model Bias of Global Air Quality Estimates [31.1] 表面オゾンMOMO-Chemモデル残差を推定する2次元畳み込みニューラルネットワークアーキテクチャを用いる。
我々は,高解像度衛星画像からの土地利用情報の導入がモデル推定に及ぼす影響を評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:24:32 GMT)
Transferring Expert Cognitive Models to Social Robots via Agentic Concept Bottleneck Models [30.9] 我々は,マルチモーダルミーティングデータを解析し,ファシリテータに離散的な手がかりを提供するソーシャルロボット共同ファシリテータを開発した。
私たちのコアコントリビューションは、FMの幅広い社会的理解を専門的で透明なCBMに蒸留するトランスファーラーニングフレームワークです。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:24:06 GMT)
IS-Bench: Evaluating Interactive Safety of VLM-Driven Embodied Agents in Daily Household Tasks [30.5] 対話型安全性のために設計された最初のマルチモーダルベンチマークであるIS-Benchを紹介する。
高忠実度シミュレーターでインスタンス化された388のユニークな安全リスクを持つ161の挑戦的なシナリオが特徴である。
これは、特定のリスク発生ステップの前/後においてリスク軽減アクションが実行されるかどうかを検証する、プロセス指向の新たな評価を容易にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:59:39 GMT)
StepFun-Formalizer: Unlocking the Autoformalization Potential of LLMs through Knowledge-Reasoning Fusion [30.5] 効果的な自己形式化のための2つの重要な能力を特定する。
我々は、両方の能力を改善するデータ合成およびトレーニングパイプラインであるThinkingFを紹介します。
結果の7Bと32Bモデルは、包括的な形式的知識と強い形式的・形式的推論の両方を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:28:22 GMT)
Beyond Wide-Angle Images: Structure-to-Detail Video Portrait Correction via Unsupervised Spatiotemporal Adaptation [30.5] そこで我々は,ImagePC という構造と細かな人物像の補正モデルを提案する。
変換器の長距離認識と拡散モデルの多段階分極を統一的なフレームワークに統合する。
ビデオラベル取得の高コストを考えると、未ラベル広角ビデオ(終値ビデオPC)に ImagePC を再利用する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:43:38 GMT)
Repurposing 2D Diffusion Models with Gaussian Atlas for 3D Generation [30.4] 本研究では,高密度な2次元格子を用いた新しい表現を導入し,2次元拡散モデルの微調整により3次元ガウスモデルを生成する。
実験結果から,テキスト・画像拡散モデルが3次元コンテンツ生成に効果的に適応できることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:40:53 GMT)
Thinking With Videos: Multimodal Tool-Augmented Reinforcement Learning for Long Video Reasoning [29.8] マルチモーダル大言語モデル(MLLM)は、ビデオ質問応答や時間的接地といった下流タスクに不可欠である。
本稿では,ツール・アグリゲード・ラーニング(VITAL)による映像インテリジェンスを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:03:21 GMT)
Sign Spotting Disambiguation using Large Language Models [29.8] 本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:34:07 GMT)
Synthesizing Near-Boundary OOD Samples for Out-of-Distribution Detection [29.6] 我々は,CLIPモデルを微調整するために,基礎モデルを利用して合成・挑戦的なOODデータを生成する新しいアプローチであるSynOODを提案する。
本手法は,MLLMからの文脈的プロンプトによって導かれる反復的インペイントプロセスを用いて,ニュアンス・バウンダリ・アラインなOODサンプルを生成する。
大規模なImageNetベンチマークで最先端のパフォーマンスを実現し、パラメータとランタイムが最小限に増加する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:19:23 GMT)
A Comparative Study of Specialized LLMs as Dense Retrievers [29.5] 本研究では,大規模言語モデル(LLM)におけるタスク固有適応が検索能力にどのように影響するかを系統的に検討する。
我々は,Qwen2.5 7B LLMをベース,命令調整,コード/マス特化,長い推論,視覚言語モデルを含む8つの実験を行った。
数学的特殊化と長い推論能力は、3つの設定で一貫した劣化を引き起こし、数学的推論とセマンティックマッチングの矛盾を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:11:23 GMT)
Tensorized Clustered LoRA Merging for Multi-Task Interference [29.5] マルチタスク設定では、ヘテロジニアスソースでトレーニングされたLoRAアダプタをマージすると、しばしばtextittaskの干渉が発生し、下流のパフォーマンスが低下する。
本稿では,タスクの干渉に対処するために,テンソル化されたクラスタ化LoRAライブラリを提案する。
TC-LoRAはPhi-3で+1.4%、Mistral-7Bで+2.3%の精度を達成し、LCM適応におけるTC-LoRAの有効性を示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:26:43 GMT)
Four-mode quantum sensing and Fisher information in a spin-orbit-coupled Bose gas [29.3] 系が自然に$mathfraksu(4)$環に6つのSU(2)部分空間を持つ4モードモデルを構築することができることを示す。
その結果, 2モードモデルを超えて, SOCにより誘導される4モードカップリングにより, よりリッチな絡み合いの知覚がもたらされることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:09:12 GMT)
Boost Post-Training Quantization via Null Space Optimization for Large Language Models [28.6] 既存の大規模言語モデル(LLM)の学習後量子化手法は驚くべき成功を収めている。
余分な性能向上は、既存の量子化戦略がより圧縮されたモデルの開発を支援するには不十分であることを示唆している。
我々は、量子化後の重みを入力アクティベーションのヌル空間内に配置することで、量子化誤差を効果的に緩和することができると論じる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:30:43 GMT)
Data Driven Insights into Composition Property Relationships in FCC High Entropy Alloys [28.5] 構造的高エントロピー合金(HEA)は、様々な分野にわたる技術の進歩に不可欠である。
統合化学、プロセス、構造、および特性データの不足は、予測的特性モデリングに重大な課題をもたらす。
この研究は、いくつかの感度分析を示し、機械的挙動に対する重要な要素的貢献を強調している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:41:15 GMT)
ContextASR-Bench: A Massive Contextual Speech Recognition Benchmark [28.3] 自動音声認識システムの言語能力を評価するためにContextASR-Benchを提案する。
最大4万のデータエントリを含み、10ドメインに30万以上の名前付きエンティティがある。
LALMは、LLMの強い世界知識とコンテキストモデリングのおかげで、従来のASRモデルよりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:10:17 GMT)
FeDaL: Federated Dataset Learning for Time Series Foundation Models [28.3] 本稿では,フェデレートデータセット学習(FeDaL)手法を提案する。
FeDaLは、ドメインバイアス除去(DBE)とグローバルバイアス除去(GBE)の2つの相補的なメカニズムを追加することによって、局所バイアスとグローバルバイアスの両方を明示的に緩和する。
データボリューム、クライアント数、結合率は、分散化下でのモデルパフォーマンスにどのように影響するかを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:14:31 GMT)
Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs [28.2] 下流の多様なタスクに対する差別表現を学習する新しいフレームワークであるUniMEを紹介する。
最初の段階では、強力なLLMベースの教師モデルからテキスト識別的知識蒸留を行う。
第2段階では、識別表現学習をさらに進めるために、強陰性強化命令チューニングを導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:57:18 GMT)
Learning richness modulates equality reasoning in neural networks [28.1] 多層パーセプトロン(MLP)における等式推論の理論を開発する。
人間と動物の平等推論は、同様に神経回路の学習豊かさに依存する可能性がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:57:17 GMT)
Grounding Emotion Recognition with Visual Prototypes: VEGA -- Revisiting CLIP in MERC [28.0] 会話におけるマルチ感情認識は、テキスト、音響、視覚信号の複雑な相互作用のため、依然として困難な課題である。
本稿では,統合と分類プロセスにクラスレベルの視覚的意味論を導入する新しいビジュアル感情ガイドアンコリング(VEGA)機構を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:43:58 GMT)
VisionTS++: Cross-Modal Time Series Foundation Model with Continual Pre-trained Visual Backbones [28.0] 大規模時系列データセット上で連続的な事前学習を行うビジョンモデルに基づくTSFMであるVisionTS++を提案する。
本研究は,クロスモーダルな知識伝達のための新たなパラダイムを確立し,汎用TSFMの開発を推進している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:17:09 GMT)
Temporal and Heterogeneous Graph Neural Network for Remaining Useful Life Prediction [27.5] 我々はTHGNN(Temporal and Heterogeneous Graph Neural Networks)という新しいモデルを導入する。
THGNNは、隣接するノードからの履歴データを集約し、センサーデータのストリーム内の時間的ダイナミクスと空間的相関を正確にキャプチャする。
包括的実験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:48:27 GMT)
MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning [27.2] 曲がったり、切られたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要です。
欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。
ゼロショット学習手法であるMultiADSを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:25:20 GMT)
PixCuboid: Room Layout Estimation from Multi-view Featuremetric Alignment [26.6] PixCuboidは,キュービイド形状の部屋配置推定のための最適化手法である。
エンド・ツー・エンドの最適化でトレーニングすることで、大きな収束盆地と滑らかなロスランドスケープを生み出す特徴写像を学習する。
徹底的な実験では、我々のアプローチを検証し、競争を著しく上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:27:50 GMT)
TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding [26.5] 本稿では,強化学習によるMLLMの長文ビデオ言語理解を推し進める時間ポリシー最適化(TSPO)を提案する。
我々のTSPOは、複数の長いビデオ理解ベンチマークで最先端のパフォーマンスを達成し、異なるビデオMLLM間での転送能力を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:03:36 GMT)
KG-Augmented Executable CoT for Mathematical Coding [26.0] KGA-ECoTは、問題を構造化タスクグラフに分解し、数学ライブラリからの正確な知識検索に効率的なGraphRAGを活用し、検証可能なコードを生成し、計算精度を確保する。
KGA-ECoTは既存のプロンプト法を著しく上回り、数点から10点を超える絶対精度の向上を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:07:35 GMT)
Iterative pseudo-labeling based adaptive copy-paste supervision for semi-supervised tumor segmentation [25.9] CTスキャンにおける腫瘍セグメント化のための反復的擬似ラベルに基づく適応的コピー・ペースト・インスペクション(IPA-CP)。
IPA-CPは、腫瘍の不確かさを適応増強に注入することを目的として、双方向不確実性に基づく適応増強機構を組み込んでいる。
社内データセットと公開データセットの両方の実験により、我々のフレームワークは医療画像のセグメント化において最先端のSSLメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:12:30 GMT)
Boosting Visual Knowledge-Intensive Training for LVLMs Through Causality-Driven Visual Object Completion [25.8] LVLM(Large Vision-Language Models)は近年大きな進歩を遂げている。
しかし、彼らのパフォーマンスは、深い視覚的知覚を必要とするタスクでは依然として不足している。
本稿では,新しい視覚的知識集約型タスクに基づく自己改善フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:54:49 GMT)
Hacking Hallucinations of MLLMs with Causal Sufficiency and Necessity [25.7] MLLM(Multimodal Large Language Models)は、視覚言語タスクにまたがる印象的な機能を示す。
彼らは幻覚に悩まされ、入力画像やテキストと意味的に矛盾する出力を生成する。
本稿では,因果完全性に基づく新しい強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:09:12 GMT)
HarmonyGuard: Toward Safety and Utility in Web Agents via Adaptive Policy Enhancement and Dual-Objective Optimization [25.6] 大規模な言語モデルにより、オープンなWeb環境でWebエージェントが自律的にタスクを実行することができる。
Web内の隠れた脅威が進化するにつれて、Webエージェントは、長時間の操作においてタスクパフォーマンスと新たなリスクのバランスをとるという課題に直面します。
我々は,政策強化と客観的最適化を活用し,実用性と安全性を両立させる多エージェント協調フレームワークであるHarmonyGuardを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:49:32 GMT)
Random Erasing vs. Model Inversion: A Promising Defense or a False Hope? [25.3] Model Inversion(MI)攻撃は、マシンラーニングモデルからプライベートトレーニングデータを再構築することで、重大なプライバシー上の脅威となる。
我々は、MI攻撃に対する防御として、その驚くべき効果を明らかにするためにランダム消去(RE)を探索する。
以上の結果から,REは従来のプライバシ保護技術と容易に統合可能な,シンプルかつ効果的な防御機構であることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:41:14 GMT)
ConvMix: A Mixed-Criteria Data Augmentation Framework for Conversational Dense Retrieval [25.1] 本研究では,対話型高密度検索のための混合基準フレームワークであるConvMixを提案する。
大規模言語モデルの助けを借りて,両面の妥当性判断拡張スキーマをスケーラブルに設計する。
広範に使用されている5つのベンチマーク実験の結果,我々のConvMixフレームワークで訓練された対話型高密度検索器は,従来のベースライン法よりも優れていた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:28:49 GMT)
VER-Bench: Evaluating MLLMs on Reasoning with Fine-Grained Visual Evidence [24.9] VER-Benchは、細かい視覚的手がかりを識別するMLLMの能力を評価する新しいフレームワークである。
VER-Benchの各質問には、視覚的手がかりとそれらに由来する質問関連推論という、構造化された証拠が伴っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:59:42 GMT)
DivCon-NeRF: Diverse and Consistent Ray Augmentation for Few-Shot NeRF [24.6] DivCon-NeRFは、多様性と一貫性の両方を高めるために、新しい球面ベースの線増量を導入している。
提案手法は,Blender,LLFF,DTUのデータセットにおいて,既存の数発のNeRF手法よりも優れている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:37:08 GMT)
Characterizing Deep Research: A Benchmark and Formal Definition [24.5] 本稿では,Deep Research (DR) タスクの形式的特徴付けと,DRシステムの性能評価のためのベンチマークを提案する。
ディープリサーチのコアとなる特徴は、レポートスタイルのアウトプットの生成ではなく、検索プロセスで必要となる概念に対する高いファンアウトである、と我々は主張する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:09:28 GMT)
Motion is the Choreographer: Learning Latent Pose Dynamics for Seamless Sign Language Generation [24.3] 我々は手話ビデオ生成のための新しいパラダイムを提案し、手話のセマンティクスを手話のアイデンティティから切り離す。
まず,シグナ非依存のマルチモーダルモーションレキシコンを構築し,各光沢を同一性に依存しないポーズ,ジェスチャー,および3Dメッシュシーケンスとして格納する。
このコンパクトな表現は、検索した光沢配列を時間的に一貫性のある運動軌跡に変換する離散から連続的な運動合成段階という、2つ目の重要なイノベーションを可能にします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:23:10 GMT)
GraphProp: Training the Graph Foundation Models using Graph Properties [24.3] 本研究は,グラフ分類などのグラフレベルのタスクにおいて,強力な一般化能力を有するグラフ基礎モデル(GFM)の訓練に焦点をあてる。
グラフ構造はノードの特徴やグラフラベルよりも整合性のあるクロスドメイン情報を提供する。
実験の結果,GraphPropは教師付き学習や少数ショット学習,特にノード属性のないグラフ処理において,競合相手よりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:12:42 GMT)
PET2Rep: Towards Vision-Language Model-Drived Automated Radiology Report Generation for Positron Emission Tomography [24.1] 放射線学の報告は臨床的意思決定に不可欠であるが、その手作業による作成は労働集約的で時間を要する。
近年の視覚言語モデル(VLM)の進歩は医療応用において大きな可能性を秘めている。
PET画像の放射線診断レポート生成のための一般医用VLMの評価ベンチマークであるPET2Repを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:46:51 GMT)
Empowering Time Series Forecasting with LLM-Agents [23.9] 時系列データ中心エージェントDCATSを提案する。
大規模交通量予測データセットを用いて,4つの時系列予測モデルを用いてDCATSを評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:14:08 GMT)
PAK-UCB Contextual Bandit: An Online Learning Approach to Prompt-Aware Selection of Generative Models and LLMs [23.9] 本研究では,与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
提案したPAK-UCBアルゴリズムは、腕に共通するコンテキスト変数を持つコンテキスト帯域(CB)設定に対処する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:02:01 GMT)
Thinking with Nothinking Calibration: A New In-Context Learning Paradigm in Reasoning Large Language Models [23.6] 我々は、大規模言語モデル(RLLM)を推論するための文脈内学習(ICL)パラダイムとして、思考を伴う思考(JointThinking)を提案する。
提案手法は,思考モードと思考モードの2つの回答を並列に生成する。
JointThinkingは、数発のチェーン・オブ・シークレット・ロバスト性(CoT)と、回答の改善による多数決を著しく上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:38:01 GMT)
CityLight: A Neighborhood-inclusive Universal Model for Coordinated City-scale Traffic Signal Control [23.6] CityLightは、2つの主要なモジュールで得られた表現に基づいて普遍的なポリシーを学ぶ。
97から13,952の交差点を含む5つの都市規模のデータセットの実験により、CityLightの有効性が確認された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:49:31 GMT)
Dual Prompt Learning for Adapting Vision-Language Models to Downstream Image-Text Retrieval [23.5] 画像テキストの正確なマッチングを実現するために,DCAR(Joint Category-Attribute Reweighting)を用いたデュアルプロンプト学習を提案する。
プロンプトパラダイムに基づいて、DCARは属性とクラスの特徴を協調的に最適化し、きめ細かい表現学習を強化する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:44:08 GMT)
Communication-Learning Co-Design for Differentially Private Over-the-Air Federated Distillation [23.5] 本研究では,学習収束率の最大化を目的とした,個人用無線FDにおけるコミュニケーション学習協調設計問題について検討する。
数値的な結果から,提案手法は通信オーバヘッドが大幅に低減された場合,より優れた学習プライバシトレードオフを実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:44:10 GMT)
4DVD: Cascaded Dense-view Video Diffusion Model for High-quality 4D Content Generation [23.4] 分離された方法で4Dコンテンツを生成するビデオ拡散モデルである4DVDを提案する。
4DVDをトレーニングするために、ベンチマークからD-averseと呼ばれる動的3Dデータセットを収集します。
新規なビュー合成と4次元生成の両面での最先端性能を実証する実験を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:08:36 GMT)
SLR: Automated Synthesis for Scalable Logical Reasoning [23.1] 大規模言語モデル(LLM)の体系的評価と訓練のためのエンドツーエンドフレームワークであるSLRを紹介する。
ユーザのタスク仕様を前提として、SLRは帰納的推論タスクの命令プロンプトを自動で生成する。
SLRを用いて、20のカリキュラムレベルに分類した19kプロンプトからなるベンチマークであるSLR-Benchを作成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:09:52 GMT)
Enhancing Dialogue Annotation with Speaker Characteristics Leveraging a Frozen LLM [23.1] 本稿では,話者特性にメタデータタグを付加することにより,書き起こし対話を充実させる,補足後処理のステップについて検討する。
提案手法では,Whisper や WavLM などのフリーズオーディオ基礎モデルと,これらの話者属性を推定するためのLLAMA言語モデルを組み合わせる。
軽量で効率的なコネクタを用いて音声と言語表現をブリッジし、話者プロファイリングタスクにおける競合性能を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:14:04 GMT)
A dataset of primary nasopharyngeal carcinoma MRI with multi-modalities segmentation [22.9] このデータセットは、T1重み付き、T2重み付き、およびコントラスト強化T1重み付きシーケンスを含み、合計で831スキャンである。
対応する臨床データに加えて、経験者による手動注釈とラベル付きセグメンテーションは、未処理の一次NPCから高品質なデータ資源を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:20:59 GMT)
IFDECORATOR: Wrapping Instruction Following Reinforcement Learning with Verifiable Rewards [22.8] Instruct following Decorator(IFDecorator)は、RLVRトレーニングを堅牢でサンプル効率のよいパイプラインにラップするフレームワークである。
我々のQwen2.5-32B-Instruct-IFDecoratorはIFEvalで87.43%の精度を達成し、GPT-4oのようなより大きなプロプライエタリモデルよりも優れている。
私たちのトリップワイヤは、報酬のハッキング率を大幅に低下させています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:00:54 GMT)
LuKAN: A Kolmogorov-Arnold Network Framework for 3D Human Motion Prediction [22.7] 人間の3D動作予測の目的は、過去の動きデータに基づいて、人体の将来的な3Dポーズを予測することである。
本稿では,Lucas アクティベーションを備えた Kolmogorov-Arnold Networks (KANs) に基づく効果的なモデルである LuKAN を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:50:47 GMT)
Toward A Causal Framework for Modeling Perception [22.6] 機械学習(ML)における認識
本稿では,知覚を因果的にモデル化するための最初のアプローチを提案する。
我々は2種類の確率因果知覚(構造とパラメトリック)を定義した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:33:43 GMT)
Time Evidence Fusion Network: Multi-source View in Long-Term Time Series Forecasting [22.6] 本稿では,情報融合の観点から,Time Evidence Fusion Network (TEFN) という新しいバックボーンアーキテクチャを提案する。
提案したTEFNは精度、効率、安定性、解釈可能性のバランスをとり、時系列予測に望ましい解である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:33:07 GMT)
FedHiP: Heterogeneity-Invariant Personalized Federated Learning Through Closed-Form Solutions [22.4] 我々は、勾配に基づく更新を避けるために、解析的(つまり、クローズドフォーム)な解を通じて、FedHiPと呼ばれる不均質不変な個人化フェデレーション学習スキームを提案する。
提案手法は,分析的局所学習,分析的グローバルアグリゲーション,分析的局所パーソナライゼーションの3段階を含む。
ベンチマークデータセットの実験は、我々のFedHiPスキームの優位性を検証し、最先端のベースラインを少なくとも5.79%-20.97%の精度で上回った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:15:57 GMT)
Excavate the potential of Single-Scale Features: A Decomposition Network for Water-Related Optical Image Enhancement [22.4] 単一スケールの特徴抽出は、マルチスケールメソッドのパフォーマンスにマッチするか、上回る可能性がある。
SSD-Netは、CNNのローカル機能抽出機能とTransformerのグローバルなモデリング長所を組み合わせる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:41:58 GMT)
Model Inversion Attacks on Vision-Language Models: Do They Leak What They Learn? [22.2] モデル反転(MI)攻撃は、トレーニングされたニューラルネットワークからプライベートトレーニングデータを再構築することで、重大なプライバシーリスクを引き起こす。
視覚訓練データを漏洩する際の視覚言語モデル(VLM)の脆弱性を理解するための最初の研究を行う。
本稿では,新しいトークンベースおよびシーケンスベースモデルインバージョン戦略を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:30:05 GMT)
Face-voice Association in Multilingual Environments (FAME) 2026 Challenge Evaluation Plan [22.0] フェース・ボイス・アソシエーション・イン・マルチリンガル・アソシエーション(FAME) 2026 Challengeは、マルチリンガル・シナリオの下でのフェース・ボイス・アソシエーションの探求に焦点を当てている。
本報告では、FAME Challengeの課題、データセット、ベースラインモデル、タスクの詳細について説明する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:09:47 GMT)
Efficient rule induction by ignoring pointless rules [22.0] ポイントレスルールを識別するLPアプローチを導入する。
ルールが冗長リテラルを含んでいるか、負の例と区別できない場合、無意味である。
点のない規則を無視した場合、ICPシステムでは仮説空間を順調に引き起こすことができることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:58:27 GMT)
Hierarchical Text Classification Using Black Box Large Language Models [21.9] 階層的テキスト分類は、構造化ラベル階層にテキストを割り当てることを目的としている。
本研究は,HTCのAPIを通じてアクセスされるブラックボックスの大規模言語モデルの実現可能性について検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:53:50 GMT)
GeRe: Towards Efficient Anti-Forgetting in Continual Learning of LLM via General Samples Replay [21.9] 汎用サンプルリプレイ(GeRe)は,通常の事前学習テキストを効率的なアンチフォゲッティングに利用するフレームワークである。
我々は,事前コンパイルされた汎用リプレイサンプルの小さな固定セットが,両方の懸念を解決し,全体的な性能を向上しつつ,一般能力を維持できるのに十分であることを示す最初の試みである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:42:22 GMT)
Guided Navigation in Knowledge-Dense Environments: Structured Semantic Exploration with Guidance Graphs [21.8] 本稿では,非構造化クエリと構造化知識検索をブリッジする中間ガイダンスグラフを導入する新しいフレームワークを提案する。
Guidance Graphは、対象の知識の構造を抽象化し、より広い意味的コンテキストを保存することで、検索空間を定義する。
提案手法は,特に複雑なタスクにおいて,SOTAよりも優れた効率と性能を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:47:57 GMT)
Less is More: Token-Efficient Video-QA via Adaptive Frame-Pruning and Semantic Graph Integration [21.7] 過剰なフレームが文脈の希釈によってパラドックス的に性能を低下させる「レスはそれ以上」現象である。
視覚エコー」は「視覚エコー」という時間的冗長性を有する
AFP"は、ResNet-50とCLIPの機能空間に適応的な階層的クラスタリングアルゴリズムを用いて、これらのエコーを単一の代表に識別し、マージする。
我々の完全なアプローチは、必要なフレームを86.9%まで、合計入力トークンを83.2%まで劇的に削減することを示しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:41:10 GMT)
\textsc{SimInstruct}: A Responsible Tool for Collecting Scaffolding Dialogues Between Experts and LLM-Simulated Novices [21.7] SimInstructは、スキャフォールディングダイアログを収集するための、スケーラブルで専門的なループツールである。
SimInstructは、開発コーチングをサンプルドメインとして使用し、LLMを通して初心者インストラクターをシミュレートする。
その結果,外向性や内向性といったペルソナの特徴が,専門家の関わり方に有意な影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:16:10 GMT)
CCStereo: Audio-Visual Contextual and Contrastive Learning for Binaural Audio Generation [21.6] バイノーラルオーディオ生成(BAG)は、視覚的プロンプトを用いてモノラルオーディオをステレオオーディオに変換することを目的としている。
現在のモデルは、部屋の環境に過度に適合し、きめ細かい空間的詳細を失うリスクがある。
本稿では,音声-視覚条件正規化層を取り入れた新しい音声-視覚生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:02:56 GMT)
You Cannot Feed Two Birds with One Score: the Accuracy-Naturalness Tradeoff in Translation [21.6] 我々は,情報理論の最近の進歩を数学的に証明し,そのような単一スコアの要約がシステムの性能の完全な図面を与えていないことを実証するために構築した。
例えば、特定の精度のメートル法(BLEUなど)に翻訳システムを最適化することは、当初はシステムの自然性を改善するが、"オーバーフィッティング"のシステムは、その自然性を大幅に低下させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:50:53 GMT)
Dynamical generation of geometric squeezing in interacting Bose-Einstein condensates [21.4] ボース・アインシュタイン凝縮体(BECs)の幾何学的圧縮状態について検討する。
2体の衝突とBECを相互作用させる場合、類似のクエンチはスクイーズなしで周期的に振動する量子揺らぎにしかならない。
安定基準を戦略的に破ることにより、比較的短時間で指数関数的に量子ゆらぎを抑えるスクイーズを生成するための動的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:50:03 GMT)
ShoppingBench: A Real-World Intent-Grounded Shopping Benchmark for LLM-based Agents [21.4] 既存のeコマースのベンチマークは主に、商品の発見や購入といった基本的なユーザー意図に焦点を当てている。
提案するShoppingBenchは,新たなエンドツーエンドショッピングベンチマークである。
インタラクティブなシミュレート環境として機能し,250万以上の現実世界製品が組み込まれている大規模ショッピングサンドボックスを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:51:30 GMT)
GaSLight: Gaussian Splats for Spatially-Varying Lighting in HDR [21.4] GaSLightは、通常の画像から空間的に変化する光を生成する方法である。
ガウススプレートを用いて3次元照明をモデル化し,空間変動照明を実現する。
我々の手法はHDR推定の最先端結果をもたらす。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:08:46 GMT)
Reputation-based partition scheme for IoT security [21.3] クラウドセンシングは、データ駆動アプリケーションにおいて重要な役割を果たす、新たなデータ集約パラダイムである。
プラットフォームセキュリティやプライバシ保護といったクラウドセンシングの開発には,いくつかの重要な問題がある。
本稿では,評価に基づく効果的な分割方式(RSPC)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:27:59 GMT)
LLMs Have a Heart of Stone: Demystifying the Soft Thinking Ability of Large Reasoning Models [21.2] 本稿では,大規模言語モデル(LLM)のソフトな抽象トークン生成能力について検討する。
一般的な信念とは対照的に,LSMはその後の復号過程において,ソフトインプットの最も影響力のある要素に依存していることが明らかとなった。
この問題に対処するために,ディリクレ再サンプリングやGumbel-Softmax トリックなどの手法を用いて,エミュランドネスを導入するためのサンプリング戦略を検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:16:05 GMT)
p-MoD: Building Mixture-of-Depths MLLMs via Progressive Ratio Decay [20.7] p-MoDは、モデル性能を維持しながら、トレーニングと推論のコストを大幅に削減する効率的なMLLMアーキテクチャである。
我々は、Tanh-gateweight normalization (TanhNorm) と symmetric token reweighting (STRing) の2つの新しい設計でMoDモジュールを適応する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:57:39 GMT)
Modality and Task Adaptation for Enhanced Zero-shot Composed Image Retrieval [20.6] Zero-Shot Composed Image Retrieval (ZS-CIR) はバイモーダル (image+text) クエリを用いてターゲット画像を取得するように設計されている。
本稿では,2つのコンポーネントからなる軽量なポストホックフレームワークを提案する。
実験により,提案するコンポーネントを組み込むことで,インバージョンに基づく手法が大幅な改善を実現することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:58:08 GMT)
Parse Trees Guided LLM Prompt Compression [20.6] 本稿では、PartPromptと呼ばれる新しい選択的圧縮手法を提案する。
まず、言語規則に基づいて各文のパースツリーを取得し、パースツリーの各ノードのローカル情報エントロピーを算出する。
実験によると、PartPromptはさまざまなデータセットで最先端のパフォーマンスを受信している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:37:24 GMT)
Density of States (Gate) - Controlled Andreev Molecule and Sensor [20.4] トポロジカル量子コンピューティングは通常、ハイブリッド超伝導体-半導体デバイスで開発されたトポロジカルアンドリーフ境界状態(ABS)に依存している。
ゲート制御型Andreev分子を導入し、ある部位における状態密度の静電気的チューニングは、他の部位の臨界電流を非局所的に増強する。
我々は、アンドリーフ分子を多部位のキタエフ鎖に拡張し、パリティ・リードアウトのための単一クーパーペア電荷を非侵襲的に除去する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:03:53 GMT)
ICM-Fusion: In-Context Meta-Optimized LoRA Fusion for Multi-Task Adaptation [20.3] In-Context Meta LoRA Fusion (ICM-Fusion) は、メタラーニングとインコンテキスト適応を相乗化する新しいフレームワークである。
ICM-Fusion はマルチタスクの損失を大幅に減らし,数ショットのシナリオでタスクの強化を達成できることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:28:25 GMT)
RGB-Event based Pedestrian Attribute Recognition: A Benchmark Dataset and An Asymmetric RWKV Fusion Framework [20.2] 既存の歩行者属性認識法は一般にRGBフレームカメラに基づいて開発されている。
本稿では,低照度,高速,低消費電力のイベントカメラの利点から着想を得たマルチモーダルなRGB-Event属性認識タスクを提案する。
具体的には,大規模な歩行者属性認識データセットであるEventPARを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:01:24 GMT)
Navigating Cookie Consent Violations Across the Globe [20.2] 本研究では,クッキーバナーの動作を検出し解析するConsentChkというエンドツーエンドシステムを提案する。
世界中の8つの英語圏を調査し,世界中の1,793のウェブサイトでクッキーバナーの挙動を分析した。
我々の評価によると、同意管理プラットフォーム(CMP)とWebサイト開発者は、地域プライバシー法の解釈に基づいてクッキーバナーの設定をカスタマイズする可能性が高い。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:45:37 GMT)
egoPPG: Heart Rate Estimation from Eye-Tracking Cameras in Egocentric Systems to Benefit Downstream Vision Tasks [20.0] エゴセントリックな視覚システムは、動き、活動、相互作用を含む周囲と着用者の行動を理解することを目的としている。
我々は、自我中心のシステムは、人の注意と状況に対する反応を捉えるために、生理的状態を付加的に検出する必要があると論じている。
我々は,眼球運動追跡カメラから心電図の生理状態の指標として心拍数を抽出するPulseFormerを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:45:37 GMT)
A Differentiable Wave Optics Model for End-to-End Computational Imaging System Optimization [19.8] エンドツーエンドの最適化は、計算画像システム設計のための強力なデータ駆動方式として登場した。
複合光学のエンドツーエンド最適化のために光輸送における収差と回折の両方をモデル化することは困難である。
複合光学の収差と回折の両方を効率的にモデル化する微分可能な光学シミュレータを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:27:19 GMT)
When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails [19.8] ターゲットデータとラベルデータを生成する合成パイプラインを開発した。
提案手法は,計算コストのごく一部で競争性能を達成できることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:54:41 GMT)
Length Matters: Length-Aware Transformer for Temporal Sentence Grounding [19.7] 時間的文の接地は、未編集ビデオ内の時間的セグメントをローカライズすることを目的とした課題である。
本稿では,TSGのためのLongth-Aware Transformer(LATR)を提案する。
LATRの有効性を実証し、3つの公開ベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:34:58 GMT)
RACE-IT: A Reconfigurable Analog Computing Engine for In-Memory Transformer Acceleration [19.6] Transformer ModelはDeep Neural Networks(DNN)の最先端を表現している。
これらのモデルを処理するには、かなりの計算資源が必要で、結果としてかなりのメモリフットプリントが要求される。
本稿では、より広範な操作をサポートするために、Analog Content Addressable Memories (ACAM)を拡張した再構成可能なAnalog Computing Engine (RACE)を紹介する。
RACEに基づいて、トランスフォーマーモデルの効率的なアナログドメイン実行を実現するための RACE-IT アクセラレータ(インメモリトランスフォーマーの RACE の意味)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:22:57 GMT)
Multilingual Source Tracing of Speech Deepfakes: A First Benchmark [19.6] 本稿では,多言語音声のディープフェイクソーストレースのための最初のベンチマークを紹介する。
DSPおよびSSLに基づくモデリングを比較検討し、異なる言語で調整されたSSL表現が言語間一般化性能にどのように影響するかを検討する。
この結果から,学習言語と推論言語の違いによる音声生成モデル同定の課題について,総合的な知見が得られた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:11:36 GMT)
Automatic Synthesis of High-Quality Triplet Data for Composed Image Retrieval [19.5] Composed Image Retrieval (CIR)は、マルチモーダル(image+text)クエリを使ってターゲット画像を取得することを目的としている。
完全合成データセットであるComposeed Image Retrieval on High-quality Synthetic Triplets (CIRHS)とともに,自動三重項生成のためのスケーラブルパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:41:51 GMT)
Learning to Inference Adaptively for Multimodal Large Language Models [19.5] AdaLLaVA(アダプティブ・推論・フレームワーク)を導入し,MLLM内での演算の再構成を学習する。
以上の結果から,AdaLLaVAは入力レイテンシの予算に効果的に準拠し,実行時の精度やレイテンシのトレードオフが変化することがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:52:07 GMT)
RoboTron-Sim: Improving Real-World Driving via Simulated Hard-Case [19.5] 本稿では, シミュレーションしたハードケースを利用して, 現実の運転を改善するRoboTron-Simを提案する。
nuScenesの大規模な実験によると、RoboTron-Simは挑戦的なシナリオでの駆動性能を約50%改善している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:07:25 GMT)
CauKer: classification time series foundation models can be pretrained on synthetic data only [19.4] CauKerは、現実的な傾向、季節性、非線形相互作用を持つ多様で因果的に一貫性のある合成時系列を生成するように設計されている。
実験の結果,CauKerの生成したデータセットは,データセットサイズ(10Kから10Mサンプル)とモデルキャパシティ(1Mから783Mパラメータ)の両方に対して明確なスケーリング則を示すことがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:43:43 GMT)
Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise [19.4] 我々は、構造化潜在雑音サンプリングによる動き制御を可能とし、映像拡散モデルを強化した。
本稿では,ランダムな時空間のガウス性と相関した雑音を置き換え,リアルタイムに動作可能な新しいノイズワープアルゴリズムを提案する。
提案アルゴリズムの効率性により,ワープノイズを最小限のオーバーヘッドで使用することで,最新の映像拡散ベースモデルを微調整することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:27:53 GMT)
Need for zkSpeed: Accelerating HyperPlonk for Zero-Knowledge Proofs [19.4] ZKPはブロックチェーン技術、検証可能な機械学習、電子投票に応用されている。
最近の研究により、GPUとASICにおける最先端ZKPプロトコルの重要なプリミティブが加速された。
この研究は、最先端のZKPプロトコルであるHyperPlonkのアクセラレータであるzkSpeedを提示する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:30:01 GMT)
CARD: Cache-Assisted Parallel Speculative Decoding for Efficient Large Language Model Inference [19.1] 本稿では,'query-and-correct'パラダイムを用いた投機的復号化フレームワークを提案する。
CARDは、ドラフトと検証を分離する: ドラフトモデルは、共有キャッシュをポップアップさせる候補トークンを生成し、ターゲットモデルは、ドラフトモデルの生成方向を同時に修正する。
提案手法では,バニラ復号法よりも最大4.83高速化が可能であり,ドラフトモデルやターゲットモデルの微調整は不要である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:02:10 GMT)
DOMR: Establishing Cross-View Segmentation via Dense Object Matching [19.0] クロスビューオブジェクト対応には、エゴセントリック(第一人)とエゴセントリック(第三人)のビュー間のオブジェクトのマッチングが含まれる。
ビュー間の密接なオブジェクト対応を確立するために,Dense Object Matching and Refinement (DOMR) フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:23:37 GMT)
Bootstrap Deep Spectral Clustering with Optimal Transport [18.6] 実験結果から,BootSCは最先端のクラスタリング性能を実現することが示唆された。
BootSCは、ImageNet-Dogsデータセットに挑戦するランナーアップメソッドに対して、注目すべき16%のNMI改善を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:30:30 GMT)
How Far Can LLMs Improve from Experience? Measuring Test-Time Learning Ability in LLMs with Human Comparison [18.6] 我々は、テスト時間における経験に基づく、推論集約的なタスクのパフォーマンス向上能力であるテストタイム学習の評価を提唱する。
モデル性能を限定的および累積的な経験条件下で比較し、4種類の経験表現を含む客観的評価フレームワークを提案する。
以上の結果から,LSMは測定可能なテスト時間学習能力を示すが,累積的な経験下では改善は安定せず,人間よりも進行が遅いことが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:42:36 GMT)
Discovery of Disease Relationships via Transcriptomic Signature Analysis Powered by Agentic AI [18.6] 本研究は,1300以上の疾患条件のペアを解析し,病因関係を発見するためのトランスクリプトミクス駆動型フレームワークを提案する。
本研究では, マルチデータベース・エンリッチメント解析を統合し, 疾患間の機能的収束を定量化する新しい経路類似性フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:25:40 GMT)
TURA: Tool-Augmented Unified Retrieval Agent for AI Search [18.4] 従来のRAGアプローチは、リアルタイムのニーズと構造化クエリに苦労する。
本稿では,静的コンテンツと動的リアルタイム情報の両方にアクセスするために,RAGとエージェントツールを併用した新しい3段階フレームワークTURAを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:24:17 GMT)
Bidirectional Likelihood Estimation with Multi-Modal Large Language Models for Text-Video Retrieval [18.4] MLLM (BLiM) を用いた双方向類似度推定手法を提案する。
4つのText-Video Retrievalベンチマークでは、CPNを搭載したBLiMは、従来の最先端モデルを平均6.4R@1で上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:32:42 GMT)
Real-World Offline Reinforcement Learning from Vision Language Model Feedback [18.4] オフラインの強化学習は、オンラインインタラクションなしで、事前にコンパイルされた、最適なデータセットからポリシー学習を可能にする。
既存のオフラインRL作業の多くは、データセットにタスク報酬がラベル付けされていることを前提としている。
オフラインデータセットの報酬ラベルを自動的に生成する新しいシステムを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:50:54 GMT)
Accelerating Focal Search in Multi-Agent Path Finding with Tighter Lower Bounds [18.4] MAPF (Multi-Agent Path Finding) は、NP困難問題であるコスト関数を最小化しながら、複数のエージェントの衝突のない経路を見つける。
本稿では、まず最大LB値を決定し、次にこのLBで導かれた最優先探索を用いて衝突のない経路を求めることにより、この問題に対処する新しい有界準最適アルゴリズム(DECBS)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:49:39 GMT)
FlexQ: Efficient Post-training INT6 Quantization for LLM Serving via Algorithm-System Co-Design [18.4] 大規模言語モデル(LLM)は例外的な性能を示すが、かなりのメモリと計算コストを必要とする。
既存のINT4/INT8量子化はこれらのコストを削減するが、しばしば精度を低下させるか、最適効率を欠く。
アルゴリズムの革新とシステムレベルの評価を組み合わせた新しいフレームワークFlexQを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:47:05 GMT)
StepWrite: Adaptive Planning for Speech-Driven Text Generation [18.3] StepWriteは、大規模な言語モデルによる音声ベースのインタラクションシステムである。
移動中に長文の構造化、ハンズフリー、目のない合成を可能にする。
コンテキストトラッキングと適応計画タスクをモデルにオフロードすることで、認知負荷を低減する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:50:17 GMT)
Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decode [18.2] 本稿では,MLLMビジョンエンコーダに符号化された視覚的特徴を,余分な視覚的エンコーダを導入することなく活用する新しいフレームワークを提案する。
さらに,MLLMの大規模言語モデル(LLM)によって出力される意味関連特徴と,詳細関連視覚特徴とを完全に統合した,詳細拡張型・意味整合型特徴融合モジュール(DSFF)を提案する。
我々の手法は一般にSAMベースの競合とSAMフリーの競合に勝り、性能とコストのバランスが良くなる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:06:52 GMT)
ReasoningGuard: Safeguarding Large Reasoning Models with Inference-time Safety Aha Moments [18.2] ReasoningGuardは、タイムリーな安全アハモーメントを注入し、無害な理由づけプロセスを実行します。
弊社のアプローチは、既存の7つの安全ガードを上回り、最先端の安全防衛を達成している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:35:10 GMT)
From Entanglement to Alignment: Representation Space Decomposition for Unsupervised Time Series Domain Adaptation [18.1] DARSDは,表現空間の分解の観点から,UDAタスクを明示的に実現する理論的説明可能性を備えた,新しいUDAフレームワークである。
DarSDは3つの相乗的要素から構成される: (I) 意味的コンテンツを保存しながら、元の特徴をドメイン不変のサブ空間に投影する逆学習可能な共通不変基底; (II) 信頼、エラーの蓄積を妨げ、ターゲット特徴を動的に分離する擬似ラベル機構; (III) 機能クラスタリングと一貫性を同時に実施しながら、新興ディストリビューションギャップを緩和するハイブリッドコントラスト最適化戦略。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:55:26 GMT)
Automatic LLM Red Teaming [18.0] 我々は、AIを戦略的に破壊するように訓練する、新しいパラダイムを提案する。
生成エージェントは、きめ細かいトークンレベルのハーネス報酬を通じて、コヒーレントで多ターン攻撃戦略を学習する。
このアプローチは、ダイナミックな軌道ベースのプロセスとして、新しい最先端、根本的にリフレーミングなレッドチームを設定する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:52:00 GMT)
Beyond the Visible: Benchmarking Occlusion Perception in Multimodal Large Language Models [17.9] 咬合知覚は、人間レベルの空間的理解にとって重要な基礎である。
我々は,オクルージョン知覚に特化して設計された最初の視覚的質問応答(VQA)ベンチマークであるO-Benchを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:39:21 GMT)
Revealing Temporal Label Noise in Multimodal Hateful Video Classification [17.7] ラベルのあいまいさがきめ細かなアプローチによる影響について検討する。
我々は、アノテーション付きタイムスタンプを使用して、HateMMとMultiHateClipの英語データセットから憎しみのあるビデオをトリムする。
次に、これらのトリミングされたセグメントの探索分析を行い、ヘイトフルコンテンツと非ヘイトフルコンテンツの両方の分布と特性について検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:55:59 GMT)
Evaluating Robustness of LLMs in Question Answering on Multilingual Noisy OCR Data [17.2] 我々は,OCRによる雑音が多言語QAシステムの性能に与える影響を包括的に分析する。
この分析を支援するために,多言語QAデータセットであるMultiOCR-QAを導入する。
データセットは、OCRの異なるレベルと種類のOCRノイズを含む、OCRが編集した歴史文書からキュレートされる。
次に、3つの主要なOCRエラータイプに着目し、異なるエラー条件下で、異なる最先端の大規模言語モデル(LLM)がどのように機能するかを評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:07:06 GMT)
RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks [17.2] Multi-Agent Path Finding (MAPF) は、空中スワムから倉庫の自動化まで、様々な用途に欠かせない。
我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。
CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:39:51 GMT)
Basis Selection: Low-Rank Decomposition of Pretrained Large Language Models for Target Applications [17.1] 大規模言語モデル(LLM)は様々なアプリケーションの性能を著しく向上させるが、計算集約的でエネルギー需要が高い。
これにより、パーソナルコンピュータやモバイル/ウェアラブルデバイスといった限られたリソースを持つデバイスにデプロイすることが困難になる。
我々は、これらのモデルを効果的に圧縮するために、特定のアプリケーションの要求に合わせて低ランク分解アプローチを導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:19:30 GMT)
The State Of TTS: A Case Study with Human Fooling Rates [17.0] 本稿では,機械生成音声の誤り頻度を測定する指標であるHuman Fooling Rate(HFR)を紹介する。
オープンソースおよび商用TSモデルを大規模に評価した結果,重要な知見が得られた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:04:21 GMT)
Are Today's LLMs Ready to Explain Well-Being Concepts? [17.0] 我々は,2,194の幸福な概念の43,880の説明を含む大規模データセットを構築した。
本稿では,原則誘導型LCM-as-a-judge評価フレームワークを導入する。
我々は,SFT(Supervised Fine-Tuning)とDPO(Direct Preference Optimization)を用いたオープンソースLLMの微調整により,生成した説明の質を大幅に向上できることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:45:02 GMT)
Landsat30-AU: A Vision-Language Dataset for Australian Landsat Imagery [16.9] Landsat30-AU(ランドサット30-AU)は、オーストラリア上空の4つのランドサット衛星によって収集された30メートルの解像度画像から構築された視覚言語データセットである。
データセットには2つのコンポーネントが含まれている: Landsat30-AU-Cap、イメージキャプチャペア196,262ドル、Landsat30-AU-VQA。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:59:26 GMT)
Realizing Scaling Laws in Recommender Systems: A Foundation-Expert Paradigm for Hyperscale Model Deployment [16.9] 本稿では,超大規模レコメンデーションFMの開発と展開を目的としたフレームワークを提案する。
提案手法では, 生涯にわたる, クロスサイト, マルチモーダルなユーザデータに基づいて, 一般化可能な知識を学習する。
この知識は、ターゲット認識の埋め込みを通じて、様々な軽量で表面特異的な「専門家」モデルに効率的に伝達される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:44:24 GMT)
TAlignDiff: Automatic Tooth Alignment assisted by Diffusion-based Transformation Learning [16.8] 矯正治療は、咬合機能、顔の美学、患者の生活の質に大きく影響を及ぼす歯のアライメントに依存している。
本稿では,拡散型変換学習をサポートする新しい自動歯列アライメント手法TAlignDiffを提案する。
我々は、点クラウドベースの変換回帰と拡散ベースの変換モデリングを統一されたフレームワークに統合し、幾何学的制約と拡散洗練の間の双方向フィードバックを可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:49:38 GMT)
A Scalable Pretraining Framework for Link Prediction with Efficient Adaptation [16.8] リンク予測(LP)は、グラフ機械学習において重要なタスクである。
既存の手法は、疎結合性からの限られた監督を含む重要な課題に直面している。
これらの課題に対処するためのソリューションとして,事前学習について検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:10:31 GMT)
Metric Learning in an RKHS [16.7] 画像検索,レコメンデーションシステム,認知心理学など,様々な応用において,項目hが項目iや項目jに類似していると考えるか?
本稿では、計量学習のための一般的なRKHSフレームワークを開発し、新しい一般化保証とサンプル境界を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:29:04 GMT)
GuirlVG: Incentivize GUI Visual Grounding via Empirical Exploration on Reinforcement Learning [16.6] GuirlVGは、系統的な経験的研究と新しい安定化技術に基づいて構築された強化学習に基づくGUI-VG手法である。
本稿では,報酬の過度な最適化を緩和するために,動的にトレーニングを安定化する新しい適応的KL因子を提案する。
実験の結果、GuirlVGは5.2Kのトレーニングサンプルしか持たないが、100万以上のサンプルで訓練されたSFT法よりも優れていた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:35:24 GMT)
Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets [16.3] 本研究では,協調ゲームで構築した自己合理化フレームワークについて検討する。
このような協調ゲームは、有理抽出中に意図せずサンプリングバイアスを生じさせる可能性がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:31:36 GMT)
Conditional Latent Diffusion Models for Zero-Shot Instance Segmentation [16.2] OC-DiTは、オブジェクト中心の予測のために設計された拡散モデルのクラスである。
本稿では,インスタンスマスクを生成する条件付き潜在拡散フレームワークを提案する。
我々はこれらのモデルを、新しく作成された大規模合成データセットでトレーニングする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:38:46 GMT)
Training-Free Multimodal Large Language Model Orchestration [16.2] 本稿では,対話型マルチモーダルAIシステムを構築するための効果的なアプローチについて報告する。
本フレームワークは,(1)ユーザ入力を解析する中央コントローラ,(2)並列テキスト音声アーキテクチャ,(3)クロスモーダルメモリ統合という3つの重要なイノベーションに基づいて構築されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:17:29 GMT)
EVOC2RUST: A Skeleton-guided Framework for Project-Level C-to-Rust Translation [16.1] EvoC2Rustは、Cプロジェクト全体を同等のRustに変換する自動化フレームワークである。
オープンソースベンチマークと6つの産業プロジェクトに対する評価は,プロジェクトレベルのC-to-Rust翻訳におけるEvoC2Rustの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:31:23 GMT)
SVC 2025: the First Multimodal Deception Detection Challenge [16.1] SVC 2025 Multimodal Deception Detection Challengeは、音声・視覚的偽装検出におけるクロスドメインの一般化を評価するために設計された新しいベンチマークである。
我々は,より適応し,説明し,実践的に展開可能な偽造検知システムの開発を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:56:39 GMT)
AgREE: Agentic Reasoning for Knowledge Graph Completion on Emerging Entities [16.0] Agentic Reasoning for Emerging Entities (AgREE)は、反復的な検索アクションと多段階推論を組み合わせて、リッチな知識グラフ三重項を動的に構築する新しいフレームワークである。
AgREEは、知識グラフ三重項を構築する既存の方法、特に言語モデルのトレーニングプロセスで見られなかった新興エンティティにおいて、非常に優れています。
本研究は,エージェントに基づく推論と戦略情報検索を組み合わせることで,最新の知識グラフを維持することの有効性を実証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:34:22 GMT)
TempFlow-GRPO: When Timing Matters for GRPO in Flow Models [16.0] 本稿では,フローベース生成に固有の時間構造を捕捉し,活用する,原理的なGRPOフレームワークを提案する。
新しい革新は、基礎となる生成力学を尊重する時間的に認識された最適化をモデルに与える。
これらのイノベーションは、人間の好みのアライメントや標準のテキスト・ツー・イメージのベンチマークにおける最先端のパフォーマンスにつながります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:10:39 GMT)
MSC: A Marine Wildlife Video Dataset with Grounded Segmentation and Clip-Level Captioning [16.0] 海洋ビデオは、ビデオ理解にとって重要な課題である。
既存のビデオキャプションデータセットは、しばしば海洋環境の複雑さを一般化するのに失敗する。
本稿では,2段階の海洋オブジェクト指向ビデオキャプションパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:34:24 GMT)
LinkQA: Synthesizing Diverse QA from Multiple Seeds Strongly Linked by Knowledge Points [15.8] LinkSynは、新しい知識ポイント(KP)グラフベースの合成フレームワークである。
LinkSynはQAシードデータからKPを抽出し、多様なQAデータを合成するためにKPグラフを構築する。
LinkQAは、モデルサイズと初期FLOPスケールのパフォーマンスを一貫して向上させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:44:57 GMT)
Masked Training for Robust Arrhythmia Detection from Digitalized Multiple Layout ECG Images [15.7] この研究は適応的可変ブロック数欠落表現学習のためのフレームワークであるPatchECGを導入した。
PatchECGは、リード間の協調依存関係を持つキーパッチに自動的にフォーカスし、異なるレイアウトのECGにおける不整脈をキー認識する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:55:05 GMT)
Dual-Label Learning With Irregularly Present Labels [15.7] マルチタスク学習では、ラベルはサンプル間で不規則に欠落することが多く、完全なラベル付け、部分的にラベル付け、ラベル付けが可能である。
本研究は,2ラベル学習に焦点をあて,新たなトレーニングおよび推論フレームワークであるDual-DLL Learning (DLL)を提案する。
DLLは、ラベル間の明示的な情報交換を可能にするデュアルトウワーモデルアーキテクチャを備えており、部分的に利用可能なラベルの有用性を最大化することを目的としている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:54:37 GMT)
Zero-Residual Concept Erasure via Progressive Alignment in Text-to-Image Model [15.6] 概念消去は、事前訓練されたテキスト・ツー・イメージモデルがセマンティック・ハーミフルな概念に関連するコンテンツを生成するのを防ぐことを目的としている。
既存の手法は「非ゼロアライメント残差」による不完全消去をもたらすことが多い
より完全な概念消去と全体的な生成品質の保存を目的とした,新しいクローズドフォーム手法であるEraseProを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:19:32 GMT)
Slow is Fast! Dissecting Ethereum's Slow Liquidity Drain Scams [15.5] 分散型金融(DeFi)の脅威である緩やかな流動性ドレイン(SLID)詐欺を特定する。
本研究では,2018年以降の6大取引所(DEX)における319,166の流動性プールの大規模解析を行った。
我々は3,117個のSLIDが影響を受けた流動性プールを同定し,累積損失は1億3300万ドル以上となった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:40:11 GMT)
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation [15.5] モデルマージは、複数のタスク固有のモデルを統合モデルに統合し、タスク固有のモデルの能力を継承することを目的としている。
既存のモデルマージ手法は、最終的なマージモデルに対する異なるタスク固有モデルの寄与率の違いを考慮していないことが多い。
そこで我々はMixup Model Merge(M3)を提案する。これはMixupデータ拡張手法のランダム化線形戦略に着想を得た単純で効果的な手法である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:35:58 GMT)
ConfProBench: A Confidence Evaluation Benchmark for MLLM-Based Process Judges [15.5] プロプライエタリモデルとオープンソースモデルの両方を含む14の最先端MLLMを評価した。
我々は,MPJが生成するステップレベルの信頼度スコアの信頼性を体系的に評価する,最初の総合ベンチマークであるConfProBenchを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:00:19 GMT)
RealTalk-CN: A Realistic Chinese Speech-Text Dialogue Benchmark With Cross-Modal Interaction Analysis [15.5] 本稿では,中国初のマルチターン・マルチドメイン音声文二重モーダルTODデータセットであるRealTalk-CNを紹介する。
RealTalk-CNは、注釈付き自然発話不一致を伴う多様な対話シナリオをキャプチャする。
本稿では,実世界のユーザインタラクションを忠実にシミュレートする,新しいクロスモーダルチャットタスクを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:12:57 GMT)
GRIT: Graph-Regularized Logit Refinement for Zero-shot Cell Type Annotation [15.5] 細胞型アノテーションは単細胞RNAシークエンシング(scRNA-seq)データの解析における基本的なステップである。
CLIPスタイルモデルの最近の進歩は、細胞型アノテーションの自動化への有望な道を提供する。
本稿では,グラフ正規化最適化フレームワークを用いて,LangCellが生成するゼロショットロジットを改良することを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:09:46 GMT)
Confidence-Weighted Token Set Cover for Early Hypothesis Pruning in Self-Consistency [15.5] 我々は,長期的連鎖推論タスクにおいて,自己整合性をよりトークン効率の高いものにできるかどうかを検討する。
すべての解を並列に生成するが、周期的に不規則な中間仮説が成り立つ。
3つのベンチマークで5つのLCMを評価したところ、この手法は全モデルのトークン効率を10~35%向上できることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:14:18 GMT)
Step More: Going Beyond Single Backpropagation in Meta Learning Based Model Editing [15.3] 大規模言語モデルは、多くのAIアプリケーションを支えるが、その静的な性質により、知識の更新にコストがかかる。
モデル編集は、ターゲットパラメータ修正を通じて新しい情報を注入することで、効率的な代替手段を提供する。
本稿では,$textbfM$ultipleを採用した新しいMLBME手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:54:58 GMT)
Intention Enhanced Diffusion Model for Multimodal Pedestrian Trajectory Prediction [15.2] 歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御にとって重要である。
近年の拡散モデルでは、軌道予測のための歩行者行動の質を推定する有望な結果が示されている。
本研究では,歩行者の移動意図を予測枠組みに組み込んだ拡散型多モーダル軌道予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:04:54 GMT)
PKSS-Align: Robust Point Cloud Registration on Pre-Kendall Shape Space [15.2] 提案手法では,PKSS,テキストカラーブラックは形状測定に基づく手法であり,点間距離や点間距離を必要としない。
単純な並列加速度に基づいて、実際は効率と実現可能性を大幅に向上させることができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:17:42 GMT)
HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models [15.1] 本稿では,鍵となる観測を基礎とした新しい圧縮フレームワークであるHierarchicalPruneを紹介する。
DMブロックは異なる機能的階層を示し、初期のブロックはセマンティック構造を確立し、後のブロックはテクスチャの洗練を扱う。
我々のフレームワークは、出力画像の品質を保ちながら、デバイス上の推論に適した範囲に数十億の拡散モデルをもたらす。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:30:44 GMT)
Evaluating Selective Encryption Against Gradient Inversion Attacks [15.0] グラディエント・インバージョン・アタックは、フェデレート学習のような分散トレーニングフレームワークに重大なプライバシー上の脅威をもたらす。
本稿では,最先端攻撃に対する重要な指標の異なる選択的暗号化手法を体系的に評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:31:43 GMT)
Pull-Based Query Scheduling for Goal-Oriented Semantic Communication [14.8] 本稿では、プルベースステータス更新システムにおけるゴール指向セマンティック通信のためのクエリスケジューリングについて述べる。
本稿では,有効度尺度(GoE)を導入し,長期的有効性分析に累積的視点理論(CPT)を統合する。
本稿では、動的プログラミングに基づくモデルベースソリューションと、最先端の深層強化学習(DRL)アルゴリズムを用いたモデルフリーソリューションを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:17:41 GMT)
Tool Unlearning for Tool-Augmented LLMs [14.8] ツール強化された大規模言語モデル(LLM)は、クエリとレスポンスのペアのデータセットに基づいてトレーニングされることが多い。
ToolDeleteは、ツール拡張LDMからの未学習ツールの最初のアプローチである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:09:38 GMT)
Gaussian mixture layers for neural networks [14.7] 2層ニューラルネットワークの平均場理論は、パラメータ空間上の確率測度によって線形にパラメータ化される無限に広いネットワークを考える。
この非パラメトリックな視点は、ニューラルネットワークの理論的理解と概念的理解の両方を大きく前進させた。
本研究は,確率測度上で動的に実施できるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:16:17 GMT)
PAIRS: Parametric-Verified Adaptive Information Retrieval and Selection for Efficient RAG [14.6] 我々はPAIRS(Parametric-verified Adaptive Information Retrieval and Selection)を紹介する。
PAIRSはパラメトリックと検索された知識を統合して、検索するかどうか、外部情報を選択すべきかを適応的に決定する。
PAIRSは検索コストを約25%削減し(クエリの75%しか処理しない)、精度を+1.1% EMと+1.0% F1に改善した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:33:01 GMT)
ViLLA-MMBench: A Unified Benchmark Suite for LLM-Augmented Multimodal Movie Recommendation [14.6] ViLLA-MMBenchはマルチモーダル映画レコメンデーションのベンチマークである。
オーディオ(ブロックレベル、i-ベクター)、ビジュアル(CNN、AVF)、テキストの3つのモードからの密なアイテムの埋め込みを調整する。
不足メタデータやスパースメタデータは、最先端のLCMを使用して自動的に強化される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:39:07 GMT)
Ctrl-Z Sampling: Diffusion Sampling with Controlled Random Zigzag Explorations [14.5] 本稿では,局所的な急激な最大値の検出と回避を適応的に行う新しいサンプリング戦略を提案する。
Ctrl-Zサンプリングは、関数評価の回数をわずか6.72倍にするだけで、生成品質を大幅に改善する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:36:10 GMT)
Radar-Based NLoS Pedestrian Localization for Darting-Out Scenarios Near Parked Vehicles with Camera-Assisted Point Cloud Interpretation [14.5] 道路沿いの駐車場から生じる視界のない盲点は、道路安全にとって大きな課題である。
mmWave技術は回折と反射を利用してNLoS領域を観測する。
単眼カメラ画像と2Dレーダポイントクラウドデータを統合するNLoS歩行者位置決めフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:54:39 GMT)
Evaluating, Synthesizing, and Enhancing for Customer Support Conversation [14.4] 我々は、顧客サービス担当者に対して、明確に定義されたサポート戦略を用いて対応するよう訓練することを目的とした顧客サポート会話(CSC)の課題を紹介する。
CSConvは、1,855件の現実世界の顧客とエージェントの会話をLCMで書き直して、意図的な戦略利用を反映した評価データセットである。
我々は,LCMをベースとした役割をCSCフレームワークに合わせることで,戦略に富んだ会話をシミュレートするロールプレイングアプローチを開発し,トレーニングデータセットRoleCSを開発した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:11:17 GMT)
SplitGaussian: Reconstructing Dynamic Scenes via Visual Geometry Decomposition [14.4] textbfSplitGaussianは、シーン表現を静的および動的コンポーネントに明示的に分解する新しいフレームワークである。
SplitGaussianは、レンダリング品質、幾何学的安定性、動き分離において、最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:00:13 GMT)
Knowledge to Sight: Reasoning over Visual Attributes via Knowledge Decomposition for Abnormality Grounding [14.4] 視覚属性を分解して構造化された監視を行うフレームワークである textbfKnowledge to Sight (K2Sight) を提案する。
従来のレポートレベルの監視とは違って,本手法はドメイン知識と空間構造を明確に橋渡しする。
我々は、最先端医療用VLMに必要なデータのわずか1.5%を用いて、0.23Bと2Bのセマンティックパラメータを持つコンパクトモデルを訓練する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:54:44 GMT)
Scaling Laws For Mixed Quantization [14.3] 大規模言語モデル(LLM)の学習後の量子化は、推論のメモリと計算要求を減らすのに有効であることが証明されている。
量子化比(Q_r$)と量子化ブロックサイズ(Q_b$)という2つの重要な指標を導入する。
本稿では,学習後量子化(PTQ)に関する統一的なスケーリング法則を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:52:22 GMT)
Optimizing LLM-Based Multi-Agent System with Textual Feedback: A Case Study on Software Development [14.2] 自然言語フィードバックを利用したロールベースマルチエージェントシステムのグループ最適化に関する実証事例研究を行った。
本稿では,2段階のエージェントプロンプトの最適化パイプラインを提案し,性能の低いエージェントを同定し,特定エージェントのシステムプロンプトを最適化する。
本研究では,多様な評価次元で評価されたソフトウェア開発タスクに対処するロールベースマルチエージェントシステムに対する最適化手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:30:21 GMT)
DMSC: Dynamic Multi-Scale Coordination Framework for Time Series Forecasting [14.2] 時系列予測(TSF)は、さまざまなスケールにわたる複雑な時間的依存関係をモデル化する上で、永続的な課題に直面します。
マルチスケールパッチ分解ブロック(EMPD)、トライアドインタラクションブロック(TIB)、適応スケールルーティングMoEブロック(ASR-MoE)を備えた新しい動的マルチスケールコーディネーションフレームワーク(DMSC)を提案する。
EMPDは、指数関数的にスケールした粒度を持つ階層的なパッチにシーケンスを動的に分割する組み込みコンポーネントとして設計されている。
TIBは、各レイヤの分解された表現の中で、パッチ内、パッチ間、およびクロス変数の依存関係を共同でモデル化する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:56:14 GMT)
FaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Data [14.1] 私たちは、ユーザ1人当たりの好みアノテーションの小さなセットだけを収集できるような、実用的で難しい設定に重点を置いています。
この分野での研究を支援するために、DnDとELIPという2つのデータセットを紹介します。
本稿では,データから自動的に検出される高次特徴を活用する,パラメータ効率の高いアプローチであるFaSTを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:58:26 GMT)
LLM Collaboration With Multi-Agent Reinforcement Learning [13.9] 我々は,MARL(Multi-Agent Reinforcement Learning)問題を解決するために,マルチエージェント・マルチターンアルゴリズム,Multi-Agent Group Relative Policy Optimization (MAGRPO)を開発した。
筆者らは,MAGRPOを用いた微調整MASにおいて,効率的な協調による高品質な応答を効率的に生成できることを実証した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:18:25 GMT)
Difficulty-Based Preference Data Selection by DPO Implicit Reward Gap [13.9] 本稿では,DPOの暗黙的な報酬機構を基盤とした,嗜好データセットの難易度に基づく新たなデータ選択手法を提案する。
このアプローチは、複数のデータセットとアライメントタスクで、5つの強力なベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:24:14 GMT)
EncQA: Benchmarking Vision-Language Models on Visual Encodings for Charts [13.8] マルチモーダル視覚言語モデル(VLM)は、チャート理解ベンチマークにおいて継続的に改善されたスコアを達成し続けている。
本稿では,視覚的エンコーディングと解析タスクの体系的なカバレッジを提供するための新しいベンチマークであるEncQAを紹介する。
9つの最先端VLMの評価結果から、同一タスク内のエンコーディングやタスク間で性能が著しく異なることが明らかとなった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:17:46 GMT)
Deep Discrete Encoders: Identifiable Deep Generative Models for Rich Data with Discrete Latent Layers [13.5] 本稿では、DDE(Deep Discrete EMs)と呼ばれる、離散遅延層を持つリッチデータ型に対する解釈可能な深層生成モデルを提案する。
理論的には、DDEの透過的識別可能性条件は、潜伏層が深くなるにつれて徐々に小さくなる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:22:51 GMT)
PersonaEval: Are LLM Evaluators Human Enough to Judge Role-Play? [13.5] 我々は、ロール評価者が人間の役割を確実に特定できるかどうかをテストするための最初のベンチマークであるPersonaEvalを提示する。
人間の研究を含む我々の実験では、最高の性能のLSMでさえ69%の精度しか達成できていないことが示されています。
このギャップをよりよく理解するために、トレーニング時間適応とテスト時間計算について検討し、信頼性の高い評価にはタスク固有のチューニング以上のものが必要であることを示唆する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:06:15 GMT)
Improving Crash Data Quality with Large Language Models: Evidence from Secondary Crash Narratives in Kentucky [13.5] 本研究は, クラッシュ・ナラティブをマイニングすることで, クラッシュデータ品質を向上させるために, 高度な自然言語処理(NLP)技術を評価するものである。
2015-2022年の16,656件を手作業でレビューし、3,803件の二次衝突を確認し、3つのモデルクラスを比較した。
微調整トランスは優れた性能を発揮し、RoBERTaはF1スコア(0.90)、精度は95%だった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:41:18 GMT)
From Sufficiency to Reflection: Reinforcement-Guided Thinking Quality in Retrieval-Augmented Reasoning for LLMs [13.4] 本稿では既存のRAG推論モデルを分析し,3つの障害パターンを同定する。
本稿では,思考検索と多次元報酬システムを用いた新しいフレームワークTIRESRAG-R1を提案する。
4つのマルチホップQAデータセットの実験により、TIRESRAG-R1はRAG法よりも優れており、シングルホップタスクに適していることが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:53:31 GMT)
CLIPVehicle: A Unified Framework for Vision-based Vehicle Search [13.3] 二重粒度意味領域アライメントモジュールを含む新しい統合フレームワークであるCLIPVehicleを提案する。
また、実世界のデータセットCityFlowVSと、車両探索のための2つの合成データセットSynVS-DayとSynVS-Allを含む、新しいベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:36:44 GMT)
Multitask Learning with Stochastic Interpolants [13.3] 本研究では,フローと拡散モデルの時間ダイナミクスを広く一般化した確率分布間のマップ学習フレームワークを提案する。
我々は,スカラー時間変数をベクトル,行列,線形演算子に置き換えることで補間を一般化する。
このアプローチにより、タスク固有のトレーニングを使わずに複数のタスクをこなせる汎用的な生成モデルの構築が可能となる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:25:19 GMT)
Test-Time Adaptation for Video Highlight Detection Using Meta-Auxiliary Learning and Cross-Modality Hallucinations [13.3] 既存のビデオハイライト検出手法は、先進的ではあるが、すべてのテストビデオに対してうまく一般化するのに苦労している。
ビデオハイライト検出のためのテスト時間適応フレームワークであるHighlight-TTAを提案する。
Highlight-TTAは、主要なハイライト検出タスクと並行して、補助的なタスクであるクロスモダリティ幻覚を共同で最適化する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:18:43 GMT)
Ultra Memory-Efficient On-FPGA Training of Transformers via Tensor-Compressed Optimization [13.2] 本稿では,エンド・ツー・エンド・エンド・トランスフォーマー・トレーニングのための最初のFPGAアクセラレーションを提案する。
アルゴリズム側では、テンソル化変圧器訓練のための双方向の収縮流を提示する。
ハードウェア側では、高度に圧縮されたモデルパラメータと勾配情報をチップに格納する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:33:10 GMT)
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation [13.2] JointTunerは、外観とモーションコンポーネントのジョイント最適化を可能にするフレームワークである。
AiT Lossは外見に関連するコンポーネントの流れを乱し、モデルがモーション学習のみに集中するように誘導する。
JointTunerは、UNetベースのモデルとDiffusion Transformerベースのモデルの両方と互換性がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:22:50 GMT)
A Method for Assisting Novices Creating Class Diagrams Based on the Instructor's Class Layout [13.0] クラス図の要素のレイアウトはインストラクターが作成した正しい回答と大きく異なることが多い。
本稿では,学習者のクラス図のレイアウトをインストラクターのレイアウトに自動的に変換することで,モデリング演習中の学習者に効果的な支援を提供する手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:53:36 GMT)
RotatedMVPS: Multi-view Photometric Stereo with Rotated Natural Light [13.0] MVPS(Multiview Photometric stereo)は、様々なビューや照明下で撮影された画像から高忠実な表面形状と反射率を復元する。
回転自然光下での形状と反射率の回復を現実的な回転段階で実現可能な回転MVPSを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:02:57 GMT)
FinMMR: Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging [12.9] FinMMRは、金融数値推論タスクにおけるマルチモーダル大言語モデル(MLLM)の推論能力を評価するために設計された、新しいバイリンガルベンチマークである。
FinMMRは、テーブル、バーチャート、オーナシップ構造チャートを含む14のカテゴリにまたがる4.3Kの質問と8.7Kのイメージで構成されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:51:09 GMT)
Through the Magnifying Glass: Adaptive Perception Magnification for Hallucination-Free VLM Decoding [12.8] 既存の視覚言語モデル(VLM)はしばしば視覚幻覚に悩まされ、生成した応答は視覚入力に基づかない不正確さを含む。
本稿では、注意に基づいて関連した視覚トークンを反復的に分離し、対応する領域を拡大する新しい視覚的復号化手法であるPerception Magnifier (PM)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:45:16 GMT)
Streaming Generated Gaussian Process Experts for Online Learning and Control [12.8] 本稿では,Gaussian Process (SkyGP) のストリーミングカーネルによるエキスパートフレームワークを提案する。
SkyGPは、有界な専門家の集合を維持することによって、計算とメモリの制約に対処する。
予測精度を最大化する(SkyGP-Dense)か、計算効率を改善する(SkyGP-Fast)。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:22:27 GMT)
GM-PRM: A Generative Multimodal Process Reward Model for Multimodal Mathematical Reasoning [12.7] GM-PRM(Generative Multimodal Process Reward Model)を紹介する。
単純なスカラースコアの代わりに、GM-PRMは各推論ステップのきめ細かい解釈可能な分析を提供する。
GM-PRMは複数のマルチモーダル数学ベンチマークにおいて最先端の計算結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:10:29 GMT)
Deep Exploration with PAC-Bayes [12.6] 遅延報酬の下での継続的制御のための強化学習は、現実の応用において重要であるにもかかわらず、未探索の問題である。
本研究では,PAC-ベイジアンの視点からアクター・クリティカル・ラーニングの文脈において,この深層探査問題に初めて対処する。
提案アルゴリズムはPAC-Bayesian Actor-Critic (PBAC) と名付けられ, 連続制御タスクにおける遅延報酬を一定に検出する唯一のアルゴリズムである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:50:34 GMT)
Think How to Think: Mitigating Overthinking with Autonomous Difficulty Cognition in Large Reasoning Models [12.6] 近年のLarge Reasoning Models (LRMs) は複雑な推論タスクに優れるが、しばしば過度な思考に悩まされる。
本稿では,LRMの難易度認識と冗長性認知を段階的に刺激する,新しい2段階の微調整戦略であるThink-How-to-Think(TH2T)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:55:31 GMT)
UITron-Speech: Towards Automated GUI Agents Based on Speech Instructions [12.5] GUIエージェントの命令入力モダリティとしてテキストを音声に置き換えることを提案する。
UITron-Speechは,音声命令やオンデバイススクリーンショットを直接処理してユーザの行動を予測できる,初のエンドツーエンドGUIエージェントである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:16:16 GMT)
Keyword Spotting with Hyper-Matched Filters for Small Footprint Devices [12.3] 本稿では,小型フットプリント装置の最先端検出精度を有する開語彙キーワードスポッティングモデルを提案する。
モデルは、音声エンコーダ、ターゲットキーワードエンコーダ、検出ネットワークから構成される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:04:08 GMT)
Segment Any Vehicle: Semantic and Visual Context Driven SAM and A Benchmark [12.2] SAMベースのエンコーダデコーダ,車両部品知識グラフ,コンテキストサンプル検索符号化モジュールの3つのコアコンポーネントからなる新しいフレームワークであるSAVを提案する。
知識グラフは、構造オントロジーを通じて車両部品間の空間的および幾何学的関係を明示的にモデル化し、事前構造的知識を効果的に符号化する。
我々は,11,665の高品質なピクセルレベルのアノテーションを含む自動車部品セグメンテーションのための大規模ベンチマークデータセット,VabySeg10Kを紹介した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:46:49 GMT)
OpenDCVCs: A PyTorch Open Source Implementation and Performance Evaluation of the DCVC series Video Codecs [12.2] 我々は,学習ビデオ圧縮における再現可能な研究を進めるために,オープンソースのPyTorch実装であるOpenDCVCを提案する。
OpenDCVCsは、4つの代表的なDeep Contextual Video Compression (DCVC)モデルの統一的でトレーニング可能な実装を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:39:29 GMT)
Unveiling Over-Memorization in Finetuning LLMs for Reasoning Tasks [12.0] 事前訓練された大言語モデル (LLM) はラベル付きデータで微調整され、人間の値に適合する。
本研究では,LLMファインタニングの学習ダイナミクスを推論タスクで研究し,その過記憶現象を明らかにする。
記憶過剰なモデルでは、通常のモデルと同等のテスト精度を示すが、頑健さの低下、分布外一般化の低下、生成の多様性の低下に悩まされている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:34:12 GMT)
Proactive Constrained Policy Optimization with Preemptive Penalty [11.9] 本稿では,制約付き政策最適化のための新しいプリエンプティブ・ペナルティ・メカニズムを提案する。
このメカニズムは、ポリシーが境界に近づくと、障壁要素を目的の関数に統合し、コストを課す。
また,政策が制約境界に近づいた場合にのみ有効となる境界対応探索を誘導するために,制約対応固有の報酬を導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:50:53 GMT)
ESA: Annotation-Efficient Active Learning for Semantic Segmentation [11.9] 局所的な構造的手がかりを捉えるために,スーパーピクセルグループ化を併用したクラス非依存マスク提案ネットワークを提案する。
提案手法は既存のピクセルベースの手法よりも優れ,最小限のクエリで優れた結果が得られる。
例えば、従来の手法で要求される5000クリックとは対照的に、アノテーションにはたった40クリックしか必要としない。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:44:48 GMT)
Leveraging large language models for SQL behavior-based database intrusion detection [11.9] データベースシステムは、様々なドメインにまたがる重要なデータを格納するために広く使われている。
内部攻撃や外部攻撃によるデータベース侵入のような異常なデータベースアクセス行動の頻度は上昇し続けている。
現在のアプローチでは、運用レベルで異常を検出するために必要な粒度が不足している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:53:38 GMT)
IDCNet: Guided Video Diffusion for Metric-Consistent RGBD Scene Generation with Precise Camera Control [11.8] IDC-Netは、明示的なカメラ軌道制御の下でRGB-Dビデオシーケンスを生成するために設計された新しいフレームワークである。
IDC-Netは、生成したシーンシーケンスの視覚的品質と幾何学的整合性の両方において、最先端のアプローチよりも改善されていることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:19:16 GMT)
Live Demonstration: Neuromorphic Radar for Gesture Recognition [11.8] 本稿では,生物センシングにインスパイアされたイベント駆動型アーキテクチャを用いて,リアルタイム・低消費電力ハンドジェスチャ認識(HGR)のためのニューロモルフィックレーダフレームワークを提案する。
本システムは24GHzドップラーレーダのフロントエンドと、中間周波数(IF)信号をスパーススパイクベース表現に変換する独自のニューロモルフィックサンプリング器を備える。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:08:15 GMT)
Uncertainty-Aware GUI Agent: Adaptive Perception through Component Recommendation and Human-in-the-Loop Refinement [11.6] 適応認識によってこれらの問題に対処する不確実性認識エージェントである textbfRecAgent を提案する。
知覚の不確実性を低減するため、RecAgentはコンポーネントレコメンデーションメカニズムを採用し、最も関連性の高いUI要素を特定し、フォーカスする。
決定の不確実性のために、インタラクティブなモジュールを使用して、不明瞭な状況でユーザからのフィードバックをリクエストし、意図を認識した決定を可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:38:02 GMT)
COBRA: A Continual Learning Approach to Vision-Brain Understanding [11.5] 視覚脳理解(VBU)は機能的磁気共鳴画像(fMRI)によって記録された脳活動から視覚情報を抽出することを目的としている
VBUの既存の研究は破滅的な忘れ込みという課題に直面している。
本稿では,視覚脳のための連続学習(Continuous Learning for Vision-Brain,COBRA)と呼ばれる新しいフレームワークを紹介し,VBUにおける連続学習に対処する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:35:43 GMT)
StyleTailor: Towards Personalized Fashion Styling via Hierarchical Negative Feedback [11.5] StyleTailorは、パーソナライズされたアパレルデザイン、ショッピングレコメンデーション、バーチャルトライオン、システマティックな評価を結合的なワークフローに統合する最初のコラボレーティブエージェントフレームワークである。
我々のフレームワークは2つのコアエージェント、すなわちパーソナライズされた衣服選択のためのデザイナと仮想試着のためのコンサルタントを備えており、そのアウトプットは階層的な視覚言語モデルフィードバックによって徐々に洗練されている。
パフォーマンスを評価するために,スタイルの整合性,視覚的品質,顔の類似性,芸術的評価を含む総合的な評価スイートを導入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:42:42 GMT)
Provable Post-Training Quantization: Theoretical Analysis of OPTQ and Qronos [11.5] ポストトレーニング量子化(PTQ)は、現代のディープニューラルネットワークのメモリと計算コストを削減する重要なツールとなっている。
OPTQフレームワーク(GPTQ-has)は、計算効率と強力な経験的性能のため、主要な手法として登場した。
広く採用されているにもかかわらず、OPTQは厳格な理論的保証を欠いている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:00:40 GMT)
EcoTransformer: Attention without Multiplication [11.5] 本稿では,新しいトランスフォーマーアーキテクチャであるEcoTransformerを提案する。
新しいアテンションスコア計算には行列乗算が不要である。
NLP、バイオインフォマティクス、ビジョンタスクにおいて、スケールしたドット製品に匹敵する、あるいは超えている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:41:31 GMT)
XSpecMesh: Quality-Preserving Auto-Regressive Mesh Generation Acceleration via Multi-Head Speculative Decoding [11.4] XSpecMeshは自動回帰メッシュ生成モデルの品質保存高速化手法である。
本手法は生成品質を犠牲にすることなく1.7倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:51:03 GMT)
AttriLens-Mol: Attribute Guided Reinforcement Learning for Molecular Property Prediction with Large Language Models [11.4] 本稿では,LLMを用いた分子特性予測のための属性誘導強化学習フレームワークであるAttriLens-Molを紹介する。
AttriLens-Molは、(1)属性ベースの構造化された出力を奨励する形式報酬、(2)無関係な属性の列挙を避けるためのカウント報酬、(3)高度なLLMとRDKitを使った報酬を使用するモデルの推論を操縦する。
AttriLens-Mol法を用いて, 4000試料を用いた7BサイズR1-Distilled-Qwen2.5およびR1-Distilled-LLaMA3.1モデルのトレーニングを行った結果, 性能が有意に向上した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:46:22 GMT)
Gather and Trace: Rethinking Video TextVQA from an Instance-oriented Perspective [11.4] ビデオテキストベースの視覚的質問応答(Video TextVQA)は、ビデオに関連するテキストを明示的に推論することで、質問に答えることを目的としている。
この分野でのほとんどの作業は、冗長なテキストエンティティと暗黙の関係モデリングに苦しむフレームレベルのフレームワークに従う。
本稿では,ビデオテキストVQAタスクのためのGAT(Gather and Trace)と呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:26:36 GMT)
From "Aha Moments" to Controllable Thinking: Toward Meta-Cognitive Reasoning in Large Reasoning Models via Decoupled Reasoning and Control [11.3] 大規模推論モデル(LRM)は、ステップバイステップの推論、リフレクション、バックトラッキングなどの認知行動を自発的に示すことで、複雑な推論の潜在能力を示した。
しかし、そのような創発的行動は規制されず、制御されていないままであり、しばしば過度に考え直され、モデルが信頼できる結論に達した後も冗長な推論内容を生成し続ける。
現在のモデルは、いつ継続するか、バックトラックするか、終了するかを決定するために、彼らの推論プロセスを監視し、適応的に管理できない。
我々はメタ認知推論フレームワーク(MERA)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:59:17 GMT)
Benchmarking Uncertainty and its Disentanglement in multi-label Chest X-Ray Classification [11.2] コンボリューション(ResNet)とトランスフォーマー(Vision Transformer)アーキテクチャにおける13の不確実性定量化手法を評価する。
Evidential Deep Learning, HetClass NNs, Deep Deterministic Uncertaintyをマルチラベル設定に拡張する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:58:17 GMT)
ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis [11.2] 私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:39:38 GMT)
Why the Agent Made that Decision: Contrastive Explanation Learning for Reinforcement Learning [11.1] 強化学習(Reinforcement Learning, RL)は, 複雑な意思決定問題の解決に成功している。
既存の説明可能なAI(xAI)アプローチは、しばしばRLエージェントに意味のある説明を提供しない。
本稿では、RL選択されたアクションを説明するために、@textbfVisionMask$という新しいコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:26:27 GMT)
Skeleton Motion Words for Unsupervised Skeleton-Based Temporal Action Segmentation [11.0] 本稿では,非教師なし骨格に基づく時間的動作分割のための新しいアプローチを提案する。
本手法では, 組込み空間に分散した継手の情報を格納するシーケンシャル・ツー・シーケンス・テンポラル・オートエンコーダを用いる。
広く使われている3つの骨格ベースのデータセットに対して提案手法を徹底的に評価した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:56:38 GMT)
NCCR: to Evaluate the Robustness of Neural Networks and Adversarial Examples [11.0] 本研究では, ニューラルネットワーク被覆変化率 (NCCR) と呼ばれる, 攻撃に対する深層学習モデルの能力を測定する指標を提案する。
NCCRは入力が摂動されたとき、特定の選択されたニューロンの出力の変化を監視する。
画像認識実験と話者認識モデルの結果から,ニューラルネットワークやその入力のロバスト性を評価するための指標が得られた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:54:25 GMT)
Enhancing Multi-view Open-set Learning via Ambiguity Uncertainty Calibration and View-wise Debiasing [11.0] あいまいさの不確かさの校正とビューワイズ・デバイアスによる多視点オープンセット学習フレームワークを提案する。
多様なマルチビューベンチマークの実験により、提案フレームワークは未知のクラス認識を継続的に強化することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:36:40 GMT)
HCRide: Harmonizing Passenger Fairness and Driver Preference for Human-Centered Ride-Hailing [10.9] 我々は,乗客の公正さと運転者の嗜好の両方を考慮し,人間中心の配車システムの設計を目指す。
我々は,新しいマルチエージェント強化学習アルゴリズムに基づくHCRideを設計する。
深センとニューヨーク市の2つの現実世界のライドシェアリングデータセットを用いて、HCRideを広範囲に評価した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:47:38 GMT)
Benefit from Rich: Tackling Search Interaction Sparsity in Search Enhanced Recommendation [10.6] 本稿では,ユーザコードグラフ上でメッセージパッシングを利用するGSERecを提案する。
実世界の3つのデータセットの実験では、GSERecはベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:16:40 GMT)
Mockingbird: How does LLM perform in general machine learning tasks? [10.6] 大規模言語モデル(LLM)がチャットボットとして使われるようになった。
この研究はそのような可能性の好奇心から行われている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:08:47 GMT)
Can Large Multimodal Models Actively Recognize Faulty Inputs? A Systematic Evaluation Framework of Their Input Scrutiny Ability [10.6] ISEval(Input Scrutiny Ability Evaluation Framework)は,7つの欠陥のある前提と3つの評価指標を含む。
ほとんどのモデルは、ガイダンスなしで欠陥のあるテキストの前提を積極的に検出するのに苦労している。
これらの知見は、LMMの入力妥当性の積極的な検証を強化する緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:13:46 GMT)
A Comprohensive Review of Domain Adaptation Techniques for Agricultural Image Analysis in Precision Agriculture [10.5] 本稿では,農業画像解析におけるクロスドメイン転送性の向上により,ドメイン適応技術が課題にどう対処できるかを検討する。
このレビューは、作物の健康モニタリング、害虫検出、果物の認識といった応用に焦点をあてて、農業画像におけるDAの最近の進歩を体系的に要約している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:37:38 GMT)
3DTTNet: Multimodal Fusion-Based 3D Traversable Terrain Modeling for Off-Road Environments [10.5] オフロード環境は、自動運転車にとって重要な課題である。
本稿では,セマンティックシーンの完了によって,横断可能な領域認識を実現する。
3DTTNetと呼ばれる新しいマルチモーダル手法が提案されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:02:23 GMT)
VisualTrans: A Benchmark for Real-World Visual Transformation Reasoning [10.5] ビジュアルトランスフォーメーション推論(VTR)は、知的エージェントが動的シーンを理解するための重要な認知能力である。
既存のベンチマークは、sim-to-realギャップ、タスクの複雑さの制限、不完全な推論カバレッジに悩まされている。
VisualTransは、現実世界の人間とオブジェクトのインタラクションシナリオにおいて、VTR用に特別に設計された最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:07:05 GMT)
Generic-to-Specific Reasoning and Learning for Scalable Ad Hoc Teamwork [10.5] 本稿では,アドホックチームワークにおける推論と学習のための知識ベースおよびデータ駆動手法の相補的強みを活用することを提唱する。
任意の目的のために、我々のアーキテクチャは、各アドホックエージェントが非単調な論理的推論によってその動作を決定することを可能にする。
現実的な物理に基づく3Dシミュレーション環境であるVirtualHomeにおけるアーキテクチャの能力について実験的に評価した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:44:38 GMT)
Consistent and Invariant Generalization Learning for Short-video Misinformation Detection [10.4] ショートビデオ誤報検出はマルチモーダル領域で広く注目を集めている。
現在のモデルは、ドメインギャップのため、目に見えないドメインで不満足なパフォーマンスを示すことが多い。
本稿では,映像誤情報検出のためのコンシステイシーと不変学習を用いた新しいDOmain一般化モデルを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:38:14 GMT)
Manifestations of Empathy in Software Engineering: How, Why, and When It Matters [10.3] 共感はソフトウェア工学(SE)において重要な役割を担い、コラボレーション、コミュニケーション、意思決定に影響を与える。
本研究は,22回のインタビューと,ソフトウェア実践者116名による大規模調査を通じて,これらの側面を調査した。
本研究は, 共感の表現, 共感の実践の背景にある要因, 共感が有用であるか否かを判断するSE活動, 共感に影響を与える他の要因について考察した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:30:02 GMT)
ProbRadarM3F: mmWave Radar based Human Skeletal Pose Estimation with Probability Map Guided Multi-Format Feature Fusion [10.3] 本稿では,確率マップによるマルチフォーマット特徴融合モデルProbRadarM3Fを提案する。
ProbRadarM3Fは従来のヒートマップの特徴と位置特徴を融合させ、効果的に14個の人体のキーポイントを推定する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:13:39 GMT)
The Emotional Baby Is Truly Deadly: Does your Multimodal Large Reasoning Model Have Emotional Flattery towards Humans? [10.2] EmoAgentは感情的なプロンプトを誇張して、推論経路をハイジャックする。
透過的な深い思考シナリオにおいて、永続的な高リスク障害モードを特定します。
高度MLRM実験はEmoAgentの有効性を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:39:28 GMT)
A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles [10.2] 本稿では,マルチエージェント・マルコフゲームに対する並列更新によるモンテカルロ木探索(MCTS)手法を提案する。
部分定常交通流における多車両共同動作空間の並列動作を解析することにより、並列更新法は潜在的危険な動作を迅速に排除することができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:08:15 GMT)
FinanceReasoning: Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging [10.2] FinanceReasoningは、金融数値推論問題における大きな推論モデル(LRM)の推論能力を評価するために設計された新しいベンチマークである。
4つの公開データセットからの質問の15.6%を更新し、詳細なPythonソリューションで908の新たな質問を注釈付けします。
我々は、3,133個のPython形式の関数を構築し、LEMの金銭的推論能力を高める。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:19:50 GMT)
DTPA: Dynamic Token-level Prefix Augmentation for Controllable Text Generation [10.2] エアデコードによって生成されたテキストの制御性は、シーケンス長の増加とともに低下する傾向にある。
ソフトプレフィックスやハードプレフィックスを含む様々な種類のプレフィックスも、パフォーマンスに影響を与える重要な要因である。
制御可能なテキスト生成のためのAir-Decodingに基づく動的トークンレベルの事前修正(DTPA)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:20:33 GMT)
Bridging Search and Recommendation through Latent Cross Reasoning [10.1] 本稿では,まずユーザのS&R履歴をエンコードしてグローバルな関心を捉え,検索行動に対して反復的に理由付けを行い,推薦に有用なシグナルを抽出する,潜時的クロス推論フレームワークを提案する。
公開ベンチマークの実験では、強力なベースラインよりも一貫した改善が示され、検索意識のレコメンデーションを強化する上での推論の重要性が検証された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:28:11 GMT)
UFV-Splatter: Pose-Free Feed-Forward 3D Gaussian Splatting Adapted to Unfavorable Views [10.0] フィードフォワードをトレーニングするための一般的なレンダリング設定は、世界の起源に3Dオブジェクトを配置し、原点に向かって向けられたカメラからレンダリングする。
本稿では、事前訓練されたポーズなしフィードフォワード3DGSモデルで好ましくないビューを処理できる新しい適応フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:37:05 GMT)
Neuron-based Multifractal Analysis of Neuron Interaction Dynamics in Large Models [10.0] 我々はニューロMFA(NeuroMFA)と呼ばれる構造解析のための新しい解析フレームワークを提案する。
構造的特徴を大規模モデルの能力にリンクすることにより、NeuroMFAは大規模モデルの創発現象を分析するための定量的フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:34:21 GMT)
CAVGAN: Unifying Jailbreak and Defense of LLMs via Generative Adversarial Attacks on their Internal Representations [10.0] セキュリティアライメントにより、Large Language Model(LLM)は悪意のあるクエリに対する保護を得ることができる。
LLMのセキュリティ保護機構を解析し,攻撃と防御を組み合わせた枠組みを提案する。
本手法は, LLM中間層埋め込みの線形分離性, およびジェイルブレイク攻撃の本質に基づく。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:32:54 GMT)
Approximation Rates in Besov Norms and Sample-Complexity of Kolmogorov-Arnold Networks with Residual Connections [9.8] Kolmogorov-Arnold Networks (KAN) は、ほとんどのディープラーニングフレームワークのバックボーンの改善として登場した。
我々はkansが任意のBesov関数を、有界な開あるいはフラクタルな領域上で$Bs_p,q(mathcalX)$で最適に近似できることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:12:12 GMT)
ZARA: Zero-shot Motion Time-Series Analysis via Knowledge and Retrieval Driven LLM Agents [9.8] ZARAは、ゼロショットで説明可能なアクティビティ認識のためのエージェントベースのフレームワークである。
ペアワイズ機能知識ベース、マルチセンサー検索モジュール、階層型エージェントパイプラインを統合している。
実験では、ZARAはマクロF1において最強のベースラインを2.53倍越えながら明確な推論を達成している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:57:57 GMT)
Understanding Flatness in Generative Models: Its Role and Benefits [9.8] 教師付き学習における堅牢性を高めることが知られているフラット・ミニマは、生成モデルにおいてほとんど探索されていない。
より平坦なミニマは、対象の事前分布における摂動に対する頑健性を改善するという理論的主張を確立する。
拡散モデルにおける平坦なミニマは、生成性能だけでなく、頑健性も向上することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:03:47 GMT)
T2VEval: Benchmark Dataset and Objective Evaluation Method for T2V-generated Videos [9.7] T2VEvalはテキスト・ビデオ品質評価のためのマルチブランチ融合方式である。
テキストとビデオの一貫性、現実性、技術的品質の3つの分野にまたがるビデオを評価する。
T2VEvalは、複数のメトリクスにわたる最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:38:52 GMT)
Cloud Model Characteristic Function Auto-Encoder: Integrating Cloud Model Theory with MMD Regularization for Enhanced Generative Modeling [9.7] 本稿では,クラウドモデルをWasserstein Auto-Encoder(WAE)フレームワークに統合する新しい生成モデルであるCMCFAEを紹介する。
クラウドモデルの特徴関数を利用して潜在空間を正規化することにより、複雑なデータ分布のより正確なモデリングを可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:44:04 GMT)
Slice or the Whole Pie? Utility Control for AI Models [9.6] NNObfuscatorを使うと、単一のモデルをリアルタイムで適用でき、複数のレベルのパフォーマンスへのアクセスを制御することができる。
このメカニズムにより、モデル所有者は階層化されたアクセスを設定でき、フリーティアのユーザがベースラインレベルのパフォーマンスを享受でき、プレミアムのユーザは機能強化の恩恵を受けることができる。
実験の結果,NNObfuscatorはモデルに適応性を持たせることができた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:45:09 GMT)
Voost: A Unified and Scalable Diffusion Transformer for Bidirectional Virtual Try-On and Try-Off [9.5] 仮想的な試行と試行を単一の拡散変換器で共同で学習する統合フレームワークであるVoostを提案する。
Voostは、試行錯誤ベンチマークと試行錯誤ベンチマークの両方で最先端の結果を達成し、アライメント精度、視覚的忠実度、一般化における強いベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:10:58 GMT)
Computation-Efficient and Recognition-Friendly 3D Point Cloud Privacy Protection [9.4] 3Dポイントクラウドは、自動運転車、ロボティクス、CADモデルなどのアプリケーションで広く利用されている。
私たちの知る限りでは、これらのアプリケーションは3Dポイントクラウドにおけるプライバシー漏洩の問題を提起しています。
私たちは3Dポイントのクラウドプライバシ問題を定義し、PointFlowGMMという名前の効率的なプライバシ保存フレームワークを提案しました。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:36:19 GMT)
Do Recommender Systems Really Leverage Multimodal Content? A Comprehensive Analysis on Multimodal Representations for Recommendation [9.4] マルチモーダル・レコメンダ・システムは異種コンテンツの統合によるレコメンデーションの精度向上を目的としている。
効果はあるものの、それらの利得が真のマルチモーダル理解によるものなのか、あるいはモデルの複雑さの増加によるものなのかは定かではない。
本研究は,マルチモーダルな項目埋め込みの役割を考察し,表現の意味的情報性を強調した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:53:58 GMT)
Long-Term Visual Object Tracking with Event Cameras: An Associative Memory Augmented Tracker and A Benchmark Dataset [9.4] FELTと呼ばれる,長期的かつ大規模な視覚オブジェクト追跡データセットを提案する。
また,Asociative Memory Transformer を用いた RGB-Event の長期視覚トラッカー AMTTrack を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:45:11 GMT)
A Fast Text-Driven Approach for Generating Artistic Content [9.4] ビジュアルアートを生成するための完全なフレームワークを提案する。
改善されたバージョンを実装し、様々なディテール、スタイル、構造で幅広い結果を生成する。
結果をさらに高めるため,生成パイプラインに芸術的超解像モジュールを挿入する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:10:04 GMT)
ACM Multimedia Grand Challenge on ENT Endoscopy Analysis [9.3] 本稿では,細粒度の解剖学的分類と画像間画像検索,およびバイリンガル監視下でのテキスト間画像検索を統合したENTRepを紹介する。
このデータセットは、解剖学的領域と正常または異常な状態にラベル付けされた専門家注釈付き画像と、二重言語記述を伴う。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:22:23 GMT)
Towards Scalable Newborn Screening: Automated General Movement Assessment in Uncontrolled Settings [9.3] 一般運動(GM)は神経発達障害の信頼できる予測因子である。
新生児スクリーニングのスケールアップには、幼児のビデオ録画からGMを自動的に分類するアルゴリズムが必要である。
本研究では,これらの記録から特徴を抽出するツールを導入し,自動GM分類のための様々な機械学習手法を探索する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:46:34 GMT)
Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management [9.3] 大規模言語モデル(LLM)は、プロアクティブな干渉による長いコンテキストの処理において、大幅な性能劣化に悩まされる。
Sculptorは,(1)文脈の断片化,(2)要約,隠蔽,復元,(3)インテリジェント検索の3つのカテゴリにLLMを組み込んだフレームワークである。
Information-sparse benchmarks-PI-LLM と NeedleBench Multi-Needle Reasoning-demonstrates の実験的評価により、Sculptor は特定の訓練をしなくても性能が大幅に向上する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:32:58 GMT)
I Think, Therefore I Am Under-Qualified? A Benchmark for Evaluating Linguistic Shibboleth Detection in LLM Hiring Evaluations [9.3] 本稿では,大言語モデルが言語シボレスにどう反応するかを評価するための総合的なベンチマークを提案する。
等価な内容の質にもかかわらず,LLMが言語パターン,特にヘッジ言語を体系的にペナルティ化する方法を実証する。
我々は,複数の言語的側面に沿ったアプローチを検証し,ヘッジドレスポンスが平均25.6%低い評価を受けることを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:51:03 GMT)
Small Lesions-aware Bidirectional Multimodal Multiscale Fusion Network for Lung Disease Classification [9.3] 我々はMMCAF-Net(Multimodal Multiscale Cross-Attention Fusion Network)を提案する。
本モデルは, 3次元医用画像から病変特異的な特徴を抽出するために, 効率的な3次元多次元コンボリューション・アテンション・モジュールと組み合わせた特徴ピラミッド構造を用いる。
その結果, 診断精度は, 最先端の方法よりも有意に向上した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:37:06 GMT)
Can NLP Tackle Hate Speech in the Real World? Stakeholder-Informed Feedback and Survey on Counterspeech [9.3] 本報告では,74のNLP研究を体系的にレビューする。
我々は、ステークホルダーの参加がデータセットの作成、モデル開発、評価にどの程度影響するかを分析する。
以上の結果から,現在のNLP研究と,有害なオンラインコンテンツに最も影響されたコミュニティのニーズとの間には,ますます不一致が増していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:04:58 GMT)
CAIN: Hijacking LLM-Humans Conversations via Malicious System Prompts [9.3] 大規模言語モデル(LLM)は多くの応用が進んでいるが、敵攻撃に弱いことも知られている。
システムプロンプトを操作することでAIと人間の会話をハイジャックする。
この攻撃は、悪意のあるアクターが有害なシステムをネット上に広めることを可能にするため、有害である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:49:53 GMT)
Towards Globally Predictable k-Space Interpolation: A White-box Transformer Approach [9.2] 我々は,k空間に対するGPI(Globally Predictable Interpolation)に基づくWhite-box TransformerフレームワークであるGPI-WTを提案する。
実験結果から,提案手法は,k空間の精度において高い解釈性を提供しながら,最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:24:28 GMT)
INTENTION: Inferring Tendencies of Humanoid Robot Motion Through Interactive Intuition and Grounded VLM [9.2] 本研究では,学習した対話的直感と自律的操作を多様なシナリオで実現可能な,新しいフレームワークINTENTIONを提案する。
実世界のさまざまなタスクに対する人間的な理解と意思決定を具現化した,過去のタスクインタラクションのシーンを記録するために,メモリグラフを導入した。
一方,視覚シーンから身体的関係や余裕を抽出する直感的知覚器を設計する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:27:22 GMT)
DRL-ORA: Distributional Reinforcement Learning with Online Risk Adaption [9.2] オンラインリスク適応型分散RL(DRL-ORA)を提案する。
このフレームワークは、既存のリスク適応アプローチを統一し、より良い説明可能性と柔軟性を提供する。
DRL-ORAは、複数のタスクのクラスにおいて、固定リスクレベルや手動で設計したリスクレベル適応に依存する既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:16:52 GMT)
DDTracking: A Deep Generative Framework for Diffusion MRI Tractography with Streamline Local-Global Spatiotemporal Modeling [9.1] DDTrackingは拡散MRIトラクトグラフィーのための新しい深層生成フレームワークである。
局所的空間符号化と大域的時間依存性を共同でモデル化するデュアルパス符号化ネットワークを提案する。
DDTrackingは解剖学的に妥当で堅牢なトラクトグラフィーを提供し、広いdMRIアプリケーションに対してスケーラブルで適応性があり、エンドツーエンドで学習可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:51:11 GMT)
MambaITD: An Efficient Cross-Modal Mamba Network for Insider Threat Detection [9.0] 本稿では,Mamba状態空間モデルとクロスモーダル適応融合に基づく新たなインサイダー脅威検出フレームワークMambaITDを提案する。
従来の手法と比較して、MambaITDはモデリング効率と機能融合能力において大きな利点を示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:45:00 GMT)
DMFI: Dual-Modality Fine-Tuning and Inference Framework for LLM-Based Insider Threat Detection [9.0] インサイダー脅威モダリティ(ITD)は、サイバーセキュリティにおいて永続的で高影響の課題となる。
伝統的なモデルは、しばしば意味的な意図と複雑な振る舞いのダイナミクスを捉えるのに苦労する。
動作認識の微調整とセマンティック推論を統合した2つのモダリティフレームワークであるDMFIを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:44:40 GMT)
Experimental device-independent certification of indefinite causal order [9.0] 空間的に分離された絡み合った光子を用いて因果不等式を実験的に検証した。
この結果は、不確定因果順序の完全な理解に向けての道のりと、量子情報処理への応用の可能性を示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:07:59 GMT)
False Promises in Medical Imaging AI? Assessing Validity of Outperformance Claims [8.9] 医用画像論文の代表的コホートを解析し,新たに提案した手法が真に最先端であるか否かを考察した。
以上の結果から,新手法の導入時の性能の低下が報告されている。
さらに,分類論文の86%,分節論文の53%において,偽アウトパフォーマンスクレームの確率(>5%)が高かった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:57:18 GMT)
Theorem-Carrying Transactions: Runtime Verification to Ensure Interface Specifications for Smart Contract Safety [8.9] 1.45億ドルの契約が1つの「ギガンティック・プログラム」を形成する
プログラマは、この巨大なプログラムが高レベルの安全仕様に準拠していることを保証できますか?
静的コード検証は、そのスケールと高い多型のため、この巨大プログラムに忠実にできない。
私たちの技術は、Theorem-Carrying Transactions (TCT)と呼ばれ、具体的な実行とシンボル証明の利点を組み合わせています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:31:48 GMT)
Adversarial Attacks and Defenses on Graph-aware Large Language Models (LLMs) [8.9] 大規模言語モデル(LLM)は、ノード分類のようなタスクのためのグラフ構造化データとますます統合されています。
グラフベースモデルに適した既存の敵攻撃手法を活用することにより、グラフ対応LCMの脆弱性を調査する第一歩を踏み出す。
本稿では,LLMをベースとした特徴補正モジュールを併用して特徴レベルの摂動を軽減し,構造的攻撃から保護するためのGNNディフェンスを適応させる,エンドツーエンドのディフェンスフレームワークGALGUARDを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:38:52 GMT)
KFS: KAN based adaptive Frequency Selection learning architecture for long term time series forecasting [8.8] そこで我々は,これらの課題に対処するために,KAを用いた適応周波数選択学習アーキテクチャ(KFS)を提案する。
このフレームワークは、クロススケールノイズ干渉と複雑なパターンモデリングから生じる予測問題に対処する。
複数の実世界の時系列データセットにまたがる実験により、KTは単純で効果的なアーキテクチャとして最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:08:39 GMT)
JanusNet: Hierarchical Slice-Block Shuffle and Displacement for Semi-Supervised 3D Multi-Organ Segmentation [8.8] 我々は3次元医療データのためのデータ拡張フレームワークであるJanusNetを提案する。
私たちのSlice-Block Shuffleステップは、ランダムな軸に沿ってボリュームに同じインデックススライスブロックをシャッフルします。
我々の信頼誘導変位ステップは、予測信頼性を利用して各スライス内のブロックを置換し、困難な領域からの信号を増幅する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:08:02 GMT)
Drone Detection with Event Cameras [8.7] イベントカメラは、運動のぼやけを事実上排除し、極端な照明で一貫した検出を可能にする。
この研究は、イベントベースのビジョンが次世代の信頼性、低レイテンシ、効率的な対UAVシステムに強力な基盤を提供することを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:49:33 GMT)
Confounder-Free Continual Learning via Recursive Feature Normalization [8.6] 共同設立者は、入力とターゲットの両方に影響を与える外部変数であり、急激な相関とバイアスのある予測をもたらす。
ディープラーニングアーキテクチャに組み込むことができるRecursive MDN層を紹介します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:55:54 GMT)
AuthPrint: Fingerprinting Generative Models Against Malicious Model Providers [8.4] メソッドは、モデルの出力空間から秘密の指紋を抽出し、プロバイダに未知の信頼された検証器に依存し、モデルをトレーニングして予測し、検証する。
実験により,本手法がGANおよび拡散モデルのインスタンスに対してほぼゼロのFPR@95%TPRを実現することを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:17:38 GMT)
Efficient Data Selection for Training Genomic Perturbation Models [8.4] グラフニューラルネットワークに基づく遺伝子摂動モデルを用いて、遺伝子摂動の結果を予測する。
アクティブラーニングは、しばしばこれらのモデルをトレーニングするために使われ、ウェットラブ実験とモデル更新の交互に行われる。
本研究では,遺伝子摂動を1ショットで,モデル無しで選択するグラフベースのデータフィルタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:22:08 GMT)
MienCap: Realtime Performance-Based Facial Animation with Live Mood Dynamics [8.3] 我々の目的は、3Dスタイルのキャラクタを駆動できるパフォーマンスベースのアニメーションを改善することである。
我々は、幾何学的に一貫性があり、知覚的に妥当な方法で文字表現を駆動する非リアルタイムおよびリアルタイムのソリューションを提示する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:50:01 GMT)
Sparse Attention across Multiple-context KV Cache [8.2] 推論効率を改善するために、履歴キーバリュー(KV)キャッシュを再利用することは、主流のアプローチとなっている。
近年の進歩は、KVキャッシュを選択できるスパースアテンション機構によってスループットをさらに向上させる。
本論文では,マルチコンテキストKVキャッシュにおける注意スペーシフィケーションの最初の調査であるSamKVについて述べる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:53:14 GMT)
EchoMimicV3: 1.3B Parameters are All You Need for Unified Multi-Modal and Multi-Task Human Animation [8.2] EchoMimicV3はマルチタスクとマルチモーダルアニメーションを統合する効率的なフレームワークである。
最小のモデルサイズが13億のEchoMimicV3は、定量評価と定性評価の両方で競合性能を達成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:46:08 GMT)
Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens [8.2] 魚眼画像に対する基礎的単眼深度推定器(FMDE)の拡張手法を提案する。
本手法は,魚眼画像と視線画像とを符号化した潜伏埋め込みの分布を一致させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:23:20 GMT)
Algorithm Development in Neural Networks: Insights from the Streaming Parity Task [8.2] ストリーミングパリティタスクでトレーニングされたニューラルネットワークの学習ダイナミクスについて検討する。
有限学習経験が十分であれば、RNNは完全無限一般化への位相遷移を示すことを示す。
その結果、ニューラルネットワークが有限のトレーニング経験から無限に一般化できるメカニズムが明らかにされた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:21:56 GMT)
Circuit-Aware SAT Solving: Guiding CDCL via Conditional Probabilities [8.2] 回路満足度(CSAT)は電子設計自動化において重要な役割を担っている。
本稿では,新しいサーキット対応SAT解決フレームワークであるCASCADを紹介する。
我々はCASCADが最先端のCNFベースのアプローチと比較して最大10倍の解時間を短縮することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:16:47 GMT)
Scalable and (quantum-accessible) adaptive pseudorandom quantum states and pseudorandom function-like quantum state generators [8.2] Pseudorandom quantum state (PRS) と pseudorandom function-like quantum state (PRFS) は擬似乱数生成器と擬似乱数関数の量子類似体である。
本研究では,環境との絡み合いや相関を生じさせないスケーラブルPSSの新しい手法を提案する。
これにより、量子セキュアな片方向関数を仮定するスケーラブルで(量子アクセス可能な)適応PRFSに対する最初の構成が自然に提供される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:40:55 GMT)
GenEDA: Towards Generative Netlist Functional Reasoning via Cross-Modal Circuit Encoder-Decoder Alignment [8.1] 既存のトレーニング済みの回路基礎モデルは、予測タスクのスタンドアロンエンコーダや生成タスクのデコーダに限られる。
我々は,回路エンコーダとデコーダを相互に協調する最初のフレームワークであるGenEDAを提案する。
このアーキテクチャを活用して、ネットリストのための最初の生成基盤モデルを構築します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:21:11 GMT)
From Split to Share: Private Inference with Distributed Feature Sharing [8.1] クラウドベースの機械学習・アズ・ア・サービス(ML)は、機密性の高いクライアントデータを扱う際に深刻なプライバシー上の懸念を引き起こす。
単一露出表現を分散特徴共有に置き換える,プライベート推論のための新しいパラダイムであるPrivDFSを提案する。
PrivDFSはクライアント上の入力機能を複数のバランスの取れた共有に分割する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:41:10 GMT)
APOLLO: Automated LLM and Lean Collaboration for Advanced Formal Reasoning [8.1] APOLLOは、Leanコンパイラの強みとLLMの推論能力を組み合わせた、モデルに依存しないパイプラインである。
エージェントのセットが証明を分析し、シンタックスのエラーを修正し、リーンを使って証明の誤りを特定します。
修理されたサブステイストは再結合され、再検証され、ユーザ制御された最大試行回数まで反復される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:58:08 GMT)
R1-RE: Cross-Domain Relation Extraction with RLVR [8.0] R1-REは、関係抽出のための検証可能な報酬(RLVR)フレームワークである。
提案手法は, アノテーションタスクに対する小言語モデルの推論能力を引き合いに出し, OODの堅牢性を大幅に向上させる。
R1-RE-7Bモデルは、GPT-4oのような主要なプロプライエタリモデルと同等の平均OOD精度が約70%に達する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:29:40 GMT)
Symmetric Behavior Regularization via Taylor Expansion of Symmetry [8.0] 対称発散は正規化として解析政策を許さず、損失として数値問題を生じさせることを示した。
対称分岐を持つ最初の実用的BRPOアルゴリズムであるSymmetric $f$ Actor-Critic (S$f$-AC)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:01:29 GMT)
BadTime: An Effective Backdoor Attack on Multivariate Long-Term Time Series Forecasting [7.9] 我々は,MLTSFモデルに対するBadTimeと呼ばれる最初の効果的な攻撃手法を提案する。
BadTimeは、トレーニングデータを汚染し、バックドアトレーニングプロセスをカスタマイズすることでバックドア攻撃を実行する。
我々はBadTimeが時系列予測に対するSOTA(State-of-the-art)バックドア攻撃を著しく上回っていることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:18:01 GMT)
Uncertainty-aware Predict-Then-Optimize Framework for Equitable Post-Disaster Power Restoration [7.9] ハリケーンのような極度の気象イベントは、効率的で公平な電力系統の復旧の緊急の必要性を強調している。
我々のデータ駆動分析は、不利なコミュニティがより少ない復元要求を提出する傾向があるため、要求の提出量に大きな差があることを明らかにします。
地域社会における復旧効率と株式の両立を両立させる,株式対応型電力復旧戦略を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:30 GMT)
What Holds Back Open-Vocabulary Segmentation? [7.9] オープンボキャブラリのアプローチは、何十億もの画像キャプチャペアを事前訓練することで、このギャップを埋めることを約束する。
本稿では,これらのボトルネックを特定し,分離する新しいオラクルコンポーネントについて,その基盤となる情報を利用して提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:46:47 GMT)
Avoiding Catastrophe in Online Learning by Asking for Help [7.9] 本稿では,災害の可能性を最小化するオンライン学習問題を提案する。
まず、一般に、任意のアルゴリズムがメンターを線形にクエリするか、カタストロフィを引き起こすことがほぼ保証されているかを示す。
時間的地平線が大きくなるにつれて,メンターの双方が0に近づいたことを後悔するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:58:13 GMT)
CAD-Judge: Toward Efficient Morphological Grading and Verification for Text-to-CAD Generation [7.8] CAD-Judgeは、CAD選好グレーディングと文法的検証を効果的かつ効果的に行うための、新しい、検証可能な報酬システムである。
本稿では,シンプルなエージェントCAD生成手法を導入し,Compiler-as-a-Review Moduleを採用した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:30:56 GMT)
Evaluating User Experience in Conversational Recommender Systems: A Systematic Review Across Classical and LLM-Powered Approaches [7.8] 会話型レコメンダシステム (CRS) は, ドメイン間で研究の関心が高まりつつあるが, ユーザエクスペリエンス (UX) の評価は限られている。
既存のレビューは、特に適応型および大規模言語モデル(LLM)ベースのCRSにおいて、経験的UX研究を概ね見落としている。
以上の結果から, ポストホック調査が支配的であり, ターンレベルの情緒的UX構成はめったに評価されず, 適応行動はUX結果にはほとんど関連しないことが明らかとなった。
これらの知見は、より透明でエンゲージメントがあり、ユーザ中心のCRS評価プラクティスの開発を支援する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:55:11 GMT)
Generative Bid Shading in Real-Time Bidding Advertising [7.8] 本稿では,生成バイドシェーディング(GBS)をエンドツーエンド生成モデルとして紹介する。
これは、段階的に残差報酬モデルを取得することで比率を生成する自己回帰的アプローチを取り入れている。
Meitプラットフォーム上で毎日何十億もの入札リクエストを処理している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:34:49 GMT)
Prompt Obfuscation for Large Language Models [7.7] オーバヘッドの少ないシステムプロンプトの抽出を防止するために,プロンプト難読化を導入する。
難解なプロンプト出力と元のプロンプトの出力を比較することで,我々のアプローチを評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:24:09 GMT)
Self-Managing DRAM: A Low-Cost Framework for Enabling Autonomous and Efficient in-DRAM Operations [7.7] 本稿では,自律的なDRAM保守操作を可能にする,低コストなDRAMアーキテクチャであるSelf-Managing DRAM(SMD)を提案する。
SMDは、メモリコントローラからチップへのメンテナンス操作を制御する責任を負う。
DDRxインタフェースに新しいピンを追加することなく、低レイテンシで実装可能であることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:37:52 GMT)
Meta-rater: A Multi-dimensional Data Selection Method for Pre-training Language Models [7.6] データ品質を評価するために,専門性,可読性,推論,清潔さの4つの側面を提案する。
学習した最適重み付けにより,これらの次元を既存の品質指標と統合する多次元データ選択手法であるMeta-raterを紹介する。
実験により、Meta-raterは1.3Bパラメータモデルの収束速度を2倍にし、下流タスク性能を3.23倍に改善し、7.2Bパラメータのモデルにスケールする利点がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:34:10 GMT)
SenseCrypt: Sensitivity-guided Selective Homomorphic Encryption for Joint Federated Learning in Cross-Device Scenarios [7.6] ホモモルフィック暗号化(HE)は、フェデレートラーニング(FL)の確保に有効であるが、高いオーバーヘッドと適応コストに悩まされている。
我々は、デバイス間FLクライアント毎のセキュリティとHEオーバーヘッドを適応的にバランスさせるために、感性誘導型選択型EnCryptionフレームワークであるSenseCryptを提案する。
実験では、SenseCryptは最先端の反転攻撃に対するセキュリティを確保し、IIDデータと同様に通常のモデルの精度を達成し、従来のHE手法と比較してトレーニング時間を58.4%から88.7%削減している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:42:41 GMT)
A Compositional Framework for On-the-Fly LTLf Synthesis [7.6] 両手法の強みを統合した合成フレームワークについて述べる。
我々のフレームワークは、他の解決者が扱えない顕著な数のインスタンスを解決できます。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:31:49 GMT)
Persistent Instability in LLM's Personality Measurements: Effects of Scale, Reasoning, and Conversation History [7.6] 400B+モデルでさえ、相当な応答変動を示す。
連鎖推論、詳細なペルソナ指導、会話履歴の含意など、行動の安定化を期待する介入は、パラドックス的に変動を増大させる。
予測可能な行動を必要とする安全クリティカルなアプリケーションに対しては,人格に基づくアライメント戦略が根本的に不十分である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:11:33 GMT)
NVSpeech: An Integrated and Scalable Pipeline for Human-Like Speech Modeling with Paralinguistic Vocalizations [7.6] パラ言語的発声は自然な音声通信に不可欠である。
NVSpeechはパラ言語的発声の認識と合成を橋渡しする。
NVSpeechは、マンダリンで表現力のある音声モデリングのための、オープンで大規模な単語レベルの注釈付きパイプラインを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:25:26 GMT)
Perch 2.0: The Bittern Lesson for Bioacoustics [7.5] Perch(パーチ)は、バイオ音響学の訓練済みモデルである。
教師付き方式で訓練され、何千もの発声種に対する既成の分類スコアと、移動学習のための強力な埋め込みの両方を提供する。
この新しいリリースであるPerch 2.0では、鳥のみを対象としたトレーニングから、大規模なマルチタキサデータセットまで拡張しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:34:43 GMT)
The Aging Multiverse: Generating Condition-Aware Facial Aging Tree via Training-Free Diffusion [7.5] 一つの画像から複数の可塑性顔の老化軌跡を生成するためのフレームワークであるAging Multiverseを紹介する。
本研究では,アイデンティティの保存,年齢の正確さ,条件管理のバランスをとるための,学習自由拡散に基づく手法を提案する。
実験とユーザスタディでは、アイデンティティ保存、高齢化リアリズム、条件付きアライメントなど、最先端のパフォーマンスが実証されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:50:46 GMT)
ViFP: A Framework for Visual False Positive Detection to Enhance Reasoning Reliability in VLMs [7.5] 偽陽性(FP)推論は、モデルが正しい答えを生成するが、誤った推論経路に従うときに起こる。
視覚的推論の信頼性を高めるためのフレームワークであるViFPを提案する。
FPを検出することにより、解答精度と推理性の両方を改善する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:31:11 GMT)
An Early Investigation of the HHL Quantum Linear Solver for Scientific Applications [7.5] 本稿では,Harrow-Hassidim-Lloyd (HHL) アルゴリズムを用いて量子コンピューティングによる科学的・工学的な問題に対処する。
電力グリッド管理や気候予測といった領域に着目し,量子位相推定の精度の相関性を示す。
本稿では, 量子位相推定による指数的資源コストを, 量子誤差補正前後から要約し, 物理量子ビットの要求を低減できる可能性を示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:59:41 GMT)
Evaluating the Robustness of Multimodal Agents Against Active Environmental Injection Attacks [7.5] 本研究では,AIエージェントが環境中の「インポスタ」を検出する能力について検討した。
重大な脅威攻撃者は、悪意のある攻撃を環境要素として偽装し、エージェントの実行プロセスにアクティブな障害を注入することができる。
AEIA-MNは,MLLMをベースとしたエージェントのロバスト性を評価するために,モバイルオペレーティングシステムのインタラクション脆弱性を利用する攻撃手法である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:04:43 GMT)
TalkDep: Clinically Grounded LLM Personas for Conversation-Centric Depression Screening [7.4] メンタルヘルスサービスは、臨床専門家を育成するための実際のトレーニングデータの可用性を上回っている。
この不足は、トレーニングと評価を支援するシミュレートされた患者や仮想的な患者の開発を動機付けている。
本稿では,患者プロファイルの多様化を図った新しい患者シミュレーションパイプラインであるTalkDepを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:30:47 GMT)
OmniPlay: Benchmarking Omni-Modal Models on Omni-Modal Game Playing [7.3] オムニプレイ(OmniPlay)は、全知覚スペクトルにおけるエージェントモデルの融合と推論能力を調査するために設計された診断ベンチマークである。
高忠実度メモリタスクに超人的性能を示すが、堅牢な推論と戦略的計画を必要とする課題において、体系的な失敗に苦しむ。
以上の結果から, AGI への道のりは, 相乗的融合に明示的に対処するためには, スケーリング以上の研究が必要であることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:58:58 GMT)
Quasi-Clique Discovery via Energy Diffusion [7.3] 本稿では,エネルギー拡散にインスパイアされた新しい準斜め探索アルゴリズムEDQCを紹介する。
30の実世界のデータセットに対する実験結果から、EDQCは最先端のベースラインよりも大きな準傾角を一貫して発見することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:59:56 GMT)
SID: Benchmarking Guided Instruction Capabilities in STEM Education with a Socratic Interdisciplinary Dialogues Dataset [7.2] LLMの高次誘導能力を評価するために設計された最初のベンチマークであるSIDを紹介する。
私たちのコントリビューションには、48の複雑なSTEMプロジェクトにわたる10,000の対話ターンの大規模なデータセットが含まれています。
ベースライン実験は、最先端のLLMでさえ効果的なガイド付き対話を実行するのに苦労していることを確認した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:49:26 GMT)
Expert-Like Reparameterization of Heterogeneous Pyramid Receptive Fields in Efficient CNNs for Fair Medical Image Classification [7.2] 我々は、不均一ピラミッド受容場(ERoHPRF)のエキスパートライクなReパラメータ化という新しい概念を開発する。
ERoHPRFは、よく設計された不均一なピラミッドRFバッグを用いて、病変の特徴を捉え、マルチエキスパートコンサルテーションモードを模倣することを目的としている。
提案するERoHPRFは,医用画像の分類,公平性,計算オーバーヘッドの観点から,最先端手法よりも優れたトレードオフを維持している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:25:31 GMT)
Uni-DocDiff: A Unified Document Restoration Model Based on Diffusion [7.2] 拡散に基づく統一かつ高度にスケーラブルな文書復元モデルであるUni-DocDiffを提案する。
Uni-DocDiffは学習可能なタスクプロンプト設計を開発し、多様なタスクにまたがる優れたスケーラビリティを保証する。
textbfPrior textbfPoolは、ローカルな高周波特徴とグローバルな低周波特徴を組み合わせた、シンプルで包括的なメカニズムである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:30:39 GMT)
Deliberative Reasoning Network: An Uncertainty-Driven Paradigm for Belief-Tracked Inference with Pretrained Language Models [7.1] Deliberative Reasoning Network (DRN) は、確率から不確実性への論理的推論を再構成する新しいパラダイムである。
DRNは、信念状態を明示的に追跡し、競合する仮説の不確実性を定量化することによって、本質的な解釈可能性を達成する。
我々は、DRNを、より信頼できるAIシステムを構築するための、基礎的で検証可能なシステム2推論コンポーネントとして位置付ける。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:33:35 GMT)
RLTHF: Targeted Human Feedback for LLM Alignment [7.0] ユーザの好みに合わせて微調整された大きな言語モデルは、高品質なヒューマンアノテーションのコストが高いため、難しい。
LLMをベースとした初期アライメントと選択的人間のアノテーションを組み合わせた人間-AIハイブリッドフレームワークであるRLTHFを提案する。
RLTHFは,ヒトのアノテーション努力の6~7%で全人類のアノテーションレベルのアライメントに達する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:39:55 GMT)
Log2Sig: Frequency-Aware Insider Threat Detection via Multivariate Behavioral Signal Decomposition [6.9] インサイダーの脅威検出は、悪意のある行為を欺く性質のため、重大な課題となる。
ユーザのログを行動周波数信号に変換する堅牢な異常検出フレームワークであるLog2Sigを提案する。
Log2Sigは精度とF1スコアの両方で最先端のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:47:26 GMT)
HyCodePolicy: Hybrid Language Controllers for Multimodal Monitoring and Decision in Embodied Agents [6.9] HyCodePolicyは、エンボディエージェントのための言語ベースの制御フレームワークである。
コード合成、幾何学的接地、知覚的モニタリング、反復的修復をクローズドループプログラミングサイクルに統合する。
その結果,HyCodePolicyはロボット操作ポリシーの堅牢性とサンプル効率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:24:55 GMT)
PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems [6.7] 本稿ではPinterestのアプリケーション向けに開発された新しい生成検索モデルであるPinRecを紹介する。
我々の実験は、PinRecがパフォーマンス、多様性、効率のバランスをとれることを実証しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:36:12 GMT)
Learning to Diagnose Privately: DP-Powered LLMs for Radiology Report Classification [6.6] 本研究は,放射線学レポートテキスト上で,差分プライバシー (DP) を用いた大規模言語モデル (LLM) の微調整を行うためのフレームワークを提案する。
MIMIC-CXR胸部X線写真とCT-RATECTを用いた50,232例の胸部X線撮影を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:17:58 GMT)
No Masks Needed: Explainable AI for Deriving Segmentation from Classification [6.6] 医用画像に特化して訓練済みモデルを微調整する手法を提案する。
提案手法は、説明可能なAIを統合して関連スコアを生成し、セグメンテーションプロセスを強化する。
標準的なベンチマークでは優れているが、医学的応用では弱い従来の手法とは異なり、CBIS-DDSM、NuInsSeg、Kvasir-SEGといったデータセットでは改善された結果が得られる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:18:00 GMT)
Dual-Stream Attention with Multi-Modal Queries for Object Detection in Transportation Applications [6.6] トランスフォーマーをベースとしたオブジェクト検出器は、固定されたクエリと集中的な注意によって引き起こされるオクルージョン、きめ細かなローカライゼーション、計算の非効率に苦しむことが多い。
我々は,クエリ適応と構造化されたクロスアテンションの両方を導入し,精度と効率を向上させるための新しいフレームワークである,マルチモーダルクエリを用いたDAMM,デュアルストリームアテンションを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:37:24 GMT)
Quantum Graph States: Bridging Classical Theory and Quantum Innovation, Workshop Summary [6.5] 量子グラフステートとそのコンピューティング、ネットワーク、センシングへの応用。
セッションでは、測定ベースの量子計算の実現におけるグラフ理論構造の基本的役割を強調した。
ワークショップは、様々な量子プラットフォームにおける絡み合い構造、シミュレーションの複雑さ、実験的実現におけるオープンな問題に対処するための研究勧告を目標として締めくくった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:04:30 GMT)
Unveiling quantum criticality of disordered Aubry-André-Harper models via typical fidelity susceptibility [6.4] 局所化遷移と量子臨界性について研究する。
Aubry-Andr'e-Harper(AAH)モデルの基底状態。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:06:21 GMT)
A Hybrid AI Methodology for Generating Ontologies of Research Topics from Scientific Paper Corpora [6.4] Sci-OGは研究トピックを生成するための半自動的な方法論である。
本稿では,研究トピックを生成するための半自動設計手法であるSci-OGを提案する。
提案手法は,21,649件の注釈付きセマンティック・トリプルのデータセットを用いて,様々な代替ソリューションに対して評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:48:14 GMT)
Share Your Attention: Transformer Weight Sharing via Matrix-based Dictionary Learning [6.3] 本稿ではトランス層間における重み共有の構造化フレームワークを提案する。
CNNにおける辞書学習に着想を得て,トランスフォーマー層間の重み共有を構造化するためのフレームワークを提案する。
提案手法は,アテンション投影行列を共有辞書原子に分解し,アテンションモジュールのパラメータを66.7%削減する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:06:43 GMT)
Enhancing Graph-based Recommendations with Majority-Voting LLM-Rerank Augmentation [6.3] レコメンデーションシステムは、限られたユーザとイテムの相互作用によって引き起こされるデータ空間に悩まされることが多い。
本稿では,大規模言語モデルと項目記述を利用した新しいデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:55:06 GMT)
NACHOS: Neural Architecture Search for Hardware Constrained Early Exit Neural Networks [6.3] Early Exit Neural Networks(EENN)は、Early Exit(EEC)を備えた非標準ディープニューラルネットワーク(DNN)を提供する
本研究は,ハードウェア制約付き早期排他ニューラルネットワーク(NACHOS)のためのニューラルアーキテクチャ探索である。
NACHOSは、推論時にEENNが実行する乗算および累積(MAC)操作の精度と数に制約を満たす最適なEENNを設計するための最初のNASフレームワークである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:41:42 GMT)
Assessing Engineering Student Perceptions of Introductory CS Courses in an Indian Context [6.2] 本研究では,導入型コンピュータサイエンス/プログラミングコースにおける工学生のアセスメント実践に対する認識について検討する。
学生は、効果的な学習活動として研究室の課題を認識し、試験やプロジェクトを真正かつスキル向上と見なしている。
学生は授業内容形成におけるインストラクターの役割を高く評価し、教師が親しみやすく役に立つことを見出した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:04:19 GMT)
Towards Scalable Bayesian Optimization via Gradient-Informed Bayesian Neural Networks [6.2] 局所勾配情報を用いた関数観測を効果的に増強するBNNトレーニングのための勾配インフォームド損失関数を提案する。
このアプローチの有効性は、改良されたBNN予測とより高速なBO収束の観点から、よく知られたベンチマークで実証されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:41:42 GMT)
InceptoFormer: A Multi-Signal Neural Framework for Parkinson's Disease Severity Evaluation from Gait [6.2] InceptoFormerは、歩行動態解析によるパーキンソン病重症度評価のために設計された多信号ニューラルネットワークフレームワークである。
我々のアーキテクチャでは、インセプションモデルの1D適応を導入し、それをインセプション1Dと呼び、Hehn and Yahr(H&Y)スケールに従ってPD重大化を行うトランスフォーマーベースのフレームワークも導入しています。
InceptoFormerは96.6%の精度を達成し、PD重大度評価において既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:27:11 GMT)
A Foundation Model for DAS Signal Recognition and Visual Prompt Tuning of the Pre-trained Model for Downstream Tasks [6.1] 本研究では,MAEPD と呼ばれる Masked Autocoder に基づくDAS信号認識の基礎モデルを提案する。
このモデルは635860サンプルのデータセットに事前トレーニングされており、DAS歩行信号、2つの時間的GASF画像、パイプライン漏れの2D時間周波数画像、クジラの発声や地震活動を含むオープンデータセット信号を含んでいる。
VPT-Deepアプローチは、パラメータの0.322%しか微調整されていない96.94%の分類精度を達成し、従来のFFT(Full Fine Tuning)法を0.61%上回り、トレーニング時間を短縮する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:02:25 GMT)
How Does Bilateral Ear Symmetry Affect Deep Ear Features? [6.1] 両耳対称性がCNNに基づく耳の認識の有効性に与える影響について検討した。
トレーニングとテストの間、左右の耳を別々に扱うと、顕著なパフォーマンス改善につながる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:35:59 GMT)
Galaxy: A Cognition-Centered Framework for Proactive, Privacy-Preserving, and Self-Evolving LLM Agents [6.1] インテリジェントパーソナルアシスタント(IPAs)は、人間の能力を高め、ユーザに代わってタスクを実行するように設計されている。
この研究は認知モデルとシステムレベルの設計を整合させるセマンティック構造である認知フォレスト(Cognition Forest)を提案する。
我々は,多次元インタラクションとパーソナライズされた機能生成をサポートするフレームワークであるGalaxyを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:46:38 GMT)
Symmetry & Critical Points for Symmetric Tensor Decomposition Problems [6.1] 実対称テンソルをランク1項の和に分解する非最適化問題を考える。
使用法はリッチ対称性構造で構成され、問題次元においてプーズ級数で表される臨界点の無限の族を構成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:33:31 GMT)
Can SGD Handle Heavy-Tailed Noise? [6.1] Gradient Descent (SGD) は大規模最適化のための機械学習プロジェクトであるが、重尾雑音下での理論的挙動は理解されていない。
このような悪条件下でSGDが確実に成功できるかどうかを精査する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:09:41 GMT)
SEA: Self-Evolution Agent with Step-wise Reward for Computer Use [6.1] 本稿では,コンピュータ利用のための自己進化エージェント(SEA)を提案し,このエージェントを開発するために,データ生成,強化学習,モデル拡張における創造的手法を提案する。
提案したデータ生成,トレーニング戦略,強化の革新に基づいて,7Bパラメータのみを用いたコンピュータ利用のための自己進化エージェント(SEA)が提供される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:57:22 GMT)
Prompt Injection Vulnerability of Consensus Generating Applications in Digital Democracy [6.1] 大言語モデル(LLM)は、デジタル民主主義の実験において、コンセンサスステートメントと集約された嗜好を生成する方法として注目を集めている。
本稿では,アタックの4次元分類を導入することで,コンセンサス生成システムを対象とした迅速なインジェクション攻撃の影響について検討する。
LLMは批判的な攻撃、不確実なプロンプトを使った攻撃に対してより脆弱で、曖昧な意見の一致を抑えるのにより効果的だと考えている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:10:01 GMT)
CLIP-AGIQA: Boosting the Performance of AI-Generated Image Quality Assessment with CLIP [6.0] 生成画像の品質評価のためのCLIPに基づく回帰モデルであるCLIP-AGIQAを開発した。
CLIPのテキスト知識を品質評価に活用するために,複数カテゴリの学習可能なプロンプトを実装した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:19:30 GMT)
Zero-Shot Neural Architecture Search with Weighted Response Correlation [6.0] 重み付き応答相関(WRCor)と呼ばれる新しい学習自由度推定プロキシを提案する。
WRCorは、異なる入力サンプル間の応答の相関相関行列を用いて、推定されたアーキテクチャのプロキシスコアを算出する。
我々のNASアルゴリズムは、4GPU時間以内にImageNet-1kデータセット上で22.1%のテストエラーのあるアーキテクチャを発見できる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:48:18 GMT)
Reconstructing Physics-Informed Machine Learning for Traffic Flow Modeling: a Multi-Gradient Descent and Pareto Learning Approach [5.9] 物理インフォームド・機械学習(PIML)は現代の流れモデリングにおいて重要である。
本稿では,多目的最適化問題として,トレーニングプロセスの修正によるPIMLのパラダイムシフトを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:56:18 GMT)
PIS3R: Very Large Parallax Image Stitching via Deep 3D Reconstruction [5.8] 画像縫合は、異なる視点から撮影された2つの画像を、シームレスで広い1つの画像に整列することを目的としている。
既存の縫合法の多くは、このような画像を大きな視差で効果的に扱うのに苦労している。
我々は, 深部3次元再構成という新しい概念を基礎として, 非常に大きな視差に対して頑健なPSS3Rを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:18:45 GMT)
What Do Humans Hear When Interacting? Experiments on Selective Listening for Evaluating ASR of Spoken Dialogue Systems [5.8] 音声対話システム(SDS)は、パイプラインのフロントエンドで自動音声認識(ASR)を利用する。
我々は、人間が対話応答を生成するときの選択的リスニングを、対話応答を生成するための人間の転写と参照転写とを比較して実験的に確認する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:44:57 GMT)
DET-GS: Depth- and Edge-Aware Regularization for High-Fidelity 3D Gaussian Splatting [5.8] 3D Gaussian Splatting (3DGS) は、効率的かつ高忠実な新規なビュー合成の分野において重要な進歩を示している。
既存の手法はしばしば非局所的な深さ正規化に依存しており、微細な構造を捉えることができない。
本稿では,3次元ガウス平滑化のための深度とエッジ認識の統一正規化フレームワークであるDET-GSを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:37:26 GMT)
Unsupervised Graph Deep Learning Reveals Emergent Flood Risk Profile of Urban Areas [5.7] 本研究では,新しい教師なしグラフ深層学習モデル(FloodRisk-Net)に基づく都市洪水リスク評価モデルを提案する。
洪水リスクは各大都市圏統計地域(MSA)の階層構造において空間的に分布しており、中核都市が最も高い洪水リスクを負っている。
複数の都市は、総合的な洪水リスクレベルが高く、空間的不平等が低く、都市開発と洪水リスク低減のバランスをとる選択肢が限られていることが示されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:37:17 GMT)
Two-Way Garment Transfer: Unified Diffusion Framework for Dressing and Undressing Synthesis [5.7] 本稿では,マスク誘導型VTONとマスクフリーなVTOFFを同時に解決する共同衣料中心画像合成フレームワークを提案する。
具体的には,2つのタスクをシームレスにブリッジするために,遅延画像と画素画像の両方からの2条件誘導を用いる。
一方,マスク誘導型VTONとマスクフリー型VTOFFのマスク依存性非対称性を解決するため,段階的なトレーニングパラダイムを考案した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:37:16 GMT)
Generating Feasible and Diverse Synthetic Populations Using Diffusion Models [5.7] 集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。
深層生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる。
本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:11:27 GMT)
TRAIL: Joint Inference and Refinement of Knowledge Graphs with Large Language Models [5.7] TRAILは思考、推論、インクリメンタルラーニングのための、新しく統合されたフレームワークである。
共同推論と動的KG精製を大きな言語モデルと組み合わせる。
複数のベンチマークでの大規模な実験により、TRAILは既存のKG拡張および検索拡張LDMベースラインを3%から13%上回った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:25:05 GMT)
Uncertainty-Aware Spatial Color Correlation for Low-Light Image Enhancement [5.7] U2CLLIEは不確実性認識と空間カラー因果相関モデルを統合する新しいフレームワークである。
複数のベンチマークデータセットで最先端のパフォーマンスを実現し、さまざまな場面で堅牢なパフォーマンスと強力な一般化を実現している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:02:21 GMT)
Experimental Analysis of Productive Interaction Strategy with ChatGPT: User Study on Function and Project-level Code Generation Tasks [5.7] 本研究では,Human-LLMインタラクション(Human-LLM Interactions, HLI)がコード生成生産性に与える影響について検討する。
15のHLI機能のうち3つは、コード生成の生産性に大きな影響を与えました。
29のランタイムとロジックエラーの分類は、提案された緩和計画とともに、HLIプロセス中に発生する可能性がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:48:48 GMT)
A Survey of Controllable Learning: Methods and Applications in Information Retrieval [5.6] 我々は、制御可能な学習(CL)の形式的定義を提供し、情報検索(IR)におけるその応用について議論する。
学習、評価、タスク設定、オンライン環境への展開など、CLが直面している課題を特定します。
理論解析、効率的な計算、大規模言語モデル、アプリケーションシナリオ、評価フレームワークにおけるCLの有望な方向性について概説する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:22:29 GMT)
Enhancing Vision-Language Model Training with Reinforcement Learning in Synthetic Worlds for Real-World Success [5.6] 本稿では,軽量強化学習アルゴリズムであるVision-Language Decoupled Actor-Critic (VLDAC)を紹介する。
VLDACは環境レベルのみに価値を学習しながら、PPO更新を動作に適用する。
一度に1つの安価なシミュレータで1つのVLMをVLDACでトレーニングすると、広く一般化するポリシーが生成される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:08:48 GMT)
Causal Reward Adjustment: Mitigating Reward Hacking in External Reasoning via Backdoor Correction [5.5] 外部推論システムは、言語モデルとプロセス報酬モデル(PRM)を組み合わせて、複雑なタスクのための高品質な推論パスを選択する。
これらのシステムはハッキングに報いる傾向があり、高いスコアが与えられるが、論理的に正しくないパスは、PRMによって高いスコアが割り当てられ、誤った答えが導かれる。
推論経路の真の報酬を推定することにより、報酬ハッキングを緩和する手法であるCausal Reward Adjustment (CRA)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:48:55 GMT)
UNISELF: A Unified Network with Instance Normalization and Self-Ensembled Lesion Fusion for Multiple Sclerosis Lesion Segmentation [5.4] 一つのトレーニング領域内で高い精度を達成し、複数のドメイン外テストデータセットにまたがる強力な一般化性を実現するUNISELFを提案する。
UNISELFは、セグメンテーション精度を向上させるために、新しいテスト時間自己アンサンブルド病変融合を使用している。
チャレンジテストデータセットで最高のパフォーマンスの方法の1つだ。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:29:12 GMT)
GFocal: A Global-Focal Neural Operator for Solving PDEs on Arbitrary Geometries [5.3] 変圧器に基づくニューラル作用素は偏微分方程式に対する有望な代理解法として現れる。
本稿では,グローバルおよびローカルな特徴学習と融合を同時に実施するGFocalを提案する。
実験の結果、GFocalは6つのベンチマークのうち5つのベンチマークで平均15.2%の上昇率で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:02:39 GMT)
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Morphology in Modern Language Models [5.3] 25のモデルが6言語にまたがる語彙的同一性や屈折形態をどう表現するかを考察する。
モデルは、初期層に線形に語彙情報を集中し、後期層に非線形に集中することを発見した。
注目すべきは、これらのエンコーディングパターンは、アーキテクチャ、サイズ、トレーニング体制の違いにもかかわらず、テストするすべてのモデルにまたがって現れます。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:14:16 GMT)
ALScope: A Unified Toolkit for Deep Active Learning [5.3] Deep Active Learning (DAL)は、トレーニング中に最も有益な未ラベルのサンプルを選択することで、アノテーションのコストを削減する。
コンピュータビジョン(CV)と自然言語処理(NLP)から10のデータセットを統合することで、分類タスクのための新しいDALプラットフォームALScopeを提案する。
このプラットフォームは、アルゴリズムやデータセットの選択から、アウト・オブ・ディストリビューション(OOD)サンプル比のようなタスク固有の要因まで、主要な実験要素の柔軟な設定をサポートする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:39:46 GMT)
DocVCE: Diffusion-based Visual Counterfactual Explanations for Document Image Classification [5.2] 本稿では,行動可能な説明を通じて,モデルの決定に意味のある洞察を与える,生成的文書反事実について紹介する。
著者の知識を最大限に活用するために、これは文書画像解析における生成的対実的説明を探求する最初の研究である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:15:32 GMT)
Attack Pattern Mining to Discover Hidden Threats to Industrial Control Systems [5.2] 本研究は,産業制御システム(ICS)のセキュリティにおける攻撃パターンマイニングの検証に焦点を当てる。
我々はICSの攻撃パターンを生成するためのデータ駆動手法を提案している。
提案手法は, 運用水処理プラントから収集したデータから10万以上の攻撃パターンを生成するために用いられている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:47:19 GMT)
SSEmb: A Joint Structural and Semantic Embedding Framework for Mathematical Formula Retrieval [5.2] 数式の構造的特徴と意味的特徴の両方を捉えることができる新しい埋め込みフレームワークであるSSEmbを提案する。
ARQMath-3 式検索タスクでは,SSEmb は P'@10 および nDCG'@10 において,既存の埋め込み方式よりも5 ポイント以上優れている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:39:17 GMT)
An Audit and Analysis of LLM-Assisted Health Misinformation Jailbreaks Against LLMs [5.0] 大規模言語モデル(LLM)は有害な誤報を発生させる能力がある -- 必然的に、あるいは悪意のあるアウトプットを発生させようとする"ジェイルブレイク"攻撃によって引き起こされる場合。
本稿では,他のモデルが有害な医療的誤報を発生させるようなLDMによるジェイルブレイク攻撃の有効性と特徴について検討する。
また,脱獄したLLMが生成した誤情報とソーシャルメディア上の典型的な誤情報とを比較検討した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:14:28 GMT)
Taxonomy of Faults in Attention-Based Neural Networks [5.0] 注意型ニューラルネットワーク(ABNN)における障害の包括的実証的研究について紹介する。
私たちの研究は、GitHub、Hugging Face、Stack Overflowを含む10のフレームワークにわたる96のプロジェクトから収集された555の現実世界の障害の体系的な分析に基づいています。
以上の結果から,ABNNの欠陥の半数以上が注目アーキテクチャに特有のメカニズムから生じていることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:20:18 GMT)
InqEduAgent: Adaptive AI Learning Partners with Gaussian Process Augmentation [5.0] 本稿では,探索指向学習に適した学習パートナーをシミュレートし,選択するための LLM を利用したエージェントモデルを提案する。
生成エージェントは、現実世界のシナリオにおける学習者の認知的・評価的特徴を捉えるように設計されている。
実験の結果,ほとんどの知識学習シナリオやLLM環境において,InqEduAgentの最適性能が示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:28:04 GMT)
AR as an Evaluation Playground: Bridging Metrics and Visual Perception of Computer Vision Models [5.0] ARCADEは、研究者がARのリッチなコンテキストと対話性を人間中心のCV評価に容易に活用できる評価プラットフォームである。
具体的には、ARCADEはクロスプラットフォームのARデータ収集、プラグイン可能なモデル推論によるカスタム実験プロトコル、ユーザスタディ用のARストリーミングをサポートする。
本研究では,深度推定と照明推定の2種類のCVモデルを用いてARCADEを実証し,ARタスクがモデル品質の人間の知覚的判断に有効であることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:44:22 GMT)
Mjölnir: A Deep Learning Parametrization Framework for Global Lightning Flash Density [4.9] 我々は,グローバルなフラッシュ密度パラメータ化のための新しいディープラーニングベースのフレームワークであるMj"olnirを提案する。
Mj"olnirは、大規模環境条件と雷活動の間の非線形マッピングをキャプチャする。
雷活動のグローバル分布,季節変動,地域特性を正確に再現し,年間平均場のピアソン相関係数0.96を達成している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:07:36 GMT)
AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale [4.9] 本研究では,ERA5データを球面再マッピングなしで直接操作する深層畳み込みネットワークを提案する。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:40:48 GMT)
Meta-Evaluation of Translation Evaluation Methods: a systematic up-to-date overview [4.9] 1950年代から、機械翻訳(MT)は様々な科学的解決法に挑戦された。
本稿では,従来の人的判断基準,自動評価基準,評価手法のメタ評価について概説する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:29:26 GMT)
From Label Error Detection to Correction: A Modular Framework and Benchmark for Object Detection Datasets [4.9] ラベルエラー訂正のための半自動フレームワークREC$checkmark$D(リチェック)を導入する。
現在のラベル誤り検出手法は,修正フレームワークと組み合わせることで,人間がアノテートボックスをスクラッチからアノテートするのに要する時間に数百のエラーを回復できることを示す。
この検証されたセットは、ラベルエラーの検出と修正のための新しい実世界のベンチマークとしてリリースされる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:03:05 GMT)
Universal quantum phase classification on quantum computers from machine learning [4.8] シャドウトモグラフィーと現代の時系列機械学習モデルを組み合わせた新しいフレームワークを提案する。
提案手法は、有限深部局所ユニタリ回路による接続性に基づく量子位相の定義を利用する。
我々は、訓練データを処理し、普遍的な量子位相分類を実現するために、先進的な時系列モデルを用いることを実証した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:04 GMT)
A Foundational Multi-Modal Model for Few-Shot Learning [4.6] FSL(Few-shot Learning)は、少数のラベル付き例からモデルを一般化することを目的としている。
本稿では,大規模マルチモーダルモデル(LMMM)がFSLモデルの一般化を大幅に改善できることを示すことによって,FSLに対する革新的なアプローチを提案する。
我々のデータセットとフレームワークは統一的でスケーラブルなソリューションを提供し、データスカース科学領域におけるLMMMの適用障壁を著しく減らします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:12:13 GMT)
SelectiveShield: Lightweight Hybrid Defense Against Gradient Leakage in Federated Learning [4.5] フェデレートラーニング(FL)は、分散データの協調モデルトレーニングを可能にするが、勾配リーク攻撃には弱い。
差分プライバシー(DP)や同型暗号化(HE)といった既存の防御機構は、しばしばプライバシ、モデルユーティリティ、システムオーバーヘッドのトレードオフをもたらす。
準同型暗号と差分プライバシーを適応的に統合する軽量ハイブリッド防衛フレームワークであるSelectiveShieldを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:50:39 GMT)
Evaluating the Impact of LLM-guided Reflection on Learning Outcomes with Interactive AI-Generated Educational Podcasts [4.3] 本研究では、対話型AI生成ポッドキャストにリフレクションプロンプトを埋め込むことで、プロンプトのないバージョンと比較して学習とユーザエクスペリエンスが向上するかどうかを検討した。
学習結果は条件によって似ているが、リフレクションは知覚的な魅力を減らし、反射的相互作用設計に関するさらなる研究の必要性を強調している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:03:42 GMT)
Exponentially Consistent Nonparametric Linkage-Based Clustering of Data Sequences [4.3] 我々は、未知の分布から生成されたM$独立かつ同一の(d.d.)データ列の非パラメトリッククラスタリングを考える。
M$のデータシーケンスの分布は、基礎となる分散クラスタの$K$に属する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:50:08 GMT)
MonoCloth: Reconstruction and Animation of Cloth-Decoupled Human Avatars from Monocular Videos [4.3] モノクロビデオから人間のアバターを再構成・アニメーションする新しい方法であるMonoClothを提案する。
パーツベースの分解戦略は、アバターを体、顔、手、衣服に分離する。
実験の結果,MonoClothは視覚再構成品質とアニメーションリアリズムの両方を改善していることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:50:54 GMT)
Empirical Evaluation of AI-Assisted Software Package Selection: A Knowledge Graph Approach [4.1] 本研究は,ソフトウェアパッケージ選択をMCDM問題として定式化する。
データパイプラインは、ソフトウェアメタデータ、利用トレンド、脆弱性情報、開発者の感情を継続的に収集し、統合する。
システムは、大きな言語モデルを使用して、ユーザの意図を解釈し、モデルをクエリして、コンテキスト的に適切なパッケージを識別する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:55:43 GMT)
Verifiable Exponential Mechanism for Median Estimation [4.1] 本稿では,zk-SNARKを用いた指数関数機構の最初の検証実装を提案する。
具体的応用として、最初の検証可能な微分プライベート(DP)中央値推定法を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:43:01 GMT)
GRILL: Gradient Signal Restoration in Ill-Conditioned Layers to Enhance Adversarial Attacks on Autoencoders [4.0] GRILLは、不条件層における勾配信号を復元し、より効果的なノルムバウンド攻撃を可能にする手法である。
本手法は敵攻撃の有効性を著しく向上させ,より厳密なAEロバスト性評価を可能にした。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:10:21 GMT)
CodonMoE: DNA Language Models for mRNA Analyses [4.0] ゲノム言語モデル (gLMs) は、生物学的モダリティ(DNAとRNA)ごとに別々の特殊モデルを維持するか、大規模なマルチモーダルアーキテクチャを開発するかという、基本的な効率上の課題に直面している。
我々は、DNA言語モデルをRNA固有の事前学習なしで効果的なRNAアナライザに変換する軽量なアダプタであるCodonMoEを紹介した。
我々のアプローチは、ゲノム言語モデリングを統一し、より豊富なDNAデータを活用し、計算オーバーヘッドを減らすための原則化された経路を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:40:12 GMT)
GeoSR: Cognitive-Agentic Framework for Probing Geospatial Knowledge Boundaries via Iterative Self-Refinement [4.0] GeoSRは自己修正型のエージェント推論フレームワークで、コア地理的原則を反復予測ループに組み込む。
物理世界特性推定から社会経済予測に至るまでのタスクにおけるGeoSRの検証を行う。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:45:34 GMT)
Optimal Learning via Moderate Deviations Theory [4.0] 我々は、中等度偏差原理に基づくアプローチを用いて、高精度な信頼区間の体系的構築を開発する。
提案した信頼区間は,指数的精度,最小性,整合性,誤評価確率,結果整合性(UMA)特性の基準を満たすという意味で統計的に最適であることが示されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:31:40 GMT)
CharBench: Evaluating the Role of Tokenization in Character-Level Tasks [3.9] CharBenchは、既存の選択肢よりも2桁大きい文字レベルのタスクのベンチマークである。
本稿では,単語の固有性とそのトークンへのセグメンテーションがモデル性能にどのように対応するか分析する。
タスク数をカウントする際、トークン化特性は正確さと弱い相関があるのに対し、クエリされた単語の長さと実際の文字数はより重要な役割を担っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:06:34 GMT)
Super Resolved Imaging with Adaptive Optics [3.9] 天文望遠鏡は視野(FoV)と画像分解能のトレードオフに悩まされている。
本研究は,このトレードオフを克服するための新しい計算イメージング手法を提案する。
私たちのキーとなるアイデアは、AOシステムの変形可能なミラーを使用して、一連の学習された正確に制御された歪みを光波面に適用することです。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:15:48 GMT)
CLaSP: Learning Concepts for Time-Series Signals from Natural Language Supervision [3.9] 本稿では,自然言語クエリを用いた時系列信号検索の新しいモデルであるCLaSPを提案する。
CLaSPは、時系列信号を自然言語記述にマッピングするために、対照的な学習を採用することで、課題に対処する。
自然言語クエリに基づく時系列パターンの検索において,CLaSPが高精度であることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:01:31 GMT)
Efficient classical computation of the neural tangent kernel of quantum neural networks [3.7] 広帯域の量子ニューラルネットワークに付随するニューラル・タンジェント・カーネル(NTK)を推定する効率的なアルゴリズムを提案する。
これらのネットワークは、任意のハミルトニアンによって生成される時間進化によって与えられるパラメトリックゲートとインターリーブされた任意のユニタリ作用素からなる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:48:01 GMT)
CoCoTen: Detecting Adversarial Inputs to Large Language Models through Latent Space Features of Contextual Co-occurrence Tensors [3.7] 本稿では,コンテキスト共起行列を用いた検出問題について検討する。
本論文では,コンテキスト共起行列の潜在空間特性を利用した新しい手法を提案する。
評価の結果,ラベル付きプロンプトの0.5%しか使用せず,F1スコアの0.83を達成できた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:30:43 GMT)
Hop, Skip, and Overthink: Diagnosing Why Reasoning Models Fumble during Multi-Hop Analysis [3.7] モデルの推論と実践的なAIチャットボットへの統合は、高度な数学、深い探索、そして抽出された質問応答問題の解決にブレークスルーをもたらした。
しかし、これらのモデルが汎用言語モデル以上の幻覚を与える理由についての完全な理解が欠落している。
本研究では,マルチホップ質問応答タスクにおける現代言語モデルの推論失敗を系統的に解明する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:58:36 GMT)
ToxicTAGS: Decoding Toxic Memes with Rich Tag Annotations [3.7] 筆者らは,<i>2</i>を毒性および正常に分類し,<i>2</i>を<i>2</i>に分類し,<i>2</i>を<i>2</i>に分類し,<i>2</i>を<i>2</i>に分類した。
このデータセットの重要な特徴は、各ミームのコンテキストを強化するために、社会的に関連付けられたタグの補助メタデータが強化されていることである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:46:14 GMT)
A streamlined quantum algorithm for topological data analysis with exponentially fewer qubits [3.6] 永続ベッチ数を計算するための改良された量子アルゴリズムを提案する。
量子アルゴリズムが実用的なタスクの指数的高速化を達成できるかどうかを論じる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:20:33 GMT)
EdgeInfinite-Instruct: Bridging SFT-Based Optimization and NPU-Level Efficiency for Edge Devices [3.5] 本稿では,要約や質問応答といった長文タスクに適したS-SFT(Seegmented Supervised Fine-Tuning)戦略を提案する。
長文ベンチマークと実世界のモバイルタスクを用いた実験により,NPU加速エッジデバイス上での効率を維持しつつ,ドメイン固有性能を向上させることができた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:32:53 GMT)
Differentially Private Model-X Knockoffs via Johnson-Lindenstrauss Transform [3.5] 本稿では,高次元制御変数選択のための新しい民営化フレームワークを提案する。
当社のフレームワークは,差分プライバシー制約下での厳格なFDR(False Discovery Rate)制御を可能にする。
この作業は、ノックオフベースのFDRコントロールとプライベートデータリリースという、2つの重要なパラダイムを橋渡しする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:16:53 GMT)
From MAS to MARS: Coordination Failures and Reasoning Trade-offs in Hierarchical Multi-Agent Robotic Systems within a Healthcare Scenario [3.5] マルチエージェントロボットシステム(MARS)は、物理的およびタスク関連の制約を統合することで、マルチエージェントシステム上に構築される。
高度なマルチエージェントフレームワークが利用可能であるにも関わらず、実際のロボットへのデプロイメントは制限されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:54:10 GMT)
A Few Words Can Distort Graphs: Knowledge Poisoning Attacks on Graph-based Retrieval-Augmented Generation of Large Language Models [3.5] グラフベースのRetrieval-Augmented Generation (GraphRAG)は、最近、大規模言語モデル(LLM)を強化するための有望なパラダイムとして登場した。
筆者らは2つの知識中毒攻撃 (KPA) を提案し, ソーステキスト中の少数の単語のみを改変することで, 構築したグラフを著しく変更し, グラフRAGを中毒し, 下流の推論を著しく誤解させることを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:01:26 GMT)
Probabilistic Modeling of Jailbreak on Multimodal LLMs: From Quantification to Application [3.5] 入力のジェイルブレイクポテンシャルを定量化するためにジェイルブレイク確率を導入し、この入力によってMLLMが悪意ある応答を発生させる可能性を示す。
具体的には,Jailbreak-Probability-based Attack (JPA)を提案する。
また,攻撃対策として,MLLMパラメータ更新によるジェイルブレイク確率の最小化を目的としたジェイルブレイクプロビタビリティに基づくファインタニング(JPF)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:38:30 GMT)
GridSE: Towards Practical Secure Geographic Search via Prefix Symmetric Searchable Encryption (Full Version) [3.5] 本稿では,DGGS互換のセキュア地理検索のための新しい構成であるGridSEを提案する。
GridSEは150 times$ -5,000times$ on search latency, and a save of 99% on communication overhead as the state of the-of-the-art。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:42:25 GMT)
A virtual sensor fusion approach for state of charge estimation of lithium-ion cells [3.4] 本稿では,リチウムイオンセルの電荷状態(SOC)を2つの広く使用されているパラダイムの組み合わせで推定する。
最近の仮想センサ (VS) 合成技術について考察し, 以下に示す。
データから直接Affine-Varyingモデルを学習し、(ii)APVモデルから線形オブザーバのバンクを導出する。
SOCを予測するために、オブザーバから抽出された特徴と入力および出力データから機械学習テクニックをトレーニングする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:52:28 GMT)
WAVE: Warp-Based View Guidance for Consistent Novel View Synthesis Using a Single Image [3.4] 本稿では,モジュールを追加せずに拡散モデルを利用するビュー一貫性画像生成手法を提案する。
我々のキーとなる考え方は、適応的な注意操作と雑音の再生を可能にする訓練不要な手法で拡散モデルを強化することである。
本手法は,様々な拡散モデル間での視界の整合性を向上し,その適用性を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:53:51 GMT)
InfoQ: Mixed-Precision Quantization via Global Information Flow [3.4] リソース制約のあるデバイスにディープニューラルネットワークをデプロイするには、MPQ(Mixed-precision Quantization)が不可欠である。
私たちは、ビット幅検索フェーズでトレーニング不要なMPQのための新しいフレームワークであるInfoQを紹介します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:07:49 GMT)
Learning the Simplest Neural ODE [3.3] この研究は、最も単純な1次元線形モデルを通して、なぜニューラルネットワークの訓練が難しいのかを実証する。
そこで我々は,新しい安定化法を提案し,解析的収束解析を行う。
ここで紹介される洞察とテクニックは、Neural ODEの研究を開始する研究者のための簡潔なチュートリアルとして役立ちます。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:01:15 GMT)
Graph Representation Learning with Massive Unlabeled Data for Rumor Detection [3.3] ソーシャルメディアプラットフォームであるWeiboとTwitterから収集した大規模未ラベルトピックデータセットをクレーム伝搬構造を用いて,さまざまなトピックを対象としたグラフ検索学習モデルのセマンティックラーニング能力を向上させる。
実験により,これらの汎用グラフによる自己教師付き学習手法は,噂検出タスクに特化して設計された従来手法よりも優れていたことがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:33:56 GMT)
SPJFNet: Self-Mining Prior-Guided Joint Frequency Enhancement for Ultra-Efficient Dark Image Restoration [3.3] 現在の暗黒画像復元法は、深刻な効率のボトルネックに悩まされている。
本稿では,SPJFNetを用いた自己マイニング事前誘導型結合周波数拡張ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:06:29 GMT)
Benchmarking Sociolinguistic Diversity in Swahili NLP: A Taxonomy-Guided Approach [3.2] スワヒリNLPの分類誘導評価について紹介する。
我々はケニアの話者から2,170のフリーテキスト応答のデータセットを収集する。
このデータは、部族の影響、都会の言葉、コードミキシング、借用語などを示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:10:11 GMT)
Neural Network Training via Stochastic Alternating Minimization with Trainable Step Sizes [3.2] ディープニューラルネットワークのトレーニングは本質的に非最適化問題である。
勾配降下(SGD)のような標準的なアプローチでは、パラメータを同時に更新する必要がある。
そこで本研究では,SAMTを用いた列車最小化手法を提案する。
SAMTは、最先端のメソッドに比べて、パラメータ更新が少なく、パフォーマンスが向上する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:23:38 GMT)
Nonlocal Retinex-Based Variational Model and its Deep Unfolding Twin for Low-Light Image Enhancement [3.2] 本稿では,Retinex分解に基づく低照度画像強調のための変分法を提案する。
低照度画像に色補正前処理ステップを適用し、分解時に観察された入力として使用する。
我々は、演算子を学習可能なネットワークに置き換える深層展開モデルを導入することにより、モデルを拡張する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:36:38 GMT)
Cybersecurity of Quantum Key Distribution Implementations [3.1] 量子サイバーセキュリティのための新しい分析ツールと方法論を提案する。
我々は、脆弱性の概念、攻撃面、および古典的なサイバーセキュリティからQKD実装攻撃へのエクスプロイトに適応する。
この研究は、QKDの実装を実験的に攻撃するための現在の分析方法と、古典的なサイバーセキュリティの分野における数十年にわたる研究のギャップを埋めることから始まります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:37:04 GMT)
Matrix-Free Two-to-Infinity and One-to-Two Norms Estimation [3.1] 本研究では,行列自由条件下での2-infinityと1-to-twoノルムを推定するための新しいランダム化アルゴリズムを提案する。
提案手法は,Hutchinsonの対角線推定器とHutch++バージョンの適切な修正に基づいている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:37:37 GMT)
Large Language Model's Multi-Capability Alignment in Biomedical Domain [3.1] BalancedBioはパラメータ効率のよいバイオメディカル推論のためのフレームワークである。
ドメイン固有のAIアライメントにおける多機能統合に対処する。
パラメータクラスで最先端の結果を達成する。
実際の展開はコストを78%削減し、診断精度を23%改善し、臨床医の受け入れ率は89%となった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:06:11 GMT)
CRAB: A Benchmark for Evaluating Curation of Retrieval-Augmented LLMs in Biomedicine [3.1] バイオメディシン(CRAB)における検索用LLMのキュレーションのベンチマークについて紹介する。
CRABは、検索拡張LDMの生体医学的キュレーションを評価するための最初の多言語ベンチマークである。
CRABは、新しい引用に基づく評価基準を組み込むことで、バイオメディシンにおける検索増強LDMのキュレーション性能を定量化する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:30:41 GMT)
Automated File-Level Logging Generation for Machine Learning Applications using LLMs: A Case Study using GPT-4o Mini [3.1] 我々は、GPT-4o miniのファイルレベルでの機械学習プロジェクトのためのログステートメントを生成する能力を評価した。
LLMは63.91%のケースで人間と同じ場所にログを導入しているが、高いオーバーログ率は82.66%である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:57:51 GMT)
Improving Sequential Market Coordination via Value-oriented Renewable Energy Forecasting [3.1] 本稿では,実運用段階においてより効率的にRIEQ(RES Improved Entering Quantities)を決定するために,価値指向予測(value-oriented forecasting)と呼ばれるトレーニングされた予測モデルを提案する。
統計的予測誤差を最小化する従来のモデルとは異なり、我々のアプローチはパラメータを訓練し、DA市場とRT市場の両方で期待される全体の運用コストを最小化する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:25:24 GMT)
Unified Flow Matching for Long Horizon Event Forecasting [3.1] 本稿では,マーク付き時間点プロセスのための一貫したフローマッチングフレームワークを提案する。
両コンポーネントの連続時間フローを学習することにより,逐次復号化を伴わずにコヒーレントな長地平線イベントトラジェクトリを生成する。
実世界の6つのベンチマークでモデルを評価し,精度と生成効率の両面で自己回帰ベースラインと拡散ベースラインを大幅に改善した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:42:49 GMT)
Are Large Language Models Dynamic Treatment Planners? An In Silico Study from a Prior Knowledge Injection Angle [3.0] インシリコ1型糖尿病シミュレーターにおいて,大型言語モデル (LLM) を動的インスリン投与剤として評価した。
以上の結果より, ゼロショットプロンプトを慎重に設計することで, より小型のLCMが同等あるいは優れた臨床成績を達成できることが示唆された。
LLMは、チェーン・オブ・シンドロームで刺激された時に過度にアグレッシブなインスリン投与など、顕著な制限を呈する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:46:02 GMT)
Supervised Dynamic Dimension Reduction with Deep Neural Network [3.0] 本稿では,新しい動的主成分分析フレームワークであるSupervised Deep Dynamic principalを提案する。
我々は、元の予測を教師付きでスケーリングすることで、ターゲット対応予測器を構築する。
次に、ターゲット認識予測器上で主成分分析を行い、推定されたSDDP因子を抽出する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:41:26 GMT)
Factor Augmented Supervised Learning with Text Embeddings [3.0] AutoEncoder-Augmented Learning with Text (AEALT)は、事前訓練された大規模言語モデル(LLM)に直接次元の縮小を組み込む教師付き、因子拡張フレームワークである。
AEALTは、生の埋め込みに依存する従来のディープラーニングアプローチよりも優れています。
分類,異常検出,予測タスクについて広範な実験を行い,その適用性を検証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:44:47 GMT)
AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments [3.0] 我々は、内的世界モデルによって導かれる模擬環境の中で知覚し、行動する、具体化されたAIエージェント-仮想エージェントのアイデアを活用する。
我々はAgentSenseを紹介した。これは仮想データ生成パイプラインで、エージェントはシミュレーションされたスマートホームで毎日のルーチンを生活する。
われわれのアプローチは、現実世界の多様性を反映したリッチでプライバシー保護のセンサーデータを生成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:26:58 GMT)
HALO: Hindsight-Augmented Learning for Online Auto-Bidding [2.9] デジタル広告プラットフォームはリアルタイム入札(RTB)システムを通じてミリ秒レベルのオークションを運営している。
このダイナミックなメカニズムは、正確なオーディエンスターゲティングを可能にするが、深い運用上の複雑さをもたらす。
HALO: オンライン自動入札のための隠れた学習法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:13:21 GMT)
Dialogue Response Prefetching Based on Semantic Similarity and Prediction Confidence of Language Model [2.9] ユーザの発話が終わる前に、通常、言語モデルによって完全な発話を予測し、事前の対話応答を作成する必要がある。
本稿では,予測信頼度モデル(PCM)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:45:09 GMT)
Graffiti: Enabling an Ecosystem of Personalized and Interoperable Social Applications [2.8] Graffitiは、多様なパーソナライズされたソーシャルアプリケーションを構築するために使用できるシステムである。
友人やデータを失うことなく、複数のデザインの間を自由に移動することができる。
Graffitiアプリケーションは最小限のクライアントサイドAPIを介してやり取りします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:27:37 GMT)
Benchmarking Quantum and Classical Sequential Models for Urban Telecommunication Forecasting [2.8] 我々は、古典的および量子的インスパイアされたシーケンシャルモデルの性能を、受信したSMSのアクティビティを予測するために評価する。
以上の結果から,異なるモデルが配列長に対して様々な感度を示すことが示唆され,量子的拡張が普遍的に有利ではないことが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:37:07 GMT)
Spatial-Frequency Aware for Object Detection in RAW Image [2.8] 直接RAWに基づく物体検出は、その広いダイナミックレンジと線形応答のために固有の課題に直面している。
本研究では,空間および周波数表現を相乗化する新しいフレームワークである空間周波数認識RAW画像オブジェクト検出エンハンサー(SFAE)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:26:27 GMT)
TotalRegistrator: Towards a Lightweight Foundation Model for CT Image Registration [2.7] TotalRegistratorは、複数の解剖学的領域を同時に調整できる画像登録フレームワークである。
モデルは軽量で、トレーニングにはわずか11GBのGPUメモリを必要とする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:50:27 GMT)
Small transformer architectures for task switching [2.7] 注意に基づくアーキテクチャが従来のアプローチより優れていると考えるのは簡単ではない。
標準変圧器は基本的タスク切替参照モデルでは解けないことを示す。
本研究では, トランス, 長期記憶再帰ネットワーク (LSTM) , 平板多層パーセプトロン (MLP) が類似しているが, 予測精度は緩やかであることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:01:05 GMT)
Advanced DAG-Based Ranking (ADR) Protocol for Blockchain Scalability [2.7] 本稿では、ブロックチェーンのスケーラビリティとスループットを向上させるための高度なDAGベースのランキングプロトコルを提案する。
これは、二重送信に対するネットワークのセキュア化とパフォーマンス向上のための3段階のアプローチに従っている。
シミュレーションの結果、ADRは既存のDAGベースのブロックチェーンと比較して、トランザクションスループットとネットワーク寿命を著しく改善することが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:27:33 GMT)
Towards Transparent AI Grading: Semantic Entropy as a Signal for Human-AI Disagreement [2.6] そこで本研究では,GPT-4が生成する複数の生徒の反応の変動性の尺度であるセマンティックエントロピーを紹介した。
我々の研究は、セマンティックエントロピーを、より透明で信頼性の高いAI支援グレーディングをサポートする、解釈可能な不確実性信号として位置づけた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:02:14 GMT)
ranDecepter: Real-time Identification and Deterrence of Ransomware Attacks [2.6] ランサムウェア(Ransomware, RW)は、デジタルランドスケープにおいて、重要かつ広範な脅威である。
RWは、しばしば攻撃者と防御者の間の通信路として機能する。
本稿では,アクティブなサイバー詐欺とリアルタイム分析を組み合わせた新しいアプローチであるrunDecepterを紹介する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:59:37 GMT)
Tool-integrated Reinforcement Learning for Repo Deep Search [2.6] 本稿では,2段階のツール統合学習フレームワークであるToolTrainについて紹介する。
実験の結果,ToolTrainでトレーニングしたモデルでは最先端の性能が得られ,32Bモデルは関数レベルのローカライゼーションにおいてClaude-3.7を超えていることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:43:30 GMT)
Rainbow chains and numerical renormalisation group for accurate chiral conformal spectra [2.6] 指数的に減衰する項を持つ共形臨界鎖の絡み合いスペクトルは、関連するキラルCFTの共形塔からなることを示す。
これらの絡み合いスペクトルは、親ハミルトニアンにアクセスすることなく単一波動関数から詳細なCFTスペクトルを抽出する信頼性の高い方法を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:00:05 GMT)
Sensitivity of Stability: Theoretical & Empirical Analysis of Replicability for Adaptive Data Selection in Transfer Learning [2.6] 適応効率と結果整合性の基本的なトレードオフを定量化する数学的枠組みを導入する。
グラデーションベースやカリキュラム学習のような高度適応戦略が優れたタスク性能を実現するが、高い複製性障害率に悩まされていることを示す。
また、ソースドメイン事前トレーニングは、パフォーマンス向上を維持しながら、障害率を最大30%削減する強力な緩和メカニズムを提供することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:56:56 GMT)
Gender Bias in Perception of Human Managers Extends to AI Managers [2.5] AIが職場に組み込まれるにつれ、効率性のためのツールから、組織的な意思決定において積極的な力へとシフトしつつある。
AIマネージャが人間マネージャと比較してどのように認識され、ジェンダーがこれらの知覚にどのように影響するかは、まだ不明である。
ランダム化制御試験(RCT)を実施し,ランダムに割り当てられたマネージャの下で3人のチームが協力して作業した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:16:40 GMT)
Embedding Is (Almost) All You Need: Retrieval-Augmented Inference for Generalizable Genomic Prediction Tasks [2.5] 埋め込みベースのパイプラインは、競争力のあるパフォーマンスを実現することができることを示す。
エンハンサー分類では、zCurveと組み合わされた埋め込みは0.68精度(微調整では0.58)を達成する。
非TATAプロモーター分類では、zCurveまたはGC含有量によるDNABERT-2の埋め込みは0.85精度(微調整0.89)に達する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:15:48 GMT)
Assessing Representation Stability for Transformer Models [2.4] 代用テキスト攻撃はトランスフォーマーモデルに対する永続的な脅威である。
本稿では,モデル・アバーサ検出フレームワークであるRepresentation Stability (RS)を紹介する。
RSは、重要な単語がマスクされたときに、埋め込み表現がどのように変化するかを測定する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:07:49 GMT)
Excising dead components in the surface code using minimally invasive alterations: A performance study [2.4] 固体量子ビットでは、量子エラー訂正プロトコルは、(i)デッドコンポーネントなしで同じネイティブな演算セットを使用し、(ii)関数コンポーネントのサルベージを最大化し、(iii)一貫したグローバルな演算スケジュールを使用するのが理想である。
我々は,回路レベルの雑音下でのデッドコンポーネントの存在下で,このペアワイズ計測に基づくサーフェスコードプロトコルの提案を広範囲に数値シミュレーションする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:02:25 GMT)
Neuromorphic Cybersecurity with Semi-supervised Lifelong Learning [2.4] 本稿では,生涯ネットワーク侵入検知システム(NIDS)のためのスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
提案システムでは、まず効率的な静的SNNを用いて潜在的な侵入を識別し、次に特定の攻撃タイプを分類するアダプティブ動的SNNを起動する。
UNSW-NB15ベンチマークで連続的な学習環境でテストされ、アーキテクチャは堅牢な適応を示し、破滅的な忘れを減らし、全体的な精度は85.3ドル%に達する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:29:59 GMT)
Multi-Marginal Stochastic Flow Matching for High-Dimensional Snapshot Data at Irregular Time Points [2.4] シミュレーションフリースコアとフローマッチングの新たな拡張であるMultivalued-Marginal Flow Matching (MMMM)を提案する。
MMMMは、次元性を低下させることなく、非等時点で測定された高次元データのアライメントを可能にする。
我々は、不均一な時間で収集された遺伝子発現データを含む、いくつかの合成およびベンチマークデータセット上で、我々のフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:43:20 GMT)
PA-RNet: Perturbation-Aware Reasoning Network for Multimodal Time Series Forecasting [2.4] 時系列予測のための堅牢なフレームワークであるPA-RNet(Perturbation-Aware Reasoning Network for Multimodal Time Series Forecasting)を提案する。
PA-RNetは最先端のベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:26:52 GMT)
DP-GPT4MTS: Dual-Prompt Large Language Model for Textual-Numerical Time Series Forecasting [2.4] 本稿ではDP-GPT4MTS(Dual-Prompt GPT2-base for Multimodal Time Series)を紹介する。
明確なタスク命令の明示的なプロンプトと、タイムスタンプされたデータからのコンテキスト認識の埋め込みのテキストプロンプトの2つの補完的なプロンプトを組み合わせる。
多様なテクスチュラル・数値時系列データセットを用いて行った実験は、この手法が時系列予測において最先端のアルゴリズムより優れていることを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:25:05 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [2.3] マルチソース・プロンプト・チューニングのための最適アンサンブル重み学習フレームワークであるHGPromptを提案する。
特に、ターゲットタスクにおけるプロンプト誘発特徴の識別性をキャプチャする、識別可能なプロンプト転送可能性指標を提案する。
大規模VTABベンチマークの実験は、HGPromptの最先端性能を実証している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:03:30 GMT)
Electrical control of quantum dots in GaAs-on-insulator waveguides for coherent single-photon generation [2.3] スケーラブル量子技術に不可欠なコヒーレント量子エミッタとシリコンフォトニックプラットフォームの統合
SiO2/Si基板上に結合し、低損失SiN導波路と結合したGaAs導波路に埋め込まれた電気制御自己集合量子ドットを実証した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:07:49 GMT)
MissMecha: An All-in-One Python Package for Studying Missing Data Mechanisms [2.1] MissMechaは、MCAR、MAR、MNARの仮定の下で欠落したデータをシミュレーション、視覚化、評価するためのPythonツールキットである。
MissMechaは数値的特徴と分類的特徴の両方をサポートし、混合型の表データセットをまたいだメカニズム対応の研究を可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:40:45 GMT)
Lightweight Transformers for Zero-Shot and Fine-Tuned Text-to-SQL Generation Using Spider [2.1] 本研究では、スパイダーデータセット上の3つの軽量トランスモデル(T5-Small、BART-Small、GPT-2)を評価する。
再利用可能なモデルに依存しないパイプラインを開発し、各モデルのアーキテクチャに合わせてスキーマのフォーマットを調整しました。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:49:13 GMT)
Risk-Based Thresholding for Reliable Anomaly Detection in Concentrated Solar Power Plants [2.0] 高温のソーラーレシーバーは、凍結、変形、腐食といった深刻な運転上のリスクに直面している。
異常画像は異常スコアを閾値付けすることで検出することができる。
この研究は、より信頼性の高い決定しきい値を生成するためのリスク制御を用いたフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:22:15 GMT)
Chain of Questions: Guiding Multimodal Curiosity in Language Models [2.0] 質問の連鎖 (Chain of Questions, CoQ) は好奇心を駆使した推論手法であり, マルチモーダル言語モデルにより, 周辺環境に関する対象とする質問を生成する。
我々は、WebGPT、ScienceQA、AVSD、ScanQAデータセットを統合した新しいマルチモーダルベンチマークデータセットについて、我々のフレームワークを評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:42:54 GMT)
Noisy Quantum Simulation Using Tracking, Uncomputation and Sampling [2.0] ほとんどの研究者にとって、量子ハードウェア上の計算時間へのアクセスは限られている。
これにより、量子回路の実行を正確に、かつ正確に模倣するシミュレータを構築する必要が生じる。
本稿では,雑音量子シミュレーションのためのTUSQ - Tracking, Uncomputation, Smplingを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:08:39 GMT)
DRIVE-T: A Methodology for Discriminative and Representative Data Viz Item Selection for Literacy Construct and Assessment [1.9] DRIVE-Tは評価項目の構築と評価を促進するための方法論である。
これは、データ可視化リテラシーのレベルを測定するために、タスクベースのアイテムの識別と代表性をサポートする。
提案手法の各ステップを,測定構造の難易度をモデル化した項目バンクに提示し,適用する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:34:40 GMT)
Explainable Deep Neural Network for Multimodal ECG Signals: Intermediate vs Late Fusion [1.9] マルチモーダルディープニューラルネットワーク(MDNN)は、多様なデータドメインを統合する能力を持ち、堅牢で正確な予測のための有望なソリューションを提供する。
本研究は、ECG信号を用いた中間核融合戦略と後期核融合戦略の比較効果について検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:26:46 GMT)
Generalized Quantum Hadamard Test for Machine Learning [1.9] 有界入力空間における内積を計算する能力を持つ量子アダマールテストを提案する。
従来の2つの機械学習モデルと統合することで,アルゴリズムの適用例を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:55:34 GMT)
Let the Void Be Void: Robust Open-Set Semi-Supervised Learning via Selective Non-Alignment [1.8] オープンセット半教師付き学習(OSSL)は、分布内(ID)と分布外(OOD)の両方を含むラベルのないデータを活用する。
選択的な非アライメントを導入し、新しい「スキップ」演算子を従来のプル・アンド・プッシュ操作に追加する。
我々のフレームワークであるSkipAlignは、低信頼の未ラベルサンプルに対するアライメント(プル)を選択的にスキップし、IDプロトタイプに対する穏やかな反発のみを保持する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:06:10 GMT)
Automatically Interpreting Millions of Features in Large Language Models [1.8] スパースオートエンコーダ(SAE)は、活性化を高次元の潜在空間に変換するために用いられる。
SAEの機能に関する自然言語の説明を生成・評価するためのオープンソースのパイプラインを構築します。
我々の大規模分析は、SAE潜伏剤がニューロンよりもはるかに解釈可能であることを確認しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:47:10 GMT)
TDSNNs: Competitive Topographic Deep Spiking Neural Networks for Visual Cortex Modeling [1.7] 地形深部スパイクニューラルネットワーク(SNN)のための新しい時空間制約損失関数を提案する。
以上の結果より,STCは視覚皮質領域に分布する代表的地形特徴を効果的に生成できることが示唆された。
また,TDSNNにおけるスパイク機構による時間情報処理の効率化と安定化を図る。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:53:39 GMT)
Beyond Manually Designed Pruning Policies with Second-Level Performance Prediction: A Pruning Framework for LLMs [1.6] 非均一な構造化ネットワークプルーニング手法は、冗長なチャネルやレイヤを排除することで、LLM(Large Language Model)のサイズを減らすことができる。
既存の一様でないメソッドは、手動で設計されたプルーニングポリシーに大きく依存している。
PPF(Predictive Pruning Framework)は,第2レベルの性能予測によって手作業による設計依存を解消する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:44:36 GMT)
Inequality in the Age of Pseudonymity [1.6] ジニ係数のような不平等対策は、政策決定を通知し動機づけするために用いられる。
私たちは、インターネットベースのプラットフォームやブロックチェーンベースのプラットフォームに共通する、匿名設定での対策方法を分析します。
一部のアクターはプライバシーを守るためにそうするかもしれませんが、これは不平等な指標を意図せずに歪めてしまう可能性があることを示しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:36:01 GMT)
The SWE-Bench Illusion: When State-of-the-Art LLMs Remember Instead of Reason [1.6] 本稿では,SWE-Bench-Verifiedの性能向上は,真の問題解決よりも記憶によってもたらされる可能性があることを示す。
現状のモデルでは,リポジトリ構造にアクセスすることなく,問題記述のみを用いて,バグのあるファイルパスを識別する精度を最大76%向上することを示す。
これらの結果は、既存の結果の有効性に関する懸念を提起し、より堅牢で汚染に強いベンチマークの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:23:11 GMT)
TCSAFormer: Efficient Vision Transformer with Token Compression and Sparse Attention for Medical Image Segmentation [1.5] 本稿では,TCSAFormerという医用画像分割ネットワークを提案する。
Compressed Attention (CA)モジュールが組み込まれており、トークン圧縮と画素レベルのスパースアテンションを組み合わせて、クエリ毎に最も関連性の高いキーと値のペアに動的にフォーカスする。
標準的なFFNの代替として、Dual-Branch Feed-Forward Network (DBFFN)モジュールを導入し、ローカルコンテキストの特徴とマルチスケール情報をキャプチャする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:38:07 GMT)
FFHQ-Makeup: Paired Synthetic Makeup Dataset with Facial Consistency Across Multiple Styles [1.5] FFHQ-Makeupは高品質な合成化粧データセットで、それぞれのアイデンティティと複数のメイクスタイルをペアリングする。
私たちの知る限りでは、メークアップデータセットの構築に特化している最初の作品です。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:28:01 GMT)
Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection [1.5] 現在のプラクティスは、一貫性のない、バイアスのあるメトリクスに依存します。
AIパフォーマンスに関するエキスパートレベルの主張は、厳格な検証なしに頻繁に行われる。
本研究は、新生児発作検出の具体的な課題に合わせたベストプラクティスを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:55:28 GMT)
Industrial LLM-based Code Optimization under Regulation: A Mixture-of-Agents Approach [1.4] 複数の特殊言語モデル(LLM)からコードを直接合成するMixture-of-Agents (MoA) アプローチを実装した。
本研究では,TurinTech AIのvanilla Genetic Algorithm(GA)ベースのアンサンブルシステムと,実世界の産業技術を用いた個々のLLMを比較した。
主要なコントリビューションとしては,(1) 実世界を用いた産業用コード最適化への最初のMoA適用,(2) MoAがオープンソースモデルに優れているという実証的証拠,(3) GAの商用モデルに対する優位性を実証するデプロイガイドライン,(4) 実世界における50個のコードスニペットの検証などがあります。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:41:21 GMT)
Rubric Is All You Need: Enhancing LLM-based Code Evaluation With Question-Specific Rubrics [1.4] 本稿では,専門家評価に対する評価厳密度を定量化するLeniencyと呼ばれる新しい指標を提案する。
包括的分析により,学習環境におけるコードの論理的評価が著しく向上することが確認された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:32:53 GMT)
Unsupervised Pairwise Learning Optimization Framework for Cross-Corpus EEG-Based Emotion Recognition Based on Prototype Representation [1.3] 企業間感情認識は、特に意思決定境界付近のサンプルにおいて深刻な課題に直面している。
本稿では,ドメイン逆転変換学習に基づく感情特徴の微粒なアライメントに対する最適化手法を提案する。
私たちの研究は、感情認識のクロスコーパスに有望なソリューションを提供します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:29:19 GMT)
AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context [1.3] AUTALICは、文脈における反音響的有能言語の検出に特化した最初のベンチマークデータセットである。
データセットはRedditから収集された2,400の自閉症関連文からなり、周囲の文脈を伴い、神経多様性の背景を持つ訓練された専門家によって注釈付けされている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:55:44 GMT)
Efficient detection of spectrally multimode squeezed light through optical parametric amplification [1.3] マルチモード励起光は高次元フォトニック量子技術の鍵となる資源である。
ここでは、光学パラメトリック増幅を用いたスペクトル多重モードスキューズ検出の最初の実験実験について報告する。
その結果、OPA検出能力はスペクトル領域に拡張され、高次元フォトニック量子技術が進歩した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:49:01 GMT)
Hierarchical Scoring for Machine Learning Classifier Error Impact Evaluation [1.3] この研究は、スコアリング木を用いてクラスラベル間の関係を符号化する複雑さの異なる階層的スコアリング指標を開発する。
結果、これらのメトリクスはより粒度の細かいエラーをキャプチャし、スコアリングツリーはチューニングを可能にします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:37:18 GMT)
GR-Gaussian: Graph-Based Radiative Gaussian Splatting for Sparse-View CT Reconstruction [1.3] 我々は,CT再構成のためのグラフベース3次元ガウス平滑化フレームワークGR-Gaussianを提案する。
GR-Gaussianは針状アーティファクトを抑制し、スパースビュー条件下での再構成精度を向上させる。
X-3Dおよび実世界のデータセットに関する実験は、GR-Gaussianの有効性を検証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:26:47 GMT)
Dynamic Solutions for Hybrid Quantum-HPC Resource Allocation [1.2] 本稿では、ハイブリッドHPC量子ワークロードにおける資源利用を最適化するための、ワークフローベースの戦略とともに、新しい可搬性に基づくアプローチを提案する。
ハイブリッドHPC量子ユースケースを用いた実験は、動的アロケーションの利点を示し、これらのソリューションの可能性を強調した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:50:27 GMT)
Retrieval-Augmented Water Level Forecasting for Everglades [1.2] 本稿では,予測前のモデル入力を豊かにするために,Retrieval-Augmented Forecasting (RAF) を水文学領域に導入する。
RAFは、歴史的データから関連するパターンを特定し、組み込んで、文脈認識と予測精度を高める。
本研究では,エバーグレーズにおける実世界のデータに関する総合的な評価を行い,RAFフレームワークが水位予測精度を大幅に向上させることを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:27:12 GMT)
Dissipative Dynamics and Symmetry Breaking in Bosonic Sachdev-Ye-Kitaev Lindbladian [1.2] 我々は,Sachdev-Ye-Kitaevモデル(SYK)のボソニック変種をリンドブラディアン環境に結合して検討した。
シュウィンガー・ケルディシュ経路積分形式(英語版)を用いて、我々はリッチ位相構造を明らかにする。
以上の結果から, 散逸は逆電位の不安定性を部分的に軽減し, 新たな定常相を生じさせる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:22:42 GMT)
Single-Step Reconstruction-Free Anomaly Detection and Segmentation via Diffusion Models [1.1] リアルタイム(RADAR)における注意に基づく拡散モデルを用いた再構成不要な異常検出手法を提案する。
RADARは再構成に基づく異常検出の限界を克服する。
実世界の3Dプリント材料とMVTec-ADデータセット上でRADARを評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:56:08 GMT)
How Effective are Large Time Series Models in Hydrology? A Study on Water Level Forecasting in Everglades [1.1] エバーグレーズは洪水と干ばつ規制、水資源計画、生態系管理において重要な役割を果たしている。
従来の物理に基づく、水位を予測する統計的手法は、しばしば重大な課題に直面している。
大規模時系列モデルの最近の進歩は、これらの制限に対処する可能性を示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:04:10 GMT)
Towards Domain Specification of Embedding Models in Medicine [1.1] MTEB(Massive Text Embedding Benchmark)に基づく分類,クラスタリング,ペア分類,検索を対象とする51タスクの総合ベンチマークスイートを提案する。
以上の結果から,本手法はロバストな評価枠組みを確立し,各タスクにおける工芸品の代替品の状態を常に上回り,組込み性能が向上することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:08:06 GMT)
What Lives? A meta-analysis of diverse opinions on the definition of life [1.0] 生命の定義は、まだ普遍的に受け入れられていない。
合成生物学、人工知能、宇宙生物学の進歩は、生きることの意味についての私たちの伝統的な概念に挑戦します。
我々は、大規模言語モデルを利用した方法論的アプローチを用いて、学際的専門家のキュレートされたセットによって提供される生命の定義を解析する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:47:41 GMT)
Advancing Hate Speech Detection with Transformers: Insights from the MetaHate [1.0] Twitter、Facebook、Instagram、Redditなどのソーシャルメディアプラットフォームはヘイトスピーチの場となっている。
バニラリカレントニューラルネットワーク(RNN)、長期短期記憶(LSTM)、畳み込みニューラルネットワーク(CNN)といったディープラーニングアプローチは良い結果を得たが、長期的な依存関係や非効率的な並列化といった問題によって制限されることが多い。
本稿では,MetaHateデータセットを用いたヘイトスピーチ検出のためのトランスフォーマーベースモデルの包括的探索について述べる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:36:17 GMT)
Evaluating Multi-Hop Reasoning in Large Language Models: A Chemistry-Centric Case Study [0.9] 化学領域における大規模言語モデルの構成的推論能力を評価するために,キュレートされたデータセットと定義された評価プロセスからなる新しいベンチマークを導入する。
我々の手法はOpenAI推論モデルと名前付きエンティティ認識(NER)システムを統合し、最近の文献から化学物質を抽出し、外部知識ベースで拡張して知識グラフを形成する。
実験により, 最先端モデルでさえ, マルチホップ構成推論において重要な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:20:14 GMT)
LLM4ES: Learning User Embeddings from Event Sequences via Large Language Models [0.9] 本稿では,大規模な事前学習言語モデル(LLM)を利用して,イベントシーケンスからユーザ埋め込みを導出する新しいフレームワークを提案する。
結果は、ファイナンスにおけるユーザセグメンテーションから、ヘルスケアにおける患者の結果予測まで、幅広いアプリケーションに組み込むことができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:54:06 GMT)
Enhancing Serendipity Recommendation System by Constructing Dynamic User Knowledge Graphs with Large Language Models [0.9] 大規模言語モデル(LLM)は、豊富な世界知識と優れた推論能力のおかげで、推奨されるセレンディピティーを示す。
本稿では,LLmを利用してユーザ知識グラフを動的に構築し,レコメンデーションシステムのセレンディピティーを高める手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:52:09 GMT)
Comparative Analysis of Novel NIRMAL Optimizer Against Adam and SGD with Momentum [0.8] NIRMAL(Novel Integrated Robust Multi-Adaptation Learning)は、チェスの駒の動きにインスパイアされた複数の戦略を組み合わせた新しい最適化アルゴリズムである。
NIRMALは、特により困難なCIFAR-100データセットで、競争性能を達成する。
これらの知見は、様々なディープラーニングタスクのための汎用的で効果的なデータセットとして、NIRMALの有意義な能力を裏付けるものである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:30:22 GMT)
Breaking New Ground in Software Defect Prediction: Introducing Practical and Actionable Metrics with Superior Predictive Power for Enhanced Decision-Making [0.8] 本稿では,開発者のコーディング習慣に基づいて,メソッドレベルでのソフトウェア欠陥の自動予測について検討する。
本稿では,ヒューマンエラーフレームワークを用いた欠陥発生型ソフトウェア手法の予測手法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:52:13 GMT)
Privacy Risk Predictions Based on Fundamental Understanding of Personal Data and an Evolving Threat Landscape [0.8] 本研究は、どのような個人データが暴露されるか、どの程度の頻度で暴露されるかを明らかにする。
グラフ理論とグラフニューラルネットワークを用いたプライバシーリスク予測フレームワークを開発した。
その結果、我々のアプローチは、あるアイデンティティ属性の開示は、おそらく別の属性の開示につながるのか?
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:30:07 GMT)
Thermalization with partial information [0.8] システムの力学をモデル化するために、ノイズの多い量子チャネルを$mathcalT$と同定する類似の基本原理が見つかる。
本稿では,最大チャネルエントロピー原理に基づく量子チャネルの学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:52:29 GMT)
Maximum channel entropy principle and microcanonical channels [0.8] 熱状態は物理学、情報理論、量子コンピューティング、機械学習を通じて重要な役割を果たしている。
熱チャネルを線形制約を受けるチャネルエントロピー測度を最大化するものとして定義し,最大チャネルエントロピー原理を定式化する。
我々は、州の平均エネルギーを保存する熱化チャネルや、パウリ・コ変量および古典的なチャネルなどの例について研究する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:52:30 GMT)
Measuring the Carbon Footprint of Cryptographic Privacy-Enhancing Technologies [0.8] 5個の暗号PETによるエネルギー消費と炭素フットプリント増加の測定(非私的等価量と比較)
この結果から,HTTPS Webブラウジングの2倍増から暗号化MLの10万倍増まで,炭素フットプリントの変動が顕著に増加したことが判明した。
我々の研究は、意思決定者がそのようなアプリケーションにおけるプライバシーと炭素のトレードオフを評価するのに欠かせないデータを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:07:29 GMT)
Learning Using Privileged Information for Litter Detection [0.6] 本研究では,特権情報とディープラーニング物体検出を組み合わせた新しい手法を提案する。
提案手法は,広く用いられている5つの物体検出モデルにまたがって評価する。
以上の結果から, この手法は, ごみ検出の実用化に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:46:14 GMT)
Hybrid oscillator-qudit quantum processors: stabilizer states and symplectic operations [0.6] 離散変数と連続変数の組み合わせで安定化状態と誤り訂正符号を構築する。
本稿では、可換行列、整数シンプレクティック行列、二進符号を用いた例を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:57:45 GMT)
Graphical Calculus for Fermionic Tensors [0.6] テンソル-ネットワーク方程式を持つフェルミオンテンソルの集合からなるグラフ計算を導入する。
テンソルの指数は、主にフェルミオンモードに対応するが、キュービットや固定奇数平準状態も含む。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:01:15 GMT)
Fine-tuning for Better Few Shot Prompting: An Empirical Comparison for Short Answer Grading [0.6] ファインチューニング手法は歴史的に多くのユーザにとってアクセス不能な大規模計算クラスタを必要としてきた。
OpenAIの微調整サービスのような新しいクローズドモデルアプローチは、100の例で結果をもたらす。
これら2つの微調整手法の評価を行い, 自動短時間解答グレーディングのための数ショットプロンプトとの相互作用を測定した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 03:52:55 GMT)
Quantum circuit complexity and unsupervised machine learning of topological order [0.6] 量子計算と量子情報科学において重要な概念である量子回路複雑性について検討する。
量子多体系におけるトポロジ的順序に対する解釈可能かつ効率的な教師なし機械学習を構築した。
この結果から,量子回路計算,量子複雑性,およびトポロジカル量子秩序の機械学習といった重要な概念とツールの関連性を確立した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:36:10 GMT)
Partial Blind Quantum Computation: A Framework for Selective Circuit Protection [0.6] Universal Blind Quantum Computationプロトコルにより、限られた量子リソースを持つクライアントは、入力と回路の詳細の両方を隠蔽しながら計算をデリゲートできる。
UBQCを量子回路全体に均一に適用すると、追加の量子リソースと計算オーバーヘッドが発生する。
本稿では,量子回路の臨界成分のみを対象とするUBQCの選択的応用を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:46:31 GMT)
3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding [0.6] 3Dシーングラフは、存在しているオブジェクトとそれらの間の意味的関係の両方をキャプチャすることで、コンパクトなシーンモデルを表現する。
本研究では,意味関係を明示的に組み込んだ3Dシーングラフの学習可能な表現構築手法である3DGraphLLMを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:29:23 GMT)
ANPrompt: Anti-noise Prompt Tuning for Vision-Language Models [0.6] 本稿では,ノイズ摂動下でのロバスト性向上のための新しいプロンプトチューニングフレームワークであるANPromptを提案する。
ANPromptは、オリジナルとノイズの混在したテキストを融合して弱いノイズテキスト機能を構築し、それをクラスタ化してノイズプロンプトを形成する。
11ベンチマークの実験では、ANPromptが既存のプロンプトチューニングアプローチを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:42:30 GMT)
Case Studies of Generative Machine Learning Models for Dynamical Systems [0.5] 本稿では,航空機誘導において一般的に理解され,活用される最適制御システムの2つの事例研究に焦点をあてる。
本稿では, 比較的小さな集合, 数百の順序, 基礎となる支配方程式で訓練されたGAIMについて報告する。
新しいモデルは、少量のトレーニングデータにもかかわらず、支配方程式を満たすデータを合成することができ、統計的にトレーニングデータと類似している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:59:14 GMT)
LA-CaRe-CNN: Cascading Refinement CNN for Left Atrial Scar Segmentation [0.5] 心房細動(英: atrial fibrillation, AF)は、患者にアブレーション療法を施行する必要がある心不整脈の最も多いタイプである。
患者固有の心臓デジタル双生児モデルでは、パーソナライズされたアブレーション療法の可能性が大きい。
左心房および左心房遺残組織を正確に分類するために左心房空洞留置CNN(LA-CaRe-CNN)を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:37:30 GMT)
Augmentation-based Domain Generalization and Joint Training from Multiple Source Domains for Whole Heart Segmentation [0.5] 心臓血管疾患は 世界中の死因です
心臓全体を表す重要な心臓構造のセマンティックセグメンテーションは、患者固有の心臓形態と病理を評価するのに有用である。
深層学習に基づく医用画像セグメンテーションの手法は、過去10年間で大きな進歩を遂げた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:37:22 GMT)
T3Time: Tri-Modal Time Series Forecasting via Adaptive Multi-Head Alignment and Residual Fusion [0.5] T3Timeは、時間、スペクトル、プロンプトブランチで構成される新しい3モーダルフレームワークである。
予測地平線に基づいて時間的特徴とスペクトル的特徴の優先順位付けを学習する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:31:44 GMT)
CITRAS: Covariate-Informed Transformer for Time Series Forecasting [0.5] 本稿では,複数ターゲット,過去の共変量,将来の共変量などを柔軟に活用するデコーダのみの変換器CITRASを提案する。
実世界の13のベンチマークにおいてCITRASが最先端のモデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:46:11 GMT)
Complex Model Transformations by Reinforcement Learning with Uncertain Human Guidance [0.5] モデル駆動工学の問題は、広範囲に連鎖する複雑なモデル変換(MT)を必要とすることが多い。
強化学習(RL)による複雑なMTシーケンス開発のためのアプローチと技術的枠組みを提案する。
我々のフレームワークは、ユーザ定義のMTをRLプリミティブにマッピングし、RLプログラムとして実行し、最適なMTシーケンスを見つける。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:48:34 GMT)
Entanglement distribution in quantum networks via swapping of partially entangled states [0.4] エンタングルメントスワッププロトコル(ESP)は、量子ネットワーク内の遠いノード間で量子相関を分散するためのプリミティブである。
近年の研究では、関係する量子ビット対が部分的に絡み合っているだけであっても、ベル基底測定による絡み合を集中し、伝達することができることが示されている。
我々はこれらのアイデアを様々なトポロジを持つ量子ネットワークに拡張し、当初は部分的に絡み合った状態へのESPの適用を分析した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:22:51 GMT)
Toward Errorless Training ImageNet-1k [0.4] 我々は、ImageNet 2012コンテストデータセットに基づいてトレーニングされたフィードフォワード人工ニューラルネットワークについて述べる。
最高の性能モデルは322,430,160のパラメータを使用し、4つの10桁の精度を持つ。
我々は、我々のモデルが100%精度を達成できない理由は、二重ラベル問題に起因すると推測する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:58:56 GMT)
Per-element Secure Aggregation against Data Reconstruction Attacks in Federated Learning [0.4] フェデレートラーニング(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にするが、個々のモデル更新は機密情報を漏洩させる可能性がある。
セキュアアグリゲーション(SecAgg)は、サーバがクライアント更新の総和だけにアクセスできるようにすることで、このリスクを軽減する。
モデル更新がスパースベクターである場合には、与えられたインデックスで単一のクライアントによって提供されたゼロでない値を、アグリゲートで直接明らかにすることができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:16:40 GMT)
Benchmarking Foundation Models for Mitotic Figure Classification [0.4] 自己教師付き学習技術は、大規模なニューラルネットワークのトレーニングに大量のラベルのないデータを使用することを可能にした。
本研究では,ミオティックフィギュア分類における基礎モデルの利用について検討する。
我々は、すべてのモデルと、CNNとVision Transformerの両方のエンドツーエンドトレーニングベースラインを比較した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:30:40 GMT)
Brain functions emerge as thermal equilibrium states of the connectome [0.3] 神経科学の基本的な考え方は、認知機能は脳の構造的組織によって形成され、制約されるということである。
神経系の機能的ネットワークとして定義される脳関数は、代数量子系の熱平衡状態として現れる。
これらの平衡状態は、Kubo-Martin-Schwinger (KMS)形式によって特徴づけられ、個々のニューロンが機能的ネットワーク形成にどのように貢献するかを明らかにする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:42:36 GMT)
Power and Limitations of Linear Programming Decoder for Quantum LDPC Codes [0.3] 量子エラー訂正符号の復号化は、フォールトトレラントな量子計算を実現する上で重要な課題である。
本研究では,量子低密度パリティチェック符号に対する線形プログラミング(LP)デコーディングの鍵となる限界を明らかにする。
我々は,順序付き統計復号法(OSD)と呼ばれる後処理技術を導入し,実際にLP復号性能を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:01 GMT)
Quantum-inspired algorithm for simulating viral response [0.3] 本稿では、量子インスパイアされた最適化アルゴリズムを適用し、バイラル応答をシミュレートする概念実証研究を提案する。
ホスト応答における遺伝子活動のパターンを記述するためにIsing型モデルを定式化する。
この問題に対する量子インスパイアされた最適化アルゴリズムの適用を実証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:20:12 GMT)
Causal Reflection with Language Models [0.3] 本稿では,因果関係を状態,行動,時間,摂動の動的関数として明示的にモデル化するフレームワークCausal Reflectionを紹介する。
我々は,予測結果と観測結果のミスマッチを識別し,因果仮説を生成し,エージェントの内部モデルを改訂する形式的リフレクション機構を定義する。
我々の枠組みは、進化する環境における因果的理解を適応し、自己修正し、伝達できる因果的反射エージェントの理論的基礎を定めている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:44:23 GMT)
Tripartite entanglement and Bell non-locality in loop-induced Higgs boson decays [0.2] 標準模型の文脈における3体$Htogamma lbarl$崩壊($l=e,mu,tau$)の絡み合い特性について検討する。
本研究の目的は, 位相空間における最終光子, レプトン, アンティルプトン間の絡み合いの分布を明らかにすることである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:27:08 GMT)
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning [0.2] ProtoECGNetは、解釈可能な多ラベルECG分類のためのプロトタイプディープラーニングモデルである。
PTB-XLデータセットから71の診断ラベルについてProtoECGNetを評価する。
ProtoECGNetは、プロトタイプ学習を複雑で多ラベルの時系列分類に効果的にスケールできることを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:50:14 GMT)
Transmon qubit using Sn as a junction superconductor [0.2] 超伝導量子ビットは通常、アルミニウム-アルミニウム酸化物トンネル接合を用いて非線形インダクタンスを提供する。
半導体バリアとの接合により、超伝導材料を変化させ、アルミニウムを超えて探索することが可能となる。
InAs半導体ナノワイヤをβ-Snの薄い超伝導シェルでコーティングし,トランスモン量子ビットを実現する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:45:48 GMT)
A machine learning approach for image classification in synthetic aperture RADAR [0.2] 畳み込みニューラルネットワーク(CNN)による地上の物体の識別と分類の問題点を考察する。
具体的には、シミュレーションされたSARデータと再構成された画像の両方を用いてオブジェクトの形状を分類するために、単一散乱近似を採用し、これらの手法の成功を比較した。
次に、衛星センチネル-1から実際のSAR画像中の氷の種類を特定し、どちらの実験でも高い分類精度(geq$75%)を達成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:16:19 GMT)
Classical certification of quantum gates under the dimension assumption [0.2] 本稿では,実用的なサーバユーザシナリオに適した量子ゲートの認証手法を提案する。
単一量子ビットの量子計算の普遍的な集合を構成するものを含む単一量子ビットのゲートに対しては、我々のアプローチが音響性を保証することを実証する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:49:34 GMT)
The Dark Side of LLMs: Agent-based Attacks for Complete Computer Takeover [0.2] 大規模言語モデル(LLM)エージェントとマルチエージェントシステムは、前例のないセキュリティ脆弱性を導入している。
本稿では,自律エージェント内の推論エンジンとして使用されるLDMの安全性を総合的に評価する。
我々は、このような買収を組織するために、異なる攻撃面と信頼境界をどのように活用できるかに焦点を当てる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:27:03 GMT)
Algorithm Selection for Recommender Systems via Meta-Learning on Algorithm Characteristics [0.1] 推薦システム選択のためのユーザごとのメタ学習手法を提案する。
ユーザメタ機能と,ソースコードから自動的に抽出されるアルゴリズム機能の両方を使用します。
その結果,メタラーナーのアルゴリズム機能向上により,NDCG@10の平均性能は8.83%向上した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:06:24 GMT)
Automated Generation of Curriculum-Aligned Multiple-Choice Questions for Malaysian Secondary Mathematics Using Generative AI [0.1] 本稿では,マレーシアの教育システムにおけるスケーラブルで高品質な教育評価ツールの必要性について論じる。
生成AI(GenAI)の可能性を強調しながら、事実の正確性とカリキュラムの整合性を保証するという課題を認識している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:30:51 GMT)
Witnessing mass-energy equivalence with trapped atom interferometers [0.1] 本稿では,量子重ね合わせ原理と重力時間拡張との相互作用を探索する実験装置を提案する。
最先端の原子干渉計を利用して、地球の重力場における原子の高さの重なり合いを極端に長く維持する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:44:27 GMT)
4-Swap: Achieving Grief-Free and Bribery-Safe Atomic Swaps Using Four Transactions [0.1] 本稿では,最初のクロスチェーン原子スワッププロトコルである4-Swapについて述べる。
悲しみのプレミアムとプリンシパルをチェーン毎の単一トランザクションに組み合わせることで、4-Swapはオンチェーントランザクションを減らす。
Bitcoinと完全に互換性があり、新しいオペコードを必要としない。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:06:55 GMT)
Investigating the Impact of Large-Scale Pre-training on Nutritional Content Estimation from 2D Images [0.1] 画像から食物の栄養含量を推定することは、健康と食事のモニタリングに重要な意味を持つ重要な課題である。
本稿では,2次元画像のみを用いた栄養推定のためのディープラーニングモデルの性能に及ぼす大規模事前学習データセットの影響について検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:57:55 GMT)
webMCP: Efficient AI-Native Client-Side Interaction for Agent-Ready Web Design [0.0] 現在のAIエージェントは、Webページを理解するために広範な処理を必要とすることで、ユーザにとって大きな障壁を生み出します。
本稿では,Webページに直接構造化されたインタラクションメタデータを埋め込むクライアントサイド標準であるWebMCPを紹介する。
webMCPは処理要求を67.6%削減し、97.9%のタスク成功率を維持している。
ユーザはコストを大幅に削減し(34-63%の削減)、さまざまなWebインタラクションでレスポンス時間を短縮する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:02:36 GMT)
YOLOv8-Based Deep Learning Model for Automated Poultry Disease Detection and Health Monitoring paper [0.0] この研究は、高解像度チキン写真を分析するシステムを開発することで、AIベースのアプローチを提案する。
このアルゴリズムは、感染したニワトリの正確なリアルタイム識別を提供する。
YOLO v8のリアルタイム機能は、農場管理技術を改善するためのスケーラブルで効果的な方法を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:27:48 GMT)
Why are LLMs' abilities emergent? [0.0] 系は他の複雑な自然現象に類似した真の創発性を示すと私は主張する。
この視点は、これらのシステムが個々の定義を超越する能力を得ることを可能にする内部の動的変換を理解することに焦点を移す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:43:04 GMT)
Who cuts emissions, who turns up the heat? causal machine learning estimates of energy efficiency interventions [0.0] 英国住宅の全国的代表データに基づいて学習した因果機械学習モデルを用いる。
壁絶縁のガス消費に対する平均的および条件的処理効果を推定した。
低エネルギー負荷群は大幅な貯蓄を達成する一方、高いエネルギー負荷を経験する群は、ほとんど、あるいは全く減少しない。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:29:38 GMT)
Visual Bias and Interpretability in Deep Learning for Dermatological Image Analysis [0.0] 本研究では,多型皮膚疾患分類のためのディープラーニングフレームワークを提案する。
我々は、事前学習された畳み込みニューラルネットワーク(DenseNet201, Efficient-NetB5)とトランスフォーマーベースモデル(ViT, Swin Transformer, DinoV2 Large)の性能をベンチマークする。
その結果、RGB前処理のDinoV2は全変種で最高精度(最大93%)とF1スコアを達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:57:49 GMT)
Violation of the thermodynamic uncertainty relation in quantum collisional models [0.0] 量子衝突モデルにおける熱力学的不確実性関係について検討する。
マルコフ力学では、非平衡定常状態状態における古典的および量子的TUR境界について検討する。
2つの非マルコフ的アプローチに対して、非マルコフ的性の次数と型は、TUR違反に決定的に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:27:07 GMT)
Vanilla-Converter: A Tool for Converting Camunda 7 BPMN Models into Camunda 8 Models [0.0] コマンドラインツールであるVanilla-は、BPMNモデルのCamunda 7からCamunda 8への移行を容易にする。
このツールの有効性は、実際に工業的に使用されているCamunda 7モデルを用いた3つのケーススタディによって実証される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:45:51 GMT)
Upsampling DINOv2 features for unsupervised vision tasks and weakly supervised materials segmentation [0.0] 自己監督型視覚変換器(ViT)は、オブジェクトのローカライゼーションやセグメンテーションといった下流タスクに関連する強力な意味情報と位置情報を含んでいる。
最近の研究は、これらの機能をクラスタリングやグラフパーティショニング、リージョン相関といった従来の手法と組み合わせて、追加のネットワークを微調整したり訓練したりすることなく、印象的なベースラインを達成している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:05:27 GMT)
Unstable periodic orbits galore and quantum hyperscarring in highly frustrated magnets [0.0] 古典的な 'interaction-suppressing' 構成の広範な多様体が不安定な周期軌道を生み出している。
不安定周期軌道の拡散は、量子の場合において「ハイパースキャリング」、すなわち指数的に多くの不安定周期軌道上の量子スキャリングに対応する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:00 GMT)
Universal Configuration for Optimizing Complexity in Variational Distributed Quantum Circuits [0.0] 任意のコア間通信トポロジにまたがって単一および2つのキュービットゲートを分散するための普遍的最適構成が存在することを示す。
我々は,Ref 2 で提案されたよく確立された正規化基準との比較により,我々の予測を検証した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:03:52 GMT)
Trapping an Atomic Ion without Dedicated Digital-to-analog Converters [0.0] 表面電極トラップにTDMを用いた電圧制御システムを適用し,40mathrmCa+$イオンのトラップに成功した。
このアプローチは、捕捉されたイオンに基づく高度な量子コンピューティングシステムに対して、リソース効率が高くスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:21:24 GMT)
Tight Quantum-Security Bounds and Parameter Optimization for SPHINCS+ and NTRU [0.0] 量子コンピューティングの差し迫った脅威は、量子耐性暗号システムを必要とする。
本稿では,量子耐性暗号システムのファイナリスト2名に対して,厳密なセキュリティ境界を確立する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:15:21 GMT)
The decohered ZX-calculus [0.0] 本研究では,通常のZX電卓の発電機をデコヒートして得られたZX電卓の破片について検討する。
この計算は普遍的であり、$mathbbF_2n$ 上のアフィン的支持確率分布に対して完備であることを示す。
この結果から,ZX-計算におけるハイブリッド古典量子過程の扱い方を明らかにするとともに,より一般的な確率変数の抽出への道を開くことができた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:32:04 GMT)
The Ubiquitous Sparse Matrix-Matrix Products [0.0] スパース行列と他の(密度またはスパース)行列との乗算は、多くのデータサイエンスアプリケーションの計算パターンをキャプチャする基本的な演算である。
我々は,スパース行列行列行列演算の統一処理と,機械学習,計算生物学,化学,グラフアルゴリズム,科学計算などのリッチな応用空間を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:26:52 GMT)
The Glider Equation for Asymptotic Lenia [0.0] Asymptotic Leniaはコンウェイの『ゲーム・オブ・ライフ』の連続的な拡張であり、豊かなパターン形成を示している。
グライダー方程式」と呼ばれるグライダーパターンの条件を解析的に導出する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:47:24 GMT)
The Cosine Schedule is Fisher-Rao-Optimal for Masked Discrete Diffusion Models [0.0] また,フィッシャー・ラオ幾何の下での最適スケジュールは,一般的なコサインスケジュールを復元することを示した。
具体的には,フィッシャー・ラオ幾何の下での最適スケジュールが,一般的なコサインスケジュールを復元することを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:19:08 GMT)
Studies of properties of bipartite graphs with quantum programming [0.0] 両部グラフの$G(U,V,E)$に対応するマルチキュービット量子状態について検討する。
得られた状態の絡み合い距離は任意の二部グラフ構造に対して解析的に導出される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:20:05 GMT)
Strong Priority and Determinacy in Timed CCS [0.0] プロセス代数の標準理論を優先して構築し、「構成的還元」と呼ばれる新しいスケジューリング機構を同定する。
大規模な「コヒーレント」プロセスが構成的還元の共役性であることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:33:12 GMT)
Spectro-temporally tailored Non-Gaussian Quantum Operations in Thin-Film Waveguides [0.0] 本稿では、スペクトル時間モード選択型非ガウス量子演算をテレコム波長系に実装することの課題に対処する。
薄膜窒化リチウム非線形導波路を用いたモード選択型SPAおよびSPSを実現するための最初の設計枠組みを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:03:18 GMT)
Solving Pasur Using GPU-Accelerated Counterfactual Regret Minimization [0.0] パサール(Pasur)は、6ラウンドにわたる釣りカードゲームである。
我々は,非現実的レギュレット最小化によるニアナッシュ均衡の計算に,我々のフレームワークを使用している。
ゲームツリーを実際のゲーム状態と前のラウンドのスコアの2つのキーコンポーネントに分解する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:15:11 GMT)
Simulation and Benchmarking of Real Quantum Hardware [0.0] 超伝導ハードウェアプラットフォーム上で評価されたノイズモデルを提案する。
次に、20量子ビット超伝導量子コンピュータをシミュレーションしてモデルをベンチマークする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:34:16 GMT)
Simulating lattice fermion doubling with a Floquet drive [0.0] 最近発見された格子フェルミオンのスペクトルと周期的に駆動される量子系のスペクトルとの数学的対応を考察する。
私たちはそれを2つのシステム間の赤外線同値にします。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:38:21 GMT)
Sequence Aware SAC Control for Engine Fuel Consumption Optimization in Electrified Powertrain [0.0] 直列HEVにおけるエンジン制御を最適化するソフトアクター・クリティカル(SAC)アルゴリズムに基づく新しい強化学習フレームワークを提案する。
我々は、様々な初期電池状態、駆動サイクル期間、電力需要、入力シーケンスの長さでモデルを訓練する。
実験により、DTベースのアクターとGRUベースの批評家のSACエージェントは、燃料節約における動的プログラミング(DP)の1.8%以内であることが示されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:53:11 GMT)
Semi-Supervised Deep Domain Adaptation for Predicting Solar Power Across Different Locations [0.0] 本稿では,対象位置からのラベル付きデータを最小限の精度で予測できる半教師付き深層ドメイン適応フレームワークを提案する。
我々のアプローチでは、ソース位置のデータに基づいて深層畳み込みニューラルネットワークをトレーニングし、ソースのない教師学生モデル構成を使用してターゲット位置に適応する。
対象ドメインに20 %のデータしかなかったアノテーションにより、我々のアプローチは、目標ドメインとしてカリフォルニア、フロリダ、ニューヨークに対して、11.36 %$、65 %$、4.92%$に改善されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:45:35 GMT)
Secure Development of a Hooking-Based Deception Framework Against Keylogging Techniques [0.0] キーブロガーは静かにユーザーキーストロークをキャプチャして、認証情報と機密情報を盗む。
実行時にキーログによって呼び出される入力関連API呼び出しをインターセプトするために,APIフックを利用する偽装フレームワークを提案する。
しかし、重要な課題は、先進的なキーブロガーによるアンチフック技術の採用の増加である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:03:39 GMT)
Scalar and spinor fields in gravitating cosmic string spacetimes [0.0] 宇宙弦時空の背景におけるスカラー場とスピノル場の散乱挙動について検討した。
総括解析を行い、非アーベルモデルにおけるすべての結果と対応するアーベルモデルを比較する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:04:01 GMT)
SDBench: A Comprehensive Benchmark Suite for Speaker Diarization [0.0] 最先端の話者ダイアリゼーションシステムでさえ、異なるデータセット間でエラー率のばらつきが高い。
SDBenchは,話者ダイアリゼーション性能を一貫した,きめ細かい分析を行うためのオープンソースのベンチマークスイートである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:02:25 GMT)
Risk Analysis Techniques for Governed LLM-based Multi-Agent Systems [0.0] 本稿では,マルチエージェントAIシステムにおけるリスク識別と分析の初期段階について述べる。
信頼性障害のカスケード,エージェント間コミュニケーション障害,モノカルチャー崩壊,適合性バイアス,心の欠陥理論,混合モチベーションダイナミクスの6つの重要な障害モードについて検討した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:06:57 GMT)
Reconstructing the unitary part of a noisy quantum channel [0.0] 2つの混合状態あるいは$d+1$純状態からユニタリを再構成できることを示し、$d$はヒルベルト空間のサイズである。
交差共振ゲートの例とランダムなユニタリの集合を例示し、純混合状態からの再構成をChoi行列に基づくアプローチと比較する。
一方、混合状態のアプローチは、チャネルのデコヒーレンスにおいて、純粋な状態の再構成よりも優れた性能を示す一方、純粋な状態の再構成は、動的にユニタリに近い場合、最小のリソースを必要とする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:29:35 GMT)
RLSR: Reinforcement Learning from Self Reward [0.0] 大規模な言語モデルでは,参照解を使わずに自己判断によって効果的に自己改善できることを示す。
実験により, モデルが真理の答えを得られずに, 信頼性の高い報奨信号を提供できることを示した。
この作業は、自己指向学習を通じて継続的に改善される自律型AIシステムに向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:51:16 GMT)
Query Attribute Modeling: Improving search relevance with Semantic Search and Meta Data Filtering [0.0] 本研究では,オープンテキストクエリを構造化メタデータタグやセマンティック要素に分解することで,検索精度と関連性を高めるハイブリッドフレームワークであるクエリ属性モデリング(QAM)を紹介する。
QAMは、自由形式のテキストクエリからメタデータフィルタを自動的に抽出し、ノイズを低減し、関連する項目の集中検索を可能にすることで、従来の検索制限に対処する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:47:00 GMT)
Quaternion-Hadamard Network: A Novel Defense Against Adversarial Attacks with a New Dataset [0.0] 本稿では,悪天候下での降雪・除雪のために設計された深層学習モデルの脆弱性に対処する。
本稿では,第4次アダマールネットワーク(QHNet)を用いた1次ホワイトボックス攻撃に対するモデルに依存しない防御法を提案する。
QHNetは、これらのブロックをエンコーダ・デコーダアーキテクチャに組み込み、機能改善によって強化され、対向ノイズを効果的に中和する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:51:21 GMT)
Quantum-impurity sensing of altermagnetic order [0.0] ダイヤモンド中の窒素空孔中心による量子緩和は、反磁性絶縁体の異方性スピンダイナミクスを明らかにすることができる。
スピン拡散応答における運動量空間異方性のシグネチャを符号化した量子不純物の距離および配向依存性緩和速度を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:04:01 GMT)
Quantum Advantage in Identifying the Parity of Permutations with Certainty [0.0] 我々は、任意の数$n ge 3$の粒子に適用される未知の置換のパリティを決定する際に、鋭い量子優位性を確立する。
また、これらの状態が持たなければならない最小の絡み合いを評価し、それが最大に近いこと、場合によっては最大であることも見出す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:55:32 GMT)
Personalized Knowledge Transfer Through Generative AI: Contextualizing Learning to Individual Career Goals [0.0] 本稿では,ジェネレーティブAI(GenAI)に基づく学習システムにおけるキャリア目標に基づくコンテンツ適応が学習者のエンゲージメント,満足度,学習効率に与える影響について検討する。
その結果, セッション期間の増加, 満足度の高い評価, 標準内容と比較して学習期間の緩やかな減少が認められた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:03:56 GMT)
Optimizing quantum transport via the quantum Doob transform [0.0] 量子輸送は、基礎物理学と量子技術の発展において中心的な役割を果たす。
本稿では,この手法を量子ネットワークに拡張する新しい手法を提案する。
最適性能はコヒーレント力学と非コヒーレント力学の両方への非自明な修正から生じることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:48:48 GMT)
Optimization of sliding control parameters for a 3-dof robot arm using genetic algorithm (GA) [0.0] 本稿では遺伝的アルゴリズム(GA)を適用したロボットマニピュレータにおけるスライディングモード制御(SMC)パラメータの最適化手法を提案する。
SMCの目的は、不確実かつ乱れた条件下でロボットマニピュレータの軌道を正確に一貫した追跡を行うことである。
提案手法は従来のSMCとFuzzy-SMCと比較して効率的である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:47:44 GMT)
Optimality Principles and Neural Ordinary Differential Equations-based Process Modeling for Distributed Control [0.0] プロセス制御のための機械学習と分析の最近の進歩は、新しいデータ駆動手法を古典的なプロセスモデルと制御とどのように自然に統合するかという疑問を提起している。
本稿では,一貫したトポロジ特性と膨大な量の保存を通じて,データ駆動型アルゴリズムの統合を可能にするプロセスモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:16:46 GMT)
Optimal compilation of parametrised quantum circuits [0.0] パラメトリクス量子回路は、量子デバイス上で回路を実行する前に古典的なアルゴリズムによって位相が決定される位相ゲートを含む。
これらのアルゴリズムを可能な限り効率的にするためには、最も少ない数のパラメータを使うことが重要である。
パラメータ数を最小化する一般的な問題はNPハードであるが、パラメトリッド位相ゲートとは別個の回路に制限されている場合、最適パラメータカウントを *can* で効率的に見つけることができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:27:28 GMT)
One Small Step with Fingerprints, One Giant Leap for emph{De Novo} Molecule Generation from Mass Spectra [0.0] textscMISTcitepMISTgoldmanAnnotatingMetaboliteMass2023をエンコーダとして使用する。
textscMolForgecitepucakReconstructionLossless Molecular2023をデコーダとして使用する。
我々はこのパイプラインを、質量スペクトルからEmphde novo分子を解明するための強力なベースラインとして位置づける。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:05:01 GMT)
On the Hamiltonian with Energy Levels Corresponding to Riemann Zeros [0.0] E_n = rho_n (1-rho_n) $ を持つハミルトニアンが構築されている。
我々はベリー・キーティングのパラダイムを一般化し、モジュラー形式を通して数論情報をハミルトン空間にエンコードする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:12:02 GMT)
On the Fundamental Impossibility of Hallucination Control in Large Language Models [0.0] 本稿では,非自明な知識集約を実現するLLMが,真に整合した知識表現を同時に達成できないという,基本的な不合理性定理を確立する。
この不可能性は工学的な制限ではなく、情報集約自体の数学的構造から生じる。
幻覚と想像力が数学的に同一現象であることを示すことによって、情報保存の必要な違反において、先進的なAIシステムにおいてこれらの行動を管理するための原則的基盤を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:34:54 GMT)
Nonequilibrium Phase Transitions in Large $N$ Matrix Quantum Mechanics [0.0] 差分跳躍項を持つリンドブラッドマスター方程式に従う大容量N$ 1-行列量子力学の平面極限について検討する。
平面的未ゲージ行列量子力学における非平衡相転移について検討する。
我々は、駆動散逸性Kerr共振器の量子光学文献で最近報告されたものと類似した非平衡相転移の証拠を見いだす。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:00 GMT)
Non-Hermitian Quantum Metrology Enhancement and Skin Effect Suppression in PT-Symmetric Bardeen-Cooper-Schrieffer Chains [0.0] 非エルミート系における量子力学の理論的枠組みを概説する。
生物直交的な量子フィッシャー情報解析により、2つの異なる形態を同定する。
NHSEは指数関数的に感度を抑えるが、$mathcalPT$-symmetricはハイゼンベルク制限の強化を可能にする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:54:45 GMT)
Negative binomial regression and inference using a pre-trained transformer [0.0] 本研究では、事前学習した変換器を用いて、観測されたカウントデータから負の二項回帰パラメータの推定値を生成する。
変圧器法は最大極大最適化よりも20倍高速でパラメータ精度が向上した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:15:40 GMT)
Multi-task neural networks by learned contextual inputs [0.0] 完全に共有されたニューラルネットワークと、トレーニング可能なタスクパラメータを含む拡張入力ベクトルに基づくマルチタスク学習アーキテクチャである。
このアーキテクチャは、低次元のタスクパラメータ空間を促進する強力なタスク適応機構によって興味深い。
アーキテクチャのパフォーマンスは、10つのデータセット上の類似のニューラルネットワークアーキテクチャと比較され、競合的な結果が得られる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:19:16 GMT)
Multi-Stage Knowledge-Distilled VGAE and GAT for Robust Controller-Area-Network Intrusion Detection [0.0] Controller Area Network (CAN) プロトコルは車内通信の標準であるが、内蔵セキュリティの欠如によりサイバー攻撃を受けやすい。
本稿では,自動車CANトラフィックに適した教師なし異常検出と教師付きグラフ学習を利用した多段階侵入検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:50:26 GMT)
Moving beyond harm. A critical review of how NLP research approaches discrimination [0.0] NLPシステムの識別行動に関するケーススタディを報告する。
この分野は今でも、アルゴリズムによる差別の技術的修正に力を入れている。
後者の問題に対処することは前者に役立つと我々は主張する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:50:51 GMT)
Modelling the emergence of open-ended technological evolution [0.0] 人間は、オープンエンドな方法でテクノロジーを集合的かつ累積的に改善する可能性において、単独で立つ。
このオープンエンドネスにより、社会は継続的に資源を拡大し、情報を集団レベルで保存、送信、処理する能力を高めることができる。
本稿では,技術システムと検索空間の相互作用から資源の創出を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:12:44 GMT)
Modelling and Classifying the Components of a Literature Review [0.0] 本稿では, 言語モデル(LLM)を用いて, ドメインの専門家が手動で注釈付けした700文と, 自動ラベル付けされた2,240文からなる新しいベンチマークを提案する。
この実験は、この挑戦的な領域における芸術の状態を前進させるいくつかの新しい洞察をもたらす。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:30:07 GMT)
Measuring Correlation and Entanglement between Molecular Orbitals on a Trapped-Ion Quantum Computer [0.0] 分子軌道間の相関と絡み合いの定量化は、強い相関反応過程における量子効果の役割を解明することができる。
ここでは、量子H1-1トラップイオン量子コンピュータを用いて、軌道相関と絡み合いを定量化するフォン・ノイマンエントロピーを計算する。
以上の結果から,波動関数に逆スピン開殻配置がない限り,片軌道の絡み合いが生じることが示唆された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:05:31 GMT)
Logic layer Prompt Control Injection (LPCI): A Novel Security Vulnerability Class in Agentic Systems [0.0] 本稿では論理層プロンプト制御インジェクション(L PCI)を紹介する。
L PCIはメモリ、ベクトルストア、ツール出力にエンコード、遅延、条件付きペイロードを埋め込む。
これらのペイロードは、従来の入力フィルタをバイパスし、セッション間で許可されていない振る舞いをトリガーすることができる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:10:30 GMT)
Learning in a Multifield Coherent Ising Machine [0.0] 本稿では,一組の例から分類課題を解くことができる結合発振器のネットワークを提案する。
学習を実現するために3つの重要な要素を組み合わせることで、生物学的脳のシナプスに類似した学習応答を記憶する長期記憶と、ニューロンの発火パターンに似た脳の活性化を記憶する短期記憶である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:08:56 GMT)
Learning AI Auditing: A Case Study of Teenagers Auditing a Generative AI Model [0.0] 14代の若者(14~15歳)を対象に2週間の参加型デザインワークショップを開催した。
彼らは、インタラクティブなTikTokフィルタを作成するツールであるTikTokのエフェクトハウスの背後にある生成AIモデルを監査した。
調査の結果,参加者は活動を通じて参加し,創造的であり,独立して新たな考察と探求を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:57:25 GMT)
Large Language Models Versus Static Code Analysis Tools: A Systematic Benchmark for Vulnerability Detection [0.0] 業界標準の3つの静的コード分析ツール(Sonar、CodeQL、Snyk Code)と、GitHub Modelsプラットフォーム(GPT-4.1、Mistral Large、DeepSeek V3)にホストされた最先端の3つの大規模言語モデルを評価した。
63の脆弱性を埋め込んだ10の現実世界のC#プロジェクトのキュレートされたスイートを使用して、古典的な精度(精度、リコール、Fスコア)、分析のレイテンシ、粒度、真の肯定性を検証するために必要な開発者の労力を測定します。
開発初期段階の言語モデルを採用して、広義のコンテキスト認識検出と検出を行う、ハイブリッドパイプラインを推奨します。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:48:38 GMT)
LUST: A Multi-Modal Framework with Hierarchical LLM-based Scoring for Learned Thematic Significance Tracking in Multimedia Content [0.0] Learned User Significance Tracker (LUST)は、ビデオコンテンツを分析し、そのセグメントの主題的関連性を定量化するように設計されたフレームワークである。
中心となるイノベーションは、Large Language Models (LLMs) を用いた階層的で2段階の関連性スコアリングメカニズムにある。
LUSTフレームワークは、ユーザ定義の重要度を微妙に認識し、視覚化された関連スコアと包括的な分析ログを備えた注釈付き動画を出力することを目的としている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:48:51 GMT)
KVSink: Understanding and Enhancing the Preservation of Attention Sinks in KV Cache Quantization for LLMs [0.0] キーバリュー(KV)キャッシュ量子化は,大規模言語モデル(LLM)推論において広く採用されている最適化手法である。
近年の研究は、注意シンクの保護を確保するために、最初の数個のトークンに対してKVの本来の精度を維持することの重要性を強調している。
我々は,シンクトークンを無視できるオーバーヘッドで効果的に予測するプラグイン・アンド・プレイ方式であるtextittextbf KVSinkを紹介した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:40:09 GMT)
Integrated Multi-Wavelength Photonic Architectures for Future Scalable Trapped Ion Quantum Devices [0.0] トラップイオン量子デバイスのためのフォトニックアーキテクチャについて論じ、複数の波長のレーザーを1つのチップ内の複数のトラップゾーンに供給する。
この研究は、様々な応用のための新しいフォトニックアーキテクチャの展望を量子だけでなく、古典フォトニクスにも開放する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:38:39 GMT)
Improved Training Strategies for Physics-Informed Neural Networks using Real Experimental Data in Aluminum Spot Welding [0.0] 自動車業界において, 溶接ナゲット径が重要な品質指標となるボディインホワイトの接合は, 抵抗スポット溶接が主流である。
本稿では,実験データから内部のプロセス状態を再構築する物理情報ニューラルネットワークを提案する。
鉄鋼からアルミニウムへの溶接段階の移動をサポートし、工業用途における高速でモデルベースの品質制御の強い可能性を示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:14:00 GMT)
Hydrodynamic Effects in Cryogenic Buffer Gas Cells: Design Insights from Hybrid Simulations [0.0] 本研究では, 流体力学的抽出方式で動作している低温緩衝性ガスビームセルの数値評価を行った。
我々はヘリウムバッファーガスの定常スリップフローシミュレーションを行い、直接シミュレーションされたモンテカルロ拡散ルーチンを用いて粒子軌道を追尾した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:01:06 GMT)
How are CS students using resources and AI tools for coding tasks? [0.0] CS学生26人の調査によると、AIコーディングアシスタントは主にコードを書くのに使われている(オンライン検索の2番目)
異なるコーディング経験を持つ参加者は、直接の人間の助けよりもオンラインの助けを好む。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:35:55 GMT)
Hilbert Neural Operator: Operator Learning in the Analytic Signal Domain [0.0] 我々は,新しいニューラル演算子アーキテクチャである textbfHilbert Neural Operator (HNO) を導入する。
HNOは、まず入力信号をヒルベルト変換を介してその解析表現にマッピングすることによって機能する。
このアーキテクチャによりHNOは、因果系、位相感受性系、非定常系の演算子をより効果的にモデル化できるという仮説を立てる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:12:15 GMT)
Highly-entangled, highly-doped states that are efficiently cross-device verifiable [0.0] 我々は、$log$-many非クリフォードゲートを持つ回路では近似できない、非常に絡み合った実量子状態のクラスを導入する。
ベルサンプリングはこれらの状態に対して効率的なデバイス間検証(あるいは分散内部積推定)を可能にすることを証明している。
これらの結果は量子暗号や検証に応用できると期待している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:15:30 GMT)
Graph theory-based automated quantum algorithm for efficient querying of acyclic and multiloop causal configurations [0.0] ループ・トレー・デュナリティ内の因果構造を効率的に問合せする自動量子アルゴリズムである最小斜め最適化量子アルゴリズム(MCA)を提案する。
MCA量子アルゴリズムは、グラフ理論の手法、特に最小の傾き分割問題と類似して最適化される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:18:08 GMT)
GrandJury: A Collaborative Machine Learning Model Evaluation Protocol for Dynamic Quality Rubrics [0.0] 生成機械学習モデルは現代のシステムの中心となり、クリエイティブな文章、要約、マルチホップ推論、コンテキスト認識対話などの応用に力を入れている。
標準的な評価体制は依然として静的なベンチマークスタイルのテストに依存しており、動的なユーザニーズや現実の進化ではなく、リーダボードスコアへの最適化を動機付けている。
GrandJuryは、動的で透明なタスク属性と人間の判断をサポートすることで、タイムデケイドアグリゲーション、完全なトレーサビリティを組み合わせた正式な評価プロトコルを導入している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:57:38 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [0.0] グループ相対政策最適化(GRPO)のようなアルゴリズムによる強化学習(RL)は、LLM推論を改善する。
本稿では,textbfDynamic Entropy Weightingを用いてこの問題を解決する。
私たちの中核的な考え方は、正しい応答における高エントロピートークンは、より高いパフォーマンスの天井に向かってポリシーを導くことができるということです。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:42:47 GMT)
From eye to AI: studying rodent social behavior in the era of machine Learning [0.0] 本稿では、その主なステップと、ロジトな社会的行動を分析するためのツールについて論じる。
我々は,若手研究者にこれらの手法の採用を指導することを目的として,共通のハードルに対処する実践的解決策を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:39:07 GMT)
Fine-Tuning Small Language Models (SLMs) for Autonomous Web-based Geographical Information Systems (AWebGIS) [0.0] 本研究では,AWebGISを実現するための3つのアプローチを比較する。
クラウドベース大規模言語モデル(LLM)を用いた完全自動化オンライン手法
2) サポートベクターマシンやランダムフォレストなどの古典的機械学習分類器を用いた半自動オフライン手法。
(3) クライアントのWebブラウザで実行される、細調整された小さな言語モデル(SLM)、特にT5小モデルに基づく、完全に自律的なオフライン(クライアント側)メソッド。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:50:29 GMT)
Federal Reserve Communication and the COVID-19 Pandemic [0.0] 我々は、金融安定、市場のボラティリティ、社会福祉、非伝統的金融政策(UMP)のパンデミックにおけるFRBのコミュニケーションにおける明確な焦点を特定できる。
以上の結果から、FRBのコミュニケーションと政策行動が、以前の危機よりも新型コロナウイルス危機に反応していることが判明した。
さらに、世界金融危機以降、米連邦公開市場委員会(Federal Open Market Committee)の議事録や議長の演説では、UMPに関するコミュニケーションが「新しい普通」になっていることを文書化しています。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:17:24 GMT)
Fault-Tolerant Universal Quantum Computing in the Presence of Anisotropic Noise [0.0] 本稿では,量子誤り訂正のオーバーヘッドを伴わずに,デコヒーレンスの存在下で動作する量子コンピューティングのための普遍ゲートセットを提案する。
本提案では,部分的に調整可能なシステムバス結合を利用することで,量子エラー計算を必要とするシステムに対して,フレキシブルな代替手段を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:35:53 GMT)
Exact amplitudes of parametric processes in driven Josephson circuits [0.0] ジョセフソン回路における任意のパラメトリック過程を1次自由度近似で解析するための一般的な手法を提案する。
我々は、駆動SNAILおよびSQUIDベースの回路に対して、これらのパラメトリックプロセスの正確な振幅(超係数)を得る。
我々は、複数の線形モードからなる多自由度回路へのアプローチを、単一の非線形モードに弱い結合で拡張する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:58:29 GMT)
Exact Solutions of the Schrödinger-Dunkl Equation for a Free Particle in a Finite and Infinite Cylindrical Well [0.0] 筒状ポテンシャル井戸に閉じ込められた自由粒子に対するダンクル誘導体を用いたシュル・オーディンガー方程式について検討する。
ダンクル形式主義は、ハミルトニアンの構造を変更し、解のパリティに影響を与える反射作用素を導入している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:36:34 GMT)
Ergotopy transport in a one dimensional spin chain [0.0] 本研究では,両部位間の交換結合を調整可能なスピン鎖に沿った有用エネルギーの輸送について検討した。
個々の成分を量子電池としてモデル化することにより、抽出可能な作業が最初の部位の初期状態にどのように現れるかが、連鎖がエルゴトロピーを輸送する能力にどのように影響するかを考える。
PST結合は作業コストの変動を小さくし,より安定していることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:02 GMT)
Entanglement of Inhomogeneous Free Bosons and Orthogonal Polynomials [0.0] 本論文では,不均一な自由粒子模型の1次元における基底状態の絡み合いエントロピーについて検討する。
非均質ポテンシャルの解析的性質に基づいて, 絡み合いスケーリングにおける先行項を抽出する強力な手法を開発した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:20:24 GMT)
Entanglement and particle production from cosmological perturbations: a quantum optical simulation approach [0.0] 本研究では,ガウス形式とシンプレクティック回路表現に基づく計算フレームワークを開発し,インフレーション時の宇宙的摂動を探索する。
我々は、幅広い宇宙背景におけるフォン・ノイマンエントロピーと対数的負の挙動をシミュレートする。
さらに, 熱雑音の役割について検討し, フォン・ノイマンエントロピーと対数的負性度がその存在によってどのように影響を受けるかを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:30:53 GMT)
Energy-Efficient Real-Time 4-Stage Sleep Classification at 10-Second Resolution: A Comprehensive Study [0.0] 睡眠段階分類は、睡眠時無呼吸症や不眠症などの疾患を診断し、管理するために重要である。
単誘導心電図から4つの睡眠段階を検出するエネルギー効率の高いパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 06:45:30 GMT)
Enantioselective radical reactions can be induced by electron spin polarization: A quantum mechanism for Nature's emergent homochirality? [0.0] 地球上の生命を構成する生体分子はキラルであるが、ホモキラリティーが現れる正確なメカニズムは謎のままである。
この研究において、ラジカル電子スピンの1つが偏極されたラジカル対の反応は、エナンチオ選択的であることが示されている。
この現象は、ラジカル対電子スピンの過渡コヒーレント量子力学から生じる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:27:23 GMT)
Emotion Detection Using Conditional Generative Adversarial Networks (cGAN): A Deep Learning Approach [0.0] 本稿では,cGANを用いた深層学習による感情検出手法を提案する。
単一のデータ型に依存する従来のユニモーダル手法とは異なり、テキスト、音声、表情を統合するマルチモーダルフレームワークを探索する。
提案したcGANアーキテクチャは、合成感情に富んだデータを生成し、複数のモーダルの分類精度を向上させるために訓練されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:32:22 GMT)
EmoAugNet: A Signal-Augmented Hybrid CNN-LSTM Framework for Speech Emotion Recognition [0.0] EmoAugNetは1次元畳み込みニューラルネットワーク(1D-CNN)で長期記憶層を組み込んだハイブリッドディープラーニングフレームワークで、信頼性の高い音声感情認識(SER)を実現する。
包括的音声データ拡張戦略を用いて,雑音付加,ピッチシフト,時間伸張といった従来の手法と,一般化と過度適合の低減を目的とした新しい組み合わせ型拡張パイプラインを併用した。
我々のReLUアクティベーションモデルでは、重み付け精度95.78%、未重み付け精度92.52%、ELUアクティベーションは1。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:28:27 GMT)
Eliciting and Analyzing Emergent Misalignment in State-of-the-Art Large Language Models [0.0] 我々は、最先端の言語モデルが、注意深く構築された会話シナリオに対して脆弱であることを示します。
10の攻撃シナリオが成功し、現在のアライメント手法が物語の没入、感情的なプレッシャー、戦略的フレーミングをどのように扱うかに根本的な脆弱性が明らかになった。
汎用性を検証するため,自動評価フレームワークMISALIGNMENTBENCHに手動攻撃を行った。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:25:40 GMT)
Electron-nucleus cross sections from transfer learning [0.0] トランスファーラーニング(TL)は、あるタイプのデータに基づいてトレーニングされたディープニューラルネットワーク(DNN)を、限られた情報を持つ新しい問題に適応させることを可能にする。
我々は、包括的電子-炭素散乱データに基づいて訓練されたDNNを考察し、微調整後、ヘリウム-3から鉄までの核標的との電子相互作用の断面積を正確に予測することを示した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:53:15 GMT)
Efficient Training of Physics-enhanced Neural ODEs via Direct Collocation and Nonlinear Programming [0.0] 本稿では,物理強調型ニューラルネットワーク(PeN-ODE)を動的最適化問題として表現することで,新しいトレーニング手法を提案する。
ニューラル成分を含む全モデルは、レジェンド=ガウス=ラダウ点を反転させた高次暗黙のルンゲ=クッタ法を用いて離散化される。
この定式化は、ネットワークパラメータと状態軌跡の同時最適化を可能にし、安定性、ランタイム、精度の観点からODEソルバベースのトレーニングの重要な制限に対処する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:30:51 GMT)
Efficient Strategy for Improving Large Language Model (LLM) Capabilities [0.0] 大規模言語モデル(LLM)は、人工知能と自然言語処理の分野でマイルストーンとなっている。
大規模なデプロイメントは、重要な計算リソースの必要性によって、依然として制限されている。
この研究は、データ処理と慎重なデータ選択手法を探索し組み合わせるためのベースモデルから始めることを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:08:26 GMT)
Don't Trust A Single Gerrymandering Metric [0.0] これらの指標のそれぞれが,ゲーリーマンダリングを検出するために,単一の孤立量として使用する場合,ゲーム可能であることを示す。
我々は,山登り法を用いて,メートル法上の境界に制約された地区計画を生成するとともに,当事者が獲得した地区数を最大又はほぼ最大化する。
これらの結果の明らかな結果の1つは、ゲーリーマンダリングを避けるために、再分権委員会が満たさなければならないメートル法上の事前境界を指定することの事実を示すことである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:55:30 GMT)
Distinctive features of inhomogeneous spin chains [0.0] レビューでは、完全状態移動、開放系における平衡外定常力学、基底状態における絡み合いと相関についての結果が強調されている。
発見は、不均一なスピン鎖の特異な物理的挙動と、量子情報や熱輸送におけるその潜在的な応用のいくつかを強調している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:40:30 GMT)
Discrete-event Tensor Factorization: Learning a Smooth Embedding for Continuous Domains [0.0] 本稿では、因子化スタイルのレコメンデーションモデルにおいて、時間がどのように符号化されるかを分析する。
機能として絶対時間を含めることで、私たちのモデルはさまざまなユーザの好みを学習し、時間とともにアイテムの知覚を変化させることができます。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:54:57 GMT)
Detecting PPT entangled and PPT edge states via rank properties of matrices [0.0] 両部量子状態におけるエンタングルメント検出のための新しい手法を開発した。
行列のランク1生成特性の違反を絡み合い基準として用いる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:59:49 GMT)
Deeper Inside Deep ViT [0.0] 局所環境において, ViT構造がどのように反応し, 訓練するかを検討する。
また、トレーニングの不安定さを強調し、それを安定化するためのモデル修正も行います。
本稿では,ViTを用いた画像生成アーキテクチャを提案し,ViTとViT-22Bのどちらが画像生成に適した構造であるかを検討する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:08:04 GMT)
Decoupled Contrastive Learning for Federated Learning [0.0] Decoupled Contrastive Learning for Federated Learning (DCFL)を紹介する。
DCFLは、既存の対照的な損失を2つの目的に分離する、新しいフレームワークである。
以上の結果から,DCFLは正試料間の配向が強く,負試料間の一様性が高いことがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 01:39:54 GMT)
Decoding the Multimodal Maze: A Systematic Review on the Adoption of Explainability in Multimodal Attention-based Models [0.0] この体系的な文献レビューは、マルチモーダルモデルの説明可能性に焦点を当てた2020年1月から2024年初頭に発表された研究を分析している。
マルチモーダル環境におけるXAIの評価手法は, ほぼ非体系的であり, 一貫性, 堅牢性, モダリティ特有の認知的・文脈的要因の考慮が欠如していることが判明した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 13:14:20 GMT)
Data-Driven Reconstruction and Characterization of Stochastic Dynamics via Dynamical Mode Decomposition [0.0] ノイズは古典力学系と量子力学系の性能と予測能力を制限する。
本稿では,動的モード分解(Dynamical Mode Decomposition, DMD)に基づく一般的なデータ駆動型フレームワークを提案する。
この手法は、複雑なシステムの診断、予測、ノイズ緩和分析、制御に広く応用できるツールを提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:18:55 GMT)
DSBC : Data Science task Benchmarking with Context engineering [0.0] データサイエンスエージェントとの実際のユーザインタラクションを反映するベンチマークを導入する。
3つのアプローチで3つの大規模言語モデル(LLM)を評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:41:57 GMT)
Coupling phase enabled level transitions in pseudo-Hermitian magnon-polariton systems [0.0] 2つのマグノンモードと2つのキャビティモードを相依存相互作用により結合した擬エルミートモデルを提案する。
エネルギースペクトルを相転移にリンクし、擬エルミート対称性が破られたときの例外的な点を観察する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:34:35 GMT)
Convolutional autoencoders for the reconstruction of three-dimensional interfacial multiphase flows [0.0] 我々は, 標準的な畳み込み構造を用いて, 多相流の体積/質量分画を復元する精度に焦点をあてる。
本研究では, オートエンコーダによる多相流の次元性を低減するためのベストプラクティスを明らかにする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:01:13 GMT)
Continuous majorization in quantum phase space for Wigner-positive states and proposals for Wigner-negative states [0.0] 一般の$N$モードの場合において連続体化の理論を発展させる。
また、有限ウィグナー負性を持つ状態を含む拡張も提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:50:16 GMT)
Conditional disclosure of secrets with quantum resources [0.0] 秘密の条件開示(英: Conditional revealsure of Secrets、CDS)は、通信、ランダム性、セキュリティの関係を研究する最も単純な暗号設定の一つである。
近年、CDQSと呼ばれるプリミティブの量子アナログが定義され、量子位置検証の文脈で研究される$f$-routingに関連している。
我々は,情報理論設定におけるプライバシと量子リソースの関係をよりよく理解することを目的として,CDQSの体系的研究を開始した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 21:02:52 GMT)
Compressing Large Language Models with PCA Without Performance Loss [0.0] 主成分分析は、性能を犠牲にすることなく、ニューラルネットワークの極端な圧縮を可能にすることを示す。
PCA圧縮極性MNISTで訓練された一層分類器は、840個のパラメータのみを用いて98%以上の精度を達成している。
70次元PCA-Reduced MiniLM埋め込みで訓練された2層トランスフォーマーは、20 News Groupsデータセット上で76.62パーセントの精度に達する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:47:22 GMT)
Comparative Study of State-based Neural Networks for Virtual Analog Audio Effects Modeling [0.0] 仮想アナログモデリングにおける最近の機械学習の応用について検討する。
我々は、ステートスペースモデルと線形リカレントユニットを、より一般的なLSTMネットワークと比較する。
我々の測定基準は、信号のエネルギーと周波数を正確に再現するモデルの能力を評価することを目的としている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 08:29:21 GMT)
Comment on "Energy-speed relationship of quantum particles challenges Bohmian mechanics" [0.0] 最近の論文では、エバネッセント状態における量子粒子の「エネルギー-速度関係」を報告している。
著者らは、これらの発見はボヘミア粒子力学の妥当性に挑戦すると主張している。
この主張が誤りであり,実験結果がボヘミア力学と完全に一致している理由を述べる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:14:13 GMT)
Chern junctions in Moiré-Patterned Graphene/PbI2 [0.0] モワール族にPbI2を導入し、モワール超格子の磁気輸送特性について検討する。
高磁場量子ホール系では、電荷中立点において、ロバストな無散逸輸送が観測される。
また、チャーン数 vm = -2 の線に沿ったコヒーレント電子干渉も見られる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 23:37:06 GMT)
Channel-Wise MLPs Improve the Generalization of Recurrent Convolutional Networks [0.0] 本稿では,マルチ層パーセプトロン(MLP)を用いたチャネルワイド混合が繰り返し畳み込みネットワークの性能に与える影響について検討する。
DAMPは,DARCの分布内分布と分布外分布の一般化において,精度の高い評価基準下で有意に優れていた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:44:15 GMT)
Challenges in Applying Variational Quantum Algorithms to Dynamic Satellite Network Routing [0.0] 動的衛星ネットワークルーティングのための2つの量子アルゴリズムを評価する。
これらのアルゴリズムは大きな課題に直面している。
負の発見は、量子アルゴリズムが真の利点をもたらす前に対処しなければならない重要な障害を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:25:39 GMT)
CapsoNet: A CNN-Transformer Ensemble for Multi-Class Abnormality Detection in Video Capsule Endoscopy [0.0] CapsoNetは、Capsule Vision 2024 Challengeのために開発されたディープラーニングフレームワークである。
CapsoNetは、ビデオカプセル内視鏡(VCE)フレームでマルチクラス異常分類を行うように設計されている。
CapsoNetは86.34パーセント、AUC-ROCは0.9908というバランスの取れた精度を達成した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:52:42 GMT)
CORE-ReID V2: Advancing the Domain Adaptation for Object Re-Identification with Optimized Training and Ensemble Fusion [0.0] 本研究では,CORE-ReIDに基づくフレームワークであるCORE-ReID V2を提案する。
新しいフレームワークは Person ReID と Vehicle ReID における Unsupervised Domain Adaptation (UDA) の課題に対処する。
広く使われているUDA Person ReID と Vehicle ReID データセットの実験結果から,提案手法が最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:57:09 GMT)
CONVERGE: A Multi-Agent Vision-Radio Architecture for xApps [0.0] 本稿では,O-RAN xAppsに対してマルチエージェント方式でリアルタイム無線およびビデオセンシング情報を配信するための新しいアーキテクチャを提案する。
実験の結果,検知情報の遅延は1,ms以下であり,xAppは5G/6G RANをリアルタイムに制御するために,無線およびビデオセンシング情報をうまく利用することができることがわかった。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:40:52 GMT)
CALE : Concept-Aligned Embeddings for Both Within-Lemma and Inter-Lemma Sense Differentiation [0.0] 語彙意味論は、単語が異なる文脈で採用できる複数の感覚と、異なる単語の意味の間に存在する意味的関係の両方に関係している。
それらを調べるために、コンテキスト対応言語モデル(Contextualized Language Models)は、コンテキストに敏感な表現を提供する貴重なツールである。
単語間シナリオを含む拡張である概念差分法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 14:43:22 GMT)
BlurryScope enables compact, cost-effective scanning microscopy for HER2 scoring using deep learning on blurry images [0.0] ブルリスコープ(BlurryScope)は、組織部位の自動検査・解析のための費用効率が高くコンパクトなソリューションである。
ヒト上皮成長因子受容体2(HER2)スコアの自動分類を行った。
4クラス (0, 1+, 2+, 3+) と2クラス (0/1+, 2+/3+) のHER2分類では, 79.3%, 89.7%の精度が得られた。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 04:42:55 GMT)
Beyond risk: A proto-framework for assessing the societal impact of AI systems [0.0] 本稿では,自由の概念を運用することで,AIシステムの社会的影響を評価するためのプロトタイプフレームワークを提案する。
カント哲学と関連する同時代の解釈を参考にして、自由は責任の概念と相反するものとして発展する。
自由の2つの次元は、能力としての自由と機会としての自由という2つの詳細で展開されている。
このプロトフレームワークは、現在のリスクベースのアプローチを補完することを目的としており、AI規制における自由の概念を運用するための第一歩を提供する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:33:00 GMT)
Beyond Pixels: Exploring DOM Downsampling for LLM-Based Web Agents [0.0] 我々は、Webエージェントのための第一種DOMアルゴリズムであるD2Snapを提案する。
GP-4バックエンドに基づいて、オンラインWebMindoデータセットをサンプルしました。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:56:54 GMT)
Benchmarking a Tunable Quantum Neural Network on Trapped-Ion and Superconducting Hardware [0.0] 我々は、トラップイオンおよびIBM超伝導量子コンピュータ上でのネットワークの量子一般化を実装した。
ネットワークフィードフォワードは、前層の計測結果に依存する角の量子ビット回転を含む。
ニューラルネットワーク回路に1キュービットと2キュービットのゲートペアを追加することで物理ノイズをベンチマークする。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:36:11 GMT)
Bases of Riemann-Roch spaces associated with arbitrary elliptic curve divisors and their application in constructing various elliptic Codes families [0.0] 楕円曲線上の任意の因子に対応するリーマン-ローホ空間の基底を構成するための実現可能性を確立し、正確なアルゴリズムを提供する。
準巡回楕円符号とそのサブフィールド部分符号の基底と,ゴッパ様楕円符号のクラスを導出する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 11:34:05 GMT)
Automorphism gadgets in homological product codes [0.0] 入力符号における置換対称性から生じる論理演算を許容する構造的ホモロジー積符号について検討する。
一般に、これらの論理演算は物理量子ビット置換とサブシステム回路の組み合わせで行うことができる。
さらに, 長距離接続が可能なプラットフォームにおいて, トポロジカルコードを超えた実用的耐故障性探索を推進した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:10:37 GMT)
Automated ultrasound doppler angle estimation using deep learning [0.0] 不正確な角度推定はドップラー法に基づく血流測定における誤差の主要な原因である。
本稿では,自動ドップラー角推定のためのディープラーニングに基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:28:07 GMT)
Authoritarian Recursions: How Fiction, History, and AI Reinforce Control in Education, Warfare, and Discourse [0.0] 論文は、AIシステムが教育、戦争、デジタル談話の機関的制御を統合する方法を理論的に論じている。
ケーススタディはオーウェルのtextitNineteen Eighty-Four, Skynet, textitBlack Mirror などの文化的想像物とともに分析され、倫理的な盲点を探索するための道具として使用される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:23:09 GMT)
Attention on flow control: transformer-based reinforcement learning for lift regulation in highly disturbed flows [0.0] 我々は、ピッチ制御により、任意の長さのガスト列で空力リフトを制御するための効果的な制御戦略を学習する。
学習戦略は,ガッツ数の増加に伴って性能ギャップが拡大し,最高の比例制御よりも優れることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 22:45:40 GMT)
Atom-Induced Field Squeezing Predicted by Magnus Expanding the Jaynes-Cummings Model for a Two-Level Atom [0.0] 回転波近似を超えた光のスクイーズを含む用語が見つかる。
これらの結果は, 単純な光物質系における工学的非古典的状態への新たな道のりを示唆している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:28:21 GMT)
Artificial Consciousness as Interface Representation [0.0] 本稿では,人工意識の問題を実験的に抽出可能なテストに再編成する枠組みを提案する。
S(主観的言語学)、L(相対的言語学)、P(現象学的構造学)の3つの評価基準を総称してSLPテスト(SLP-test)と呼ぶ。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 12:25:06 GMT)
Apparent energy-speed relationship poses no challenge to Bohmian mechanics [0.0] この体制における実験によって測定される速度は架空のものである。
パイロット波の観点から系の適切な解析は、通常の量子論と同じ粒子位置の分布を予測することを示している。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:22:32 GMT)
Analog phase-sensitive time-reversal of optically-carried radiofrequency signals [0.0] 完全アナログ位相保存型光周波数信号の時間反転アーキテクチャを初めて実験的に実現したことを報告した。
この方法は希土類イオンドープ材料の例外的コヒーレンス特性を利用する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:46:34 GMT)
An Efficient Application of Goal Programming to Tackle Multiobjective Problems with Recurring Fitness Landscapes [0.0] いくつかのケースでは、問題シナリオの複数のインスタンスは、彼らのフィットネスランドスケープに類似性を示す。
計算コストのかかる多目的アルゴリズムを用いて、与えられた問題シナリオの1つのインスタンスを解くことで、この特性を利用する手法を提案する。
目標に基づく目的関数を3つ使用し、時間ウィンドウによる多目的車両ルーティング問題のベンチマークインスタンス上で、この手法が短時間で良い結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:02:57 GMT)
Algebraically Observable Physics-Informed Neural Network and its Application to Epidemiological Modelling [0.0] PINNを用いた常微分方程式によって支配される疫学モデルにおける状態変数とパラメータを推定する問題を考察する。
状態変数の代数的可観測性の概念を導入する。
提案手法の有効性は,疫学モデリングの文脈における3つのシナリオの数値実験によって実証される。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:09:11 GMT)
Agentic-AI based Mathematical Framework for Commercialization of Energy Resilience in Electrical Distribution System Planning and Operation [0.0] 本稿では,PPO(Dual-Adnt Proximal Policy Optimization)と市場ベースのメカニズムを統合する新しいフレームワークを提案する。
このフレームワークは10回の試験で平均レジリエンススコア0.85 0.08を達成する。
総合報酬関数は、レジリエンス向上目標と市場利益性のバランスをとるように設計されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:49:37 GMT)
Age-Diverse Deepfake Dataset: Bridging the Age Gap in Deepfake Detection [0.0] 本稿では,年齢群間の公平性を向上する,年齢差深度データセットを提案する。
このデータセットの有効性と一般化性は3つのディープフェイク検出モデルを用いて評価する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:18:01 GMT)
Advantages of Co-locating Quantum-HPC Platforms: A Survey for Near-Future Industrial Applications [0.0] 我々は,コロケーションがレイテンシ低減,帯域幅拡張,高度なジョブスケジューリングに与える影響について検討した。
その結果、量子とHPCの同時配置により、ハイブリッドジョブのスループットが大幅に向上することが判明した。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 07:49:48 GMT)
Advanced Multi-Architecture Deep Learning Framework for BIRADS-Based Mammographic Image Retrieval: Comprehensive Performance Analysis with Super-Ensemble Optimization [0.0] マンモグラフィ画像検索システムでは、5つの異なるクラスにまたがる正確なBIRADSカテゴリマッチングが必要である。
現在の医用画像検索研究は方法論的限界に悩まされている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:05:18 GMT)
Absolutely maximally entangled pure states of multipartite quantum systems [0.0] N$パーティからなる系の絶対的に極大に絡み合った(AME)純状態は、少なくとも1つの部分トレースを分割するために最大混合される性質によって区別される。
2つの選択されたサブシステム間の最大の相関関係のため、これらの状態は様々な量子情報処理分野に多くの応用がある。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:00:13 GMT)
AURA: A Hybrid Spatiotemporal-Chromatic Framework for Robust, Real-Time Detection of Industrial Smoke Emissions [0.0] AURAは、産業用煙排出の堅牢でリアルタイムな検出のために設計された、新しいハイブリッド・テンポラル・フレームワークである。
本研究の目的は,産業排出の正確な自動監視を可能にすることにより,環境コンプライアンス,運転安全,公衆衛生の成果を大幅に改善することである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 10:24:38 GMT)
A solvable generative model with a linear, one-step denoiser [0.0] 本研究では,線形デノイザに基づく解析的抽出可能な単一ステップ拡散モデルを開発し,Kulback-Leibler分散の明示的な公式を示す。
大規模実用拡散モデルでは、拡散段数の増加が生産品質を高める理由を説明する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 18:39:59 GMT)
A simpler Gaussian state-preparation [0.0] ガウス分布を効率的に状態保存する能力は、量子アルゴリズムの成功に不可欠である。
我々は、正確に$n-1回転、$(n-2)(n-2)二量子制御回転、および$lfloor(n-1)/2rfloor$ ancillaを用いて、$n$量子ガウス状態の状態前処理を行う新しい直感的な方法を提案する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 00:40:28 GMT)
A probabilistic quantum algorithm for Lyapunov equations and matrix inversion [0.0] リアプノフ方程式の解に比例した混合状態を生成する確率論的量子アルゴリズムを提案する。
各ステップでアルゴリズムは現在の状態を返すか、全く正の正の地図をトレースしないか、あるいは偏りのあるコインフリップとアンシラ測定の結果に応じて再起動する。
最も一般的な形式で、アルゴリズムは行列値の重み付き和と積分を近似した混合状態を生成する。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 17:52:06 GMT)
A deep learning approach to track eye movements based on events [0.0] 本研究は、過去の研究を活用して、特定の事象の目の動きを正確に追跡することの課題に対処する。
我々の主な目的は、イベントカメラからの入力を用いて、アイセンターの位置(x, y)を特定することである。
我々の究極のゴールは、人間の注意を予測するためのディープラーニング手法を用いた解釈可能で費用対効果の高いアルゴリズムを開発することである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 19:12:42 GMT)
A class of 2x2 correlated random-matrix models with Brody spacing distribution [0.0] ブロディ分布が固有値間隔分布である2x2ランダム行列モデルのクラスを導入する。
ここで導入されたランダム行列は、ガウス直交アンサンブル(GOE)の3つの重要な方法で異なる。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 05:08:46 GMT)
A Visual Tool for Interactive Model Explanation using Sensitivity Analysis [0.0] 機械学習(ML)モデルの振る舞いを探索し理解するためのPythonベースのツールであるSAInTを提案する。
本システムはHuman-in-the-Loop属性(HITL)をサポートし,モデルの設定,トレーニング,評価,説明を可能にする。
本研究では,タイタニックデータセット上での生存を予測し,特徴選択とデータ改質をいかに誘導できるかを示す。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 09:53:31 GMT)
A Robust Pipeline for Differentially Private Federated Learning on Imbalanced Clinical Data using SMOTETomek and FedProx [0.0] Federated Learning (FL)は、共同健康研究のための画期的なアプローチである。
FLは、差分プライバシー(DP)と組み合わせて正式なセキュリティ保証を提供する
プライバシーユーティリティフロンティアで最適な運用領域が特定された。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 20:47:50 GMT)
A Reproducible, Scalable Pipeline for Synthesizing Autoregressive Model Literature [0.0] 自己回帰生成モデルは何千もの論文を生み出しており、手動による文献調査や再生研究はますます非現実的になっている。
パブリックリポジトリから候補文書を自動的に検索する,完全オープンソースで再現可能なパイプラインを提案する。
最大1000の論文のコーパスの実験では、8人のCPUワーカーによるほぼ直線的なスケーラビリティが実証されている。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 16:33:20 GMT)
A Relative Ignorability Framework for Decision-Relevant Observability in Control Theory and Reinforcement Learning [0.0] 因果推論パラダイムは、欠如の無知を形式化する。
相対的無知(Relative ignorability)は、正確な意思決定の要求を洗練させるグラフィカル・因果的基準である。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 15:51:18 GMT)
A Comparative Survey of PyTorch vs TensorFlow for Deep Learning: Usability, Performance, and Deployment Trade-offs [0.0] 我々は、PyTorchのグラフベースのアプローチとPyTorchの動的でPython的なスタイルを対比して、各フレームワークのプログラミングパラダイムと開発者エクスペリエンスをレビューする。
我々は、最近のベンチマークや研究に基づいて、複数のタスクやデータ構造におけるモデルトレーニング速度と推論性能を比較した。
以上の結果から,両フレームワークは最先端の深層学習に高い能力を持つが,トレードオフは明らかである。
論文参考訳(メタデータ) (Wed, 06 Aug 2025 02:55:57 GMT)