ScaleCap: Inference-Time Scalable Image Captioning via Dual-Modality Debiasing [128.8] 高品質画像キャプションの主な課題は、LVLMの固有のバイアスにある。
本稿では,キャプションを継続的に強化・校正し,推論予算を増大させる,スケーラブルなデバイアス付きキャプション戦略を提案する。
450KイメージにScaleCapをアノテートし、LVLMプレトレーニングに使用することで、11の広く使用されているベンチマークで一貫したパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:55 GMT)
Position: Intelligent Science Laboratory Requires the Integration of Cognitive and Embodied AI [98.2] 知的科学研究所(ISL)のパラダイムを提案する。
ISLは、認知と具体的知性を深く統合した多層クローズドループフレームワークである。
このようなシステムは、現在の科学的発見の限界を克服するために不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:31:44 GMT)
VideoMathQA: Benchmarking Mathematical Reasoning via Multimodal Understanding in Videos [89.4] VideoMathQAは、ビデオ上で時間的に拡張されたクロスモーダル推論を実行できるかどうかを評価するために設計されたベンチマークである。
ベンチマークは10種類の数学的領域にまたがっており、ビデオは10秒から1時間以上に及ぶ。
構造化された視覚的コンテンツを解釈し、指導的物語を理解し、視覚的、音声的、テキスト的モダリティにまたがる共同概念を理解するためのモデルが必要である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:36:56 GMT)
Orthogonal Finetuning Made Scalable [87.5] OFT(Orthogonal Finetuning)は、壊滅的な忘れ込みを防止しつつ、パラメータ効率の高い適応を提供するが、実行時とメモリの要求が高いため、実際のデプロイメントが制限される。
ここでは,OFTの計算ボトルネックを重み中心の実装とみなす。
本稿では,行列ベクトル乗法(行列フリー計算)を用いて,計算コストを2次に削減する入力中心の変換法OFTv2を提案する。
これらの修正により、OFTv2はパフォーマンスを損なうことなく、最大10倍高速なトレーニングと3倍のGPUメモリ使用率を達成することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:49 GMT)
Process Reward Models That Think [86.9] ステップバイステップ検証 - プロセス報酬モデル(PRM)としても知られる - は、テスト時間スケーリングの鍵となる要素である。
この研究は、検証チェーン・オブ・シント(CoT)を生成することにより、ソリューションのすべてのステップを検証する言語化されたステップワイド報酬モデルとして、データ効率の高いPRMを構築することを目的としている。
我々は差別的PRMよりもプロセスラベルを桁違いに少なめに微調整した長いCoT検証器ThinkPRMを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:05:02 GMT)
Unified Vision-Language-Action Model [86.7] 我々は、視覚、言語、行動信号を離散トークンシーケンスとして自動回帰モデル化する、統一的でネイティブなマルチモーダルVLAモデルUniVLAを提案する。
提案手法は, CALVIN, LIBERO, Simplenv-Bridge など, 広く使用されているシミュレーションベンチマークにまたがって, 最新の結果を設定する。
さらに、現実世界のALOHA操作と自律運転に適用可能であることを実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:57 GMT)
Progressive Cross-Stream Cooperation in Spatial and Temporal Domain for Action Localization [84.7] S時間的行動局所化は、空間的局所化、行動分類、時間的局所化の3つのレベルからなる。
上記の3つの課題をすべて改善する,新たなプログレッシブなクロスストリーム協調フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:03:17 GMT)
Can Large Language Models Capture Human Annotator Disagreements? [84.3] 大きな言語モデル(LLM)は、人間の労力を減らすために、自動アノテーションにますます使われています。
しかし、これらのモデルが有意な人間のアノテーションの変化も捉えているかどうかはまだ不明である。
我々の研究は、人間のラベルを繰り返すことなく注釈の不一致を予測するLLMの能力を広範囲に評価することで、このギャップに対処する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:49:26 GMT)
High precision PINNs in unbounded domains: application to singularity formulation in PDEs [83.5] ニューラルネットワークアンサッツの選択、サンプリング戦略、最適化アルゴリズムについて検討する。
1次元バーガース方程式の場合、我々のフレームワークは非常に高精度な解が得られる。
2D Boussinesq 方程式の場合、損失が 4$ の解は citewang2023asymsymptotic よりも小さく、トレーニングステップは少ない。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:01:44 GMT)
Machine-Learning-Assisted Photonic Device Development: A Multiscale Approach from Theory to Characterization [80.8] フォトニックデバイス開発(PDD)は、様々な波長、スケール、アプリケーションにまたがる光を制御する新しいデバイスの設計と実装において大きな成功を収めた。
PDDは、設計パラメータからデバイス動作を導出する、デバイス性能をシミュレーションする、最適なデバイスを製造する、デバイス性能を測定する、という5段階の反復的プロセスである。
PDDは、大規模な最適化の展望、構造的または光学的特徴の不確実性、堅牢な製造プロセスの実装の困難に悩まされている。
本稿では,機械学習支援型PDDの実現に向けて,これらの手法の総合的な展望を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:32:54 GMT)
Defeating Prompt Injections by Design [79.0] CaMeLは、Large Language Modelsを中心とした保護システムレイヤを作成する堅牢なディフェンスである。
CaMeLは、(信頼された)クエリから制御とデータフローを明示的に抽出する。
セキュリティをさらに改善するため、CaMeLは、権限のないデータフロー上のプライベートデータの流出を防止する機能の概念を使用している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:05:33 GMT)
Report on NSF Workshop on Science of Safe AI [76.0] 機械学習の新たな進歩は、社会問題に対する技術ベースのソリューションを開発する新たな機会につながっている。
AIの約束を果たすためには、正確でパフォーマンスが高く、安全で信頼性の高いAIベースのシステムを開発する方法に取り組む必要がある。
本報告はワークショップの安全性の異なる側面に対処した作業グループにおける議論の結果である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:55:29 GMT)
Radial Attention: $O(n\log n)$ Sparse Attention with Energy Decay for Long Video Generation [74.3] ラジアル注意(英: Radial Attention)は、エネルギー崩壊を指数関数的に減衰する計算密度に変換する、$O(n log n)$の複雑さを持つスケーラブルなスパース注意機構である。
Wan2.1-14B、HunyuanVideo、Mochi 1の動画品質を維持しており、オリジナルより1.9ドルのスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:59 GMT)
Self-Paced Collaborative and Adversarial Network for Unsupervised Domain Adaptation [74.3] 本稿では,CAN(Collaborative and Adversarial Network)と呼ばれる非教師付きドメイン適応手法を提案する。
CANは、ニューラルネットワークのトレーニングに、ドメイン協調学習戦略とドメイン共用学習戦略を使用する。
対象領域における識別性をさらに高めるために,SPCAN(Self-Paced CAN)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:58:37 GMT)
Analyzing LLMs' Knowledge Boundary Cognition Across Languages Through the Lens of Internal Representations [72.6] 本研究は,LLMが言語間の知識境界をどのように認識するかを解析するための最初の研究である。
1) LLM の知識境界に対する認識は, 言語間の中間層と中間層にコード化されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:24:15 GMT)
Bind-Your-Avatar: Multi-Talking-Character Video Generation with Dynamic 3D-mask-based Embedding Router [72.3] MM-DiTベースのモデルであるBind-Your-Avatarを紹介した。
具体的には,音とキャラクタの対応制御に対処するために,誰が誰と何を話し合うのかを結合する,きめ細かい埋め込みルータを組み込んだ新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:50:16 GMT)
Progressive Modality Cooperation for Multi-Modality Domain Adaptation [70.3] 我々は,PMC(Progressive Modality Cooperation)と呼ばれる汎用多モードドメイン適応フレームワークを提案する。
MMDA設定の下では、両方のドメインのサンプルはすべてのモダリティを持つ。
MMDA-PI設定では、ターゲットドメインにいくつかのモダリティが欠落している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:13:56 GMT)
SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented Dialogue Agents [70.1] SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:06:57 GMT)
Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons [69.7] 本稿では、共振器(RF)ニューロンを用いて時間領域信号を直接処理する無線スプリットコンピューティングアーキテクチャについて検討する。
可変周波数で共鳴することにより、RFニューロンは低スパイク活性を維持しながら時間局在スペクトル特徴を抽出する。
実験の結果,提案したRF-SNNアーキテクチャは従来のLIF-SNNやANNと同等の精度を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:14:59 GMT)
Emergence of Text Readability in Vision Language Models [69.1] VLM(Vision-Language Models)のトレーニング中に画像内のテキストコンテンツを認識する能力がどのように現れるかを検討する。
画像中のテキスト情報を読み取る能力は、かなりの訓練を繰り返した後、突然現れる。
この遅延は、コントラスト学習が最初に一般的な意味理解を優先し、後にテキスト固有の記号処理が発達する傾向を反映している可能性がある。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:35:32 GMT)
AlignGuard: Scalable Safety Alignment for Text-to-Image Generation [68.1] Text-to-image (T2I) モデルは広く使われているが、その限られた安全ガードレールはエンドユーザを有害なコンテンツに晒し、モデル誤用を許容する可能性がある。
本稿では,T2Iモデルの安全アライメント手法であるAlignGuardを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:53:27 GMT)
CronusVLA: Transferring Latent Motion Across Time for Multi-Frame Prediction in Manipulation [67.2] CronusVLAはシングルフレームのVLAモデルを効率的な後トレーニング段階を通じてマルチフレームのパラダイムに拡張する統合フレームワークである。
CronusVLAはSimplerEnvの最先端のパフォーマンスを70.9%の成功率で達成し、LIBEROのOpenVLAよりも12.7%改善した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:30:27 GMT)
Controllable diffusion-based generation for multi-channel biological data [66.4] 本研究では, 構造的および空間的生物学的データに対する制御可能生成のための統合拡散フレームワークを提案する。
空間的および非空間的予測タスクにまたがって,IMCにおけるタンパク質のインパルス化や単一セルデータセットにおける遺伝子対タンパク質の予測など,最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:56:21 GMT)
Any-Order GPT as Masked Diffusion Model: Decoupling Formulation and Architecture [65.9] 自己回帰(AR)モデルの代替として、仮面拡散モデル(MDM)が登場している。
ARモデルはデコーダのみであることが多いが、MDMはエンコーダのみである。
本研究は,デコーダのみのフレームワークにおけるMDMを評価した。
MDM内でアーキテクチャの影響(デコーダのみ対エンコーダのみ)を調査する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:22:25 GMT)
SA-Solver: Stochastic Adams Solver for Fast Sampling of Diffusion Models [63.5] 拡散確率モデル(DPM)は生成タスクでかなりの成功を収めた。
DPM からのサンプリングは、時間を要する拡散 SDE や ODE の解法と等価であるため、改良された微分方程式解法に基づく多数の高速サンプリング手法が提案されている。
SDEを解き、高品質なデータを生成するための効率的な方法である textitSA-r を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:47:02 GMT)
CoCo4D: Comprehensive and Complex 4D Scene Generation [61.3] 既存の4D合成法は主に、限られた新しい視点でオブジェクトレベルの生成や動的シーン合成に重点を置いている。
テキストプロンプトから詳細な動的4Dシーンを生成するためのフレームワーク(CoCo4D)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:05:44 GMT)
ObjCtrl-2.5D: Training-free Object Control with Camera Poses [61.2] 本研究の目的は、画像間(I2V)生成において、より正確で多目的なオブジェクト制御を実現することである。
深度情報を持つ2次元軌道から拡張した3次元軌道を用いた学習不要物体制御手法であるCtrl-2.5Dを制御信号として提案する。
実験により、Ctrl-2.5Dはトレーニング不要の手法と比較して、オブジェクト制御の精度を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:19:15 GMT)
A Survey of LLM-Driven AI Agent Communication: Protocols, Security Risks, and Defense Countermeasures [60.5] 大規模言語モデル駆動型AIエージェントは、前例のない知性、柔軟性、適応性を示している。
エージェントコミュニケーションは、未来のAIエコシステムの基礎的な柱と見なされている。
本稿では,エージェント通信セキュリティに関する包括的調査を行う。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:44:28 GMT)
A Survey of Multi-sensor Fusion Perception for Embodied AI: Background, Methods, Challenges and Prospects [60.3] マルチセンサー融合知覚(MSFP)は、AIを具現化するための重要な技術である。
AIベースのMSFP手法に関する最近の成果は、関連する調査でレビューされている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:34:56 GMT)
HoliGS: Holistic Gaussian Splatting for Embodied View Synthesis [59.3] 本稿では,長い単眼RGBビデオのエンボディドビュー合成に対処する,変形可能なガウススプラッティングフレームワークを提案する。
提案手法は,非可逆ガウス散乱変形ネットワークを利用して大規模動的環境を正確に再構築する。
その結果、現実のシナリオにおけるEVSの実用的でスケーラブルなソリューションが浮かび上がっています。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:54:40 GMT)
Controlled Retrieval-augmented Context Evaluation for Long-form RAG [58.1] Retrieval-augmented Generation (RAG)は、外部知識ソースから取得したコンテキストを組み込むことで、大規模言語モデルを強化する。
我々は、レポート生成のような長期RAGタスクにおいて、包括的な検索強化コンテキストを提供することが重要であると論じる。
本稿では,検索拡張コンテキストを直接評価するフレームワークであるCRUXを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:17:48 GMT)
MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [58.0] マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。
我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。
このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:52:43 GMT)
Light of Normals: Unified Feature Representation for Universal Photometric Stereo [57.4] ユニバーサル測光ステレオ(英語版) (PS) は、任意の照明条件下で物体から高品質な表面の正常を回復することを目的としている。
2つの基本的な課題は、1) 様々な照明と表面の通常の特徴の深い結合、2) 複素曲面における高周波幾何学的詳細の保存である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:34:59 GMT)
Unsupervised Data Generation for Offline Reinforcement Learning: A Perspective from Model [57.2] オフライン強化学習(RL)は、最近RL研究者から関心が高まりつつある。
オフラインRLの性能は、オンラインRLのフィードバックによって修正できる配布外問題に悩まされる。
本稿では、まず、バッチデータとオフラインRLアルゴリズムの性能を理論的に橋渡しする。
タスクに依存しない環境では、教師なしのRLによって訓練された一連のポリシーは、パフォーマンスギャップにおける最悪の後悔を最小限に抑えることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:08:36 GMT)
Machine Learning with Privacy for Protected Attributes [56.4] 差分プライバシー(DP)の定義を洗練し、機能差分プライバシー(FDP)と呼ばれるより汎用的で柔軟なフレームワークを作成する。
私たちの定義はシミュレーションに基づいており、プライバシの追加/削除と置き換えの両方が可能で、保護された機能と非保護された機能の任意の分離を処理できます。
各種機械学習タスクにフレームワークを適用し,パブリック機能が利用可能であればDP学習モデルの実用性を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:53:28 GMT)
FOCoOp: Enhancing Out-of-Distribution Robustness in Federated Prompt Learning for Vision-Language Models [56.3] ビジョン言語モデルのためのフェデレーション・プロンプト・ラーニング(FPL)は、分散クライアント間でモデルを協調的に適応するための強力なアプローチである。
既存のFPLアプローチは、特にアウト・オブ・ディストリビューション(OOD)シフトにおいて、パフォーマンスと堅牢性の間のトレードオフに悩まされる。
我々は、クライアント間の多様な分散をキャプチャするFederated OOD-aware Context Optimization (FOCoOp)フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:51:04 GMT)
SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution [55.1] 後続の超解像モデルの設計原理について検討し,その設計原理について検討する。
まず、ベースモデルの出力特性をよりよく模倣し、VSRモデルと上流ジェネレータとの整合性を確保するための2つのトレーニングペアを生成する方法を提案する。
第2に,(1)時間ステップサンプリング戦略,(2)低分解能(LR)入力に対する雑音増強効果の系統的解析を通じて,VSRモデル行動に対する批判的洞察を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:57:26 GMT)
Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study [55.1] データ理解、コード生成、戦略的計画という3つの側面にわたるモデルを評価します。
我々はこれらの知見を活用してデータ合成手法を開発し、オープンソースのLCMの分析的推論能力の大幅な改善を実証した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:04:23 GMT)
Hadamard Attention Recurrent Transformer: A Strong Baseline for Stereo Matching Transformer [55.0] Adamard Attention Recurrent Stereo Transformer(HART)について紹介する。
HARTには、以下のコンポーネントを組み込んだ新しいアテンションメカニズムが含まれている。
反映的な領域では、HARTはKITTI 2012ベンチマークで1位にランクインした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:41:44 GMT)
In-Context Learning for Gradient-Free Receiver Adaptation: Principles, Applications, and Theory [54.9] ディープラーニングベースの無線受信機は、様々なチャネル環境に動的に適応する能力を提供する。
ジョイントトレーニング、ハイパーネットワークベースの手法、メタラーニングを含む現在の適応戦略は、限られた柔軟性を示すか、勾配降下による明示的な最適化を必要とする。
本稿では、インコンテキスト学習(ICL)の新たなパラダイムに根ざした勾配なし適応手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:30:14 GMT)
MIFNet: Learning Modality-Invariant Features for Generalizable Multimodal Image Matching [54.7] キーポイントの検出と記述方法は、しばしばマルチモーダルデータと競合する。
マルチモーダル画像マッチングにおけるキーポイント記述に対するモダリティ不変特徴量を計算するためのモダリティ不変特徴量学習ネットワーク(MIFNet)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:14:38 GMT)
Holmes: Towards Effective and Harmless Model Ownership Verification to Personalized Large Vision Models via Decoupling Common Features [54.6] 本稿では、類似の共通特徴を分離し、パーソナライズされたモデルに対する無害モデルオーナシップ検証手法を提案する。
最初の段階では、データセット固有の機能を中断しながら、犠牲者モデルの共通の特徴を保持するシャドウモデルを作成します。
その後、メタ分類器が訓練され、被害者のデータセット固有の特徴を含む不審なモデルを決定することで、盗まれたモデルを特定する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:40:11 GMT)
Training-Free Motion Customization for Distilled Video Generators with Adaptive Test-Time Distillation [53.9] 蒸留ビデオ生成モデルは、高速で効率的なが、参照ビデオによってガイドされるときの動きのカスタマイズに苦労する。
拡散教師の強制力を活用して運動のカスタマイズを可能にする訓練不要な試験時間蒸留フレームワークであるMotionEchoを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:20:15 GMT)
NeRF-based CBCT Reconstruction needs Normalization and Initialization [53.6] NeRFベースの手法は、ハッシュエンコーダとニューラルネットワークという2つの主要なコンポーネント間の局所的な訓練ミスマッチに悩まされる。
特徴整合性を高め、ミスマッチを緩和する正規化ハッシュを導入する。
ニューラルネットワークは早期トレーニング中に安定性が向上し、より高速な収束と再構築性能が向上する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:01:45 GMT)
Towards Robust Stability Prediction in Smart Grids: GAN-based Approach under Data Constraints and Adversarial Challenges [53.2] 本稿では,安定したデータのみを用いて,スマートグリッドの不安定性を検出する新しいフレームワークを提案する。
最大98.1%の精度でグリッド安定性を予測でき、98.9%で敵の攻撃を検知できる。
シングルボードコンピュータ上で実装され、7ms以下の平均応答時間でリアルタイムな意思決定を可能にする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:10:26 GMT)
ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation [53.1] 大規模推論モデル(LRM)の最近の進歩は、チェーン・オブ・ソート(CoT)による生成長のスケールアップにより、複雑な推論タスクにおける顕著な性能向上を実現している。
本稿では,推論過程のトークン生成中にテキストヒントを注入することにより,推論モデルに簡潔な発話を促すフレームワークであるConciseHintを提案する。
DeepSeek-R1 や Qwen-3 シリーズを含む最先端の LRM 実験により,本手法は性能を良好に保ちながら簡潔な推論過程を効果的に生成できることが実証された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:08:33 GMT)
GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation [52.9] モデルフリーなカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴリ内の様々なインスタンスにまたがって一般化されるコンテキストオブジェクトの特徴の抽出である。
GCE-Poseは、カテゴリレベルのグローバルコンテキストを予め統合することにより、新規インスタンスのポーズ推定を強化する手法である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:02:34 GMT)
Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting [52.7] Eucidated Rolling Diffusion Models (ERDM)を紹介する。
ERDMはEucidated Diffusion Models (EDM) の原理的, 性能的設計とローリング予測構造を統一する最初のフレームワークである
2D Navier-StokesシミュレーションとERA5グローバル気象予報の1.5円解像度では、ERDMはキー拡散ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:44:31 GMT)
ManiGaussian++: General Robotic Bimanual Manipulation with Hierarchical Gaussian World Model [52.0] 本稿では,階層的世界モデルを用いてマルチタスクシーンのダイナミックスを消化することにより,双方向操作を改善するManiGaussianフレームワークの拡張を提案する。
提案手法は,シミュレーションタスク10件で20.2%,実世界の課題9件で平均60%の成功率で,最先端のバイマニュアル操作技術よりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:06 GMT)
Decompiling Smart Contracts with a Large Language Model [51.5] Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。
この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。
バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:42:59 GMT)
Segment Any 3D-Part in a Scene from a Sentence [50.5] 本稿では,自然言語記述に基づくシーン内の任意の3次元部分のセグメンテーションを実現することを目的とする。
本稿では,高密度部分アノテーションを用いた最初の大規模3Dデータセットである3D-PUデータセットを紹介する。
手法面では,パートレベルセグメンテーションの課題に対処する3DインプットのみのフレームワークであるOpenPart3Dを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:51:22 GMT)
Distributing entanglement at the quantum speed limit in Rydberg chains [49.2] 我々は、中性原子の鎖におけるリドベルク励起の輸送を数値的に研究する。
オフ共鳴駆動場を用いた効果的なフリップフロップ相互作用を実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:26:09 GMT)
From Reproduction to Replication: Evaluating Research Agents with Progressive Code Masking [48.9] AutoExperimentは、AIエージェントの機械学習実験の実装と実行能力を評価するベンチマークである。
我々は最先端のエージェントを評価し、n$が増加するにつれて性能が急速に低下することを発見した。
本研究は、長期コード生成、文脈検索、自律的な実験実行における重要な課題を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:39:20 GMT)
HeNCler: Node Clustering in Heterophilous Graphs via Learned Asymmetric Similarity [48.6] HeNClerは、重み付けされたカーネル特異値分解に基づいてクラスタリング固有の目的を最適化することで類似性グラフを学習する。
提案手法は,非対称類似グラフ上でのスペクトルクラスタリングを可能にし,有向グラフと無向グラフの両方に柔軟性を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:34:05 GMT)
Language Model Re-rankers are Fooled by Lexical Similarities [48.1] 言語モデル(LM)リランカは、検索強化世代(RAG)の検索結果を洗練するために使用される。
NQ, LitQA2, DRUIDデータセット上で, 6種類のLM再ランカを評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:03:01 GMT)
Tree-based variational inference for Poisson log-normal models [47.8] 階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:54:09 GMT)
A Spatio-Temporal Point Process for Fine-Grained Modeling of Reading Behavior [47.5] 心理言語学のアンサッツは、読者の固定とケードをモデル化することで、オンラインの文処理に関する洞察が得られるということである。
このようなモデリングの標準的なアプローチは、強い仮定を課す、集約された視線追跡測定とモデルに依存している。
本稿では,より一般的な読解行動の確率的モデルを提案する。
ササードはホークスプロセスを用いてモデル化され、それぞれの固定が時間と空間で新しい固定が生じる確率をとらえる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:39:21 GMT)
Is an object-centric representation beneficial for robotic manipulation ? [45.8] オブジェクト中心表現(OCR)は近年,画像やビデオの構造的表現の学習において,コンピュータビジョンコミュニティにおける関心の対象となっている。
複数の一般化シナリオにまたがって1つの古典的対象中心法を評価し、その結果をいくつかの最先端のホリスティック表現と比較する。
以上の結果から,既存の手法は複雑なシーン構造を含む難解なシナリオでは失敗しがちであるが,オブジェクト指向手法はこれらの課題を克服するのに役立つことがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:23:55 GMT)
Decoherence and fidelity enhancement during shuttling of entangled spin qubits [45.1] シャトルスピンに作用するノイズは複雑で異常な相関を示す。
これらの相関は、シャットリングの忠実度を高めるためにも利用することができる。
2つの連続的に回転する絡み合ったスピンの状態で論理量子ビットを符号化することにより、非常に遅いシャットリングであっても高い忠実性が得られることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:37:39 GMT)
MATE: LLM-Powered Multi-Agent Translation Environment for Accessibility Applications [45.0] マルチモーダルアクセシビリティMASであるMATEは、ユーザのニーズに基づいてモダリティ変換を行う。
MATEは、医療など幅広い分野、産業、分野に適用することができる。
ModCon-Task-Identifierは、ユーザ入力から正確なモダリティ変換タスクを抽出できるモデルである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:40:23 GMT)
Hierarchical Time Series Forecasting Via Latent Mean Encoding [45.0] 複数のビジネスアプリケーションにおいて、粗大かつ微妙な時間スケールで目標変数の振る舞いをコヒーレントに予測することは、利益を最適化した意思決定に不可欠である。
本稿では,異なる時間的アグリゲーションレベルを予測するモジュールを活用することで,この問題に対処する新しい階層アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:54:47 GMT)
SceneCrafter: Controllable Multi-View Driving Scene Editing [44.9] SceneCrafterは、複数のカメラから撮影した運転シーンをリアルな3D一貫性で操作するための汎用的なエディタである。
SceneCrafterは、既存のベースラインと比較して最先端のリアリズム、制御性、3D一貫性、シーン編集品質を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:23:47 GMT)
Towards Unsupervised Multi-Agent Reinforcement Learning via Task-Agnostic Exploration [44.6] 実践的な設定でこの問題に対処するために,スケーラブルで分散化された信頼領域ポリシー探索アルゴリズムを提案する。
本研究では,特定の目的,すなわち混合エントロピーの最適化が,トラクタビリティと性能のトレードオフに優れたものであることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:08:29 GMT)
Training Flexible Models of Genetic Variant Effects from Functional Annotations using Accelerated Linear Algebra [44.3] 提案手法は,大規模ニューラルネットワーク予測モデルを用いてオプティマイザを最適化するDeepWASを開発するための手法である。
より多くの機能でトレーニングされたより大きなモデルは、より良い予測をし、病気の予測を改善し、治療対象の識別を改善する可能性がある。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:07:45 GMT)
Operator Forces For Coarse-Grained Molecular Dynamics [44.1] 機械学習型粗粒化法(MLCG)は、CG分子動力学のための高精度な力場を構築するための有望なアプローチとして登場した。
フローベースカーネルは,構成サンプルのみから高品質なCG力を生成可能であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:51:20 GMT)
Robust Optimization with Diffusion Models for Green Security [43.6] グリーンセキュリティでは、効果的パトロールを計画するためには、密猟、違法伐採、違法漁などの敵の行動を予測する必要がある。
本稿では,その強い分布適合性を利用した逆挙動モデリングのための条件付き拡散モデルを提案する。
混合戦略の混合戦略を導入し, 正確なサンプリングを行うために, ツイスト型シークエンシャルモンテカルロ (SMC) サンプリング装置を用いる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:13:40 GMT)
Temporal Differential Fields for 4D Motion Modeling via Image-to-Video Synthesis [43.5] 既存の方法は、開始フレームと終了フレームを含む高線量イメージングスキャンが同時に存在する限り、時間運動をシミュレートすることはできない。
我々は,第1フレームと相似して所定の長さの将来のフレームを予測する画像・ビデオ・フレームワークを用いて,通常の動作過程を先駆的にシミュレートする。
本手法は,知覚的類似性や時間的整合性に関する他の競合手法に対抗して,内在性運動軌跡に沿って4次元映像をシミュレートする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:43:16 GMT)
KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality [43.3] 大規模言語モデル(LLM)は、しばしば、推論中に知識境界を正確に認識できないために、誤ったコンテンツを出力する、厳しい幻覚を示す。
スロー思考モデルにおける高い幻覚に対処するために,知識強化RL(KnowRL)を提案する。
KnowRLは、知識検証に基づいて事実性報酬をRLトレーニングプロセスに統合することにより、事実に基づくスロー思考を行うモデルを支援する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:17:17 GMT)
Has Machine Translation Evaluation Achieved Human Parity? The Human Reference and the Limits of Progress [43.1] 機械翻訳(MT)評価では、人的判断との一致に基づいて計量性能を評価する。
我々はMTメタ評価,すなわちMTメトリクスの能力の評価に,人間のベースラインを取り入れた。
以上の結果から,ヒトのアノテータは自動測定値よりも一貫して優れていないことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:35:00 GMT)
MDeRainNet: An Efficient Macro-pixel Image Rain Removal Network [42.7] 我々は,LF画像から降雨ストリーク除去を行うために,MDeRainNetと呼ばれる効率的なネットワークを提案する。
提案するネットワークはマルチスケールエンコーダデコーダアーキテクチャを採用し, 直接マクロピクセル画像(MPI)を用いて降雨除去性能を向上する。
そこで本研究では,MDeRainNetのための新しい半教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:32:40 GMT)
A collaborative digital twin built on FAIR data and compute infrastructure [41.9] 本研究は,nanoHUBサービス上に構築された分散SDL実装をオンラインシミュレーションとFAIRデータ管理のために提案する。
研究者と学生は、独自の実験をセットアップし、協力者とデータを共有し、FAIRデータ、予測MLモデル、シーケンシャルな最適化の組み合わせを探索することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:13:52 GMT)
CoVE: Compressed Vocabulary Expansion Makes Better LLM-based Recommender Systems [41.5] 圧縮語彙拡張(CoVE)と呼ばれる新しいシステムを提案する。
CoVEでは、各項目には拡張語彙内のユニークなIDが割り当てられる。
CoVEは大規模産業用途で実用化されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:27:51 GMT)
Enhancing Diversity in Parallel Agents: A Maximum State Entropy Exploration Story [40.8] 並列環境で収集したデータのエントロピーを最大化する新しい学習フレームワークを提案する。
提案手法は,個々のエージェントとエージェント間の多様性のエントロピーを慎重にバランスさせ,冗長性を効果的に最小化する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:24:23 GMT)
Global and Local Contrastive Learning for Joint Representations from Cardiac MRI and ECG [40.4] PTACL(Patient and Temporal Alignment Contrastive Learning)は、CMRからの時間情報を統合することで、ECG表現を強化するマルチモーダルコントラスト学習フレームワークである。
英国バイオバンクの被験者27,951名を対象に,ペア心電図-CMRデータを用いたPTACLの評価を行った。
心電図を用いた非侵襲的心臓診断におけるPTACLの有用性について検討した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:19:39 GMT)
Systematic Review of Pituitary Gland and Pituitary Adenoma Automatic Segmentation Techniques in Magnetic Resonance Imaging [40.2] 自動・半自動セグメンテーション法を応用した34種類の研究をレビューした。
レビューされた研究の大半はディープラーニングのアプローチを利用しており、U-Netベースのモデルが最も普及している。
正常下垂体腺のような小さな構造において、一貫して良好な性能を達成するためには、さらなる改善が必要である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:05:01 GMT)
Time-resolved spectral diffusion of a multimode mechanical memory [39.6] 高周波フォノンは、チップ上の量子情報のキャリアとして、および量子メモリとして、非常に有望である。
この2つのモードの周波数位置は,理論モデルやモンテカルロシミュレーションと一致して時間的に相関しないことを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:23:45 GMT)
Q2SAR: A Quantum Multiple Kernel Learning Approach for Drug Discovery [39.6] 本研究は、QSAR分類を強化するために、量子多重カーネル学習フレームワークを成功させたことを実証する。
本手法をDYRK1Aキナーゼ阻害剤を同定するためのデータセットに適用する。
古典的なグラディエントブースティングモデルに対してQMKL-SVMをベンチマークすることにより、量子化アプローチがより優れたAUCスコアを達成することを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:57:50 GMT)
UltraAD: Fine-Grained Ultrasound Anomaly Classification via Few-Shot CLIP Adaptation [39.5] 視覚言語モデル(VLM)に基づく,異常な局所化ときめ細かい分類のためのアプローチであるUltraADを提案する。
UltraADは乳房の3つのデータセットで広く評価されており、病変のデータセットと微細な医学的分類の両方において最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:00:38 GMT)
LEVOS: Leveraging Vocabulary Overlap with Sanskrit to Generate Technical Lexicons in Indian Languages [39.1] 技術的用語の言語情報翻訳のためのサンスクリットに基づくセグメントの新規な利用法を提案する。
提案手法では,意味のあるサブワード単位の識別に文字レベルセグメンテーションを用いる。
我々はサンスクリットから派生したセグメントを用いた技術用語翻訳のための2つの実験的な設定における一貫した改善を観察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:06:32 GMT)
Cross-Level Multi-Instance Distillation for Self-Supervised Fine-Grained Visual Categorization [39.0] 本稿では,粒度の細かいプレテキスト表現の課題を解決するために,クロスレベルマルチインスタンス蒸留(CMD)フレームワークを提案する。
私たちのキーとなる考え方は、複数のインスタンス学習による微細なプレテキスト表現の決定において、各イメージパッチの重要性を検討することです。
提案手法は,最新の手法を10.14%,既存の最先端の自己教師型学習手法を19.78%,トップ1精度とランク1検索基準の両方で上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:17:42 GMT)
Semantic Scene Graph for Ultrasound Image Explanation and Scanning Guidance [38.9] 本研究では,超音波画像のシーングラフ(SG)を用いて画像内容の説明を行う。
予測されたSGは、超音波スキャンを行方不明の解剖に導く可能性を探っている。
左頸部領域と右頸部領域の画像に対して,SGによる画像説明とスキャン指導の有効性が検証された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:49:40 GMT)
Distillation-Enabled Knowledge Alignment for Generative Semantic Communications in AIGC Provisioning Tasks [38.5] ジェネレーティブ・セマンティック・コミュニケーション(GSC)は、高度にコンパクトな情報を伝達することで有望なソリューションを提供する。
GSCは、クラウド生成AI(GAI)の知識と、エッジとユーザが所有する知識の整合性に依存している。
GSCシステムのための蒸留可能な知識アライメントアルゴリズムであるDeKA-gを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:50:14 GMT)
Learning Instruction-Following Policies through Open-Ended Instruction Relabeling with Large Language Models [37.7] 本稿では,これまで収集したエージェントの軌跡を振り返ってオープンエンド命令を自動生成する手法を提案する。
我々の中核的な考え方は、エージェントが暗黙的に達成した意味のあるサブタスクを識別することで、LLMを用いて、軌道変更の失敗を回避することである。
我々は,本提案手法を課題であるCraftax環境において実証的に評価し,サンプル効率,命令カバレッジ,全体的な政策性能の明確な改善を実証した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:49:28 GMT)
FusionSAM: Visual Multi-Modal Learning with Segment Anything [37.6] 本稿では,Segment Anything Model (SAM) をマルチモーダル画像セグメンテーションに導入する。
本稿では,LSTG(Latent Space Token Generation)とFMP(Fusion Mask Prompting)モジュールを組み合わせた新しいフレームワークを提案する。
本手法は,マルチモーダル自動運転シナリオにおいてSAMとSAM2を著しく上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:21:13 GMT)
Alleviating User-Sensitive bias with Fair Generative Sequential Recommendation Model [37.5] 新しい生成モデルパラダイムとしての拡散モデル(DM)はレコメンデーションシステムにおいて大きな成功を収めた。
本稿では,FairGENRecに基づくFairGENerative Sequence Recommendationモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:42:46 GMT)
Referring Expression Instance Retrieval and A Strong End-to-End Baseline [37.5] 現実世界のシナリオは、大きなギャラリーをまたいだインスタンスレベルの検索とローカライゼーションの両方を必要とすることが多い。
本稿では,インスタンスレベルの検索とローカライゼーションを共同でサポートするReferring Expression Instance Retrieval (REIR)を提案する。
本稿では,MSCOCOインスタンスとRefCOCOインスタンスの微細な表現を生成するために,視覚言語モデルによって構築された大規模ベンチマークであるREIRCOCOを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:38:39 GMT)
Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models [35.9] Open-Vocabulary Camouflaged Objectは、任意のカテゴリからカモフラージュされたオブジェクトを分類し分類しようとする。
最近のアプローチでは一般的に2段階のパラダイムが採用されている。
本稿では,OVCOSにおけるこれらの問題に対処する新しいVLM誘導型ケースドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:16:41 GMT)
T-Rex: Task-Adaptive Spatial Representation Extraction for Robotic Manipulation with Vision-Language Models [35.8] 本稿では,空間表現抽出のためのタスク適応フレームワークであるT-Rexを紹介する。
我々は, 空間的理解, 効率, 安定性において, 付加的な訓練を伴わずに大きな優位性をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:36:15 GMT)
FrankenBot: Brain-Morphic Modular Orchestration for Robotic Manipulation with Vision-Language Models [35.8] VLM(Vision-Language Models)は豊かな世界知識を獲得し、例外的なシーン理解とマルチモーダル推論能力を示している。
本稿では,VLM駆動型脳型ロボット操作フレームワークであるFrankenBotを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:11:22 GMT)
AntiGrounding: Lifting Robotic Actions into VLM Representation Space for Decision Making [35.8] AntiGroundingは、命令のグラウンディングプロセスをリバースする新しいフレームワークである。
候補アクションをVLM表現空間に直接持ち上げる。
複数のビューからトラジェクトリを描画し、命令ベースの意思決定に構造化された視覚的質問応答を使用する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:01:18 GMT)
Meta-Reasoner: Dynamic Guidance for Optimized Inference-time Reasoning in Large Language Models [35.8] 大規模言語モデルは、複雑なタスクを解決するために、より長い推論チェーンに依存している。
この試行錯誤アプローチは、しばしば高い計算オーバーヘッドとエラーの伝播をもたらす。
推論時間推論を動的に最適化するフレームワークであるMeta-Reasonerを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:27:42 GMT)
Right Is Not Enough: The Pitfalls of Outcome Supervision in Training LLMs for Math Reasoning [35.1] 細粒度アノテーションを持つ新しいデータセットであるMathOlympiadEvalを導入し、LLMの回答の正しさとプロセスの正しさの間に大きなギャップがあることを明らかにした。
LLM-as-a-judgeのような既存の自動化手法は、これらの推論の欠陥を確実に検出するのに苦労する。
そこで我々はParaStepVerifierを提案する。ParaStepVerifierは数学的解の厳密なステップバイステップ検証のための新しい手法である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:55:38 GMT)
Towards Better Benchmark Datasets for Inductive Knowledge Graph Completion [34.6] 帰納的知識グラフ補完(KGC)は、知識グラフ(KG)における行方不明事実の予測を試みる
インダクティブなKGCデータセットを構築するための現在の手順は、必然的に、利用可能なショートカットを生成します。
我々は、ショートカットを緩和するのに役立つ、誘導的KGCデータセットを構築するための代替戦略を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:16:19 GMT)
ConStellaration: A dataset of QI-like stellarator plasma boundaries and optimization benchmarks [34.5] 種々のQI様ステラレータプラズマ境界形状と理想的な磁気流体力学(MHD)平衡のオープンデータセットを公表した。
すべてのベンチマークに対して、古典的な最適化手法に基づいた参照コード、評価スクリプト、強力なベースラインを提供します。
データセットでトレーニングされた学習モデルが、新しく実現可能な構成を効率的に生成する方法を示します。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:49:00 GMT)
Stepping Out of Similar Semantic Space for Open-Vocabulary Segmentation [34.0] Open-vocabulary segmentationは、無制限テキスト入力をガイダンスとして与えられた任意のカテゴリのセグメンテーションを実現することを目的としている。
トレーニングセマンティクスとは大きく異なるOpenBenchという新しいベンチマークを提示する。
また,多様なオープンシナリオに対するセグメンテーション性能を改善するため,OVSNetという手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:11:42 GMT)
MuBench: Assessment of Multilingual Capabilities of Large Language Models Across 61 Languages [33.5] MuBenchは61の言語をカバーし、幅広い機能を評価するベンチマークです。
我々は、最先端の多言語LLMを評価し、請求項と実際の言語カバレッジとの間に顕著なギャップを見いだした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:53:00 GMT)
FAF: A Feature-Adaptive Framework for Few-Shot Time Series Forecasting [33.2] FAF(Feature-Adaptive Time Series Forecasting Framework)を提案する。
FAFは、GKM(Generalized Knowledge Module)、TSM(Task-Specific Module)、RM( Rank Module)の3つの重要なコンポーネントで構成されている。
実世界の5つの異なる実世界のFAFを,数ショットの時系列予測設定で評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:28:38 GMT)
AdaDeDup: Adaptive Hybrid Data Pruning for Efficient Large-Scale Object Detection Training [33.0] 我々は、密度に基づくプルーニングとモデルインフォームドフィードバックをクラスタ適応的に統合する新しいフレームワークであるAdaptive De-Duplication (AdaDeDup)を紹介した。
これは、顕著なベースラインを著しく上回り、性能劣化を著しく低減し、20%のデータを刈り取りながら、ほぼオリジナルに近いモデル性能を達成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:35:51 GMT)
Privacy-Shielded Image Compression: Defending Against Exploitation from Vision-Language Pretrained Models [32.9] 本稿では,画像圧縮段階での防御によりユーザのプライバシを保護し,悪用を防止することを目的とする。
本稿では,複数のデコードオプションでビットストリームを生成する,PSIC(Privacy-Shielded Image Compression)と呼ばれるフレキシブルな符号化手法を提案する。
提案手法はプラグアンドプレイであり,既存のLearned Image Compression(lic)モデルにシームレスに統合可能である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:52:22 GMT)
Low-Complexity Semantic Packet Aggregation for Token Communication via Lookahead Search [32.6] 本稿では,トークンのパケット化に着目し,平均トークン類似度(ATS)を最大化する。
これを解決するために,ルックアヘッド検索(SemPA-Look)を用いたセマンティックアグリゲーションの新しいフレームワークを提案する。
SemPA-Lookは、リプレースせずにパケット内のトークン候補をサンプリングするルックアヘッド検索インスパイアされたアルゴリズムを適用している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:25:44 GMT)
Aligning Anime Video Generation with Human Feedback [31.7] アニメビデオ生成は、アニメデータの不足と異常な動きパターンのために大きな課題に直面している。
既存の報酬モデルは、主に現実世界のビデオ用に設計されており、アニメのユニークな外観と一貫性の要求を捉えていない。
そこで本研究では,人間のフィードバックを有効活用して,アニメ映像生成を向上するためのパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:54:57 GMT)
Position: Machine Learning Conferences Should Establish a "Refutations and Critiques" Track [31.6] 機械学習のカンファレンスは、専用の“反感と批判”トラックを確立するべきだ、と私たちは主張する。
このトラックは、先行研究に重大な挑戦をする重要な研究を支援するために、注目に値するプラットフォームを提供する。
MLのカンファレンスは、ML研究の自己修正を支援する公式で信頼性の高いメカニズムを作成するべきだ、と私たちは結論付けています。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:19:30 GMT)
Augmenting Multi-Agent Communication with State Delta Trajectory [31.1] 本稿では,自然言語トークンとトークンワイド状態遷移トラジェクトリの両方をひとつのエージェントから別のエージェントに転送する新しい通信プロトコルを提案する。
それぞれのトークンを生成した後のLSMの状態変化のシーケンスは、推論プロセスの裏側に隠された情報をよりよく反映できることがわかった。
実験の結果,SDEを用いたマルチエージェントシステムでは,他の通信プロトコルと比較してSOTAの性能が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:38:25 GMT)
ConCM: Consistency-Driven Calibration and Matching for Few-Shot Class-Incremental Learning [30.9] FSCIL(Few-Shot Class-Incremental Learning)は、学習知識を維持しながら、限られた監督力を持つ新しいクラスに適応するモデルを必要とする。
本稿では,FSCIL固有の知識衝突を系統的に軽減する一貫性駆動型幾何マッチングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:12:50 GMT)
ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis [30.8] Sparse Position and Outline Tracking (SPOT) は、視覚データにおける不規則な形状の領域を処理するために設計された新しいアルゴリズムである。
SPOTは、空間座標を抽出して不規則な形状の領域を特定し、局所化し、不規則な形状の構造化表現を可能にする。
SPOT上に構築したClimateIQAは,新しい気象学的視覚的質問応答データセットである。
ClimateIQAは、空間的手がかり、地理的メタデータ、分析データを組み込むことでVLMトレーニングを強化し、極端な気象特性の解釈と記述におけるモデルの精度を向上させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:53:09 GMT)
DivTrackee versus DynTracker: Promoting Diversity in Anti-Facial Recognition against Dynamic FR Strategy [30.6] 我々はDynTrackerを紹介した。DynTrackerは、モデルのギャラリーデータベースを、新しく認識されたターゲットIDイメージで反復的に更新する動的FR戦略である。
我々は、DynTrackerによるプライバシー上の脅威を軽減するために、AFRで保護された画像の多様性を明示的に促進することを提唱する。
具体的には、テキスト誘導画像生成フレームワーク上に構築された多様なAFR保護を実現するための新しい手法であるDivTrackeeを開発する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:43:32 GMT)
Hierarchical Reinforcement Learning and Value Optimization for Challenging Quadruped Locomotion [30.5] 四足歩行のための新しい階層型強化学習フレームワークを提案する。
提案手法は,高レベル政策が低レベル政策の最適目標を選択する2層階層構造を取り入れたものである。
我々は、様々な地形の衝突が少なく、より高い報酬を達成する能力の改善を観察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:19:15 GMT)
Why Uncertainty Calibration Matters for Reliable Perturbation-based Explanations [30.5] 本研究では,説明可能性固有の摂動を受けると,モデルが信頼できない確率推定をしばしば生成することを示す。
ReCalXは、摂動に基づく説明を改善するためのモデルを再検討するための新しいアプローチである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:54:12 GMT)
Contrastive Cross-Modal Learning for Infusing Chest X-ray Knowledge into ECGs [29.7] 心電図(ECG)と胸部X線(CXR)は、心臓評価において最も広く用いられる2つの指標である。
本研究は,胸部X線を利用して臨床に有用な心電図表現を学習する,新しいコントラスト学習ベースのフレームワークであるCroMoTEXを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:47:26 GMT)
EBC-ZIP: Improving Blockwise Crowd Counting with Zero-Inflated Poisson Regression [29.6] 現実世界の群衆のシーンでは、ほとんどの空間領域は人間を含まないため、不均衡な数分布につながる。
ゼロ膨らんだポアソン(Zip)回帰定式化を用いてカウントの空間分布をモデル化する集団カウントフレームワークであるEBC-Zipを提案する。
提案手法は,従来の回帰損失をZIP分布の負のログ類似度に置き換えることで,ゼロ重分布の処理性を向上する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:06:22 GMT)
Maximal Update Parametrization and Zero-Shot Hyperparameter Transfer for Fourier Neural Operators [29.6] フーリエニューラル演算子(FNO)は複素偏微分方程式(PDE)を解くための原理的アプローチを提供する
我々は、より小さなFNOで調整された最適な設定を可能にするゼロショットハイパーパラメータ転送技術である$mu$Transfer-FNOを導入する。
実験により,Transfer-FNOは,大規模FNO上でのハイパーパラメータのチューニングに要する計算コストを低減し,精度を維持・改善することを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:53:34 GMT)
Deep Electromagnetic Structure Design Under Limited Evaluation Budgets [29.4] 我々はPQS(Progressive Quadtree-based Search)と呼ばれる新しい手法を提案する。
PQSは、従来のイメージライクなレイアウトをクアッドツリーベースの階層表現に変換し、グローバルパターンからローカル詳細へのプログレッシブな検索を可能にする。
実世界の2つの工学的タスク、すなわち2層周波数選択表面と高利得アンテナのPQSを評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:20:16 GMT)
Thumb on the Scale: Optimal Loss Weighting in Last Layer Retraining [29.1] この研究は、目に見えない制限(リトレーニング)データがしばしば分離不能であり、モデルが比例的にサイズである最後の層再トレーニング(LLR)の仕組みを探求する。
理論と実践において、損失重み付けは依然としてこの体制に有効であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:48:58 GMT)
Grounding Beyond Detection: Enhancing Contextual Understanding in Embodied 3D Grounding [29.0] Embodied 3D groundingは、エゴ中心の視点から人間の指示で記述された対象物をローカライズすることを目的としている。
ほとんどの手法は、訓練された3D検出器の最適化されたバックボーンパラメータがグラウンドモデルの初期化に使用される2段階のパラダイムに従っている。
本研究では,対象カテゴリによってフィルタリングされた予測ボックスを用いて,検出モデルの接地性能を評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:13:34 GMT)
Uncertainty Quantification on Graph Learning: A Survey [28.3] グラフィカルモデルに適した不確実性定量化技術の開発への関心が高まっている。
この調査は、グラフィカルモデルにおけるUQに特に集中することで、既存のほとんどのUQ調査と自身を区別する。
不確実性の原因をレビューした後、不確実性表現と不確実性処理という2つの高レベル次元を用いて作業の整理を行う。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:02:19 GMT)
ASR-enhanced Multimodal Representation Learning for Cross-Domain Product Retrieval [28.1] 電子商取引はますますマルチメディア化され、画像やショートビデオ、ライブストリームのプロモーションなど、幅広い領域で商品が展示されている。
広義のシナリオでは、製品内変異が大きく、製品間類似度が高いため、視覚のみの表現は不十分である。
ASRによるマルチモーダル製品表現学習(AMPere)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:54:23 GMT)
Uncovering Conceptual Blindspots in Generative Image Models Using Sparse Autoencoders [28.0] 生成画像モデルにおいて,概念的盲点を識別するための体系的アプローチを提案する。
我々のアプローチは、特定の抑制された盲点と誇張された盲点を明らかにする。
全体として,生成モデルにおける概念的盲点を体系的に同定するための理論的基盤的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:15:15 GMT)
Towards an Introspective Dynamic Model of Globally Distributed Computing Infrastructures [27.5] 大規模な科学的コラボレーションはペタバイト単位のデータを生成し、ボリュームはすぐにエクタバイトに達すると期待されている。
これらの計算とストレージの要求を管理するために、中央集権的なワークフローとデータ管理システムが実装されている。
より効果的あるいはAI駆動のソリューションを採用する上で重要な障害は、迅速で信頼性の高いイントロスペクティブ・ダイナミック・モデルがないことである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:42:36 GMT)
Multilingual Tokenization through the Lens of Indian Languages: Challenges and Insights [27.4] 本稿では17言語にわたるトークン化戦略の本質的な評価について述べる。
ボトムアップとトップダウンのトークン化アルゴリズムのトレードオフを定量化する。
極端に低リソースな言語は、関連する高リソースな言語で訓練されたトークン化ツールの恩恵を受けることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:35:36 GMT)
Kling-Foley: Multimodal Diffusion Transformer for High-Quality Video-to-Audio Generation [27.2] ビデオコンテンツに同期した高品質なオーディオを合成する大規模マルチモーダルビデオ・ツー・オーディオ生成モデルを提案する。
実験の結果,Kling-Foleyはフローマッチングを訓練し,新たな音響視覚SOTA性能を実現することがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:39:39 GMT)
Orthogonal Soft Pruning for Efficient Class Unlearning [26.8] そこで本研究では,ミリ秒レベルの応答時間で高速かつ高精度な記憶を実現するための,クラス認識型ソフトプルーニングフレームワークを提案する。
提案手法は,クラス固有のチャネルを効率的に識別しながら,畳み込みフィルタと区切られた特徴表現をデコレーションする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:52:04 GMT)
Achieving Trustworthy Real-Time Decision Support Systems with Low-Latency Interpretable AI Models [26.7] 本稿では,低遅延AIモデルを利用したリアルタイム意思決定支援システムについて検討する。
これは、包括的なAI駆動意思決定ツール、エッジ-IoTテクノロジとの統合、効果的なヒューマン-AIチームワークのためのアプローチの最近の進歩をまとめるものだ。
結論は、この急速に変化する領域における将来のブレークスルーの舞台となった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:22:25 GMT)
DeltaSpace: A Semantic-aligned Feature Space for Flexible Text-guided Image Editing [25.9] テキスト誘導画像編集は、トレーニングと推論の柔軟性を考える際に大きな課題に直面している。
本稿では,CLIP の視覚的特徴差を生成モデルの潜在空間方向にマッピングする DeltaEdit という新しいフレームワークを提案する。
実験は、異なる生成モデルによるDeltaEditの有効性と汎用性を検証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:09:37 GMT)
Da Yu: Towards USV-Based Image Captioning for Waterway Surveillance and Scene Understanding [25.9] 水路環境に特化して設計された最初のキャプションデータセットであるWaterCaptionを紹介する。
WaterCaptionは、きめ細かいマルチリージョンの長文記述に焦点を当てている。
我々は,USVのためのエッジデプロイ可能なマルチモーダルな大規模言語モデルであるDa Yuを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:48:48 GMT)
In-Context Occam's Razor: How Transformers Prefer Simpler Hypotheses on the Fly [25.5] In-context Learning (ICL) は、トランスフォーマーがパラメータを更新せずにコンテキストの例を通して新しいタスクに適応できるようにする。
本稿では,より単純な処理によって生成される任意のパターンを,より複雑度の高いカテゴリで表現できる階層的タスク構造をトランスフォーマーがいかにナビゲートするかについて検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:33:00 GMT)
Measuring and Guiding Monosemanticity [25.4] 現在の手法では、特徴表現を確実にローカライズし操作する上で、課題に直面している。
本稿では,学習中にラベル付き概念に潜在表現を条件付ける手法であるガイドスパースオートエンコーダ(G-SAE)を提案する。
G-SAEは単Semanticityを向上するだけでなく、より効果的できめ細かいステアリングを可能にする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:18:20 GMT)
Active View Selector: Fast and Accurate Active View Selection with Cross Reference Image Quality Assessment [25.4] 新規なビュー合成と3次元再構成におけるアクティブなビュー選択に取り組む。
FisheRFやActiveNeRFといった既存の方法は、不確実性を最小化したり、3Dでの情報ゲインを最大化することで、次のベストビューを選択する。
これを2D画像品質評価(IQA)タスクとして再構成し、現在のレンダリングが最低品質のビューを選択する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:15 GMT)
Proofs as Explanations: Short Certificates for Reliable Predictions [25.2] 我々は、予測$h(x)=y$がトレーニングデータのサブセット$S'$から成り立つ、説明可能なAIのモデルを考える。
集合 $S'$ of size $d+1$ は正の予測の説明として解放され、実現可能性の仮定の下での予測の正しさの短い証明として機能する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:55:51 GMT)
ProxelGen: Generating Proteins as 3D Densities [25.0] ProxelGenは、一般的な3Dポイントクラウド表現とは対照的に、3D密度で動作する。
我々は3次元CNNベースのVAEでプロクセルとしてコードされたタンパク質を,その潜在空間で動作する拡散モデルとともに生成する。
最先端モデルと比較すると、ProxelGenのサンプルはより新規性が高く、FIDスコアが良く、トレーニングセットと同じレベルの設計性が得られる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:35:55 GMT)
Visual hallucination detection in large vision-language models via evidential conflict [24.5] Dempster-Shafer理論(DST)に基づく不確実性推定によるLVLMの視覚幻覚検出法
そこで本研究では,LVLMの視覚幻覚検出手法として,DST(Dempster-Shafer theory)を用いた第1次視覚幻覚検出法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:03:10 GMT)
AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models [24.4] AnimaXは、ビデオ拡散モデルの動作先をスケルトンベースのアニメーションの制御可能な構造でブリッジするフィードフォワード3Dアニメーションフレームワークである。
提案手法は,マルチビュー・マルチフレーム2次元ポーズマップとして3次元動作を表現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:58 GMT)
Angio-Diff: Learning a Self-Supervised Adversarial Diffusion Model for Angiographic Geometry Generation [24.3] 血管疾患は人間の健康に重大な脅威となり、X線血管造影は診断の基準として確立された。
データ駆動のディープアプローチは、ペア化された大規模なX線血管造影データセットが欠如していることによって妨げられている。
血管造影X線を血管造影X線に変換するための拡散モデルによる自己監督手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:31:57 GMT)
MNN-AECS: Energy Optimization for LLM Decoding on Mobile Devices via Adaptive Core Selection [23.9] エネルギー効率は、オンデバイス大言語モデル(LLM)の推論において大きな関心事である。
我々は、適応エネルギー中心コア選択(AECS)を導入し、それをMNNに統合し、エネルギー効率の良いMNN-AECSを作成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:50:28 GMT)
RRCANet: Recurrent Reusable-Convolution Attention Network for Infrared Small Target Detection [23.5] 赤外線小目標検出は、その特徴のために難しい課題である。
最近のCNNベースの手法は、重い特徴抽出と融合モジュールで有望な性能を実現している。
赤外線小ターゲット検出のための再帰的再帰的再畳み込みアテンションネットワーク(RRCA-Net)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:09:15 GMT)
Disentangling Reasoning and Knowledge in Medical Large Language Models [23.4] 大きな言語モデルにおける医学的推論は、臨床医の診断的思考をエミュレートすることを目的としている。
MedQA-USMLE、MedMCQA、PubMedQAといった現在のベンチマークでは、推論と事実のリコールが混在していることが多い。
バイオメディカルモデル(HuatuoGPT-o1, MedReason, m1)と一般ドメインモデル(DeepSeek-R1, o4-mini, Qwen3)を評価する。
我々は、推論重大例に基づいて微調整と強化学習を用いてBioMed-R1を訓練する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:27:30 GMT)
Network Structures as an Attack Surface: Topology-Based Privacy Leakage in Federated Learning [23.0] 我々は、現実的な敵の知識シナリオにまたがって、トポロジに基づくプライバシリークの包括的分析を行う。
異なる構造知識を持つ敵は、強い差分プライバシー保証の下でも、機密性の高いデータ配信パターンを推測できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:42:08 GMT)
STIMULUS: Achieving Fast Convergence and Low Sample Complexity in Stochastic Multi-Objective Learning [22.9] マルチオブジェクト最適化(MOO)は、ML、オペレーション、研究、エンジニアリングにおける幅広い応用において注目を集めている。
そこで本研究では,MOOの新しい頑健なアプローチであるSTIMULUSを提案する。
さらに,STimULUS-Mと呼ばれる収束を高速化するために運動量項を組み込んだSTimULusの強化版を導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:31:25 GMT)
Continuous Bayesian Model Selection for Multivariate Causal Discovery [22.9] 離散モデル選択問題の連続緩和を利用したスケーラブルなアルゴリズムを提案する。
ベイズ非パラメトリックモデルとしてカウスカルプロセス条件密度推定器(CGP-CDE)を用いる。
この行列は、限界確率と非巡回正規化器を用いて最適化され、最大 A 後方因果グラフを与える。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:05:27 GMT)
Hyperbolic Kernel Graph Neural Networks for Neurocognitive Decline Analysis from Multimodal Brain Imaging [22.9] 本稿では,マルチモーダル・ニューロイメージングを用いた神経認知下降解析のためのハイパーボリックカーネルグラフ融合フレームワークを提案する。
マルチモーダルグラフ構築モジュール、双曲空間で脳グラフを符号化するグラフ表現学習モジュール、下流予測のための双曲ニューラルネットワークで構成される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:16:37 GMT)
AnTKV: Anchor Token-Aware Sub-Bit Vector Quantization for KV Cache in Large Language Models [22.7] AnTKVは、Anchor Token対応ベクター量子化を利用してKVキャッシュを圧縮する新しいフレームワークである。
AnTKVは、Mistral-7B上での超低ビット量子化の下では、FP16ベースラインの4.73に比べて、1ビットで6.32、0.375ビットで8.87と非常に低いパープレキシティを実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:45:48 GMT)
What Matters in LLM-generated Data: Diversity and Its Effect on Model Fine-Tuning [22.4] LLM生成データの多様性レベルが下流モデルの性能にどのように影響するかを示す。
また、LLM生成データの異なる割合を混合したデータに基づいて訓練されたモデルの性能についても検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:44:58 GMT)
Genome-Anchored Foundation Model Embeddings Improve Molecular Prediction from Histology Images [22.3] PathLUPIは、トレーニング中に転写学的特権情報を使用して、ゲノムアンコールされた組織埋め込みを抽出する。
AUC $geq$ 0.80 in 14 of the biomarker prediction and molecular subtyping task and C-index $geq$ 0.70 in survive cohorts of 5 major cancer types。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:48:12 GMT)
GenHSI: Controllable Generation of Human-Scene Interaction Videos [22.2] GenHSIは、長い人間とシーンの対話ビデオの制御可能な生成のためのトレーニング不要の方法である。
映画のアニメーションからインスピレーションを得て、長い映像生成タスクを3段階に分割することで、過去の作品の限界を克服する。
我々は、トレーニングなしで任意の数のキャラクタアクションを含む一貫したカメラポーズで、初めて長いビデオシーケンスを生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:58:04 GMT)
Breaking Single-Tester Limits: Multi-Agent LLMs for Multi-User Feature Testing [22.1] アプリケーション機能テストのためのマルチユーザ対話タスクを自動化するために,LLM(Large Language Models)を利用した新しいマルチエージェントアプローチであるMAdroidを提案する。
具体的には、MAdroidは、ユーザエージェント(オペレータ)とスーパーバイザーエージェント(コーディネータとオブザーバ)の2つの機能タイプを採用している。
マルチユーザ対話型タスク41件を含む評価は,96.8%の動作類似性を有するタスクの82.9%を達成し,提案手法の有効性を示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:54:08 GMT)
RA-NeRF: Robust Neural Radiance Field Reconstruction with Accurate Camera Pose Estimation under Complex Trajectories [22.0] RA-NeRFは複雑なカメラ軌道であっても、高精度なカメラポーズを予測することができる。
RA-NeRFは、カメラポーズ推定と視覚的品質の両方において最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:47:52 GMT)
FactCheckmate: Preemptively Detecting and Mitigating Hallucinations in LMs [21.8] FactCheckmateを導入し,分類器の学習により幻覚を事前に検出する。
幻覚が検出されると、FactCheckmateはLMの隠れた状態を調整して介入する。
その結果,FactCheckmateの有効性が示され,70%以上のプリエンプティブ検出精度が得られた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:49:48 GMT)
Long-Context Generalization with Sparse Attention [21.3] トランスフォーマーベースのアーキテクチャは、伝統的に注意重みを計算するためにソフトマックスを使用している。
シーケンス長が増加するにつれて、非情報的トークンは注意確率の質量を蓄積し、分散と表現的崩壊をもたらす。
本稿では,$alpha$-entmax を用いて注意機構を疎結合にすることで,これらの問題を回避できることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:45:00 GMT)
RecLLM-R1: A Two-Stage Training Paradigm with Reinforcement Learning and Chain-of-Thought v1 [20.9] 本稿では,Large Language Models(LLM)を利用したレコメンデーションフレームワークであるRecLLM-R1を紹介する。
RecLLM-R1は、精度、多様性、新規性など、さまざまな評価指標において、既存のベースラインメソッドを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:39:34 GMT)
ToSA: Token Merging with Spatial Awareness [20.9] ToSAは、意味的および空間的認識を組み合わせ、トークンマージプロセスを導く新しいトークンマージ手法である。
ToSAは、視覚的および具体的質問応答に関する複数のベンチマークで、以前のトークンマージ手法よりも優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:58:20 GMT)
Uncovering the origin of bound state in the continuum [20.8] 連続体(BIC)と準BICの境界状態は、顕著な波動関数のクラスを表す。
バンド間の結合をチューニングすることで、準BICを正確にBICに変換することができることを示す。
従来の提案とは異なり、我々の理論は対称性の保護も位相的制約も必要とせず、マルチバンドモデルに拡張できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:45:40 GMT)
Classifying and Tracking International Aid Contribution Towards SDGs [20.7] 国際援助は、発展途上国の経済成長と豊かさを促進するための重要なメカニズムである。
労働集約的なデータ管理と不完全な記録のため、支援の追跡は依然として困難である。
我々は、手動の分類を補完し、主観的解釈において人間の偏見を緩和するAIモデルを開発する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:59:52 GMT)
The Noisy Path from Source to Citation: Measuring How Scholars Engage with Past Research [20.6] 本稿では,大規模な引用忠実度を定量化する計算パイプラインを提案する。
論文の全文を用いて、パイプラインは引用論文における引用と引用論文における対応するクレームを識別する。
準実験を用いて「電話効果」を確立する - 引用論文が原主張に忠実度が低い場合、引用論文と原文を引用する将来の論文は原文に忠実度が低い。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:00:02 GMT)
SRFT: A Single-Stage Method with Supervised and Reinforcement Fine-Tuning for Reasoning [20.4] 大規模言語モデル (LLM) は推論タスクにおいて顕著な進歩を遂げているが、スーパービジョンファインチューニング (SFT) と強化学習 (RL) の最適統合は依然として根本的な課題である。
本稿では,エントロピーを考慮した重み付け機構により,両方のファインチューニングパラダイムを統一する単一ステージ手法であるSupervised Reinforcement Fine-Tuning (SRFT)を提案する。
大規模な実験の結果、SRFTは平均精度59.1%に達し、5つの数学的推論ベンチマークでは0-RL法を9.0%上回り、3つのアウト・オブ・ディストリビューションベンチマークでは10.9%を上回った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:31:37 GMT)
Ark: An Open-source Python-based Framework for Robot Learning [20.1] ARKは、そのギャップを埋めるために設計された、オープンソースのPythonファーストのロボティクスフレームワークである。
ARKは、ユーザがデータを収集し、前処理し、ポリシーをトレーニングできる、Gymスタイルの環境インターフェースを提供する。
ARKには、コントロール、SLAM、モーションプランニング、システム識別、可視化のための再利用可能なモジュールが付属している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:23:39 GMT)
Tagged for Direction: Pinning Down Causal Edge Directions with Precision [19.9] 本稿では,複数のタグを各変数に因果グラフで割り当てる,タグに基づく因果探索手法を提案する。
既存の因果発見アプローチは、まずいくつかのエッジを指示するために適用され、タグ間のエッジ関係を決定するために使用される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:39:17 GMT)
crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023 [19.8] クロスモダリティドメイン適応 (cross-Modality Domain Adaptation,crossMoDA) シリーズの2022年版と2023年版について報告する。
2023年版での勝利は、2021年版と2022年の試験データにおけるアウトレーヤの数を減らした。
臨床的に許容されるVSセグメンテーションにはまだ進歩が必要だが、高評価は、より困難なクロスモーダルタスクが将来のベンチマークに役立つことを示唆している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:00:00 GMT)
Language Models Learn Rare Phenomena from Less Rare Phenomena: The Case of the Missing AANNs [19.8] 言語モデルは希少な現象から一般化することで希少な文法現象を学習できることを示す。
この結果から, LMが希少な現象から一般化することで, 希少な文法現象を学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:39:54 GMT)
Skywork-SWE: Unveiling Data Scaling Laws for Software Engineering in LLMs [19.8] ソフトウェアエンジニアリング(SWE)は、次世代のLLMエージェントにとって重要なテストベッドとして登場した。
既存のデータセットのほとんどは、わずか数千のGitHubソースインスタンスに制限されている。
SWEデータセットのボリュームと多様性の両方を体系的にスケールするインクリメンタルな自動データキュレーションパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:53:36 GMT)
Inapproximability of Finding Sparse Vectors in Codes, Subspaces, and Lattices [19.2] スパースベクトルを見つけることは、コード、部分空間、格子を含むいくつかの文脈で生じる根本的な問題である。
我々は、PCP定理をバイパスする新しいアプローチを用いて、これらの変種すべてに対して強い不適合性を証明した。
我々の主な結果は、任意の定数係数内の実部分空間における最も広いベクトルを近似することがNPハードであることである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:51:55 GMT)
EvDetMAV: Generalized MAV Detection from Moving Event Cameras [19.2] 既存の航空機(MAV)検出方法は、主にRGB画像のターゲットの外観特徴に依存している。
イベントストリーム中のプロペラの特徴をフル活用して,イベントカメラから異なる種類のMAVを検出する方法について検討する。
これは、複数のシナリオと異なる種類のMAVからなる、最初のイベントベースのMAVデータセットである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:35:15 GMT)
Detection of subsurface structures with a vehicle-based atom gravity gradiometer [18.9] 原子重力勾配計(AGG)は最も正確な移動重力勾配計の1つであるが、現在は可搬性と感度のトレードオフによって制限されている。
本稿では,94Lの超コンパクトセンサヘッドを備えた高感度移動型AGGについて述べる。
実験室では、77E/sqrtHz$(1E=1$times10-9$/s$2$)の感度と0.5E以上の長期的な安定性を達成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:58:06 GMT)
KAG-Thinker: Interactive Thinking and Deep Reasoning in LLMs via Knowledge-Augmented Generation [18.8] 我々は、KAG-Thinkerを導入し、KAGをマルチターン対話型思考と、専用パラメータライト大言語モデル(LLM)を利用した深い推論フレームワークにアップグレードする。
提案手法は,複雑な問題を解くための構造化思考プロセスを構築し,推論過程の論理的一貫性と文脈的整合性を高める。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:50:57 GMT)
Efficient Extreme Operating Condition Search for Online Relay Setting Calculation in Renewable Power Systems Based on Parallel Graph Neural Network [18.8] 本稿では,オンラインリレー設定計算に適した効率的な深層学習に基づくEOCS手法を提案する。
実験結果から,提案手法は既存手法よりも高い精度でEOCS問題を解くことができることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:50:58 GMT)
Follow-the-Perturbed-Leader Approaches Best-of-Both-Worlds for the m-Set Semi-Bandit Problems [18.7] 我々は、学習者が$m$の腕から$m$の腕を正確に選択する、$m$セット半帯域問題の一般的な場合を考える。
また, Fr'echet 摂動を持つFTPL は, 対向的な設定で, $mathcalO(sqrtnm(sqrtdlog(d)+m5/6)$ をほぼ最適に再現できることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:04:37 GMT)
Inference-Time Reward Hacking in Large Language Models [18.5] リワードモデルは、正確性、有用性、安全性などの複雑なデシダータのプロキシとして機能する。
不正な報酬を過度に最適化することで、意図したアライメントの目標を覆し、全体的なパフォーマンスを低下させることができる。
HedgeTuneは最適な推論時間パラメータを見つけ、報酬のハッキングを避けるための効率的なアルゴリズムである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:05:25 GMT)
A Contrastive Learning Foundation Model Based on Perfectly Aligned Sample Pairs for Remote Sensing Images [18.2] セマンティック・パーフェクト・アライメント・サンプル・ペアによる全目的リモートセンシング機能を実現するPerAと呼ばれる新しい自己教師型手法を提案する。
私たちのフレームワークは,教師と生徒の一貫性を確保することによって,高品質な機能を提供します。
約500万のRS画像を含むラベル付き事前学習データセットを収集する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:04:10 GMT)
Learning Treatment Representations for Downstream Instrumental Variable Regression [18.1] 本稿では,表現学習過程において,機器変数を明示的に組み込むことで,治療表現を構築する新しい手法を提案する。
我々の手法は、限られた楽器で高次元内在変数を扱うための枠組みを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:58:39 GMT)
Recurrent Visual Feature Extraction and Stereo Attentions for CT Report Generation [18.1] 本稿では,大規模言語モデル (LLM) に基づくCTRG法を提案する。
具体的には、視覚変換器を用いて、各スライスをCTボリュームで繰り返し処理し、異なる視点から符号化したスライスに注意を払って重要な視覚情報を得る。
ベンチマークM3D-Capデータセットの実験結果とさらなる解析により,本手法が強いベースラインモデルより優れていることが示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:29:06 GMT)
MegaFold: System-Level Optimizations for Accelerating Protein Structure Prediction Models [18.0] AF3トレーニングを加速するクロスプラットフォームシステムであるMegaFoldを提案する。
MegaFoldはAF3トレーニングのピークメモリ使用量を最大1.23$times$に削減し、最大1.73$times$と1.62$times$に改善した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:30:49 GMT)
Tensor-Parallelism with Partially Synchronized Activations [17.9] テンソル並列性を持つ大規模言語モデル(LLM)の訓練と推論には,アクティベーションの同期化に相当なコミュニケーションが必要である。
これをCAAT-Net(Communication-Aware Architecture forparallelism)と呼ぶ。
我々は1Bおよび7BパラメータCAAT-Netモデルをトレーニングし、テンソルパラレル通信の50%削減と事前学習精度の大幅な低下を伴わない。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:09:48 GMT)
MSR-Align: Policy-Grounded Multimodal Alignment for Safety-Aware Reasoning in Vision-Language Models [17.8] VLM(Vision-Language Models)は、多モーダル推論タスクにおいて、チェーンオブ思考能力の向上を通じて、顕著な進歩を遂げている。
既存の安全アライメントアプローチは、マルチモーダル入力によって引き起こされる複雑でニュアンスな脅威に対処するには不十分である。
MSR-Alignは、視覚とテキストのモダリティの双方にわたって標準化された安全ポリシーよりも、きめ細かい、熟考的な推論をサポートしている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:37:59 GMT)
Evaluating Transparent Reasoning in Large Language Models for Accountable Critical Tasks [17.7] 本稿では,大規模言語モデル (LLM) の推論能力を厳格に評価するベンチマークであるREACTを紹介する。
当科から511症例,法科から86症例に注釈を付し,それぞれに専門家が抽出した詳細な根拠と推論過程の各ステップを裏付ける証拠が得られた。
実験により, 推論グラフは従来のベースラインと比較して, LLM推論の解釈可能性や精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:31:03 GMT)
On the necessity of adaptive regularisation:Optimal anytime online learning on $\boldsymbol{\ell_p}$-balls [17.6] オンライン凸最適化を$ell_p$-balls in $mathbbRd$ for $p > 2$で検討する。
常にサブ線形であるが、最適の後悔は、高次元の設定($d > T$)と低次元の設定($d leq T$)のシフトを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:06:56 GMT)
SMARTIES: Spectrum-Aware Multi-Sensor Auto-Encoder for Remote Sensing Images [17.3] 最近のディープラーニングモデルは、単一のセンサーや固定された組み合わせに特化していることが多い。
SMARTIESは、センサ依存/依存の取り組みを持ち上げる汎用的で汎用的な基礎モデルである。
多様なセンサーにまたがる単一タスクとマルチモーダルタスクにおいて、SMARTIESはセンサー固有の事前訓練に依存する以前のモデルより優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:51:39 GMT)
Local Look-Ahead Guidance via Verifier-in-the-Loop for Automated Theorem Proving [17.3] そこで本研究では,各ステップの中間フィードバックをループ上で行う新しい検証手法を提案する。
検証としてリーンを用いることで、ステップバイステップのローカル検証がモデルの推論精度と効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:42:55 GMT)
Not All Thats Rare Is Lost: Causal Paths to Rare Concept Synthesis [17.2] 我々は、まれな概念生成を潜在因果経路をナビゲートするものとして扱う、原則化されたフレームワークであるRAPを紹介する。
RAPは希少な概念生成を一貫して強化し、自動評価と人間の研究の両方において、強力なベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:08:12 GMT)
TOMD: A Trail-based Off-road Multimodal Dataset for Traversable Pathway Segmentation under Challenging Illumination Conditions [17.0] このような環境に特化して設計された包括的データセットであるTrail-based Off-road Multimodal dataset (TOMD)を紹介する。
TOMDは、128チャンネルのLiDAR、ステレオ画像、IMU、照明測定を含む高忠実なマルチモーダルセンサーデータを備えている。
また,正確な経路予測のための動的マルチスケールデータ融合モデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:58:44 GMT)
MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners [16.9] MuseControlLiteは、正確な条件付けのためにテキストから音楽への生成モデルを微調整するように設計されている。
興味のある状態が時間の関数である場合、位置埋め込みが重要となる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:53:56 GMT)
Protein Structure Tokenization: Benchmarking and New Recipe [16.8] StructTokenBenchは、構造トークン化器の品質と効率を包括的に評価するフレームワークである。
AminoAseedは、コードブックの更新を強化し、コードブックのサイズと寸法を最適にバランスさせ、トークン化ツールの利用と品質を改善する戦略である。
本手法は,24タスクに対して平均6.31%の性能向上を実現し,感度と利用率をそれぞれ12.83%,124.03%向上させた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:54:25 GMT)
Spotting Out-of-Character Behavior: Atomic-Level Evaluation of Persona Fidelity in Open-Ended Generation [16.8] より微細な粒度でペルソナの忠実度を定量化する原子レベル評価フレームワークを提案する。
私たちの3つの重要な測定基準は、世代間でのペルソナのアライメントと一貫性の度合いを測定します。
多様なタスクやパーソナリティの多様さからペルソナの忠実度を解析することにより,タスク構造とペルソナの嗜好性がモデル適応性にどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:33:10 GMT)
ReconX: Reconstruct Any Scene from Sparse Views with Video Diffusion Model [16.1] ReconXは、時間生成タスクとして曖昧な再構築課題を再編成する、新しい3Dシーン再構築パラダイムである。
提案したReconXはまずグローバルポイントクラウドを構築し、3D構造条件としてコンテキスト空間にエンコードする。
この条件に導かれ、ビデオ拡散モデルは、ディテール保存され、高い3D一貫性を示すビデオフレームを合成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:04:03 GMT)
Exclusive Style Removal for Cross Domain Novel Class Discovery [15.9] textitNovel Class Discovery (NCD) は通常、未表示の新規クラスをラベル付けされていないセットにクラスタリングするタスクである。
本稿では,基本特徴と異なるスタイル情報を抽出するための排他的スタイル除去モジュールを提案する。
このモジュールは他のNCDメソッドと簡単に統合でき、異なるディストリビューションを持つ新しいクラスのパフォーマンスを向上させるプラグインとして機能する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:03:27 GMT)
FLAT-LLM: Fine-grained Low-rank Activation Space Transformation for Large Language Model Compression [15.8] FLAT-LLMは、アクティベーション空間の微細な低ランク変換に基づく、トレーニング不要な構造圧縮手法である。
回復微調整なしで効率よく効果的な重量圧縮を実現し、数分でキャリブレーションを完了できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:40:57 GMT)
VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration [15.8] 離散最適化に基づく変形可能な画像登録フレームワークであるVoxelOptを提案する。
学習ベースの長所と反復的手法を組み合わせて、登録精度と実行時のバランスを改善する。
腹部CTの登録では、これらの変更により、VoxelOptは、ラベルの監督によって訓練された最先端の学習ベースの手法と一致しながら、効率と正確性の両方において、リード反復性を上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:44:04 GMT)
VFArchē: A Dual-Mode Framework for Locating Vulnerable Functions in Open-Source Software [15.6] ソフトウェア構成分析(SCA)は、ソフトウェアプロジェクトの依存性に固有の脆弱性に対処する上で重要な役割を担っている。
VFArch=eは、脆弱性を公開するために設計されたデュアルモードのアプローチで、利用可能なパッチリンクの有無にかかわらず、シナリオに適用できる。
妥当な努力で50の脆弱性のうち43のVFを見つけ、SCAツールの78~89%の偽陽性を著しく減らしました。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:11:45 GMT)
Towards Backdoor Stealthiness in Model Parameter Space [15.6] 入力空間や特徴空間のステルスネスに焦点をあてた12の一般的なバックドア攻撃と17の多様な代表防御について検討した。
入力および特徴空間攻撃は、現在のバックドア攻撃では十分に考慮されていないパラメータ空間に顕著なバックドア関連ニューロンをもたらす。
包括的ステルスネスを考慮して,Grondと呼ばれる新たなサプライチェーン攻撃を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:40:14 GMT)
Fuzz-Testing Meets LLM-Based Agents: An Automated and Efficient Framework for Jailbreaking Text-To-Image Generation Models [15.6] JailFuzzerは、大きな言語モデル(LLM)エージェントによって駆動される新しいファジングフレームワークである。
自然かつ意味的に一貫性のあるプロンプトを生成し、従来の防御による検出の可能性を減らす。
クエリオーバーヘッドを最小限に抑えたジェイルブレイク攻撃で高い成功率を達成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:55:29 GMT)
Model-Based Exploration in Monitored Markov Decision Processes [15.4] 強化学習の要点は、エージェントが常に報酬を観察することである。
Mon-MDPアルゴリズムにはいくつかの制限がある。
我々はこれらの欠点に対処するMon-MDPのモデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:32:18 GMT)
Sensitive Content Classification in Social Media: A Holistic Resource and Evaluation [15.4] 6つのカテゴリにまたがるソーシャルメディアコンテンツモデレーションに適した統合データセットを提案しました。
これには、矛盾する言語、暴言、性的明示的な材料、薬物関連コンテンツ、自傷行為、スパムが含まれる。
この新たなデータセットを微調整した大規模言語モデルでは,市販のモデルに比べて検出性能が大幅に向上した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:31:28 GMT)
From Coarse to Continuous: Progressive Refinement Implicit Neural Representation for Motion-Robust Anisotropic MRI Reconstruction [15.3] MRIでは、スライス・ツー・ボリュームの再構成は、2次元スライスから一貫した3次元脳の体積を回復するために重要である。
プログレッシブ改良型暗黙的ニューラル表現フレームワーク(PR-INR)を提案する。
我々のPR-INRは、幾何対応座標空間内での運動補正、構造改善、体積合成を統一する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:48:10 GMT)
Multimodal Fusion SLAM with Fourier Attention [15.2] 本稿では,高速フーリエ変換 (FFT) を用いた効率的なマルチモーダル融合SLAM法FMF-SLAMを提案する。
具体的には、RGBと奥行き信号から特徴を抽出する、新しいフーリエ型自己注意・相互注意機構を導入する。
我々のアプローチは、TUM、TartanAir、および我々の実世界のデータセットのビデオシーケンスを使用して検証され、ノイズ、様々な照明、暗黒条件下での最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:24:14 GMT)
Outlier-Safe Pre-Training for Robust 4-Bit Quantization of Large Language Models [15.2] 大規模言語モデルにおける極端なアクティベーションアウトレイアは量子化性能を著しく低下させる。
生成を積極的に防止する実用的なガイドラインであるOutlier-Safe Pre-Training (OSP)を紹介した。
我々の研究は、アウトリーチはLLMに固有のものではなく、トレーニング戦略の結果であることを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:03:57 GMT)
Safeguard-by-Development: A Privacy-Enhanced Development Paradigm for Multi-Agent Collaboration Systems [15.2] 多エージェント協調システム(MACS)は,各エージェントの特殊化とエージェント間のコミュニケーションを活用することで,複雑な問題を効率的に解決する。
エージェント間の情報交換と外部環境との相互作用は、機密データ漏洩の重大なリスクをもたらす。
既存のMACSには詳細なデータ保護制御がないため、機密情報を安全に管理することは困難である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:20:37 GMT)
Controllable Video Generation with Provable Disentanglement [15.1] 本稿では,ビデオ概念を乱すための制御可能なビデオ生成支援ネットワーク(VoGAN)を提案する。
最小限の変化原理と十分な変化特性を強制するために、潜在動的変数の次元性を最小化する。
提案手法は,多種多様な現実シナリオにおける生成品質と制御性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:54:02 GMT)
General Methods Make Great Domain-specific Foundation Models: A Case-study on Fetal Ultrasound [15.1] 2M画像の大規模な胎児超音波データセットに基づいて基礎モデルを訓練する。
我々は,自然画像,超音波画像,教師付きベースラインで事前訓練された一連のモデルと比較した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:00:13 GMT)
Inference Scaled GraphRAG: Improving Multi Hop Question Answering on Knowledge Graphs [15.0] 大きな言語モデル(LLM)は、言語理解と生成において印象的な能力を達成した。
構造化コンテキストやマルチホップ情報へのアクセスが限られているため、知識集約的推論タスクではパフォーマンスが低下し続けています。
Inference-Scaled GraphRAGは、推論時間計算のスケーリングを適用してLLMベースのグラフ推論を強化する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:31:03 GMT)
Memory-Augmented Incomplete Multimodal Survival Prediction via Cross-Slide and Gene-Attentive Hypergraph Learning [15.0] 癌生存予測にはマルチモーダルな病理・ゲノム解析が重要である。
既存のアプローチは主に、フォーマリン固定パラフィン埋め込み(FFPE)スライドとゲノムデータを統合する。
本稿では,ハイパーグラフ学習を活用して,病理スライドとゲノムデータ間の多WSI情報と相互モダリティの相互作用を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:31:13 GMT)
VideoPCDNet: Video Parsing and Prediction with Phase Correlation Networks [14.9] 本稿では,オブジェクト中心のビデオ分解と予測のための教師なしフレームワークであるVideoPCDNetを提案する。
本モデルは,学習対象のプロトタイプの変換版として表現されるオブジェクトコンポーネントに動画を解析するために,周波数領域位相相関法を用いる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:39:47 GMT)
Reconsidering Explicit Longitudinal Mammography Alignment for Enhanced Breast Cancer Risk Prediction [14.9] ディープラーニングに基づくリスク予測手法は、リスクの高いグループに対するスクリーニング間隔を調整することに関心を喚起している。
最近のアプローチでは、スクリーニングの時間的側面を活用して、経時的に乳房組織の変化を追跡する。
この2つの主要な戦略は、変形可能な登録による明示的な機能アライメントと、トランスフォーマーのようなテクニックを用いた暗黙的な学習アライメントである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:46:29 GMT)
Object-aware Sound Source Localization via Audio-Visual Scene Understanding [14.8] 既存の手法は複雑な場面における音像の正確な位置決めに苦慮している。
この制限は、主に単純な音声と視覚の対応に依存することから生じる。
マルチモーダル大言語モデルを利用した新しい音源定位フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:05:51 GMT)
The Effect of Depth on the Expressivity of Deep Linear State-Space Models [14.8] ディープステートスペースモデル(SSM)はシーケンスモデリングにおいて人気が高まっている。
深部線形SSMにおける深さと幅の役割について検討し,それらがアーキテクチャの表現能力にどのように影響するかを特徴付けることを目的とした。
パラメータノルムが大きい浅い線形SSMは、構成的手法を用いてより小さなノルムを持つ深い線形SSMで表現できることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:01:21 GMT)
Fast and Distributed Equivariant Graph Neural Networks by Virtual Node Learning [14.7] 我々はFastEGNNとDistEGNNを紹介した。
FastEGNNは、実際のノードの大きな未順序グラフを効果的に近似する、小さな順序付き仮想ノードセットを使用している。
超大規模幾何学グラフに対しては,仮想ノードがサブグラフ間のグローバルブリッジとして機能する分散拡張であるDistEGNNを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:17:38 GMT)
ContactDexNet: Multi-fingered Robotic Hand Grasping in Cluttered Environments through Hand-object Contact Semantic Mapping [14.7] 接触セマンティックマップを用いて, 乱雑な環境下でのマルチフィンガーハンドグリップサンプルを生成する手法を開発した。
また,マルチモーダルなマルチフィンガーグリップデータセット生成手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:49:27 GMT)
Convolution-weighting method for the physics-informed neural network: A Primal-Dual Optimization Perspective [14.7] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法として広く用いられている
PINNは一般に有限個の点を用いて最適化され、収束と精度を保証する上で大きな課題となる。
そこで本稿では, 減量関数に対する重み付けを, 孤立点から連続近傍領域への適応的に変更する手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:13:51 GMT)
Multimodal Machine Learning in Mental Health: A Survey of Data, Algorithms, and Challenges [14.6] マルチモーダル機械学習(MML)は、精神疾患の検出方法、特徴付け、縦方向の監視方法を急速に再構築している。
この調査は、メンタルヘルスのためのMMLを包括的、臨床的に基礎づけた初めての合成を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:40:09 GMT)
Mixture of Cache-Conditional Experts for Efficient Mobile Device Inference [14.6] 本稿では,トークン生成時に専門家の再利用を活用し,キャッシュの局所性を改善する新しいキャッシュ対応ルーティング戦略を提案する。
モバイルデバイス上での2$times$のスピードアップを実演する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:27:46 GMT)
Quantitative Benchmarking of Anomaly Detection Methods in Digital Pathology [14.5] 異常検出は、デジタル病理学の応用において大きな可能性を秘めている。
その大きさ、多スケール構造、染色のばらつき、反復パターンなど、病理画像のユニークな特徴は、現在の異常検出アルゴリズムが解決に苦慮している新しい課題をもたらす。
広範囲な実験を通じて20以上の古典的および一般的な異常検出手法をベンチマークする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:39:23 GMT)
Distributed Quantum Inner Product Estimation with Low-Depth Circuits [14.5] 本研究は、低深度量子回路を用いたDIPEを探索する。
まず、任意のユニタリな2ドルの設計アンサンブルを持つDIPEは、平均的なサンプルの複雑さを$Theta(sqrt2n)$とする。
次に、平均的なサンプル複雑度が$O(sqrt2.18n)$および$O(sqrt2.5n)$であることを示す、ユニタリな2ドルの設計の下のアンサンブルを分析する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:37:26 GMT)
Ancient Script Image Recognition and Processing: A Review [14.4] 古代の文字は人類文明の重要なキャリアとして機能し、貴重な歴史的・文化的情報を埋め込んでいる。
ディープラーニングの台頭に伴い、この分野は急速に進展し、多くのスクリプト固有のデータセットやモデルが提案されている。
この調査は、古代のスクリプト画像認識手法の総合的なレビューを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:34:55 GMT)
Convergent and divergent connectivity patterns of the arcuate fasciculus in macaques and humans [14.4] 本研究では,マカク類とヒトの歯根膜の構造と接続性について検討した。
マカクAFは側頭頂部皮質から発生し、聴覚皮質と頭頂部大網を横切り、前頭前野に投射する。
ヒトAFは、中側頭回へのより大きな拡張と、前頭前・頭頂部のより強い接続を示す。
これらの種間差は、人間特有の高度な言語処理の出現のための接続ベースの基質であることが示唆されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:58:14 GMT)
GBGC: Efficient and Adaptive Graph Coarsening via Granular-ball Computing [14.3] グラニュラーボール(GBGC)を用いた新しい多粒度, 効率的, 適応的粗大化法を提案する。
GBGCは、適応的な粒度グラフ精錬機構を導入し、元のグラフを粗いものから細かいものへと適応的に分割し、異なる大きさの粒度と最適な粒度に分割する。
GBGCの精度は、グラニュラーボール計算の優れた堅牢性と一般化のため、元のグラフよりもほぼ常に高い。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:18:06 GMT)
The Elements of Differentiable Programming [14.2] 微分可能プログラミングは複雑なコンピュータプログラムのエンドツーエンドの微分を可能にする。
微分プログラミングは、コンピュータ科学と応用数学のいくつかの領域の上に構築されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:38:16 GMT)
SemGauss-SLAM: Dense Semantic Gaussian Splatting SLAM [14.1] SemGauss-SLAMは、正確な3Dセマンティックマッピング、堅牢なカメラトラッキング、高品質なレンダリングを可能にする、密集したセマンティックSLAMシステムである。
セマンティックな特徴を3次元ガウス表現に組み込んで,環境の空間的レイアウト内で意味情報を効果的にエンコードする。
マルチフレームセマンティックアソシエーションを活用することで、この戦略は3次元ガウス表現とカメラポーズの合同最適化を可能にし、低ドリフトトラッキングと正確なセマンティックマッピングを実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:31:25 GMT)
An ab initio foundation model of wavefunctions that accurately describes chemical bond breaking [14.1] オルブフォーマーは化学的精度(1kcal/mol)に一貫して収束する唯一の方法である
この研究は、シュル・オーディンガー方程式を多くの分子上で解くコストを、量子化学の実践的なアプローチに変えるという考え方を転換した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:12:45 GMT)
NEAR$^2$: A Nested Embedding Approach to Efficient Product Retrieval and Ranking [14.0] NEAR$2$と呼ばれる製品検索とランキングに対するNested Embedding Approachを提案する。
提案手法は,既存のモデルと比較して,より小さな埋め込み次元よりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:02:02 GMT)
Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases [14.0] 条件付きアトラスは、人口統計学や病理学のような特定の条件によって定義された特定のサブ人口をターゲットにしている。
既存のアプローチでは、大きな解剖学的変異を処理できない場合が多い登録ベースの方法のいずれかを使用している。
本稿では, 潜在拡散モデルを用いて変形場を生成し, 一般集団アトラスを特定のサブ集団を表すものに変換することを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:12:51 GMT)
Flopping for FLOPs: Leveraging equivariance for computational efficiency [13.9] 本稿では,パラメータ毎に同じ数の浮動小数点演算(FLOP)を標準の非同変ネットワークに維持しながら対称性を維持する新しい同変ニューラルネットワークを提案する。
提案手法はFLOPと壁面時間の両方を削減し,効率よくスケーラブルな対称性を意識したアーキテクチャを実現するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:03:53 GMT)
Cross-Layer Discrete Concept Discovery for Interpreting Language Models [13.8] glsclvqvaeは、ベクトル量子化を使用してレイヤ間の表現をマッピングするフレームワークである。
我々の手法は、量子化中の温度に基づくサンプリングとEMAコードブックの更新を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:43:36 GMT)
DRO-Augment Framework: Robustness by Synergizing Wasserstein Distributionally Robust Optimization and Data Augmentation [13.8] DRO-Augmentは、Wasserstein Distributionally Robust Optimizationと様々なデータ拡張戦略を統合する新しいフレームワークである。
本手法は,重度データ摂動および逆攻撃シナリオ下での既存の拡張手法より優れる。
理論的には,計算効率のよい変分正規化損失関数を用いて学習したニューラルネットワークに対して,新たな一般化誤差境界を確立する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:04:53 GMT)
RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning [13.8] RAGパイプラインにアプリケーション認識推論を明示的に組み込んだ原則付きモジュール拡張であるRAG+を紹介します。
RAG+は、知識とアライメントされたアプリケーションの例からなる二重コーパスを構築し、手動または自動で作成し、推論中に共同で両方のコーパスを取得する。
複数のモデルで実施された数学、法学、医学の分野での実験では、RAG+は標準的なRAGの変種を一貫して上回り、3.5%の平均的な改善を達成し、複雑なシナリオではピークが7.5%まで上昇することを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:50:06 GMT)
Recalling The Forgotten Class Memberships: Unlearned Models Can Be Noisy Labelers to Leak Privacy [13.7] マシン・アンラーニング(MU)攻撃に関する現在の限られた研究は、プライバシデータを含むオリジナルのモデルへのアクセスを必要とする。
本稿では,未学習モデルから忘れられたクラスメンバーシップを,オリジナルのモデルへのアクセスを必要とせずにリコールする革新的な研究を提案する。
本研究と評価により,MU脆弱性に関する今後の研究のベンチマークが確立された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:21:10 GMT)
Error-resilient Reversal of Quantum Chaotic Dynamics Enabled by Scramblons [13.7] 量子多体系における時間の矢印は、量子情報をスクランブルし絡みを増大させるハミルトン進化に由来する。
量子情報スクランブルとカオス力学の構造について検討する。
我々の結果は、複雑な量子系の動的反転の基本的な限界を押し上げます。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:00:05 GMT)
TrainVerify: Equivalence-Based Verification for Distributed LLM Training [13.6] 大規模言語モデル(LLM)を大規模にトレーニングするには、数千のデバイスで並列実行する必要がある。
LLMの分散トレーニングを検証可能なシステムであるTraiVerifyを導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:50:28 GMT)
Learning to Disentangle Latent Reasoning Rules with Language VAEs: A Systematic Study [13.6] 本研究は,推論規則を言語モデル内に明示的に組み込んで記憶する方法について検討する。
本稿では,Transformer ベースの言語 VAE における推論規則を学習するための完全なパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:38:03 GMT)
A Perspective on Quantum Computing Applications in Quantum Chemistry using 25--100 Logical Qubits [13.6] 量子化学は長い間、量子計算の自然な候補として認識されてきた。
アルゴリズムとソフトウェア設計における、ほぼ短期的な機会を強調します。
本稿では,量子化学の実用化に向けた戦略ロードマップと協調経路を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:02:25 GMT)
Temporal-IRL: Modeling Port Congestion and Berth Scheduling with Inverse Reinforcement Learning [13.5] モデルは、バーススケジューリングを学習し、終端における船舶シークエンシングを予測し、船舶港留置を推定する。
モデルをトレーニングし、テストし、明らかに優れた結果を得た。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:12 GMT)
LLM-Driven Medical Document Analysis: Enhancing Trustworthy Pathology and Differential Diagnosis [13.4] 低ランク適応を用いてLLaMA-v3を微調整する信頼性の高い医療文書分析プラットフォームを提案する。
本手法は差分診断のための最大のベンチマークデータセットであるDDXPlusを利用する。
開発したWebベースのプラットフォームでは、ユーザは独自の構造化されていない医療文書を提出し、正確な説明可能な診断結果を受け取ることができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:12:42 GMT)
DDS-NAS: Dynamic Data Selection within Neural Architecture Search via On-line Hard Example Mining applied to Image Classification [13.4] カリキュラム学習フレームワーク内の動的ハードサンプルマイニングを通じて、ニューラルネットワーク検索(NAS)トレーニングを高速化します。
トレーニング中の各画像サンプルの寄与を最大化することにより、NASトレーニングサイクルの持続時間と収束に必要なイテレーション数を削減する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:31:33 GMT)
Private Model Personalization Revisited [13.4] 共有表現フレームワークにおけるユーザレベルの差分プライバシー(DP)に基づくモデルパーソナライゼーションについて検討する。
我々のゴールは、共有埋め込みと局所的な低次元表現を極小リスクでプライベートに回収することである。
共有埋め込みをプライベートに学習し、マージンベースの精度保証を導出するための情報理論構築を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:57:17 GMT)
NaviAgent: Bilevel Planning on Tool Dependency Graphs for Function Calling [13.4] NaviAgentは、堅牢な関数呼び出しのためのグラフナビゲートされたバイレベル計画アーキテクチャである。
LLMを動力とするエージェントとして、Multi-Path Deciderは4次元決定空間を定義する。
Graph-Encoded NavigatorはTool Dependency Heterogeneous Graphを構築する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:39:07 GMT)
TTSDS2: Resources and Benchmark for Evaluating Human-Quality Text to Speech Systems [13.3] TTSDS のより堅牢で改良されたバージョンである Text to Speech Distribution Score 2 (TTSDS2) を紹介する。
TTSDS2は、各ドメインの0.50以上のスピアマン相関と、評価された主観的スコアと相関する16の指標のうち、唯一のものである。
11,000以上の主観的評価スコアを持つデータセット、データ漏洩を避けるために多言語テストデータセットを継続的に再現するためのパイプライン。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:12:02 GMT)
Multi-Continental Healthcare Modelling Using Blockchain-Enabled Federated Learning [13.2] 局所的なデータセットを共有せずに、多大陸のデータセットを用いたグローバルヘルスケアモデリングのためのフレームワークを提案する。
技術的には、医療データのプライバシと安全性の要件を満たすために、ブロックチェーン対応のフェデレーション学習が適応して実装されている。
実験結果から,提案するフレームワークは有効で,効率的で,かつ,プライバシーを保護できることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:32:03 GMT)
ChatSR: Multimodal Large Language Models for Scientific Formula Discovery [13.1] ChatSRは、知識のある人間の科学者のように振る舞う。
ChatSRは、自然言語のプロンプトに含まれる以前の知識をよく理解し、生成した表現の質を向上させることができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:22:55 GMT)
AI-based Multimodal Biometrics for Detecting Smartphone Distractions: Application to Online Learning [13.1] 本稿では、生理的信号と頭部ポーズデータを利用して、電話の使用を検出するAIベースのアプローチを提案する。
以上の結果から,脳波や心拍数などの生体信号の精度は低く,頭部ポーズだけで87%の精度が得られた。
すべての信号を組み合わせたマルチモーダルモデルは91%の精度に達し、統合の利点を強調している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:38:12 GMT)
Information-Theoretic Proofs for Diffusion Sampling [13.1] 本稿では, 拡散法に基づくジェネレーティブ・モデリング手法の基本的, 自己完結型分析法を提案する。
拡散ステップサイズが十分に小さい場合、サンプリング分布はターゲット分布に確実に近いことを示す。
また,各ステップの高次モーメントを一致させるために,各ステップに付加的なランダム性を用いることで収束を加速する方法についての透過的なビューを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:42:23 GMT)
RCStat: A Statistical Framework for using Relative Contextualization in Transformers [13.1] RCStat (Relative Contextualization) による生の注意ログを利用した統計フレームワークについて紹介する。
i)キー値圧縮、RCベースのしきい値が、品質損失を最小限に抑えたキャッシュ削減のための適応的なキー値消去を駆動する、(ii)属性、(ii)RCが、ポストソフトマックス法よりも高い忠実度トークン、文、チャンクレベルの説明を得る、という2つの応用を実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:55:43 GMT)
Vision Transformer-Based Time-Series Image Reconstruction for Cloud-Filling Applications [13.0] マルチスペクトル画像(MSI)における雲の被覆は、初期収穫のマッピングにおいて重要な課題となる。
雲に覆われた領域のMSIデータを再構成するために、視覚変換器(ViT)を用いた時系列MSI画像再構成という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:00:36 GMT)
MaizeField3D: A Curated 3D Point Cloud and Procedural Model Dataset of Field-Grown Maize from a Diversity Panel [12.9] そこで本研究では,多種多様な遺伝子パネルから3次元点群を解析した。
MaizeField3Dは、AIによる表現型化、植物構造解析、農業研究における3D応用のための基礎的なデータセットとして機能する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:04:30 GMT)
Personality Prediction from Life Stories using Language Models [12.9] 本研究では,5要素モデル(FFM)の性格特性を予測するために,2000トークンを超える長話インタビューをモデル化することの課題に対処する。
まず,事前学習した言語モデルのスライディング・ウインドウ・ファインタニングを用いてコンテキスト埋め込みを抽出し,長期依存性を統合し,解釈可能性を高めるための注意機構を備えたリカレントニューラルネットワーク(RNN)を適用する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:39:06 GMT)
COLUR: Confidence-Oriented Learning, Unlearning and Relearning with Noisy-Label Data for Model Restoration and Refinement [12.8] 本稿では,堅牢なモデル復元・改良(MRR)フレームワークCOLURを提案する。
COLURはラベルノイズの影響を解き明かし、各ラベルに対するモデルの信頼性を洗練して再学習する。
4つの実データセットで大規模な実験を行い、全ての評価結果から、COLURはMRR後の他のSOTA法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:33:48 GMT)
Impact of Heavy Noble Gases on the Magnetic Resonance Linewidth of Alkali-Metal Atoms: A Theoretical Study [12.6] 本研究では, キセノン誘起二体・三体相互作用が, 現実的なNMRG条件下でアルカリ金属原子の直線幅をどう変化させるかを検討した。
Xe原子は主に二元系スピンジャイロスコープ衝突とファンデルワールス(vdW)を介するF減衰過程によって線幅を広げる。
窒素緩衝ガスは二元衝突によるアルカリ-金属スピン緩和に直接寄与し、分子寿命を変化させることで間接的にvdW衝突速度を調節する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:13:21 GMT)
KnowMap: Efficient Knowledge-Driven Task Adaptation for LLMs [12.4] 環境および経験データから知識ベースを動的に構築する新しいアプローチであるKnowMapを提案する。
KnowMapは、大きな言語モデルに価値のあるタスク固有の知識を持たせるために、小さな知識埋め込みモデルを微調整する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:30:38 GMT)
New Insights on Unfolding and Fine-tuning Quantum Federated Learning [12.2] 本研究は,Quantum Federated Learning(QFL)の中核的な限界に対処し,医療やゲノム研究などの複雑な課題への適用性を合理化したものである。
自己適応型微調整の開発により, 遺伝子発現解析や癌検出, 診断精度の向上, 量子システム内における予測モデリングなどの重要な応用に特に有効であることが証明された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:17:48 GMT)
ReMAR-DS: Recalibrated Feature Learning for Metal Artifact Reduction and CT Domain Transformation [12.2] kVCT画像のアーチファクトは画像品質を低下させ、臨床的決定に影響を及ぼす。
我々は,kVCTからMega-Voltage CT(MVCT)へのメタアーティファクトリダクションとドメイン変換のためのディープラーニングフレームワークを提案する。
提案するフレームワークであるReMAR-DSは、エンコーダ・デコーダアーキテクチャを利用して、機能リカバリを強化し、解剖学的構造を保ちながらアーティファクトを効果的に削減する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:34:35 GMT)
Experimental Assessment of Neural 3D Reconstruction for Small UAV-based Applications [12.2] 無人航空機(UAV)の小型化は、その展開能力を屋内および難航地域に拡大した。
本稿では,ニューラル3Dレコンストラクション(N3DR)を小型UAVシステムと組み合わせることで,これらの制約を克服する新しいアプローチを提案する。
具体的には,N3DRをベースとしたパイプラインの設計,実装,評価を行う。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:25:17 GMT)
MOST: MR reconstruction Optimization for multiple downStream Tasks via continual learning [12.1] 個別に訓練された再構成ネットワークと下流タスクネットワークをカスケーディングすることで、性能劣化がもたらされることが示されている。
この最適化を順次導入した複数のダウンストリームタスクに拡張し,複数のダウンストリームタスクに対して単一のMR再構成ネットワークを最適化できることを実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:38:57 GMT)
Quantum Resource Theories of Anyonic Entanglement [12.1] 本稿では,全絡み,従来の絡み,正電荷絡みを定量化する3つの尺度を提案する。
本研究は, 全絡み構造を従来の絡み構造とACEに分解し, 異質な絡み構造を呈することを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:54:14 GMT)
ChordPrompt: Orchestrating Cross-Modal Prompt Synergy for Multi-Domain Incremental Learning in CLIP [12.0] 継続学習は、事前訓練された視覚言語モデルに、新規または以前は表現されていないデータ分布に効果的に適応させる権限を与える。
ChordPromptは、視覚情報とテキスト情報の相互作用を活用するためのクロスモーダルプロンプトを導入している。
ChordPromptはゼロショットの一般化とダウンストリームのタスクパフォーマンスにおいて最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:22:06 GMT)
What Makes the Best Decomposition? Investigating Binary Decomposition Under FCG Variance [12.0] 様々なコンパイル設定でコンパイルされた関数呼び出しグラフの分散に関する最初の系統的研究を行う。
FCGのサイズは劇的に変化しますが、FCGは3種類のマッピングでリンクされています。
本稿では, 最適分解を同定し, 既存の分解処理と最適分解を比較する方法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:43:28 GMT)
PrivacyXray: Detecting Privacy Breaches in LLMs through Semantic Consistency and Probability Certainty [11.9] 大規模言語モデル(LLM)は、医療、金融、法律サービスなど、機密性の高い領域で広く使われている。
PrivacyXrayは、LDMの内部状態を解析してプライバシー侵害を検出する新しいフレームワークである。
5つのLLMで平均92.69%の精度で一貫した性能を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:22:59 GMT)
Overtuning in Hyperparameter Optimization [11.9] オーバーチューニングの正式な定義を提供し、メタオーバーフィッティングのような関連する概念と区別する。
我々はHPOベンチマークデータを大規模に再解析し、オーバーチューニングの頻度と重症度を評価する。
以上の結果から,オーバーチューニングは従来想定されていたよりも一般的であり,通常は軽度であるが,時には重度であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:49:48 GMT)
From High-SNR Radar Signal to ECG: A Transfer Learning Model with Cardio-Focusing Algorithm for Scenarios with Limited Data [11.9] この研究は、限られたデータを持つ新しいシナリオにおけるレーダベースのECGリカバリに焦点を当てる。
転写学習モデル(RFcardi)を提案し,心電図の真偽を示さずにレーダ信号から心臓関連情報を抽出する。
RFcardiモデルは、少数のレーダーECGペアを使用してトレーニングを行い、忠実なECG回復を効果的に生成することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:38:34 GMT)
Discovering Symmetries of ODEs by Symbolic Regression [11.9] 探索に基づく記号回帰は、リー点対称性の生成元を見つけるタスクに適応する。
このアプローチにより、既存の計算機代数系では見つからないODEの対称性を見つけることができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:55:59 GMT)
A Qubit-Efficient Hybrid Quantum Encoding Mechanism for Quantum Machine Learning [11.9] 量子主測地解析(Quantum principal Geodesic Analysis, QPGA)は、次元の減少と量子ビット効率の符号化のための非可逆的手法である。
我々は、qPGAは量子およびハイブリッドオートエンコーダよりも局所構造を効率的に保存することを示した。
下流のQML分類タスクでは、qPGAは99%以上の精度を達成でき、MNISTとFashion-MNISTのF1スコアは量子依存ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:09:16 GMT)
Model Guidance via Robust Feature Attribution [11.7] 提案手法は,最先端手法と比較してテスト時の誤分類を20%削減する。
また、実験前の設定を自然言語処理タスクを含むように拡張します。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:47:15 GMT)
USIS16K: High-Quality Dataset for Underwater Salient Instance Segmentation [11.6] 16,151個の高分解能水中画像からなる大規模データセットであるUSIS16Kを紹介する。
各画像には高品質のインスタンスレベルのサルエントオブジェクトマスクが付加されている。
USIS16Kを用いた水中物体検出とUSISタスクのベンチマーク評価を行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:58:01 GMT)
SAM2-SGP: Enhancing SAM2 for Medical Image Segmentation via Support-Set Guided Prompting [11.4] 人為的なプロンプトへの依存は、SAM2を医療画像のセグメンテーションタスクに適応させる上で大きな課題となる。
我々は,手動プロンプトの必要性を解消するフレームワークであるSAM2-SGP(サポートセット誘導プロンプト)を用いたSAM2を提案する。
提案モデルはSAM2のメモリ機構を活用し,Pseudo-mask Generation (PMG)モジュールを用いたサポートセットからイメージマスクペアを用いて擬似マスクを生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:22:25 GMT)
Dimension Reduction for Symbolic Regression [11.4] シンボリック回帰アルゴリズムを評価するための1つの尺度は、有限標本からシンボリック同値までの公式を復元する能力である。
有効な置換を確実に識別し,様々な種類の最先端のシンボル回帰アルゴリズムの性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:46:05 GMT)
Scaling Speculative Decoding with Lookahead Reasoning [11.3] トークンレベルの投機的復号法(SD)は有効だが、その利点は秘められている。
並列性の第2段層を利用したLookahead Reasoningを開発した。
Lookahead Reasoningは、回答の品質を維持しながら、SDの1.4倍から2.1倍のスピードアップを改善する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:48:10 GMT)
M3D: Manifold-based Domain Adaptation with Dynamic Distribution for Non-Deep Transfer Learning in Cross-subject and Cross-session EEG-based Emotion Recognition [11.3] 本稿では,M3D(Manifold-based Domain Adaptation with Dynamic Distribution)を提案する。
M3Dは、多様体特徴変換、動的分布アライメント、分類器学習、アンサンブル学習の4つの重要なモジュールで構成されている。
実験の結果,M3Dは平均4.47%の精度で従来の非深度学習法より優れていた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:07:48 GMT)
TeViR: Text-to-Video Reward with Diffusion Models for Efficient Reinforcement Learning [11.2] 本稿では,事前学習したテキスト・ビデオ拡散モデルを利用して高密度報酬を生成するTeViRを提案する。
11の複雑なロボットタスクに対する実験結果は、TeViRが従来の手法より優れていることを示している。
複雑な環境でエージェントを効率的に誘導するTeViRの能力は、ロボット操作における強化学習の応用を前進させる可能性を強調している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:29:35 GMT)
Automated Detection of Pre-training Text in Black-box LLMs [11.2] VeilProbeは、人間の介入なしにブラックボックス設定で事前学習されたテキストを自動的に検出するフレームワークである。
これは、入力テキストと大言語モデルによって生成された対応する出力接尾辞との間の潜時マッピングの特徴を推論する。
キートークンの摂動を実行し、より区別可能なメンバシップ機能を得る。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:08:15 GMT)
FlightKooba: A Fast Interpretable FTP Model [11.2] 本稿では,HIPPO法,クープマン理論,サイバネティックスによる状態空間方程式に基づく新しいモデリングと制御フレームワークであるFlight Koobaを提案する。
構造状態空間方程式のアイデアにインスパイアされたFlightKoobaは、データからクープマン作用素を直接構成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:53:49 GMT)
An accuracy-runtime trade-off comparison of scalable Gaussian process approximations for spatial data [11.1] 我々は,確率評価,パラメータ推定,予測に関する異なるガウス過程近似の精度を体系的に比較した。
ほぼ全ての実験において、ヴェッキア近似は最も正確なものとして一貫して現れる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:26:05 GMT)
Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation [11.1] Aug2Searchは、Generative AI(GenAI)モデルによって生成された合成データを活用するEBRベースのフレームワークである。
本稿では,GenAI,特にLarge Language Models(LLMs)の高品質な合成データ生成能力について検討する。
Aug2Searchは1億の合成データサンプルを使用して、ROC_AUCの最大4%の改善を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:46:45 GMT)
Interrogating AI: Characterizing Emergent Playful Interactions with ChatGPT [10.9] 本研究では,人気のAI技術であるChatGPTのユーザによる遊び的なインタラクションに焦点を当てた。
ユーザ談話の半数以上(54%)が遊び心のあるインタラクションを中心に展開していることがわかった。
これらのインタラクションが、AIのエージェンシーを理解し、人間とAIの関係を形作り、AIシステムを設計するための洞察を提供する上で、どのように役立つかを検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:45:18 GMT)
Scaling Up Unbiased Search-based Symbolic Regression [10.9] そこで本研究では, 最先端の記号回帰法により得られた手法よりも, 解の精度が向上することを示す。
特に、体系的な探索は、真の根底にある記号表現を回復する能力の観点から、最先端のシンボル回帰器より優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:47:19 GMT)
CycleDistill: Bootstrapping Machine Translation using LLMs with Cyclical Distillation [10.9] CycleDistillはモノリンガルコーパスからゼロまたは少数ショットMTを介して合成平行コーパスを生成するブートストラップ方式である。
単言語コーパスにのみ依存することで、CycleDistillは高品質な機械翻訳を実現し、最初のイテレーションで20-30 chrFポイントを超える数ショットのベースラインモデルを改善することができる。
また, 蒸留プロセスにおけるソフトマックス活性化の効果について検討し, 翻訳品質の軽度改善を観察した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:56:57 GMT)
When Domains Collide: An Activity Theory Exploration of Cross-Disciplinary Collaboration [10.7] 学際的ソフトウェア開発チームは、ますます多様化し、組み込まれ、学際的になっています。
予想に異議を唱え、問題解決の視点を分散させ、対立する優先順位は摩擦を引き起こす。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:51:35 GMT)
VReaves: Eavesdropping on Virtual Reality App Identity and Activity via Electromagnetic Side Channels [10.6] 本稿では,VRアプリ識別とアクティビティ認識のためのVRヘッドセットの電磁エマレーション側チャネルを盗聴するシステムであるVReavesについて述べる。
まず、信号処理パイプラインを介して、VRヘッドセットに埋め込まれたIoTセンサー(カメラやマイクなど)から電磁エマニュエーションを特徴付ける。
市販の市販VRデバイスを用いた実験により,電磁エマレーション側チャネルによるVRアプリの識別とアクティビティ認識の効率化が実証された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:33:43 GMT)
Center of Gravity-Guided Focusing Influence Mechanism for Multi-Agent Reinforcement Learning [10.6] Focusing Influence Mechanism (FIM)は、エージェントの影響をタスククリティカルな要素に向けることで協調を強化するフレームワークである。
FIMは,(1)エージェント動作下での安定性に基づくCoG状態次元の同定,(2)これらの次元に有意義な影響を及ぼすために反現実的な報酬を設計すること,(3)永続的で同期的な焦点を奨励すること,の3つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:35:15 GMT)
Commander-GPT: Dividing and Routing for Multimodal Sarcasm Detection [10.5] コマンド-GPT(Command-GPT)は、軍事コマンド理論にインスパイアされたモジュール型決定ルーティングフレームワークである。
我々のフレームワークは、最先端(SoTA)ベースラインよりもF1スコアが4.4%、11.7%向上している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:38:32 GMT)
"I know myself better, but not really greatly": How Well Can LLMs Detect and Explain LLM-Generated Texts? [10.5] 本稿では,2進(人間対LLM生成)と3進分類(未決定クラスを含む)の2つの設定において,現在のLLMの検出と説明能力について検討する。
異なる大きさの6つのオープンソースLCMを評価し、自己検出(LLM)が相互検出(他のLCMからの出力の同定)を一貫して上回っていることを発見した。
本研究は, 自己検出・自己説明における現在のLCMの限界を浮き彫りにして, 過度に適合し, 一般化性を高めるためのさらなる研究の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:03:17 GMT)
Screen Them All: High-Throughput Pan-Cancer Genetic and Phenotypic Biomarker Screening from H&E Whole Slide Images [10.4] OmniScreenは、60,529人のがん患者から抽出されたVirchow2の埋め込みを利用したAIベースのシステムである。
統一されたモデルを用いて、がん全体にわたる幅広い臨床関連バイオマーカーを予測する。
治療標的を確実に同定し、稀な腫瘍と稀な腫瘍に共通する表現型の特徴を共有できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:10:17 GMT)
WAFFLE: Finetuning Multi-Modal Model for Automated Front-End Development [10.3] We introduced Waffle, a new fine-tuning strategy that using a structure-ware attention mechanism to improve LLMs's understanding of HTML's structure。
Waffleで微調整されたモデルでは、HTMLマッチが9.00pp(パーセント)、CW-SSIMが0.0982、CLIPが32.99pp、LLEMが27.12ppである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:35:02 GMT)
The Most Important Features in Generalized Additive Models Might Be Groups of Features [10.3] 本稿では,GAM(Generalized Additive Models)における特徴群の重要性を判定するための新しいアプローチを提案する。
本稿では, 群重心の挙動を多種多様なデータ構造で示す3つの合成実験において, 提案手法の特性について述べる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:25:24 GMT)
HeurAgenix: Leveraging LLMs for Solving Complex Combinatorial Optimization Challenges [10.1] ヒューリスティックアルゴリズムは最適化(CO)問題を解く上で重要な役割を果たす。
HeurAgenixは、大規模言語モデル(LLM)を利用した2段階の超ヒューリスティックフレームワークである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:48:12 GMT)
Continual Retinal Vision-Language Pre-training upon Incremental Imaging Modalities [10.0] RetCoPは、ファンドドメインにおける最初の連続的なビジョン言語事前トレーニングフレームワークである。
異なる画像モダリティから画像とテキストの特徴を段階的に統合した基礎モデルに統合する。
実験により、RetCoPは比較したすべての手法より優れており、最高の一般化と最小の忘れ率を達成することが示されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:18:31 GMT)
Intrinsic Quantum Mpemba Effect in Markovian Systems and Quantum Circuits [10.0] 量子Mpemba効果(QME)は、平衡から遠く離れた系が平衡に近い状態に達する反直観現象を記述している。
本稿では、量子状態によって追跡される軌道長を距離のより適切な尺度として用いた固有量子Mpemba効果(IQME)を提案する。
この研究は、量子状態の進化についての理解を深め、新しい量子力学の振る舞いを正確に捉えるための基礎を築いた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:52:06 GMT)
Surgery-R1: Advancing Surgical-VQLA with Reasoning Multimodal Large Language Model via Reinforcement Learning [9.9] 外科用VQLA(Surgery-R1)のための最初のマルチモーダル大言語モデルを提案する。
Surgery-R1はMLLM(Reasoning Multimodal Large Language Models)の開発にインスパイアされている
実験の結果,オペレーショナル-R1は,手術-VQLAタスクや広く使用されているMLLMにおいて,既存の最先端(SOTA)モデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:53:10 GMT)
Health Sentinel: An AI Pipeline For Real-time Disease Outbreak Detection [9.8] Health Sentinelは、MLと非MLメソッドを組み合わせた情報抽出パイプラインである。
Health Sentinelは3億以上のニュース記事を処理し、インド全体で9万5000以上のユニークな健康イベントを特定した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:54:37 GMT)
Fourier Multi-Component and Multi-Layer Neural Networks: Unlocking High-Frequency Potential [9.7] 本稿では,FMMNN(Fourier Multi-Component and Multi-Layer Neural Network)を紹介する。
我々は、FMMNNが高周波成分のモデリングに非常に効果的で柔軟なことを実証した。
また、FMMNNの最適化状況を分析し、標準の完全連結ニューラルネットワークよりもずっと好都合であることを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:50:17 GMT)
Path Learning with Trajectory Advantage Regression [9.6] 本稿では,強化学習に基づくオフライン経路学習と経路帰属の手法であるトラジェクトリ・アドバンテージ・レグレッションを提案する。
提案手法は回帰問題のみをアルゴリズム的に解きながら経路最適化問題を解くのに利用できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:05:23 GMT)
Are We There Yet? A Brief Survey of Music Emotion Prediction Datasets, Models and Outstanding Challenges [9.6] 利用可能な音楽感情データセットの概要を概観し,評価基準とフィールドでの競争について論じる。
我々は、データセットの品質、アノテーションの一貫性、モデル一般化に関連する問題など、音楽の感情を正確に捉え続ける課題を強調した。
音楽感情認識の今後の進歩には、標準化されたベンチマーク、より大規模で多様なデータセット、モデル解釈可能性の改善が必要であると論じる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:19:36 GMT)
Video-XL-2: Towards Very Long-Video Understanding Through Task-Aware KV Sparsification [9.6] Video-XL-2は、タスク対応KVスペーシングに基づく長時間ビデオ理解に優れたコスト効率を提供する新しいMLLMである。
NVIDIA A100(80GB)のGPUで1万フレーム以上を処理でき、数千フレームをほんの数秒で処理できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:19:56 GMT)
Rethinking Neural Combinatorial Optimization for Vehicle Routing Problems with Different Constraint Tightness Degrees [9.6] 最近のニューラル最適化(NCO)手法は、ドメイン固有の専門知識を必要としない、有望な問題解決能力を示している。
本稿では,キャパシティ制約の厳密度が異なるNCO性能を実験的に解析するために,キャパシティ制約付き車両ルーティング問題(CVRP)を例に挙げる。
本研究では,制約のきつい度合いを明示的に考慮した効率的なトレーニング手法を開発し,汎用的な解法を学習するためのマルチエキスパートモジュールを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:24:26 GMT)
Overlap-Aware Feature Learning for Robust Unsupervised Domain Adaptation for 3D Semantic Segmentation [9.6] 3Dポイントクラウドセマンティックセグメンテーション(PCSS)は、ロボットシステムと自律運転における環境認識の基礎である。
既存の方法は、現実の摂動(例えば、雪、霧、雨)と敵の歪みに固有の脆弱性を批判的に見落としている。
この研究は、まず、現在のPCSS-UDAロバスト性を損なう2つの本質的な制限を特定する。
1) 強靭性指標による敵攻撃・破壊タイプに対するレジリエンスを定量化する頑健性評価モデル,2) 注意誘導重複抑制による識別構造を維持しつつ,双方向のドメインマッピングを可能にする非可逆的注意アライメントモジュール(IAAM) とからなる三部構成のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:45:50 GMT)
Retrieval-Confused Generation is a Good Defender for Privacy Violation Attack of Large Language Models [9.6] プライバシー侵害攻撃(PVA)は、Staabらによって明らかにされ、深刻なプライバシー問題を引き起こしている。
既存のディフェンス方式は主に大きな言語モデル(LLM)を利用して入力クエリを匿名化している。
本稿では,PVAを効率よく,かつ隠蔽的に防御できるLLMの検索強調生成(RCG)に基づく新しい防衛パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:28:29 GMT)
Zero-Shot EEG-to-Gait Decoding via Phase-Aware Representation Learning [9.5] ドメイン一般化型脳波-モーションデコーディングフレームワークであるNeuroDyGaitを提案する。
構造化されたコントラスト表現学習とリレーショナルドメインモデリングを使用して、脳波とモーション埋め込みのセマンティックアライメントを実現する。
ベンチマークデータセットのクロスオブジェクト歩行復号における適応や優れた性能を必要とせずに、見えない個人に対するゼロショットモーション予測を実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:03:49 GMT)
Can Language Models Replace Programmers for Coding? REPOCOD Says 'Not Yet' [9.5] 大規模言語モデル(LLM)の機能を評価するために、多くのリポジトリレベルのコード生成ベンチマークが登場した。
これらのベンチマークは、短い補完、合成例、または限られたスケールのリポジトリに焦点を当て、現実世界のコーディングタスクを表現できない。
実世界の大規模プロジェクトで現実的な依存関係を持つ複雑なタスクを含むPythonコード生成ベンチマークであるREPOCODを作成します。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:49:51 GMT)
Understanding Reasoning in Thinking Language Models via Steering Vectors [9.4] 我々はDeepSeek-R1-Distillモデルにおいて、特定の推論動作を分析し、操作する。
これらの挙動はモデルの活性化空間における線形方向によって媒介され、ステアリングベクトルを用いて制御できることを実証する。
提案手法は,思考モデルにおける推論過程を制御的かつ解釈可能な方法で操る実用的なツールを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:53:33 GMT)
Ormer: A Manipulation-resistant and Gas-efficient Blockchain Pricing Oracle for DeFi [9.2] 平均的時間重み付き平均価格(TWAP)オーラクルは、時間枠を短くして資産価格を平均化することによって価格供給を処理するために広く使用されている。
この問題に対処するために,新しいオンチェーンガス効率価格アルゴリズム(Ormer)を提案する。
Ormerは平均絶対価格誤差を15.3%、時間遅延を49.3%削減する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:48:21 GMT)
HOIverse: A Synthetic Scene Graph Dataset With Human Object Interactions [9.2] HOIverseはシーングラフと人間とオブジェクトの相互作用の交差点における合成データセットである。
対象物と対象物とのパラメトリックな関係を計算した。
我々は、パラメトリックな関係と人間とオブジェクトの相互作用を予測するために、最先端のシーングラフ生成モデルにデータセットをベンチマークする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:00:31 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1] 本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。
連続変数、整数変数、カテゴリー変数に対処する。
混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:09:47 GMT)
Do Vendi Scores Converge with Finite Samples? Truncated Vendi Score for Finite-Sample Convergence Guarantees [9.1] 制限標本サイズ下でのベンディ値とRKE値の収束について検討した。
カーネル行列の固有スペクトルをトラッピングすることにより、$t$-truncated Vendiスコアを導入する。
ベンディスコアとは対照的に、RKEスコアがすべてのカーネル関数の普遍収束保証を享受していることを証明する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:25:00 GMT)
Duality and Policy Evaluation in Distributionally Robust Bayesian Diffusion Control [8.9] 予測端末数値ユーティリティの拡散制御問題について考察する。
コントローラは、基礎となる拡散の未知のドリフトに事前分布を課す。
実際には、前者は一般的に誤って指定され、モデルの誤特定の程度は、政策のパフォーマンスに重大な影響を与える可能性がある。
本稿では, ベースラインの分岐近傍で事前選択した相手に対して, コントローラがゲームをする, 分布的に堅牢なベイズ制御(DRBC)の定式化を導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:58:49 GMT)
NTRL: Encounter Generation via Reinforcement Learning for Dynamic Difficulty Adjustment in Dungeons and Dragons [8.9] ダンジョンズ&ドラゴンズ(D&D)における動的困難調整(DDA)を自動化する新しいアプローチ
NTRLは、問題を文脈的盗聴としてフレーミングすることで、リアルタイムのパーティーメンバー属性に基づいて遭遇を生成する。
古典的DMと比較して、NTRLは遭遇を反復的に最適化して戦闘長寿(+200%)を延長し、党員へのダメージを増大させ、試合後のヒットポイントを減少させ、プレイヤーの死亡数を増大させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:34:01 GMT)
Generating and Understanding Tests via Path-Aware Symbolic Execution with LLMs [8.8] PALMは、シンボリックパス列挙とLLM支援テスト生成を組み合わせたテスト生成システムである。
Palmは、パスカバレッジをよりよく理解し、PALMが生成したテストで実際にどのパスが実行されているかを特定するのに役立つ。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:46:16 GMT)
Detecting Machine-Generated Texts: Not Just "AI vs Humans" and Explainability is Complicated [8.8] そこで本研究では,新たな3次テキスト分類手法を導入し,いずれの情報源にも起因する可能性のあるテキストの「未決定」カテゴリを追加する。
この研究は、単に分類から機械が生成したテキストの説明へとパラダイムをシフトさせ、ユーザーに対して明確で理解可能な説明を提供するための検出器の必要性を強調した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:45:05 GMT)
FuncVul: An Effective Function Level Vulnerability Detection Model using LLM and Code Chunk [8.7] ソフトウェアサプライチェーンの脆弱性は、攻撃者が広く使われているパッケージやライブラリに脆弱性のあるコードを注入する際に発生する。
本稿では,C/C++とPythonの関数レベル脆弱性検出のためのコードチャンクベースモデルであるFuncVulを紹介する。
FuncVulは、より小さくクリティカルなコードセグメントに焦点を当てて、関数内の複数の脆弱性を特定する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:30:40 GMT)
Systematic Comparison of Projection Methods for Monocular 3D Human Pose Estimation on Fisheye Images [8.7] 本研究では, ピンホール, 等距離, 二重球面カメラモデル, 円筒投影法が人の3次元ポーズ推定精度に与える影響について検討した。
クローズアップシナリオではピンホールプロジェクションが不十分であり、最適プロジェクション法は人間のポーズによってカバーされるFOVによって変化する。
本稿では,予測品質を向上させるため,検出バウンディングボックスに基づいて適切な投影モデルを選択する手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:05:36 GMT)
Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups [8.7] SOP(Sum-of-Parts)は、任意の差別化可能なモデルをグループベースのSANNに変換するフレームワークである。
SOPは、視覚および言語タスクにおけるSANNの最先端のパフォーマンスを達成する。
定量的およびセマンティックな指標に基づいて,これらの群が解釈可能であることを検証した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:57:39 GMT)
Mem4Nav: Boosting Vision-and-Language Navigation in Urban Environments with a Hierarchical Spatial-Cognition Long-Short Memory System [8.6] 大規模都市環境における視覚・言語ナビゲーション (VLN) は、複雑な場面で言語指導を行うための具体的エージェントを必要とする。
階層型空間認識長短メモリシステムである textbfMem4Nav を導入し,任意のVLNバックボーンを拡張できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:00:43 GMT)
AnchorDP3: 3D Affordance Guided Sparse Diffusion Policy for Robotic Manipulation [8.6] AnchorDP3は、デュアルアームロボット操作のための拡散ポリシーフレームワークである。
大規模で手続き的に生成されたシミュレーションデータに基づいて訓練される。
RoboTwinベンチマークの平均成功率は98.7%に達する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:03:26 GMT)
Commonsense Generation and Evaluation for Dialogue Systems using Large Language Models [8.6] 本稿では,多種多様なコモンセンス関係に基づく対話システムにおけるターンレベルデータ拡張の課題について検討する。
提案手法は,事前学習されたLarge Language Models (LLM) の拡張知識とゼロショット機能を利用して命令に従う。
予備的な結果から,本手法は対話システムにおける常識推論と評価にLLMを効果的に活用することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:18:05 GMT)
Conversational Intent-Driven GraphRAG: Enhancing Multi-Turn Dialogue Systems through Adaptive Dual-Retrieval of Flow Patterns and Context Semantics [8.5] CID-GraphRAG (対話型インテント駆動グラフ検索生成)
本稿では,マルチターン顧客サービス会話におけるコンテキストコヒーレンスと目標指向の進展を維持する上で,既存の対話システムの限界に対処する新しいフレームワークを提案する。
CID-GraphRAGは、ゴール達成された過去の対話から動的意図遷移グラフを構築し、インテントベースのグラフとセマンティックサーチを適応的にバランスさせる二重検索機構を実装している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:20:45 GMT)
Automatic Prompt Optimization for Knowledge Graph Construction: Insights from an Empirical Study [8.5] テキストからのトリプル(オブジェクト-リレーショナルオブジェクト)抽出は、KG構築の基本的な構成要素である。
NLPタスク(例えば自律生成)における最近の作業では、この課題に対処するために自動的なプロンプト最適化/エンジニアリングを使用している。
我々は、(a)プロンプト戦略、(b)プロンプト最適化とタスク実行に使用されるLLM、(c)スキーマにおける標準関係の数、(d)入力テキストの長さと多様性、(e)プロンプト最適化に使用されるメトリック、および(f)トレーニングとテストに使用されるデータセットを変更することで異なる設定を評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:38:49 GMT)
SycnMapV2: Robust and Adaptive Unsupervised Segmentation [8.5] SyncMapV2は、教師なしセグメンテーションを最先端のロバスト性で解決する最初の方法である。
SyncMapV2は、SOTA法で見られる23.8%の減少に比べて、デジタル汚職下では0.01%のmIoUが最小値の低下を示した。
新しい入力ごとに再初期化を必要とする従来の方法とは異なり、SyncMapV2はオンラインで適応し、人間の視覚の継続的な適応性を模倣する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:07:21 GMT)
Is Long-to-Short a Free Lunch? Investigating Inconsistency and Reasoning Efficiency in LRMs [8.4] 大規模推論モデル(LRM)において,効率的な推論手法が行動の不整合をもたらすかどうかを検討する。
$ICBENCH$は、3次元にわたるLRMの不整合を測定するために設計されたベンチマークである。
より大きなモデルは一般的に小さなモデルよりも一貫性が高いが、すべてのモデルが広く「計画的」な振る舞いを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:25:28 GMT)
Pro-AD: Learning Comprehensive Prototypes with Prototype-based Constraint for Multi-class Unsupervised Anomaly Detection [8.4] 教師なし異常検出のためのプロトタイプベースの再構成手法は、学習可能なプロトタイプの限られたセットを利用する。
本稿では,これらの問題に対処するPro-ADを提案し,そのプロトタイプを完全活用して異常検出性能を向上する。
当社のPro-ADは,マルチクラス非教師付き異常検出タスクにおいて,優れたロバスト性および実用性を示し,最先端性能を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:59:10 GMT)
Bridging the Gap Between Approximation and Learning via Optimal Approximation by ReLU MLPs of Maximal Regularity [8.3] 例えば、$(L,alpha)$-H"older関数は、$mathcalO(dnd/alpha)$, of width $mathcalO(dnd/alpha)$, depth $mathcalO(log(d))$, with $mathcalO(dnd/alpha)$, $mathcalO(dnd/alpha)$, and $mathcalO(dnd/alpha)$, with $mathcal。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:03:32 GMT)
From Worst-Case Hardness of $\mathsf{NP}$ to Quantum Cryptography via Quantum Indistinguishability Obfuscation [8.1] Indistinguishability obfuscation (iO) は多くの意味を持つ強力な暗号プリミティブとして登場した。
本研究では、量子iOのパワーの研究を開始する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:50:33 GMT)
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning [8.1] 拡散モデルを用いたビデオ編集は、ビデオの高品質な編集を作成できる顕著な成果を上げている。
ファーストフレーム誘導編集は、最初のフレームを制御できるが、その後のフレームよりも柔軟性に欠ける。
フレキシブルなビデオ編集のための事前訓練された画像対ビデオ(I2V)モデルに適応するマスクベースのLoRAチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:22:08 GMT)
Deformable Medical Image Registration with Effective Anatomical Structure Representation and Divide-and-Conquer Network [7.9] EASR-DCNという新しいROIベースの登録手法を提案する。
本手法は,有効なROIによる医用画像を表現するとともに,ラベルを必要とせず,これらのROIの独立的なアライメントを実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:11:00 GMT)
An approach to control design for two-level quantum ensemble systems [7.8] 量子アンサンブル系はNMR分光法やロバスト量子制御など様々な応用に現れる。
本研究では,ドリフトレス2レベル量子系の1パラメータファミリーに対して,完全に実装可能な制御戦略を提案する。
収束特性を解析的に確立し,提案手法の有効性を示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:57:58 GMT)
Identifying Physically Realizable Triggers for Backdoored Face Recognition Networks [7.7] 最近の研究では、バックドア顔認識(FR)システムが、特定のサングラスのような自然なトリガーに反応できることが示されている。
本稿では、FRネットワークが自然に実現可能なトリガによって損なわれているかどうかを検知する新しい手法を提案する。
提案手法の有効性をFRネットワークで実証し,トップ5の精度74%でトリガを識別できることを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:36:27 GMT)
A Principled Path to Fitted Distributional Evaluation [7.7] 本研究は、広く使われている適合Q評価を分散OPE設定に拡張することに焦点を当てる。
我々はこの拡張を適合分布評価(FDE)と呼ぶ。
このギャップを埋めるために、理論的に基礎付けられたFDE法を構築するための一連の指針を提示する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:08:56 GMT)
Perspective-Shifted Neuro-Symbolic World Models: A Framework for Socially-Aware Robot Navigation [7.6] ソーシャルナビゲーションのためのニューロシンボリックモデルに基づく強化学習アーキテクチャを提案する。
部分的に観察可能な環境における信念追跡の課題に対処する。
また,信念推定のための視点シフト演算子を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:01:26 GMT)
Generate the Forest before the Trees -- A Hierarchical Diffusion model for Climate Downscaling [7.5] ダウンスケーリングは、地域計画に必要な高解像度の気候データを生成するのに不可欠であるが、従来の手法は計算的に要求されるままである。
拡散フレームワークに容易に拡張可能な階層的サンプリングプロセスを導入する階層的拡散ダウンスケーリング(HDD)モデルを導入する。
HDDはERA5の再解析データセットとCMIP6モデル上での競合精度を実現し、競合する結果の最大半分のピクセルで実行することで計算負荷を大幅に削減する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:39:53 GMT)
Automated Generation of Diverse Courses of Actions for Multi-Agent Operations using Binary Optimization and Graph Learning [7.5] 本稿では,エージェントとタスクの互換性がソフトに変化する操作に対して,多様なCOAプールを生成するための新しい理論的定式化および計算フレームワークを提案する。
シミュレーション環境におけるCOA生成プロセスのテストは、ランダムウォークベースライン、タスクシークエンシングにおける最適性ギャップの小さいこと、および5エージェント/100タスク操作で最大20COAを計画するのに約50分を要した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:58:30 GMT)
Unfolding the Past: A Comprehensive Deep Learning Approach to Analyzing Incunabula Pages [7.5] インキュナブラページの構造と内容を自動的に解析するための概念実証法を開発した。
Jagiellonian Digital Libraryのリソースを使用して、5つの異なるインキュナブラから500ページの注釈付きのカスタムデータセットが作成された。
オブジェクト検出を行うため、YOLO11nとYOLO11sモデルは2つの戦略を用いて採用、訓練された。
その後、TesseractとKraken OCRの両方を用いて、Textに分類された領域で光学的文字認識が行われた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:19:13 GMT)
Rich Interoperable Metadata for Cultural Heritage Projects at Jagiellonian University [7.5] MARC 21やDublin Coreといったコア標準は、柔軟性が十分ではないため、ライブラリに格納されたオブジェクトのために現在作成されたリッチなメタデータは保存できない。
我々は、現在JUで収集されているオブジェクトのメタデータを、文化遺産コミュニティが使用している5つの幅広いメタデータ標準と比較した。
予備的な結果は両者のマッピングが本当に問題であることを示しましたが、JU文化遺産メタデータスキーマのさらなる研究に追従すべき要件を特定しました。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:12:22 GMT)
AMF-MedIT: An Efficient Align-Modulation-Fusion Framework for Medical Image-Tabular Data [7.3] AMF-MedITは医用画像と表データ統合のための効率的なAlign-Modulation-Fusionフレームワークである。
AMF-MedITはマルチモーダル性能とデータ効率のバランスが良い。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:10:35 GMT)
KnowML: Improving Generalization of ML-NIDS with Attack Knowledge Graphs [7.2] 我々は,攻撃知識をML-NIDSに統合する知識誘導機械学習フレームワークであるKnowMLを提案する。
本研究は,28種類のリアルアタックに対してKnowMLを評価し,その内10種を新たに収集した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:08:58 GMT)
Exploring Developer Experience Factors in Software Ecosystems [7.1] 開発者エクスペリエンス(DX)は、開発者のパフォーマンスと、ソフトウェアエコシステム(SECO)プラットフォームへの継続的な関与において、重要な役割を果たす。
この作業は、主要なDX要因を特定し、SECOの採用とコントリビューションを継続するサードパーティ開発者の決定にどのように影響するかを理解することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:17:24 GMT)
Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning [7.0] 動的マルチエージェントシステムにおいて,チーム構成を双方向に学習するためのフレームワークを提案する。
両チーム構成におけるアルゴリズム特性が政策性能と一般化に与える影響について考察する。
我々は、広く採用されているマルチエージェントシナリオを用いて、競争性能を実証し、ほとんどのシナリオにおける一般化を改善したアプローチを検証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:40:05 GMT)
Words as Trigger Points in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit [7.0] 我々は、トリガーポイントがそのような振る舞いを理解し、モデル化するのに有用な概念であることを示唆する。
元の研究では、個人は特定の引き起こす言葉や話題が言及されたとき、強く、ネガティブな感情反応を示す。
本稿は,これらのトリガーポイントがオンライン討論にも存在していることを明らかにする。
コメントを分析してみると、引き起こす言葉はユーザーのエンゲージメントと敵意を増す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:59:23 GMT)
An Empirical Investigation on the Challenges in Scientific Workflow Systems Development [6.9] この記事では、Stack Overflow(SO)とGitHubにおける開発者と研究者のインタラクションについて検討する。
問題を分析することで、13のトピック(例えば、エラーとバグ修正、ドキュメント、依存性)を特定し、データ構造と操作が最も難しいことを発見した。
また、データ構造や操作、タスク管理、ワークフロースケジューリングといった、SOとGitHubの共通するトピックも見つけました。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:13:29 GMT)
Look to Locate: Vision-Based Multisensory Navigation with 3-D Digital Maps for GNSS-Challenged Environments [6.9] 本稿では, 単眼深度推定, セマンティックフィルタリング, 視覚マップ登録を統合した, 費用対効果の高いマルチセンサナビゲーションシステムを提案する。
実世界の屋内および屋外の運転シナリオにおいて,提案システムは室内で92%,屋外で80%以上の精度を達成した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:44:03 GMT)
ReDit: Reward Dithering for Improved LLM Policy Optimization [6.8] DeepSeek-R1は、ルールベースの報酬システムを通じて、LLM(Large Language Model)推論機能の拡張に成功した。
報酬のハッキングを効果的に軽減する「完璧な」報酬システムであるが、そのような報酬機能はしばしば離散的である。
本稿では、単純なランダムノイズを加えることで離散的な報酬信号をディザリングするReDit(Reward Dithering)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:07:57 GMT)
JoyAgents-R1: Joint Evolution Dynamics for Versatile Multi-LLM Agents with Reinforcement Learning [6.8] ヘテロジニアス多エージェントの協調訓練にグループ相対ポリシー最適化を適用したJoyAgents-R1を提案する。
JoyAgents-R1は、より小さなオープンソースモデルで構築されたより大きなLLMに匹敵する性能を実現していることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:31 GMT)
Multiscale Training of Convolutional Neural Networks [6.8] 高解像度画像上での畳み込みニューラルネットワーク(CNN)のトレーニングは、最も優れたメッシュ上の損失の勾配を評価するコストによってボトルネックとなることが多い。
本稿では,モンテカルロにインスパイアされたマルチレベル・マルチスケール・グラディエント推定法 (MGE) を提案する。
さらに、粗いメッシュの学習問題を最初に解き、次の細かいレベルを“ホットスタート”し、必要な微細メッシュを桁違いに削減するフルマルチスケールトレーニングアルゴリズムにMGEを組み込む。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:04:58 GMT)
Verifiable Unlearning on Edge [6.8] 本稿では,ゼロ知識証明,特にzk-SNARKを用いた検証フレームワークを導入し,プライバシを損なうことなく,パーソナライズされたエッジデバイスモデル上でのデータの非学習を確認する。
我々は、効率的なzk-SNARK証明生成と互換性のある未学習操作を容易にするために、明示的に設計されたアルゴリズムを開発した。
本研究は,個人化による性能改善の最小限の劣化を伴う検証不可能な未学習を実証し,本フレームワークの有効性と有効性を確認した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:24:47 GMT)
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.8] 大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。
既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。
私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:10:59 GMT)
Prover Agent: An Agent-based Framework for Formal Mathematical Proofs [6.6] 本稿では,自動定理証明のためのAIエージェントであるProver Agentを紹介する。
大規模な言語モデル(LLM)と公式な証明アシスタントであるLeanを統合している。
MiniF2Fベンチマークで86.1%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:01:52 GMT)
Preference-Optimal Multi-Metric Weighting for Parallel Coordinate Plots [6.5] そこで本稿では, 最適重量を計算するための原理的定式化法を提案する。
UMAPにより低減された2次元平面上のメートル法トレードオフを可視化するために、様々なレーダチャートを用いてこれを達成した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:48:09 GMT)
Electric-field Quantum Sensing Exploiting a Photogenerated Charge-transfer Triplet State in a Molecular Semiconductor [6.5] 電場センシングは、通常弱いスピン電結合と限られた方向感度のため、難しいままである。
本稿では、有機分子ACRSAにおける光発生電荷移動(CT)スピン三重項状態を用いたコヒーレント電場センシングを実証する。
我々は,有機CT三重項を,原子-SOCを介さずに機能するEフィールドの化学的に多目的かつ方向性に敏感な量子センサとして位置づけた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:01:18 GMT)
Higher-Order Neuromorphic Ising Machines -- Autoencoders and Fowler-Nordheim Annealers are all you need for Scalability [6.5] 次数化に基づくアーキテクチャよりも優れたスケーラビリティを示す高次ニューロモルフィックIsingマシンについて報告する。
イジング基底状態への漸近収束はスピンによって定義される自己エンコーダ潜在空間をサンプリングすることによって保証される。
グラフカラー化などの相互接続行列の間隔に基づく手法は,高次ニューロモーフィックイジングマシンに効果的に適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:17:02 GMT)
Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems [6.5] 推薦システムにおける大規模言語モデル (LLM) はますます顕著になっている。
本稿では,最適化手法の2つのクラス,モデル並列性とデータ並列性について系統的に検討する。
シミュレーションサービス環境における実世界のレコメンデーションデータセットを用いて行った実験は、提案したハイブリッド並列化スキームがトレーニングスループットを30%以上向上することを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:28:50 GMT)
Noise Consistency Training: A Native Approach for One-Step Generator in Learning Additional Controls [6.3] ワンステップジェネレータは、優れた生成品質と計算効率を提供する。
しかし、これらを新しい制御条件に適応させることは、大きな課題となる。
本稿では,新しい制御信号を事前学習したワンステップジェネレータに直接統合するための,新しい軽量なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:58:55 GMT)
DynNPC: Finding More Violations Induced by ADS in Simulation Testing through Dynamic NPC Behavior Generation [6.3] 我々は、自律運転システム(ADS)によって引き起こされるより多くの違反シナリオを生成するためのシナリオベースの新しいテストフレームワークDynNPCを提案する。
具体的には、DynNPCにより、車両の信号とリアルタイム動作に基づいて、シミュレーション実行中に異なる運転戦略を用いて、NPC車両が動的に行動を生成することができる。
ADSにより引き起こされるより多くの違反シナリオを見つける上で,DynNPCの有効性と有効性を示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:02:49 GMT)
Causal-Aware Intelligent QoE Optimization for VR Interaction with Adaptive Keyframe Extraction [6.3] 本稿では,VRゲームにおけるクオリティ・オブ・エクスペリエンス(QoE)を最大化するインテリジェントなフレームワークを提案する。
適応抽出と因果認識強化学習(RL)の統合
実験の結果、我々のフレームワークは対話的なレイテンシを著しく低減し、QoEを強化し、公平性を維持することがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:32:34 GMT)
DiaLLMs: EHR Enhanced Clinical Conversational System for Clinical Test Recommendation and Diagnosis Prediction [6.3] 異種EHRデータを臨床基盤の対話に組み込んだ最初の医療用LDMであるDiaLLMを提案する。
臨床検査基準 (CTR) を策定し, 臨床所見を対応する記述にマッピングし, 検査結果を「正常」 あるいは「異常」と分類する。
DiaLLMは臨床検査の推薦と診断の予測においてベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:47:21 GMT)
3D-SSM: A Novel 3D Selective Scan Module for Remote Sensing Change Detection [6.1] 本研究では,空間面とチャネルの両面からグローバルな情報をキャプチャする3次元選択的スキャンモジュール(3D-SSM)を提案する。
本稿では,時間的相互作用モジュール (SIM) とマルチブランチ抽出モジュール (MBFEM) の2つの重要なコンポーネントについて述べる。
提案手法は,5つのベンチマークデータセットにおける時間変化検出手法と比較して,良好な性能を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:46:31 GMT)
Diffusion-based Task-oriented Semantic Communications with Model Inversion Attack [6.1] タスク指向セマンティックコミュニケーションは、6Gネットワークのための有望なニューラルネットワークベースのシステム設計である。
そこで我々はDiffSemという拡散型セマンティック・コミュニケーション・フレームワークを提案し,セマンティック・インフォメーションの再構築を最適化した。
その結果,DiffSemは分類精度を10.03%向上し,動的チャネル下での安定した性能を維持した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:21:27 GMT)
Adaptive Request Scheduling for CodeLLM Serving with SLA Guarantees [6.1] 既存の大規模言語モデル(CodeMs)は、現代のソフトウェア開発にますます統合されています。
しかし、セルフホスト環境は、リソース制約のあるサービス環境において重要な課題である。
要求毎のSLAの実現可能性と意思決定をリアルタイムで予測する動的戦略であるSABERを提案する。
以上の結果から,SLAを意識した適応スケジューリングが,堅牢で高性能なCodeLL提供の鍵となることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:44:33 GMT)
Interpretable Hybrid Machine Learning Models Using FOLD-R++ and Answer Set Programming [5.9] 並列的に、Answer Set Programming (ASP)のようなシンボリックなメソッドは、解釈可能な論理ルールを提供する。
本稿では,FOLD-R++アルゴリズムとブラックボックスML分類器を併用するハイブリッド手法を提案する。
5つの医学データセットの実験では、統計的に有意なパフォーマンス向上とF1スコアが示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:37:17 GMT)
Persona-Assigned Large Language Models Exhibit Human-Like Motivated Reasoning [5.7] 人間における推論は、アイデンティティ保護のような根底にあるモチベーションのためにバイアスを起こしやすい。
本研究では,4つの政治的・社会的な属性に8つのペルソナを割り当てることによって,大きな言語モデルにおける動機づけが引き起こされるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:35:17 GMT)
Beyond Reconstruction: A Physics Based Neural Deferred Shader for Photo-realistic Rendering [5.7] 本稿では,データ駆動型レンダリングプロセスの分解を目的とした,物理に基づくニューラル遅延シェーディングパイプラインを提案する。
我々は、シェーディングおよびリライティングタスクのためのフォトリアリスティックな結果を生成するために、一般化可能なシェーディング関数を学習する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:59:50 GMT)
Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task Planning [5.6] TAPASは特殊なLLMベースのエージェントを使用して、協調的にドメインモデルを生成し、適応する。
ReAct(Reason+Act)スタイルの実行エージェントは、自然言語の計画翻訳と組み合わせて、動的に生成された計画と現実世界のロボット能力のギャップを埋める。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:02:06 GMT)
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval [5.6] テキストと画像表現を統一するマルチモーダル埋め込みモデルであるjina-embeddings-v4を導入する。
このモデルにはタスク固有のローランド適応(LoRA)アダプタが組み込まれ、さまざまな検索シナリオのパフォーマンスを最適化する。
また、この機能の評価を容易にするために、視覚的にリッチな画像検索に特化した新しいベンチマークであるJina-VDRを導入する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:52:37 GMT)
FORTRESS: Frontier Risk Evaluation for National Security and Public Safety [5.5] 現在のベンチマークは、国家の安全と公共の安全リスクに対する安全の堅牢性をテストするのに失敗することが多い。
forTRESS:500人の専門家による敵のプロンプトと4-7のバイナリー質問のインスタンスベースのルーリックについて紹介する。
各プロンプト-ルブリックペアは、モデルオーバーリフレクションをテストするための対応する良性バージョンを持つ。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:55:23 GMT)
Large Language Models as Span Annotators [5.5] 大規模言語モデル(LLM)は柔軟性とコスト効率のよいアノテーションバックボーンとして機能することを示す。
出力アノテーションあたりのコストのごく一部で,LLMが人間のアノテーションに匹敵するアノテータ間合意(IAA)を達成することを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:11:18 GMT)
TRACED: Transition-aware Regret Approximation with Co-learnability for Environment Design [5.4] 深い強化学習エージェントを目に見えない環境に一般化することは、依然として大きな課題である。
環境設計のための共学習性を考慮した遷移認識レギュレット近似(TRACED)を提案する。
TRACEDは、複数のベンチマークでゼロショットの一般化を改善しながら、強いベースラインよりも環境相互作用を最大2倍少なくするキュリキュラを生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:29:24 GMT)
C-Learner: Constrained Learning for Causal Inference [5.4] 両世界の最良の重み付けを実現する新しいデバイアス化手法を提案する。
我々の制約学習フレームワークは、プラグイン量に対する一階誤差がゼロであるという制約の下で、最高のプラグイン推定器を解く。
本手法は重なり合いの低い設定で優れた性能を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:19:45 GMT)
FineCLIPER: Multi-modal Fine-grained CLIP for Dynamic Facial Expression Recognition with AdaptERs [5.4] 適応器を用いた動的顔表情認識のためのマルチモーダルきめ細粒度CLIP(Fine CLIPER)を提案する。
我々のFine CLIPERは、パラメータが少ないDFEW、FERV39k、MAFWデータセットで調整可能なSOTA性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:42:09 GMT)
Assessing Risk of Stealing Proprietary Models for Medical Imaging Tasks [5.3] 本稿では,ブラックボックス医療画像モデルの盗難攻撃モデルに対する脆弱性について検討する。
我々は,公開データセットを使うことで,敵がMS攻撃を効果的に実行できることを実証する。
我々は,クエリ予算に制限のあるMS能力を向上させるために,QueryWiseと呼ばれる2段階のモデルステルス手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:46:01 GMT)
Brain Mapping with Dense Features: Grounding Cortical Semantic Selectivity in Natural Images With Vision Transformers [5.3] 本稿では,自然界における空間分布型視覚概念とニューラルセレクティビティを関連付ける方法であるBrainSAILを紹介する。
BrainSAILは、事前訓練された視覚モデルから意味的に一貫性があり、密集した空間的特徴を利用する。
カテゴリー選択性のある大脳皮質領域におけるBrainSAILの評価を行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:12:24 GMT)
SoK: Can Synthetic Images Replace Real Data? A Survey of Utility and Privacy of Synthetic Image Generation [5.2] この研究は、PPDSの質問に答えようとしている: 合成データは、実際のデータを効果的に置き換えることができるか?
本研究は,多種多様な手法を体系的に評価することにより,合成データ生成手法の実用・プライバシトレードオフに関する実用的な知見を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:41:34 GMT)
Learning-aided Bigraph Matching Approach to Multi-Crew Restoration of Damaged Power Networks Coupled with Road Transportation Networks [5.2] 破壊後のクリティカルインフラストラクチャネットワーク(CIN)のレジリエンスは、復旧の速度と、運用機能の回復の程度に依存する。
復旧のための資源配分は、どの乗組員が特定のネットワークノードをどの順序で修理するかを決定することを含む最適な計画問題である。
本稿では、乗組員と輸送ノードと電力グリッドノードの2つの相互接続グラフを1つのヘテロジニアスグラフにマージするグラフベースの新しい定式化を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:12:45 GMT)
DaMO: A Data-Efficient Multimodal Orchestrator for Temporal Reasoning with Video LLMs [5.1] 大規模言語モデル(LLM)が最近ビデオドメインに拡張され、洗練されたビデオ言語理解が可能になった。
本稿では,正確な時間的推論とマルチモーダル理解を目的とした,データ効率のよいビデオLLMであるDaMOを紹介する。
構造化された4段階のプログレッシブトレーニングパラダイムを通じてDaMOをトレーニングし、マルチモーダルアライメント、セマンティックグラウンド、時間的推論機能を備えたモデルを段階的に装備する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:59:30 GMT)
Correcting Hallucinations in News Summaries: Exploration of Self-Correcting LLM Methods with External Knowledge [5.1] 大規模言語モデル(LLM)は、一貫性のあるテキストを生成する優れた能力を示している。
彼らは幻覚の問題に悩まされ、実際には不正確な声明を出している。
本稿では,3つの検索エンジンから得られた証拠を用いて,幻覚の要約を正す手法を用いて,最先端の自己修正システム2つについて検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:20:31 GMT)
PromptAug: Fine-grained Conflict Classification Using Data Augmentation [5.1] 競合関連データの増大は、Large Language Modelガードレールによって、ユニークな課題を引き起こします。
本稿では,革新的なLCMに基づくデータ拡張手法であるPromptAugを紹介する。
PromptAugは、コンフリクトと感情データセットの精度とF1スコアの両方で2%の統計的に有意な改善を行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:33:18 GMT)
Privacy Attacks on Image AutoRegressive Models [4.9] 画像自己回帰モデル(IAR)は、画像品質における最先端拡散モデル(DM)と一致する。
IARに関連するプライバシリスクは未調査のままであり、その責任を負うデプロイメントに関する懸念が高まる。
我々は,トレーニング画像の検出において,極めて高い成功率を達成する新しいメンバーシップ推論攻撃(MIA)を開発した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:19:57 GMT)
QHackBench: Benchmarking Large Language Models for Quantum Code Generation Using PennyLane Hackathon Challenges [4.8] 本稿では,量子ハッカソン(QHack)の現実的課題を用いたペニーレーンに基づく量子コード生成のための大規模言語モデルのベンチマークを行う。
我々は、QHackコンペから派生した新しいベンチマークデータセットであるQHackBenchを紹介し、バニラプロンプトとレトリーバル拡張生成(RAG)によるモデル性能の評価を行う。
その結果,PennyLaneデータセットを補足したRAG強化モデルは,特に複雑な量子アルゴリズムにおいて,標準のプロンプトとほぼ同様の結果を生成することがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:54:56 GMT)
MedErr-CT: A Visual Question Answering Benchmark for Identifying and Correcting Errors in CT Reports [4.8] MedErr-CTは医療MLLMのCTレポートにおける誤りの特定と修正能力を評価するための新しいベンチマークである。
ベンチマークには6つのエラーカテゴリが含まれている。4つの視覚中心エラー(Omission, Insertion, Direction, Size)と2つの語彙的エラータイプ(Unit, Typo)だ。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:51:03 GMT)
VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with AtrousLoRA [4.8] 大動脈血管分節に対するSegment Anything Model(SAM)の拡張版であるVesselSAMを提案する。
VesselSAM には,Atrous Attention と Low-Rank Adaptation (LoRA) を統合した新たなモジュールであるAtrousLoRA が組み込まれている。
本稿では,Aortic Vessel Tree (AVT) データセットとType-B Aortic Dissection (TBAD) データセットの2つの挑戦的データセットを用いて VesselSAM を評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:20:36 GMT)
Causal-Paced Deep Reinforcement Learning [4.7] Causal-Paced Deep Reinforcement Learning (CP-DRL)は、相互作用データ近似に基づくタスク間のSCM差を認識するカリキュラム学習フレームワークである。
実証的に、CP-DRLはPoint Massベンチマークの既存のカリキュラム手法よりも優れている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:15:01 GMT)
Consensus-Driven Uncertainty for Robotic Grasping based on RGB Perception [4.7] どちらも対象物の6-DoFポーズを推定し、その推定の不確かさを予測する把握エージェントは、高い不確実性の下で動作しないことを選択することで、タスクの失敗を回避することができる。
本稿では,画像に基づくポーズ推定によって導かれるグリップが,そのグリップが試みられる前に成功するかどうかを予測するための,軽量で深いネットワークのトレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:53:54 GMT)
Persona Features Control Emergent Misalignment [4.7] 我々は,GPT-4oを意図的でないコードで微調整することで,「創発的不整合」を引き起こすことを示す。
内部モデル表現を微調整前後に比較するために「モデル微分」手法を適用する。
また緩和戦略についても検討し,数百個の良性サンプルを瞬時に微調整することで効率よくアライメントを復元できることを見出した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:38:21 GMT)
One Prototype Is Enough: Single-Prototype Activation for Interpretable Image Classification [4.7] 本稿では,ProtoPNetなどのプロトタイプネットワークにインスパイアされた,解釈可能な画像分類のための新しいディープニューラルネットワークを提案する。
ProtoSoloは、分類タスクにおいて優れたパフォーマンスを達成し、説明の認知的複雑さの観点から最高のレベルに達する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:18:35 GMT)
Social Hatred: Efficient Multimodal Detection of Hatemongers [4.6] ヘイト・モンガーの検出における多モーダル・アグリゲーション・アプローチについて考察する。
ユーザーのテキストを 社会的文脈で処理すれば ヘイト・モンジャーの 検出が大幅に改善される
本手法は, コード化されたメッセージの分類, ドッグホイストリング, 人種的ガス照明の改善に有効である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:16:21 GMT)
KunLunBaizeRAG: Reinforcement Learning Driven Inference Performance Leap for Large Language Models [4.6] KunLunBaizeRAGは、複雑なマルチホップ質問応答タスクにおける大規模言語モデル(LLM)の推論能力を高めるために設計された強化学習駆動推論フレームワークである。
主なイノベーションとしては、RAG駆動のReasoning Alignment(RDRA)メカニズム、検索-Think Iterative Enhancement(STIE)メカニズム、Network-Local Intelligent Routing(NLR)メカニズム、プログレッシブハイブリッドトレーニング戦略などがある。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:48:01 GMT)
Unified Neural Backdoor Removal with Only Few Clean Samples through Unlearning and Relearning [4.6] ULRL(UnLearn and ReLearn for backdoor removal)を提案する。
提案手法はまず,ネットワークの損失を小さなクリーンデータセット上で意図的に最大化する未学習フェーズを用いる。
再学習段階では、これらの疑わしいニューロンは、標的の再初期化とコサイン類似性規則化を用いて再分類される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:35:42 GMT)
Lemmanaid: Neuro-Symbolic Lemma Conjecturing [4.6] レマナイド(Lemmanaid)は、実用的な神経象徴性レムマ注射器具である。
LLM(Large Language Models)とシンボリックメソッドを組み合わせる。
我々はIsabelle証明アシスタントの証明ライブラリ上で評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:21:33 GMT)
DIM-SUM: Dynamic IMputation for Smart Utility Management [4.5] DIM-SUMは、頑健な計算モデルをトレーニングするための前処理フレームワークである。
DIM-SUMは、人工的にマスクされたトレーニングデータと本当の欠落パターンのギャップを埋める。
DIM-SUMは、処理時間が少なく、トレーニングデータも大幅に少ないため、従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:38:06 GMT)
DecDEC: A Systems Approach to Advancing Low-Bit LLM Quantization [4.5] 大規模言語モデル(LLM)の量子化は、特にハードウェアリソースが限られているデバイス上の設定において、最近人気を集めている。
我々は、量子化の重要な利点を保ちながら、低ビットLLMの品質を向上させる推論スキームであるDecDECを提案する。
我々は,最先端の量子化手法を改良し,DecDECの有効性を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:03:30 GMT)
Scalable Machine Learning Algorithms using Path Signatures [4.4] この論文は、スケーラブルな機械学習パイプラインにおいて、パスシグネチャの表現力を利用する方法を研究する。
理論的ロバスト性と計算効率を組み合わせ、粗い経路理論と確率論的モデリング、ディープラーニング、カーネルメソッドをブリッジする一連のモデルを導入している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:58:09 GMT)
Benchmarking the Pedagogical Knowledge of Large Language Models [4.4] 本稿では,その教育的知識に基づいて,大規模言語モデルを評価するための新しいデータセットであるThe Pedagogy Benchmarkを紹介する。
これらのベンチマークは、教師のための専門的開発試験から得られた、慎重にキュレートされた質問に基づいて構築されている。
本報告では, 教育的知識に関する質問に対して, 精度が28%から89%の範囲で, 97モデルの結果を報告する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:36:22 GMT)
Self-Supervised Multimodal NeRF for Autonomous Driving [4.4] ニューロビュー合成フレームワーク(NVSF)と呼ばれるNeRF(Neural Radiance Fields)ベースのフレームワークを提案する。
空間の暗黙的な神経表現と、LiDARとカメラの両方の時間変化シーンを共同で学習する。
我々は、静的シーンと動的シーンの両方を含む現実の自律走行シナリオでこれをテストする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:32:15 GMT)
Video Compression for Spatiotemporal Earth System Data [4.3] 大規模な地球系データセットは、標準的なビデオと類似した特徴を示す。
我々は、データセットによるマルチチャネル圧縮のためのライブラリであるxarray videoをビデオとして提示する。
実世界の4つのマルチチャネルデータセットに対して,本ライブラリの有効性を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:20:05 GMT)
Robust OOD Graph Learning via Mean Constraints and Noise Reduction [4.2] Graph Out-of-Distribution (OOD)分類は、特にカテゴリーの不均衡と構造的ノイズの下で、急激なパフォーマンス低下に悩まされることが多い。
本研究は,(1)スキューラベル分布によるマイノリティクラスの性能低下,(2)グラフデータにおける構造ノイズに対する感度向上という2つの課題に対処する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:25:33 GMT)
A Batch-Insensitive Dynamic GNN Approach to Address Temporal Discontinuity in Graph Streams [4.2] 大規模なバッチでトレーニングされたメモリグラフニューラルネットワーク(MDGNN)は、イベントシーケンスを中断することが多い。
BadGNNは、(1)時間リプシッツ規則化(TLR)と(2)適応注意調整(A3)の2つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:31:43 GMT)
heiDS at ArchEHR-QA 2025: From Fixed-k to Query-dependent-k for Retrieval Augmented Generation [4.2] 本稿では、ArchEHR-QA 2025共有タスクのためのHeiDSと呼ばれるチームのアプローチについて述べる。
検索拡張生成(RAG)フレームワークを用いたパイプラインは、患者固有の質問に応答して患者の電子的健康記録から臨床証拠に起因する回答を生成するように設計されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:03:01 GMT)
MambaOutRS: A Hybrid CNN-Fourier Architecture for Remote Sensing Image Classification [4.1] リモートセンシング画像分類のための新しいハイブリッド畳み込みアーキテクチャであるMambaOutRSを紹介する。
MambaOutRSは、局所的な特徴抽出のためにスタック化されたGated CNNブロック上に構築され、新しいFourier Filter Gate (FFG)モジュールが導入されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:20:11 GMT)
JCAPT: A Joint Modeling Approach for CAPT [4.1] 本研究は、音韻的属性、SSMに基づくモデリング、CAPTにおけるプロンプトを組み合わせた最初のものである。
speechocean762ベンチマークで行った一連の実験は、我々のモデルが従来手法より一貫して優れていることを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:12:32 GMT)
Two-Stream Spatial-Temporal Transformer Framework for Person Identification via Natural Conversational Keypoints [4.1] オンライン会話中に見える上半身キーポイントを用いた人物識別のための2ストリーム時空間変換フレームワークを提案する。
我々のフレームワークはキーポイント間の空間的関係と,その時間的進化を2つの専門分野を通して処理する。
このフレームワークは、自然会話に従事した114人のデータセットに基づいて評価され、空間ストリームの認識精度は80.12%、時間ストリームの63.61%に達した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:11:23 GMT)
ICP-3DGS: SfM-free 3D Gaussian Splatting for Large-scale Unbounded Scenes [4.1] 我々は,大規模なカメラ動作下での正確なカメラポーズ推定を実現するために,ICP(Iterative Closest Point)を最適化ベースの改良に組み込むことを提案する。
また,大規模なシーンの再現を導くために,ボクセルを用いたシーン密度化手法を導入する。
ICP-3DGSのアプローチは、カメラポーズ推定と新しいビュー合成の両方において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:10:06 GMT)
COBRA-PPM: A Causal Bayesian Reasoning Architecture Using Probabilistic Programming for Robot Manipulation Under Uncertainty [4.1] 我々は、因果ベイズネットワークと確率的プログラミングを組み合わせた新しい因果ベイズ推論アーキテクチャであるCOBRA-PPMを導入し、不確実性の下でロボット操作の介入推論を行う。
ブロック積み重ね作業における高忠実度実験により,高い精度で操作結果を予測する(Pred Acc: 88.6%)とともに,94.2%のタスク成功率でグリージーな次善動作選択を行う。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:26:15 GMT)
Scaling Transformers for Time Series Forecasting: Do Pretrained Large Models Outperform Small-Scale Alternatives? [4.1] 本研究は,事前学習された大規模時系列モデル(LSTSM)が予測タスクにおいて従来の非事前学習された小型変換器より優れているかどうかを検討する。
我々は,従来の変圧器とともに,事前訓練されたユニバーサル時系列モデル(Moirai,TimeGPTなど)を解析する。
本研究は, LSTSMの強度と限界を明らかにし, 時系列タスクへの適合性について考察した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:54:10 GMT)
Integrating Pair Programming as a Work Practice [4.0] ペアプログラミング(PP)はかつてないほど重要になっている。
PPの文書化された利点にもかかわらず、その採用はソフトウェアチーム間で相容れないままである。
この研究は、チームメンバーの採用を促進または妨げ、PPにおけるエンゲージメントを継続する要因を理解することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:02:03 GMT)
Fake or Real, Can Robots Tell? Evaluating Embodied Vision-Language Models on Real and 3D-Printed Objects [4.0] 本稿では,RGBカメラを搭載したロボットアームによるテーブルトップシーンのキャプション戦略の比較検討を行う。
ロボットは複数の視点から物体の画像を収集し,シーン記述を生成する複数のモデルを評価する。
実験では, 単一視点と多視点キャプションのトレードオフ, 実世界と3Dプリントオブジェクトの認識の相違について検討した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:45:09 GMT)
PATCH! {P}sychometrics-{A}ssis{T}ed Ben{CH}marking of Large Language Models against Human Populations: A Case Study of Proficiency in 8th Grade Mathematics [3.9] 大規模(マルチモーダル)言語モデル(LLM)の既存のベンチマークの多くは、LLMの学術的習熟度の測定に重点を置いている。
LLMは、疑わしい測定品質、品質評価の欠如、不明瞭な人口基準など、いくつかの制限に悩まされている。
心理測定に基づくアプローチを採用すると、現在のベンチマークの実践に基づいて評価結果が異なることが示される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:11:54 GMT)
LLM Watermarking Using Mixtures and Statistical-to-Computational Gaps [3.9] テキストが与えられたら、大きな言語モデル(LLM)が生成したのか、それとも人間が生成したのかを判断できますか?
閉鎖条件下では検出不能な透かし方式を提案する。
また、敵がほとんどのモデルにアクセスできる厳しいオープン環境では、除去不能な透かし方式を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:37:32 GMT)
LLM-based Multi-Agent System for Intelligent Refactoring of Haskell Code [3.8] Haskell コード上での処理を自動化するために,大規模言語モデル (LLM) ベースのマルチエージェントシステムを提案する。
その結果、提案したマルチエージェントシステムは、コードの複雑さを平均11.03%減少させ、コード品質を22.46%改善し、パフォーマンス効率を平均13.27%向上させることができた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:17:34 GMT)
Yotta: A Large-Scale Trustless Data Trading Scheme for Blockchain System [3.8] 私たちは、Web 3.0でデータトレーディングを可能にするためのプロパティ要件を形式化した最初の人です。
これらの要件に基づいて、ブロックチェーンのための完全なバッチデータトレーディングスキームであるYottaを最初に提案します。
シミュレーションの結果,Yottaのベースラインアプローチは最大130倍に向上した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:57:25 GMT)
HMSViT: A Hierarchical Masked Self-Supervised Vision Transformer for Corneal Nerve Segmentation and Diabetic Neuropathy Diagnosis [3.8] 糖尿病末梢神経障害(DPN)は糖尿病患者の約半数に影響を与え、早期発見を必要とする。
我々はHMSViT(HMSViT)を提案する。
HMSViTは、絶対位置符号化によるプーリングに基づく階層的・二重注意機構を採用し、効率的なマルチスケール特徴抽出を実現する。
臨床CCMデータセットの実験では、HMSViTは61.34% mIoUと70.40%の診断精度で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:00:23 GMT)
Universal kernels via harmonic analysis on Riemannian symmetric spaces [3.7] カーネルは、機械学習におけるカーネルメソッドの理論的基盤において、基本的な重要性である。
対称空間におけるカーネルの普遍性特性を調査するためのツールを確立する。
我々は、多様体値データを含む応用におけるそれらの使用に関する理論的正当性を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:03:25 GMT)
Robust Robotic Exploration and Mapping Using Generative Occupancy Map Synthesis [3.7] SceneSenseは3次元占有マップの予測のために設計・訓練された拡散モデルである。
提案手法は,これらの予測をリアルタイムに実行中の占有マップに融合し,地図の品質とトラバータビリティを大幅に向上させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:13:44 GMT)
Near-optimal estimates for the $\ell^p$-Lipschitz constants of deep random ReLU neural networks [3.7] ネットワークの幅が対数的であり,その深さが線形である要因によって,最大で異なる広帯域ネットワークに対して,高い確率上・下界を導出する。
注目すべきは、$ellp$-Lipschitz定数の振舞いは、 [1,2) $ と $p in [2,infty] $ の間に大きく異なることである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:02:16 GMT)
PEVLM: Parallel Encoding for Vision-Language Models [3.7] VLM(Vision-Language Models)は、ビデオレイテンシ計算タスクにおいて強力な性能を示す。
モデル微調整を必要とせず,VLMのプリフィル効率を向上させるための並列符号化方式である textbfPEVLM を提案する。
LongVideoBenchベンチマークの実験では、PEVLMは既存の推論効率の手法よりも最大8.37%の精度で改善されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:14:52 GMT)
WebGuard++:Interpretable Malicious URL Detection via Bidirectional Fusion of HTML Subgraphs and Multi-Scale Convolutional BERT [3.6] URL+ HTML機能融合は、攻撃者のアーティファクトがDOM構造に持続するため、堅牢な悪意のあるURL検出を約束する。
4つの新しいコンポーネントを持つ検出フレームワークであるWebGuard++を紹介します。
実験によると、WebGuard++は最先端のベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:36:51 GMT)
Scalable entangling gates on ion qubits via structured light addressing [3.6] 実用的な量子プロセッサの開発における中心的な課題は、多数の量子ビットにスケールしながら、低制御の複雑さを維持することである。
我々は,Hermite-Gaussianビームアレイを生成する個別アドレッシングシステムを備えた新規なトラップイオンプロセッサを開発した。
複素パルス整形を伴わずに0.97程度の忠実度を持つ最大6個のイオンを含む鎖の2量子エンタングリングゲートのアドレス化を実証した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:45:28 GMT)
Anti-Phishing Training Does Not Work: A Large-Scale Empirical Assessment of Multi-Modal Training Grounded in the NIST Phish Scale [3.6] フィッシング攻撃はサイバーセキュリティの重要な脅威だ。
多くの組織は、そのサイバーセキュリティ予算のかなりの部分をフィッシング意識トレーニングに割り当てている。
根拠に基づくサイバーセキュリティ投資には、訓練(有効性)の実証的な証拠が不可欠である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:57:10 GMT)
Inferring Higher-Order Couplings with Neural Networks [3.6] 最大エントロピー法は複雑な系におけるペアワイズ相互作用のモデル化に広く用いられている。
現代の機械学習手法はそのような相互作用をモデル化することができるが、その解釈可能性はしばしば計算コストを禁ずる。
本研究では,制限ボルツマンマシンを一般化ポッツモデルにマッピングし,任意の順序で相互作用を体系的に抽出する手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:51:24 GMT)
Doc2SAR: A Synergistic Framework for High-Fidelity Extraction of Structure-Activity Relationships from Scientific Documents [3.5] 我々は200の科学的文書の厳密な注釈付きベンチマークであるDocSAR-200を紹介する。
また、ドメイン固有のツールとMLLMを統合した新しいフレームワークDoc2SARを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:53:04 GMT)
Breaking Barriers: Do Reinforcement Post Training Gains Transfer To Unseen Domains? [3.5] 強化ポストトレーニング(RPT)は、最近、大規模言語モデル(LLM)の推論能力を改善することを約束している。
これらの改良がいかにして新しいドメインに一般化されるかは、以前の研究で微調整に使われた同じドメインのデータ上でRTTモデルを評価するため、まだ不明である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:53:10 GMT)
Iterative Minimax Games with Coupled Linear Constraints [3.5] 非マックスミニゲームを扱う限界は、機械学習コミュニティで大きな勢いを増している。
批判的批判的敵戦略に対処するこの種のゲームの最初の分析を行う。
-2 であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:47:46 GMT)
Adversarial Attacks on Deep Learning-Based False Data Injection Detection in Differential Relays [3.4] 本稿では,False Data Injection Attacks (FDIA) に使用される既存のディープラーニングベーススキーム (DLS) を,FDIA(False Data Injection Attacks) としてスマートグリッドで回避できることを示す。
本稿では, DLS 脆弱性を利用したFast Gradient Sign Method を利用した新たな攻撃フレームワークを提案する。
本研究は,DLSに基づくFDIA検出に対する敵対的攻撃による重大な脅威を浮き彫りにし,スマートグリッドにおける堅牢なサイバーセキュリティ対策の必要性を浮き彫りにし,対戦型FDIAに対するモデルロバスト性を高めるための対戦型トレーニングの有効性を示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:22:26 GMT)
Continuous-variable Quantum Diffusion Model for State Generation and Restoration [3.4] 本稿では,連続可変量子拡散原理に基づく新しいフレームワークを提案し,CV量子ニューラルネットワーク(CVQNN)と相乗化する。
状態生成のための連続可変量子拡散生成モデル(CVQD-G)では,熱損失チャネルを用いた物理駆動前方拡散プロセスを採用している。
状態回復のために、我々の特殊変種は量子状態、特に未知のパラメータを持つコヒーレントな状態を熱劣化から復元するために設計された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:04:21 GMT)
LSH-DynED: A Dynamic Ensemble Framework with LSH-Based Undersampling for Evolving Multi-Class Imbalanced Classification [3.4] この研究は、これらの課題に対処するための、新しく、堅牢で、レジリエントなアプローチを紹介します。
Locality Sensitive Hashing と Random Hyperplane Projections (LSH-RHP) を Dynamic Ensemble Diversification (DynED) フレームワークに統合する。
我々は23の現実世界と10の半合成データセットに関する総合的な実験を行い、LSH-DynEDと15の最先端の手法を比較した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:46:47 GMT)
LLM-Based Social Simulations Require a Boundary [3.4] 大規模言語モデル(LLM)に基づく社会シミュレーションは明確な境界を確立するべきである。
本稿では、アライメント(実世界のパターンにマッチするシミュレーション行動)、一貫性(時間とともに一貫性のあるエージェント動作を維持する)、堅牢性という3つの重要な境界問題について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:14:47 GMT)
Exploring the Collaborative Co-Creation Process with AI: A Case Study in Novice Music Production [3.3] この調査は、アイデアからSpotifyでこれらの曲をリリースするまでのクリエイティブな旅の全体にわたって行われた。
われわれの発見は、AIが創造性をどう変えるかを強調している。
我々は,AIとの共同創造に関する新たな視点を提供する,Human-AI Co-Creation Stage ModelとHuman-AI Agency Modelを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:33:17 GMT)
Enhancing Generalization of Spiking Neural Networks Through Temporal Regularization [3.2] スパイキングニューラルネットワーク(SNN)は、イベント駆動と低電力特性のために広く注目を集めている。
近年の研究では、ニューロモルフィックデータセットの規模が限られているため、直接訓練されたSNNが深刻なオーバーフィッティングの問題に悩まされていることが示されている。
時間依存正規化機構を導入することで、時間依存正規化訓練(TRT)手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:36:55 GMT)
Future of Quantum Computing [3.2] 2024年11月26日火曜日、4人の議論者が「Future of Quantum Computing(量子コンピューティングの未来)」と題された、穏健な仮想パネルに参加した。
この記事では、この活発なセッションで議論の詳細な概要を説明します。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:36:48 GMT)
Evaluating Long Range Dependency Handling in Code Generation LLMs [3.2] コンテクストウィンドウ内の複数ステップのキー検索タスクを最大8kトークンまで長値化することで,複数のコード生成モデルが長距離依存を処理可能であることを解析する。
関数がプロンプトで後で定義される別の関数を参照する場合、多くのモデル(最大2倍)で性能が著しく低下することがわかった。
また,スライディングウィンドウアテンション機構を用いたモデルでは,単一ウィンドウのサイズ以上の参照処理が困難であることも確認した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:45:07 GMT)
Enhancing Sports Strategy with Video Analytics and Data Mining: Automated Video-Based Analytics Framework for Tennis Doubles [3.1] このフレームワークは、グラウンディングディーノのような高度な機械学習技術と、自然言語の接地による正確なプレイヤーローカライゼーションと、ロバストなポーズ推定のためのYOLO-Poseを統合している。
テニスの試合データに対する我々のアプローチを評価し,CNNを用いたトランスファー学習を用いたモデルが,ショットタイプ,プレーヤ位置,フォーメーションの予測において,ポーズベースの手法よりもかなり優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:48:55 GMT)
Deep neural networks with ReLU, leaky ReLU, and softplus activation provably overcome the curse of dimensionality for Kolmogorov partial differential equations with Lipschitz nonlinearities in the $L^p$-sense [3.1] 我々は、ディープニューラルネットワーク(DNN)が、次元の呪い(COD)を伴わずにPDE解を近似する表現力を持っていることを示す。
この成果を一般化するためにこの研究の重要な貢献は、$pin(0,infty)$で$Lp$-senseでこのステートメントを確立することである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:07:05 GMT)
AGI Enabled Solutions For IoX Layers Bottlenecks In Cyber-Physical-Social-Thinking Space [3.1] Internet of Everything(IoX)とArtificial General Intelligence(AGI)の統合により、変革的なパラダイムが生まれました。
この調査は、センシング層データ管理、ネットワーク層プロトコル最適化、アプリケーション層決定フレームワークの3つの重要なコンポーネントに焦点を当てている。
我々は、AGIに強化されたIoXが、相互接続システムと高度なAIの交差点における重要な研究分野として現れつつあると信じている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:33:43 GMT)
Convergence of Mean Shift Algorithms for Large Bandwidths and Simultaneous Accurate Clustering [3.0] 平均シフト(MS)は、クラスタリングとイメージセグメンテーションで顕著な用途を持つ、非パラメトリックで密度に基づく反復アルゴリズムである。
テキストに対して十分な広帯域収束は,任意の次元において放射対称かつ厳密な正定値カーネルで保証されることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:53:29 GMT)
Comparative Performance of Finetuned ImageNet Pre-trained Models for Electronic Component Classification [2.9] ImageNet事前学習モデルは画像分類に非常に効果的である。
本稿では、電子部品の分類において、12のImageNet事前学習モデルの性能を比較した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:48:39 GMT)
Unscrambling disease progression at scale: fast inference of event permutations with optimal transport [2.9] 疾患進行モデルでは、慢性変性状態として、患者の特徴の変化の群レベルの時間的軌跡を推定する。
本研究では,Birkhoff polytopeに属する事象の潜在置換行列として,最適な輸送からモデル疾患進行へのアイデアを活用する。
実験は、シミュレーションにおけるノイズに対する速度、精度、堅牢性の増加を実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:53:30 GMT)
Trajectory Prediction in Dynamic Object Tracking: A Critical Study [2.8] 本研究は、動的物体追跡(DOT)および軌道予測(TP)手法における現在の進歩を詳細に分析する。
機能ベース、セグメンテーションベース、推定ベース、学習ベースなど、さまざまなアプローチをカバーしている。
この研究は、これらの技術が自動車や自動運転車、監視とセキュリティ、医療、産業自動化に与える影響を強調している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:10:01 GMT)
A Detailed Factor Analysis for the Political Compass Test: Navigating Ideologies of Large Language Models [2.8] 政治コンパステスト(PCT)や同様のアンケートは、LLMの政治的傾きを定量化するために用いられてきた。
標準生成パラメータの変化はモデルのPCTスコアに大きな影響を与えない。
急激な変化や微調整などの外的要因は、個別および組み合わせで同じ影響を及ぼす。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:33:51 GMT)
Dynamics of Giant Atom Coupled with Disordered Lattices [2.8] この研究は、ランダムな固有周波数変動を特徴とする乱れ格子に結合した巨大原子のダイナミクスを探求する。
原子励起確率、光子ダイナミクス、エネルギースペクトルを解析することにより、障害が特定の範囲に閉じ込められている場合、システムは顕著な堅牢性を示すことを明らかにした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:58:11 GMT)
Picsou: Enabling Replicated State Machines to Communicate Efficiently [2.7] 我々は、新しいプリミティブ、クロスクラスタ一貫性ブロードキャスト(C3B)を導入する。
本稿では,C3Bプリミティブの実装であるPICSOUを紹介する。
マイクロベンチマークやアプリケーションでは,従来のソリューションよりも最大24倍の性能を実現しています。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:30:59 GMT)
Dynamic PET Image Reconstruction via Non-negative INR Factorization [2.6] 未知画像の低階行列分解に基づく非教師なし学習手法である非負インプリシットニューラルネットワーク表現因子化(textttNINRF)を導入する。
ポアソンノイズを用いた動的PET再構成実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:09:18 GMT)
ZK-SERIES: Privacy-Preserving Authentication using Temporal Biometric Data [2.5] そこで我々は,ZK-SERIESを提案し,幅広い時系列ベースの認証プロトコルのプライバシと効率性を提供する。
ZK-SERIESは同じビルディングブロック、すなわちゼロ知識乗算証明と効率よくバッチ化された範囲証明を使用する。
実験結果から,古いデバイスでは1.3秒以内にプライバシ保護認証プロトコルが完成できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:45:43 GMT)
From memories to maps: Mechanisms of in context reinforcement learning in transformers [2.5] 本研究は,げっ歯類行動にインスパイアされた計画課題の分布について,コンテクスト内強化学習のためのトランスフォーマーを訓練する。
モデルに現れる学習アルゴリズムを特徴付ける。
メモリは計算資源として機能し、フレキシブルな動作をサポートするために生のエクスペリエンスとキャッシュされた計算の両方を格納する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:55:43 GMT)
Stabilizing PDE--ML Coupled System [2.4] 大規模PDEシステムを用いたマシンリアントサロゲートの使用の長期的障害は,数値解法における不安定性の開始である。
本稿では,より複雑なシステムを実現する上で有効な,プロトタイプ問題と洞察の抽出について述べる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:09:14 GMT)
Doc2Agent: Scalable Generation of Tool-Using Agents from API Documentation [2.4] Doc2Agentは、PythonベースのツールをAPIドキュメントから呼び出せるツールエージェントを構築するためのスケーラブルなパイプラインである。
実世界のAPI、WebArena API、リサーチAPIに対するアプローチを評価し、検証されたツールを作成します。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:30:44 GMT)
Large language models for automated scholarly paper review: A survey [2.4] 本研究の目的は,大規模言語モデル(LLM)の時代における自動学術論文レビュー(ASPR)の全体像を提供することである。
LLM技術の導入により,ASPR関連技術のボトルネックが解決されたのかを概観する。
本稿では,ASPR における LLM の性能と課題を要約し,ASPR に対する出版社や学界の態度と反応について考察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:45:26 GMT)
GlyphPattern: An Abstract Pattern Recognition Benchmark for Vision-Language Models [2.4] GlyphPatternは、3つの視覚的提示スタイルと318人の人間が書いた視覚的パターンの記述を組み合わせたデータセットである。
本稿では,視覚処理,自然言語理解,パターン一般化など,複数のレベルでの課題を明らかにする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:23:10 GMT)
Can LLMs Replace Humans During Code Chunking? [2.4] 大規模言語モデル(LLM)は、特にコード理解と生成に関わるタスクにおいて、コンピュータ科学において重要なツールとなっている。
本稿では,ALC および MUMPS で記述されたレガシ行政コードの近代化における LLM の適用について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:02:35 GMT)
RepuNet: A Reputation System for Mitigating Malicious Clients in DFL [2.4] Decentralized Federated Learning (DFL)は、ノードが中央サーバなしでモデルを協調的にトレーニングすることを可能にする。
悪意のあるノードは、この自律性を利用して、破損したモデルを送信したり、モデルの提出を遅らせたり、過剰なメッセージでネットワークを浸水させたりすることができる。
本稿では,DFLにおける脅威を分類し,ノードの挙動を動的に評価する分散評価システムであるRepuNetを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:46:48 GMT)
Optically tunable linear and nonlinear enhancement of index of refraction [2.4] 屈折率調整による材料の光学特性の制御は、現在の最先端技術に革命をもたらし、高損失媒体における光伝搬を制御できる。
量子力学的アプローチを用いて線形および非線形状態における屈折率(EIR)のテクステンスメントのプラズモニックアナログの能動的光学的チューニングを実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:08:09 GMT)
Collaborative governance of cyber violence: A two-phase, multi-scenario four-party evolutionary game and SBI1I2R public opinion dissemination [2.3] 本研究は、ミクロ・マクロレベルの視点を統合し、サイバー暴力のための2段階のマルチシナリオガバナンス機構を提案する。
第1フェーズでは、進化ゲーム理論に基づいて、サイバー暴力に関与した4つのパーティによるマルチシナリオ進化ゲームモデルが開発された。
第2段階では,コミュニケーション力学理論の統合により傍観者の役割が導入され,ゲーム戦略とともに感情的要因が検討された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:13:45 GMT)
Accurate, fast, cheap: Choose three. Replacing Multi-Head-Attention with Bidirectional Recurrent Attention for Long-Form ASR [2.3] 我々は、ASRの線形複雑度再帰的注意層を調査した作業に基づいて構築する。
双方向RA層は, 短・長の両方のアプリケーションにおいて, MHAの精度に適合することがわかった。
RA性能をさらに向上し,スループットが44%のLCAよりも精度が向上する長文トレーニングパラダイムを開発した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:21:56 GMT)
Thermalization of Quantum Many-Body Scars in Kinetically Constrained Systems [2.2] そこで本研究では,QMBSモデルの熱特性を記述するために,グランド・カノニカル・アンサンブルに基づく新しい記述を導入する。
我々の研究は、制約による非エルゴディディティと熱化パラダイムの基本的な緊張を解消する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:22:48 GMT)
Dynamical quantum phase transition and thermal equilibrium in the lattice Thirring model [2.2] 臨界相と質量相の両方で平衡から切り離された格子チリングモデルの進化をシミュレートする。
我々は、動的量子相転移が存在するために必要な初期状態のエネルギー密度の閾値を同定する。
ギャップ付きクエンチハミルトニアンの場合、このしきい値と有限温度位相図内の異なる領域間の遷移との接続を明らかにする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:43:09 GMT)
Airway Skill Assessment with Spatiotemporal Attention Mechanisms Using Human Gaze [2.1] 航空管理技術は救急医療において重要であり、通常主観的評価によって評価される。
本稿では,気道技能,特に気管内挿管(ETI)を評価するための機械学習アプローチを提案する。
提案システムは,ヒトの視線によって誘導される注意機構を利用して,成功・失敗のETI手順の認識を高める。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:40:58 GMT)
Cross-sensor self-supervised training and alignment for remote sensing [2.1] リモートセンシング(X-STARS)のためのクロスセンサ・セルフ教師付きトレーニングとアライメントを導入する。
X-STARSは、スクラッチからモデルを訓練したり、低解像度のEOデータに基づいて事前訓練された大型モデルを新しい高解像度センサーに適応させることができる。
我々は、X-STARSが、データの可用性と解像度の様々な条件において、より少ないデータで最先端のマージンを達成していることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:52:02 GMT)
HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps [2.1] 本稿では,ユーザプライバシと信頼度の研究を進めることを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスについて紹介する。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:59:14 GMT)
Computer Vision based Automated Quantification of Agricultural Sprayers Boom Displacement [2.1] 自走式農薬散布機を農業生産に使用する際の適用率の誤差が懸念されている。
スプラッシュブーム不安定性は、アプリケーションのエラーに対する主要な貢献者の1つである。
本研究では,各種農業用スプレー機のブーム運動を定量化するコンピュータビジョンシステムを開発した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:30:18 GMT)
Rank-Preserving Index-Dependent Matrix Transformations: Applications to Clockwork and Deconstruction Theory Space Models [2.0] 本稿では、元の行列の階数と零点を保存する$g_f(i,j)$の正確な数学的条件を確立する。
クロックワークおよび次元デコンストラクションモデルにおいて、我々のフレームワークがどのように0モードプロファイルとフェルミオン質量スペクトルを調整できるかを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:37:48 GMT)
Guidance in the Frequency Domain Enables High-Fidelity Sampling at Low CFG Scales [1.9] 低周波と高周波は、生成品質に大きな影響を及ぼす。
標準CFGで行われているように、全周波数にわたって均一なスケールを適用すると、ハイスケールでの多様性が過度に減少する。
本稿では、CFGを低飽和・高周波数成分に分解する効果的な手法である周波数分離誘導法(FDG)を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:19:42 GMT)
Hallucination Detection with Small Language Models [1.9] 本稿では,大規模言語モデルによって生成された応答を検証するために,複数の小言語モデルを統合するフレームワークを提案する。
その結果,幻覚と比較してF1スコアが10%改善し,正しい反応が検出できた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:19:26 GMT)
Compound Fault Diagnosis for Train Transmission Systems Using Deep Learning with Fourier-enhanced Representation [1.9] 本稿では,複合故障診断のための周波数領域表現と1次元畳み込みニューラルネットワークを提案する。
提案手法は, 単断層17点, 複合断層42点において97.67%, 93.93%の精度を示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:10:58 GMT)
Toward Decision-Oriented Prognostics: An Integrated Estimate-Optimize Framework for Predictive Maintenance [1.9] 本稿では,センサ駆動型診断が経済的なトレードオフの下で意思決定を通知するPdMフレームワークを提案する。
まず,従来の推定値最適化(ETO)フレームワークでは,確率的予測の誤差が不整合および準最適保守決定をもたらすことを実証した。
本稿では,予測モデルを協調的に調整し,メンテナンス結果を直接最適化する統合的推定最適化(IEO)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:10:15 GMT)
MATER: Multi-level Acoustic and Textual Emotion Representation for Interpretable Speech Emotion Recognition [1.9] 本稿では,自然条件下での音声感情認識(SERNC)チャレンジへの貢献について述べる。
自然言語の複雑さに対処するため,マルチレベル音響-手動感情表現(MATER)を提案する。
MATERは、単語、発話、埋め込みレベルにおける音響的特徴とテキスト的特徴を統合する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:35:53 GMT)
Exact Matrix Seriation through Mathematical Optimization: Stress and Effectiveness-Based Models [1.9] マトリックスセレーションは、特に空間データの可視化と解析において、データサイエンスの基本的な技術である。
本稿では,厳密なモデルベースの観点からの行列セレーションに対処するために,数学的最適化を基礎とした統一的なフレームワークを提案する。
本稿では, 非線形定式化とその線形化を含む, 局所的ストレス基準に対する新しい数学的プログラミングモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:35:55 GMT)
Stylized Structural Patterns for Improved Neural Network Pre-training [1.9] コンピュータビジョンにおけるディープラーニングモデルは、実際の画像の大規模なデータセットを必要とする。
最近の研究では、合成データが代替として提案されているが、訓練されたモデルはしばしば性能が劣っている。
そこで我々は,新しい種類の合成データを導入し,改良されたニューラルフラクタル定式化を提案する。
第二に,視覚的特徴を,ライセンスのない小さな実画像から合成データセットへ伝達する手法であるリバースススタイリングを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:47:31 GMT)
A Global-Local Cross-Attention Network for Ultra-high Resolution Remote Sensing Image Semantic Segmentation [1.8] GLCANetはUHRリモートセンシングのための軽量セグメンテーションフレームワークである。
セルフアテンションメカニズムは、長距離依存関係を強化し、グローバル機能を強化し、セマンティック一貫性を改善するためにローカル詳細を保存する。
マスク付きクロスアテンション機構は、グローバルローカルな特徴を適応的に融合させ、グローバルコンテキストを活用しながら細かな詳細を選択的に強化し、セグメンテーション精度を向上させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:20:08 GMT)
Realistic Image-to-Image Machine Unlearning via Decoupling and Knowledge Retention [1.8] 機械学習モデルは、目に見えないデータに対してかなりよく機能する、と私たちは主張する。
本稿では,モデルパラメータを勾配上昇で分離するフレームワークを提案する。
また、勾配のあるモデル更新に対して$(epsilon, delta)$-unlearningの保証も提供しています。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:47:20 GMT)
ECG-SMART-NET: A Deep Learning Architecture for Precise ECG Diagnosis of Occlusion Myocardial Infarction [1.8] OMI症例の3分の2は、12誘導心電図から視覚的に識別することが困難である。
現在の最先端の証拠は、機能ベースのランダムな森林と畳み込みニューラルネットワーク(CNN)の両方が、OMIのECG検出を改善するための有望なアプローチであることを示唆している。
我々はOMI識別のためのECG--NETを開発し評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:37:46 GMT)
FDA-Opt: Communication-Efficient Federated Fine-Tuning of Language Models [1.7] FDA-Optは、現代のFederated LearningライブラリやシステムにおけるFedOptの代替品だ。
FDA-Optは、現代のFLライブラリーやシステムにおけるFedOptの代替として実用的で、ドロップインの代替であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:20:46 GMT)
Identifying Heterogeneity in Distributed Learning [1.7] 最小データ伝送量を用いた分散M推定における不均一パラメータ成分の同定法について検討する。
1つは再正規化されたWaldテストに基づいており、分散データブロックの数が$K$で最小ブロックのサンプルサイズより小さいオーダーである限り一貫性がある。
2つ目は、データブロック間の最大と最小のコンポーネント単位でのパラメータの差に基づく、極端なコントラストテスト(ECT)である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:55:45 GMT)
Robotics Under Construction: Challenges on Job Sites [1.7] 本稿では,無人建設現場への最初のステップとして,自律型貨物輸送システムを提案する。
本システムは,CD110R-3クローラキャリアをベースとして,自律ナビゲーション,フリート管理,動的環境ベースローカライゼーションを統合したシステムである。
予備的な結果は、地形の進化におけるナビゲーション、建設固有の条件下での環境認識など、潜在的な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:07:43 GMT)
Unlocking Insights Addressing Alcohol Inference Mismatch through Database-Narrative Alignment [1.7] 本研究は,事故データ中のAIMを識別するためにデータベースナラティブアライメントを用いたアルコール推定ミスマッチ(AIM)の課題に対処する。
アイオワ州で発生した371,062件の事故記録から、2,767件のAIM事故が判明し、全体のAIMの割合は24.03%となった。
その結果、アルコール関連の致命的な事故や夜間の事故はミスマッチの比率が低いのに対し、未知の車種や古いドライバーを含む事故はミスマッチのリスクが高いことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:13:52 GMT)
Quantum-Classical Computing for Time-Dependent Ion-Atom Collision Dynamics: Applications to Charge Transfer Cross Section Simulations [1.6] 本稿では,時間依存型イオン原子衝突ダイナミクスをシミュレーションするためのハイブリッド量子古典計算フレームワークを提案する。
陽子-水素衝突系の対応する断面積を1-25keVのエネルギー範囲で計算する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:03:20 GMT)
A comparative analysis of machine learning algorithms for predicting probabilities of default [1.5] 将来的な融資のデフォルト(PD)の確率を予測することは、金融機関にとって重要な目標である。
近年,機械学習(ML)アルゴリズムは様々な予測タスクにおいて顕著な成功を収めている。
本稿では,5つの予測モデルの性能を比較することで,MLアルゴリズムがこの分野にもたらす機会を強調する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:56:07 GMT)
EmoStage: A Framework for Accurate Empathetic Response Generation via Perspective-Taking and Phase Recognition [1.4] EmoStageは共感的応答生成を強化するフレームワークである。
当社のフレームワークでは,クライアントの心理的状態とサポートニーズを推定する視点的取組みを導入している。
相認識はカウンセリングプロセスとの整合性を確保するために組み込まれている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:18:37 GMT)
SoK: "Interoperability vs Security" Arguments: A Technical Framework [1.4] 大企業の独占力に関する懸念は、近年のメディアや政策論議で顕著に取り上げられている。
EU、米国、その他の規制当局は、より健全な市場競争を促進する努力を強化している。
当然ながら、インターオペラビリティのイニシアチブは、大企業の抵抗に直面している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:44:35 GMT)
Progressive Size-Adaptive Federated Learning: A Comprehensive Framework for Heterogeneous Multi-Modal Data Systems [1.3] 本稿では,SAFL(Size-Based Adaptive Federated Learning)を紹介する。
SAFLは、異種マルチモーダルデータ間のデータセットサイズ特性に基づいて、フェデレーション学習を編成する。
全データセットの平均精度は87.68%で、構造化データモダリティは99%以上である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:50:33 GMT)
Virtual Memory for 3D Gaussian Splatting [1.3] ガウスの版画は、新しいビューレンダリングの分野における画期的な分野である。
近年の進歩は、作成できるスプレイティングシーンのサイズを増大させてきた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:31:33 GMT)
Dialogic Pedagogy for Large Language Models: Aligning Conversational AI with Proven Theories of Learning [1.3] 大言語モデル(LLM)は、リッチな会話学習体験を可能にすることによって、教育を変革している。
本稿では,LLMをベースとした会話エージェントが高等教育にどのように利用されているのかを概観する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:19:09 GMT)
FEAT: A Preference Feedback Dataset through a Cost-Effective Auto-Generation and Labeling Framework for English AI Tutoring [1.3] 英語教育の授業では、教師のフィードバックは生徒の指導に不可欠である。
近年,教師を支援するため,AIによる授業支援システムが登場している。
教員のフィードバックを生成するための費用対効果の高いフレームワークであるFEATを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:32:06 GMT)
Supervised Coupled Matrix-Tensor Factorization (SCMTF) for Computational Phenotyping of Patient Reported Outcomes in Ulcerative Colitis [1.3] フェノタイピング(英: Phenotyping)とは、異なるタイプの疾患の進行を識別するために、患者のグループを識別する過程である。
患者が報告した症状は、通常、他のデータタイプよりも騒々しく、主観的で、はるかに疎外である。
本稿では,新しい教師付き行列-テンソル因子化法(SCMTF)を用いて,患者報告結果(PROs)を活用するための計算表現型の適用について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:55:11 GMT)
NAADA: A Noise-Aware Attention Denoising Autoencoder for Dental Panoramic Radiographs [1.2] 畳み込み型オートエンコーダ(DAE)は画像復元のための強力なツールである。
CNNは、スムーズな領域などの低周波特性を、高周波の詳細よりも効率的に回復する傾向がある。
本研究では,ノイズを考慮した自己認識手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:23:04 GMT)
A Foundational individual Mobility Prediction Model based on Open-Source Large Language Models [1.1] 大規模言語モデル(LLM)はドメイン固有のタスクに広く適用されている。
本稿では,基盤となるオープンソースのLCMに基づくモビリティ予測モデルをトレーニングするための,統一的な微調整フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:54:22 GMT)
DCN^2: Interplay of Implicit Collision Weights and Explicit Cross Layers for Large-Scale Recommendation [1.1] 我々はDCNv2アーキテクチャに3つの重要なアルゴリズム的改善を導入し、その定式化と大規模動作について詳述する。
DCN2と呼ばれる拡張アーキテクチャは、さまざまなユースケースで毎秒0.5億以上の予測を処理するライブレコメンデーションシステムで積極的に使われています。
これらの改善は、クロス層の情報損失、学習可能なルックアップレベルの重みによる衝突の暗黙の管理、FFMの振る舞いをエミュレートするカスタムレイヤとのペアワイズ類似性の明示的なモデリングなど、DCNv2で観測される重要な制限に効果的に対処する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:44:42 GMT)
ECCoT: A Framework for Enhancing Effective Cognition via Chain of Thought in Large Language Model [1.1] ECCoTは、大規模言語モデルで推論チェーンを評価し、洗練するフレームワークである。
解釈可能性を改善し、バイアスを減らし、LCMベースの意思決定の信頼性を高める。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:09:53 GMT)
Resonances of recurrence time of monitored quantum walks [1.1] リングに印加された磁束による時間反転対称性の破れは、ユニタリの固有値の縮退を除去する。
システムサイズが共鳴に与える影響を詳細に研究する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:50:14 GMT)
Online Discovery of Simulation Models for Evolving Business Processes (Extended Version) [1.1] ビジネスプロセスシミュレーション(Business Process Simulation、BPS)とは、ビジネスプロセスの動的な振る舞いを再現する技術である。
過去のイベントログからシミュレーションモデルを自動的に発見するための多くのアプローチが提案されている。
本稿では,Incremental Process Discovery と Online Machine Learning を組み合わせたストリーミングプロセスシミュレーション発見手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:14:12 GMT)
A General Framework for Property-Driven Machine Learning [1.0] 逆行訓練は,小摂動に対するロバスト性を向上させるために,$epsilon$-cubesで行うことができることを示す。
コンピュータビジョン以外の領域は、一般化された超矩形を通してより柔軟な入力領域の仕様を必要とすることがある。
本稿では,これら2つの補完的アプローチを,プロパティ駆動機械学習の単一フレームワークに組み込む方法について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:27:12 GMT)
Automatic Posology Structuration : What role for LLMs? [1.0] 自由文ポソジを構造化形式に変換するために,Large Language Models (LLM) の利用について検討する。
提案手法は,性能向上に寄与するが,ベースラインの精度は微調整LLMのみである。
そこで我々は,NERL から LLM へ低信頼度ケースをルーティングし,信頼度スコアに基づいて出力を選択するハイブリッドパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:25:21 GMT)
FusionForce: End-to-end Differentiable Neural-Symbolic Layer for Trajectory Prediction [1.0] 本稿では、カメラ画像やライダー点雲から、荒れたオフロード地形におけるロボットの軌道予測を行うエンド・ツー・エンドの微分可能モデルを提案する。
このモデルは、ロボットとテランの相互作用力を予測する学習可能なコンポーネントと、古典力学の法則を強制するニューラル・シンボリック・レイヤを統合する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:44:58 GMT)
Improved and Explainable Cervical Cancer Classification using Ensemble Pooling of Block Fused Descriptors [1.0] 以前の研究では、ResNetsが子宮頸癌の画像から特徴を抽出していることが示されている。
我々は,Global Max Poolingの新機能選択手法を詳細機能に使用し,Global Average Poolingを抽象機能に使用した。
IARCとAnnoCervの2つの公開データセットで徹底的に実験を行い、平均的なパフォーマンスは97.92%と92.97%である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:04:47 GMT)
Who Does What in Deep Learning? Multidimensional Game-Theoretic Attribution of Function of Neural Units [1.0] SHAPのような既存の説明可能なAI手法は入力に重要であるが、神経ユニットの寄与を定量化することはできない。
ここでは、モデルに依存しないゲーム理論フレームワークであるMultiperturbation Shapley-value Analysis (MSA)とのギャップを埋める。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:50:35 GMT)
A Certified Proof Checker for Deep Neural Network Verification in Imandra [1.0] Imandra における Marabou 証明書チェックの代替実装を提案する。
これはマラブーに対してより強力な独立保証を与える。
これは、対話的定理証明において、DNN検証器を広く採用する道を開く。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:45:04 GMT)
Deblurring in the Wild: A Real-World Dataset from Smartphone High-Speed Videos [0.9] スマートフォンのスローモーションビデオから構築した,世界最大規模の画像デブロアリングデータセットについて紹介する。
240フレームを1秒でキャプチャすることで、フレームの平均化によって現実的な長時間露光のぼかしをシミュレートし、ぼかし画像を生成する。
我々のデータセットには42,000以上の高解像度のぼかしシャープ画像ペアが含まれており、広く使われているデータセットの約10倍の大きさである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:17:29 GMT)
Quantum-Resistant Domain Name System: A Comprehensive System-Level Study [0.9] 本稿では,広範に展開されている3つのメカニズムにまたがる,量子後DNSセキュリティに関する総合的なシステムレベル研究について述べる。
我々は、レガシー、ポスト量子、ハイブリッド暗号構成下でDNSセキュリティをベンチマークするための統合フレームワークであるポスト量子暗号(PQC)-DNSを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:35:24 GMT)
Identifying Macro Causal Effects in C-DMGs over DMGs [0.9] DMGに対するC-DMGのマクロ因果効果を同定するために, ド-計算が無条件で完全であることが証明された。
ioSCMは、有向混合グラフ(DMG)として知られる別のタイプのグラフ構造を誘導する。
本稿では,ADMGのC-DMGに対するマクロ因果効果の非識別性に関するグラフィカルな基準が,DMGのC-DMGのサブセットにまで自然に拡張されていることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:14:43 GMT)
Hierarchical Quantum Error Correction with Hypergraph Product Code and Rotated Surface Code [0.9] 本稿では,ハイパーグラフ積(HGP)符号を回転曲面符号で符号化する階層型量子誤り訂正(QEC)方式を提案し,解析する。
上層には3,4のランダムなHGP符号が使われており、誤り率が一定であることが知られている。
下層は、格子手術によるハードウェア互換性を実現するため、回転した表面コードと距離5から構成される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:57:38 GMT)
Behavioral Anomaly Detection in Distributed Systems via Federated Contrastive Learning [0.9] 目標は、データプライバシ、ノードの不均一性、異常パターン認識という観点で、従来の集中型アプローチの制限を克服することにある。
提案手法は,フェデレート学習の分散協調モデリング機能と,コントラスト学習の特徴識別強化を併用する。
ローカルノードに埋め込み表現を構築し、正と負のサンプルペアを構築して、より差別的な特徴空間を学ぶモデルを導く。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:04:44 GMT)
Dynamics of discrete spacetimes with Quantum-enhanced Markov Chain Monte Carlo [0.8] 因果集合論(Causal Set Theory)は、量子重力に対する離散的なローレンツ不変のアプローチである。
本稿では,因果集合の空間をサンプリングすることによって因果集合の力学を研究する量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:47:02 GMT)
When Large Language Models contradict humans? Large Language Models' Sycophantic Behaviour [0.8] 本研究では,サイコファンティック行動に対する大規模言語モデルの提案可能性について検討する。
この行動は梅毒(sycophancy)として知られ、LLMが誤解を招く反応を引き起こす傾向を描いている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:59:56 GMT)
MILAAP: Mobile Link Allocation via Attention-based Prediction [0.8] ネットワークノード間のスペクトル,空間,時間依存性の機械学習モデルに対するMiLAAPアテンションに基づく予測フレームワークを提案する。
ローカルCSシーケンスを用いた動的ネットワークの場合,MILAAPのチャネル状態予測精度はノードの移動パターンによって著しく100%であることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:45:51 GMT)
Tailored Conversations beyond LLMs: A RL-Based Dialogue Manager [0.7] 本稿では,大規模言語モデル(LLM)をRLベースの対話マネージャと統合して,特定の目的を持ったオープンエンド対話を実現するフレームワークを提案する。
階層的強化学習を用いて対話の構造化フェーズをモデル化し,メタラーニングを用いて多様なユーザプロファイル間の適応性を向上する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:15:26 GMT)
Learning from Anatomy: Supervised Anatomical Pretraining (SAP) for Improved Metastatic Bone Disease Segmentation in Whole-Body MRI [0.7] 本稿では,解剖ラベルの限られたデータセットから学習するSAP(Supervised Anatomical Pretraining)法を提案する。
SAPはベースラインモデルとSSLプリトレーニングされたモデルの両方で大幅に優れており、正規化表面Diceは0.76、Dice係数は0.64である。
1ml以上の臨床関連病変のみを考慮すると、SAPは32例中28例において100%の感度で検出できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:59:44 GMT)
Collapses in quantum-classical probabilistically checkable proofs and the quantum polynomial hierarchy [0.7] 本研究では, 量子証明システムの構造特性を, ランドスケープの複雑さを明らかにする崩壊結果の確立によって検討する。
主なコントリビューションは次の3つです。 $mathsfUniqueQP = MathsfQ CPCP$ under $mathsfBQ$-operators and randomized reductions。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:59:50 GMT)
GIST: Gibbs self-tuning for locally adaptive Hamiltonian Monte Carlo [0.7] アルゴリズムのチューニングパラメータをサンプリングするギブス法による局所適応型ハミルトン・モンテカルロサンプリングのための新しいフレームワークを提案する。
経路長を適応的にサンプリングするために、Gibs Self-tuning(GIST)アプローチは、ランダム化されたHMC、多項HMC、No-U-Turn Sampler(NUTS)、Apogee-to-Apogee Path Samplerを含む。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 21:42:56 GMT)
MAIZX: A Carbon-Aware Framework for Optimizing Cloud Computing Emissions [0.7] クラウドコンピューティングは、高エネルギー消費と二酸化炭素排出量のために、重大な環境問題を引き起こす。
データセンターは世界のエネルギー消費の2-4%を占めており、ICT部門の電力消費のシェアは2040年までに40%に達すると予測されている。
本研究では,クラウド操作の最適化と炭素フットプリント削減を目的としたMAIZXフレームワークの評価を行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:40:09 GMT)
GNN's Uncertainty Quantification using Self-Distillation [0.7] 本稿では,知識蒸留に基づく新しい手法を提案し,グラフニューラルネットワークの不確かさをより効率的に,高精度に定量化する。
本研究では,2つのグラフデータセットにおける分布外データの識別におけるアプローチの精度,性能,能力について実験的に評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:08:31 GMT)
Filling of incomplete sinograms from sparse PET detector configurations using a residual U-Net [0.7] 長軸視野PETスキャナは、従来のPETスキャナと比較して視野と感度が向上する。
大幅なコストは、拡張カバーシステムに必要な高密度に充填された光検出器に関係している。
代替のスパースシステム構成が提案されており、標準的なPETシステムと同様の検出器コストで視野内PET設計を拡張できる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:10:44 GMT)
Implementing blind navigation through multi-modal sensing and gait guidance [0.7] 視覚障害者の世界の人口は2億2000万人を超えた。
ガイド・缶やガイド・ドッグのような伝統的な援助は存在するが、いくつかの欠点がある。
提案するGait-based Guiding Systemを通じてナビゲーション誘導を行うウェアラブルブラインドガイドデバイスについて紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:03:20 GMT)
Talking to GDELT Through Knowledge Graphs [0.6] 本研究では,各アプローチの強みと弱みを質問応答解析で把握するために,様々なRAG(Retrieval Augmented Regeneration)アプローチについて検討する。
テキストコーパスから情報を取得するために,従来のベクトルストアRAGと,最先端の大規模言語モデル(LLM)に基づくアプローチを実装した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:10:56 GMT)
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images [0.6] テキスト検出,テキスト抽出,テキスト解析という3つの重要なモジュールからなる,PHI検出のためのAIベースのパイプラインを提案する。
これらの結果から,各モジュールに専用の視覚モデルと言語モデルを用いることで,最適な設定を実現することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:25:40 GMT)
Robust Behavior Cloning Via Global Lipschitz Regularization [0.6] 行動クローニングは効果的な模倣学習技術であり、自動運転車のような安全上重要な領域でも採用されている。
我々は、学習したポリシーネットワークの堅牢性を高めるために、グローバルなリプシッツ正規化アプローチを使用する。
ポリシの堅牢性を保証するために,リプシッツニューラルネットワークを構築する方法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:19:08 GMT)
Evaluating Compliance with Visualization Guidelines in Diagrams for Scientific Publications Using Large Vision Language Models [0.6] データビジュアライゼーションの研究分野は、ダイアグラムの作成と利用に関する原則とガイドラインの定義を扱う。
大規模視覚言語モデル(VLM)は、選択されたデータ可視化原則やガイドラインに関する潜在的な問題を特定するためにダイアグラムを分析するために用いられる。
VLMは、xラベルの欠如、伝説の欠如、不要な3D効果など、ダイアグラムの潜在的な問題を自動的に識別するために使用することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:42:36 GMT)
Understanding Human-AI Trust in Education [0.6] 本研究では,人間的・システム的信頼が学生の快楽,信頼的意図,使用に対する行動意図,有用性にどのように影響するかを検討する。
本研究は,人間とAIの信頼に特有な新たな理論的枠組みの必要性を浮き彫りにし,適切な信頼を育むための実践的な洞察を提供するものである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:15:49 GMT)
Shape and Texture Recognition in Large Vision-Language Models [0.5] この研究は、Large Shape and Texturesデータセット(LAS&T)を導入している。
このデータセットは、LVLM(Large Vision-Language Models)が2Dおよび3Dシーンの形状、テクスチャ、材料を効果的に理解する方法のベンチマークに使用される。
形状認識には, 方向, テクスチャ, 色, 環境によって異なる同一形状の画像をマッチングするモデルの能力をテストする。
テクスチャと材料認識のために,異なる物体や環境にまたがる同一のテクスチャと材料を用いた画像の識別能力を評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:16:21 GMT)
CAM-NET: An AI Model for Whole Atmosphere with Thermosphere and Ionosphere Extension [0.5] 我々は,地球表面から電離層への中性大気変数の予測を目的としたAIモデルであるCAM-NETを提案する。
このモデルは、帯状風や乾燥風、温度、圧力の時間といった重要な大気パラメータを効果的に予測する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:07:28 GMT)
Exact requirements for battery-assisted qubit gates [0.5] 電池状態の物理的制約の下でのユニタリ欠陥の最小化は、数学的にラグランジアン最適化問題と等価であることを示す。
我々は、エネルギー、二乗エネルギー、レベル数、および量子フィッシャー情報に制約を課し、最も高精度な電池状態を特定する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:46:50 GMT)
Generating scalable crossband entanglement from intraband entanglement [0.5] そこで本稿では,帯域内絡みの輝度が入力帯域内絡みの明るさに比例する要因によって,帯域内絡みの限界を克服するために帯域内絡みの活用を提案する。
提案したプロトコルは、既製のコンポーネントのみに依存しており、かなりの損失に対して堅牢な利点を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:55:37 GMT)
On the efficacy of old features for the detection of new bots [0.5] 我々は、Twitterをベンチマークとして、新しいボットを検出する4つの最先端機能セットのパフォーマンスを比較した。
この結果は、進化したボットを検知するために汎用分類器と低コストで計算可能な会計機能を使用できることを示唆している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:56:09 GMT)
A Verification Methodology for Safety Assurance of Robotic Autonomous Systems [0.4] 本稿では,自律型農業ロボットの安全性保証のための検証ワークフローを提案する。
コンセプトスタディから設計、実行時の検証に至るまで、開発ライフサイクル全体をカバーする。
提案手法は, 安全クリティカルな特性を検証し, 設計問題の早期発見を容易にするために有効に利用できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:39:51 GMT)
IgCONDA-PET: Weakly-Supervised PET Anomaly Detection using Implicitly-Guided Attention-Conditional Counterfactual Diffusion Modeling -- a Multi-Center, Multi-Cancer, and Multi-Tracer Study [0.4] PET病変検出とセグメンテーションネットワークを訓練するためのピクセルレベルのアノテートデータの必要性を最小化することが望まれている。
現在、教師なしまたは弱い監督による異常検出法は、健康なデータにのみ訓練された自己エンコーダまたはジェネレーティブ・敵ネットワーク(GAN)に依存している。
弱教師付き$textbfI$mplicitly-$textbfg$uided $textbfCO$u$textbfN$terfactual diffusion model for $textbfD$etecting $textbfA$nomaを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:45:53 GMT)
A text-to-tabular approach to generate synthetic patient data using LLMs [0.4] そこで本研究では,患者データへのアクセスを必要としない人工的な患者データを生成する手法を提案する。
我々は,大言語モデルの先行医療知識とコンテキスト内学習能力を活用して,現実的な患者データを生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:24:58 GMT)
Lost in Translation? Converting RegExes for Log Parsing into Dynatrace Pattern Language [0.3] Reptileは、RegExesをDPLパターンに変換するためのルールベースのアプローチと、完全な変換が不可能な場合のベストプラクティスを組み合わせたものだ。
大企業から収集したRegExes 946の評価は、Reptileが73.7%を安全に変換したことを示している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:49:40 GMT)
How Effectively Can BERT Models Interpret Context and Detect Bengali Communal Violent Text? [0.3] 既存の研究では、コミュニティの暴力的な文章は未発見の領域として残されている。
本稿では,このタスクに適した微調整BanglaBERTモデルを導入し,マクロF1スコア0.60を達成した。
このアンサンブルモデルでは性能が向上し、マクロF1スコアは0.63となった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:48:49 GMT)
Explaining deep neural network models for electricity price forecasting with XAI [0.3] 我々は、深層ニューラルネットワークモデルを使用して価格を予測し、XAI手法を使用して、市場における価格変動の要因を理解する。
目的は、異なる電気市場がどのように機能するかについての理解を深めることである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:07:19 GMT)
Image Segmentation using Chan-Vese Active Contours [0.2] 本稿では,画像分割のためのChan-Vese能動輪郭モデルの包括的導出と実装について述べる。
このモデルは、画像勾配よりも地域強度差に基づいて輪郭を進化させ、ノイズの多い画像や境界が弱い画像の分割に非常に効果的である。
医用および合成画像における実験結果は,従来のエッジベース手法と比較して,正確なセグメンテーション,ノイズに対する堅牢性,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:16:56 GMT)
A Framework for Uncertainty Quantification Based on Nearest Neighbors Across Layers [0.2] ニューラルネットワークは、パターンの検出や論理モデルの作成が難しい問題を解く上で、高精度である。
これらのエラーを検出し軽減するための戦略のひとつは、ニューラルネットワークの決定に対する不確実性を測定することである。
本稿では,検索した学習事例に基づいて,意思決定の不確実性を測定するための新しいポストホックフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:10:41 GMT)
GeistBERT: Breathing Life into German NLP [0.2] GeistBERTは、多種多様なコーパスで漸進的にトレーニングすることで、ドイツ語処理の改善を目指している。
モデルは強力なパフォーマンスを達成し、すべてのタスクをベースモデルでリードし、新しい最先端(SOTA)を設定する。
ドイツのNLP研究コミュニティをサポートするため、私たちはGeistBERTをMITライセンス下でリリースします。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:31:06 GMT)
Statistical Multicriteria Evaluation of LLM-Generated Text [0.2] 我々は、一般化支配(GSD)に基づく統計的推測のための最近提案された枠組みに適応する。
GSDは、シングルメトリック評価の不適切性、基本的な自動測定値と順序的人間の判断の不適合性、推論された統計的保証の欠如に対処する。
この枠組みを適用して、人間の生成したテキストに対して共通の復号戦略を評価することにより、統計的に有意な性能差を識別できることを実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:59:45 GMT)
Quantum Neural Networks for Propensity Score Estimation and Survival Analysis in Observational Biomedical Studies [0.2] 大学オストラバ病院で治療を受けた大腸癌1177例(2001-2009)における腹腔鏡下手術術と開術術の生存成績の比較における選択バイアスへの量子ニューラルネットワーク(QNN)の適用
QNNアーキテクチャでは、データエンコーディングに線形ZFeatureMap、予測にSummedPaulis演算子、ノイズの多い量子環境に頑健で勾配のない最適化にCovariance Matrix Adaptation Evolution Strategy (CMA-ES)を採用した。
これらの結果は、生体医学研究における因果推論を改善するために、CMA-ESとノイズ認識戦略によって強化されたQNNの可能性を強調している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:40:39 GMT)
A standard transformer and attention with linear biases for molecular conformer generation [0.2] 等変ネットワークは、2次元分子グラフから分子配座を生成するように設計されている。
非同変変圧器モデルは、一般化を改善するためにスケールする能力のために、実現可能な代替品として登場した。
本稿では,これらのサイズ制限を効果的に扱える位置符号化法について述べる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:50:49 GMT)
High-Performance ARM-on-ARM Virtualization for Multicore SystemC-TLM-Based Virtual Platforms [0.2] ARM-on-ARM仮想プラットフォームは、計算集約的なワークロード上の従来の命令セットシミュレータベースのモデルよりも最大10倍のスピードアップを実現している。
命令セットシミュレータのドロップイン代替として使用できるマルチコアのSystemC-TLMベースのCPUモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:13:50 GMT)
Contactless Cardiac Pulse Monitoring Using Event Cameras [0.1] 本研究では,顔の時系列記録から心パルス信号の接触のない再構成について検討した。
イベントストリームの二次元表現から心臓信号を抽出するために、エンドツーエンドモデルを訓練する。
実験の結果, 顔面領域の生理的心情報はイベントストリーム内に有効に保存されていることが確認された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:38:00 GMT)
Efficient Hardware Implementation of Modular Multiplier over GF (2m) on FPGA [0.1] 楕円曲線暗号(ECC)が主要な公開鍵プロトコルとして登場している。
本研究では,バイナリフィールドGF(2m)上のモジュラ乗算のためのハイブリッド乗算手法のハードウェア実装を提案する。
従来の乗算(CM)とカラツバ乗算(KM)の組み合わせを最適化して楕円曲線点乗算(ECPM)を強化する設計である。
本手法は,ECC暗号システムの高速化,ハードウェア効率,資源利用を著しく向上させる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:32:36 GMT)
Narrow-line-mediated Sisyphus cooling in the $^{3}\mathrm{P}_{2}$ metastable state of strontium [0.1] 5s5p,3textrmP_2$状態における磁化ストロンチウム(Sr)の狭線冷却を実証した。
641nmの立位波は、5s4d,3textrmD_3$遷移から青色に変形され、3s4d,3textrmD_3$状態の散逸性光学格子を生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:12:03 GMT)
Noncontextual Pauli Hamiltonians [0.1] 非コンテキストのパウリ・ハミルトン多様体の多くの性質を厳格に確立する。
非コンテキストハミルトニアンがより多くの物理的相互作用を記述できることが示される。
したがって、フィールドは効率的にシミュラブルな状態の新しいクラスに開きます。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:45:09 GMT)
ReBoot: Encrypted Training of Deep Neural Networks with CKKS Bootstrapping [0.1] Homomorphic Encryption (HE)は、量子後暗号セキュリティとエンドツーエンドのデータ保護を提供する。
Deep Neural Networks(DNN)はHE設定で注目されているが、その使用は主に暗号化推論に限定されている。
本稿では,DNNの完全暗号化および非対話的トレーニングを可能にする最初のフレームワークであるReBootを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:00:14 GMT)
Leveraging Lightweight Generators for Memory Efficient Continual Learning [0.0] 破滅的な忘れは、すべてのデータを以前のタスクからメモリに保持することで、簡単に軽減できる。
本稿では,メモリベースの連続学習アルゴリズムに必要なメモリを削減することを目的とする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:59:52 GMT)
When Can We Reuse a Calibration Set for Multiple Conformal Predictions? [0.0] 我々は,e-conformal predictionとHoeffdingの不等式が組み合わさって,単一校正集合の繰り返し使用を可能にすることを示す。
我々は、ディープニューラルネットワークをトレーニングし、キャリブレーションセットを使用して、Hoeffdingの補正を推定する。
この補正により、修正マルコフの不等式を適用することができ、定量化された信頼度を持つ予測セットを構築することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:57:25 GMT)
Weak unitary symmetries of open quantum dynamics: beyond quantum master equations [0.0] 我々は、弱ユニタリ対称性を持つマルコフ開量子力学を考える。
ジョイントダイナミクスは、常に量子マスター方程式と直接的に関連する分離可能な対称性を特徴付けている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:27:43 GMT)
Unlocking Multi-Dimensional Integration with Quantum Adaptive Importance Sampling [0.0] 多次元関数のモンテカルロ積分のための量子適応重要サンプリング(QAIS)を実現する量子アルゴリズムを提案する。
アプリケーションとして、非常に鋭いピークのループFeynman積分とマルチモーダルベンチマーク積分を考察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:19:06 GMT)
Universal pre-training by iterated random computation [0.0] 合成されたデータは、データを見る前にモデルを事前訓練するために使用できることを示す。
実験の結果を実世界のデータに拡張し,事前学習後のモデルを微調整することで,より高速な収束とより優れた一般化が得られることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:36:35 GMT)
Universal and Efficient Quantum State Verification via Schmidt Decomposition and Mutually Unbiased Bases [0.0] 任意の多部純量子状態を検証する普遍的プロトコルを提案する。
局所次元に依存しないサンプル複雑性の普遍的な上限を確立する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:22:01 GMT)
Two dimensional sub-wavelength topological dark state lattices [0.0] 我々は、スカラー電位と同じ領域に局在した合成磁場の狭く強いパッチを伴って、サブ波長クロニグ・ペニーのような幾何スカラー電位を生成する方法を示す。
これらの急激なピーク磁束は、反対符号の滑らかな背景磁場によって補償され、単位セル当たりのネット磁束はゼロとなる。
数値解析により、理想的なチャーンバンドの存在と、非断熱効果と損失に対するトポロジカル位相の堅牢性が確認された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:13:25 GMT)
Tunable correlation retention: A statistical method for generating synthetic data [0.0] 与えられたデータセットから統計的に代表的な合成データを生成する手法を提案する。
本手法の主な目的は,生成したデータに対して,原データに存在する機能間相関を模倣することである。
我々は,Pearson相関行列を用いてデータセットを,解像度と相関深さの異なるレベルと比較することにより評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:32:44 GMT)
Thermodynamics of a Quantum Subsystem [0.0] 外部力によって準静的に駆動される量子サブシステムの熱力学を解析する。
量子サブシステムの熱力学関数は局所スペクトルの観点から動的に定義できることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:49:35 GMT)
Thermalization and irreversibility of an isolated quantum system [0.0] 非平衡初期状態は高度に絡み合った量子状態へと進化する。
ローカル演算子$hatO$は、絡み合った状態にある情報の一部を消去する。
この情報消去機構を1次元ハバードモデルに組み込むことで, 完全に分離されたシステムにおいて, 熱化過程が現れることを示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:39:20 GMT)
The receptron is a nonlinear threshold logic gate with intrinsic multi-dimensional selective capabilities for analog inputs [0.0] Threshold logic gates (TLG) は、分類能力を持つ生物学的ニューロンの人工的対応として提案されている。
入力依存重み関数を特徴とするレセプトロンと呼ばれるTLGモデルの一般化により、分類性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:04:15 GMT)
The Shape of Consumer Behavior: A Symbolic and Topological Analysis of Time Series [0.0] 本研究では,Symbolic Aggregate ApproXimation (SAX), enhanced SAX (eSAX), and Topological Data Analysis (TDA)の3つの非教師なしクラスタリング手法を評価する。
以上の結果から,SAXとeSAXは,安定な時系列に対して高速かつ解釈可能なクラスタリングを提供する一方で,ボラティリティと複雑性に苦慮し,不明瞭なキャッチオールのクラスタを生成することが示唆された。
消費者分析におけるシンボル的およびトポロジ的手法の活用に関する実践的ガイダンスで結論を出し,ハイブリッドアプローチが今後の応用に強い可能性を秘めていることを示唆する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:20:33 GMT)
The Alignment Trap: Complexity Barriers [0.0] 本稿は、AIアライメントは単に難しいだけでなく、基本的な論理的矛盾に基づくものである、と論じる。
私たちは、すべての必要な安全ルールを列挙できないため、マシンラーニングを正確に使用しています。
このパラドックスは、5つの独立した数学的証明によって確認される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:41:11 GMT)
Super-Resolution with Structured Motion [0.0] 本研究では,高精度な動き情報,スパース画像先行情報,凸最適化を用いることで,大きな要因による解像度向上が可能であることを示す。
擬似ランダム運動を用いることで、単一の低分解能画像を用いて高分解能目標を再構成できることを実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:30:27 GMT)
Study of entanglement in Ne, Mg, and Si isotopic chains [0.0] 我々は,Ne,Mg,Si同位体鎖におけるモードエンタングルメントとその進化について検討した。
また、2体相互作用のスピンテンソル分解を3つの構成要素(中心、スピン軌道、テンソル)に支援することで、核力の役割について詳細な研究がなされている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:08:31 GMT)
Some improvements to product formula circuits for Hamiltonian simulation [0.0] 本稿では, トロッタースズキ分解による基底状態エネルギー推定アルゴリズムの積公式実装の改善について述べる。
これらには、ハミルトン項ごとのより小さな回路テンプレート、通勤制御された回転の並列化、より効率的な並列スケジューリングが含まれる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:52:46 GMT)
Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0] 都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:01:50 GMT)
Simulating the Waterfall Model: A Systematic Review [0.0] この体系的なマッピングは、ピアレビューされた文献の計算シミュレーションにおいて、ウォーターフォールモデルがどのように表現されたかを調べる。
主要な学術データベースの構造化検索により、2000年から2024年の間に発表された68のピアレビュー研究が特定された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:15:34 GMT)
Simulating one hundred entangled atoms using projected-interacting full configuration interaction wavefunctions corrected by projected density functionals [0.0] 大規模絡み合い系をシミュレートできる相関波動関数法を提案する。
このアプローチは大きな活性空間にアクセスし、絡み合いと強い相関を可視化することができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:11:25 GMT)
Sensing Electric Currents in an a-IGZO TFT-Based Circuit Using a Quantum Diamond Microscope [0.0] 量子ダイヤモンド顕微鏡(Quantum Diamond Microscope、QDM)は、電子回路のキャラクタリゼーションを可能にする新しい磁気イメージングツールである。
16アモルファス-インジウム-ガリウム-亜鉛酸化物(a-IGZO)薄膜トランジスタ(TFT)からなる電流ミラー回路のウエハレベル電流検出を実証する。
本研究は, 新興半導体技術の非侵襲診断ツールとしてのQDMの機能を明らかにするものである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 05:56:02 GMT)
Sampling Matters in Explanations: Towards Trustworthy Attribution Analysis Building Block in Visual Models through Maximizing Explanation Certainty [0.0] 信頼に値する帰属分析を構築するには、サンプル分布の不一致問題を解決する必要がある。
本稿では,入力からの特徴を抑圧し,半最適サンプリング手法を提案する。
我々のアプローチは効果的であり、最先端のベースラインに対してより満足のいく説明を得ることができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:15:22 GMT)
SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification [0.0] 自己監督陽性サンプリング(SSPS)は話者検証のための新しい正のサンプリング手法である。
SSPSはSimCLRとDINOの両方のSVパフォーマンスを改善し、2.57%と2.53%のEERに達した。
SSPSは、話者内分散を低くすることで58%のEER削減を実現し、DINO-SSPSに匹敵する性能を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:06:50 GMT)
Revealing Symmetry-Broken Superconducting Configurations by Density Functional Theory [0.0] 現在、従来の超伝導体と非伝統的な超伝導体の超伝導に関するコヒーレントな理論は欠落している。
ここでは、対称性を破った超伝導構造の形成から超伝導が生じることを示す。
この電子-フォノン相互作用は、電子および/または穴の電荷密度のためのストレート1次元トンネル(SODT)を生成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:39:44 GMT)
Realization of pure gyration in an on-chip superconducting microwave device [0.0] 非相互結合と合成磁場の重要な要件は、非相互結合と合成磁場の工学である。
ここでは、時間変調のみを用いて、状態間の純粋なジャイレーションを実現することを実証する。
本手法は, 物理実装(古典的あるいは量子的)や周波数範囲に完全に依存せず, 大規模非相互メタマテリアルへの道を開く。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:00:03 GMT)
Rare dense solutions clusters in asymmetric binary perceptrons -- local entropy via fully lifted RDT [0.0] 本研究では, 古典的非対称二元性パーセプトロン (ABP) とその関連エントロピー (LE) をアルゴリズム的硬さの潜在的源として検討した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:12:39 GMT)
Rabi transport and the other finite-size effects in one-dimensional discrete-time topological quantum walk [0.0] 一次元量子ウォークにおける位相的に異なる位相の境界における局在状態の出現を示す。
有限格子に対して、トポロジーは局所化および双局在化状態を誘導し、有限サイズ効果による縮退の結果としてラビ様輸送をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:22:37 GMT)
Quantum thermalization and average entropy of a subsystem [0.0] 平均フォン・ノイマン(VN)エントロピーに関するペイジのセミナル結果は、現実的な多体系にはすぐには適用されない。
ここでは、エネルギー$E$を中心とする狭いエネルギーシェルに対応するサブスペース$mathcalH_E$の純粋状態上で平均化されたVNエントロピーについて検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:18:50 GMT)
Quantum simulation of thermodynamics: Maxwell relations for pair correlations [0.0] すべての熱力学量と1つの局所相関関数を関連付ける一般化マックスウェル関係を導入する。
この普遍的アプローチは量子シミュレータで容易に利用でき、凝縮物質系への応用を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:22:52 GMT)
Quantum obesity and steering ellipsoids for fermionic fields in dilaton black hole [0.0] 本稿では,2量子ビット上の時空のGarfinkle-Horowitz-Stromingerダイアレーションを受けるギシン状態に対する量子肥満(QO),量子不協和(QD),および量子ステアリング楕円体(QSE)について検討する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:41:01 GMT)
Quantum Counting in the Rydberg Blockade [0.0] そこで本研究では,中性原子量子コンピュータ上での2SAT (Planar 2-Satisfiability) の解数を数値的にカウントする量子アルゴリズムを提案する。
我々のアルゴリズムは、変数を所定の式に従って空間に配置された原子レジスタにマッピングするため、2SAT制約は隣り合う原子間のリドベルク封鎖によって強制される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:09:55 GMT)
Quantifying Spin Defect Density in hBN via Raman and Photoluminescence Analysis [0.0] 六方晶窒化ホウ素(hBN)の負の帯電ホウ素(mathrmV_B-$)は、有望な固体スピン量子ビットとして出現している。
ここでは、ラマンとフォトルミネッセンスシグネチャを相関させて、hBNの$mathrmV_B-$欠陥密度を定量化する全光学的手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:09:21 GMT)
Probing the dichotomy between Yu-Shiba-Rusinov and Majorana bound states via conductance, quantum noise and $Δ_T$ noise [0.0] 我々は、YSR(Yu-Shiba-Rusinov)状態とMBS(Majorana-bound state)状態を区別するための診断ツールとして、電荷、スピン伝導、電荷、スピン量子ノイズ、および電荷およびスピン$Delta_T$ノイズについて検討する。
YSR状態は、自明なs波超伝導ギャップ内でスピンフリップとして働く磁気不純物から生じ、MBSはトポロジカル超伝導体に現れる。
我々の分析は、電荷とスピンの伝導率、電荷とスピンの量子ノイズの両方の測定と、Delta_T$ノイズの組合せが、ユニークで信頼性の高いシグネチャを提供することを示した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:34:24 GMT)
Probabilistic modelling and safety assurance of an agriculture robot providing light-treatment [0.0] 農業ロボットの採用は、新しい技術の信頼性、堅牢性、安全性に対する農家の信頼を仮定している。
本稿では,早期開発段階における確率論的モデリングとリスク分析の枠組みについて考察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:39:32 GMT)
Practical continuous-variable quantum key distribution with squeezed light [0.0] 連続可変量子鍵分布(CV-QKD)は、高い秘密鍵レートを達成する可能性に対して大きな関心を集めている。
本研究では,理論的予測を実験的に検証し,実用的なCV-QKDシステムの提案と実証を行う。
我々の研究は、圧縮された状態が量子鍵分布やその他の量子情報プロトコルの実用的なリソースとなるための道を開いた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:10:01 GMT)
PocketVina Enables Scalable and Highly Accurate Physically Valid Docking through Multi-Pocket Conditioning [0.0] PocketVinaは、ポケット予測とシステマティックなマルチポケット探索を組み合わせた、検索ベースのドッキングフレームワークである。
我々はPocketVinaを、PDBbind 2020 (timesplit and unseen)、DockGen、Astex、PoseBustersの4つの確立したベンチマークで評価し、物理的に有効なドッキングポーズのサンプリングにおいて一貫して強いパフォーマンスを観察する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:50:30 GMT)
Phonon thermal Hall as a lattice Aharonov-Bohm effect [0.0] 実験により、磁場は熱流束と熱勾配ベクトルとの間の不整合を誘導することがわかった。
熱ホール角はピーク長手熱伝導率の温度で最大である。
誘導された発現は、黒リン、ゲルマニウム、シリコンで実験的に発見されたものに近い。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:03:27 GMT)
Numerical solution of quantum Landau-Lifshitz-Gilbert equation [0.0] Landau-Lifshitz-Gilbert (LLG) 方程式は、磁気系の磁化力学をモデル化するための基礎として長い間使われてきた。
量子効果をスピン力学に組み込む必要性に触発されて、近年LG方程式の量子一般化が提案されている。
我々はこの量子LGフレームワークに合わせた堅牢な数値手法を開発した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:04:07 GMT)
Norm Inequality for Perturbed Quantum Evolutions and Its Application to Grover's Algorithm [0.0] 我々は、Gronwallの補題に基づく一般的な標準不等式を導出することにより、コヒーレント制御誤差が量子状態の進化に与える影響について検討する。
本稿では,コヒーレントエラーの存在下でのGroverの探索アルゴリズムのロバスト性を解析するために,この枠組みを適用した。
本研究は, 誤差強度, アルゴリズム実行時, 成功確率の定量的スケーリング関係を特徴とし, レジリエントな量子プロトコルの設計に関する実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:26:16 GMT)
No-go theorem for environment-assisted invariance in non-unitary dynamics [0.0] 本研究は,非単体操作では,環境支援による断熱的ショートカットが達成できないことを示す。
また,外部浴槽にCFTが結合した場合,AdS/CFTにおける永遠ブラックホールの静的状態が侵害されることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 11:19:30 GMT)
Neural network-based Godunov corrections for approximate Riemann solvers using bi-fidelity learning [0.0] 教師付き学習を用いて訓練されたニューラルネットワークに基づく代理モデルを構築し、内部および外部保守状態変数を対応する正確なフラックスにマッピングする。
提案手法の性能は, 1次元および2次元偏微分方程式への応用を通じて実証される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 22:02:35 GMT)
Multimode Entangled Squeezed Light Generation and Propagation in a Coupled-Cavity Photonic Crystal [0.0] 本稿では,光の量子状態の生成と伝播を効率よく正確にモデル化する手法を提案する。
マルチモードフォトニック結晶結合キャビティシステムの設計とモデル化に本手法を適用する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:53:43 GMT)
Multi-mode feedback cooling of the collective modes of a Bose-Einstein condensate [0.0] ボース・アインシュタイン凝縮体の3つの低層集合モードの空洞自由フィードバック冷却を,プロラトハーモニックトラップで実験的に実証した。
ダイポールモードを1原子あたりのフォノン占有率の平均値に効率よく減衰させることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:56:55 GMT)
Momentum-based minimization of the Ginzburg-Landau functional on Euclidean spaces and graphs [0.0] ユークリッド空間およびグラフ上での拡散周波関数の運動量に基づく最小化について検討する。
時間ステップサイズが大きすぎるが大きすぎると、モーメントがより速く収束することを示す。
解析は平面曲線,三次元空間の表面,およびグラフ上の半教師付き学習タスクの数値実験によって補完される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:38:44 GMT)
Metamaterials in Superconducting and Cryogenic Quantum Technologies [0.0] フォールトトレラント量子コンピュータの開発は、量子ビットコヒーレンス、接続性、スケーラビリティの課題に直面している。
本総説では, メタマテリアル, オンデマンド電磁特性を有する人工構造を変換解として確立する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:08:42 GMT)
MENGLAN: Multiscale Enhanced Nonparametric Gas Analyzer with Lightweight Architecture and Networks [0.0] 本研究では,マルチストリーム構造,ハイブリッド型マルチヘッドアテンション機構,フィーチャーリアクティベーションモジュールを統合したマルチスケール非パラメトリックガスアナライザMENGLANを提案する。
その結果,MENGLANは既存の手法に比べて優れた性能,計算要求の低減,デプロイ性の向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:41:41 GMT)
Limits of Discrete Energy of Families of Increasing Sets [0.0] 集合のハウスドルフ次元はリースエネルギーを用いて検出できる。
x_n$ という点列が集合 $E の部分集合 mathbbRd$ を適切な意味で埋める状況を考える。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 01:23:47 GMT)
Leveraging Large Language Models to Democratize Access to Costly Datasets for Academic Research [0.0] GPT-4o-mini を用いた新たな手法の開発と評価を行った。
提案手法は,約1万件のプロキシステートメントとCAM(Critical Audit Matters)から1万2000件以上の10-Kの書類から,CEOの給与比率を収集する上で,人間レベルの精度を実現する。
これは、手作業による収集に要する数百時間や、商用データベースのサブスクリプションに要する数千ドルとは対照的である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:52:00 GMT)
Learning quantum tomography from incomplete measurements [0.0] 量子トモグラフィーを情報的に不完全なシナリオで再検討し、ディープニューラルネットワークを用いた状態再構成手法を提案する。
最初のアプローチでは、トレーニングされたネットワークは、(既に取られた)測定演算子の集合のみに依存する係数を持つ最適線形あるいは二次的な再構成子を予測する。
2つ目は、LSTMリカレントネットワークをベースとして、逐次状態再構成を行うため、スケーラブルである。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:49:56 GMT)
Learning Task Belief Similarity with Latent Dynamics for Meta-Reinforcement Learning [0.0] 近年のベイズ適応ディープRLアプローチは、しばしば環境の報酬信号の再構成に依存している。
我々は,ベイズ適応型MDPにおけるタスク信念の類似性を測定することで,新しいメタRLフレームワークSimBeliefを提案する。
提案手法は, スパース報酬のMuJoCoとパンダジャムのタスクにおいて, 最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:52:00 GMT)
Isoprobability Models of Qubit Dynamics: Demonstration via Time-Dependent Phase Control on IBM Quantum [0.0] 我々は、時間依存パルス振幅と周波数の様々なペアが同じ遷移確率プロファイルを生成するような、量子力学のモデルの等確率クラスを考案する。
提案手法は,Landau-Majorana-St"uckelberg-Zener (LMSZ) およびAllen-Eberly-Hioe (AEH) クラスから導かれる等確率モデルの族を用いて実証する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 12:36:06 GMT)
Improved energy barrier in higher-dimensional hypergraph product codes [0.0] 低密度パリティチェック(LDPC)特性を持つHHGP符号の低バウンダリ改善を示す。
解析の結果,LDPC HHGP符号のエネルギー障壁は,基礎となる古典符号の距離によって低く抑えられていることがわかった。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:54:42 GMT)
Human-Centered Editable Speech-to-Sign-Language Generation via Streaming Conformer-Transformer and Resampling Hook [0.0] 既存のエンドツーエンドの手話アニメーションシステムは、自然度が低く、顔/身体の表現性が制限され、ユーザ制御ができない。
本稿では,人間中心のリアルタイム音声署名アニメーションフレームワークを提案する。
Unity3D上にデプロイされたシステムでは,13msのフレームイン時間と103msのレイテンシを実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:11:34 GMT)
Holography for bulk-boundary local topological order [0.0] 本稿では、位相境界を持つ量子スピン系にLTO公理を拡張する。
我々はこの解析を、Levin-Wen と Walker-Wang のバルクバウンダリ系に対して明らかに詳細に行う。
我々は、ウォーカー・ワン模型の標準位相境界に対応する、この編みカテゴリーネット上の正準状態を考える。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:34:35 GMT)
Higher-Order Corrections to Quantum Observables in $h\to WW^*$ [0.0] ヒッグス粒子は WW* から ell+ nu_ell ell'- barnu_ell'$ に崩壊し、ヒッグス結合の構造と電弱ゲージボソンにユニークな窓を与える。
この崩壊を特徴づける角係数に対する次から次への電気弱補正の系統的研究を行う。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:54:05 GMT)
High-throughput spin-bath characterization of spin-defects in semiconductors [0.0] 半導体におけるスピン欠陥の局所環境に関する詳細な知識は、量子センシングおよび情報応用における制御および絡み合いプロトコルの最適化に不可欠である。
本研究では、スパース実験コヒーレンス信号からスピン欠陥を取り巻くランダム核の原子位置と超微細結合を復元する不測の逆問題に対処する。
同位体核スピンの数と超微細結合の数の決定に挑戦するために、アブイニシアトデータを組み込んだ超次元ベイズ的手法を用いる。
このアプローチは、数、超微細結合、核スピンの位置の後方分布を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:41:41 GMT)
High-Efficiency Tunable Microwave Photon Detector Based on a Semiconductor Double Quantum Dot Coupled to a Superconducting High-Impedance Cavity [0.0] マイクロ波領域における高効率単一光子検出は、量子センシング、通信、情報処理において重要な技術である。
本研究では、単一光子状態において70%の効率でマイクロ波光子検出を行う。
本研究は,半導体ベースのキャビティQEDアーキテクチャを,効率的なマイクロ波光子検出のためのスケーラブルで汎用的なプラットフォームとして確立し,量子マイクロ波光学およびハイブリッド量子情報技術のための新たな道を開いた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:44:15 GMT)
Harnessing Near-Infrared Spectroscopy and Machine Learning for Traceable Classification of Hanwoo and Holstein Beef [0.0] 本研究では, 近赤外分光法(NIRS)と高度な機械学習(ML)技術を組み合わせて, 食品の真正性, 誤ラベル, 密着性に対処するために, ハンウー・ビーフ(HNB)とホルスタイン・ビーフ(HLB)を区別する手法について検討した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 02:41:51 GMT)
HERCULES: Hierarchical Embedding-based Recursive Clustering Using LLMs for Efficient Summarization [0.0] HERCULESは、多様なデータ型の階層的なk平均クラスタリングのために設計されたアルゴリズムとPythonパッケージである。
階層のそれぞれのレベルでクラスタのセマンティックにリッチなタイトルと記述を生成する。
インタラクティブな可視化ツールは、クラスタリング結果の徹底的な分析と理解を容易にする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:22:00 GMT)
Gottesman-Knill Limit on One-way Communication Complexity: Tracing the Quantum Advantage down to Magic [0.0] 素次元量子システムを用いて実装された任意の一方的な通信複雑性プロトコルは、常に同じ次元の古典的なシステムと通信することで、正確にシミュレート可能であることを示す。
量子計算における Gottesman-Knill の定理と直接的に類似して、我々の結果は一方的な通信複雑性における量子上の優位性を実現するのに不可欠である同じ資源を識別する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:57:52 GMT)
Geometric-Aware Variational Inference: Robust and Adaptive Regularization with Directional Weight Uncertainty [0.0] 濃度適応摂動 (CAP) は単位超球面上での重みの不確かさを直接モデル化する変分フレームワークである。
CAPは、指向性統計をニューラルネットワークの実用的なノイズ正規化に結びつける最初の完全な理論フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:42:00 GMT)
Fully lifted \emph{blirp} interpolation -- a large deviation view [0.0] 我々は[104]から比較を再検討し、その偏差のアップグレードを導入する。
表現型に加え、分析的にはるかに難しい表現型ランダム構造の特徴の研究も可能である。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:06:17 GMT)
First-Passage Approach to Optimizing Perturbations for Improved Training of Machine Learning Models [0.0] 機械学習プロトコルを第1パスプロセスとみなし、摂動に対する応答を考察する。
摂動学習プロセスが準定常状態に達した場合、単一摂動周波数での応答は広い周波数でその振舞いを予測することができることを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:16:47 GMT)
Fast readout of quantum dot spin qubits via Andreev spins [0.0] アンドレーフスピン量子ビットは超伝導量子ビットの大きな共振器結合によって実現される高速な測定スキームの恩恵を受けるが、量子ビット演算中にコヒーレンスを低下させる。
本稿では,量子ドットとアンドレーフスピン量子ビットの電気的結合に基づく高速かつ高忠実な測定プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:22:35 GMT)
Extreme Learning Machines for Exoplanet Simulations: A Faster, Lightweight Alternative to Deep Learning [0.0] Extreme Learning Machine (ELM) は、複雑な物理モデルを高速化するための軽量で非段階的な機械学習アルゴリズムである。
異なるデータ構造を持つ2つのテストケースにおいて,EMMサロゲートモデルの評価を行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:46:23 GMT)
Explicit Residual-Based Scalable Image Coding for Humans and Machines [0.0] スケーラブルな画像圧縮手法は マシンと人間の視覚の両方に役立ちます
本稿では, 明示的な残差圧縮機構を統合することにより, ICMHフレームワークの符号化効率と解釈可能性を向上させる。
特徴残差ベース残差ベース符号化(FR-ICMH)と画素残差ベース残差ベース残差ベース符号化(PR-ICMH)の2つの補完手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:01:53 GMT)
Exceeding the maximum classical energy density in fully charged quantum batteries [0.0] 古典電池では、各サブシステムのエネルギー密度は最大値に達し、$E_C$と表される。
我々は、量子エネルギーテレポータイオン(QET)のプロトコルにより、この限界を量子電池で超過できることを実証した。
提案プロトコルは,効率の向上,量子コンピュータの実験的複雑さの低減,即時エネルギー充電を実現する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:36:28 GMT)
Evolutionary computing-based image segmentation method to detect defects and features in Additive Friction Stir Deposition Process [0.0] 本研究は, 付加摩擦スター堆積過程における音質解析のための進化的計算に基づく画像分割手法を提案する。
この手法は、勾配等級解析と距離変換を統合し、新しい注意重み付き可視化を作成する。
その結果,AFSD関節における不完全結合領域と不均一領域の同定に注意に基づく解析が有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:45:59 GMT)
Evaluating link prediction: New perspectives and recommendations [0.0] リンク予測(LP)は、ネットワーク科学と機械学習研究において重要な問題である。
厳密かつ制御された方法でLP手法を評価できる実験装置を提案する。
この制御されたセットアップにおいて、実ネットワークデータセット上の様々なLP手法を用いて広範な実験を行い、慎重に設計された仮説の配列を通して、これらの要因とLPの性能との相互作用についての貴重な知見を収集する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:08:51 GMT)
Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach [0.0] 我々はヒトフェノタイプオントロジーの病原性アノテーションを用いて合成ビグネットを生成する。
そこで我々はSCインタビューをシミュレーションし,アルゴリズム更新が現実世界の診断性能に与える影響を推定した。
本手法の有効性は, 実測値と実測値を比較し, 遡及的に評価した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:06:37 GMT)
Error recovery protocols within metastable Decoherence-Free Subspaces [0.0] 量子マスター方程式によって支配されるオープン量子系は、量子メタスタビリティを示すことができる。
このような準安定DFSを受動的量子誤り訂正のための符号空間として利用する方法について検討する。
リウヴィリアンのスペクトル特性を用いて、どの種類の誤りが自律的に逆転できるかを特徴付ける。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:54:16 GMT)
Entropy and type-token ratio in gigaword corpora [0.0] 語彙の多様性はタイプトケン比とエントロピーで特徴づけられる。
英語,スペイン語,トルコ語の6つの大規模言語データセットにおける多様性指標について検討した。
与えられたコーパスと言語のテキストのエントロピーとタイプトケン比の実証的機能関係を明らかにした。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:18:03 GMT)
Entanglement detection via third-order local invariants from randomized measurements [0.0] ランダム化測定によりアクセス可能な3階局所不変量をすべて計算し、分離性基準を導出する。
不変量の再構成により、任意の局所次元を持つ多部状態に対する実験的にアクセス可能な絡み合い基準が得られる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:34:29 GMT)
Enhancing Sports Strategy with Video Analytics and Data Mining: Assessing the effectiveness of Multimodal LLMs in tennis video analysis [0.0] 本研究の目的は,テニスビデオを中心に,スポーツビデオの分析におけるMLLMの有効性を評価することである。
テニス分析の研究にもかかわらず、テニス集会における出来事の順序を理解し、特定できるモデルにはギャップが残っている。
このギャップを埋める能力 - テニスのアクションを分類する能力 - と、集会での一連のテニスアクションでこれらのアクションを識別する能力について、MLLMを主に評価する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 06:08:35 GMT)
Emotion Detection on User Front-Facing App Interfaces for Enhanced Schedule Optimization: A Machine Learning Approach [0.0] 感情検出に対する2つの補完的アプローチを提示し,評価する。
心電図(ECG)信号から抽出した心拍数(HR)データを用いて、ヴァレンス、オーラル、ドミナンスの感情次元を予測し、複数の機械学習モデルを介してコンピュータ活動を分析し、マウスの動き、クリック、キーストロークパターンなどのきめ細かいユーザーインタラクションに基づいて感情を分類する行動的方法。
実世界のデータセットから得られた我々の比較分析によると、どちらの手法も有効性を示す一方で、コンピュータアクティビティに基づく手法は、特にマウス関連の相互作用において、より優れた一貫性と精度を提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:21:46 GMT)
Emergence of non-ergodic multifractal quantum states in geometrical fractals [0.0] 固有状態多フラクタル性(Eigenstate multifractality)は、非相互作用性不規則金属の目印であり、異常なスローダイナミクスによって特徴づけられる。
本研究では, 結晶格子に欠陥を反復的に導入することにより, 乱れのない非エルゴード多フラクタル状態を実現する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 10:01:47 GMT)
Directional search for light dark matter with quantum sensors [0.0] ダークマター(DM)の存在は、粒子物理学における新しい物理学の最も説得力のある兆候の1つである。
センサ間の位相差は、DM風の速度と方向の情報を含む。
本稿では,この情報を量子状態を用いてセンサから抽出するための測定プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:31:53 GMT)
Detecting zero-point fluctuations with stochastic Brownian oscillators [0.0] ゼロ点変動の検出を可能にする一般的な増幅戦略を提案する。
本稿では,未知の熱浴の量子揺らぎの証として,ウイルス比を用いる方法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:35:29 GMT)
Dataset of soil images with corresponding particle size distributions for photogranulometry [0.0] 本稿では,ケベック州モントリオールで収集された321種類の土壌試料の高解像度画像12,714枚について述べる。
ジオテクノロジー応用において、畳み込みニューラルネットワーク(CNN)をトレーニングするための堅牢な出発点を提供するように設計されている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:07:00 GMT)
DRIFT: Data Reduction via Informative Feature Transformation- Generalization Begins Before Deep Learning starts [0.0] DRIFTは物理系の振動解析に触発された新しい前処理技術である。
信号と雑音の両方の中で学習しようとする従来のモデルとは異なり、DRIFTは情報的特徴を強調することで物理知覚を模倣する。
DRIFTでは、画像はプレートの空間振動モード形状によって形成された低次元の基底に投影され、物理的に接地された特徴セットを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:53:18 GMT)
Curating art exhibitions using machine learning [0.0] 本稿では,機械学習技術に基づく一連の人工モデルを提案する。
われわれは過去25年間の展覧会をニューヨークのメトロポリタン美術館で開催することに集中している。
我々の4つの人工知能モデルは、これらの様々なキュレーターを模倣する合理的な能力を達成する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:25:03 GMT)
Cross-regularization: Adaptive Model Complexity through Validation Gradients [0.0] クロス規則化は、トレーニング中の検証勾配を通じて正規化パラメータを適用することでトレードオフを解決する。
ニューラルネットワークのノイズ注入によって実装される場合、この手法は印象的なパターンを明らかにする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:15:50 GMT)
Continuous quantum correction on Markovian and Non-Markovian models [0.0] 我々はマルコフ的誤差モデルの下での性能を2つの異なる非マルコフ的モデルと比較する。
連続量子誤差補正は非マルコフ雑音に対する性能を高めた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:54:38 GMT)
Constructive Universal Approximation and Finite Sample Memorization by Narrow Deep ReLU Networks [0.0] 我々は$N$の異なる点を持つデータセットが$mathbbRd$と$M$の出力クラスを正確に分類できることを示した。
また、任意の有界領域に対して$Lp(Omega; mathbbRm)$の普遍近似定理も証明する。
我々の結果は、深層ニューラルネットワークにおける制御性、表現性、およびトレーニングのダイナミクスを接続する統一的で解釈可能なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:20:03 GMT)
Comparative study of divacancies in 3C-, 4H- and 6H-SiC [0.0] 6H-および3C-SiCの多様性は共鳴励起でも安定であると予想される。
6H-および3C-SiCの多様性は共鳴励起でも安定であると予想される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 09:44:14 GMT)
Classification in Japanese Sign Language Based on Dynamic Facial Expressions [0.0] 日本語手話(JSL)認識の研究は,データセットの欠如により限られている。
JSLでは、肯定的な文や質問などの文型は表情によって区別される。
提案手法は,ニューラルネットワークを用いて顔の特徴を分析し,文型を分類する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 04:10:50 GMT)
Characterizing quantum resourcefulness via group-Fourier decompositions [0.0] 状態のフーリエ分解群(GFD)は、資源と複雑さの指紋を構成する。
低リソース状態は作用素空間の小さな次元的な非自明な状態にあるのに対し、高リソース状態はより多く、より高次元的な状態をサポートする。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:02:40 GMT)
Canary in the Mine: An LLM Augmented Survey of Disciplinary Complaints to the Ordre des ingénieurs du Québec (OIQ) [0.0] 本研究は,ケベックの技術者による懲戒的事件をテーマ分析するために,事前学習したLLMを用いている。
本研究は,学際的な出来事とその原因の実証的証拠を提供することによって,工学教育と専門的開発のためのエビデンスベースの実践に寄与する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:40:40 GMT)
Can One Safety Loop Guard Them All? Agentic Guard Rails for Federated Computing [0.0] 我々は,フェデレートコンピューティングのプライバシ保護のための新しいフレームワークであるGuardian-FCを提案する。
多様なプライバシー保護機構にまたがって安全対策を統一する。
本稿では,バックエンドに依存しない安全性を示す定性的なシナリオと,検証のための形式的モデル基盤を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:39:49 GMT)
Broadband photonic structures to achieve high coupling efficiencies and Purcell factors with dark and interlayer excitons in 2D materials [0.0] 水平スロット導波路は、平面外方向に強く偏光する誘導モードを持つ平面フォトニック構造である。
遷移金属ジヒドロコゲナイド (TMD) 単分子膜において, このモードがカップリング効率$beta>80%$およびPurcell Factor$F_P>10$をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 00:47:02 GMT)
Beyond Static Models: Hypernetworks for Adaptive and Generalizable Forecasting in Complex Parametric Dynamical Systems [0.0] 補間ネットワーク学習のためのパラメトリックハイパーネットワーク(PHLieNet)について紹介する。
PHLieNetはパラメータ空間から非線形埋め込みへのグローバルマッピングと、推論埋め込みから動的伝播ネットワークの重みへのマッピングを同時に学習する。
観測よりもモデルの空間を補間することにより、PHLieNetはパラメータ化されたシステム挙動間のスムーズな遷移を促進する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 13:22:49 GMT)
Beyond Autocomplete: Designing CopilotLens Towards Transparent and Explainable AI Coding Agents [0.0] CopilotLensはインタラクティブなフレームワークで、単純な提案から透過的で説明可能なイベントへとコード補完を再構築する。
CopilotLensは、動的2レベルインターフェースを通じてAIエージェントの"思考プロセス"を明らかにする説明レイヤとして機能する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:50:03 GMT)
Autonomous Stabilization of Floquet States Using Static Dissipation [0.0] 量子システムの特性を強い周期駆動を用いて修正するフロケット工学は、原子および凝縮物質系において欠かせない道具である。
本稿では、Floquetシステムの大規模クラスを所望の状態に冷却するために、駆動系と損失補助体の静的結合を利用する単純な自律スキームについて述べる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:51:56 GMT)
Arabic Dialect Classification using RNNs, Transformers, and Large Language Models: A Comparative Analysis [0.0] アラビア語は世界でも最も人気のある言語の一つであり、22か国で話される方言が多種多様である。
本研究では、アラビア語のツイートのQADIデータセットの18のアラビア方言を分類する問題に対処する。
このうち、MARBERTv2は65%の精度、64%のF1スコアで最高の成績を収めた。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:06:58 GMT)
Anomaly Detection and Radio-frequency Interference Classification with Unsupervised Learning in Narrowband Radio Technosignature Searches [0.0] 本稿では,HDBSCANを用いて偽陽性率を低減し,外れ値信号の分離を行う信号処理手法であるGLOBular Clusteringを提案する。
ターボSETIのような標準的な狭帯域信号検出と空間フィルタリングパイプラインを組み合わせると、GLOBularクラスタリングは偽陽性率を大幅に改善する。
我々は,Lバンド付近の97個の銀河をChozaらによるターボSETI法で探索し,93.1%,99.3%の偽陽性事象低減率を示す。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:10:40 GMT)
An ETSI GS QKD compliant TLS implementation [0.0] TLSプロトコルは、クライアントとサーバ側の後方互換性を維持しながら変更される。
当社のプロトコルはQKDで暗号化されたビデオ会議コールに使用しています。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 08:27:47 GMT)
Adaptive quantum dynamics with the time-dependent variational Monte Carlo method [0.0] シミュレーション中の変動量子状態の表現率を適応的に制御する,時間依存型変分モンテカルロ法(tVMC)の拡張を提案する。
スピンジャストロウと制限ボルツマン機械波動関数を用いた一次元横場イジングモデルにおける量子クエンチのベンチマークを行った。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:47:37 GMT)
Accurate and Energy Efficient: Local Retrieval-Augmented Generation Models Outperform Commercial Large Language Models in Medical Tasks [0.0] LLM(Local Large Language Models)は、医療タスクにおいて商用のオンラインLLMよりも優れたRAGを開発するために利用することができる。
私たちのモジュラーフレームワークは、持続可能なAI開発を促進し、電気の使用を減らし、国連の持続可能な開発目標と整合する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 20:56:03 GMT)
AYLA: Amplifying Gradient Sensitivity via Loss Transformation in Non-Convex Optimization [0.0] Gradient Descent (SGD)とその変種(ADAMなど)はディープラーニングの最適化の基礎となっている。
本稿では、動的トレーニングを強化する新しいフレームワークであるAYLAを紹介する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 14:57:56 GMT)
ANOVA-boosting for Random Fourier Features [0.0] 我々のアルゴリズムは、重要な入力変数と変数の相互作用のインデックスセットを確実に見つけることができる。
我々のアルゴリズムは解釈可能性の利点があり、つまり、全ての入力変数の影響が学習モデルで知られていることを意味する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:40:40 GMT)
AI-Assisted Transport of Radioactive Ion Beams [0.0] 我々は,放射光の輸送過程を支援するために人工知能(AI)を用いたシステムを導入する。
このAI支援アプローチは、世界中の他の放射性ビーム施設に拡張して、運用効率を改善し、科学的な出力を高めることができる。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 15:36:26 GMT)
A spectral quantum algorithm for numerical differentiation and integration [0.0] 半有界領域における数値微分と積分のための低複素性量子アルゴリズムを提案する。
このアルゴリズムは、計算効率の良い量子フーリエ変換アルゴリズムを活用できるスペクトルアプローチに基づいている。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 19:11:52 GMT)
A large deviation view of \emph{stationarized} fully lifted blirp interpolation [0.0] アンフィリ指数付ランダムプロセス(blirp)について検討し,その補間比較機構について検討する。
共用紙(106)に[105]のエンフラージュ偏差アップグレードを導入する。
基本補間パラメータ関係の最終的な形式は、かなりエレガントであり、それによって、さらなる利用に容易に利用できる貴重なツールを提供する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 03:08:14 GMT)
A Unified Platform to Evaluate STDP Learning Rule and Synapse Model using Pattern Recognition in a Spiking Neural Network [0.0] We developed a unified platform to evaluate Ideal, Linear, and Non-linear $textPr_0.7textCa_0.3textMnO_3$ memristor-based synapse model。
列車セットが小さいMNISTと大型テストセットの2層SNNでは, それぞれ92.73 %, 91.07 %, 80 %の精度を実現している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 07:10:43 GMT)
A Robust Twin Parametric Margin Support Vector Machine for Multiclass Classification [0.0] 本稿では,特徴不確実性を考慮したマルチクラス分類タスクに対処する新しいTPMSVMモデルを提案する。
データ摂動に対処するため、各トレーニング観測の周囲に有界・北不確実性セットを構築し、決定論的モデルのロバストな特徴を導出する。
実世界のデータセットに対する頑健なマルチクラスTPMSVM手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 16:07:13 GMT)
A Hybrid Intrusion Detection System with a New Approach to Protect the Cybersecurity of Cloud Computing [0.0] 本研究の目的は、初期脅威を特定し緩和するハイブリッド侵入検知システム(HyIDS)を提案することである。
提案されたアプローチは、CIC_DDoS 2019、CSE_CIC_DDoS 2018、NSL-KDDデータセットを使用して評価される。
提案手法の結果はGrey Wolf(GWO)データセットと比較される。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:19:02 GMT)
A Comparison of Precinct and District Voting Data Using Persistent Homology to Identify Gerrymandering in North Carolina [0.0] 本研究では,Feng と Porter の2019 年の論文の拡張として,地理空間的選挙データからフィルタされた単体複合体を構築するためのレベルセット法について述べる。
選挙区や地区レベルでの民主党の投票領域の恒久的なホモロジーを比較すると、パルチザンの利益のために地域が「区切られた」か「詰められた」かがわかる。
本研究では,ジェリーマンダリング評価におけるトポロジカルデータ解析の新たな応用法を提案する。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 23:54:43 GMT)
A Comparative Study of NAFNet Baselines for Image Restoration [0.0] 画像復元のためのシンプルで効率的なディープラーニングベースラインであるNAFNetについて検討する。
CIFAR10画像はノイズとぼかしで劣化し,NAFNetのコアコンポーネントのアブレーション研究を行う。
我々の研究はNAFNetの設計を支持しており、SimpleGateと単純化された注意機構は従来のアクティベーションや注意よりも優れた結果をもたらす一方、LayerNormは安定したトレーニングに重要であることを証明している。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 17:59:23 GMT)
A Comparative Analysis of Reinforcement Learning and Conventional Deep Learning Approaches for Bearing Fault Diagnosis [0.0] 回転機械の軸受欠陥は、運用上の重大な破壊とメンテナンスコストにつながる可能性がある。
断層診断の近代的手法は、振動解析と機械学習技術に大きく依存している。
本研究では, 機械条件モニタリングにおける故障分類タスクに対する強化学習(RL)の実現可能性について検討した。
論文参考訳(メタデータ) (Tue, 24 Jun 2025 18:06:57 GMT)