Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free [81.7] 我々は、ゲーティング強化ソフトマックスアテンションの変種を調べる実験を行った。
SDPA(Scaled Dot-Product Attention)後の頭部特異的シグモイドゲートを簡易に修正することで,性能が向上することがわかった。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:15:49 GMT)
Reducing Unimodal Bias in Multi-Modal Semantic Segmentation with Multi-Scale Functional Entropy Regularization [66.1] 高精度な予測タスクのための新しいセンサからのマルチモーダル入力の再利用とバランスが重要である。
1つの大きな制限は、マルチモーダルフレームワークが容易に学習可能なモダリティに過度に依存する傾向があることである。
本稿では,機能的エントロピーに基づくプラグ・アンド・プレイ正規化項を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:58:15 GMT)
Weakly Supervised Temporal Sentence Grounding via Positive Sample Mining [64.3] WSTSGの課題は、ビデオレベルのビデオ言語対応のみで、未編集ビデオから言語記述に対応する時間間隔を検出することである。
アンカーサンプルの場合、既存のほとんどのアプローチは、対照的な学習のために、他のビデオまたは同じビデオから負のサンプルを生成する。
我々は,より差別的な監視を提供するために,トレーニングセットから正のサンプルをマイニングする新しいフレームワークである正のサンプルマイニング(PSM)を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:03:00 GMT)
Micius, the world's first quantum communication satellite, was hackable [55.9] 量子鍵分布のためのデコイ状態BB84プロトコルは、世界初の量子通信用衛星であるMiciusで使用されている。
搭載されている8つのレーザーダイオード間の相対時間遅延が発見された。
物理学の法則に反しない限り、可能な限り完璧な装置を使用する潜在的な攻撃者は、少なくとも98.7%のケースにおいて、信号装置とデコイ状態を区別できることを示した。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:30:38 GMT)
GRACE: Estimating Geometry-level 3D Human-Scene Contact from 2D Images [54.6] 人景接触の幾何レベルを推定することは、特定の接触面点を3次元の人間ジオメトリに接することを目的としている。
GRACE(Geometry-level Reasoning for 3D Human-scene Contact Estimation)は,3次元接触推定のための新しいパラダイムである。
ポイントクラウドエンコーダ/デコーダアーキテクチャと階層的特徴抽出と融合モジュールが組み込まれている。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:25:46 GMT)
HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation [54.0] 階層型視覚-言語-アクションモデルは、標準的なモノリシックVLAモデルよりも、ドメイン外のデータを利用するのに効果的であることを示す。
階層設計により、高レベルなVLMは、オフドメイン微調整データと実ロボットテストシナリオの間の重要なドメインギャップをまたいで転送可能であることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 18:11:38 GMT)
Opt-In Art: Learning Art Styles Only from Few Examples [50.6] ごく少数の例を考慮すれば,絵画を使わずに訓練されたモデルを芸術的なスタイルに適応させることが可能であることを示す。
意外なことに, 芸術的データに事前に触れることなく, 高品質な芸術的アウトプットを達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:57:53 GMT)
Towards Understanding Sycophancy in Language Models [49.4] 人間のフィードバックを利用した微調整を施したモデルにおける梅毒の有病率について検討した。
5つの最先端のAIアシスタントが、4つの異なる自由形式のテキスト生成タスクで常に梅毒を発現していることを示す。
以上の結果から、サイコファンシーは最先端のAIアシスタントの一般的な行動である可能性が示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:10:46 GMT)
Latent Feature-Guided Diffusion Models for Shadow Removal [47.2] 本稿では,拡散過程における影領域の詳細を段階的に洗練する,有望なアプローチとして拡散モデルの利用を提案する。
シャドウフリー画像の特徴を継承する学習された潜在特徴空間を条件付けすることで,この処理を改善する。
AISTDデータセット上でRMSEを13%向上させる手法の有効性を示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:17:58 GMT)
MacRAG: Compress, Slice, and Scale-up for Multi-Scale Adaptive Context RAG [45.3] Multi-scale Adaptive Context RAG (MacRAG) は、文書を粗い粒度に圧縮して分割する階層的な検索フレームワークである。
MacRAGは効率的なクエリ固有長コンテキストを構築し、精度とカバレッジの両方を最適化する。
本研究は,MacRAGを実世界の長文マルチホップ推論のための効率的でスケーラブルなソリューションとして確立した。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:50:44 GMT)
A Survey of WebAgents: Towards Next-Generation AI Agents for Web Automation with Large Foundation Models [45.1] Webのコンテキストでは、退屈な日々のタスクを扱う人々を支援するために、AI Agents -- WebAgents -- を活用することで、生産性と効率が劇的に向上する。
LFMの可能性を十分に探求するために、ユーザの指示に従って日々のWebタスクを完了させるように設計されたWebAgentsに広範な研究が登場した。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:20:29 GMT)
When SAM2 Meets Video Camouflaged Object Segmentation: A Comprehensive Evaluation and Adaptation [44.7] 本研究では,ビデオキャモフラージュオブジェクトセグメンテーション(VCOS)におけるSegment Anything Model 2(SAM2)の適用と性能について検討する。
VCOSは、似たような色やテクスチャ、照明条件の悪さなどにより、ビデオの周囲にシームレスにブレンドされたオブジェクトを検出する。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:48:36 GMT)
DPolicy: Managing Privacy Risks Across Multiple Releases with Differential Privacy [44.3] 差分プライバシー(DP)を用いた複数データリリースにおける累積プライバシーリスク管理システムDPolicyを提案する。
各リリースを個別に処理したり、単一の(グローバルな)DP保証を頼りにするような従来のアプローチとは異なり、当社のシステムは複数のDP保証を同時に検討する柔軟なフレームワークを採用している。
DPolicyは、プライバシー保証を形式化する高レベルのポリシー言語を導入し、伝統的にスコープとコンテキストに関する暗黙の仮定を明示している。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:49:51 GMT)
TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models [43.8] 対象話者音声処理ユニバーサルパフォーマンスベンチマーク(TS-SUPERB)を導入する。
このベンチマークには、広く認識されている4つのターゲットスピーカー処理タスクが含まれている。
入力音声から抽出した話者埋め込みは、下流モデルの条件付けの手がかりとして用いられる。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:23:37 GMT)
A Lightweight UDF Learning Framework for 3D Reconstruction Based on Local Shape Functions [42.8] 本稿では,局所形状関数を利用して3次元点雲から表面を再構成する新しいニューラルネットワーク,LoSF-UDFを提案する。
本手法は, 従来の手法と比較して, 点雲におけるノイズや外れ値に対する耐性が向上していることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:26:47 GMT)
Model Steering: Learning with a Reference Model Improves Generalization Bounds and Scaling Laws [40.8] 本稿では,戦略データの選択や重み付けを通じて,対象モデルのトレーニングを指導・強化するための基準として,訓練モデルを用いた新たな学習パラダイムを定式化する。
提案手法は,参照モデルを持たないトレーニングと比較して,一般化とデータの効率性を改善する理由に関する理論的知見を提供する。
これらの知見に基づいて,DRRho-CLIPと呼ばれる参照モデルを用いたコントラスト言語-画像事前学習手法を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:55:03 GMT)
CompSLAM: Complementary Hierarchical Multi-Modal Localization and Mapping for Robot Autonomy in Underground Environments [38.3] CompSLAMは、ロボットのためのマルチモーダルなローカライゼーションとマッピングフレームワークである。
決勝戦で勝利したチーム・ケルベロスの全ての空中、脚、車輪付きロボットに配備された。
本稿では,DARPAサブテランチャレンジの決勝コースの大部分をカバーする,手動で遠隔操作された四足歩行ロボットが取得したデータセットについても紹介する。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:59:31 GMT)
Using External knowledge to Enhanced PLM for Semantic Matching [38.1] 本稿では,事前学習された意味的関連性判別モデルを強化するために,外部知識を用いる。
10個の公開データセットに対する実験結果から,本手法が一貫した性能向上を実現することが示された。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:33:48 GMT)
Boosting Neural Language Inference via Cascaded Interactive Reasoning [38.1] 自然言語推論(NLI)は、与えられた前提と仮説の間の論理的関係の確認に焦点を当てている。
この課題は、多様な言い回し、意味的複雑さ、文脈的ニュアンスといった固有の言語的特徴により、重大な課題を提起する。
NLIにおける深い意味理解のために設計された新しいアーキテクチャであるCascaded Interactive Reasoning Network (CIRN)を紹介する。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:37:15 GMT)
From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback [36.7] 包括的できめ細かい結果を提供する評価フレームワークであるFeedbackerを紹介します。
LLM-as-a-Judge法を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:52:40 GMT)
StableMotion: Repurposing Diffusion-Based Image Priors for Motion Estimation [35.8] 本稿では,画像修正作業における動作推定を行う新しいフレームワークであるStableMotionを紹介する。
StableMotionは2つの画像修正タスクで検証され、どちらも最先端のパフォーマンスを提供する。
SSDがサポートしているStableMotionは、これまでの拡散モデルベースの方法に比べて200倍のスピードアップを提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:58:44 GMT)
Integrating Video and Text: A Balanced Approach to Multimodal Summary Generation and Evaluation [35.5] 本稿では,ゼロショット映像からテキストまでの要約手法を提案する。
従来の手法とは異なり、我々は文字をゼロショットで生成し、音声、ビデオ、テキストのみを入力として使用する。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:52:23 GMT)
UnfoldIR: Rethinking Deep Unfolding Network in Illumination Degradation Image Restoration [33.3] DUN(Deep Openfolding Network)は、照明劣化画像復元(IDIR)に広く利用されている。
IDIRタスクのための新しいDUNベースのUnfoldIRを提案する。
反射率支援照明補正(RAIC)モジュールと照明誘導反射率向上(IGRE)モジュールから構成される。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:13:01 GMT)
GeoGround: A Unified Large Vision-Language Model for Remote Sensing Visual Grounding [32.8] GeoGroundは、HBB、OBB、マスクRSビジュアルグラウンドタスクのサポートを統合する新しいフレームワークである。
我々は,異なる信号間の一貫性を高めるために,プロンプト支援型および幾何学誘導型学習を定義する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:43:29 GMT)
Think in Safety: Unveiling and Mitigating Safety Alignment Collapse in Multimodal Large Reasoning Model [30.8] マルチモーダル大推論モデル(MLRM)は幅広いアプリケーションの可能性を示しているが、その安全性と信頼性は依然として重要な懸念点である。
5つのベンチマークで11個のMLRMの総合的かつ体系的な安全性評価を行う。
分析の結果,異なるベンチマーク間で異なる安全性パターンが明らかとなった。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:59:36 GMT)
Bi-level Mean Field: Dynamic Grouping for Large-Scale MARL [30.2] MARL(Multi-Agent Reinforcement Learning)における動的グループ化によるエージェントの多様性を捉えるためのバイレベル平均場(BMF)手法を提案する。
BMFは動的グループ割り当てモジュールを導入し、エージェントの表現を学習するために変分オートエンコーダ(VAE)を使用している。
また, グループ間相互作用とグループ内相互作用の両方をモデル化し, 効果的な隣接アグリゲーションをモデル化するバイレベル相互作用モジュールを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:04:33 GMT)
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation [27.8] 画像生成のための階層的クロスモーダルアライメント(HCMA)フレームワークを提案する。
HCMAは2つのアライメントモジュールを各拡散サンプリングステップに統合する。
MS-COCO 2014検証セットの実験では、HCMAが最先端のベースラインを超えたことが示されている。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:02:58 GMT)
Towards Robust Recommendation: A Review and an Adversarial Robustness Evaluation Library [27.5] 本稿では,レコメンデータシステムの堅牢性について概観する。
本研究では,レコメンダシステムのロバスト性を,対角的ロバストネスと非対角的ロバストネスに分類する。
本稿では,レコメンデータシステムの堅牢性と今後の研究方向性について論じる。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:09:46 GMT)
A Comprehensive Survey of Synthetic Tabular Data Generation [27.1] タブラルデータ(Tabular data)は、様々な現実世界のアプリケーションにまたがる最も一般的かつ重要なデータフォーマットの1つである。
データ不足、プライバシーの懸念、クラス不均衡といった問題によって制約されることが多い。
合成データ生成は、生成モデルを利用して実際のデータセットの分布を学習する、有望なソリューションとして登場した。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:10:06 GMT)
METOR: A Unified Framework for Mutual Enhancement of Objects and Relationships in Open-vocabulary Video Visual Relationship Detection [25.5] Open-vocabulary video visual relationship detectionは、事前に定義されたオブジェクトや関係カテゴリに制限されることなく、ビデオ内のオブジェクトとそれらの関係を検出することを目的としている。
既存の手法では、CLIPのような事前訓練された視覚言語モデルの豊富な意味知識を活用して、新しいカテゴリを識別する。
オープン語彙シナリオにおけるオブジェクト検出と関係分類を相互にモデル化し,相互に強化するために,Multual EnhancemenT of Objects and Relationships (METOR)を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:45:43 GMT)
Emotion-Qwen: Training Hybrid Experts for Unified Emotion and General Vision-Language Understanding [24.9] Emotion-Qwenは、感情理解と一般的な視覚言語推論の両方を強化するために設計されたフレームワークである。
Emotion-Qwenは、Mixture of Experts (MoE)パラダイムに基づいた洗練されたハイブリッドを組み込んでいる。
ビデオ感情推論(VER)データセットを構築し,40万本以上のバイリンガルビデオクリップと詳細な記述的アノテーションを用いて,感情・クウェンの感情推論能力をさらに強化する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:15:26 GMT)
Multi-modal Synthetic Data Training and Model Collapse: Insights from VLMs and Diffusion Models [24.7] マルチモーダル視覚言語生成システムにおける生成モデル崩壊のリスクについて検討する。
モデル崩壊は、視覚言語アライメントの改善や、画像キャプションタスクのばらつきの増大など、マルチモーダルな文脈において異なる特徴を示す。
本研究は,自己改善型マルチエージェントAIシステムにおいて,モデル崩壊のリスクを低減するための初期知見と実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:42:29 GMT)
Online Feedback Efficient Active Target Discovery in Partially Observable Environments [24.3] Diffusion-guided Active Target Discovery (DiffATD) は、拡散力学を有効ターゲット発見に活用する新しい手法である。
DiffATDは、固定されたサンプリング予算内で部分的に観測可能な環境で効率的なターゲット発見を可能にする。
我々は,DiffATDがベースラインよりもはるかに優れた性能を示し,完全な環境観測性の下で動作する教師付き手法と競合することを示した。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:50:01 GMT)
RuleGenie: SIEM Detection Rule Set Optimization [24.3] SIEMシステムの冗長あるいは重複したルールは、過剰な誤警報を引き起こし、警告疲労によるアナリストのパフォーマンスを低下させ、計算オーバーヘッドを増大させる。
本稿では、SIEMルールセットを最適化するように設計された新しい大規模言語モデル(LLM)であるStrucGenieを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:56:17 GMT)
Optimal Transport for Machine Learners [23.0] 最適輸送は、最適化、偏微分方程式、確率を結合する基礎数学的理論である。
これらのコースノートは、Monge や Kantorovich の定式化を含む OT の基本的な数学的側面をカバーしている。
機械学習の応用には、勾配流によるニューラルネットワークのトレーニング、トランスフォーマーのトークンダイナミクス、GANと拡散モデルの構造などが含まれる。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:35:03 GMT)
Improving Block-Wise LLM Quantization by 4-bit Block-Wise Optimal Float (BOF4): Analysis and Variations [22.1] 大規模言語モデル(LLM)は、微調整と推論の両方で広範なメモリ容量を必要とする。
既存の手法では、NF4やAF4といったブロックワイド量子化技術がネットワーク重みに適用されている。
これらの量子化手法が最適以下の量子化誤差を引き起こすことを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:00:15 GMT)
RAM: Replace Attention with MLP for Efficient Multivariate Time Series Forecasting [21.7] 本稿では, フィードフォワード層, 残差接続, 層正規化のみを用いて, 注意機構を近似する新しいプルーニング手法を提案する。
RAMは、性能低下が2.5%未満のテンポラルモデルのFLOPを62579%削減し、性能低下が2%未満のテンポラルモデルのFLOPを42.233%削減した。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:10:54 GMT)
Rewriting Pre-Training Data Boosts LLM Performance in Math and Code [21.6] Llama 3.3 Community Licenseの下でリリースされた2つのデータセットを導入し、大きな言語モデル(LLM)のパフォーマンスを大幅に向上させる。
SwallowCodeはPythonスニペットを,構文検証,ピリントベースのスタイルフィルタリング,2段階の書き換えプロセスという,新しい4段階のパイプラインを通じて洗練する。
We show that continual pre-training of Llama-3.1-8B with SwallowCode boosts pass@1 by +17.0 on HumanEval and +17.7 on HumanEval+ than Stack-Edu。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:45:30 GMT)
A Vision Centric Remote Sensing Benchmark [21.5] リモートセンシングタスクにおけるCLIPに基づくMLLMの限界について検討した。
リモートセンシングマルチモーダル視覚パターン(RSMMVP)ベンチマークを導入する。
CLIP-blindペアを識別することで、RSタスクのMLLMを評価するように設計されている。
我々は最先端MLLMの性能を解析し、RS特化表現学習における重要な制限を明らかにした。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:12:58 GMT)
MagicPortrait: Temporally Consistent Face Reenactment with 3D Geometric Guidance [21.1] 本稿では,3次元顔パラメトリックモデルを潜在拡散フレームワークに統合した映像顔再現手法を提案する。
本手法では, 3次元顔パラメトリック表現として, FLAME(Articulated Model and Expressions)モデルを用いる。
提案手法は,高精度な表情表現と頭部ポーズ変動モデルを用いて,高品質な顔アニメーションを生成するのに優れていることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:54:17 GMT)
Guided Exploration for Efficient Relational Model Learning [20.9] 効率的な探索は、複雑で長期のタスクを持つ大規模環境で関係モデルを学習するために重要である。
ゴールリテラルバブリング(GLIB)は、新しいゴールの設定と計画によってランダムな探索を改善する。
バキングラージ(Baking-Large)は、多岐にわたる状態-作用空間と長距離タスクを持つ挑戦的ドメインである。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:07:03 GMT)
HDGlyph: A Hierarchical Disentangled Glyph-Based Framework for Long-Tail Text Rendering in Diffusion Models [20.5] HDGlyphは、非テキスト視覚合成からテキスト生成を階層的に分離する新しいフレームワークである。
私たちのモデルは、英語と中国語のテキストレンダリングで5.08%と11.7%の精度で、他のモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:05:43 GMT)
FocusedAD: Character-centric Movie Audio Description [20.3] Movie Audio Description (AD)は、対話のないセグメントで視覚コンテンツを語り、特に視覚障害者(BVI)の聴衆に利益をもたらすことを目的としている。
キャラクタ中心の映画音声記述を提供する新しいフレームワークであるFocusedADを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:12:53 GMT)
OT-Talk: Animating 3D Talking Head with Optimal Transportation [20.0] OT-Talkは、音声ヘッドアニメーションの学習モデルを最適化するために最適なトランスポートを利用する最初のアプローチである。
既存の学習フレームワークに基づいて,事前学習したHubertモデルを用いて音声特徴を抽出し,変換器モデルを用いて時間的シーケンスを処理する。
2つの公開オーディオ・メシュ・データセットに対する実験により,本手法が最先端技術より優れていることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:23:04 GMT)
I Know What You Said: Unveiling Hardware Cache Side-Channels in Local Large Language Model Inference [19.5] ローカルにデプロイ可能な大規模言語モデル(LLM)は、最近、プライバシに敏感なタスクで人気を集めている。
ローカルLSM推論に新たなサイドチャネル脆弱性が出現し、被害者の入力テキストと出力テキストの両方を公開できる。
我々は,オープンソースのLLM推論システムとプロプライエタリなLLM推論システムの両方を対象として,新しい盗聴攻撃フレームワークを設計する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:06:37 GMT)
On Definite Iterated Belief Revision with Belief Algebras [19.1] 優先関係を通じて信条情報を特徴付けることにより、反復的信条修正のための新しい枠組みを提案する。
我々は,現在の信条と新たな証拠から,改定結果が一意に決定されていることを証明した。
このアプローチは、現実のアプリケーションに適した、より予測可能で原則化された信念の修正方法を提供するかもしれない、と我々は主張する。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:34:43 GMT)
Edge-Enabled VIO with Long-Tracked Features for High-Accuracy Low-Altitude IoT Navigation [18.6] 長く追跡された機能は、より視覚的なフレームを制限し、ローカライゼーションのドリフトを減らすことができる。
また、一致したエラーの蓄積や機能トラッキングのドリフトにつながる可能性がある。
現在のVIO法は再投射誤差に基づいて観測重量を調整するが,本手法には欠点がある。
本稿では,長期的特徴量利用における累積誤差に対するアクティブデカップリング機構を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:12:24 GMT)
PRUNE: A Patching Based Repair Framework for Certiffable Unlearning of Neural Networks [18.2] トレーニングされたニューラルネットワークモデルからトレーニングデータの一部を取り除くことが望ましい。
既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。
我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:35:08 GMT)
OMGM: Orchestrate Multiple Granularities and Modalities for Efficient Multimodal Retrieval [17.8] 知識に基づく視覚質問応答(KB-VQA)に対処するための視覚言語検索拡張生成(RAG)が有効なアプローチとなっている
本稿では,複数の粒度とモダリティを調和させて有効性を向上する,粗大で微細なマルチステップ検索を特徴とするマルチモーダルRAGシステムを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:24:41 GMT)
MultiTaskVIF: Segmentation-oriented visible and infrared image fusion via multi-task learning [17.7] セグメンテーション指向VIFモデルのための簡潔で普遍的なトレーニングフレームワークであるMultiTaskVIFを提案する。
本稿では,マルチタスクヘッドデコーダ(MTH)を導入し,融合画像とトレーニング中のセグメンテーション結果の両方を同時に出力する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:47:19 GMT)
Beyond $\tilde{O}(\sqrt{T})$ Constraint Violation for Online Convex Optimization with Adversarial Constraints [17.0] 逆制約を伴うオンライン凸最適化問題を再検討する。
我々は,$tildeO(sqrtdT+Tbeta)$ regretと$tildeO(dT1-beta)$ CCVを実現するオンラインポリシーを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:23:10 GMT)
ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images [15.3] ファッション生成は、指定された文字の参照画像から時間的に一貫したビデオを合成することを目的としている。
一貫性と時間的一貫性を向上させるためのフレームワークであるProFashionを提案する。
インターネットから収集したMRFashion-7Kデータセットについて評価を行った。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:59:24 GMT)
Enhancing Monotonic Modeling with Spatio-Temporal Adaptive Awareness in Diverse Marketing [15.0] OFOSプラットフォームは、支払いを促進するためにユーザーや商人に動的アロケーションインセンティブを提供する。
本稿では,マーケティング価格の高効率化を実現するために,制約付きモノトニック適応ネットワーク(CoMAN)を提案する。
提案手法の有効性を実証し, モノトニック・オブ・ザ・アーティファクト法より優れていることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:27:03 GMT)
10 quick tips for making your software outlive your job [14.9] 政治的・財政的な変化は、多くの研究者を同時に職から外している。
この記事では、研究者が現在の仕事を辞めた後も、彼らが構築したソフトウェアが引き続き利用可能であることを保証するための10のヒントを提示します。
論文参考訳(メタデータ) (Sat, 10 May 2025 01:21:29 GMT)
Tiled Flash Linear Attention: More Efficient Linear RNN and xLSTM Kernels [14.8] ゲーティングを備えた線形RNNは、最近、言語モデリングにおけるトランスフォーマーと比較して、競合する性能を示した。
線形RNNのための新しいカーネルアルゴリズムである Tiled Flash Linear Attention (TFLA) を提案する。
高速化ベンチマークでは、TFLAに基づく新しいmLSTMカーネルが、高度に最適化されたFlashアテンション、線形アテンション、およびMambaカーネルより優れていることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:07:13 GMT)
Exploring Multimodal Foundation AI and Expert-in-the-Loop for Sustainable Management of Wild Salmon Fisheries in Indigenous Rivers [14.6] このプロジェクトは、野生のサーモンモニタリングと持続可能な漁業管理を強化するために、ファンデーションAIとプリンシパル・イン・ザ・ループフレームワークの統合について検討する。
ビデオとソナーに基づくモニタリングを活用して、自動種識別、カウント、長さ測定のためのAIツールを開発する。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:03:06 GMT)
CaMDN: Enhancing Cache Efficiency for Multi-tenant DNNs on Integrated NPUs [14.1] CaMDNはアーキテクチャスケジューリングの共同設計であり、統合NPU上でのマルチテナントDNNのキャッシュ効率を向上させる。
以前の作業と比較して、CaMDNはメモリアクセスを平均33.4%削減し、2.56$times$(平均1.88$times$)までのモデルスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:16:50 GMT)
Purity Law for Generalizable Neural TSP Solvers [13.9] 本稿では,PuLaとニューラルソリューションの特性を明示的に整合させ,一般化を促進する新たなトレーニングパラダイムであるPurity Policy Optimization(PUPO)を提案する。
実験では、PUPOは一般的なニューラルソルバとシームレスに統合することができ、推論中に追加の計算オーバーヘッドを発生させることなく、その一般化性能を著しく向上させることができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:39:05 GMT)
System Prompt Poisoning: Persistent Attacks on Large Language Models Beyond User Injection [13.2] 大きな言語モデル(LLM)は、その印象的な生成能力のために、様々なアプリケーションで広く採用されている。
既存の研究は主にユーザープロンプトによる脅威に焦点を当てているが、システムプロンプトのセキュリティはほとんど見過ごされている。
LLMに対する新たな攻撃ベクトルであるシステムプロンプト中毒を導入し、従来のユーザプロンプトインジェクションとは異なり、毒素システムプロンプトはその後のすべてのユーザインタラクションやモデル応答に永続的に影響を及ぼす。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:31:26 GMT)
Demystifying SGD with Doubly Stochastic Gradients [13.0] 一般条件下では、独立なミニバッチとランダムリシャッフルを併用した2重SGDの収束特性を確立する。
ランダムリシャッフルによりサブサンプリングノイズの複雑性依存性が向上することが証明された。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:44:13 GMT)
SimMIL: A Universal Weakly Supervised Pre-Training Framework for Multi-Instance Learning in Whole Slide Pathology Images [12.8] 本稿では,弱教師付きスキームを用いたMIL機能抽出器を提案する。
MILの効果的な特徴を学習するために、強いデータ拡張、非線形予測ヘッド、ロバストな損失関数など、いくつかの重要なコンポーネントを探索する。
我々は、一般的な大規模WSIデータセットで実験を行い、他の事前学習方式よりも優れた性能が得られることを発見した。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:23:36 GMT)
Two-Stage Random Alternation Framework for Zero-Shot Pansharpening [12.4] 縮小解像度画像からの強い監督制約をフル解像度画像の物理的特性と統合する2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
フル解像度の画像を頼りにすることで、単一の画像ペアでゼロショットトレーニングが可能となり、大規模なデータセットの必要性を回避できる。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:26:22 GMT)
Out-of-Sample Embedding with Proximity Data: Projection versus Restricted Reconstruction [12.3] ベクトル図形に点を加える」という問題は1968年にJ.C. Gowerによって初めて研究された。
様々な状況は、投影または制限された再建を保証できる。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:11:30 GMT)
Improving Generalization of Medical Image Registration Foundation Model [12.1] 本稿では,医療画像登録における一般化と堅牢性を高めるため,シャープネス・アウェアの最小化を基礎モデルに組み込む。
実験結果から,SAMと統合された基礎モデルにより,データセット間の登録性能が大幅に向上することが確認された。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:14:09 GMT)
Causal Prompt Calibration Guided Segment Anything Model for Open-Vocabulary Multi-Entity Segmentation [11.7] Segment Anything Model (SAM) は、オープン語彙多元性セグメンテーション(OVMS)における一般化問題に苦慮している
我々は,正確なOVMSを実現するために,SAMの因果プロンプト法であるCPC-SAMを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:55:33 GMT)
Quantum Conflict Measurement in Decision Making for Out-of-Distribution Detection [11.5] 本研究は、意思決定における2つのQMF間の競合を測定する量子競合指標(QCI)を提案する。
次に、コンフリクト融合法にQCIを適用し、その性能をいくつかの一般的な融合法と比較する。
実験結果から,提案手法はいくつかの最先端のOOD検出手法に対して,OOD性能を向上することが示された。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:10:59 GMT)
TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility [11.4] 軌道予測は自動運転車にとって不可欠であり、車両は周囲の道路利用者の動きを予測できる。
現在のディープラーニングモデルは、予測が物理的に実現不可能で、人間には非論理的であるため、信頼性に欠けることが多い。
本稿では,エージェントの行動差を捉えるために,すべてのエージェントクラスの相互作用とキネマティックな先行を取り入れることを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:29:32 GMT)
Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving [11.4] 本稿では,軌道予測を許容駆動方向とその境界によって導かれる制約付き回帰として定式化する新しい枠組みを提案する。
エージェントの現在の状態とHDマップを用いて、有効な境界を定義し、ネットワークを訓練して、左右の境界ポリライン間の重畳された経路を学習することで、道路上の予測を確実にする。
我々は,HPTRベースラインに対するArgoverse-2データセットのアプローチを評価する。本手法はHPTRと比較してベンチマーク指標がわずかに低下するが,最終的な変位誤差が改善し,実現不可能な軌跡を排除している。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:21:00 GMT)
Driving with Context: Online Map Matching for Complex Roads Using Lane Markings and Scenario Recognition [11.3] 現在のオンライン地図マッチング手法は、複雑な道路網の誤りを招きやすい。
複数の確率因子を持つ隠れマルコフモデル(HMM)を構築することで、オンライン標準定義(SD)マップマッチング手法を提案する。
提案手法は,路面標識やシナリオ認識を慎重に利用することにより,複雑な道路網においても正確な地図マッチングを実現することができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:00:40 GMT)
Proper Name Diacritization for Arabic Wikipedia: A Benchmark Dataset [11.2] 我々は、英語のウィキペディアと同等の用語で、様々な起源のアラビア語の固有名称を手作業で分類したデータセットを導入する。
GPT-4oは、アラビア語と英語の未分類形態を考慮し、完全発音を回復する作業についてベンチマークを行った。
我々の結果は、タスクの難しさと改善されたモデルとリソースの必要性の両方を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:28:58 GMT)
PRIME: Physics-Related Intelligent Mixture of Experts for Transistor Characteristics Prediction [11.0] PRIME (Physics-Related Intelligent Mixture of Experts) は複雑な地域特性を捉え統合するために提案されている。
本質的に、我々のフレームワークは物理に基づく知識とデータ駆動インテリジェンスを取り入れている。
各種ゲート・オール・アラウンド (GAA) 構造について, PRIME の有効性を検討するため, 広範囲な評価を行った。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:53:12 GMT)
Calibrating Translation Decoding with Quality Estimation on LLMs [11.0] 本稿では,分布から見た翻訳品質を考慮した仮説のキャリブレーション手法を提案する。
本手法では,大規模言語モデル (LLM) の翻訳は,限られた訓練後に大幅に改善される。
結果として得られた最先端の翻訳モデルは、付随するコードと人間の評価データとともに、10の言語をカバーする。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:53:02 GMT)
Balancing Progress and Safety: A Novel Risk-Aware Objective for RL in Autonomous Driving [11.0] 強化学習(Reinforcement Learning, RL)は、堅牢な意思決定能力によって自律運転を実現するための有望なアプローチである。
本稿では,2次元楕円形関数に基づく各種駆動相互作用に対するリスク認識手法を提案する。
交通密度の異なる無署名の交差点シナリオにおいて,提案した報奨の有効性を評価する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:05:03 GMT)
Probing In-Context Learning: Impact of Task Complexity and Model Architecture on Generalization and Efficiency [10.9] タスクの複雑さとモデルアーキテクチャを体系的に変化させる、巧妙な実験フレームワークを用いて、文脈内学習(ICL)について検討する。
GPT2スタイルのトランスフォーマー、FlashAttention機構を備えたトランスフォーマー、畳み込みハイエナモデル、Mamba状態空間モデルという4つの異なるモデルを評価した。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:22:40 GMT)
ActRef: Enhancing the Understanding of Python Code Refactoring with Action-Based Analysis [10.7] 本稿では,ActRefというアクションベースのリファクタリング分析フレームワークを提案する。
ActRefはdiffアクションに基づいて複数のタイプ(移動、名前変更、抽出、インライン操作など)をマイニングする。
ActRefは、コード変更アクションにフォーカスすることで、複雑なパターンを検出するPython対応のソリューションを提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:48:50 GMT)
TGBFormer: Transformer-GraphFormer Blender Network for Video Object Detection [10.7] 本稿では,ビデオオブジェクト検出のためのTransformer-GraphFormer Blender Network (TGBFormer)を提案する。
まず,グローバルな文脈情報を集約する時空間変換モジュールを開発する。
第2に,局所的空間的および時間的関係を利用して特徴を集約する空間時空間グラフフォーマーモジュールを提案する。
第3に、トランスフォーマーベースのグローバル表現とGraphFormerベースのローカル表現を適応的に結合するグローバルローカル機能ブレンダーモジュールを設計する。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:01:15 GMT)
New constructions of multipartite entanglement resistant to particle loss [10.6] 我々は、任意のN-粒子系に対して、常にm-抵抗純状態が存在すると推測した。
1つはディック状態の混合であり、k = 4 または 5 の強い (N - k) 耐性の純N-量子状態を与える。
もう1つは古典的な誤り訂正符号で、ある m N/2 に対して新しい m 耐性の qudit 状態を提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:43:29 GMT)
Effective Regularization Through Loss-Function Metalearning [10.6] 進化的計算は、ニューラルネットワークアーキテクチャのさまざまな側面を最適化するために使用することができる。
本稿では,そのような関数が過剰適合を回避し,有効正則化につながることを理論的に示す。
本稿では,正規化の理解に向けた第一歩として,進化的ニューラルアーキテクチャ探索の能力について述べる。
論文参考訳(メタデータ) (Sat, 10 May 2025 23:50:24 GMT)
Robust Learning of Diverse Code Edits [10.6] ソフトウェアエンジニアリングのアクティビティは、しばしば既存のコードへの編集を伴います。
コード言語モデル(LM)には、さまざまなタイプのコード編集要求を処理する能力がない。
本稿では,新しい合成データ生成パイプラインと適応アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:59:18 GMT)
Towards Optimal Branching of Linear and Semidefinite Relaxations for Neural Network Robustness Certification [10.3] 本研究では,ReLUニューラルネットワークの逆入力摂動に対する堅牢性を検証する。
入力不確実性集合を分割し,各部分の緩和を個別に解くために,分岐とバウンドのアプローチをとる。
提案手法は緩和誤差を低減し,ReLUアクティベーションの性質を活かしたパーティションを用いてLP緩和を行うことによって完全に誤差を除去することを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:15:51 GMT)
ElectricSight: 3D Hazard Monitoring for Power Lines Using Low-Cost Sensors [10.2] ElectricSightは、送電線に対する3次元距離測定と潜在的な危険の監視のために設計されたシステムである。
この研究の重要な革新は、システム全体のフレームワークと単眼深度推定方法の両方にある。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:15:04 GMT)
Fleet of Agents: Coordinated Problem Solving with Large Language Models [10.2] Fleet of Agents(FoA)は、動的ツリー検索をナビゲートするエージェントとして大きな言語モデルを利用する、原則化されたフレームワークである。
FoAは多数のエージェントを発生させ、それぞれが自律的に検索空間を探索し、次に選択フェーズを行う。
FoAはすべてのベンチマーク手法の中で最高のコスト品質のトレードオフを実現し、FoA + LMA3.2-11BはLlama3.2-90Bモデルを上回る。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:36:43 GMT)
Dual Alignment Maximin Optimization for Offline Model-based RL [10.0] オフラインの強化剤は、合成から現実の分布ミスマッチのため、重要な展開課題に直面します。
本稿では、まずモデル信頼性から、期待したリターンを最適化しながらポリシーの相違に焦点を移し、その後、自己整合的に合成データを組み込む。
これは、モデル環境ポリシーの一貫性と、合成およびデータのオフラインを保証する統一されたフレームワークである。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:42:40 GMT)
Visual Theory of Mind Enables the Invention of Proto-Writing [10.0] エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。
私たちのモデルは、原著の出現の背景にある認知的・文化的プロセスに光を当てています。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:24:55 GMT)
Learning Graph Representation of Agent Diffuser [9.4] 拡散に基づく生成モデルは高度なテキスト-画像合成を持つ。
この遷移は、静的モデルパラメータが生成の異なるフェーズに最適に対応していないことを示唆している。
本稿では,動的コンピュータビジョンタスクの適応性向上を目的とした,新しいマルチエージェントシステムであるLGR-ADを紹介する。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:42:24 GMT)
REFINE-AF: A Task-Agnostic Framework to Align Language Models via Self-Generated Instructions using Reinforcement Learning from Automated Feedback [9.4] 大規模言語モデル (LLMs) は、多数の少数ショットまたはゼロショット自然言語処理 (NLP) タスクで有効であることが証明されている。
これまでの研究は、モデル自体から直接命令を生成することのできるフレームワークを提案することで、この問題に対処しようと試みてきた。
本稿では,セミオートマチックなフレームワークを用いて,オープンソースの3つのLLMの性能について検討する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:23:19 GMT)
Dataset Distillation with Probabilistic Latent Features [9.3] 合成データのコンパクトなセットは、下流の分類タスクにおける元のデータセットを効果的に置き換えることができる。
本稿では,潜在特徴の共分散をモデル化する新しい手法を提案する。
提案手法は,バックボーンアーキテクチャにまたがる最先端のクロスアーキテクチャ性能を実現する。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:53:49 GMT)
GarmentDiffusion: 3D Garment Sewing Pattern Generation with Multimodal Diffusion Transformers [9.2] GarmentDiffusionは、マルチモーダル入力からセンチメートル精度でベクトル化された3Dミシンパターンを生成できる新しい生成モデルである。
提案手法は、3次元ミシンパターンパラメータをコンパクトなエッジトークン表現に効率的に符号化する。
その結果,縫製パターン生成速度はSwingGPTの100倍に向上した。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:14:47 GMT)
The Sound of Populism: Distinct Linguistic Features Across Populist Variants [9.2] 本研究は,古典的な言語問合せとワーカ機能を統合することで,ポピュリズムの音を探求する。
音声の言語マーカーにおいて,4つの重要ポピュリスト次元(左翼,右翼,反エリシズム,人中心性)がどのように現れるかを検討する。
論文参考訳(メタデータ) (Sat, 10 May 2025 03:18:19 GMT)
FreCT: Frequency-augmented Convolutional Transformer for Robust Time Series Anomaly Detection [8.8] 時系列異常検出はシステム監視とリスク識別に重要である。
周波数拡張畳み込み変換器(FreCT)を提案する。
FreCTはパッチ操作を利用してコントラストビューを生成し、コンボリューションモジュールと統合された改良されたTransformerアーキテクチャを採用している。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:32:35 GMT)
Dynamic Domain Information Modulation Algorithm for Multi-domain Sentiment Analysis [8.3] マルチドメインの感情分類は、単一のドメインにおけるラベル付きデータの不足により、貧弱なパフォーマンスモデルを軽減することを目的としている。
本稿では,各領域の感情分類に必要な領域情報を効率的に生成する動的情報変調アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:36:00 GMT)
M3CAD: Towards Generic Cooperative Autonomous Driving Benchmark [8.2] M$3$CADは、30kフレームの204のシーケンスで構成され、多様な協調運転シナリオにまたがる。
このリッチなマルチモーダル構成により、M$3$CADは単車と多車の両方の自動運転研究をサポートすることができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:47:44 GMT)
A Survey on Data-Driven Modeling of Human Drivers' Lane-Changing Decisions [8.1] 重大な運転操作である車線変更(LC)の挙動は、運転安全性と交通力学に大きな影響を及ぼす。
従来のLC決定(LCD)モデルは、特定の環境では有効であるが、しばしば振る舞いの不均一性と複雑な相互作用を単純化する。
データ駆動型アプローチは、リッチな経験的データと機械学習を活用して、潜在的な意思決定パターンをデコードすることで、これらのギャップに対処する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:09:03 GMT)
Towards One Model for Classical Dimensionality Reduction: A Probabilistic Perspective on UMAP and t-SNE [8.1] 本稿では,Ravuri 等で導入されたモデルに対応するMAP推論手法として,次元性低減手法を再放送する。
グラフラプラシアンによって暗示される共分散を記述するためによく知られたカーネルが利用できることを示す。
同様の次元削減手法を研究できるツールを紹介した。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:36:12 GMT)
Enhancing Trust Management System for Connected Autonomous Vehicles Using Machine Learning Methods: A Survey [7.5] 接続された自律走行車(CAV)は動的、オープン、マルチドメインネットワークで動作し、様々な脅威に対して脆弱である。
機械学習(ML)の最近の進歩は、信頼管理システム(TMS)を強化する大きな可能性を秘めている
本研究では,自動車とクラウドの統合システムにおけるCAVのための新しい3層MLベースのTMSフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:13:36 GMT)
Minimizing Risk Through Minimizing Model-Data Interaction: A Protocol For Relying on Proxy Tasks When Designing Child Sexual Abuse Imagery Detection Models [7.5] 子どもの性的虐待のイメージ(CSAI)は、現代社会でますます関心を集めている。
この負担を軽減するために、研究者はデータトリアージの自動化とCSAIの検出方法を模索した。
CSAデータを用いずにCSAIのトレーニングモデルに使用する代用タスク"プロキシタスク"の定義を形式化する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:10:55 GMT)
Video Dataset Condensation with Diffusion Models [7.4] ビデオデータセットの蒸留は、大規模な実データセットから必須情報を保持するコンパクトな合成データセットを生成するための有望なソリューションである。
本稿では,ビデオ拡散モデルを用いて高品質な合成ビデオを生成することにより,ビデオデータセットの蒸留に焦点を当てる。
代表性を高めるために,ビデオの多様な情報サブセットを選択するために設計されたVST-UNet(Video Spatio-Temporal U-Net)を導入する。
提案手法の有効性を,4つのベンチマークデータセットによる広範な実験により検証し,現状よりも最大10.61%の性能向上を実証した。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:12:19 GMT)
An Active Contour Model for Silhouette Vectorization using Bézier Curves [6.9] 立方体B'ezier曲線を用いたシルエットベクトル化のためのアクティブな輪郭モデルを提案する。
提案手法は,シルエット境界とベクトル化の間の平均距離を著しく低減する。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:54:39 GMT)
Adversarial Coevolutionary Illumination with Generational Adversarial MAP-Elites [6.7] 品質多様性(QD)アルゴリズムは、特定の行動空間をカバーする高性能なソリューションを見つけることにより、探索空間を照らす。
そこで本研究では,複数世代にまたがって解決策を共進化させる新しいQDアルゴリズムであるGenerational Adversarial MAP-Elites (GAME)を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:00:48 GMT)
Beyond Partisan Leaning: A Comparative Analysis of Political Bias in Large Language Models [6.5] 本研究では、大規模言語モデルにおける政治的行動を評価するために、ペルソナフリーでトピック固有のアプローチを採用する。
米国、ヨーロッパ、中国、中東で開発された43の大規模言語モデルからの反応を分析した。
発見は、ほとんどのモデルが中心左あるいは左イデオロギー的にリーンであり、非党派的エンゲージメントパターンが異なることを示している。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:25:28 GMT)
Event-based Neural Spike Detection Using Spiking Neural Networks for Neuromorphic iBMI Systems [6.5] 埋め込み可能な脳-機械インタフェース(iBMI)は、何千ものニューロンからワイヤレスで記録するように進化しているが、データ帯域幅、消費電力、インプラントサイズに課題に直面している。
本稿では、デルタ変調とパルスカウント変調によって生成されたイベントベースのニューラルデータを処理し、信号をスパースイベントに変換する新しいスパイキングニューラルネットワークスパイク検出器(SNN-SPD)を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:07:00 GMT)
MABR: Multilayer Adversarial Bias Removal Without Prior Bias Knowledge [6.2] 実世界のデータに基づいてトレーニングされたモデルは、しばしば既存の社会的バイアスを反映し、悪化させる。
本稿では,従来のバイアス型知識とは独立して機能する,新たな対人訓練戦略を提案する。
本手法は,人口統計学的アノテーションを必要とせずに,社会的バイアスを効果的に低減する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:55:51 GMT)
MambaNUT: Nighttime UAV Tracking via Mamba-based Adaptive Curriculum Learning [5.9] 本稿では,線形複雑度を背骨とする状態空間モデルを用いた純粋なMambaベースのトラッキングフレームワーク(MambaNUT)を提案する。
適応型カリキュラム学習(ACL)アプローチを導入し、動的サンプリング戦略と損失重みを調整する。
複数の夜間UAV追跡ベンチマークでの被曝実験は、提案されたMambaNUTが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 01:23:57 GMT)
A Novel Framework for Significant Wave Height Prediction based on Adaptive Feature Extraction Time-Frequency Network [5.7] 適応的特徴抽出時間周波数ネットワーク(AFE-TFNet)を提案する。
エンコーダとデコーダのローリングフレームワークであり、機能抽出と機能融合の2段階がある。
その結果, AFE-TFNet は予測精度でベンチマーク手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:25:31 GMT)
Signals from the Floods: AI-Driven Disaster Analysis through Multi-Source Data Fusion [5.7] 本研究では、X(旧Twitter)と公開調査が危機時の公衆行動に対する洞察を提供する方法について検討する。
5万5000件以上の洪水に関連するツイートと1450件の投稿を分析し、極端な天候の時の行動パターンを特定します。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:27:37 GMT)
Condition numbers in multiview geometry, instability in relative pose estimation, and RANSAC [5.6] 本稿では,複数のビュー幾何学における最小問題の数値条件付けを解析するための一般的な枠組みを提案する。
特別な動機は、通常の5ポイントまたは7ポイントのランダムサンプルコンセンサス(RANSAC)アルゴリズムに基づく相対的なポーズ推定が、外れ値が存在しない場合でも失敗するという事実にある。
これらのケースは、5点と7点の極小問題の本質的な不安定性に起因すると論じる。
論文参考訳(メタデータ) (Sat, 10 May 2025 20:40:27 GMT)
Structure Theorem for Quantum Replacer Codes [5.6] 量子置換器符号(Quantum replacementr code)は、与えられた量子置換器チャネルのセットによって引き起こされるエラーから保護される符号である。
このような符号に対する構造定理を証明し、量子誤り訂正の初期の理論的研究で様々な特殊ケースを合成する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:22:31 GMT)
FedADP: Unified Model Aggregation for Federated Learning with Heterogeneous Model Architectures [5.3] 従来のフェデレートラーニング(FL)は、特に異種環境において、効率と正確性の観点から大きな課題に直面しています。
集約中のモデルアーキテクチャを動的に調整することでクライアントの不均一性に適応するフェデレート学習フレームワークであるFedADPを提案する。
実験の結果,FedADP は FlexiFed などの既存手法を著しく上回り,最大 23.30% の精度向上を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:57:07 GMT)
E2E-FANet: A Highly Generalizable Framework for Waves prediction Behind Floating Breakwaters via Exogenous-to-Endogenous Variable Attention [5.3] 本研究では,外因性から内因性への周波数認識ネットワーク(E2E-FANet)について紹介する。
E2E-FANetは、波と構造物の関係をモデル化するために設計された、新しいエンドツーエンドニューラルネットワークである。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:28:48 GMT)
Value Iteration with Guessing for Markov Chains and Markov Decision Processes [5.1] 確率システムの標準モデルとして、マルコフ連鎖(MC)とマルコフ決定過程(MDP)がある。
これらの問題に対して広く研究されているアルゴリズム的アプローチは、ベルマン更新と呼ばれる局所的な更新を反復的に適用するValue Ittheoretical (VI) である。
ほぼ線形時間前処理アルゴリズムを提案し、その後、推測値とともに、VI はベルマン更新を指数的に多く要求するのみである。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:24:49 GMT)
Investigating Robotaxi Crash Severity Using Geographical Random Forest [5.0] 本稿では,都市建設環境の局所的な機械学習とマクロ測度を用いて,自律走行車(AV)の衝突重大度を定量的に検討する。
我々の地理ランダムフォレスト(GRF)モデルは、サンフランシスコの衝突重大度リスクマップとともに、AVやロボットタクシーの商業運用に有用な3つの発見を提示する。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:47:01 GMT)
Statistical Error Bounds for GANs with Nonlinear Objective Functionals [5.0] GAN(Generative Adversarial Network)は、ジェネレータ分布を学習するための教師なし学習手法である。
有限サンプル濃度の不等式という形で、$f$と$Gamma$の一般クラスに対して$(f,Gamma)$-GANsの統計的誤差境界を導出する。
論文参考訳(メタデータ) (Sat, 10 May 2025 03:13:26 GMT)
Deep Fréchet Regression [4.9] パラメトリックな仮定を課さずに高次元予測器を扱えるフレキシブル回帰モデルを提案する。
提案手法は,非ユークリッド応答に対する既存手法よりも優れている。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:37:18 GMT)
Learning from the Good Ones: Risk Profiling-Based Defenses Against Evasion Attacks on DNNs [4.8] 安全クリティカルなアプリケーションは、予測と推論にディープニューラルネットワーク(DNN)を使用する。
本稿では,リスク認識戦略を用いて静的防御を選択的に訓練するリスクプロファイリングフレームワークを提案する。
重症度が低い患者に対して選択的トレーニングを行うことで,27.5%のリコールが達成され,精度への影響は最小限であった。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:33:15 GMT)
An \tilde{O}ptimal Differentially Private Learner for Concept Classes with VC Dimension 1 [4.8] 本稿では,VC次元1とLittlestone次元が$d$の任意の概念クラスに対して,ほぼ最適にプライベートなPAC学習器を初めて提示する。
我々のアルゴリズムは、$tildeO_varepsilon,delta,alpha,delta(log* d)$のサンプル複雑さを、Alonらによって証明された$Omega(log* d)$の下位境界にほぼ一致する。
我々の研究に先立ち、最もよく知られている上限は一般的なVCクラスに対して$tildeO(VCcdot d5)$である。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:51:25 GMT)
POISONCRAFT: Practical Poisoning of Retrieval-Augmented Generation for Large Language Models [4.6] 大型言語モデル(LLM)は幻覚の影響を受けやすいため、誤った結果や誤解を招く可能性がある。
Retrieval-augmented Generation (RAG) は、外部知識源を活用することで幻覚を緩和する有望なアプローチである。
本稿では,POISONCRAFTと呼ばれるRAGシステムに対する中毒攻撃について検討する。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:36:28 GMT)
Advances in Bosonic Quantum Error Correction with Gottesman-Kitaev-Preskill Codes: Theory, Engineering and Applications [4.3] Gottesman-Kitaev-Preskill (GKP) 符号は、量子誤り訂正の破局点に達した最初のものの一つである。
GKP符号は量子計算における約束によって広く認識されている。
本稿では,GKPコードの基本動作機構,性能評価,多くの応用について概説する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:53:04 GMT)
ReXGradient-160K: A Large-Scale Publicly Available Dataset of Chest Radiographs with Free-text Reports [4.2] このデータセットには、米国の3つの医療システムにまたがる109,487人のユニークな患者から1万件の胸部X線研究とペアの放射線学的報告が含まれている。
この広範なデータセットを提供することで、医療画像AIの研究を加速し、自動放射線分析における最先端の進歩を目指す。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:56:11 GMT)
Efficient Parallelization of Message Passing Neural Networks [4.2] 本稿では,MPNNモデルに対して,局所的な原子間でのデータ通信を最小化する効率的な並列アルゴリズムを提案する。
このアプローチにより、MPNNモデル上で数十億の原子を厳密に局所的なモデルと同じくらい高速に分子動力学シミュレーションすることができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:30:22 GMT)
LINC: Supporting Language Independent Communication and Comprehension to Enhance Contribution in Multilingual Collaborative Meetings [4.1] 会議中の多言語コミュニケーションのためのリアルタイムモジュールと,ディスカッション分析のためのポストミーティングダッシュボードを開発した。
LINCを用いて、参加者は好みの言語でコミュニケーションすることの恩恵を受け、行動可能な洞察をリコールし、レビューし、今後の会議を効果的に準備することを発見した。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:34:31 GMT)
Text-to-CadQuery: A New Paradigm for CAD Generation with Scalable Large Model Capabilities [4.1] CAD (Computer-Aided Design) は現代の工学と製造の基礎であるが、CADモデルの作成には専門家の知識と専門的なソフトウェアが必要である。
大規模言語モデル(LLM)の最近の進歩は、自然言語を直接パラメトリック3Dモデルに変換する生成CADの可能性を開く。
テキストから直接CadQueryコードを生成し、事前学習したLLMの強みを活用して中間表現なしで3Dモデルを生成する。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:47:08 GMT)
RESAR-BEV: An Explainable Progressive Residual Autoregressive Approach for Camera-Radar Fusion in BEV Segmentation [4.0] Bird's-Eye-View (BEV)セマンティックセマンティックセグメンテーションは、自律運転のための包括的な環境認識を提供する。
我々は,一段階のエンド・ツー・エンドアプローチを超えて進歩する進歩的な改良フレームワークであるRESAR-BEVを提案する。
nuSceneの実験では、7つの本質的な運転シーンカテゴリーで54.0% mIoUでRESAR-BEVの最先端性能を示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:10:07 GMT)
Recovering Event Probabilities from Large Language Model Embeddings via Axiomatic Constraints [4.0] 拡張変分オートエンコーダにより学習された潜在空間において、確率論の加法則のような公理的制約を強制することを提案する。
このアプローチは、VAEがオリジナルの埋め込みを再構築し、意味的に関連するイベントの埋め込みを予測することから、イベント確率が潜時空間に自然に現れることを可能にする。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:04:56 GMT)
Fun-tuning: Characterizing the Vulnerability of Proprietary LLMs to Optimization-based Prompt Injection Attacks via the Fine-Tuning Interface [3.9] 本稿では,攻撃者が遠隔操作インタフェースから返却した損失情報を利用して,敵のプロンプトを探索する方法について述べる。
LLMのGoogle Geminiファミリでは65%から82%の攻撃成功率を示しています。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:36:13 GMT)
MIRAGE: Exploring How Large Language Models Perform in Complex Social Interactive Environments [3.7] 本稿では,MIRAGE(Multiverse Interactive Role-play Ability General Evaluation)を紹介する。
MIRAGEは、殺人ミステリーゲームを通じて高度な人間の行動を描写する大規模言語モデルの能力を評価するために設計されたフレームワークである。
我々の実験は、GPT-4のような人気モデルでさえ、MIRAGEが提示する複雑さをナビゲートする上で大きな課題に直面していることを示している。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:05:16 GMT)
Batch Augmentation with Unimodal Fine-tuning for Multimodal Learning [3.6] 超音波画像から胎児の臓器を検出するために,一過性微調整によるバッチ拡張を提案する。
バッチ拡張による画像に、微調整された初期層を持つニューラルネットワークを適用し、特徴量を求める。
UPMC Foodデータセット上で、最先端(SOTA)のパフォーマンスをほぼ享受しています。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:47:55 GMT)
Advancing Uto-Aztecan Language Technologies: A Case Study on the Endangered Comanche Language [3.6] この研究は、絶滅寸前にあるユト・アステカ語族の言語であるコマンチェの計算研究を初めて紹介した。
本稿では,412句を手作業でキュレートしたデータセット,合成データ生成パイプライン,GPT-4oおよびGPT-4o-miniの言語識別実験を行った。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:11:58 GMT)
Endless Jailbreaks with Bijection Learning [3.6] ランダムに生成したエンコーディングを用いて,安全性上の脆弱性に対してLLMをファジリングする強力な攻撃アルゴリズムを提案する。
私たちの攻撃は、幅広いフロンティア言語モデルに対して非常に効果的です。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:38:13 GMT)
Scaling up the Banded Matrix Factorization Mechanism for Differentially Private ML [3.6] 近縁ノイズメカニズムは、大規模エポジロン小エピック訓練体制におけるDP-SGDの効果的な代替手段であることが証明されている。
現在の最先端のアプローチはDP-BandMFで、プライバシーの増幅とノイズ相関の利点を最適にバランスさせる。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:14:36 GMT)
Feature Representation Transferring to Lightweight Models via Perception Coherence [3.4] より大規模な教師モデルから軽量な学生モデルに特徴表現を伝達する手法を提案する。
提案手法は,表現の転送を行う強力なベースライン手法に比べて性能が優れ,性能が向上する。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:55:06 GMT)
FMEnets: Flow, Material, and Energy networks for non-ideal plug flow reactor design [3.0] FMEnetsは、非理想的なプラグフローリアクターの設計と解析のための機械学習フレームワークである。
基本的な支配方程式(流体流のNavier-Stokes、反応種輸送の物質収支、温度分布のエネルギー収支)を統一されたマルチスケールネットワークモデルに統合する。
従来のマルチ層パーセプトロンを使用するFME-PINNや、Kolmogorov-Arnold NetworksをベースとしたFME-KANとして実装することができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 03:46:48 GMT)
Interplay between defects and the non-Hermitian skin effect [3.0] 非エルミート皮膚効果の相互作用と非相互1次元格子の欠陥について検討した。
有限サイズシステムにおける新しいハイブリッド皮膚欠陥状態のクラスを実証する。
我々の研究は、欠陥とNHSEとの相互作用の理解を促進する。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:22:22 GMT)
Privacy-aware Berrut Approximated Coded Computing applied to general distributed learning [2.8] 本稿では,PBACC(Private Berrut Approximate Coded Computing)を,フェデレート学習に強いが不完全なプライバシを付加する一般的なソリューションとして用いることを検討する。
我々は、集中集約のための新しい適応PBACCアルゴリズム、集中型データによる安全な分散トレーニング、分散化されたデータによるセキュアな分散トレーニングを導出する。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:27:40 GMT)
A Short Overview of Multi-Modal Wi-Fi Sensing [2.6] 無線センシング・統合センシング・通信(ISAC)における重要な技術として、Wi-Fiセンシングが登場している。
Wi-Fiセンシングは、ロバスト性やデータ収集の難しさといった課題にも直面する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:12:56 GMT)
TAROT: Towards Essentially Domain-Invariant Robustness with Theoretical Justification [2.4] TAROTはドメイン適応性と堅牢性の両方を高めるように設計されている。
これは、挑戦的なDomainNetデータセットで優れたパフォーマンスを達成する。
その結果、実世界のドメイン適応シナリオにおける我々のアプローチの幅広い適用性を強調した。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:43:04 GMT)
Dynamic Uncertainty Learning with Noisy Correspondence for Text-Based Person Search [2.3] 大規模テキストイメージデータセットは、オンラインの共起物から作成される。
既存の手法は、しばしばノイズを増幅する負のサンプルに焦点を当てる。
キー特徴セレクタ(KFS)と新しい損失関数であるDSH-Loss(Dynamic Softmax Hinge Loss)を備える動的不確実性とアライメントフレームワークを提案する。
実験により,本手法は耐雑音性が高く,低雑音・高雑音両シナリオの検索性能が向上することが示された。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:35:36 GMT)
Quadrupedal Robot Skateboard Mounting via Reverse Curriculum Learning [2.2] 本研究の目的は、逆カリキュラム強化学習を用いて、四足歩行ロボットにスケートボードを装着できるようにすることである。
タスクの終端フェーズから始まり、目的を近似するために問題定義の複雑さを徐々に増大させる目標指向の方法論が採用された。
学習された方針は、スケートボードの位置と方向のバリエーションに対して堅牢性を示し、最終的にはモバイルスケートボードを含むシナリオへの移動に成功した。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:17:15 GMT)
Port-based telecloning of an unknown quantum state [2.2] 過去10年間で、ポートベースのテレポーテーションと呼ばれる新しいタイプのテレポーテーションが広く研究されている。
本稿では,従来のテレポーテーションをポートベースの変種に置き換える,テレクロニングの類似性について考察する。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:27:19 GMT)
The Efficiency of Pre-training with Objective Masking in Pseudo Labeling for Semi-Supervised Text Classification [2.1] 我々は、Hatefiらによって提案されたテキスト分類のための半教師付きモデルを拡張し、研究する。
このモデルはMeta Pseudo Labelsの教師/学生アーキテクチャを活用している。
実験は2つの異なる言語で3つの異なるデータセットを用いて行われる。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:16:03 GMT)
dcFCI: Robust Causal Discovery Under Latent Confounding, Unfaithfulness, and Mixed Data [2.0] 本稿では,最初の非パラメトリックスコアを導入し,部分アンセストラルグラフと観測データとの整合性を評価する。
次にデータ互換のFast Causal Inference (dcFCI)を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:05:19 GMT)
JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes [1.8] 私たちは、Robotarium用のJaxベースのエンドツーエンドシミュレーション、学習、デプロイメント、ベンチマークプラットフォームであるJaxRobotariumにコントリビュートしています。
JaxRobotariumは、現実的なロボットダイナミクスと安全制約を備えたマルチロボット強化学習(MRRL)ポリシーの迅速なトレーニングと展開を可能にする。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:38:39 GMT)
Self-Data Distillation for Recovering Quality in Pruned Large Language Models [1.6] ワンショットプルーニングは、特に多段階推論を必要とするタスクにおいて、大幅な品質劣化をもたらす。
品質の低下を回復するために、教師付き微調整(SFT)が一般的に用いられるが、これは破滅的な忘れを招きかねない。
本研究では,これらの課題に対処するために,自己データ蒸留ファインチューニングを利用する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:39:41 GMT)
Can Interpretability Layouts Influence Human Perception of Offensive Sentences? [1.5] 本稿では、3つの機械学習(ML)の解釈可能性レイアウトが、ヘイトスピーチを含む文を評価する際の参加者の視点に影響を及ぼすかどうかを評価する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:15:07 GMT)
Negotiating the Shared Agency between Humans & AI in the Recommender System [1.4] 本研究では,ユーザエージェンシーの強化を目的とした二重制御機構を提案する。
透明性とコントロールのレベルがユーザエクスペリエンスに与える影響を評価した。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:54:56 GMT)
Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers [1.4] 最近のニューロシンボリックアプローチは、解釈可能性を高めるためにCNNベースのモデルからシンボリック・ルールセットを抽出することに成功している。
本稿では、スパースオートエンコーダ(SAE)にインスパイアされたスパース概念層を導入し、視覚変換器(ViT)からシンボルルールを抽出するフレームワークを提案する。
本手法は,記号的推論が可能でありながら,標準のViTよりも5.14%の精度で分類できる。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:45:15 GMT)
AI-Powered Anomaly Detection with Blockchain for Real-Time Security and Reliability in Autonomous Vehicles [1.2] 我々は、リアルタイム異常検出のための人工知能(AI)のパワーとブロックチェーン技術を組み合わせて、悪意のあるアクティビティを検出して防止する新しいフレームワークを開発する。
このフレームワークでは、センサデータと異常アラートをブロックチェーン台帳にセキュアに格納する分散プラットフォームを使用して、データの不正性と信頼性を保証している。
これにより、AVシステムは、サイバースペースとハードウェアコンポーネントの両方の障害からの攻撃に対してより耐性がある。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:53:28 GMT)
Learning Guarantee of Reward Modeling Using Deep Neural Networks [1.1] 深層ニューラルネットワークを用いたペアワイズ比較データを用いた報酬モデリングの学習理論について検討する。
我々は、非パラメトリックな設定で、深い報酬推定を行うための新しい非漸近的後悔を確立する。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:21:29 GMT)
The evolutionary advantage of guilt: co-evolution of social and non-social guilt in structured populations [1.1] 倫理的機械を構築するには、彼らの行動に対して自己評価し、後悔する感情的な能力を与える必要がある。
謝罪は潜在的な戦略的相互作用を表すが、行動特性としての罪悪感の明確な進化はいまだに理解されていない。
社会的罪悪感はコストを伴い、エージェントは他人の内部状態や行動を理解するために努力する必要がある。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:09:34 GMT)
TaskVAE: Task-Specific Variational Autoencoders for Exemplar Generation in Continual Learning for Human Activity Recognition [1.1] 継続的学習により、モデルがデータストリームの進化から学ぶことができ、事前知識の忘れを最小化できる。
本稿では,クラスインクリメンタル設定におけるリプレイベースCLのフレームワークであるTaskVAEを提案する。
すべてのタスクに対して、クラス数に関する事前の知識を必要とする伝統的なメソッドや単一のVAEに依存している伝統的なメソッドとは対照的に、TaskVAEはそのような制約なしにタスクの増加に柔軟に対応します。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:42:01 GMT)
Centralized Trust in Decentralized Systems: Unveiling Hidden Contradictions in Blockchain and Cryptocurrency [0.9] 分散型アーキテクチャにもかかわらず、暗号通貨エコシステムにおける信頼感がどのように表れているかを検討する。
ユーザーは、確立した取引所、著名なコミュニティの人物、認識された開発チームなど、集中型の信頼アンカーを積極的に探し、作成する。
この矛盾が、ユーザーの説明責任に対する精神的な欲求と、自己責任の完全な責任を負うことによるものであるかを明らかにする。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:38:37 GMT)
Unveiling hidden features of the Kitaev model through a complex-network analysis [0.9] そこで我々は, 密度行列に基づくネットワーク解析を導入し, 北エフ連鎖の基底状態について検討する。
このアプローチは、位相相転移に関連する臨界点の同定に成功し、基底状態が一様で非零な絡み合いを示す特異点を明らかにする。
この特異な挙動を解析的に説明し、スピン鎖で観察される基底状態分解の概念に関連性を確立する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:07:12 GMT)
Underwater object detection in sonar imagery with detection transformer and Zero-shot neural architecture search [0.9] ソナー画像を用いた水中物体検出は海洋技術における重要かつ急速に発展する研究領域となっている。
本稿では,ニューラルアーキテクチャサーチ(NAS)アプローチに最適化された検出変換器(DETR)アーキテクチャを提案する。
このアーキテクチャは2つの代表データセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:41:09 GMT)
Unmasking Deep Fakes: Leveraging Deep Learning for Video Authenticity Detection [0.8] 本論文の主な動機は,ディープラーニング技術を用いたディープフェイク映像の認識である。
我々は、MSCNNを顔検出器とし、EfficientNet-B5をエンコーダモデルとし、ビデオがディープフェイクかどうかを予測する。
その結果、我々のディープフェイク検出モデルは、カグルのDFDCデータセットで42.78%のログ損失、93.80%のAUC、86.82%のF1スコアを得た。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:19:14 GMT)
High-Dimensional Gaussian Process Regression with Soft Kernel Interpolation [0.8] 構造化カーネル補間(SKI)と変分誘導点法を組み合わせたソフトカーネル補間(SoftKI)を導入する。
SoftKIは、学習した少数のポイントから、ソフトマックスを介してカーネルを近似する。
様々な事例においてSoftKIの有効性を実証し、データ次元が穏やかな場合、他の近似GP手法と競合することを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 01:41:15 GMT)
Evaluating Creative Short Story Generation in Humans and Large Language Models [0.8] 大規模言語モデル(LLM)は高品質なストーリーを生成する能力を示している。
我々は,60 LLM と 60 人の短いストーリー生成において,創造性を体系的に分析する。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:20:14 GMT)
Utilizing LLMs to Investigate the Disputed Role of Evidence in Electronic Cigarette Health Policy Formation in Australia and the UK [0.8] オーストラリアとイギリスは、電子タバコの規制に対する対照的なアプローチを開発してきた。
そこで我々は,電子タバコ関連政策文書の自動解析を行うLarge Language Modelベースの文分類器を開発し,評価した。
論文参考訳(メタデータ) (Sat, 10 May 2025 23:40:28 GMT)
Getting Ready for the EU AI Act in Healthcare. A call for Sustainable AI Development and Deployment [0.6] 我々は、医療分野のためのAIシステムの開発者とデプロイ者は、積極的に行動し、AI法の要件を順守することを段階的に保証する措置を講じるべきである、と論じている。
AI法への関与は形式的な演習とはみなせない。AI法へのコンプライアンスは、信頼できるAIの倫理的原則への積極的コミットメントを通じて実施する必要がある。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:46:54 GMT)
A Computational Approach to Epilepsy Treatment: An AI-optimized Global Natural Product Prescription System [0.5] てんかんは世界中で何百万もの患者を抱える神経疾患である。
多くの人は、従来の抗てんかん薬の効力と副作用が限られているため、代替医療に移行している。
我々は,グローバルな天然物のAI駆動分析により,局所てんかん治療を最適化する計算手法を開発した。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:14:20 GMT)
Direct space-time modeling of mechanically dressed dipole-dipole interactions with electromagnetically-coupled oscillating dipoles [0.5] 実時間機械振動の存在下での結合電気双極子の放射動力学について検討する。
LOsのスケールされた集団(励起)ダイナミクスと放射光と電磁スペクトルについて検討した。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:07:24 GMT)
A Contrastive Federated Semi-Supervised Learning Intrusion Detection Framework for Internet of Robotic Things [0.4] 本稿では、IoRT侵入検知と防御のためのCFedSSL-NID(Contrastive Federated Semi-Supervised Learning Network Intrusion Detection)フレームワークを提案する。
CFedSSL-NIDはランダムに弱く強い拡張、遅延コントラスト学習、EMA更新を統合して教師付き信号を統合することで、ロボットのローカルなラベルなしデータのパフォーマンスと堅牢性を向上させる。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:59:01 GMT)
PC-SRGAN: Physically Consistent Super-Resolution Generative Adversarial Network for General Transient Simulations [0.4] 機械学習はスーパーレゾリューション(SR)に革命をもたらした
しかし、生成した画像は物理的意味を欠くことが多く、科学的な応用に欠かせないものである。
我々のアプローチであるPC-SRGANは、解釈可能なシミュレーションのための物理的整合性を確保しながら、画像の解像度を向上させる。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:05:00 GMT)
ASIL-Decomposition Based Resource Allocation Optimization for Automotive E/E Architectures [0.4] ソフトウェアコンポーネントを利用可能なハードウェアリソースに自動的にマッピングするアプローチを提案する。
既存のフレームワークと比較して,本手法はISO 26262規格に準拠した幅広い安全性解析を提供する。
我々は,臨界関数連鎖の開発コストと最大実行時間の両方を最小化するために,多目的最適化問題を定式化する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:48:29 GMT)
High-Dimensional Importance-Weighted Information Criteria: Theory and Optimality [0.4] Imori と Ing (2025) は高次元不特定回帰モデルにおけるモデル選択のための重み付けグレディアルゴリズム (IWOGA) を提案した。
妥当な仮定の集合の下でIWOGA + HDIWICの最適性を確立することによって、この主張を理論的に正当化する。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:26:12 GMT)
Model Human Learners: Computational Models to Guide Instructional Design [0.4] 本稿では,2つのA/B実験の結果を正確に予測できる計算モデルについて述べる。
また、そのようなモデルが人間のデータを必要とせずに学習曲線を生成できることも示している。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:50:38 GMT)
CCi-YOLOv8n: Enhanced Fire Detection with CARAFE and Context-Guided Modules [0.4] 都市部や森林地帯での火災は深刻な脅威となる。
小型火災や煙の検知を目標とした改良型YOLOv8モデルであるCCi-YOLOv8nを提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:44:01 GMT)
Geometry of Learning -- L2 Phase Transitions in Deep and Shallow Neural Networks [0.4] 本稿では,ロスランドスケープのリッチ曲率とレギュレータ駆動のディープラーニングを統合することで,このような遷移の統一的な枠組みを確立する。
我々の研究は、L2コンテキストを超えたニューラルネットワークの本質的な構造を探索するための、より詳細な正規化戦略と潜在的に新しい方法の道を開く。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:02:30 GMT)
Online Job Scheduler for Fault-tolerant Quantum Multiprogramming [0.3] 格子手術に基づくフォールトトレラント量子コンピューティングシステムのオンラインジョブスケジューリング問題を定式化する。
我々のスケジューラは、より単純な立方体表現を用いて、もともとポリキューブとして表現された格子手術プログラムを近似する。
さらに、スケジューリングプロセスにメカニズムを組み込んで、QPUの利用をさらに促進できることを実証する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:24:37 GMT)
An In-kernel Forensics Engine for Investigating Evasive Attacks [0.3] 本稿では,Windows オペレーティングシステムの脅威分析と鑑定を行うための,オープンソースのローアーティファクト・フォレスティクス・エンジン LASE を紹介する。
LASEは、検出可能なアーティファクトを最小限にしつつ、詳細なシステム全体の監視機能を提供することで、現在の分析ツールを拡張している。
論文参考訳(メタデータ) (Sat, 10 May 2025 03:40:17 GMT)
OptiGait-LGBM: An Efficient Approach of Gait-based Person Re-identification in Non-Overlapping Regions [0.3] 骨格モデルを用いて人物の再識別が可能なOptiGait-LGBMモデルを提案する。
複雑な屋外環境において、制御されていない歩行シーケンスを表現するために、ベンチマークデータセットRUET-GAITが導入された。
本研究の目的は,既存の手法と比較して計算コストを最小化して,上記の課題に対処することである。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:28:57 GMT)
Practical Reasoning Interruption Attacks on Reasoning Large Language Models [0.2] 大規模な言語モデル(RLLM)の推論は、さまざまなタスクにわたって優れたパフォーマンスを示してきたが、多くのセキュリティ脆弱性も明らかにしている。
最近の研究で、DeepSeek-R1では、敵対的なプロンプトの下で、明確な"思考停止"脆弱性が特定されている。
我々は,新規なプロンプトインジェクション・アタックを開発し,その根本原因を解析した。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:36:01 GMT)
Reproducing and Improving CheXNet: Deep Learning for Chest X-ray Disease Classification [0.2] 公開されているNIH ChestX-ray14データセットでは、CheXNetと呼ばれるアルゴリズムを再現し、CheXNetのベースラインメトリックを上回る他のアルゴリズムを探索しました。
最良のモデルは平均AUC-ROCスコアが0.85、F1スコアが0.39である。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:52:00 GMT)
Towards Equitable Rail Service Allocation Through Fairness-Oriented Timetabling in Liberalized Markets [0.1] 本稿では,Jain,Gini,Atkinsonの株価指標に基づく手法を用いて,自由鉄道市場における鉄道サービス割当問題を解決する。
その結果,提案手法とエクイティ指標により,異なる競争性シナリオにおける公平な計画が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:00:58 GMT)
Evaluating LLM-Generated Q&A Test: a Student-Centered Study [0.1] 我々は, GPT-4o-mini-based Q&A test for a Natural Language Processing course を自動生成し, 学生と専門家による心理測定, 知覚品質指標の評価を行った。
混合形式IRT分析では、生成したアイテムは強い差別と適切な難易度を示し、一方、学生と専門家のスター格付けは全体的な品質を反映している。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:47:23 GMT)
Using nanokelvin quantum thermometry to detect timelike Unruh effect in a Bose-Einstein condensate [0.0] 本稿ではBose-Einstein condensate (BEC)に浸漬した不純物を用いて、時間的なUnruh効果を検出することを提案する。
以上の結果から,現在のBECに埋没した時間依存性エネルギーギャップを持つ定常二層不純物を用いて,アンルー効果を探索できることが示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:34:02 GMT)
Third-Order Perturbative OTOC of the Harmonic Oscillator with Quartic Interaction and Quantum Chaos [0.0] 時間外3次相関器(OTOC)の計算
揺らぎの後、OTOCは後に飽和点の周りで変動する。
十分に強いクォート相互作用を持つ系では、長い時間窓の上の指数関数的な成長曲線が3階の摂動で明らかに現れる。
論文参考訳(メタデータ) (Sat, 10 May 2025 10:09:30 GMT)
The Quantum Toll Framework: A Thermodynamic Model of Collapse and Coherence [0.0] 本稿では,従来の量子オブザーバをコヒーレンス制約インタフェースの特別なケースとして再配置する熱力学的レンダリングモデルを提案する。
QTFの下では、オブザーバは基本ではないがデリバティブであり、生物学的および技術的インターフェースは崩壊を安定化するために進化した。
雲室の崩壊に対する空間的制約を含む実験結果について論じる。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:49:27 GMT)
The Quantum Optical Master Equation is of the same order of approximation as the Redfield Equation [0.0] 我々は、よく知られた量子光学マスター方程式も近似の同値類にあることを証明した。
量子光学マスター方程式がより正確な結果をもたらすという数値的な証拠を示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 23:48:06 GMT)
The Malaysian Election Corpus (MECo): Federal and State-Level Election Results from 1955 to 2025 [0.0] マレーシア選挙コーパス(MECo; ElectionData.MY)は、1955年から現在までの全ての連邦および州の総選挙をカバーするオープンアクセスパネルデータベースである。
MECoには、候補者、政党、選挙区のユニークな識別子で標準化された70年間に1万近いコンテストで、候補者と選挙区レベルの結果が含まれている。
このデータベースはまた、選挙規模、投票者投票、棄却された票、未投票の投票に関する要約統計も提供している。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:32:23 GMT)
The Ising model as a window on quantum gravity with matter [0.0] 我々は、Isingモデル CFT が物質による3次元(量子)重力の明確な洞察を得るのに利用できると論じる。
BTZブラックホールと相互作用するバルク物質場の性質について説明する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:20:04 GMT)
The Future of Software Testing: AI-Powered Test Case Generation and Validation [0.0] 本稿では、テストケースの生成と検証を改善する上で、AIが持つ変革の可能性について考察する。
テストプロセスの効率性、正確性、スケーラビリティを高める能力に重点を置いている。
また、高品質なトレーニングデータの必要性など、テストにAIを適用する際の重要な課題にも対処している。
論文参考訳(メタデータ) (Sat, 10 May 2025 01:03:08 GMT)
SmartPilot: A Multiagent CoPilot for Adaptive and Intelligent Manufacturing [0.0] 先進的推論と文脈決定のための,ニューロシンボリックでマルチエージェントなCoPilotであるSmartPilotを提案する。
AI能力と実世界の産業ニーズのギャップを埋めることによって、SmartPilotはインテリジェントな意思決定によって産業に力を与える。
論文参考訳(メタデータ) (Sat, 10 May 2025 02:20:49 GMT)
Single-photon-added coherent state based postselected weak measurement [0.0] SPACSをベースとしたポストセレクト弱測定は,従来の測定方法よりも精度が高いことを示す。
我々の研究は、光子統計に基づく量子精度測定の基本的な問題に対処する新しい方法を提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:25:54 GMT)
Sending absolutely maximally entangled states through noisy quantum channels [0.0] 本研究では、雑音量子チャネルの影響下でのqubit AME状態の挙動について検討する。
分極チャネルのような特定のチャネルでは、絡み合い特性は局所ユニタリ変換の下で不変である。
強調チャネルのようなチャネルでは、絡み合いの挙動は、特定のAME状態とキュービットの選択によって異なる。
論文参考訳(メタデータ) (Sat, 10 May 2025 21:00:44 GMT)
Reduction-induced the Variation of Partial Von Neumann Entropy [0.0] 混合状態QEとその対策は、理論と実用の両方において重要な役割を担っている。
本稿では, 部分Von Neumann Entropy (RIVPVNE) の還元誘起変分法を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:29:01 GMT)
Quantum RNNs and LSTMs Through Entangling and Disentangling Power of Unitary Transformations [0.0] 本稿では、量子リカレントニューラルネットワーク(RNN)とその拡張バージョンである長寿命メモリ(LSTM)ネットワークをどのようにモデル化するかについて議論する。
特に、LSTMにおけるエンタングリングとアンタングリングのパワーを情報保持と忘れるメカニズムとして解釈する。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:56:18 GMT)
Quantum Algorithm for Structure-Based Virtual Drug Screening Using Classical Force Fields [0.0] 本稿では、古典的な力場モデルを統合して、離散格子点上の静電およびファンデルワールス相互作用を計算する量子アルゴリズムを提案する。
このアプローチは明示的な距離計算を回避し、薬物発見における効率的な高次元結合エネルギー推定のためのスケーラブルで量子化されたフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:01:18 GMT)
QoS-Efficient Serving of Multiple Mixture-of-Expert LLMs Using Partial Runtime Reconfiguration [0.0] Mixtral-8x7Bモデルを使用した1台のNVIDIA A100 GPU(80GB)を持つサーバは、NVIDIAのマルチインスタンスGPU(MIG)と比較して、ターンアラウンド時間を平均85%削減している。
最大4つのバリエーションを備えたGoogleのSwitch Transformer Base-8モデルに関する実験では、他のモデルのマージベースラインと比較して、アウトプット品質の維持における我々のアプローチのスケーラビリティとレジリエンスが示され、その効果が強調されている。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:46:04 GMT)
Prompt Engineering: How Prompt Vocabulary affects Domain Knowledge [0.0] この論文は、語彙の特異性の増大がドメイン固有の質問応答および推論タスクを改善するかどうかを論じる。
名詞,動詞,形容詞を様々な特異度で体系的に代用する同義化フレームワークを開発し,四大言語モデル(LLM)への影響を測定した。
以上の結果から,全般的にプロンプトの特異性を高めることは大きな影響を与えないが,LLMが最善を尽くすと考えられるすべてのモデルに対して,特異性の範囲が存在することが明らかとなった。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:40:04 GMT)
Methods for Recognizing Nested Terms [0.0] ネスト項抽出に特化したRuTermEvalコンペティションへの参加について述べる。
我々は、ネストされた名前の認識に以前にうまく適用されたBinderモデルを適用し、ネストされた単語を抽出する。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:31:35 GMT)
Many-body interference at the onset of chaos [0.0] 粒子の不明瞭さの増大は、少数の観測可能な粒子の時間的ゆらぎを増す。
この増幅を固有基底における初期状態の一貫性の指紋として説明する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:02:03 GMT)
LineFlow: A Framework to Learn Active Control of Production Lines [0.0] 任意の複雑さのプロダクションラインをシミュレートし、それらを制御するためのRLエージェントをトレーニングするための、オープンソースのPythonフレームワークであるLineFlowを紹介します。
より複雑で工業規模の生産ラインでは、強化学習は依然として重大な課題に直面している。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:36:18 GMT)
Leveraging Modified Ex Situ Tomography Data for Segmentation of In Situ Synchrotron X-Ray Computed Tomography [0.0] In situ シンクロトロンデータのバイナリセグメンテーションのための訓練モデルに高品質なex situ実験データを変換することで、ディープラーニングに基づくセグメンテーションの方法論を提案する。
提案手法は,3次元データセットあたりの処理時間を数時間から秒に短縮しつつ,未知のデータに対して高いセグメンテーション性能を実現する。
この手法は、様々な材料システムに容易に適用でき、科学的分野にわたる時間分解トモグラフィーデータの解析を加速することができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:44:16 GMT)
Interface-Bound States and Majorana Zero Modes in Lateral Heterostructures of Bi$_2$Se$_3$ and Sb$_2$Te$_3$ with Proximity-Induced Superconductivity [0.0] マヨラナゼロモード(MZM)は2つの3次元トポロジカル絶縁体からなる側方ヘテロ構造に現れる。
我々の発見は、トポロジカル量子コンピューティングのプラットフォームとしてのこのヘテロ構造の可能性を強調した。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:36:20 GMT)
Integrating Explainable AI in Medical Devices: Technical, Clinical and Regulatory Insights and Recommendations [0.0] 本稿では、英国医療・医療製品規制機関(MHRA)が主催する専門家ワーキンググループからの洞察と勧告について述べる。
このグループは、医療専門家、規制当局、データサイエンティストで構成されており、臨床意思決定の文脈において、異なるAIアルゴリズムから出力を評価することに重点を置いている。
臨床環境で医療用AIデバイスの安全性と信頼性を確保するためには,AI手法の導入が不可欠である。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:09:19 GMT)
Impact of internal noise on convolutional neural networks [0.0] 単純化された畳み込みネットワークにおける雑音の影響について検討する。
非相関ノイズの伝搬は接続行列の統計的性質に依存する。
ネットワークの出力信号における雑音レベルの解析は,数値シミュレーションの結果と強い相関関係を示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:49:37 GMT)
Identifying optimal magnetic field configurations for decoherence mitigation of boron vacancies in hexagonal boron nitride [0.0] 2Dヘキサゴナル窒化ホウ素の ホウ素空孔センターが 有望な量子センサーとして出現しました
中心電子スピンと超微細に結合した核スピンは、磁場変動体として効果的に振舞い、急速に脱コヒーレンスをもたらす。
本稿では、スピンコヒーレンスの向上につながる特異部分空間の実現における静磁場強度と配向の効果について検討する。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:22:14 GMT)
Heisenberg limit in phase measurements: the threshold detection approach [0.0] 我々は、標準(単腕と二腕)光干渉計で実現可能な基本感度限界を解析する。
出力光の測定には、標準ホモダイン測定と非線形しきい値測定の2つのタイプを考慮する。
論文参考訳(メタデータ) (Sat, 10 May 2025 17:39:36 GMT)
Good Things Come in Pairs: Paired Autoencoders for Inverse Problems [0.0] 我々は,科学計算における逆問題解決の強力なツールであることが証明された,自己エンコーダフレームワークに注目する。
本稿では, 非線形および線形逆問題を含む, 地震イメージングや古典的塗装を含む数値実験を通じて, このアプローチの利点を解説する。
論文参考訳(メタデータ) (Sat, 10 May 2025 07:31:09 GMT)
GBDTSVM: Combined Support Vector Machine and Gradient Boosting Decision Tree Framework for efficient snoRNA-disease association prediction [0.0] 本稿では, 新規かつ効率的なスノRNA分解関連を予測するための機械学習手法として, 「GBDTSVM」 というモデルを提案する。
GBDTSVMは、GBDTとSVMを利用したsnoRNA-disease機能統合表現を効果的に抽出する。
GBDTSVMモデルの実験的評価は,現場の最先端手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:46:29 GMT)
FusionSORT: Fusion Methods for Online Multi-object Visual Tracking [0.0] 複数物体の視覚的追跡において,検出をトラックレットに関連付けるための4つの異なる融合法を検討する。
これらの融合法には、IoUに基づく最小重み付け和、カルマンフィルタ(KF)ゲーティング、ハダマードのコスト積が含まれる。
我々はMOT17、MOT20、DanceTrackデータセットの検証セットについて広範な評価を行う。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:03:20 GMT)
Experimental demonstration of scalable cross-entropy benchmarking to detect measurement-induced phase transitions on a superconducting quantum processor [0.0] 線形交叉エントロピーを用いた絡み合い相転移検出のための新しいプロトコルを提案する。
我々は,IBMの量子ハードウェア上で最大22量子ビットの1次元および全対全接続性を持つシステムにおいて,このプロトコルのデモンストレーションを報告する。
クロスエントロピー・ベンチマークの実証は、測定によって引き起こされる絡み合い相転移と、より大きな短期量子系における関連する臨界現象の研究の道を開くものである。
論文参考訳(メタデータ) (Sat, 10 May 2025 00:04:04 GMT)
Entangled laser beams and quantum ghost frequency comb [0.0] 連続的な波動動作では、絡み合ったレーザービームは、遠距離の関節光検出において100%コントラストとコントラストのような相関を生じる。
CWレーザーのジョイント測定においてゼロコインシデンス、あるいは反相関を信頼できますか?
絡み合ったレーザービームの測定は光子計数に頼らず、より短い時間で高分解能と精度でより大きな距離で行うことができる。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:06:36 GMT)
Enhancing Wide-Angle Image Using Narrow-Angle View of the Same Scene [0.0] シーンを撮影する際の一般的なジレンマは、より広い角度で撮影するかどうかであり、より多くのシーンをカバーできるが、より細部は少ないか、あるいはより細部を捉えながらシーンの一部を残すような狭い角度でクリックすることができる。
広視野レンズ(FoV)と狭視野レンズ(FoV)の両方を用いて同じシーンを撮影することにより、通常、一次レンズが捉えた画像と関連する、より精細な画質の細かなショットを注入する新しい手法を提案する。
我々はGAN(Generative Adversarial Network)に基づくモデルを用いて、狭い角度から視覚的品質パラメータを抽出することを学ぶ。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:52:12 GMT)
Enhancing Layer Attention Efficiency through Pruning Redundant Retrievals [0.0] 隣接層間のKL(Kulback-Leibler)のばらつきを利用して冗長性を定量化する手法を提案する。
また、冗長層を正確に識別し、スキップする拡張ベータ量子マッピング(EBQM)手法も導入する。
提案したELAアーキテクチャは,トレーニング効率と全体的なパフォーマンスを両立させ,トレーニング時間の30%削減を実現している。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:08:26 GMT)
Enhancing BERTopic with Intermediate Layer Representations [0.0] BERTopicは、トランスフォーマーベースの埋め込みを利用して高密度クラスタを生成するトピックモデリングアルゴリズムである。
3つの異なるデータセットを用いて18種類の埋め込み表現と実験結果について検討した。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:47:08 GMT)
Enhancement of non-Gaussianity and nonclassicality of pair coherent states with postselected von Neumann measurement [0.0] ポストセレクトされたフォン・ノイマン測定がペアコヒーレント状態(PCS)の非古典的性質に及ぼす影響について検討する。
その結果,ポストセレクトされたフォン・ノイマン測定により,PCSの非ガウス性および非古典性の両方が向上することが示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:10:23 GMT)
Enfoque Odychess: Un método dialéctico, constructivista y adaptativo para la enseñanza del ajedrez con inteligencias artificiales generativas [0.0] オデュチェスのアプローチはチェスを教える効果的な教育手法である。
この研究の意味は、革新的な教育技術を採用することに興味を持つ教育者や機関に関係している。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:58:47 GMT)
Energy self-balance as the physical basis of orbit quantization [0.0] 我々は、散逸的力学系の安定な極限サイクル引力に沿った非保守的な力による作業が、常にゼロに等しいことを示す。
我々はこの結果をハミルトン系に応用し、クリロフ・ボゴリューボフの半径方程式の固定点を同定し、極限サイクルの力学を規定する。
我々は、量子化された軌道の古典的なアナログを表す、数え切れないほど無限のネストされた極限サイクルのアトラクタを見つける。
論文参考訳(メタデータ) (Sat, 10 May 2025 16:55:14 GMT)
Efficient Telecom Specific LLM: TSLAM-Mini with QLoRA and Digital Twin Data [0.0] 汎用大規模言語モデル (LLM) は、リアルタイム通信アプリケーションにおいて、しばしば準最適性能を示す。
本研究では,ネトカイが開発したTSLAM-Miniの微調整により,この限界に対処する。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:28:47 GMT)
Doping Topological Dirac Semimetal with magnetic impurities: electronic structure of Mn-doped Cd$_3$As$_2$ [0.0] $d$レベルの磁気不純物からの磁場は、鋭い局所構造を持つ磁場を生成する。
磁性不純物は印加磁場と同じ方法で作用し、その磁場がディラックTSMの電子構造に与える影響は何か。
MnをドープしたCd$_3$As$$の電子構造は、適切な外部磁場を持つプリスチンCd$_3$As$$$の電子構造でエミュレートできることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 14:38:43 GMT)
Development of a WAZOBIA-Named Entity Recognition System [0.0] 既存のNERシステムは、主に英語、ヨーロッパ、および他のいくつかのグローバル言語に焦点を当てており、リソース不足の言語には大きなギャップを残している。
本研究は,ナイジェリアで著名な3つの言語であるHausa,Yoruba,Igboに合わせたWAZObia-NERシステムの開発について述べる。
このシステムは0.9511の精度、0.9400のリコール、0.9564のF1スコア、0.9301の精度を達成した。
論文参考訳(メタデータ) (Sat, 10 May 2025 22:59:24 GMT)
Constraint-based causal discovery with tiered background knowledge and latent variables in single or overlapping datasets [0.0] 制約に基づく因果発見における相関した背景知識の利用を検討する。
階層型FCI (tiered FCI) アルゴリズムの特性に関する新しい知見を提示する。
我々は,階層型背景知識を取り入れたIODアルゴリズム(重なり合うデータセットの統合),階層型IODアルゴリズム(tIOD)を導入する。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:17:58 GMT)
Concrete Quantum Channels and Algebraic Structure of Abstract Quantum Channels [0.0] 本稿では、ホレボ表現を持つ全ての量子チャネルとその部分集合の代数的構造を解析する。
一般化された非可逆チャネルと等等性チャネルを識別する試みが行われた。
本研究の背景には, チャネル変換の可逆性の適用性, 資源破壊チャネルの最近の発展等がある。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:02:52 GMT)
Compact and Efficient Neural Networks for Image Recognition Based on Learned 2D Separable Transform [0.0] 本稿では,画像認識タスクのためのニューラルネットワーク(NN)アーキテクチャを構築するための新しいタイプの計算層として,学習された2次元分離可能変換(LST)を提案する。
一つのLST層をベースとしたNN分類器が,MNISTデータセット上で98.02%の精度を実現し,パラメータはわずか9.5kであることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 09:31:12 GMT)
Burger: Robust Graph Denoising-augmentation Fusion and Multi-semantic Modeling in Social Recommendation [0.0] ラウンドアラインバストガンダーラインラフ・デノワシンアンダーライン・アンダーライン・フュージョンとマルチサンダーライン・マンティック・モデリング(バーガー)を用いたソーシャル・アンダーライン勧告モデルを導入する。
ユーザ・イテムインタラクション・ネットワークとソーシャルネットワークの異なるセマンティック・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・ネットワークにおけるセマンティック・インフォメーション・インフォメーション・インフォメーション・インフォメー
論文参考訳(メタデータ) (Sat, 10 May 2025 11:51:22 GMT)
Bridging the Gap: An Intermediate Language for Enhanced and Cost-Effective Grapheme-to-Phoneme Conversion with Homographs with Multiple Pronunciations Disambiguation [0.0] 本稿ではペルシャ語処理に特化して設計された中間言語を紹介する。
提案手法は,Large Language Model (LLM) のプロンプト技術と,特殊なシーケンス・ツー・シーケンス・マシン・トランスリテラルアーキテクチャの2つの重要なコンポーネントを組み合わせたものである。
論文参考訳(メタデータ) (Sat, 10 May 2025 11:10:48 GMT)
Boltzmann Classifier: A Thermodynamic-Inspired Approach to Supervised Learning [0.0] 本稿ではボルツマン分布の根底にある熱力学原理に着想を得た新しい分類アルゴリズムボルツマンを提案する。
提案手法は,入力サンプルとクラス固有セントロイドの特徴的偏差から得られるエネルギー関数に基づいて,各クラスに対する確率的推定値を算出する。
結果として生じる確率は、統計力学で用いられるボルツマン分布に類似したクラス間で正規化された指数的負エネルギーに比例する。
論文参考訳(メタデータ) (Sat, 10 May 2025 20:54:50 GMT)
Attention Mechanisms in Dynamical Systems: A Case Study with Predator-Prey Models [0.0] 時系列データに基づく単純な線形アテンションモデルを用いて,システム軌跡の再構成を行う。
興味深いことに、学習された注意重みはリャプノフ函数の幾何学的構造と一致している。
結果から,非線形システムの解釈,データ駆動分析,制御にAIによる注目が新たに導入されたことが示唆された。
論文参考訳(メタデータ) (Sat, 10 May 2025 04:14:28 GMT)
Attention Is Not All You Need: The Importance of Feedforward Networks in Transformer Models [0.0] 最先端のモデルは100以上のトランスフォーマーブロックを持ち、何十億ものトレーニング可能なパラメータを含み、数兆のテキストトークンで訓練される。
このようなブロックが少ない3層FFNを持つ変圧器ブロック構成を用いたモデルは、より少ない時間でより少ない総パラメータでトレーニング損失の少ない標準2層構成よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 10 May 2025 12:54:21 GMT)
Asymmetric Biphoton Generation under Ground-State Decoherence and Phase Mismatch in a Cold Atomic Ensemble [0.0] 自然発生4波混合における基底状態のデコヒーレンスと位相ミスマッチがバイフォトン生成に与える影響について検討した。
その結果,ストークスおよびアンチストークス光子生成速度に有意な非対称性が認められた。
基底状態のデコヒーレンスは時間的に相関した光子の生成を減少させるが、パラドックス的に二光子純度を高める。
論文参考訳(メタデータ) (Sat, 10 May 2025 13:57:57 GMT)
Artificial Neural Networks on Graded Vector Spaces [0.0] 本稿では,次数ベクトル空間上での人工ニューラルネットワークの変換フレームワークを提案する。
我々は、構造的整合性を維持するため、古典的なニューラルネットワークをグレードされたニューロン、層、アクティベーション関数で拡張する。
ケーススタディでは、重み付き射影空間における不変量を予測するといったタスクにおいて、標準ニューラルネットワークよりも優れた、フレームワークの有効性を検証する。
論文参考訳(メタデータ) (Sat, 10 May 2025 15:03:42 GMT)
Activity and Subject Detection for UCI HAR Dataset with & without missing Sensor Data [0.0] 本稿では,活動と主題の分類に使用できる軽量LSTMモデルを提案する。
実世界のシナリオを反映するためのセンサデータの欠如をシミュレートし、不完全なデータセットを復元するための計算技術を組み込んだ。
論文参考訳(メタデータ) (Sat, 10 May 2025 18:43:00 GMT)
A Relativistic Pseudo-Unitary Version of Schwinger's Quantum Mechanical Symbolism of Atomic Measurements [0.0] 非相対論的量子力学の領域内で伝統的に記述される測定過程は、カルタン空間の共変フレームワークに転写される。
この研究は相対論的量子計算ゲートの構築に基本的な理論的背景を与える可能性がある。
論文参考訳(メタデータ) (Sat, 10 May 2025 08:06:58 GMT)
A Point-Based Algorithm for Distributional Reinforcement Learning in Partially Observable Domains [0.0] 我々は分散強化学習(DistRL)を部分的に観測可能なマルコフ決定プロセス(POMDP)に拡張する。
我々は、部分可観測性のための新しい分布型ベルマン作用素を導入し、それらの収束を p-ワッサーシュタイン計量の上限の下で証明する。
本研究では,DPBVI(Distributedal Point-Based Value Iteration)を開発し,Phi-vectorsを標準のポイントベースバックアッププロシージャブリジンDistRLとPMDPプランニングに統合する。
論文参考訳(メタデータ) (Sat, 10 May 2025 05:19:32 GMT)
A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0] 本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文参考訳(メタデータ) (Sat, 10 May 2025 06:44:09 GMT)
A Formal Verification Approach to Safeguard Controller Variables from Single Event Upset [0.0] プログラム解析と形式検証に基づく条件付き変数(CRV)の同定手法を提案する。
CRVは、単一イベントの混乱(SEU)の影響を受け、制御ソフトウェアにおける安全性の侵害につながる可能性がある
論文参考訳(メタデータ) (Sat, 10 May 2025 13:56:02 GMT)
A Comparison of Precinct and District Voting Data Using Persistent Homology to Identify Gerrymandering in North Carolina [0.0] 本研究では,Feng と Porter の2019 年の論文の拡張として,地理空間的選挙データからフィルタされた単体複合体を構築するためのレベルセット法について述べる。
選挙区や地区レベルでの民主党の投票領域の恒久的なホモロジーを比較すると、パルチザンの利益のために地域が「区切られた」か「詰められた」かがわかる。
本研究では,ジェリーマンダリング評価におけるトポロジカルデータ解析の新たな応用法を提案する。
論文参考訳(メタデータ) (Sat, 10 May 2025 19:52:00 GMT)