LLaVA-Critic: Learning to Evaluate Multimodal Models [110.1] 本稿では,LLaVA-Criticについて紹介する。LLaVA-Criticは,汎用評価器として設計された,最初のオープンソースの大規模マルチモーダルモデル(LMM)である。
LLaVA-Criticは、さまざまな評価基準とシナリオを組み込んだ高品質な批判的インストラクションフォローデータセットを使用してトレーニングされている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:49:07 GMT)
Neighborhood Adaptive Estimators for Causal Inference under Network Interference [109.2] ネットワークに接続された単位による古典的非干渉仮定の違反について考察する。
トラクタビリティでは、干渉がどのように広がるかを記述する既知のネットワークを考える。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:02:00 GMT)
Audio-Reasoner: Improving Reasoning Capability in Large Audio Language Models [95.5] 本稿では,音声タスクの深い推論のための大規模音声言語モデルであるAudio-Reasonerを紹介する。
我々は、CoTA上でAudio-Reasonerを訓練し、オーディオ推論において優れた論理的機能を実現する。
以上の結果から,音声推論における構造化CoTトレーニングのコアが強調された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:18:34 GMT)
Can Large Language Models Help Experimental Design for Causal Discovery? [94.7] Large Language Model Guided Intervention Targeting (LeGIT) は、LLMを効果的に組み込んだ堅牢なフレームワークであり、因果発見のための介入のための既存の数値的アプローチを強化する。
LeGITは、既存の方法よりも大幅な改善と堅牢性を示し、人間を超越している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:19:03 GMT)
Open-World Reinforcement Learning over Long Short-Term Imagination [91.3] 高次元オープンワールドにおける視覚的強化学習エージェントの訓練は、大きな課題を呈している。
LS-Imagineは、有限個の状態遷移ステップにおいて、イマジネーションの地平線を拡大する。
我々の手法は、MineDojoの最先端技術よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:16:34 GMT)
Personalized Generation In Large Model Era: A Survey [90.8] 大規模モデルの時代には、コンテンツ生成は徐々にパーソナライズドジェネレーション(PGen)へとシフトしている。
本報告では,PGen に関する総合的な調査を行い,この急速に成長する分野における既存研究について考察する。
複数のモダリティにまたがるPGen研究をブリッジすることで、この調査は知識共有と学際的コラボレーションを促進する貴重な情報源となる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:34:19 GMT)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.2] 逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。
DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。
DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:47:33 GMT)
3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds [81.1] 3D Affordance Detectionは、様々なロボットタスクの幅広い応用において難しい問題である。
我々は従来の割当検出パラダイムをテキスト推論改善(IRAS)タスクに再構成する。
本研究では,3次元オープンシーンにおけるアベイランス検出のためのフレームワークである3D-ADLLMを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:37:57 GMT)
On the Differential Privacy and Interactivity of Privacy Sandbox Reports [78.9] GoogleのPrivacy Sandboxイニシアチブには、プライバシ保護広告機能を実現するAPIが含まれている。
これらのAPIのプライバシを分析するための抽象モデルを提供し、それらが正式なDP保証を満たすことを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:58:40 GMT)
RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards [78.7] Retrieval-Augmented Generation (RAG) は、外部リソースから知識を取得することで、Large Language Models (LLM) における幻覚を緩和する効果を証明している。
現在のアプローチでは、命令チューニングを使用してLLMを最適化し、検索した知識を活用する能力を改善している。
本稿では,異なるRAGモジュール間でデータ嗜好を整列させることでRAGシステムを訓練するDDR法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:12:01 GMT)
LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning [76.8] 負対に対する埋め込みモデルの表現学習を動的に改善するフレームワークを提案する。
LLaVEは、最先端(SOTA)のパフォーマンスを実現する強力なベースラインを確立する。
LLaVEはゼロショット方式でテキストビデオ検索タスクを一般化し、高い性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:21:57 GMT)
Spread Preference Annotation: Direct Preference Judgment for Efficient LLM Alignment [73.0] 大規模言語モデルと人間の嗜好の整合性を高める新しいフレームワークを提案する。
私たちのキーとなるアイデアは、小さな(種)データの中で人間の事前知識を活用することです。
本稿では,ノイズ認識型選好学習アルゴリズムを導入し,生成した選好データにおける品質低下のリスクを軽減する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:04:24 GMT)
On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games [71.7] ゲームにおける学習力学の非エルゴード収束は、理論と実践の両方において重要であるため、広く研究されている。
近年の研究では、最適乗算重み更新を含む学習力学の幅広いクラスが、任意に遅い最終項目収束を示すことが示されている。
OMWUは、同じクラスのゲームにおいて、その遅い最終点収束とは対照的に、$O(T-1/6)$est-iterate convergence rateを達成することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:49:24 GMT)
Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games [71.7] 本稿では,Regret$+$ (RM$+$) に基づく2プレーヤゼロサムゲーム解決アルゴリズムの終点収束特性について検討する。
我々の分析は、アルゴリズムの極限点の幾何学的構造を新たに解析し、最終点収束に関する文献の大半から大きく離れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:13:47 GMT)
Training-free Anomaly Event Detection via LLM-guided Symbolic Pattern Discovery [71.4] 異常事象検出は、様々な現実世界のアプリケーションにおいて重要な役割を果たす。
オープンセットオブジェクト検出とシンボリック回帰を統合した学習自由フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:56:51 GMT)
What is Wrong with Perplexity for Long-context Language Modeling? [71.3] 長いコンテキスト入力は、会話の拡張、文書の要約、多数のショットインコンテキスト学習といったタスクにおいて、大きな言語モデル(LLM)にとって不可欠である。
パープレキシティ(PPL)は、長期コンテキスト能力の評価には信頼性が低いことが証明されている。
長短コンテキストコントラスト法を用いて鍵トークンを識別する手法であるbfLongPPLを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:07:01 GMT)
A Survey on Vision-Language-Action Models for Embodied AI [71.2] エンボディードAIは、人工知能の重要な要素として広く認識されている。
組込みAIにおける言語条件ロボットタスクに対処するために、マルチモーダルモデルの新たなカテゴリが登場した。
具体的AIのための視覚-言語-アクションモデルに関する第1回調査を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:24:20 GMT)
On Memorization of Large Language Models in Logical Reasoning [70.9] 大きな言語モデル(LLM)は、挑戦的な推論ベンチマークで優れたパフォーマンスを達成するが、基本的な推論ミスを発生させることもできる。
1つの仮説は、より高度でほぼ飽和した性能は、類似した問題の記憶が原因ではないかというものである。
微調整は暗記を重くするが,常に一般化性能を向上することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:22:40 GMT)
Tailoring Table Retrieval from a Field-aware Hybrid Matching Perspective [70.1] 表検索はテキスト検索に比べて少ない。
異なるテーブルフィールドは、異なるマッチングの好みを持つ。
テーブル調整ハイブリドマッチングrEtriever(THYME)について紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:57:10 GMT)
The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models [69.8] 大規模言語モデルの推論効率を向上させるために,Unsupervised Prefix Fine-Tuning (UPFT)を導入した。
UPFTはラベル付きデータや徹底的なサンプリングの必要性を取り除く。
実験の結果,UPFTは教師付き手法の性能と一致していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:56:03 GMT)
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory [69.0] チャットアシスタントの5つのコアメモリ能力を評価するためのベンチマークであるLongMemEvalを紹介する。
LongMemEvalは、既存の長期記憶システムにとって重要な課題である。
本稿では,長期記憶設計をインデックス化,検索,読解の3段階に分割する統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:19:41 GMT)
Measuring What Makes You Unique: Difference-Aware User Modeling for Enhancing LLM Personalization [68.8] 本稿では,Large Language Models (LLM) のパーソナライゼーションを強化するために,差分認識パーソナライズ学習(DPL)を提案する。
DPLは、戦略的に代表ユーザを比較のために選択し、タスク関連の違いを抽出するための構造化標準を確立する。
実世界のデータセットの実験により、DPLはLLMのパーソナライゼーションを大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:53:26 GMT)
MagicDriveDiT: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control [68.7] MagicDriveDiTは、MVDiTブロックと時空間条件エンコーディングを統合し、マルチビュービデオ生成と正確な幾何学的制御を可能にする新しいアプローチである。
これは、解像度が3.3倍、フレーム数が4.4倍のマルチビュー駆動ビデオ合成を可能にする(現在のSOTAと比較)。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:18:23 GMT)
TweedieMix: Improving Multi-Concept Fusion for Diffusion-based Image/Video Generation [68.0] TweedieMixは、カスタマイズされた拡散モデルを構成する新しい方法である。
我々のフレームワークは、画像とビデオの拡散モデルに力ずくで拡張できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:21:35 GMT)
Towards Event Extraction with Massive Types: LLM-based Collaborative Annotation and Partitioning Extraction [66.7] 大規模言語モデル(LLM)に基づく協調アノテーション手法を提案する。
また, LLM-PEE と呼ばれる LLM-based Partitioning EE 法を提案する。
その結果,LLM-PEEは事象検出では5.4,引数抽出では6.1,最先端手法では6.1に優れていた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:53:43 GMT)
Empowering Sparse-Input Neural Radiance Fields with Dual-Level Semantic Guidance from Dense Novel Views [66.1] レンダリングされたセマンティクスは、レンダリングされたRGBよりも堅牢な拡張データとして扱うことができることを示す。
提案手法は, セマンティクスから導出されるガイダンスを組み込むことで, NeRFの性能を向上させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:13:44 GMT)
Beyond Exact Match: Semantically Reassessing Event Extraction by Large Language Models [65.8] イベント抽出は広範囲の応用により、広範囲の研究が注目されている。
イベント抽出の現在の評価法はトークンレベルの正確な一致に依存している。
イベント抽出のための信頼性とセマンティックな評価フレームワークであるRAEEを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:06:43 GMT)
Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts [64.3] 事前学習したスコアベースモデルから得られた熱処理, 幾何平均, 製品分布の配列から, 効率的かつ原理的に抽出する方法を提供する。
本稿では,サンプリング品質を向上させるために,推論時間スケーリングを利用する逐次モンテカルロ(SMC)再サンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:46:51 GMT)
Dual Consolidation for Pre-Trained Model-Based Domain-Incremental Learning [64.2] ドメイン・インクリメンタル・ラーニング(ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、Domain-Incremental Learning、DIL)は、異なるドメインにまたがる新しい概念へのモデルの漸進的な適応を含む。
プレトレーニングモデルの最近の進歩は、DILの確かな基盤を提供する。
しかし、新しい概念を学ぶことは、しばしば、事前訓練された知識を破滅的に忘れてしまう。
本稿では,歴史的知識の統一と統合を図るために,デュアルコンソリデータティオン(ドゥクト)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:45:15 GMT)
The Perils of Optimizing Learned Reward Functions: Low Training Error Does Not Guarantee Low Regret [64.0] 報奨モデルの十分に低いテスト誤差は、最悪の場合の後悔を確実にすることを示す。
次に、ポリシー正則化技術を用いても、同様の問題が持続することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:17:17 GMT)
VOILA: Evaluation of MLLMs For Perceptual Understanding and Analogical Reasoning [63.0] MLLM(Multimodal Large Language Models)は、視覚情報とテキスト情報を統合するための強力なツールとなっている。
本稿では,MLLMの知覚的理解と抽象的関係推論を評価するためのベンチマークVOILAを紹介する。
我々は,現在のMLLMが画像間関係の理解に苦慮し,高レベルの関係推論において限られた能力を示すことを明らかにした。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:47:38 GMT)
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.9] 大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。
しかし、これらのモデルは言語間の対応する概念、すなわち言語を横断的に関連付けることができるだろうか?
本研究は,言語横断的タスクにおける最先端LLMの評価である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:00:10 GMT)
GRADEO: Towards Human-Like Evaluation for Text-to-Video Generation via Multi-Step Reasoning [62.8] GRADEOは、最初に設計されたビデオ評価モデルの1つである。
説明可能なスコアと評価のためにAIが生成したビデオを、多段階の推論によって評価する。
実験の結果,本手法は既存手法よりも人的評価に適合していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:04:55 GMT)
A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning [61.4] 強化学習(Reinforcement Learning, RL)に基づく微調整は, 拡散モデルとブラックボックスの目的を整合させる強力なアプローチとして登場した。
拡散微調整のための新しいRLであるLeft-one-out PPO(LOOP)を提案する。
以上の結果から,LOOPは様々なブラックボックス対象の拡散モデルを効果的に改善することが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:46:27 GMT)
HyperGCT: A Dynamic Hyper-GNN-Learned Geometric Constraint for 3D Registration [60.0] フレキシブルな動的Hyper-GNN学習型幾何制約であるHyperGCTを提案する。
本手法はグラフ雑音に対して頑健であり,一般化の点で大きな優位性を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:05:43 GMT)
PromptCoT: Synthesizing Olympiad-level Problems for Mathematical Reasoning in Large Language Models [59.9] 本稿では,高品質なオリンピアードレベルの数学問題を自動生成する新しい手法であるPromptCoTを紹介する。
提案手法は,問題構築の背景にある数学的概念と理論的根拠に基づいて複雑な問題を合成する。
提案手法は, GSM8K, MATH-500, AIME2024などの標準ベンチマークで評価され, 既存の問題生成手法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:32:30 GMT)
VideoRAG: Retrieval-Augmented Generation over Video Corpus [57.7] VideoRAGは、クエリによる関連性に基づいて、動的にビデオを取得するフレームワークである。
VideoRAGは近年のLVLM(Large Video Language Models)を利用している。
我々は,ビデオRAGの有効性を実験的に検証し,関連するベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:29:52 GMT)
Aligning Large Language Models and Geometric Deep Models for Protein Representation [57.6] 遅延表現アライメントは、異なるモダリティからの埋め込みを共有空間にマッピングするために使用され、しばしば大きな言語モデル(LLM)の埋め込み空間と一致している。
プリミティブなタンパク質中心の大規模言語モデル (MLLM) が登場したが、それらは表現の至る所で最適なアライメントの実践に関する根本的な理解が欠如しているアプローチに大きく依存している。
本研究では,タンパク質領域におけるLLMと幾何学的深部モデル(GDM)のマルチモーダル表現のアライメントについて検討する。
本研究は, モデルおよびタンパク質の観点からのアライメント要因について検討し, 現行アライメント手法の課題を特定し, アライメントプロセスを改善するための戦略を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:22:33 GMT)
The Feeling of Success: Does Touch Sensing Help Predict Grasp Outcomes? [57.4] 両指にGelSight高解像度触覚センサを装着した2本指グリップを用いて,9000以上の握力試験を行った。
実験結果から,触覚を取り入れることで把握性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:29:30 GMT)
Haste Makes Waste: Evaluating Planning Abilities of LLMs for Efficient and Feasible Multitasking with Time Constraints Between Actions [56.9] 本稿では,現実の調理シナリオに基づいた新しいベンチマークフレームワークRecipe2Planを紹介する。
従来のベンチマークとは異なり、Recipe2Planは並列タスク実行による調理時間を最適化するためにエージェントに挑戦する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:27:02 GMT)
Tool Learning in the Wild: Empowering Language Models as Automatic Tool Agents [56.8] 大規模な言語モデルを外部ツールで拡張することは、彼らのユーティリティを拡張するための有望なアプローチとして現れました。
以前のメソッドは、ツールドキュメントを手動で解析し、コンテキスト内デモを作成し、ツールをLLMがステップバイステップの推論で使用する構造化フォーマットに変換する。
LLMがツール使用ワークフローを自動化できるフレームワークであるAutoToolsを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:33:50 GMT)
MindBridge: Scalable and Cross-Model Knowledge Editing via Memory-Augmented Modality [55.0] 既存のほとんどのメソッドは特定のモデルに過度に適合し、更新毎に編集済みの知識を破棄する。
マルチモーダルモデルにおけるモダリティ処理とLLMの低結合に着想を得た,スケーラブルなソリューションであるMindBridgeを紹介する。
MindBridgeは数万の知識エントリを編集しても優れたパフォーマンスを実現し、異なるLLMに柔軟に対応できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:17:57 GMT)
The 2024 Foundation Model Transparency Index [54.8] ファンデーションモデル透明性指数(FMTI)は2023年10月に、主要なファンデーションモデル開発者の透明性を測定するために設立された。
FMTI 2023は、100の透明性指標で10の主要な基礎モデル開発者を評価した。
私たちは6ヶ月後に追跡調査を行い、同じ100の指標に対して14人の開発者を獲得しました。
FMTI 2023では、公開情報を探しましたが、FMTI 2024では、開発者は100の透明性指標に関するレポートを提出しました。
開発者は平均して100点中58点を獲得し、FMTI 2023よりも21点改善しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:07:55 GMT)
Weak-to-Strong Generalization Even in Random Feature Networks, Provably [54.7] GPT-4のような強力な学習者を必要としないことを示す。
我々は、弱い教師によってラベル付けされたデータにのみ訓練されたにもかかわらず、学生がいかに教師より優れているかを実証し、証明し、理解する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:58:00 GMT)
A Comprehensive Survey on Composed Image Retrieval [54.5] Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。
現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。
我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:16:52 GMT)
AI Automatons: AI Systems Intended to Imitate Humans [54.2] 人々の行動、仕事、能力、類似性、または人間性を模倣するように設計されたAIシステムが増加している。
このようなAIシステムの研究、設計、展開、可用性は、幅広い法的、倫理的、その他の社会的影響に対する懸念を喚起している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:55:38 GMT)
Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content [53.7] テキスト間コンテンツヒンジを評価するには、視覚的品質とアライメントの2つの重要な側面がある。
テキスト間コンテンツ(Q-EVAL-100K)の視覚的品質とアライメントレベルを評価するためのデータセットを提案する。
本稿では,Q-Eval-Scoreを提案する。Q-Eval-Scoreは視覚的品質とアライメントの両方を評価できる統一モデルであり,長文のアライメントを処理できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:28:45 GMT)
BHViT: Binarized Hybrid Vision Transformer [53.4] モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。
本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。
提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:35:01 GMT)
CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes [53.1] CityGaussianV2は大規模なシーン再構築のための新しいアプローチである。
分解段階の密度化・深さ回帰手法を実装し, ぼやけたアーチファクトを除去し, 収束を加速する。
本手法は, 視覚的品質, 幾何学的精度, ストレージ, トレーニングコストの両立を図っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:11:26 GMT)
Improving Pronunciation and Accent Conversion through Knowledge Distillation And Synthetic Ground-Truth from Native TTS [52.9] アクセント変換に対する従来のアプローチは主に非ネイティブ音声をよりネイティブにすることを目的としていた。
我々は、アクセント変換だけでなく、非ネイティブアクセント話者の発音を改善する新しいACアプローチを開発した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:17:59 GMT)
Vision-Language Model IP Protection via Prompt-based Learning [52.8] 視覚言語モデル(VLM)に適した軽量IP保護戦略であるIP-CLIPを導入する。
CLIPの凍結した視覚的バックボーンを利用することで、画像スタイルとコンテンツ情報の両方を抽出し、IPプロンプトの学習に取り入れる。
この戦略は堅牢な障壁として機能し、権限のないドメインから権限のないドメインへの機能移転を効果的に防止する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:31:12 GMT)
Why Is Spatial Reasoning Hard for VLMs? An Attention Mechanism Perspective on Focus Areas [52.5] 機械的解釈可能性のレンズによる空間的推論の課題について検討する。
空間的推論の成功は、実際の物体の位置と注意を一致させるモデルの能力と強く相関している。
本研究の目的は,ADAPTVISを用いて,信頼性の高い地域への注意を喚起することである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:01:19 GMT)
IL-SOAR : Imitation Learning with Soft Optimistic Actor cRitic [52.4] 本稿では、模倣学習のためのSOARフレームワークを紹介する。
これは、コストとポリシーの更新を交互に行うプリミティブデュアルスタイルのアルゴリズムで、専門家によるデモンストレーションからポリシーを学ぶアルゴリズムテンプレートである。
いくつかの MuJoCo 環境では,f-IRL,ML-IRL,CSIL などのソフトアクタ批判に基づく模倣学習アルゴリズムの性能を一貫して向上することが示されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:43:36 GMT)
Affordance-Guided Reinforcement Learning via Visual Prompting [51.4] Keypoint-based Affordance Guidance for Improvements (KAGI) は、視覚言語モデル(VLM)によって形成される報酬を自律的なRLに活用する手法である。
自然言語記述によって指定された実世界の操作タスクにおいて、KAGIは自律的なRLのサンプル効率を改善し、20Kのオンライン微調整ステップでタスク完了を成功させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:15:21 GMT)
(How) Do Language Models Track State? [50.5] トランスフォーマー言語モデル(LM)は、進化している世界の未観測状態を追跡する必要があるように見える振る舞いを示す。
順列を構成するために訓練された、あるいは微調整されたLMにおける状態追跡について検討した。
LMは2つの状態追跡機構のうちの1つを一貫して学習していることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:31:02 GMT)
Let the Code LLM Edit Itself When You Edit the Code [50.5] underlinetextbfPositional textbfIntegrity textbfEncoding (PIE)
PIEは、標準的な完全再計算手法に比べて計算オーバーヘッドを85%以上削減する。
その結果、PIEは計算オーバーヘッドを標準の完全再計算手法に比べて85%以上削減することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:01:07 GMT)
Internal Activation as the Polar Star for Steering Unsafe LLM Behavior [50.5] SafeSwitchは、モデルの内部状態を監視し、利用することによって、安全でない出力を動的に制御するフレームワークである。
実証実験の結果,SafeSwitchは安全性ベンチマークで80%以上の有害な出力を削減し,有効性を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:51:49 GMT)
LLM-TabFlow: Synthetic Tabular Data Generation with Inter-column Logical Relationship Preservation [49.9] 本研究は,合成表型データ生成におけるカラム間関係の保存について,初めて明示的に検討したものである。
LLM-TabFlowは複雑なカラム間関係と圧縮データをキャプチャする新しい手法であり、Score-based Diffusion を用いて遅延空間における圧縮データの分布をモデル化する。
LLM-TabFlowは、カラム間の関係を完全に保ちながら、データの忠実性、ユーティリティ、プライバシの最良のバランスを保ちながら、すべてのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:47:52 GMT)
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation [49.7] Vision-Language Navigation (VLN) は、言語命令と視覚的手がかりの両方を活用することで、エージェントを環境に誘導することを目的としている。
航空VLNのための多目的ツールチェーンと大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
対応する視覚データは、Unreal, GTA V, Google Earth, 3D Splatting (3D GS)など、様々なレンダリングエンジンと高度な技術を用いて生成される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:38:58 GMT)
KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.6] KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。
自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。
このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:17:36 GMT)
MM-OR: A Large Multimodal Operating Room Dataset for Semantic Understanding of High-Intensity Surgical Environments [49.5] 手術室(オペレーティングルーム、英: Operating room, OR)は、医療スタッフ、工具、機器間の相互作用を正確に理解する必要がある複雑な高所環境である。
現在のデータセットは、スケール、リアリズムにおいて不足しており、ORシーンの性質を捉えておらず、ORモデリングにおけるマルチモーダルを制限する。
本稿では,現実的で大規模なマルチモーダルORデータセットであるMM-ORと,マルチモーダルなシーングラフ生成を実現するための最初のデータセットを紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:00:52 GMT)
AdaMesh: Personalized Facial Expressions and Head Poses for Adaptive Speech-Driven 3D Facial Animation [49.4] AdaMeshは、適応的な音声駆動の顔アニメーションアプローチである。
約10秒間の参照ビデオから、パーソナライズされた話し方を学ぶ。
鮮やかな表情と頭部のポーズを生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:47:04 GMT)
Evaluation of Architectural Synthesis Using Generative AI [49.2] 本稿では,GPT-4o と Claude 3.5 の2つのシステムの比較評価を行った。
Palladio's Four Books of Architecture (1965) のヴィラ・ロトンダ (Villa Rotonda) とパラッツォ・ポルト (Palazo Porto) の2つの建物についてケーススタディを行った。
本研究では,(1)図面から建物の2次元および3次元表現を解釈し,(2)CADソフトウェアスクリプトに建物をエンコードし,(3)アウトプットに基づく自己改善を行うシステムの能力を評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:39:28 GMT)
Generating Graphs via Spectral Diffusion [48.7] 本稿では,1)グラフラプラシア行列のスペクトル分解と2)拡散過程に基づく新しいグラフ生成モデルGGSDを提案する。
合成グラフと実世界のグラフの両方に関する広範な実験は、最先端の代替品に対する我々のモデルの強みを実証している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:44:58 GMT)
Language-Guided Visual Perception Disentanglement for Image Quality Assessment and Conditional Image Generation [48.6] CLIPのような対照的な視覚言語モデルは、セマンティック認識タスク間で優れたゼロショット機能を示している。
本稿では, 画像のゆがみを導くために, ゆがみのあるテキストを利用する, マルチモーダルな非絡み付き表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:36:48 GMT)
Rethinking High-speed Image Reconstruction Framework with Spike Camera [48.6] スパイクカメラは連続的なスパイクストリームを生成し、従来のRGBカメラよりも低帯域幅でダイナミックレンジの高速シーンをキャプチャする。
従来のトレーニングパラダイムを超える新しいスパイク・ツー・イメージ再構築フレームワークであるSpikeCLIPを導入する。
実世界の低照度データセットに対する実験により、SpikeCLIPはテクスチャの詳細と回復した画像の輝度バランスを大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:53:28 GMT)
A Theoretical Model for Grit in Pursuing Ambitious Ends [48.4] 我々は、多武装バンディットフレームワークの改善において、安定した選択とリスクのある選択の意思決定のモデルを提供する。
我々は、グリットの増加や金融安全ネットの提供など、様々な介入の影響について検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:17:42 GMT)
Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [48.2] 大きな言語モデル(LLM)は、不一致の自己認識のためにしばしば幻覚する。
既存のアプローチは、不確実性推定やクエリの拒否を通じて幻覚を緩和する。
高速かつ低速な推論システムを統合するための明示的知識境界モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:16:02 GMT)
10K is Enough: An Ultra-Lightweight Binarized Network for Infrared Small-Target Detection [48.1] 両立赤外小ターゲット検出ネットワーク(BiisNet)を提案する。
BiisNetは二項化畳み込みのコア操作を保存し、完全精度の機能をネットワークの情報フローに統合する。
結果は、BiisNetが他のバイナリアーキテクチャよりも優れているだけでなく、最先端のフル精度モデルの間で強力な競争力を示していることを示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:25:51 GMT)
Unified Video Action Model [47.9] 統合されたビデオとアクションモデルは、アクション予測のためのリッチなシーン情報を提供するロボット工学にとって重要な約束である。
我々は,映像とアクションの予測を協調的に最適化し,高精度かつ効率的なアクション推論を実現するUnified Video Action Model (UVA)を提案する。
広範な実験により、UVAは幅広いロボティクスタスクの汎用的なソリューションとして機能できることが実証された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:26:29 GMT)
A Unifying Framework for Learning Argumentation Semantics [47.8] Inductive Logic Programmingアプローチを用いて、抽象的および構造化された議論フレームワークのアクセシビリティセマンティクスを解釈可能な方法で学習する新しいフレームワークを提案する。
提案手法は既存の議論解法よりも優れており,フォーマルな議論や人間と機械の対話の領域において,新たな研究の方向性が開けることになる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:09:19 GMT)
Exploring Token-Level Augmentation in Vision Transformer for Semi-Supervised Semantic Segmentation [47.4] TokenMixは、視覚変換器を用いた半教師付きセマンティックセマンティックセグメンテーションのために特別に設計されたデータ拡張技術である。
本稿では,各ブランチが画像拡張と特徴拡張の両方を入力画像に適用するデュアルブランチフレームワークを提案する。
提案手法は, 精度が顕著に向上し, 最先端のアルゴリズムよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:09:46 GMT)
From Lazy to Rich: Exact Learning Dynamics in Deep Linear Networks [47.1] 人工ネットワークでは、これらのモデルの有効性はタスク固有の表現を構築する能力に依存している。
以前の研究では、異なる初期化によって、表現が静的な遅延状態にあるネットワークや、表現が動的に進化するリッチ/フィーチャーな学習体制のいずれかにネットワークを配置できることが強調されていた。
これらの解は、豊かな状態から遅延状態までのスペクトルにわたる表現とニューラルカーネルの進化を捉えている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:18:33 GMT)
SeqAfford: Sequential 3D Affordance Reasoning via Multimodal Large Language Model [46.8] 3D割当セグメンテーションは、人間の指示を3Dオブジェクトのタッチ可能な領域にリンクして、操作を具体化することを目的としている。
既存の取り組みは、通常、単目的、単順のパラダイムに固執する。
本稿では,複雑なユーザ意図から推論することで従来のパラダイムを拡張したSequential 3D Affordance Reasoningタスクを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:37:01 GMT)
AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation [46.7] トークンレベルの報酬最適化のためのRLHF等価蒸留法を提案する。
実験の結果、既存の方法よりもAlignDistilの方が優れていることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:57:09 GMT)
AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL [46.7] AutoRestTestは、Semantic Property Dependency Graph(SPDG)とMARL(Multi-Agent Reinforcement Learning)と大規模言語モデル(LLM)を統合して、効果的なREST APIテストを可能にする新しいツールである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:19:22 GMT)
A Token-level Text Image Foundation Model for Document Understanding [46.3] TokenOCRは、テキストイメージ関連のタスクに特化して設計された、トークンレベルの視覚基盤モデルである。
TokenOCRの事前トレーニングを容易にするために、トークンレベルの最初の画像テキストデータセットであるTokenITを構築する高品質なデータ生成パイプラインも考案した。
また,従来のVFMをTokenOCRにシームレスに置き換えて,VQAベースの文書理解タスクのための文書レベルのMLLMであるTokenVLを構築する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:05:33 GMT)
VIRES: Video Instance Repainting via Sketch and Text Guided Generation [46.2] スケッチとテキストガイダンスを備えたビデオインスタンス再描画手法であるVIRESを紹介する。
既存のアプローチは、提供されたスケッチシーケンスと時間的一貫性と正確なアライメントに苦慮している。
本稿では,自己スケーリングを標準化したSequential ControlNetを提案する。
スケッチ対応エンコーダは、再塗装された結果が提供されるスケッチシーケンスに一致していることを保証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:28:29 GMT)
$\mathbfΦ$-GAN: Physics-Inspired GAN for Generating SAR Images Under Limited Data [45.8] 本稿では,合成開口レーダ(SAR)画像に対する$Phi$-GANという物理インスパイアされた正規化手法を提案する。
PSCモデルは物理パラメータを用いてSARターゲットを近似し、$Phi$-GANが実際の物理特性と整合したSAR画像を生成する。
我々は,複数の条件付きGAN(cGAN)モデルに対して$Phi$-GANを評価し,データスカースシナリオにおける最先端性能を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:32:11 GMT)
Do Not Trust Licenses You See -- Dataset Compliance Requires Massive-Scale AI-Powered Lifecycle Tracing [45.7] 本稿では,データセットの法的リスクは,ライセンス条項だけでは正確に評価できないことを論じる。
データセットの再配布と完全なライフサイクルの追跡が不可欠である、と同社は主張する。
我々は、AIが人間の専門家よりも高い精度、効率、コスト効率でこれらのタスクを実行できることを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:57:53 GMT)
VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation [45.5] VILA-Uは、ビデオ、画像、言語理解、生成を統合する統一基盤モデルである。
VILA-Uは、両方のタスクに1つの自動回帰的な次世代予測フレームワークを使用している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:31:57 GMT)
CoRNStack: High-Quality Contrastive Data for Better Code Retrieval and Reranking [45.2] CoRNStackは、複数のプログラミング言語にまたがるコードのための、大規模で高品質なコントラストトレーニングデータセットです。
このデータセットは、ノイズ正の除去のために一貫性フィルタリングを用いてキュレートされ、さらに硬い負のマイニングによって濃縮される。
我々は、CoRNStackを用いた埋め込みモデルの対照的なトレーニングが、様々なコード検索タスクにおける最先端のパフォーマンスをもたらすことを実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:36:44 GMT)
Prime Convolutional Model: Breaking the Ground for Theoretical Explainability [45.1] 我々は、説明可能なAIに新たな理論的アプローチを提案する。
制御環境におけるケーススタディに本手法を適用した。
p-Convの異なる挙動は、$m$と$B$で数学的にモデル化できることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:42:46 GMT)
Fair Play in the Fast Lane: Integrating Sportsmanship into Autonomous Racing Systems [44.5] 本稿では,スポーツマンシップ(SPS)をレースに組み込むための2段階のゲーム理論フレームワークを提案する。
高レベルでは、モンテカルロ木探索(MCTS)を用いて最適な戦略を導出するスタックルバーグゲームを用いて、レース意図をモデル化する。
低レベルにおいては、車両の相互作用は一般化ナッシュ平衡問題(GNEP)として定式化され、全てのエージェントが軌道を最適化しながらスポーツマンシップの制約に従うことが保証される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:14:19 GMT)
Joint Out-of-Distribution Filtering and Data Discovery Active Learning [44.3] 本稿では,データ発見能学習(Joda)と分布外フィルタリングの併用を提案する。
従来の作業とは異なり、Jodaは効率が高く、補助的なモデルやラベルのないプールへのアクセスをフィルタリングや選択のために完全に省略している。
18のコンフィグレーションと3つのメトリクスに関する広範な実験では、OODフィルタリングバランスに最適なクラス発見で、常に最高の精度を達成しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:57:24 GMT)
Improving LLM-as-a-Judge Inference with the Judgment Distribution [44.2] 言語モデルを用いて、テキスト品質(LLM-as-a-judge)に関する人間の嗜好を近似する手法が、多くのタスクに適用可能な標準のプラクティスとなっている。
判定分布の平均値を取ると、すべての評価設定においてモード(グレディ復号化)を連続的に上回ることがわかった。
さらに, 評価分布から嗜好を導出する新たな手法について検討し, リスク回避を取り入れた手法により, 性能が向上することを見出した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:59:08 GMT)
Decentralized Adversarial Training over Graphs [44.0] 近年、敵攻撃に対する機械学習モデルの脆弱性が注目されている。
マルチエージェントシステムのための分散逆数フレームワークを開発する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:56:58 GMT)
KiVA: Kid-inspired Visual Analogies for Testing Large Multimodal Models [43.9] 本稿では,大型マルチモーダルモデル(LMM)における視覚的類似推論について,大人や子供と比較して検討する。
我々は,視覚的類似推論に基づくLMMのテストを行うために,日常オブジェクトの4300の視覚的変換のベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:20:59 GMT)
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing [43.6] 我々は,エキスパート選択ルーティングを備えた拡散変圧器のためのMixture-of-Experts(MoE)モデル(EC-DIT)を新たに開発する。
EC-DITは、入力テキストを理解するために割り当てられた計算を適応的に最適化し、各画像パッチを生成する。
テキストと画像のアライメント評価において、我々の最大のモデルでは、最先端のGenEvalスコアが71.68%に達し、直感的に解釈可能な競合推論速度を維持しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:23:51 GMT)
Human Insights Driven Latent Space for Different Driving Perspectives: A Unified Encoder for Efficient Multi-Task Inference [43.5] 都市交通に不可欠な複数のコンピュータビジョンタスクを訓練した統一型エンコーダを提案する。
人間の知覚機構に類似した多様な視覚的手がかりを統合することで、エンコーダはナビゲーション関連の予測を強化する豊富な特徴をキャプチャする。
その結果,(1) 統合エンコーダは,すべての視覚的認識タスク間での競合性能を達成し,強力な一般化能力を示すこと,(2) ステアリング推定のために,凍結された統合エンコーダを平均化することにより,その微細な調整された表現と,ImageNetのような汎用データセットで事前訓練された同じ凍結モデルの両方に優れることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:35:01 GMT)
Go Beyond Your Means: Unlearning with Per-Sample Gradient Orthogonalization [43.4] 機械学習は、モデルが訓練された後、問題のあるトレーニングデータの影響を取り除くことを目的としている。
既存の機械学習手法の多くは、未学習データ上の勾配上昇と、トレーニングデータを表す保持セット上の勾配降下とを慎重にバランスさせることで、この問題に対処している。
本稿では,未学習集合と保持集合との干渉を緩和する手法であるOrthoGradを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:14:33 GMT)
A Joint Visual Compression and Perception Framework for Neuralmorphic Spiking Camera [42.7] 本稿では、スパイクシーケンスを圧縮し、ビットレートとタスク性能の両方に最適化するスパイク情報符号化(SCI)の概念を提案する。
スパイクベース分類では,SOTAコーデックと比較して平均17.25%のBDレート削減,スパイクベース分類では4.3%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:44:33 GMT)
A-MEM: Agentic Memory for LLM Agents [42.5] 大規模言語モデル(LLM)エージェントは、歴史的経験を活用するためにメモリシステムを必要とする。
現在のメモリシステムは基本的なストレージと検索を可能にするが、洗練されたメモリ構造は欠如している。
本稿では, LLMエージェントに対して, エージェント方式で動的に記憶を整理できる新しいエージェントメモリシステムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:09:10 GMT)
Quantum Sensing from Gravity as Universal Dephasing Channel for Qubits [42.0] 重力赤方偏移とアハロノフ・ボーム相の一般的な現象を明らかにする。
絡み合った量子状態は普遍的な速度で脱相することを示す。
精密重力計と機械ひずみ計のための量子センサとして,量子ビットプラットフォームを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:08:34 GMT)
Robust time series generation via Schrödinger Bridge: a comprehensive evaluation [41.9] 時系列に対するSchr"odinger Bridge (SB) アプローチの生成能力について検討した。
我々は、様々なデータセットでSOTA(State-of-the-art)時系列生成手法と比較した。
我々の結果は、時系列生成のための汎用的で堅牢なツールとしてのSBフレームワークの可能性についての貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:01:30 GMT)
Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm [41.5] 本稿では,各サンプルの品質評価から,各サンプルのコントリビューション値の比較に焦点を移す,新しい選択型サンプル選択フレームワークを提案する。
LLM(Large Language Models)の高度な言語理解機能により,LLMを用いて選択過程における各オプションの価値を評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:32:41 GMT)
Revisiting Weak-to-Strong Generalization in Theory and Practice: Reverse KL vs. Forward KL [40.8] 我々は, 前方KL分岐を逆KL分岐に置き換える理論的基礎的アプローチを提案する。
逆KL発散のゼロ強制効果は、高信頼の予測を優先する。
逆のKLと逆のクロスエントロピーは、強いモデルが前方のKLと標準のクロスエントロピーで訓練されたモデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:37:41 GMT)
A Minimalist Example of Edge-of-Stability and Progressive Sharpening [40.4] エッジ・オブ・安定性 (EoS) とプログレッシブ・シャーニング (PS) は古典的なグラディエント・ダイス解析に挑戦している。
本稿では,2次元入力を持つ2層ネットワークを紹介し,一方の次元が応答に関連し,他方が無関係であることを示す。
本研究では,大きな学習率下での漸進的シャープニングと自己安定化の存在を証明し,トレーニング力学とシャープネスの非漸近解析を確立した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:35:13 GMT)
Few-shot Personalization of LLMs with Mis-aligned Responses [40.0] 本稿では,大規模言語モデル(LLM)のパーソナライズのための新しいアプローチを提案する。
私たちのキーとなるアイデアは、LSMを用いてプロンプトを段階的に改善することで、各ユーザに対してパーソナライズされたプロンプトのセットを学ぶことです。
即時改善の反復過程において,LLMによる不整合応答の文脈を取り入れた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:45:47 GMT)
Reflection on Data Storytelling Tools in the Generative AI Era from the Human-AI Collaboration Perspective [40.0] 大規模生成AI技術は、ビジュアルおよびナレーション生成におけるそのパワーでデータストーリーテリングを強化する可能性がある。
我々は、最新のツールのコラボレーションパターンを、データストーリーテリングにおける人間とAIのコラボレーションを理解するための専用のフレームワークを使用して、以前のツールのパターンと比較する。
これらのAIテクニックのメリットや、人間とAIのコラボレーションに対するその他の影響も明らかにされている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:56:18 GMT)
D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models [39.8] 本稿では、雑音推定ネットワークにおける量子化雑音の悪影響を正確に軽減することを目的とした二重復調機構D2-DPMを提案する。
実験により、D2-DPMはより優れた生成品質を示し、フル精度モデルよりも1.42低いFIDが得られることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:58:45 GMT)
Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging [39.6] FratMAE(Cross-Fraternal Twin Masked Autoencoder)は,全身解剖学的および機能的情報を効果的に統合する新しいフレームワークである。
FratMAEは複雑なクロスモーダル関係とグローバルな取り込みパターンをキャプチャし、下流タスクにおいて優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:49:07 GMT)
Effectively Steer LLM To Follow Preference via Building Confident Directions [39.4] 本稿では,モデルステアリング手法の理解と定量化のための理論的枠組みを提案する。
本フレームワークに着想を得て,LDMの活性化を制御できる確実な方向ステアリング法(CONFST)を提案する。
このアプローチは、一般的な双方向モデルステアリング方法に対して、3つの大きな利点を提供します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:32:27 GMT)
ATLaS: Agent Tuning via Learning Critical Steps [39.3] 大規模言語モデル(LLM)エージェントは、マルチドメインタスクにまたがる顕著な一般化機能を示す。
既存のエージェントチューニングアプローチでは、典型的には専門家の軌跡全体について教師付き微調整を用いる。
我々は,これらのステップのみにおいて,専門家の軌跡や微粒化における重要なステップを低コストで識別するATLaSを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:14:55 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0] 私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。
LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。
LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:55:27 GMT)
YOLO-PRO: Enhancing Instance-Specific Object Detection with Full-Channel Global Self-Attention [37.9] 本稿では,オブジェクト検出フレームワークにおける従来のボトルネック構造の本質的制約について論じる。
フルチャネルグローバル自己アテンション (ISB) を持つ Instance-Specific Bottleneck と Instance-Specific Asymmetric Decoupled Head (ISADH) の2つの新しいモジュールを提案する。
MS-COCOベンチマークの実験では、YOLO-PROフレームワークにおけるISBとISADHの協調配置により、全ての計算スケールで最先端のパフォーマンスが達成されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:17:02 GMT)
MedHEval: Benchmarking Hallucinations and Mitigation Strategies in Medical Large Vision-Language Models [37.8] 医療分野においてLVLM(Large Vision Language Models)の重要性が高まっている。
MedHEvalは、Med-LVLMの幻覚と緩和戦略を体系的に評価する新しいベンチマークである。
我々は,11個のLVLM(Med-LVLM)を用いて実験を行い,7つの最先端の幻覚緩和技術を評価した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:40:09 GMT)
Semi-Supervised In-Context Learning: A Baseline Study [37.6] 本稿では,3段階の半教師付きインコンテキスト学習フレームワークを提案する。
Naive-SemiICLはICLプロンプトのための高信頼な自己生成デモをプロンプトする。
擬似宣言を反復的に洗練するアノテーションアプローチである IterPSD は、分類タスクにおいて最大6.8%の利得を達成している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:52:49 GMT)
MPO: Boosting LLM Agents with Meta Plan Optimization [37.4] 大規模言語モデル(LLM)により、エージェントは対話的な計画タスクにうまく取り組むことができる。
既存のアプローチは、しばしば幻覚の計画に悩まされ、新しいエージェントごとに再訓練を必要とする。
本稿では,明示的なガイダンスを直接組み込んでエージェント計画機能を向上させるメタプラン最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:54:45 GMT)
LLaSE-G1: Incentivizing Generalization Capability for LLaMA-based Speech Enhancement [36.9] LLaMAに基づく言語モデルであるLLaSE-G1を導入する。
音響的不整合を軽減するため、LLaSE-G1は入力としてWavLMからの連続表現を使用し、X-Codec2からの音声トークンを予測し、音響保存を最大化する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:32:13 GMT)
VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge [36.7] 一般視覚言語モデル(VLM)はコンピュータビジョンにおいて大きな進歩を遂げてきたが、医療などの専門分野では不足している。
従来のコンピュータビジョンタスクでは、創造的あるいは近似的な回答は受け入れられるかもしれないが、医療では精度が最重要である。
本稿では,専門モデルを用いた領域知識を活用した医療用VLMのための新しいフレームワークVILA-M3を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:51:48 GMT)
Advancing Molecular Graph-Text Pre-training via Fine-grained Alignment [36.1] FineMolTexは、新しい分子グラフ-テキスト事前トレーニングフレームワークである。
粒度の粗い分子レベルの知識と粒度の細かいモチーフレベルの知識を学習する。
FineMolTexは、きめ細かな知識をうまく捉え、薬物発見と触媒設計のための貴重な洞察を提供する可能性がある。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:17:48 GMT)
Deepfake Detection via Knowledge Injection [36.0] 既存のディープフェイク検出手法は、実際のデータ知識の本質的な役割を見逃す傾向がある。
知識注入モジュールは、バックボーンモデルに必要な知識を学習し、注入するために提案される。
知識注入モジュールにおける実データの知識を強調するために,2つのレイヤワイド抑制とコントラスト損失を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:11:14 GMT)
Learning from Failures in Multi-Attempt Reinforcement Learning [35.8] 実験結果から,多目的タスクで訓練された小さなLLMであっても,より多くの試行で評価すると,精度が著しく向上することがわかった。
その結果,従来のシングルターンタスクと比較して,マルチタスクタスクで訓練されたLLMは,数学ベンチマークで若干性能が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:53:39 GMT)
RNA-FrameFlow: Flow Matching for de novo 3D RNA Backbone Design [35.7] 本稿では3次元RNAバックボーン設計のための最初の生成モデルであるRNA-FrameFlowを紹介する。
我々は、剛体フレームと関連する損失関数の集合としてRNA構造を定式化する。
3次元RNAデータセットの多様性の欠如に対処するため、構造的クラスタリングと収穫増強によるトレーニングについて検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:59:58 GMT)
AugFL: Augmenting Federated Learning with Pretrained Models [35.4] フェデレートラーニング(FL)は近年広く関心を集めている。
本稿では,中央サーバと分散クライアントによるネットワークFLシステムについて考察する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:37:33 GMT)
Joint Tensor and Inter-View Low-Rank Recovery for Incomplete Multiview Clustering [35.3] 本稿では、不完全なマルチビュークラスタリングのための新しいジョイントテンソルとビュー間低ランクリカバリ(JTIV-LRR)を提案する。
クラスタリングの精度とロバスト性は最先端の手法に比べて大幅に改善されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:50:59 GMT)
BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modelling [35.2] 時系列生成(TSG、Time-Series Generation)は、シミュレーション、データ拡張、および反事実分析に広く応用された、顕著な研究分野である。
我々は、テキストが意味的な洞察、ドメイン情報、インスタンス固有の時間パターンを提供し、TSGをガイドし改善することができると論じている。
BRIDGEはテキスト制御型TSGフレームワークで,テキスト記述とセマンティックプロトタイプを統合し,ドメインレベルのガイダンスをサポートする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:40:00 GMT)
POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation Learning [34.9] 近年の研究では、多モーダル情報によるPOI表現の充実がタスク性能を大幅に向上させることが示されている。
広範なテキストデータに基づいて訓練された大規模言語モデル (LLMs) は、リッチテキストの知識を持つことがわかった。
古典的なPOI学習モデルによって生成されたPOI表現を改善するために,LLMを利用するポータブルフレームワークであるPOI-Enhancerを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:19:42 GMT)
Words or Vision: Do Vision-Language Models Have Blind Faith in Text? [34.9] VLM(Vision-Language Models)は、視覚中心のタスクに対する視覚情報とテキスト情報の統合に優れる。
視覚中心設定における視覚データや様々なテキスト入力に直面するVLMのモダリティ嗜好について検討する。
不整合が発生した場合、VLMは視覚的データよりもテキストデータを不均等に信頼する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:21:07 GMT)
Non-rigid Structure-from-Motion: Temporally-smooth Procrustean Alignment and Spatially-variant Deformation Modeling [34.6] 非剛性構造移動(NRSfM)の研究が盛んに行われ、大きな進展が見られた。
広範に現実世界のアプリケーションを妨げる重要な課題はまだ残っている。
本稿では,空間時間モデルの観点から,上記の課題を解決することを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:37:43 GMT)
Rewarding Doubt: A Reinforcement Learning Approach to Confidence Calibration of Large Language Models [34.6] LLM(Large Language Models)の安全かつ信頼性の高い使用には、その回答に対する信頼性の正確な表現が必要である。
本稿では,LLMキャリブレーションのためのReinforcement Learning (RL) アプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:48:50 GMT)
Learning from Noisy Labels with Contrastive Co-Transformer [34.6] CNNはノイズラベルを持つサンプルの存在に過度に適合する傾向にある。
Contrastive Co-Transformerフレームワークを導入し、シンプルで高速であるが、大きなマージンで性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:48:43 GMT)
Time-Varying Coronary Artery Deformation: A Dynamic Skinning Framework for Surgical Training [33.9] 本研究は, 骨格スキンウェイトを用いた冠状動脈の動的モデリングフレームワークを提案する。
外科シミュレーションのリアルタイム性能を維持しつつ, 血管の変形を正確に制御することを目的としている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:51:37 GMT)
Frame-Voyager: Learning to Query Frames for Video Large Language Models [33.8] ビデオ大言語モデル (Video-LLMs) はビデオ理解タスクにおいて顕著な進歩を遂げている。
フレームの一様サンプリングやテキストフレーム検索のような既存のフレーム選択アプローチでは、ビデオ内の情報密度の変動を考慮できない。
タスクの与えられたテキストクエリに基づいて,情報フレームの組み合わせを問合せする Frame-Voyager を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:28:21 GMT)
Projection Head is Secretly an Information Bottleneck [33.8] 我々は情報理論の観点から、投射頭部の深い理論的理解を発展させる。
プロジェクタより前の特徴の下流性能に関する理論的保証を確立することにより、有効なプロジェクタが情報ボトルネックとして機能することを明らかにする。
提案手法は,様々な実世界のデータセットにおいて,ダウンストリーム性能が一貫した改善を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:11:50 GMT)
Memorize or Generalize? Evaluating LLM Code Generation with Evolved Questions [33.6] LLM(Large Language Models)は、コード生成において暗記現象を示すことが知られている。
本稿では, 突然変異, 言い換え, コード書き換えという3つの進化戦略を設計し, この現象を考察する。
予想通り、監督された微調整が進むにつれて、暗記のスコアは過度に適合する前に上昇し、より厳しい暗記の可能性が示唆される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:39:24 GMT)
A Survey of NL2SQL with Large Language Models: Where are we, and where are we going? [32.8] 我々は,Large Language Models (LLM) を用いたNL2手法のレビューを行う。
LLM時代におけるNL2の研究課題とオープン問題について論じる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:51:36 GMT)
Structured IB: Improving Information Bottleneck with Structured Feature Learning [32.8] 我々は、潜在的に構造化された機能を調べるためのフレームワークであるStructured IBを紹介した。
IBラグランジアン法と比較し,予測精度とタスク関連情報を比較検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:42:25 GMT)
Fence Theorem: Towards Dual-Objective Semantic-Structure Isolation in Preprocessing Phase for 3D Anomaly Detection [32.4] Fence Theoremは、前処理を二重目的意味的アイソレータとして定式化する。
Patch3Dは、Patch-CuttingとPatch-Matchingモジュールで構成され、セマンティック空間を分割し、類似のモジュールを統合する。
Anomaly-ShapeNetとReal3D-ADを異なる設定で実験した結果、前処理におけるよりきめ細かなセマンティックアライメントにより、ポイントレベルのAD精度が向上することが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:33:21 GMT)
PVTree: Realistic and Controllable Palm Vein Generation for Recognition Tasks [32.3] Palm静脈認識(Palm vein recognition)は、セキュリティとプライバシーを強化したバイオメトリック技術である。
しかし、既存の手法は、しばしば非現実的な手のひら静脈パターンを生み出したり、アイデンティティやスタイルの属性を制御するのに苦労する。
これらの問題に対処するために,PVTree という新たなヤシ静脈生成フレームワークを提案する。
提案手法は既存の手法を超越し,1:1オープンセットプロトコルの下で高いTAR@FAR=1e-4を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:15:33 GMT)
Unsupervised Video Domain Adaptation with Masked Pre-Training and Collaborative Self-Training [32.3] 画像教師モデルを用いて,映像学生モデルを対象領域に適応させる。
UNITEは、まず自己教師付き事前訓練を使用して、ターゲットのドメインビデオ上で差別的特徴学習を促進する。
次に,ビデオ学生モデルとイメージ教師モデルを用いて,マスク付き対象データを用いた自己学習を行い,未ラベル対象ビデオのための改良された擬似ラベルを生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:17:52 GMT)
Normalization through Fine-tuning: Understanding Wav2vec 2.0 Embeddings for Phonetic Analysis [32.1] 本研究では,トランスモデル,特にwav2vec 2.0における正規化過程について検討した。
We found that fine-tuning wav2vec 2.0 is effective to be speechtic normalization by selectively suppressing task-rerelevant information。
これらの知見は, 音声モデルにおいて音素正規化が柔軟に達成されるか, 人間の音声知覚においてどのように実現されるのか, 新たな知見を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:28:10 GMT)
ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish [32.0] 本稿では,Zebrafish Activity Prediction Benchmark (ZAPBench) を導入し,細胞分解能神経活動の予測問題の進展を計測する。
このベンチマークは、幼魚のゼブラフィッシュ脳の7万以上のニューロンの4D光シート顕微鏡記録を含む新しいデータセットに基づいている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:38:41 GMT)
XFMamba: Cross-Fusion Mamba for Multi-View Medical Image Classification [31.9] XFMambaは、マルチビュー医療画像分類の課題を解決するために、純粋なマンバベースのクロスフュージョンアーキテクチャである。
XFMambaは、新しい2段階融合戦略を導入し、シングルビューの特徴の学習と、それらの相互ビューの相違を容易にする。
その結果、既存の畳み込みベースおよびトランスフォーマーベースのマルチビュー手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:38:58 GMT)
VoxelNextFusion: A Simple, Unified and Effective Voxel Fusion Framework for Multi-Modal 3D Object Detection [31.9] 既存のボクセル法は、1対1で濃密な画像特徴を持つスパース・ボクセル特徴を融合する際の課題に直面する。
本稿では,VoxelNextFusionについて述べる。VoxelNextFusionは,Voxelベースの手法に特化して設計されたマルチモーダル3Dオブジェクト検出フレームワークである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:16:54 GMT)
OmniSQL: Synthesizing High-quality Text-to-SQL Data at Scale [31.9] 本研究では,大規模で高品質で多様なデータセットを人間の介入なしに自動合成する,新しいスケーラブルなテキスト・データ・フレームワークを提案する。
16,000以上の合成データベースにまたがる250万のサンプルを含む,最初の100万規模のテキスト・データセットであるSyn-2.5Mを紹介した。
我々は,7B,14B,32Bの3つのサイズで利用可能な,オープンソースの強力なテキスト・ツー・モデルであるOmniを開発した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:30:56 GMT)
MciteBench: A Benchmark for Multimodal Citation Text Generation in MLLMs [31.8] MLLM(Multimodal Large Language Models)は多様なモダリティを統合するために進歩しているが、幻覚に悩まされることが多い。
既存の作業は、主にテキストのみのコンテンツのための引用を生成することに焦点を当て、マルチモーダルコンテキストの課題と機会を見下ろしている。
MLLMのマルチモーダル引用テキスト生成能力の評価と解析を目的とした,最初のベンチマークであるMCiteBenchを紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:12:39 GMT)
Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [31.8] 大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。
本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:31:05 GMT)
GENET: Unleashing the Power of Side Information for Recommendation via Hypergraph Pre-training [31.5] 一般化されたhypErgraph pretraiNing on sidE informaTionは、フィードバック非関連側情報に関するユーザーおよびアイテム表現を事前訓練する。
一般化されたhypErgraph pretraiNing on sidE informaTionは、フィードバック非関連側情報に関するユーザーおよびアイテム表現を事前訓練する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:17:16 GMT)
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification [30.7] 拡散モデルの性能は、トレーニング期間中に使用した画像よりも解像度の高い画像を生成するときに低下する。
トレーニング不要な高解像度画像生成のための効率的かつ簡単な解法であるRectifiedHRを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:03:26 GMT)
DDAD: A Two-pronged Adversarial Defense Based on Distributional Discrepancy [30.5] 統計的逆データ検出(SADD)は、次のバッチが逆データ例(AE)を含むかどうかを検出する
本稿では,分布差の最小化がAEの損失低減に有効であることを示す。
DDAD(Distributal-Discrepancy-based Adversarial Defense)という対角防御法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:16:21 GMT)
BotUmc: An Uncertainty-Aware Twitter Bot Detection with Multi-view Causal Inference [30.4] 本研究では、不確実性を考慮したボット検出手法を提案し、不確実性スコアを用いて、異なる環境下でのソーシャルネットワークの複数ビューからの高信頼度判定を行う。
具体的には,提案するBotUmc は LLM を用いてつぶやきからの情報を抽出し,抽出した情報,元のユーザ情報,ユーザ関係に基づいてグラフを構築し,因果的干渉による複数のビューを生成する。最後に,不確実性損失を用いて結果の不確実性を定量化し,結果の選択を最終決定とする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:39:31 GMT)
A Survey on Evaluating Large Language Models in Code Generation Tasks [30.3] 本稿では,コード生成タスクにおけるLarge Language Models (LLMs) の性能評価に使用される現在の手法と指標について概説する。
自動ソフトウェア開発の需要が急速に増加し、LLMはコード生成の分野で大きな可能性を示してきた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:13:23 GMT)
MedEthicEval: Evaluating Large Language Models Based on Chinese Medical Ethics [30.1] 本稿では,医療倫理分野における大規模言語モデル(LLM)の評価を目的とした新しいベンチマークであるMedEthicEvalを紹介する。
我々のフレームワークは、知識、モデルによる医療倫理原則の把握、応用の2つの重要な要素を含み、様々なシナリオにまたがってこれらの原則を適用する能力に焦点を当てている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:01:34 GMT)
From Code to Courtroom: LLMs as the New Software Judges [29.8] 大規模言語モデル(LLM)は、コード生成や要約といったソフトウェアエンジニアリングタスクを自動化するために、ますます使われています。
人間の評価は効果的だが、非常にコストと時間を要する。
LLMを自動評価に用いるLLM-as-a-Judgeパラダイムが登場した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:48:23 GMT)
Modeling Relational Patterns for Logical Query Answering over Knowledge Graphs [29.5] そこで我々は,複雑な空間における回転により,クエリ領域を幾何学的円錐と代数的クエリ演算子として定義する新しいクエリ埋め込み手法RoConEを開発した。
いくつかのベンチマークデータセットに対する実験結果から,論理的問合せ処理の強化のための関係パターンの利点が確認された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:03:02 GMT)
Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging [29.4] 我々は、NIRイメージングとイベントベース技術を組み合わせた、低照度イメージングのための新しいフレームワークを開発した。
我々は、スペクトル一貫性と高次相互作用により、NIR画像と可視事象のクロスモーダルな特徴を利用する。
本研究は、高忠実度低照度イメージングとニューロモルフィック推論の道を開くため、NIR画像と事象の両方を強化するための衝動を与える。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:08:27 GMT)
WalkVLM:Aid Visually Impaired People Walking by Vision Language Model [29.3] 12,000対のビデオアノテーションペアからなる歩行支援専用の最初の大規模データセットを紹介した。
簡潔だが情報に富むリマインダーを生成する階層的計画に一連の思考を用いるWalkVLMモデルを提案する。
我々はブラインドウォーキングタスクの確固たるベンチマークを確立し、ストリームビデオ処理におけるWalkVLMの利点を検証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:05:02 GMT)
UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression [29.2] Inlicit Neural Representation (INRs)は、ビデオをニューラルネットワークとして表現することで、ビデオ圧縮において大きな可能性を証明している。
本稿では、自己回帰(AR)の観点からのINRモデルの新たな理解と、メモリ効率の高いニューラルビデオ圧縮(UAR-NVC)のための統一自己回帰フレームワークを提案する。
UAR-NVCは、タイムラインベースとINRベースのニューラルビデオ圧縮を統合自己回帰パラダイムの下で統合する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:54:57 GMT)
Artificial Intelligence in Reactor Physics: Current Status and Future Prospects [28.7] 原子炉物理学は中性子物性の研究であり、中性子と原子炉の物質間の相互作用をモデルで調べることに焦点を当てている。
人工知能(AI)は、例えば運転シミュレーション、安全設計、リアルタイム監視、コア管理、保守において、原子炉物理学に多大な貢献をしている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:36:58 GMT)
Towards Zero-Shot, Controllable Dialog Planning with LLMs [28.4] 大規模言語モデル(LLM)は、タスク固有のダイアログエージェントのトレーニングの代替として登場した。
本稿では,制御可能な会話木探索(CTS)エージェントのためのゼロショット手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:21:26 GMT)
Deep Height Decoupling for Precise Vision-based 3D Occupancy Prediction [28.1] 本稿では,DHD(Deep Height Decoupling,ディープハイトデカップリング,Deep Height Decoupling,DHD)について述べる。
一般的なOcc3D-nuScenesベンチマークでは,最小入力フレームでも最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:53:32 GMT)
IterPref: Focal Preference Learning for Code Generation via Iterative Debugging [28.0] We propose IterPref, a new preference alignment framework for Code LLMs。
IterPrefは明示的にエラー領域を特定し、対応するトークンを調整されたDPOアルゴリズムで調整する。
IterPrefはコード生成において大幅なパフォーマンス向上を実現し、BigCodeBenchのような課題を改善する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:56:34 GMT)
Robust Scene Change Detection Using Visual Foundation Models and Cross-Attention Mechanisms [27.9] 本稿では,視覚基礎モデルDINOv2の頑健な特徴抽出機能を活用したシーン変化検出手法を提案する。
我々は,VL-CMU-CDとPSCDの2つのベンチマークデータセットに対するアプローチと,その視点評価バージョンについて検討した。
実験では,F1スコアにおいて,特に画像ペア間の幾何学的変化を伴うシナリオにおいて,顕著な改善が示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:16:30 GMT)
Node-level Contrastive Unlearning on Graph Neural Networks [27.6] グラフアンラーニングは、グラフ上でトレーニングされたグラフニューラルネットワーク(GNN)からグラフエンティティ(ノードとエッジ)のサブセットを削除することを目的としている。
既存の作業では、グラフのパーティショニングや影響関数、その他のレイヤを使用して、グラフのアンラーニングを実現している。
本稿では,埋め込み空間を利用して,より効果的なグラフアンラーニングを実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:34:19 GMT)
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse [27.3] 本稿では,RAGフレームワークにおけるLCMの信頼性を評価する総合指標であるTrust-Scoreを紹介する。
信頼スコア性能向上のためのLCMの整合化手法であるTrust-Alignを提案する。
Trust-AlignはASQA, QAMPARI, ELI5の競争ベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:25:09 GMT)
SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting [26.5] SeqFusionは、ゼロショット予測のために、さまざまなトレーニング済みモデルを逐次収集およびヒューズする新しいフレームワークである。
対象時系列の特定の時間特性に基づいて、SeqFusionは、プレコンパイルされたPTMのバッチから最も適したPTMを選択する。
実験により、セクフュージョンは最先端の手法と比較してゼロショット予測において競合精度を達成することが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:59:17 GMT)
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models [26.2] MLLM(Multimodal Large Language Models)は、一貫した視覚・テキスト入力で主に訓練され、テストされる。
本稿では,MLLMの意味的ミスマッチの検出と推論能力を評価するためのマルチモーダル不整合推論ベンチマークを提案する。
我々は6つの最先端MLLMを評価し、o1のような専用マルチモーダル推論能力を持つモデルは、その性能を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:23:58 GMT)
From Specific-MLLMs to Omni-MLLMs: A Survey on MLLMs Aligned with Multi-modalities [26.0] Omni-MLLMは、Omni-Modalの理解と生成を目指している。
我々はまず,Omni-MLLMの4つのコアコンポーネントについて,統一マルチモーダルモデリングについて説明する。
次に、2段階のトレーニングによって達成された効果的な統合を紹介し、対応するデータセットについて議論する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:47:20 GMT)
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface [25.9] textbfOpen-ended言語インターフェースを通じて、textbfFineの粒度の視覚的知覚タスクをTextbfUnifyするフレームワークである。
オブジェクトレベルの検出、ピクセルレベルのセグメンテーション、イメージレベルの視覚言語タスクを単一のモデルに統合する。
私たちのフレームワークは、きめ細かい認識と視覚言語タスクのギャップを埋め、アーキテクチャ設計とトレーニング戦略を大幅に単純化します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:36:45 GMT)
Straight-Line Diffusion Model for Efficient 3D Molecular Generation [25.6] この問題に対処するために, SLDM(Straight-Line Diffusion Model)を提案する。
3次元分子生成ベンチマークにおけるSLDMの最先端性能はサンプリング効率を100倍に向上させる。
玩具データと画像生成タスクの実験は、SLDMの汎用性とロバスト性を検証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:23:58 GMT)
Automatically Improving LLM-based Verilog Generation using EDA Tool Feedback [25.6] 大きな言語モデル(LLM)は、完全に機能するHDLコードを生成するための潜在的なツールとして現れています。
電子設計自動化(EDA)ツールからのフィードバックを利用して,自作のVerilogの誤りを修正できることを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:25:03 GMT)
Are Large Vision Language Models Good Game Players? [25.5] 大規模視覚言語モデル(LVLM)は、視覚情報とテキスト情報の両方について理解と推論において顕著な能力を示した。
既存のLVLMの評価手法は、主にVisual Question Answeringのようなベンチマークに基づいており、LVLMの能力の全範囲を捉えていないことが多い。
構造化環境におけるLVLMの認知・推論スキルを総合的に評価するためのゲームベース評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:29:03 GMT)
Coherent backscattering and coherent forward scattering effects in variations of the random quantum kicked rotor [25.5] ランダム量子キックローターモデルにおけるコヒーレント多重散乱効果について検討する。
フロッケ期の開始時刻を変えることで、同様の干渉構造を示す2つの新しいモデルのクラスを導入することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:26:52 GMT)
Simulating Human-like Daily Activities with Desire-driven Autonomy [25.4] 本稿では,大規模言語モデル(LLM)を自律的に提案し,タスクを選択することを可能にする,D2A(Desire-driven Autonomous Agent)を提案する。
各ステップにおいて、エージェントは現在の状態の価値を評価し、一連の候補活動を提案し、その本質的なモチベーションに最適なものを選択する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:22:34 GMT)
Lightweight Channel-wise Dynamic Fusion Model: Non-stationary Time Series Forecasting via Entropy Analysis [25.3] 我々は、分散が時系列の非定常性に対する有効かつ解釈可能なプロキシであることを示す。
軽量なtextitChannel-wise textitDynamic textitFusion textitModel(textitCDFM)を提案する。
7つの時系列データセットに関する総合的な実験は、CDFMの優位性と一般化能力を示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:29:42 GMT)
Towards Heisenberg limit without critical slowing down via quantum reinforcement learning [25.0] 量子多体システムのためのQRL(quantum reinforcement learning)を用いた臨界検出プロトコルを提案する。
QRL学習シーケンスは、有限量子速度限界に達し、任意の大きさのシステムで効果的に一般化されることを示す。
我々の研究は、QRLが正確な量子状態の準備を可能にし、スケーラブルで高精度な量子臨界センシングを進化させる効果を強調した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:42:27 GMT)
Q&C: When Quantization Meets Cache in Efficient Image Generation [24.8] 拡散変換器(DiT)の量子化とキャッシュ機構の組み合わせは簡単ではない。
本稿では,上記の課題に対処してハイブリッド加速法を提案する。
競合生成能力を保ちながら,DiTsを12.7倍高速化した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:19:02 GMT)
Adapting Decoder-Based Language Models for Diverse Encoder Downstream Tasks [24.7] Gemmaを導入し、強力なデコーダモデルをエンコーダアーキテクチャに適用する。
復号器から復号器への適応を最適化するために,様々なプーリング戦略を解析する。
GLUEベンチマークとMS MARCOベンチマークの確立したアプローチに対してGemmaをベンチマークする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:17:00 GMT)
Better Aligned with Survey Respondents or Training Data? Unveiling Political Leanings of LLMs on U.S. Supreme Court Cases [24.6] トレーニングコーパス形状モデルに埋め込まれた値とバイアスがどのように出力するかを実証的に検討する。
ケーススタディとして、米国最高裁判所32件のLLMの政治的傾向を調査することに焦点をあてる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:06:06 GMT)
Position: Don't use the CLT in LLM evals with fewer than a few hundred datapoints [24.6] 我々は、CLTに基づく不確実性定量化手法は、数千の例からなるベンチマークでは適切であるが、より小型で高度に専門化されたベンチマークに依存する評価に対して、適切な不確実性評価を提供することができないと論じる。
これらの小さなデータ設定では、CLTベースの手法は非常に貧弱で、通常劇的に不確実性を過小評価する。
より一般的なシナリオにおいて、実装が容易で、より適切な代替の頻繁な手法とベイズ的手法を推奨する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:30:30 GMT)
Understanding Dynamic Diffusion Process of LLM-based Agents under Information Asymmetry [24.5] 情報内容と分配機構によって定義された12の非対称なオープン環境における情報拡散のダイナミクスについて検討する。
我々はエージェントが異なる情報に注意を割り当てるのを支援する動的注意機構を設計する。
我々は、情報コクーンの出現、情報ギャップの進化、社会資本の蓄積を観察する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:38:34 GMT)
TeTRA-VPR: A Ternary Transformer Approach for Compact Visual Place Recognition [24.4] 3次変換器であるTeTRAを提案し、ViTのバックボーンを2ビット精度に段階的に定量化し、最終埋め込み層をバイナライズする。
標準VPRベンチマークの実験では、TeTRAは効率的なベースラインに比べてメモリ消費を最大69%削減している。
これにより、パワー制約のあるメモリ制限のロボットプラットフォーム上での高精度なVPRが可能になり、TeTRAは現実のデプロイメントに魅力的なソリューションとなる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:20:10 GMT)
Elliptic Loss Regularization [24.2] 本稿では,データ入力空間と損失値のマッピングにおいて,滑らかさのレベルを強制する手法を提案する。
ネットワークの損失がデータ領域上の楕円演算子を満たすことを要求して、正規性のレベルを規定する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:08:08 GMT)
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation [24.2] 本稿では,様々な評価ベンチマークの急激な摂動を含む大規模データセットであるDOVE(Dataset Of Variation Evaluation)を提案する。
従来の研究とは対照的に,LLM感度を全体論的視点から検討し,様々な次元に沿った摂動の連関効果を評価する。
DOVEは2億5000万以上の急激な摂動とモデルアウトプットで構成されています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:00:55 GMT)
Accelerating Vision-Language-Action Model Integrated with Action Chunking via Parallel Decoding [24.1] VLA(Vision-Language-Action)モデルでは、一般化可能なロボット操作の可能性を示している。
本稿では,アクションチャンキングと統合されたVLAモデルのための最初の並列デコーディングフレームワークであるPD-VLAを提案する。
本フレームワークは,並列な固定点反復によって解く非線形システムとして自己回帰復号を再構成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:12:08 GMT)
Passive Heart Rate Monitoring During Smartphone Use in Everyday Life [23.6] 安静時心拍数(RHR)は、心臓血管の健康と死亡にとって重要なバイオマーカーである。
本稿では,日常的スマートフォン使用時の受動心拍数(HR)およびRHR測定のためのディープラーニングシステムであるPHRMについて述べる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:28:10 GMT)
Assistance or Disruption? Exploring and Evaluating the Design and Trade-offs of Proactive AI Programming Support [23.4] 我々は,エディタアクティビティとタスクコンテキストに基づいたプログラミング支援を開始するデザインプローブエージェントであるCodellaboratorを紹介し,評価する。
プロアクティブエージェントは、プロンプトのみのパラダイムに比べて効率が向上するが、ワークフローの混乱も引き起こす。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:26:19 GMT)
InSerter: Speech Instruction Following with Unsupervised Interleaved Pre-training [23.3] 本稿では,Interleaved Speech-Text Representation Pre-trainingの略であるInSerterという,シンプルでスケーラブルなトレーニング手法を提案する。
InSerterは、大規模な教師なし音声テキストシーケンスを事前訓練するために設計されており、テキストから音声への変換を用いて、広範テキストコーパスのランダムに選択されたセグメントから音声を合成する。
提案したInSerterは、SpeechInstructBenchにおけるSOTA性能を実現し、多様な音声処理タスクにおいて、優れた、あるいは競争的な結果を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:34:14 GMT)
A Transformer-Based Framework for Greek Sign Language Production using Extended Skeletal Motion Representations [22.8] 我々は手話生産(SLP)のためのディープラーニングモデルを提案する。
テキスト入力から人間のポーズキーポイントへの変換を可能にするトランスフォーマーベースのアーキテクチャを用いて,この課題に対処する。
提案したパイプラインの有効性を,ギリシャのSLデータセットAusly23上で評価した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:05:42 GMT)
Promptware Engineering: Software Engineering for LLM Prompt Development [22.8] 大規模言語モデル(LLM)は、ソフトウェアアプリケーションに統合され、プロンプトが主要な'プログラミング'インターフェースとして機能する。
その結果,新たなソフトウェアパラダイムであるプロンプトウェアが出現し,自然言語のプロンプトを使ってLLMと対話する。
フォーマルなプログラミング言語や決定論的ランタイム環境に依存する従来のソフトウェアとは異なり、プロンプトウェアはあいまいで非構造的で文脈に依存した自然言語に基づいている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:43:16 GMT)
ArticuBot: Learning Universal Articulated Object Manipulation Policy via Large Scale Simulation [22.4] Articubot(アルティキュボット)は、現実世界で目に見えないオブジェクトの多様なカテゴリをオープンするポリシーを学ぶシステムである。
学習したポリシーは、3つの異なるリアルロボット設定にゼロショット転送可能であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:51:50 GMT)
DriveGen: Towards Infinite Diverse Traffic Scenarios with Large Models [22.2] DriveGenは、より多様なトラフィック生成のための大きなモデルを備えた、新しいトラフィックシミュレーションフレームワークである。
DriveGenは、大規模モデルのハイレベルな認識と運転行動の推論を完全に活用する。
生成したシナリオとコーナーケースは、最先端のベースラインよりも優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:14:21 GMT)
Multidimensional Consistency Improves Reasoning in Language Models [22.0] 複数の入力のバリエーションにまたがる応答整合性のモデルをテストするためのフレームワークを提案する。
我々は, (i) シュート順, (ii) 問題表現, (iii) 言語でのバリエーションを誘導する。
我々のフレームワークは単言語データセットGSM8Kと多言語データセットMGSMの両方、特により小さなモデルにおいて数学的推論性能を一貫して向上させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:41:05 GMT)
Toxicity Detection towards Adaptability to Changing Perturbations [22.0] 本稿では,新しい問題,すなわち連続学習型ジェイルブレイク摂動パターンを毒性検出分野に導入する。
まず,9種類の摂動パターンによって生成された新しいデータセットを構築し,その内7つは先行作業から要約し,そのうち2つは私たちによって開発された。
次に、この新しい摂動パターン認識データセットにおける現在の手法の脆弱性を体系的に検証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:49:58 GMT)
Teaching Metric Distance to Autoregressive Multimodal Foundational Models [21.9] DIST2Lossは自動回帰離散モデルの学習を目的とした遠隔認識フレームワークである。
DIST2Lossは、固有距離測定値から派生した指数関数的な家族分布を離散的なカテゴリー最適化ターゲットに変換する。
経験的評価は多様なマルチモーダルアプリケーションにおいて一貫した性能向上を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:14:51 GMT)
V2X-LLM: Enhancing V2X Integration and Understanding in Connected Vehicle Corridors [21.7] 本稿では,V2Xデータの理解とリアルタイム解析を改善するために,V2X-LLMフレームワークを提案する。
シナリオ説明、交通状況の詳細な説明、V2Xデータ記述、車両とインフラの状態の詳細な説明、将来の交通状態を予測する状態予測である。
この統合により、交通分析、安全性、交通最適化の精度が向上する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:28:30 GMT)
From Matching to Generation: A Survey on Generative Information Retrieval [21.6] 本稿では、生成情報検索(GenIR)の最新研究動向を体系的にレビューする。
モデルトレーニングと構造、ドキュメント識別子、インクリメンタルラーニングなどについて、GRの進歩を要約します。
我々はまた、GenIRシステムにおける評価、課題、今後の発展についてもレビューする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:38:34 GMT)
Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts [21.4] Affordanceは、エージェントが認識し、その環境から利用する機能的特性を指す。
既存のマルチモーダル・アベイランス手法は有用な情報抽出の限界に直面している。
本稿では,BiT-Align画像深度テキストアプライアンスマッピングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:20:42 GMT)
Hierarchical Causal Transformer with Heterogeneous Information for Expandable Sequential Recommendation [21.4] HeterRecは、2つの新しいコンポーネントを特徴とする革新的なフレームワークだ。
HTFLは、アイテムを多次元トークン集合に分解する洗練されたトークン化機構を開拓した。
HCTアーキテクチャはトークンレベルおよびアイテムレベルの注意機構によるパターン発見をさらに強化する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:37:59 GMT)
BatchGEMBA: Token-Efficient Machine Translation Evaluation with Batched Prompting and Prompt Compression [21.2] BatchGEMBAMQMは、マシン評価のためのGEMBAMQMメトリックとバッチプロンプトを統合するフレームワークである。
提案手法では,複数の翻訳例をひとつのプロンプトに集約し,単一プロンプトと比較してトークン使用量を2~4倍削減する(バッチサイズに依存する)。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:20:52 GMT)
TPIA: Towards Target-specific Prompt Injection Attack against Code-oriented Large Language Models [21.2] 本稿では,標的特異的プロンプトインジェクション攻撃(TPIA)という,コードLLMに対する新たな攻撃パラダイムを提案する。
TPIAは悪意のある命令の情報を含む非機能的摂動を生成し、被害者のコードコンテキストに挿入する。
我々のTPIAは、3つの代表的なオープンソースコードLLMと、2つの主要な商用コードLLM統合アプリケーションにうまく対応できることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:43:47 GMT)
ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points [21.1] ArcProは、ポイントクラウドから構造化された3D抽象化を復元するアーキテクチャプログラム上に構築された学習フレームワークである。
我々は,非構造化点クラウドからアーキテクチャプログラムへのマッピングを確立するために,ポイントプログラムペア上でエンコーダ・デコーダを訓練する。
提案手法による推論は非常に効率的で, 信頼性が高く, 忠実な3次元抽象化を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:10:42 GMT)
Iterative Value Function Optimization for Guided Decoding [21.0] ガイド付き復号法、特に価値誘導法は、ヒューマンフィードバックからの強化学習に代わる費用対効果を提供する。
値関数の精度は、不正確さが最適下決定につながるため、値誘導復号には不可欠である。
既存の手法は、最適な値関数を正確に見積もることに苦慮し、より効果的な制御に繋がる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:49:10 GMT)
ERetinex: Event Camera Meets Retinex Theory for Low-Light Image Enhancement [21.0] 低照度画像強調は、暗黒のシナリオで撮影された露光下画像の復元を目的としている。
イベントカメラの高ダイナミックレンジは、極低照度シナリオにおける視覚知覚にとって重要な要素である。
本稿では,レチネックスをベースとした新しい低照度画像復元フレームワークであるERetinexを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:48:44 GMT)
Enhancing Intent Understanding for Ambiguous prompt: A Human-Machine Co-Adaption Strategy [21.0] ユーザのプロンプトと修正中の画像の相互情報を用いた人間機械協調型適応戦略を提案する。
改良されたモデルにより、複数ラウンドの調整の必要性が軽減されることが判明した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:51:26 GMT)
It Helps to Take a Second Opinion: Teaching Smaller LLMs to Deliberate Mutually via Selective Rationale Optimisation [20.8] COALITIONは、同じSLMの2つの変種間の相互作用を容易にするトレーニング可能なフレームワークである。
エンドタスクに最適化された合理性を生成するように訓練する。
我々のアブレーション研究は、2つの変種間の相互通信が、理論を自己定義するために単一のモデルを使用するよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:17:29 GMT)
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction [20.7] 本稿では、RAGフレームワーク内の情報ゲインのレンズを通して、検索品質を測定する自動評価手法を提案する。
検索の利便性を,検索後の意味的難易度を低減する程度で定量化する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:51:56 GMT)
Smoothing Grounding and Reasoning for MLLM-Powered GUI Agents with Query-Oriented Pivot Tasks [20.3] グラフィカルユーザインタフェース(GUI)エージェントの性能を高めるために、知覚強化事前学習が広く採用されている。
本稿では,GUIグラウンドと推論のブリッジとして機能する,クエリ推論と呼ばれるクエリ指向のピボット手法を提案する。
我々は、クエリ推論が、トレーニングデータの0.1%未満の大規模グラウンド拡張OS-Atlasに匹敵する、あるいはさらに優れたパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:04:26 GMT)
Amortized Probabilistic Conditioning for Optimization, Simulation and Inference [20.3] Amortized Conditioning Engine (ACE)
興味のある潜伏変数を明示的に表現するトランスフォーマーベースのメタラーニングモデル。
ACEは、観測されたデータと解釈可能な潜伏変数の両方、実行時のプリエントを含めることができ、離散的かつ連続的なデータと潜伏変数の予測分布を出力する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:22:16 GMT)
Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance [20.1] 本稿では,RGB-サーマル知覚のための言語指導によるSAM2のポテンシャルを解放する新しいSAM2駆動型ハイブリッドインタラクションパラダイムを提案する。
ShiFNetは、公開ベンチマークで最先端のセグメンテーション性能を達成し、PST900で89.8%、FMBで67.8%に達した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:04:46 GMT)
CGMatch: A Different Perspective of Semi-supervised Learning [20.0] ラベル付きデータを利用したセミ教師付き学習(SSL)が注目されている。
既存の手法はモデルの状態を正確に評価するためにモデルの信頼性にのみ依存している、と我々は主張する。
我々はCGMatchと呼ばれる新しいSSLモデルを提案し、これが初めてCount-Gapと呼ばれる新しいメトリックを組み込んだ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:14:15 GMT)
On the Relationship Between Double Descent of CNNs and Shape/Texture Bias Under Learning Process [19.9] 画像認識のための畳み込みニューラルネットワーク(CNN)における二重降下現象について検討する。
CNNの学習過程における形状/テクスチャーバイアスとエポックな二重降下の関係を見出した。
また, ラベルノイズのない状況においても, 形状・テクスチャバイアスの二重降下・上昇が観察された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:04:50 GMT)
Improving Semantic Understanding in Speech Language Models via Brain-tuning [19.7] 言語モデルは、人間の脳の自然言語に対する反応と驚くほど一致している。
現在のモデルは低レベルの音声機能に大きく依存しており、脳関連セマンティクスが欠如していることを示している。
我々は、fMRI記録による微調整により、脳関連バイアスを直接モデルに誘導することで、この制限に対処する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:26:30 GMT)
Escalating LLM-based Code Translation Benchmarking into the Class-level Era [19.7] クラスレベルのコード翻訳ベンチマークであるClassEval-Tを構築し、クラスレベルのコード翻訳における最近のLLMの性能を広範囲に評価する最初の試みを行う。
完全なコードサンプルと関連するテストスイートを使って、JavaとC++への手動移行を実現するのに、私たちは360人時間を費やしました。
実験結果は,最も広く研究されているメソッドレベルのコード翻訳ベンチマークと比較して,顕著な性能低下を示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:36:51 GMT)
Balancing Efficiency and Effectiveness: An LLM-Infused Approach for Optimized CTR Prediction [19.7] エンド・ツー・エンドの深い意味情報をモデル化する新しいアプローチを導入する。
私たちのフレームワークは効率と効率のバランスをとるために慎重に設計されています。
Meituan sponsored-searchシステムで実施したオンラインA/Bテストでは,コスト・パー・マイル(CPM)とクリック・スルー・レート(CTR)でベースライン・モデルよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:47:27 GMT)
miniCTX: Neural Theorem Proving with (Long-)Contexts [19.5] miniCTXは、トレーニング中に見えない新しい文脈に依存する形式的な数学的定理を証明するモデルの能力をテストする。
miniCTXには、実際のリーンプロジェクトと教科書に由来する定理が含まれており、それぞれに数万のトークンにまたがるコンテキストが関連付けられています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:10:22 GMT)
Tera-MIND: Tera-scale mouse brain simulation via spatial mRNA-guided diffusion [19.4] Tera-MINDは、バイオメディカル研究のために、臓器全体の効率的で生産的なシミュレーションへの有望な道を示す。
テラボキセルスケールで細胞形態を網羅した仮想マウス脳を生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:50:03 GMT)
Key-value memory in the brain [19.3] キーバリューメモリシステムは、記憶(値)と検索(キー)に使用される表現を区別する
これにより、キーバリューメモリシステムは、ストレージの忠実度と検索の識別性を同時に最適化できる。
我々は、キーバリューメモリの計算基盤、現代の機械学習システムにおけるその役割、心理学と神経科学の関連概念、数多くの経験的パズルへの応用、そして生物学的実装の可能性についてレビューする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:10:09 GMT)
Predictive Data Selection: The Data That Predicts Is the Data That Teaches [19.0] 予測データ選択(PreSelect)は,高速テキストベースのスコアラのみのトレーニングとデプロイを必要とする軽量で効率的なデータ選択手法である。
我々は、PreSelectで選択された30Bトークンでトレーニングされたモデルが300Bトークンでトレーニングされたバニラベースラインのパフォーマンスを上回ることを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:15:27 GMT)
Towards Large Language Model Guided Kernel Direct Fuzzing [19.0] 本稿では,LLMと最先端カーネルファザラSyzkallerを統合するフレームワークであるSyzAgentを紹介する。
本稿では,本手法がベンチマークで約67%の症例に対して有効であることを示す予備的な結果を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:03:31 GMT)
B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners [19.0] 自己改善は、パフォーマンスを向上させる主要な方法として現れています。
本稿では,この反復的プロセスにおいて2つの重要な要因をモニタする手法を提案し,提案する。
B-STaRは、反復的な構成を調整し、探索とエクスプロイトのバランスをとる自己学習推論フレームワークである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:29:50 GMT)
X2CT-CLIP: Enable Multi-Abnormality Detection in Computed Tomography from Chest Radiography via Tri-Modal Contrastive Learning [19.0] 我々はCTとCXRのモダリティギャップを埋める3モーダルな知識伝達学習フレームワークであるX2CT-CLIPを提案する。
CXRエンコーダに3次元CTボリュームと関連する放射線学レポートから知識を伝達することにより,CTにおける多重異常分類を可能にするための最初の試みである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:48:09 GMT)
Accelerating Focal Search in Multi-Agent Path Finding with Tighter Lower Bounds [18.4] MAPF (Multi-Agent Path Finding) は、NP困難問題であるコスト関数を最小化しながら、複数のエージェントの衝突のない経路を見つける。
本稿では、まず最大LB値を決定し、次にこのLBで導かれた最優先探索を用いて衝突のない経路を求めることにより、この問題に対処する新しい有界準最適アルゴリズム(DECBS)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:39:00 GMT)
HARP 2.0: Expanding Hosted, Asynchronous, Remote Processing for Deep Learning in the DAW [18.3] HARP 2.0は、ホストされた非同期のリモート処理を通じて、ディープラーニングモデルをデジタルオーディオワークステーション(DAW)に導入する。
任意の変換を実行するために、プラグインインターフェースから任意のGradioエンドポイントを介してオーディオをルーティングすることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:01:40 GMT)
Out-of-Distribution Generalization on Graphs via Progressive Inference [18.2] 本稿では,グラフ因果不変をプログレッシブ推論で学習するモデルGProを提案する。
提案したGProは,最先端手法を平均4.91%上回る性能を示した。
より厳しい分散シフトを持つデータセットでは、パフォーマンスの改善は6.86%に達する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:31:55 GMT)
Efficient Long Sequential Low-rank Adaptive Attention for Click-through rate Prediction [18.1] 本稿では,新しい注意機構を提案する。
計算効率を確保しながら、既存の手法の欠点を克服する。
また、ユニークに設計された損失関数を統合して、注意の非線形性を保っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:12:37 GMT)
Hashtag Re-Appropriation for Audience Control on Recommendation-Driven Social Media Xiaohongshu (rednote) [17.9] Xiaohongshuの女性は、本来の意味とは無関係なポストで使用することで、積極的に適切なハッシュタグを再設定する。
収集した5,800件の投稿に基づいてハッシュタグ再適用の実践を分析し,多様な背景から24名のアクティブユーザをインタビューした。
このプラクティスは、レコメンデーション駆動プラットフォーム上のコンテンツ配信よりもエージェンシーを再利用する方法を強調している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:07:39 GMT)
Self-Evolved Preference Optimization for Enhancing Mathematical Reasoning in Small Language Models [17.7] 我々は、小言語モデル(SLM)における推論を強化する自己進化型データ生成パイプラインSPHEREを紹介する。
SPHEREは、 (i) 自己生成(Self-Generation)、 (ii) 自己補正(Self-Correction)、 (iii) 多様性誘導(diversity induction)、そして、複数の有効な推論軌道を通じて堅牢性を改善する。
本研究では,SPHERE学習モデルがベースバージョンよりも大幅に向上し,特定のベンチマークでGPT-4oにマッチすることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:43:25 GMT)
MIXRTs: Toward Interpretable Multi-Agent Reinforcement Learning via Mixing Recurrent Soft Decision Trees [17.6] ブラックボックスニューラルネットワークを用いたマルチエージェント強化学習(MARL)は、不透明な方法で決定する。
既存の解釈可能なアプローチは通常、弱い表現力と低い性能に悩まされる。
本稿では,ルート・ツー・リーフ・パスによる明示的な決定過程を表現可能な,新しい解釈可能なアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:25:54 GMT)
Beyond Cosine Decay: On the effectiveness of Infinite Learning Rate Schedule for Continual Pre-training [17.4] ラベルのないデータは、人工知能システムのトレーニングの機会と課題の両方を提示します。
自己教師付き学習は、大量のラベルのないデータから有意義な表現を抽出する強力なパラダイムとして現れてきたが、既存の手法は、それまでの知識を忘れずに、実世界のデータストリームの静的で非IID的な性質に適応することに苦慮している。
本研究では,最近提案された無限学習率スケジュールと広く使用されているコサインスケジュールを体系的に比較し,後者がより効果的な方法であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:15:57 GMT)
Metric-Guided Conformal Bounds for Probabilistic Image Reconstruction [17.3] そこで我々は,ブラックボックス画像再構成アルゴリズムのクレームに有効な予測境界を計算するためのフレームワークを提案する。
本稿では,従来の画素ベースのバウンディング手法よりも意味論的解釈の優れたバウンダリを生成することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:07:12 GMT)
Prompt-driven Transferable Adversarial Attack on Person Re-Identification with Attribute-aware Textual Inversion [17.2] 本稿では,歩行者画像の微細な意味的特徴を損なうために,Attribute-aware Prompt Attack (AP-Attack)を導入する。
AP-Attackは最先端の転送可能性を実現し、従来の手法よりも22.9%上回った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:24:30 GMT)
RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks [17.2] Multi-Agent Path Finding (MAPF) は、空中スワムから倉庫の自動化まで、様々な用途に欠かせない。
我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。
CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:35:20 GMT)
QE4PE: Word-level Quality Estimation for Human Post-Editing [17.2] 我々のQE4PE研究は、単語レベルのQEが機械翻訳後編集に与える影響を調査する。
教師付きおよび不確実性に基づく単語レベルQE手法を含む4つの誤りスパンハイライトモードを比較した。
強調表示の有効性を決定する上で,ドメイン,言語,編集者の速度が重要な要因であることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:50:17 GMT)
Diversifying Question Generation over Knowledge Base via External Natural Questions [17.1] 多様なテキストは、様々な表現を通して同じ意味を伝達すべきである。
現在のメトリクスは、生成された質問自体のユニークなn-gramの比率を計算するため、上記の多様性を不適切に評価する。
我々は,各インスタンスを対象としたトップk生成質問の多様性を計測する,新しい多様性評価指標を考案した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:50:39 GMT)
Robust detection of overlapping bioacoustic sound events [17.0] 本稿では,Voxaboxenという名前のオンセットに基づく検出手法を提案する。
時間ウィンドウごとに、Voxaboxenは発声開始時間と発声期間を予測している。
重なり合う発声を検出するための新しいデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:26:03 GMT)
Language Models can Self-Improve at State-Value Estimation for Better Search [16.9] 自己学習型ルックアヘッド(Self-taught lookahead)は、状態遷移ダイナミクスを活用して価値モデルをトレーニングする自己教師型メソッドである。
自己学習のルックアヘッドは,従来のLLM木探索に比べて37倍のコストで性能を20%向上することがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:58:11 GMT)
Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds? [16.7] 混合サンプルデータ拡張(MSDA)は,既存のデータを混合することにより,多様なトレーニングサンプルを生成するために広く研究されている。
近年、多くのMSDA技術がポイントクラウド向けに開発されているが、主にLiDARデータをターゲットにしている。
本稿では,既存のMSDA手法をレーダポイント雲に適用する可能性を検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:02:07 GMT)
Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.5] 本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:07:15 GMT)
Design the Quantum Instruction Set with the Cartan Coordinate Analysis Framework [16.4] より非標準の2ビットゲートがデバイス上で実装され、校正できるようになった。
非標準ゲートに基づく量子命令セットの設計を容易にする分析フレームワークを提案する。
非標準の2ビット命令でユニタリ分解コストを削減できるフレームワークに基づくコンパイラを開発する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:14:31 GMT)
WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation [16.4] 農業コンピュータービジョンの分野では、緑のクルミに関連するデータセットは存在しない。
我々はUAVを用いて、8つのクルミサンプルプロットからリモートセンシングデータを収集した。
このデータセットには合計30,240イメージと706,208インスタンスが含まれている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:00:03 GMT)
PolaFormer: Polarity-aware Linear Attention for Vision Transformers [16.4] 線形アテンションはソフトマックスベースのアテンションに代わる有望な代替手段として浮上している。
同一符号と反対符号の問合せキーの相互作用を明示的にモデル化する極性対応線形アテンション機構を提案する。
単純さと各次元の異なる寄与を認識するために、我々は再スケーリングのために学習可能なパワー関数を用いる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:00:07 GMT)
Examining the Use and Impact of an AI Code Assistant on Developer Productivity and Experience in the Enterprise [16.3] Watsonx Code Assistant (WCA) はIBM内に配置されている。
WCAの開発者エクスペリエンスとその生産性への影響について検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:59:26 GMT)
Language Model Probabilities are Not Calibrated in Numeric Contexts [16.2] 言語モデル(LM)の出力は自然分布を捉えるべきだと我々は主張する。
本研究は、LM出力確率がテキストコンテキスト内の数値情報に校正されるかどうかを特に検証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:14:05 GMT)
CMMLoc: Advancing Text-to-PointCloud Localization with Cauchy-Mixture-Model Based Framework [16.2] ポイントクラウドのローカライゼーションの目的は、大都市環境におけるテキスト記述を用いた3次元位置の同定である。
我々は、不確実性を意識した$textbfC$auchy-$textbfM$ixture-$textbfM$odelである$textbfCMMLocを提案する。
CMMLocは既存の手法より優れており、KITTI360Poseデータセット上で最先端の結果が得られる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:17:17 GMT)
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model [15.9] マルチビュールームレイアウト推定のための新しい手法であるPlain-DUSt3Rを提案する。
Plane-DUSt3RはDUSt3Rフレームワークを室内レイアウトデータセット(Structure3D)に組み込んで構造平面を推定する。
均一かつ同相な結果を生成することにより、Plane-DUSt3Rは、単一の後処理ステップと2D検出結果のみを用いて、部屋レイアウトの推定を可能にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:24:06 GMT)
Revisiting Random Walks for Learning on Graphs [15.6] 我々は、グラフ上のランダムウォークが機械可読レコードを生成する、グラフ上の機械学習のための単純なモデルクラスを再考する。
我々はこれらの機械をランダムウォークニューラルネットワーク(RWNN)と呼んでいる。
確率におけるグラフ関数の普遍近似を可能としながら、RWNNを同型不変として設計できることが示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:33:29 GMT)
Text2Scenario: Text-Driven Scenario Generation for Autonomous Driving Test [15.6] Text2Scenarioは、ユーザー仕様と密接に一致したシミュレーションテストシナリオを自律的に生成するフレームワークである。
結果は、手動のシナリオ構成に必要な労力を伴わない、多様なADスタックの効率的かつ正確な評価である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:20:25 GMT)
AI Governance InternationaL Evaluation Index (AGILE Index) [15.6] 人工知能(AI)技術の急速な進歩は、人間の社会を大きく変えつつある。
2022年以降、生成的AIの広範な展開、特に大きな言語モデルが、AIガバナンスの新たなフェーズとなった。
国際ガバナンスに関するコンセンサスが確立され、活動を続ける中、AIガバナンスのグローバルな評価を行う上での実践的重要性が徐々に明らかになってきている。
AGILE Indexの最初の評価は、AIの開発レベル、AIガバナンス環境、AIガバナンス機器、AIガバナンスの有効性の4つの基本柱の探索から始まった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:10:54 GMT)
OWLViz: An Open-World Benchmark for Visual Question Answering [15.6] 本稿では, Open WorLd VISual Question answering (OWLViz) タスクに対する挑戦的なベンチマークを示す。
我々は、最先端のVLMでさえ、最高のモデルであるGemini 2.0と競合し、26.6%の精度しか達成していないことを示した。
このパフォーマンスギャップは、適切なツールを選択するマルチモーダルシステムの能力に重大な制限が生じる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:37:33 GMT)
Through the Static: Demystifying Malware Visualization via Explainability [15.4] 畳み込みニューラルネットワーク(CNN)の堅牢性と説明可能性について検討する。
本研究は,6つのCNNモデルを複製し,その落とし穴を探索することによって,これらのギャップに対処する。
このアプローチは、データセット全体で2%から8%のF1スコアを大幅に改善する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:38:50 GMT)
Towards Safe AI Clinicians: A Comprehensive Study on Large Language Model Jailbreaking in Healthcare [15.4] 大規模言語モデル(LLM)は、医療アプリケーションでますます活用されている。
本研究は、7個のLDMの脆弱性を3つの高度なブラックボックスジェイルブレイク技術に系統的に評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:20:59 GMT)
Aligned Multi Objective Optimization [15.4] 機械学習の実践では、このような衝突が起こらないシナリオが数多く存在する。
近年のマルチタスク学習,強化学習,LLMsトレーニングの成果から,多種多様な関連タスクが,目的物間のパフォーマンスを同時に向上する可能性が示唆された。
我々は、アラインド多目的最適化フレームワークを導入し、この設定のための新しいアルゴリズムを提案し、それらの優れた性能の理論的保証を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:23:17 GMT)
Shifting Power: Leveraging LLMs to Simulate Human Aversion in ABMs of Bilateral Financial Exchanges, A bond market study [15.4] TRIBEは、大きな言語モデル(LLM)を付加したエージェントベースのモデルで、取引環境における人間のような意思決定をシミュレートする。
人為的な変動性の導入は、パワーダイナミクスをクライアントにシフトさせ、システム全体に不均等に影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:36:54 GMT)
Playing games with Large language models: Randomness and strategy [15.4] 大規模言語モデル(LLM)は、ランダム化と戦略的適応の能力を調査してゲームをすることができる。
我々は, GPT-4o-Mini-2024-08-17に着目し, LLM間の2つのゲーム: Rock Paper Scissors (RPS) と戦略ゲーム (Prisoners Dilemma PD) をテストする。
我々の研究によると、LPMは繰り返しゲームにおいて損失回避戦略を発達させ、PSは安定状態に収束し、PDは迅速な設計に基づく協調と競争の結果の体系的な変化を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:04:48 GMT)
Generalized Gaussian Model for Learned Image Compression [15.3] 学習画像圧縮において、確率モデルは潜伏変数の分布を特徴づける上で重要な役割を果たす。
より柔軟な潜在分布モデリングのために、ガウスモデルを一般化ガウス族に拡張する。
提案した一般化されたガウスモデルと改良されたトレーニング手法を組み合わせることで,様々な学習画像圧縮ネットワーク上でガウスとガウスの混合モデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:19:38 GMT)
A Binary Classification Social Network Dataset for Graph Machine Learning [15.3] グラフ機械学習のためのベンチマーク分類ソーシャルネットワークデータセットはありません。
本稿では、グラフ機械学習アプリケーションを用いてバイナリクラスを予測するために設計された、バイナリ分類ソーシャルネットワークデータセット(textitBiSND)を提案する。
以上の結果から, BiSNDは67.66から70.15までのF1スコアで分類作業に適しており,今後の改善への道筋が示唆された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:40:42 GMT)
Tracking-Aware Deformation Field Estimation for Non-rigid 3D Reconstruction in Robotic Surgeries [15.2] 楽器と部品の相互作用において、組織の変形が最小であっても認識することは、依然として安全である。
本研究では,3次元メッシュと3次元組織変形を同時に再構築する新しいフレームワークであるTracking-Aware deformation Field (TADF)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:33:17 GMT)
Generative Active Adaptation for Drifting and Imbalanced Network Intrusion Detection [15.1] モデルロバスト性を高めつつラベル付けの労力を最小限に抑える生成能動適応フレームワークを提案する。
我々は、シミュレーションIDSデータと実世界のISPデータセットの両方でエンドツーエンドのフレームワークを評価した。
本フレームワークは,ラベリングコストを低減しつつ,レア攻撃検出を効果的に向上させ,実世界の侵入検知のためのスケーラブルで適応的なソリューションである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:49:42 GMT)
Training LLMs with MXFP4 [15.1] サポート対象ハードウェアのFP8よりも2倍高速なMXFP4 GEMMを用いた,最初のニアロスレストレーニングレシピを提示する。
我々のレシピでは、MXFP4のトレーニングFLOPを1/2$で計算し、バックプロパゲーション時に、FP8よりも$1.3times$、BF16より$1.7times$と見積もることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:58:12 GMT)
HyperPose: Hypernetwork-Infused Camera Pose Localization and an Extended Cambridge Landmarks Dataset [15.1] 絶対的なカメラポーズ回帰器にハイパーネットを利用するHyperPoseを提案する。
自然の環境条件、視点、照明に起因する自然のシーンに固有の外観の変化は、トレーニングとテストデータセットの間に大きな領域差を生じさせる。
推論中、ハイパーネットワークは特定の入力画像に基づいて局所化回帰ヘッドの適応重みを動的に計算する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:46:58 GMT)
A Meta-Learning Approach to Bayesian Causal Discovery [15.0] ベイズの後部から得られるような因果構造に対する不確実性は、下流のタスクにしばしば必要である。
近年の研究では、メタラーニングを用いて、最大a-posteriori因果グラフを教師あり学習として推定する問題を考察している。
本稿では,後部から因果構造を抽出し,これらの特徴を符号化するベイズメタ学習モデルを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:12:42 GMT)
ODYSSEE: Oyster Detection Yielded by Sensor Systems on Edge Electronics [14.9] オイスターは沿岸生態系において重要なキーストーンであり、経済的、環境的、文化的な利益をもたらす。
現在の監視戦略は、しばしば破壊的な方法に依存している。
本研究では, 安定拡散を用いた新しいパイプラインを提案し, 現実的な合成データを用いて収集した実データセットを増強する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:36:45 GMT)
ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment [14.7] カメラビューからセグメント化マスクを用いてターゲットオブジェクトを指定可能な,新たなクロスビューゴールアライメントフレームワークを提案する。
ROCKET-2は、人間のカメラビューから直接目標を解釈し、より優れた人間とエージェントのインタラクションを実現することができることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:16:46 GMT)
Semantic Volume: Quantifying and Detecting both External and Internal Uncertainty in LLMs [14.7] 大規模言語モデル (LLM) は、膨大な事実知識を符号化することで、様々なタスクにまたがる顕著な性能を示した。
彼らはまだ幻覚を起こす傾向があり、誤った情報や誤解を招く情報を生み出し、しばしば高い不確実性を伴う。
LLMにおける外部不確実性と内部不確実性の両方を定量化する新しい尺度であるSemantic Volumeを紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:31:25 GMT)
Balanced Mixed-Type Tabular Data Synthesis with Diffusion Models [14.7] 現在の拡散モデルでは、トレーニングデータセットのバイアスを継承し、バイアス付き合成データを生成する傾向がある。
対象ラベルと感度属性のバランスの取れた結合分布を持つ公正な合成データを生成するために、センシティブガイダンスを組み込んだ新しいモデルを提案する。
本手法は, 得られたサンプルの品質を維持しつつ, トレーニングデータのバイアスを効果的に軽減する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:39:04 GMT)
Reliable and Efficient Multi-Agent Coordination via Graph Neural Network Variational Autoencoders [14.5] 自動倉庫などの共有空間における信頼性の高いマルチロボットナビゲーションには,マルチエージェント調整が不可欠である。
我々は,グラフニューラルネットワーク変分オートエンコーダ(GNN-VAE)を用いて,集中最適化よりも高速なスケールでのマルチエージェント協調問題を解くことを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:20:11 GMT)
Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects [14.5] 様々な地形と変形可能な物体で物体を操作することは、ロボット工学における大きな課題である。
我々は、より小さな部分グラフからなる不均一グラフのレンズを通してこの問題をフレーム化する。
本稿では,多種多様な物体の厳密な挿入を含む,新規で挑戦的な強化学習ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:58:53 GMT)
mmDEAR: mmWave Point Cloud Density Enhancement for Accurate Human Body Reconstruction [14.5] そこで本研究では,mmWave点雲を向上し,身体再構成精度を向上する2段階のディープラーニングフレームワークを提案する。
我々のアプローチは最先端の手法よりも優れており、既存のモデルに統合された場合の性能がさらに向上する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:03:53 GMT)
Long distance local local oscillator continuous variable quantum key distribution with digital signal processing [14.3] 連続可変量子鍵分布(CV-QKD)は、標準的な通信技術とうまく組み合わせることができるため、広く応用されている。
信号対雑音比の低い条件下でのデータサンプリングやリカバリなど、実用的な長距離伝送にはまだ課題が残っている。
より正確なサンプリングデータを取得し,より正確な位相補償を実現するために,最小二乗近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:28:43 GMT)
TS-CGNet: Temporal-Spatial Fusion Meets Centerline-Guided Diffusion for BEV Mapping [14.1] 本稿では,中央誘導拡散を伴う時間-空間融合を利用したTS-CGNetを提案する。
このフレームワークは、既存のネットワークに統合してBEVマップを構築するように設計されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:00:30 GMT)
Mix from Failure: Confusion-Pairing Mixup for Long-Tailed Recognition [14.0] ロングテール画像認識は、人工的な制服ではなく、現実世界のクラス分布を考慮した問題である。
本稿では,マイノリティクラスにおけるサンプルの多様性を高めるために,トレーニングデータセットの強化という,異なる観点からの問題に取り組む。
本手法,すなわち Confusion-Pairing Mixup (CP-Mix) は,モデルの混乱分布を推定し,データ不足問題に対処する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:23:34 GMT)
Controllable Motion Generation via Diffusion Modal Coupling [14.0] マルチモーダルな事前分布を利用して拡散モデルの制御性を向上する新しいフレームワークを提案する。
Maze2D環境におけるデータセットとマルチタスク制御を用いた動作予測手法の評価を行った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:22:34 GMT)
To Vaccinate or not to Vaccinate? Analyzing $\mathbb{X}$ Power over the Pandemic [13.9] 新型コロナウイルスのパンデミックを抑えるため、世界は世界的なワクチンのロールアウトの準備を始めている。
その中でも、$mathbbX$(元Twitter)は関連する情報を配布する上で重要な役割を果たしている。
我々の研究は、$mathbbX$データの自然言語処理を用いて感情分析アプローチを適用している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:40:49 GMT)
Decentralized Reinforcement Learning for Multi-Agent Multi-Resource Allocation via Dynamic Cluster Agreements [13.6] 本稿では、分散的に複数のエージェント間で異種資源を割り当てることの課題に対処する。
提案手法であるLGTC-IPPOは,動的クラスタ・コンセンサスを統合することにより,独立近似政策最適化(IPPO)に基づく。
実験結果から,LGTC-IPPOはエージェント数やリソースタイプが増えても,より安定した報酬,コーディネーション,ロバストな性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:23:48 GMT)
DivPrune: Diversity-based Visual Token Pruning for Large Multimodal Models [13.5] LMM(Large Multimodal Models)にビジュアルトークンを追加すると、トークンの総数は数千に増加する。
この問題に対処するため、視覚的トークンの一部を除去するトークンプルーニング手法が提案されている。
提案手法であるDivPruneは冗長性を低減し,選択したトークンの最大多様性を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:33:14 GMT)
Linear Programming Bounds on $k$-Uniform States [13.5] k$一様状態の存在は、いくつかの量子情報タスクに応用されているため、広く研究されている問題である。
我々は、いくつかの改良された非存在結果と$k$-一様状態のバウンダリを確立する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:53:55 GMT)
A Theory of Initialisation's Impact on Specialisation [13.5] 重みの不均衡と高重エントロピーは特殊解を好むことを示す。
次に,非特定ネットワークにおけるタスク類似性と忘れのモノトニックな関係の出現を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:39:30 GMT)
NoPain: No-box Point Cloud Attack via Optimal Transport Singular Boundary [13.5] 敵攻撃は、敵のサンプルに対するディープモデルの脆弱性を悪用する。
既存のポイントクラウド攻撃者は特定のモデルに合わせて調整され、ホワイトボックスまたはブラックボックスの設定の勾配に基づいた摂動を反復的に最適化する。
有望な攻撃性能にもかかわらず、サロゲートモデルの特定のパラメータを過度に適合させるため、転送可能な敵のサンプルを作成するのに苦労することが多い。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:41:01 GMT)
Distilling Large Language Models for Network Active Queue Management [13.5] 既存のディープラーニングベースのキューイングアプローチは、動的ネットワークシナリオに苦労し、高度なエンジニアリング作業を必要とします。
本稿では,AQM-LLM,Large Language Models (LLMs) を提案する。
評価の結果,L4S-LLMは待ち行列の管理を強化し,混雑を防止し,遅延を低減し,ネットワーク性能を向上することがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:15:56 GMT)
S4D-Bio Audio Monitoring of Bone Cement Disintegration in Pulsating Fluid Jet Surgery under Laboratory Conditions [13.4] 本研究は, 骨セメント除去技術として, 脈動噴流を高精度かつ極端に侵入し, 寒冷な技術として検討した。
脈動式流体ジェット装置を用いて, 臨床症状を再現した骨セメントを除去する。
SSM(State Space Model) S4D-Bioによって補完された音声信号の監視は、流体ジェットパラメータの最適化に使用された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:30:36 GMT)
Evaluating Vision-Language Models as Evaluators in Path Planning [13.4] 大規模言語モデル(LLM)は、エンド・ツー・エンド・プランニングにおいて限定的な有効性を持つことが示されている。
本稿では,複雑な経路計画シナリオにおける計画評価器としてVLMを評価する新しいベンチマークであるPathEvalを紹介する。
分析の結果,これらのモデルがベンチマークにおいて重大な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:01:25 GMT)
h-Edit: Effective and Flexible Diffusion-Based Editing via Doob's h-Transform [13.2] h-Editは、テキスト誘導と報酬モデルに基づく編集を同時に行うことができる訓練不要の方法である。
実験の結果,h-Editは編集効率と忠実度において最先端のベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:49:59 GMT)
Diverse Controllable Diffusion Policy with Signal Temporal Logic [13.2] 信号テンポラル論理(STL)と拡散モデルを用いて、制御可能で多様でルール対応のポリシーを学習する。
閉ループ試験では,本手法は最も多様性が高く,規則満足度が高く,衝突率も低い。
ヒトとロボットの遭遇シナリオに関するケーススタディは、我々のアプローチが多様かつ閉軌道の軌道を生成できることを示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:59:00 GMT)
HiGP: A high-performance Python package for Gaussian Process [13.1] HiGPは、効率的なガウスプロセス回帰(GPR)と分類(GPC)のために設計された高性能Pythonパッケージである。
マトリクスベクター (MatVec) とマトリクス (MatMul) の乗算戦略を実装しており、カーネル行列に特化している。
ユーザフレンドリなPythonインターフェースにより、HiGPはPyTorchや他のPythonパッケージとシームレスに統合され、既存の機械学習とデータ分析に簡単に組み込むことができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:17:36 GMT)
Privacy and Accuracy-Aware AI/ML Model Deduplication [13.1] DP学習モデルの非重複化問題を初めて定式化する。
この問題に対処するために,プライバシと精度に配慮した新しい重複機構を提案する。
プライバシ保証を提供しないベースラインと比較して、当社のアプローチでは、個々のモデルに対して最大35タイムの圧縮比を向上しました。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:40:38 GMT)
InstaFace: Identity-Preserving Facial Editing with Single Image Inference [13.1] 本稿では,単一の画像のみを用いてアイデンティティを保存しながら,現実的な画像を生成するための,新しい拡散ベースのフレームワークInstaFaceを紹介する。
InstaFaceは、トレーニング可能なパラメータを追加することなく、複数の3DMMベースの条件を統合することで、3Dの視点を活用する。
本手法は, 身元保存, 光リアリズム, ポーズ, 表情, 照明の効果的な制御において, 最先端のアプローチよりも優れている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:53:45 GMT)
Volume Tells: Dual Cycle-Consistent Diffusion for 3D Fluorescence Microscopy De-noising and Super-Resolution [12.9] 3次元蛍光顕微鏡は、長期の生細胞イメージングを通して基本的な生命過程を理解するのに不可欠である。
空間的に異なるノイズや異方性分解能など、大きな課題に直面している。
3次元セルボリューム内でのボリューム内イメージングを効果的にマイニングするために、二重サイクル一貫性拡散法が提案されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:19:50 GMT)
Game-Theoretic Defenses for Robust Conformal Prediction Against Adversarial Attacks in Medical Imaging [12.6] 敵対的攻撃は、ディープラーニングモデルの信頼性と安全性に重大な脅威をもたらす。
本稿では,共形予測とゲーム理論の防衛戦略を統合する新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:56:21 GMT)
Personalize Your LLM: Fake it then Align it [12.4] CHAMELEONは、自己生成した個人嗜好データと表現編集を利用する、スケーラブルで効率的なパーソナライズ手法である。
実験の結果,CHAMELEONは個人選好に効率よく適応し,指導訓練モデルを改善し,平均40%のパーソナライズベースラインを上回り,2つのパーソナライズベースラインを達成できた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:14:43 GMT)
Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models [12.4] 本研究では,非英語言語における目標課題に対するLLM(Large Language Models)の微調整の難しさに対処するモデルマージ手法を提案する。
我々は、英語の数学の命令データと対象言語の汎用的な命令データに「専門家」を微調整する。
我々は、数学の専門家の上位と下位のトランスフォーマー層を直接言語専門家の層に置き換え、それによって対象言語の数学性能が向上する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:15:16 GMT)
InfoGNN: End-to-end deep learning on mesh via graph neural networks [12.4] 本稿では,グラフニューラルネットワーク(GNN)を中心としたメッシュモデルにおいて,ディープラーニングに関わる課題に対処する,新たなエンドツーエンドフレームワークを提案する。
さらに、InfoGNNはエンドツーエンドのフレームワークであり、ネットワーク設計をより効率的にするために単純化します。
その結果,InfoGNNはメッシュ分類やセグメンテーションタスクにおいて優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:58:30 GMT)
SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation [12.3] 視覚言語モデル(VLM)は自然言語処理や画像理解において顕著な進歩を遂げている。
本稿では,SARChat-2MというSAR画像のための大規模多モード対話データセットを革新的に提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:07:55 GMT)
Weak-to-Strong Generalization Through the Data-Centric Lens [12.2] 重なり密度という弱強一般化を特徴付ける単純なデータ中心機構を提案する。
一般化の利点は重なり合う密度の関数であり、データ選択アルゴリズムに対する後悔の束縛であることを示す理論的結果を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:28:19 GMT)
SAFE: A Sparse Autoencoder-Based Framework for Robust Query Enrichment and Hallucination Mitigation in LLMs [12.1] スパースオートエンコーダ(SAE)を利用した幻覚の検出・緩和手法SAFEを提案する。
実証的な結果は、SAFEがクエリ生成の精度を一貫して改善し、すべてのデータセットで幻覚を緩和し、最大29.45%の精度向上を実現していることを示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:19:52 GMT)
Semantic Prior Distillation with Vision Foundation Model for Enhanced Rapid Bone Scintigraphy Image Restoration [12.1] 本稿では,SAMをベースとしたセマンティック先行手法の医用画像復元への応用について述べる。
提案手法は,2つのカスケードネットワーク,$fIR1$と$fIR2$から構成される。
我々は,小児における骨シンチグラフィ画像の高速復元を目的とした最初のデータセットであるRBSと呼ばれる新しい高速骨シンチグラフィデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:23:22 GMT)
PanguIR Technical Report for NTCIR-18 AEOLLM Task [12.1] 大規模言語モデル(LLM)はますます重要で、評価が難しい。
手作業の評価は包括的ではあるが、コストが高くリソース集約的であることが多い。
自動評価はスケーラビリティを提供するが、評価基準の制限によって制約される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:40:02 GMT)
Discrete Differential Evolution Particle Swarm Optimization Algorithm for Energy Saving Flexible Job Shop Scheduling Problem Considering Machine Multi States [12.0] 省エネスケジューリングにおいて、機械状態スイッチングは期待される目標を達成するための重要なポイントである。
本研究は、新しい多状態省エネフレキシブルジョブスケジューリング問題(EFJSP-M)を提案する。
EFJSP-M に対処するため,離散微分進化粒子群最適化アルゴリズム (D-DEPSO) を設計した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:40:24 GMT)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics [11.9] 本稿では,LAMBDA ベンチマーク-Long-Horizon Actions for Mobile-Manipulation Benchmarking of Directed Activityを紹介する。
このベンチマークは、言語条件付き、長距離、マルチルーム、マルチフロア、ピック・アンド・プレイスタスクにおけるモデルのデータの効率を評価する。
私たちのベンチマークには、シミュレーションと現実世界の設定において現実性と多様性を提供する、571人の人間によるデモが含まれています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:33:11 GMT)
Calibrating LLM Confidence with Semantic Steering: A Multi-Prompt Aggregation Framework [11.9] 大規模言語モデル(LLM)は、しばしば不一致の信頼スコアを示し、予測の信頼性を過大評価する。
本稿では,信頼度評価,信頼度評価,回答選択という3つの要素を含む新しいフレームワークを提案する。
提案手法を7つのベンチマークで評価し,信頼性校正と故障検出のタスクにおいて,キャリブレーション指標の基準線を一貫して上回る結果を得た。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:40:49 GMT)
Boltzmann Attention Sampling for Image Analysis with Small Objects [11.8] 肺結節や腫瘍病変などの小さな物体は、画像の0.1%未満を占める。
既存のスパースアテンション機構は、小さく、可変で、不確実な物体の位置を検出するのに不適な厳密な階層構造に依存している。
本稿では,これらの課題に動的に注意を払って対処するために設計された,新しいトランスフォーマーベースのアーキテクチャであるBoltzFormerを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:12:58 GMT)
Generative Model-Assisted Demosaicing for Cross-multispectral Cameras [11.8] スペクトル分解は、スペクトルフィルタアレイ(SFA)ベースのマルチスペクトルイメージングプロセスにおいて重要な部分である。
シミュレーションデータを用いて教師付きで訓練されたエンドツーエンドネットワークは、実際のデータでは性能が良くないことが多い。
本稿では,自己教師付き生成モデルを用いたハイブリッド型教師付き学習手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:27:05 GMT)
LoRA-Null: Low-Rank Adaptation via Null Space for Large Language Models [11.8] Low-Rank Adaptation (LoRA) はLarge Language Models (LLM) のパラメータ効率の高い微調整手法である
本稿では,LoRA-Null,すなわちnull空間を経由した低ランク適応を提案し,事前学習した知識活性化のnull空間からアダプタを構築する。
また,LoRA-Nullは,優れた微調整性能を維持しつつ,事前学習した世界の知識を効果的に保存することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:21:08 GMT)
An Efficient and Precise Training Data Construction Framework for Process-supervised Reward Model in Mathematical Reasoning [11.7] 本稿では,EpicPRMというフレームワークを紹介し,その定量化貢献に基づいて各中間推論ステップに注釈を付ける。
我々は50kの注釈付き中間ステップからなるEpic50kという高品質なプロセス監視トレーニングデータセットを効率的に構築する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:18:46 GMT)
HarmonySet: A Comprehensive Dataset for Understanding Video-Music Semantic Alignment and Temporal Synchronization [11.7] 本稿では,映像音楽理解の促進を目的とした包括的データセットであるHarmonySetを紹介する。
ハーモニー・セットは48,328種類のビデオ・ミュージック・ペアで構成され、リズム同期、感情的アライメント、主題的コヒーレンス、文化的関連性に関する詳細な情報と共に注釈付けされている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:31:11 GMT)
Lie Algebra Canonicalization: Equivariant Neural Operators under arbitrary Lie Groups [11.6] 我々は、対称性群の無限小生成子の作用のみを利用する新しいアプローチであるLie aLgebrA Canonicalization (LieLAC)を提案する。
標準化のフレームワーク内で運用されているため、LieLACは制約のない事前訓練されたモデルと容易に統合できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:17 GMT)
Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff [11.6] Fuzzy Speculative Decoding (FSD)は、投機的復号(SD)を一般化する復号アルゴリズムである。
本手法は,ベンチマーク精度を2%程度低下させるだけで,SDよりも高速に5トークン/秒以上の大幅なランタイム改善を実現することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:30:35 GMT)
Efficient and Optimal No-Regret Caching under Partial Observation [11.5] 我々は、過去の要求のごく一部しか観測されない、より制限的な環境でキャッシュ問題を調査する。
本稿では,従来のオンライン学習アルゴリズムであるFollow-the-Perturbed-Leaderに基づいて,サブ線形後悔を伴うランダム化キャッシュポリシーを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:21:33 GMT)
AnyTouch: Learning Unified Static-Dynamic Representation across Multiple Visuo-tactile Sensors [11.5] Visuo-Tactileセンサーは、人間の触覚をエミュレートし、ロボットが物体を理解して操作できるようにする。
そこで本研究では,4種類のビジュオ触覚センサを用いたマルチモーダル触覚マルチセンサデータセットであるTacQuadを紹介する。
マルチレベル構造を持つ静的動的マルチセンサ表現学習フレームワークであるAnyTouchを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:57:23 GMT)
Koopman-Based Generalization of Deep Reinforcement Learning With Application to Wireless Communications [11.5] 深層強化学習(Deep Reinforcement Learning, DRL)は、無線通信を含む様々な科学・工学分野の進歩を推進する機械学習技術である。
DRLでは、トレーニングデータは逐次的であり、独立ではなく、同一に分散している(つまり、従来の情報理論の手法は一般化可能性解析には適さない)。
本稿では,DRLの一般化性を評価するための新しい解析手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:36:36 GMT)
MindSimulator: Exploring Brain Concept Localization via Synthetic FMRI [11.5] ヒト大脳皮質における概念選択領域は、特定の概念に関連する特定の視覚刺激に応答して顕著な活性化を示す。
従来の実験駆動型アプローチは手作業による視覚刺激収集とそれに対応する脳活動記録に基づいている。
広範囲な脳活動記録を合成することにより、様々な概念選択領域を統計的に局在させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:20:42 GMT)
Spike-and-Slab Posterior Sampling in High Dimensions [11.5] スパイク・アンド・スラブ先行法[MB88]による後方サンプリングは,ベイズ・スパース線形回帰の理論的金標準法であると考えられる。
我々は,任意のSNRに適用可能なスパイク・アンド・スラブ後続サンプリングのための最初の証明可能なアルゴリズムを提示し,問題次元における測定カウントサブを使用する。
ラプラス拡散密度を用いたスパイク・アンド・スラブ後方サンプリングに拡張し、$sigma = O(frac1k)$が有界である場合にも同様の保証を達成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:16:07 GMT)
Tabby: Tabular Data Synthesis with Language Models [11.3] Tabbyは、標準的なTransformer言語モデルアーキテクチャに対する、シンプルだが強力なトレーニング後修正である。
Tabbyは、実際のデータに近いか等しいデータ品質が得られることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:32:15 GMT)
AVD2: Accident Video Diffusion for Accident Video Description [11.2] AVD2(Accident Video Diffusion for Accident Video Description)は,事故現場の理解を高める新しいフレームワークである。
このフレームワークは、自然言語の詳細な記述や推論と一致した事故ビデオを生成し、その結果、EMM-AUデータセットが生成される。
EMM-AUデータセットの統合は、自動メトリクスと人的評価の両方で最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:28:47 GMT)
The Shift from Writing to Pruning Software: A Bonsai-Inspired IDE for Reshaping AI Generated Code [11.1] AIによるコーディングアシスタントの台頭は、ソフトウェアの構築方法の根本的な変化を示している。
AIコーディングアシスタントは既存の統合開発環境に統合されているが、その潜在能力の大部分は未完成である。
そこで我々は,従来のファイル構造を使わずに,AIが真に制約のない形式で生成できるIDEの新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:57:26 GMT)
Open Source at a Crossroads: The Future of Licensing Driven by Monetization [11.1] オープンソースソフトウェアライセンス(OSSライセンス)は、ロイヤリティや手数料を必要とせずに、様々なソースからの集約プログラムの一部としてソフトウェアを販売または配布することを保証する。
オープンソースはクロスロードであり、ライセンスモデルを再定義し、コミュニティと重要なソフトウェアをサポートする必要性が高まっています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:44:01 GMT)
The Future Outcome Reasoning and Confidence Assessment Benchmark [11.1] FOReCAstはモデルを予測し、その信頼性を評価するためのベンチマークである。
ブール問題、時間枠予測、量推定を含む様々な予測シナリオにまたがる。
実世界のアプリケーションに対して、予測精度と信頼性校正の両方を包括的に評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:59:53 GMT)
Interpretable Few-Shot Retinal Disease Diagnosis with Concept-Guided Prompting of Vision-Language Models [11.1] 眼底画像から網膜疾患の解釈可能な概念を抽出するための2つの重要な戦略を実装した。
本手法は網膜疾患の分類を改善し,少ないショットとゼロショットの検出を増強する。
本手法は,実際の臨床応用に向けて,解釈可能かつ効率的な網膜疾患認識に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:03:42 GMT)
2DGS-Avatar: Animatable High-fidelity Clothed Avatar via 2D Gaussian Splatting [10.9] 本研究では,2DGS-Avatarを提案する。
提案手法は,ポーズによって駆動され,リアルタイムでレンダリングされるアバターを生成する。
3DGSベースの手法と比較して、我々の2DGS-Avatarは、高速なトレーニングとレンダリングの利点を保ちつつ、詳細な、ダイナミック、フォトリアリスティックな外観を捉えている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:57:24 GMT)
DarkDeblur: Learning single-shot image deblurring in low-light condition [10.8] 本研究は,学習ベースアプローチによる低照度画像の難読化の限界に対処し,DarkDeNetという新しいディープネットワークを提案する。
The proposed DarkDe-Net includes a dense-attention block and a contextual gating mechanism in a feature pyramid structure to leverage content awareness。
提案したモデルの実用性は、多数のコンピュータビジョンアプリケーションに融合することで検証されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:04:50 GMT)
Quantum Charging Advantage from Multipartite Entanglement [10.8] 我々は、全電荷スキームの充電速度の普遍的境界を予想し、最大絡み込み深さで決定する。
真の量子帯電の利点を、絡み合う充電率と最大到達可能な非帯電率との比として定義することにより、帯電率が真の量子帯電の堅牢な指標となることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:35:09 GMT)
FlexInfer: Breaking Memory Constraint via Flexible and Efficient Offloading for On-Device LLM Inference [10.8] 大規模言語モデル(LLM)は、高いメモリ要求のためにデバイス上での推論の課題に直面します。
デバイス上での推論に最適化されたオフロードフレームワークであるFlexInferを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:08:03 GMT)
Towards Effective and Efficient Context-aware Nucleus Detection in Histopathology Whole Slide Images [10.6] 本稿では,効率的なコンテキスト認識型核検出アルゴリズムを提案する。
歴史的に訪れたスライディングウインドウの棚外の特徴から文脈的手がかりを収集する。
低倍率で大きなFoV領域と比較して、スライドウィンドウパッチは高い倍率を有し、より微細な組織の詳細を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:01:53 GMT)
Generative Artificial Intelligence-Guided User Studies: An Application for Air Taxi Services [10.6] 本研究は、ジェネレーティブ人工知能(GenAI)を用いて、ユーザエクスペリエンス(UX)のためのGenAI生成シナリオを作成する。
主な貢献は、Large Language Models (LLMs) とAIイメージとビデオジェネレータを使用したAir Taxi Journey (ATJ) の設計であった。
LLMは、参加者のエアタクシーへの意欲を著しく向上させる環境を識別し、提案する能力を示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:52:08 GMT)
Attention Bootstrapping for Multi-Modal Test-Time Adaptation [10.5] テストタイム適応は、未ラベルのテストデータのみを使用して、テスト時の潜在的分散シフトに十分に訓練されたモデルを適用することを目的としている。
本稿では,主エントロピー最小化法(ABPEM)を用いたアテンションブートストラップ法を提案することによって,マルチモーダルテスト時間適応の問題に取り組む。
この注意ギャップを緩和し、より良いモダリティ融合を促進するために、自己注意の指導による横断的注意を促す注意ブートストラップを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:53:53 GMT)
Clustered KL-barycenter design for policy evaluation [10.5] 本稿では,多目的政策の重要サンプリング評価のために,サンプル効率のよい行動ポリシーを設計する方法について検討する。
まず、ターゲットポリシーのKL-barycenterとして定義された単一の行動ポリシーを分析する。
目的とするポリシを小さなKL発散したグループにクラスタ化して,各クラスタに独自のKL-barycenterを動作ポリシとして割り当てることで,このアプローチを洗練する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:55:55 GMT)
Mantra: Rewriting Quantum Programs to Minimize Trap-Movements for Zoned Rydberg Atom Arrays [10.5] マントラは1量子ビットゲートと2量子ビットゲートのインターリーブを減らすために量子プログラムを書き換える。
マントラはゾーン間移動を68%減らし、物理ゲート数を35%減らし、回路の忠実度を17%改善した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:40:36 GMT)
InfiniSST: Simultaneous Translation of Unbounded Speech with Large Language Model [10.4] InfiniSSTは、マルチターン対話タスクとしてSSTを定式化する新しいアプローチである。
我々は,MST-Cから翻訳トラジェクトリとロバストセグメントを構築し,トレーニング中に多遅延拡張を行った。
MuST-C En-Es、En-De、En-Zhの実験では、InfiniSSTは計算に意識したレイテンシを0.5秒から1秒に短縮することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:51:29 GMT)
PAD: Personalized Alignment of LLMs at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:51:14 GMT)
Deal: Distributed End-to-End GNN Inference for All Nodes [10.3] Dealは、マルチビリオンエッジを持つグラフのすべてのノードに対するエンドツーエンドの推論専用の分散GNN推論システムである。
Dealは、実世界のベンチマークデータセットのエンドツーエンドの推論時間を最大7.70倍削減する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:35:41 GMT)
Learning Structured Compressed Sensing with Automatic Resource Allocation [10.3] 多次元データ取得には時間を要することが多く、ハードウェアやソフトウェアにとって大きな課題となる。
情報理論に基づく教師なし学習戦略を用いたSCOSARA(Structured Compressed Sensing with Automatic Resource Allocation)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:36:43 GMT)
Multi-agent Auto-Bidding with Latent Graph Diffusion Models [10.2] 本稿では,グラフ表現を利用して大規模オークション環境をモデル化する拡散型自動入札フレームワークを提案する。
実世界のオークション環境と合成オークション環境の両方における実証的な評価は、複数の一般的な指標におけるオートバイディング性能の大幅な改善と、オークション結果の予測精度を示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:07:24 GMT)
NET-SA: An Efficient Secure Aggregation Architecture Based on In-Network Computing [10.2] NET-SAは機械学習のための効率的なセキュアアグリゲーションアーキテクチャである。
シードアグリーメントとシークレット共有のコミュニケーション集約フェーズを排除し、通信オーバーヘッドを低減する。
実行時の最大77倍と12倍の強化を実現し、最先端のメソッドと比較してクライアント間の通信コストを2倍削減する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:52:17 GMT)
GenConViT: Deepfake Video Detection Using Generative Convolutional Vision Transformer [10.1] 本稿では,深度映像検出のためのGenConViT(Generative Convolutional Vision Transformer)を提案する。
我々のモデルは特徴抽出のためにConvationalNeXtとSwin Transformerモデルを組み合わせている。
GenConViTは、視覚的アーティファクトと潜在データ分布から学習することにより、幅広いディープフェイクビデオを検出するパフォーマンスを向上させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:43:51 GMT)
Stochastic Polyak Step-sizes and Momentum: Convergence Guarantees and Practical Performance [10.1] 本稿では,重ボール法の更新ルールに適した新しいポリアク型変種を提案し,検討する。
MomSPS$_max$ に対して、凸および滑らかな問題に対する解の近傍に SHB の保証を提供する。
他の2つの変種である MomDecSPS と MomAdaSPS は、SHB の最初の適応的なステップサイズであり、正確な最小値への収束を保証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:36:14 GMT)
Sharpness-Aware Minimization: General Analysis and Improved Rates [10.1] Sharpness-Aware Minimization (SAM) は機械学習モデルの一般化を改善する強力な方法として登場した。
本稿では,SAMとその非正規化変動規則(USAM)を1回の更新で解析する。
我々は、より自然に緩和された仮定の下で、新しいサイズの結果を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:04:06 GMT)
SAGE: Steering and Refining Dialog Generation with State-Action Augmentation [10.0] 本稿では,潜時変数を用いた対話生成における長時間水平動作を制御するSAGEという新しい手法を提案する。
我々の手法の中核は、標準言語モデルの微調整を強化したState-Action Chain (SAC) である。
このアプローチでトレーニングされたモデルでは、感情的インテリジェンスメトリクスのパフォーマンスが向上していることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:45:24 GMT)
Abstract Rendering: Computing All that is Seen in Gaussian Splat Scenes [9.9] 本稿では、連続的に変化するカメラ位置からシーンをレンダリングすることで、画像の集合を計算する抽象レンダリングを紹介する。
この能力は、視覚ベースの自律システムやその他の安全クリティカルな応用の正式な検証に特に有用である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:08:00 GMT)
cryoSPHERE: Single-particle heterogeneous reconstruction from cryo EM [9.9] 単一粒子低温電子顕微鏡(cryo-EM)は、大きなタンパク質複合体の構造を決定する強力なツールである。
本稿では,タンパク質構造を入力として使用する深層学習手法であるCryoSPHEREを紹介する。
実験で発生する高レベルのノイズに対して,CryoSPHEREは非常に耐性があることが示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:16:45 GMT)
Unsupervised Waste Classification By Dual-Encoder Contrastive Learning and Multi-Clustering Voting (DECMCV) [9.8] 本研究では,マルチクラスタリング投票(DECMCV)を用いた新しい教師なし手法であるデュアルエンコーダコントラスト学習を提案する。
実際の4,169枚の廃画像のデータセットでは、数千の正確なラベル付けを行うには50個のラベル付きサンプルが必要であり、教師付きモデルと比較して分類精度は29.85%向上した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:31:01 GMT)
Bootstrap-GS: Self-Supervised Augmentation for High-Fidelity Gaussian Splatting [9.8] 3D-GSは、トレーニング中に遭遇したものとは大きく異なる、新しいビューを生成する際に制限に直面します。
この問題に対処するためのブートストラップフレームワークを導入します。
提案手法は,限られたトレーニングセットと整合した新しい視点から,擬似地下真実を合成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:06:32 GMT)
A Novel Streamline-based diffusion MRI Tractography Registration Method with Probabilistic Keypoint Detection [9.7] 本稿では,ディープラーニングを用いた新しい教師なし手法を提案する。
全体的な考え方は、トラクトグラフィーデータセットの空間的アライメントのために、被験者間で対応するキーポイントペアを特定することである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:47:10 GMT)
SSNet: Saliency Prior and State Space Model-based Network for Salient Object Detection in RGB-D Images [9.7] RGB-D SODタスクのためのSSM(Salliency-prior and State Space Model)ベースのネットワークであるSSNetを提案する。
既存の畳み込みやトランスフォーマーベースのアプローチとは異なり、SSNetはSSMベースのマルチモードマルチスケールデコーダモジュールを導入している。
また,3つのサリエンシ事前を深い特徴と統合して特徴表現を洗練させるサリエンシ拡張モジュール (SEM) も導入した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:38:36 GMT)
Revealing the Pragmatic Dilemma for Moral Reasoning Acquisition in Language Models [9.7] 大規模言語モデル(LLM)は、道徳的認識を必要とするタスクで満足に機能しないことが多い。
現在の学習パラダイムは、LLMが十分な道徳的推論能力を得ることができるか?
性能改善は意味レベルの課題に類似したメカニズムを踏襲し,言論における潜在道徳の実践的性質の影響を受け続けることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:23:23 GMT)
CrystalFramer: Rethinking the Role of Frames for SE(3)-Invariant Crystal Structure Modeling [9.6] 物質情報学における様々な応用にグラフニューラルネットワークを用いた結晶構造モデリングが不可欠である。
本研究では,各原子に局所環境の動的ビューを提供する動的フレームの概念を提案する。
近年の変圧器を用いた結晶エンコーダにおけるアテンション機構を応用して,この概念を実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:40:49 GMT)
Unified Arbitrary-Time Video Frame Interpolation and Prediction [9.6] ビデオフレームと予測は、それぞれ既存のフレームとそれに続くフレームを合成することを目的としている。
任意の時間予測は広く研究されているが、任意の時間予測の値は概ね見過ごされている。
任意時間ビデオ補間と予測を統一したuniVIPを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:17:17 GMT)
OkraLong: A Flexible Retrieval-Augmented Framework for Long-Text Query Processing [9.6] LLM(Large Language Models)は、長文クエリを効率的に処理する際の課題である。
我々は,処理ワークフロー全体を柔軟に最適化する新しいフレームワークであるOkraLongを提案する。
OkraLongは回答の正確性を高めるだけでなく、さまざまなデータセットで費用対効果を達成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:21:47 GMT)
Frequency Shift Caused by Nonuniform Field and Boundary Relaxation in Magnetic Resonance and Comagnetometers [9.6] 任意の空間分布を持つ境界緩和と非一様磁場による周波数シフトについて検討する。
この周波数シフトはスピン種に依存しており、NMRジャイロスコープと磁気磁気センサの系統的な誤差を示唆している。
この知見は、最近のNMRジャイロスコープとコマグネトメーターを用いた新しい物理探査実験における説明できないシフトを理解するのに役立つ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:12:28 GMT)
Weighted Aggregation of Conformity Scores for Classification [9.6] コンフォーマル予測は、有効なカバレッジ保証を備えた予測セットを構築するための強力なフレームワークである。
本稿では,共形予測器の性能向上のために,複数のスコア関数を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:23:38 GMT)
Volume-Sorted Prediction Set: Efficient Conformal Prediction for Multi-Target Regression [9.6] マルチターゲット回帰における不確実性のための新しい手法であるVolume-Sorted Prediction Set (VSPS)を紹介する。
複雑な高次元設定における情報予測モデルを維持しながら,VSPSがより小さく,より多くの領域を生成することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:34:59 GMT)
HaLoRA: Hardware-aware Low-Rank Adaptation for Large Language Models Based on Hybrid Compute-in-Memory Architecture [9.5] 低ランク適応(LoRA)は、下流タスクに大規模言語モデル(LLM)を適用するためのパラメータ効率の高い微調整法である。
RRAM固有のノイズによる性能劣化に対処するため,ハードウェア対応低ランク適応法(HaLoRA)を考案した。
LLaMA 3.2 1Bと3Bを微調整した実験では、HaLoRAが複数の推論タスクにまたがって有効であることを示し、平均スコアを最大22.7改善した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:42:56 GMT)
ExpertGenQA: Open-ended QA generation in Specialized Domains [9.4] ExpertGenQAは、いくつかのショット学習と構造化トピックとスタイル分類を組み合わせて、包括的なドメイン固有のQAペアを生成するプロトコルである。
ExpertGenQAは,9,4.4%のトピックカバレッジを維持しつつ,ベースライン数ショットアプローチの効率を2倍に向上することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:09:48 GMT)
RedChronos: A Large Language Model-Based Log Analysis System for Insider Threat Detection in Enterprises [9.3] 内部脅威検出は、組織や企業内のセキュリティ脅威に対処することを目的としている。
RedChronosは大規模言語モデルに基づくログ分析システムである。
RedChronosは、精度、精度、検出率の点で、既存のアプローチより優れているか、あるいは一致している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:18:40 GMT)
Generative assimilation and prediction for weather and climate [9.3] GAP(Generative Assimilation and Prediction)を紹介する。
GAPは気候と気候の同化と予測のための統合された枠組みである。
データ同化、シームレスな予測、気候シミュレーションなど、幅広い気候関連タスクに優れています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:36:29 GMT)
Unlocking a New Rust Programming Experience: Fast and Slow Thinking with LLMs to Conquer Undefined Behaviors [9.3] Rustは安全性を低下させるUndefined Behaviors (UBs)を導入している。
これらのUBをなくすには、Rustの安全ルールと強力な型付けを深く理解する必要がある。
RustプロジェクトにおけるUBを自動的にかつ柔軟に最小化するRustBrainというフレームワークを紹介します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:48:45 GMT)
A Transformer Model for Predicting Chemical Reaction Products from Generic Templates [9.2] この研究は20の一般的な反応テンプレートを含むデータセットであるBroad Reaction Set (BRS)を提案する。
化学に適したT5モデルが導入され、剛性テンプレートとテンプレートフリーメソッドのバランスがとれる。
ProPreT5は、正確で有効で現実的な反応生成物を生成する能力を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:18:32 GMT)
Exploring Causality for HRI: A Case Study on Robotic Mental Well-being Coaching [9.1] 本研究は, 相互作用における順応性の効果について, より深い知見を得ることを目的としている。
本研究は,マクロレベルの因果解析とマイクロレベルの因果解析を併用することにより,相互作用中の順応性によって幸福感が向上する可能性について,より深い知見を得ることを目的とする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:56:47 GMT)
Learning Mixtures of Gaussians Using Diffusion Models [9.1] 我々は、$k$ Gaussiansの混合をTVエラー$varepsilon$、quasi-polynomial$O(ntextpoly,logleft(fracn+kvarepsilonright)$で学習するための新しいアルゴリズムを提供する。
結果は、混合分布が一定半径の$k$球の和で支持されるガウスの連続混合に拡張される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:36:34 GMT)
SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models [9.1] Sigmoid-Enhanced CUR Decomposition LoRA(セキュラ:シグモイド強化CUR分解ロラ)を提案する。
本手法では,パラメータ保持と微調整効率を向上させる新しい正規化手法であるSigmoid-based Magnitude Norm (S-MagNorm)を導入する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:59:18 GMT)
TReND: Transformer derived features and Regularized NMF for neonatal functional network Delineation [9.0] 本稿では,新しい自己教師型トランス-オートエンコーダフレームワークであるTReNDを提案する。
TReNDは、voxel-wise rs-fMRIデータでエンコーダをアンタングルする。
我々は3つの異なるrs-fMRIデータセット上でTReNDフレームワークを広範囲に検証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:57:59 GMT)
Cross-Subject Depression Level Classification Using EEG Signals with a Sample Confidence Method [8.8] GCNモデルに基づく抑うつレベル分類
モデル学習パターンに触発されて、2つの新しいモジュールを導入しました。
DepL-GCNは81.13%、81.36%の精度を達成した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:16:11 GMT)
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts [8.8] Mixture-of-experts (MoE) は、大規模な言語モデルを1兆以上のパラメータに拡張するために広く利用されている。
既存の方法は、オーバーラップする計算でMoE層内の通信をパイプライン化することを提案している。
細粒度通信-計算オーバラップを最適化したMOEシステムであるCOMETを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:54:37 GMT)
AIR-HLoc: Adaptive Retrieved Images Selection for Efficient Visual Localisation [8.8] 最先端の階層的ローカライゼーションパイプライン(HLOC)は2D-3D対応を確立するために画像検索(IR)を使用している。
本稿では,グローバルディスクリプタとローカルディスクリプタの関係について検討する。
本稿では,クエリのグローバルな記述子とデータベース内の記述子との類似性に基づいて$k$を調整する適応型戦略を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:31:55 GMT)
Optimization, Isoperimetric Inequalities, and Sampling via Lyapunov Potentials [8.7] すべての初期化からグラディエントフローを用いた任意のFの最適性は、低温におけるギブス測度 mu_beta = e-beta F/Z のポインカーの不等式を意味することを示す。
特に、mu_beta が Poincar'e の不等式を β >= Omega(d) に対して定数 OC'+1/beta で満たすことを確立し、ここで C' は Mu_beta の Poincar'e 定数であり、F の大域最小化の近傍に制限される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:48:15 GMT)
Exploring Simple Siamese Network for High-Resolution Video Quality Assessment [8.6] 本研究は,高解像度ビデオ品質評価(VQA)のためのシンプルだが効果的なSiamVQAを紹介する。
SiamVQAは、技術ブランチと美学ブランチの重みを共有し、技術ブランチのセマンティックな認識能力を高める。
SiamVQAは、高解像度のベンチマークで最先端の精度を達成し、低解像度のベンチマークで競合する結果を得る。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:40:16 GMT)
P2DFlow: A Protein Ensemble Generative Model with SE(3) Flow Matching [8.6] P2DFlowはSE(3)フローマッチングに基づく生成モデルであり、タンパク質の構造的アンサンブルを予測する。
ATLASのMDデータセットでトレーニングと評価を行うと、P2DFlowは他のベースラインモデルよりも優れている。
タンパク質分子シミュレーションの潜在的プロキシ剤として、P2DFlowによって生成された高品質なアンサンブルは、様々なシナリオでタンパク質の機能を理解するのに大いに役立つ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:38:11 GMT)
PersonaX: A Recommendation Agent Oriented User Modeling Framework for Long Behavior Sequence [8.6] 本稿では,ユーザモデリングのためのエージェント非依存UMフレームワークとしてペルソナXを提案する。
PersonaXは、さまざまなユーザの興味を捉えるために、オフラインでコンパクトなSBSセグメントを抽出する。
高品質なプロトタイプユーザプロファイリングにおける PersonaX の有効性と汎用性を検証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:41:40 GMT)
Leveraging Randomness in Model and Data Partitioning for Privacy Amplification [8.5] トレーニングプロセスにおける固有のランダム性は、プライバシーの増幅にどのように活用できるかを考察する。
この中には、(1)データパーティショニング、(2)サンプルがトレーニングイテレーションのサブセットのみに参加し、(2)モデルパーティショニング、(2)サンプルがモデルのパラメータのサブセットだけを更新する。
以上の結果から、複雑な方法でデータと相互作用する訓練プロセスのランダム性は、重要なプライバシーの増幅のために体系的に活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:49:59 GMT)
Lightweight yet Efficient: An External Attentive Graph Convolutional Network with Positional Prompts for Sequential Recommendation [8.5] 本稿では,逐次的推薦,すなわちEA-GPSのための位置推定プロンプトを備えた外部注意グラフ畳み込みネットワークを提案する。
提案したEA-GPSは最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:18:36 GMT)
Deep Learning-Enhanced Visual Monitoring in Hazardous Underwater Environments with a Swarm of Micro-Robots [8.4] 水中貯蔵施設のような極端な環境の監視と探索は、コストが高く、労働集約的で危険である。
本稿では,複数時間深層学習ネットワークを統合し,協調予測と画像再構成を行う新しい手法を提案する。
その結果,座標予測精度と画像の集合性が非常に高く,本手法の現実的適用性を示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:19:06 GMT)
LADM: Long-context Training Data Selection with Attention-based Dependency Measurement for LLMs [8.3] LLM(Large Language Models)の分野では、長いコンテキストモデリングがますます注目を集めている。
意識に基づく依存度測定(LADM)を用いたLong-contextデータ選択フレームワークを提案する。
LADMは大規模マルチドメイン事前学習コーパスから高品質の長文データを効率的に識別することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:10:13 GMT)
Leveraging Large Language Models for Enhanced Digital Twin Modeling: Trends, Methods, and Challenges [8.2] ディジタルツインは、継続的監視、シミュレーション、予測、最適化を可能にする。
近年の通信, コンピューティング, 制御技術の進歩は, デジタル双生児の発展と普及を加速させている。
大きな言語モデル(LLM)の台頭は、これらの課題に対処するための新たな道を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:13:31 GMT)
Accurate and Scalable Stochastic Gaussian Process Regression via Learnable Coreset-based Variational Inference [8.1] 本稿では,ガウス過程(mathcalGP$)回帰に対する新しい帰納的変分推定法を提案する。
従来の推論用自由形式変動型族とは異なり、コアセットベースの変動型 $mathcalGP$ (CVGP) は $mathcalGP$ pre と (重み付き) データの確率で定義される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:19:53 GMT)
LocoVR: Multiuser Indoor Locomotion Dataset in Virtual Reality [8.0] LocoVRは、130以上の屋内環境から収集された7000人以上の2人以上の軌跡のデータセットである。
評価の結果,ロコVRは人体軌道を利用した3つの室内作業において,モデル性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:49:01 GMT)
M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models [8.0] 我々は,M2Lingualと呼ばれる多言語多言語命令微調整データセットの完全合成・新規分類法(Evol)を提案する。
最初は多様な種子の例を選択し、次に提案されたEvol分類を用いてこれらの種子を複雑で挑戦的なマルチターン命令に変換することによって構築される。
異なる大きさのLLMを学習し,多種多様な言語に対して性能向上を示すことで,M2Lingualの有効性を実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:56:00 GMT)
RaceVLA: VLA-based Racing Drone Navigation with Human-like Behaviour [8.0] 本研究では、リアルタイム環境フィードバックに基づいて、ドローンがナビゲーション戦略に適応できる高度なアルゴリズムの統合について検討する。
このモデルは、収集されたレース用ドローンデータセットに基づいて微調整され、ドローンのレース環境が複雑であるにもかかわらず、強力な一般化を示している。
実験では、平均速度1.04m/s、最大速度2.02m/s、一貫した操縦性を示し、高速シナリオを効果的に処理できるRaceVLAの能力を示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:54:05 GMT)
Open Ko-LLM Leaderboard2: Bridging Foundational and Practical Evaluation for Korean LLMs [7.9] 我々は、以前のOpen Ko-LLM Leaderboardの改良版であるOpen Ko-LLM Leaderboard2を提案する。
オリジナルのベンチマークは、現実の能力とより密に整合した新しいタスクに完全に置き換えられている。
韓国語の特徴をよりよく反映するために、4つの新しい韓国語ベンチマークが導入されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:18:34 GMT)
A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness [7.9] ディープニューラルネットワーク(DNN)の性能に画像品質が重要な役割を果たす
大規模なデータセットは、しばしば幅広い条件下で画像を含む。
DNNの性能と強く相関する画像品質指標を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:15:31 GMT)
Limited Effectiveness of LLM-based Data Augmentation for COVID-19 Misinformation Stance Detection [7.8] 発生したアウトブレイクを取り巻く誤報は、深刻な社会的脅威を引き起こす。
1つの有望なアプローチはスタンス検出(SD)であり、これはソーシャルメディア投稿が誤解を招く主張を支持しているか、反対しているかを識別するものである。
データ拡張手法として,大言語モデル(LLM)を用いて制御可能な誤情報生成をテストする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:38:29 GMT)
SelaFD:Seamless Adaptation of Vision Transformer Fine-tuning for Radar-based Human Activity Recognition [7.8] 転倒検出などの人的活動認識(HAR)は高齢化によってますます重要になっている。
本研究は,レーダベースのTime-Dopplerシグネチャを用いたHAR用ViTモデルを微調整することに焦点を当てた。
そこで本研究では,Low-Rank Adaptation (LoRA) を重み空間に微調整することで,事前学習したViTモデルからの知識伝達を容易にする手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:09:19 GMT)
Designing a Dataset for Convolutional Neural Networks to Predict Space Groups Consistent with Extinction Laws [7.8] 本論文では,一次元粉体回折パターンのデータセットを,空間群を予測するために畳み込みニューラルネットワークを学習するための新しい戦略を用いて設計した。
回折パターンを格子パラメータと排他法則に基づいて計算した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:52:44 GMT)
Machine Learning-based Regional Cooling Demand Prediction with Optimised Dataset Partitioning [7.7] 都市内建物における冷却需要の正確な予測はエネルギー効率の維持に不可欠である。
本研究では,高分解能Long Short-Term Memory (LSTM) と Gated Recurrent Unit (GRU) ネットワークの汎用フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:43:33 GMT)
The Distributionally Robust Optimization Model of Sparse Principal Component Analysis [7.7] 乱数パラメータの確率分布が不確実な条件下でのスパース主成分分析(PCA)について考察する。
この問題は、不確実性を捉えるための構成的アプローチに基づいて、分散ロバストな最適化(DRO)モデルとして定式化されている。
内部問題は閉形式解を認め、元の DRO モデルをスティーフェル多様体上の同値な最小化問題に再構成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:00:08 GMT)
Finding Local Diffusion Schrödinger Bridge using Kolmogorov-Arnold Network [7.7] 本稿では,拡散路部分空間における局所拡散Schr"odinger Bridges (LDSB) の発見を初めて提案する。
実験の結果,LDSBは同じトレーニング済みのデノナイジングネットワークを用いて,画像生成の品質と効率を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:11:53 GMT)
Quantitative Resilience Modeling for Autonomous Cyber Defense [7.6] サイバーレジリエンス(サイバーレジリエンス)とは、システムがシステム操作に最小限の影響で攻撃から回復する能力である。
多様なネットワークトポロジやアタックパターンに適用可能な、レジリエンスの正式な定義はありません。
複数のディフェンダ運用目標を考慮したレジリエンスの定量的定式化を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:52:25 GMT)
PIDLoc: Cross-View Pose Optimization Network Inspired by PID Controllers [7.6] PIDLocは、比例積分微分(PID)コントローラにインスパイアされた、新しいクロスビューポーズ最適化手法である。
PIDLOCは、KITTIデータセットのクロスビューポーズ推定において最先端のパフォーマンスを達成し、以前の最先端と比較して位置誤差を37.8%削減する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:24:08 GMT)
Multimodal AI predicts clinical outcomes of drug combinations from preclinical data [7.5] 我々は、構造、経路、細胞生存性、転写データから学習するマルチモーダルAIモデルMADRIGALを紹介する。
953の臨床的結果と21842の化合物にまたがる薬物の組み合わせ効果を予測する。
単一モダリティ法や最先端のモデルより優れており、有害な薬物相互作用を予測する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:55:14 GMT)
LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset [7.5] ガス漏れは予防を必要とする重大な危険をもたらす。
近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。
本稿では,背景部分抽出,ゼロショットオブジェクト検出,フィルタリング,セグメンテーションを組み合わせたゼロショット手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:17:17 GMT)
Replay Consolidation with Label Propagation for Continual Object Detection [7.5] 継続学習は、以前獲得した知識を覚えながら、新しいデータを学ぶことを目的としている。
このシナリオでは、以前のタスクからのイメージには、将来のタスクでラベル付けされているように再現れる可能性のある未知のクラスのインスタンスが含まれる可能性がある。
本稿では,リプレイ・コンソリデーション (Replay Consolidation with Label propagation for Object Detection) と呼ばれる新しい手法による蒸留方式の代替案を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:22:01 GMT)
GraphGarment: Learning Garment Dynamics for Bimanual Cloth Manipulation Tasks [7.4] GraphGarmentは、ロボット制御入力に基づいて衣服のダイナミクスをモデル化する新しいアプローチである。
我々は,ロボットのエンドエフェクタと衣料品の相互作用をグラフで表現する。
そこで本研究では,衣服の状態予測誤差を補償する残差モデルを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:35:48 GMT)
Call for Rigor in Reporting Quality of Instruction Tuning Data [7.3] 研究は、インストラクションチューニング(IT)データの品質の重要性を強調している。
この実践から生じる潜在的な問題を実証し、データ品質を検証する上で慎重に検討する必要があることを強調する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:04:58 GMT)
Disentangled Knowledge Tracing for Alleviating Cognitive Bias [7.1] そこで本研究では,学生の因果効果に基づいて,親しみやすい,不慣れな能力のモデル化を行うディスタングルド・ナレッジ・トラクション・モデルを提案する。
DisKTは認知バイアスを著しく軽減し、評価精度が16ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:04:13 GMT)
Integrated Computation and Communication with Fiber-optic Transmissions [7.1] 光ファイバー伝送システムは、高速通信チャネルだけでなく、機械学習計算のための非線形カーネル関数としても活用されている。
コンピュータインテリジェンスとコミュニケーションの統合はシームレスです。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:55:02 GMT)
AxBERT: An Interpretable Chinese Spelling Correction Method Driven by Associative Knowledge Network [7.1] AxBERTは、連想的知識ネットワーク(AKN)と整合して中国語の綴り訂正を行う。
AxBERTの解釈可能性について,定性的推論とともに効果的に説明することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:09:10 GMT)
Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs [7.0] AKIは、画像トークンがテキストトークンに参加することを可能にするために、因果的注意をMMA(Modality-mutual attention)に開放する新しいMLLMである。
我々のMMA設計は汎用的であり、様々なモダリティにまたがるアプリケーションを可能にし、多様なマルチモーダルシナリオに対応できるようにスケーラブルである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:18:33 GMT)
Teaching Robots to Build Simulations of Themselves [7.0] 本稿では,ロボットが簡単な生ビデオデータのみを用いて,形態,運動学,運動制御をモデル化し,予測できる自己教師付き学習フレームワークを提案する。
この自己学習型シミュレーションは, 正確な動作計画を可能にするだけでなく, 異常を検知し, 損傷から回復することを可能にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:45:46 GMT)
Optimisation of cyber insurance coverage with selection of cost effective security controls [7.0] 我々は、リスク回避組織がサイバーセキュリティ投資を費用対効果で分配するのを支援するアプローチを提案する。
当社のアプローチがユニークなのは、サイバー保険と自己保護への投資額を定義する代わりに、これらの投資をどのように使うべきかを明確に定義することです。
いくつかの脅威を同時に考慮した制御選択問題の正確なアルゴリズムを提案し、このアルゴリズムを他の近似アルゴリズムの解と比較する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:21:13 GMT)
Towards Scalable Topological Regularizers [6.9] ワッサーシュタインや最大平均誤差といった確率測度のための計量は、そのような分布の違いを定量化するために一般的に用いられる。
永続ホモロジー(Persistent homology)は、点雲の多スケールな位相構造を定量化するトポロジカルデータ解析のツールである。
本稿では, 多数の小サブサンプルの永続的ホモロジーをトポロジカル・レギュレータとして計算した上で, 主永続性尺度の利用を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:07:16 GMT)
Unifying Model Predictive Path Integral Control, Reinforcement Learning, and Diffusion Models for Optimal Control and Planning [6.9] 我々は,Gibs測度の勾配に基づく最適化により,MPPI,RL,拡散モデルを結ぶ統一的な視点を確立する。
まず,MPPIをスムーズなエネルギー関数上の勾配上昇として解釈できることを示す。
次に、目的関数に指数変換を適用することにより、ポリシー勾配法がMPPIに還元されることを実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:11:38 GMT)
Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024 [6.9] 我々は,2024年にソーシャルメディアとディープフェイク検出プラットフォームユーザから収集されたワイヤ内ディープフェイクからなる新しいディープフェイク検出ベンチマークであるDeepfake-Eval-2024を紹介する。
ベンチマークには、52の異なる言語で88の異なるウェブサイトからさまざまなメディアコンテンツが含まれている。
その結果,Deepfake-Eval-2024で評価すると,オープンソースのDeepfake検出モデルの性能は急激に低下することがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:33:22 GMT)
The Breakdown of Gaussian Universality in Classification of High-dimensional Linear Factor Mixtures [6.9] 一般的な混合データ環境下での分類における経験的リスク最小化の高次元的特徴について述べる。
その分解の影響を理解するために、ガウス普遍性の条件を定義し、損失関数の選択に対するそれらの影響について議論する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:00:33 GMT)
Building 3D In-Context Learning Universal Model in Neuroimaging [6.8] In-context Learning (ICL)は、普遍モデルの一種であり、再訓練なしに広範囲のタスクにまたがる例外的な一般化を示す。
既存のICLモデルは、2D画像を入力として取り込むが、神経画像の3D解剖学的構造を完全に活用することは困難である。
我々は,複数のニューロイメージングタスクを3Dで実行可能なICLモデルであるNeuroverse3Dを紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:51:44 GMT)
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [6.7] 本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。
本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。
複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:34:09 GMT)
DQO-MAP: Dual Quadrics Multi-Object mapping with Gaussian Splatting [6.7] 本研究では,オブジェクトのポーズ推定と再構成をシームレスに統合する新しいオブジェクトSLAMシステムを提案する。
DQO-MAPは精度、再構成品質、計算効率の点で優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:55:07 GMT)
Invisible Strings: Revealing Latent Dancer-to-Dancer Interactions with Graph Neural Networks [6.7] グラフニューラルネットワークを用いて、2人のダンサーが共有する複雑な接続をハイライトし、解釈する。
デュエットの協調的ダイナミクスの代替モデルを構築するためのグラフベースの手法の可能性を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:08:31 GMT)
Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models [6.7] 大規模言語モデル(LLM)のためのETLパイプラインであるDataverseを提案する。
Dataverseにブロックベースのインターフェースを備えたカスタムプロセッサを簡単に追加することで、Dataverseを簡単かつ効率的に使用して独自のパイプラインを構築することができる。
本稿では,システムの性能と実装を解説した,簡潔で2分間のデモ映像を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:06:30 GMT)
State of play and future directions in industrial computer vision AI standards [6.6] 人工知能(AI)とディープラーニング(DL)はコンピュータビジョン(CV)の分野で大きな進歩をもたらした。
本研究では,産業用コンピュータビジョンAI標準の開発について,現状を考察する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:46:34 GMT)
WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation [6.5] WMNavは視覚言語モデル(VLM)を利用した新しい世界モデルベースのナビゲーションフレームワークである。
決定の結果を予測し、ポリシーモジュールへのフィードバックを提供するためにメモリを構築する。
人間のような思考プロセスに従って分解することにより、WMNavはモデル幻覚の影響を効果的に緩和する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:51:36 GMT)
Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection [6.4] INP-Formerは、テスト画像から直接固有の正規プロトタイプ(INP)を抽出する新しい方法である。
INP-Formerは、単一クラス、複数クラス、少数ショットADタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:10:32 GMT)
Analysis of Regularized Learning in Banach Spaces for Linear-functional Data [6.4] 本稿では,線形関数型データに対するバナッハ空間における正規化学習の理論について考察する。
正規化学習は、バナッハ空間上の正規化経験的リスクを最小限に抑えるように設計されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:15:16 GMT)
Understanding and Predicting Derailment in Toxic Conversations on GitHub [6.3] この研究は、GitHubの有害性につながる会話の脱線を理解し予測することを目的としている。
このデータセットに基づいて,有害な会話や脱線点の特徴を識別する。
本研究では,エスカレーション前に潜在的に有害な会話を自動的に検出し,対処するための能動的モデレーション手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:01:37 GMT)
Multiaccuracy and Multicalibration via Proxy Groups [6.3] 本稿では,プロキシ・センシティブな属性を用いて,真のマルチ精度とマルチキャリブレーションの作用可能な上限を導出する方法を示す。
また、マルチ精度とマルチキャリブレーションを満たすためのモデル調整は、真の、しかし未知の、センシティブなグループに対するこれらの違反を著しく軽減することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:47:54 GMT)
Cellular Automaton With CNN [6.3] 本研究では、畳み込みニューラルネットワーク(CNN)を用いて、2次元CAモデルにおけるジャンプパラメータを同定する。
本稿では,CA内のセルの近傍サイズと移動規則を規定するジャンプパラメータを分類するために,CA生成データに基づいて訓練されたカスタムCNNアーキテクチャを提案する。
提案したCNNは、LeNet-5やAlexNetのような既存のアーキテクチャと比較して、競合の精度(89.31)を達成している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:15:47 GMT)
Enhancing the charging performance of an atomic quantum battery [6.2] 2つの原子からなる量子バッテリモデルについて検討し、充電器とバッテリ要素を多モード真空場に結合する。
エルゴトロピー、充電時間、充電効率などのメリットの数値を解析した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:46:20 GMT)
Leveraging Self-Supervised Learning Methods for Remote Screening of Subjects with Paroxysmal Atrial Fibrillation [6.2] 本研究では,コホートを限定した臨床研究から予備的な結果を得る手段として,自己監督学習(SSL)の適用について検討する。
発作性心房細動 (P-AF) に対する遠隔モニタリング, 正常洞結節リズムにおける単誘導心電図信号を用いた被験者のスクリーニングについて検討した。
我々は,最先端のSSL手法と教師付き学習手法を併用して評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:42:38 GMT)
Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction [6.1] フロアプランの再構築は、信頼性の高い屋内ロボットナビゲーションと高レベルのシーン理解に不可欠な構造的前提を提供する。
平面抽出,ポーズ推定,バックエンド最適化をシームレスに行うことで,フロアプラン再構築をマルチセッションSLAMシステムに密に統合するFloorplan-SLAMを提案する。
Floorplan-SLAM は平面抽出, 推定精度, フロアプランの再現精度, 性能において, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:48:57 GMT)
FwNet-ECA: A Classification Model Enhancing Window Attention with Global Receptive Fields via Fourier Filtering Operations [6.1] 大域的注意機構に固有の過度な計算の問題を緩和するために,窓付き注意機構を導入した。
FwNet-ECAは、フーリエ変換と学習可能な重み行列を組み合わせ、画像のスペクトル特性を高める新しい手法である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:48:00 GMT)
AI-based association analysis for medical imaging using latent-space geometric confounder correction [6.1] 本研究は, 人工知能に基づく医用画像解析におけるコンバウンディング効果と解釈可能性の課題について論じる。
本稿では,画像データに代えて,共同設立者関係の情報を潜在表現として保持する戦略を提案する。
その結果、共同設立者の影響力を減らし、誤りや誤解を招く協会を予防し、臨床・疫学研究者による詳細な調査にユニークな視覚的解釈を提供する方法の有効性が確認された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:24:53 GMT)
Anomaly detection in non-stationary videos using time-recursive differencing network based prediction [6.1] 本稿では,ビデオ異常検出のための自己回帰移動平均推定を行い,時間再帰的差分ネットワークを用いて予測を行う。
提案手法の有効性は, 簡単な光フローに基づく映像の特徴を考慮し, 提案手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:16:39 GMT)
Evaluating the Robustness of LiDAR Point Cloud Tracking Against Adversarial Attack [6.1] 本稿では,3次元物体追跡の文脈において,敵攻撃を行うための統一的なフレームワークを提案する。
ブラックボックス攻撃のシナリオに対処するために,新たなトランスファーベースアプローチであるTarget-aware Perturbation Generation (TAPG)アルゴリズムを導入する。
実験の結果,ブラックボックスとホワイトボックスの両方の攻撃を受けた場合,高度な追跡手法に重大な脆弱性があることが判明した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:54:15 GMT)
Modular Conversational Agents for Surveys and Interviews [6.0] 本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。
3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。
その結果,AIエージェントは完成率と応答品質を高めることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:14:35 GMT)
From Data to Uncertainty Sets: a Machine Learning Approach [5.9] 我々は、堅牢な最適化を活用し、機械学習モデルの出力の不確実性に対する制約を保護する。
我々は違反の可能性を強く保証する。
合成計算実験では、この手法は他の手法よりも1桁小さい半径を持つ不確実性集合を必要とする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:30:28 GMT)
VisAgent: Narrative-Preserving Story Visualization Framework [5.9] VisAgentはトレーニング不要のフレームワークで、特定のストーリーの中で重要なシーンを理解し視覚化するように設計されている。
ストーリーの蒸留、セマンティック一貫性、コンテキストコヒーレンスを考慮することで、VisAgentはエージェントワークフローを採用している。
実証的に検証された有効性は、現実的なストーリービジュアライゼーションアプリケーションに対するフレームワークの適合性を確認する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:41:45 GMT)
BioD2C: A Dual-level Semantic Consistency Constraint Framework for Biomedical VQA [5.8] バイオメディカルVQAのための新しい2レベルセマンティック一貫性制約フレームワークBioD2Cを提案する。
BioD2Cは、モデルと特徴レベルの両方で二重レベルのセマンティックインタラクションアライメントを実現し、モデルが質問に基づいて視覚的特徴を適応的に学習できるようにする。
本研究では,手動で修正した画像をフィルタリングし,質問と回答のペアをマルチモーダルな文脈で整列させることにより,過去のデータセットに固有のバイアスに対処する新たなデータセットであるBioVGQを確立する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:39:42 GMT)
LiteWebAgent: The Open-Source Suite for VLM-Based Web-Agent Applications [5.8] LiteWebAgentは、VLMベースのWebエージェントアプリケーションのためのオープンソーススイートである。
私たちのフレームワークは、Webエージェントエコシステムにおける重要なギャップに対処しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:13:10 GMT)
Privacy-Preserving Authentication: Theory vs. Practice [5.8] 暗号はゼロ知識証明や高度なシグネチャスキームのようなエキサイティングなプリミティブを提供する。
このようなプリミティブは、高レベルのプライバシー保護を組み込んだオンライン認証と認証を実現することができる。
本稿では、問題、暗号化ができること、デプロイ例、広く普及する障壁について考察する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:14:20 GMT)
Towards Robust Expert Finding in Community Question Answering Platforms [5.7] TUEFは、コミュニティ質問回答プラットフォームにおける公正な専門家発見のためのトピック指向のユーザーインタラクションモデルである。
我々は、より正確に専門家を特定するために、多種多様な情報、具体的にはコンテンツと社会情報を利用する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:46:01 GMT)
COMMA: Coordinate-aware Modulated Mamba Network for 3D Dispersed Vessel Segmentation [5.7] コーディネート対応変調マンバネットワーク(COMMA)について紹介する。
これまでで最大規模の3Dコンテナデータセットである570件のデータセットを手作業でラベル付けしました。
COMMAを6つのデータセットで評価し,2つの画像モダリティと5種類の血管組織について検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:45:10 GMT)
Towards Robust Multi-UAV Collaboration: MARL with Noise-Resilient Communication and Attention Mechanisms [5.7] 本稿では,UAV経路計画のためのマルチエージェント強化学習(MARL)フレームワークを提案する。
このフレームワークには、注意機構に基づくUAV通信プロトコルとトレーニング・デプロイシステムが含まれている。
合成と実世界の両方のデータセットで行った実験は、経路計画効率とロバスト性の観点から既存のアルゴリズムよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:05:14 GMT)
A Survey on Quantum Machine Learning: Current Trends, Challenges, Opportunities, and the Road Ahead [5.6] 量子コンピューティング(QC)は、古典的な計算に比べて複雑な問題を解く効率を改善すると主張している。
QCが機械学習(ML)に統合されると、量子機械学習(QML)システムを生成する。
本稿では,QCの基本概念と,その古典コンピューティングに対する顕著な優位性について,より深く理解することを目的とする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:25:39 GMT)
Union of Experts: Adapting Hierarchical Routing to Equivalently Decomposed Transformer [5.6] 提案するUnion-of-Experts(UoE)は,変圧器を等価な専門家グループに分解し,入力データとエキスパートの動的ルーティングを実装する。
実験により、UoEが採用するモデルは、画像領域と自然言語領域にわたる複数のタスクにおいて、フルアテンション、最先端のMoE、効率的なトランスフォーマーを超越していることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:01:25 GMT)
Variety of Superradiant Phase Transition in Bose-Fermi System with Tight-Binding Model in the weak-coupling regime [5.6] 一次元強結合電子鎖内の超ラジカル相転移に固有の動的多様性について検討する。
ピエルス置換によって量子化された電磁ベクトルポテンシャルを用いることで、ゲージ結合されたボース=フェルミ系は運動量依存の超ラジカル遷移を促進する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:04:35 GMT)
Use Me Wisely: AI-Driven Assessment for LLM Prompting Skills Development [5.6] 大規模言語モデル(LLM)を利用したチャットボットは、様々な領域で普及し、様々なタスクやプロセスをサポートしている。
しかし、プロンプトは非常にタスクに依存し、ドメインに依存しており、ジェネリックアプローチの有効性を制限している。
本研究では, アドホックガイドラインと最小限の注釈付きプロンプトサンプルを用いて, LLM を用いた学習評価を促進できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:56:33 GMT)
AILS-NTUA at SemEval-2025 Task 4: Parameter-Efficient Unlearning for Large Language Models using Data Chunking [5.5] 低ランク適応と層別微調整を用いたパラメータ効率・勾配に基づくアンラーニングを応用した。
我々はデータチャンキングを採用し、忘れたデータを不連続なパーティションに分割し、サイクルサンプリングされた保持サンプルを予め定義された比率でマージする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:39:09 GMT)
AutoEval: A Practical Framework for Autonomous Evaluation of Mobile Agents [5.5] AutoEvalは、自動エージェント評価フレームワークで、手作業なしでモバイルエージェントをテストする。
我々は,提案フレームワークのプロトタイプを実装し,自動生成したタスク報酬信号の検証を行い,人手による報酬信号の93%以上を検索した。
我々は,現状のモバイルエージェントを我々のフレームワークを用いて評価し,その性能特性と限界について詳細な知見を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:44:30 GMT)
Bringing Comparative Cognition To Computers [5.5] 類似点と相違点の過度かつ過小評価は避けなければならない。
比較アプローチを採用することで、より広範な認知科学にAI認知研究を統合することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:58:42 GMT)
ProAPO: Progressively Automatic Prompt Optimization for Visual Classification [5.5] 視覚言語モデル(VLM)は、大規模なペア画像テキストデータを用いた訓練により、画像分類に大きな進歩をもたらした。
近年の手法では,大型言語モデル(LLM)が生成する視覚的記述がVLMの一般化を促進することが示されているが,クラス固有のプロンプトはLLMの幻覚によって不正確あるいは識別に欠ける可能性がある。
本稿では,最小限の監督を要さず,かつループを含まない細粒度カテゴリに対して,視覚的に識別可能なプロンプトを見つけることを目的とする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:18:01 GMT)
Assessing Quantum Layout Synthesis Tools via Known Optimal-SWAP Cost Benchmarks [5.5] 証明可能なSWAP数と非自明な回路構造を持つベンチマークセットであるQUBIKOSを紹介する。
最初に、主要なQLSアルゴリズムのSWAPゲート使用率の最適性ギャップを定量化できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:34:57 GMT)
MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance [5.5] 本研究では,マルチオブジェクトを用いたレイアウト誘導ゼロショット画像パーソナライズのためのMS-Diffusionフレームワークを提案する。
提案した多目的クロスアテンションオーケストラは、テキストの制御を保ちながら、オブジェクト間コンポジションを編成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:21:26 GMT)
Why Johnny Signs with Sigstore: Examining Tooling as a Factor in Software Signing Adoption in the Sigstore Ecosystem [5.4] 我々は、現代的で広く採用されているソフトウェア署名ツールであるSigstoreの形式的ユーザビリティについて研究する。
ツールの選択に影響を与える要因について,13名 (13名) のセキュリティ実践者に対してインタビューを行った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:55:28 GMT)
Truthfulness of Decision-Theoretic Calibration Measures [5.4] サブサンプリングステップキャリブレーションと呼ばれる新たなキャリブレーション尺度である$mathsfStepCEtextsfsub$を導入する。
特に、任意の積分布において、$mathsfStepCEtextsfsub$は$O(1)$ factorまで真であるのに対し、事前決定理論の校正策は$e-Omega(T)$-$Omega(sqrtT)$ truthfulness gapに苦しむ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:20:10 GMT)
Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.4] マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。
MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。
提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:54:34 GMT)
LAPD: Langevin-Assisted Bayesian Active Learning for Physical Discovery [5.4] Langevin-Assisted Active Physical Discovery (LAPD) は、モンテカルロのレプリカ交換勾配を統合したフレームワークである。
LAPDはノイズデータを用いた信頼性,不確実性を考慮した識別を実現する。
Lotka-Volterra, Lorenz, Burgers, Convection-Diffusion equationsなどの非線形系のLAPDを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:17:24 GMT)
A Characterization of List Regression [5.4] リスト回帰の完全な特徴付けを提供する。
我々は、$k$-OIG次元と$k$-fat-shattering次元という2つの次元を提案する。
これにより、既存のリスト学習の特徴を分類から回帰まで拡張する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:49:40 GMT)
Duumviri: Detecting Trackers and Mixed Trackers with a Breakage Detector [5.3] State-of-the-artツールは通常、障害を検出するために、ユーザレポートと開発者の努力に依存します。
本稿では,機械学習に基づく破壊検知器をトラッカー検出パイプラインに組み込むことにより,機能資源の誤識別を自動的に回避することを提案する。
Duumviriは、これまで報告されていない22のユニークなトラッカーと26のユニークな混合トラッカーを検出し、確認することを可能にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:50:53 GMT)
Monocular visual simultaneous localization and mapping: (r)evolution from geometry to deep learning-based pipelines [5.3] 本稿では、幾何学ベースのSLAMと学習ベースのSLAMの2つの主要なフレームワークに基づいて、視覚的SLAMアルゴリズムの現状を調査する。
視覚的SLAM調査における2つの重要な課題に対処し、視覚的SLAMパイプラインを一貫した分類を提供し、(2)異なるデプロイメント条件下での性能を堅牢に評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:20:17 GMT)
Exploring the Potential of QEEGNet for Cross-Task and Cross-Dataset Electroencephalography Encoding with Quantum Machine Learning [5.1] 量子機械学習(QML)の最近の進歩は、EEG分析を強化する新たな機会を提供する。
我々は、量子層を組み込んだハイブリッドニューラルネットワークであるQuantum-EEGNet(QEEGNet)をEEGNetに拡張する。
我々の評価は、様々な学習シナリオにおけるQEEGNetの性能を評価する、多様な認知タスクと運動タスクのデータセットにまたがる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:54:00 GMT)
Differences-in-Neighbors for Network Interference in Experiments [5.1] そこで本研究では,ネットワーク干渉を緩和するために設計されたDNと呼ばれる新しい推定器を提案する。
DM推定器と比較して、DNバイアスは干渉効果の大きさで2位、その分散はHT推定器よりも指数的に小さい。
大規模ソーシャルネットワークと都市レベルのライドシェアリングシミュレータによる実証評価は,DNの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:40:12 GMT)
CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement [5.1] CalibRefineは完全に自動化され、ターゲットレス、オンラインキャリブレーションフレームワークである。
我々は,CalibRefineが人間の関与を最小限に抑えた高精度キャリブレーション結果を提供することを示した。
本研究は、オブジェクトレベルの特徴マッチングが、反復的かつ自己監督的な注意に基づく調整と相まって、複雑で現実的な条件下でのセンサの融合を可能にすることを明らかにする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:54:37 GMT)
PennyLang: Pioneering LLM-Based Quantum Code Generation with a Novel PennyLane-Centric Dataset [5.1] 大きな言語モデル(LLM)は、コード生成、自然言語処理、ドメイン固有の推論において顕著な機能を提供します。
量子回路の3,347ペニーレーン固有のコードサンプルからなる,新しい高品質なデータセットを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:04:35 GMT)
Low-Level Matters: An Efficient Hybrid Architecture for Robust Multi-frame Infrared Small Target Detection [5.0] マルチフレーム赤外線小目標検出は、低高度および海洋監視において重要な役割を果たす。
CNNとTransformerを組み合わせたハイブリッドアーキテクチャは、マルチフレームIRSTDの強化に大いに期待できる。
低レベルの機能学習ハイブリッドフレームワークを再定義する,シンプルながら強力なハイブリッドアーキテクチャであるLVNetを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:53:25 GMT)
Monocular Person Localization under Camera Ego-motion [5.0] ポーズ推定問題の一部として、人物のローカライゼーションを考察する。
ヒトを4点モデルで表現することにより、2次元カメラの姿勢と人の3次元位置を共同で推定する。
本手法は人追従システムにさらに実装され,アジャイル四足歩行ロボットに展開される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:07:27 GMT)
Large Language Models as Natural Selector for Embodied Soft Robot Design [5.0] 本稿では,大規模言語モデルがソフトロボット設計の表現を学習できるかどうかを評価する新しいベンチマークであるRoboCrafter-QAを紹介する。
実験の結果,これらのモデルが設計表現を学習する上で有望な能力を示す一方で,微妙な性能差を持つ設計の微妙な区別に苦慮していることが判明した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:55:10 GMT)
DreamerV3 for Traffic Signal Control: Hyperparameter Tuning and Performance [5.0] 強化学習(Reinforcement Learning, RL)は、スマートTSC戦略の開発において、広く研究されている技術である。
DreamerV3アルゴリズムはポリシー学習のための魅力的な特性を示す。
本稿では,TSC戦略学習のための世界モデルの利点を探るため,DreamerV3アルゴリズムを用いて廊下TSCモデルを訓練する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:02:46 GMT)
PatternPaint: Practical Layout Pattern Generation Using Diffusion-Based Inpainting [5.0] PatternPaintは、限定的なデザインルール準拠のトレーニングサンプルで法的パターンを生成することができる拡散ベースのフレームワークである。
我々のモデルは、複雑な2次元金属配線設計規則設定において法的なパターンを生成できる唯一のモデルである。
その結果、新しい技術ノードの開発において、レイアウトパターン生成のための実運用対応のアプローチを実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:29:33 GMT)
A Kolmogorov-Arnold Network for Explainable Detection of Cyberattacks on EV Chargers [4.9] 本稿では,電気自動車充電器のサイバー攻撃を検出するためのKAN(Kolmogorov-Arnold Network)ベースのフレームワークを提案する。
このフレームワークは、通常の充電シナリオと悪意のある充電シナリオを効果的に区別する。
提案手法は,精度99%,F1スコア92%のEV充電器に対するサイバー攻撃を精度良く検出できることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:06:39 GMT)
AILS-NTUA at SemEval-2025 Task 3: Leveraging Large Language Models and Translation Strategies for Multilingual Hallucination Detection [4.9] 本稿では,多言語テキストを英語に翻訳することで,幻覚検出の効率化を図る,効率的な学習不要なLCMプロンプト戦略を提案する。
提案手法は,複数の言語にまたがる競合的ランキングを達成し,低リソース言語における2つの第1位を確保する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:38:57 GMT)
MX-Font++: Mixture of Heterogeneous Aggregation Experts for Few-shot Font Generation [4.9] Few-shot Font Generation (FFG)は、限られた参照グリフを使用して新しいフォントライブラリを作成することを目的としている。
MX-Fontは、局所的なコンポーネントの観点から文字の内容を考え、Mixture of Experts (MoE) アプローチを用いて、より優れた遷移のためにコンポーネントを適応的に抽出する。
これらの問題を緩和するために、チャンネル次元や空間次元の情報を集約できないように、コンテンツとスタイルを分離する強力な特徴抽出エキスパートであるヘテロジニアス・アグリゲーション・エキスパート(HAE)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:18:43 GMT)
Undertrained Image Reconstruction for Realistic Degradation in Blind Image Super-Resolution [4.8] 超解像度(SR)モデルは現実世界の低解像度(LR)画像と競合する。
ほとんどのSRモデルは現実世界のLR画像では性能が良くない。
本研究では,未訓練画像再構成モデルを用いたデータセット生成手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:33:58 GMT)
Synthetic Data: Revisiting the Privacy-Utility Trade-off [4.8] ある記事は、合成データは従来の匿名化技術よりもプライバシーとユーティリティのトレードオフが良くないと述べている。
本稿で記述したプライバシゲームの実装を分析し,高度に専門的で制約のある環境で動作していることを確認した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:38:25 GMT)
Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection [4.8] 本稿では,エッジデバイス上での視覚異常検出における連続学習の課題について,新たな考察を行う。
エッジデバイス上でのメモリフットプリントが低いことを考慮し,STFPM手法の評価を行った。
本研究は,資源制約エッジデバイス上でのCLADシナリオに適応し,漸進的に学習するVADモデルをデプロイ可能であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:03:47 GMT)
From Restless to Contextual: A Thresholding Bandit Approach to Improve Finite-horizon Performance [4.8] オンラインのレスレス・バンディットは、国家の移行と予算の制約を取り入れることで、古典的な文脈的バンディットを拡張している。
我々は、拡張性のある予算付きしきい値付き帯域幅問題として問題を再構築する。
本稿では,オンラインマルチステート設定において,最小限の最小定数後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:49:16 GMT)
Towards Explainable Doctor Recommendation with Large Language Models [4.7] 我々は、医師推薦をランキングタスクとして定式化し、大規模言語モデル(LLM)に基づくポイントワイドランキングフレームワークを開発する。
本フレームワークは, 疾患治療ペアの関連性に応じて, ゼロショット設定で医師をランク付けする。
本研究は,38組以上の疾患治療ペアからなる専門知識駆動型医師ランキングデータセットであるDrRankを構築した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:48:07 GMT)
ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields [4.7] 本研究は、2つの3次元調音形状間の物理的可視性の教師なし予測のための統一的な枠組みを示す。
ニューラル正規微分方程式(ODE)が支配する滑らかな時間変化流れ場を用いた微分同相変換として補間をモデル化する
対応性は, パラメータ化の異なる高忠実度曲面に有効である, 効率的なバリアフォールド定式化を用いて回復する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:28:05 GMT)
NitiBench: A Comprehensive Studies of LLM Frameworks Capabilities for Thai Legal Question Answering [4.6] 本稿では、タイの一般的な金融法を網羅するニチベンチ-CCLと、現実の税法ケースを含むニチベンチ-タックスの2つのデータセットからなるベンチマークであるニチベンチを紹介する。
検索強化世代(RAG)と長文LLMに基づく3つの重要な研究課題に対処するためのアプローチを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:45:23 GMT)
Utilizing Sequential Information of General Lab-test Results and Diagnoses History for Differential Diagnosis of Dementia [4.6] アルツハイマー病(AD)の早期診断は、複数のデータ関連課題に直面している。
これらの課題はADの進行的な性質によって悪化し、微妙な病態的変化が何十年にもわたって臨床症状に先行することが多い。
本研究は, 日常的に収集された総合的な検査履歴を生かした新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:20:44 GMT)
Adaptive Camera Sensor for Vision Models [4.6] Lensは、モデルの観点から高品質な画像をキャプチャすることで、モデル性能を向上させる新しいカメラセンサ制御方法である。
LensのコアとなるVisiTは、トレーニング不要で、モデル固有の品質指標で、テスト時に個々の未ラベルのサンプルを評価する。
Lensを検証するために、様々なセンサと照明条件から自然摂動をキャプチャする新しいベンチマークデータセットであるImageNet-ES Diverseを紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:20:23 GMT)
Large Language Models are Powerful EHR Encoders [4.5] ドメイン固有のEHR基盤モデルは予測精度と一般化の有望な改善を実証している。
汎用大規模言語モデル(LLM)に基づく埋め込み手法をEHRエンコーダとして用いる可能性について検討する。
GTE-Qwen2-7B-Instruct と LLM2Vec-Llama3.1-8B-Instruct の2つの最新式 LLM-embedding モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:36:52 GMT)
Electron spin dynamics guide cell motility [4.4] 細胞傷害は青い光子の急性放出を誘発し、これらの光子は筋肉前駆細胞を磁場に敏感にする。
タンパク質発現の包括的解析により、青い光子が細胞運動を促進する能力はカルモデュリンカルシウムセンサーの活性化によって引き起こされることが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:51:18 GMT)
StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts [4.4] 本稿では,大規模言語モデルを用いた芸術的舞台生成のための総合的なフレームワークであるStageDesignerを紹介する。
StageDesignerは、調味されたアーティストのレイアウトをシミュレートし、没入的な3Dステージシーンを生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:17:50 GMT)
Online Inference for Quantiles by Constant Learning-Rate Stochastic Gradient Descent [4.3] 本稿では,理論的保証付き量子損失関数の学習速度を一定としたオンライン勾配勾配勾配推定法を提案する。
数値解析により,提案した量子推定器の強い有限サンプル性能と推定法が示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:37:42 GMT)
QEEGNet: Quantum Machine Learning for Enhanced Electroencephalography Encoding [4.2] 我々は、量子コンピューティングと古典的なEEGNetアーキテクチャを統合し、EEGエンコーディングと分析を改善する新しいハイブリッドニューラルネットワークであるQuantum-EEGNet(QEEGNet)を紹介する。
QEEGNetはニューラルネットワークに量子層を組み込んで、EEGデータのより複雑なパターンをキャプチャし、計算上の利点を提供する。
我々は、ベンチマークEEGデータセット上でQEEGNetを評価し、ほとんどの被験者および他の被験者において、従来型のEEGNetを一貫して上回っていることを実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:14:37 GMT)
HoSNN: Adversarially-Robust Homeostatic Spiking Neural Networks with Adaptive Firing Thresholds [4.2] スパイキングニューラルネットワーク(SNN)は、有望なニューラルインスパイアされた計算モデルを提供する。
本稿では,ニューロホメオスタシスからインスピレーションを得て,しきい値適応型集積・発火ニューロンモデルの設計を行う。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:24:52 GMT)
Deficient Excitation in Parameter Learning [4.2] 本稿では,不足励起(DE)下でのパラメータ学習問題について検討する。
提案したオンラインアルゴリズムは、識別可能部分空間と識別不能部分空間を計算できる。
識別可能な部分空間内の学習誤差は、ノイズフリーの場合において指数関数的に0に収束する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:18:13 GMT)
Speculative Decoding and Beyond: An In-Depth Survey of Techniques [4.2] シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。
ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:46:23 GMT)
Tsirelson bounds for quantum correlations with indefinite causal order [4.2] 任意の因果不等式の違反を境界とする一般的な方法を提案する。
我々は、最大違反が対応する相関の代数的最大値よりも一般的に小さいことを証明した。
この結果は、量子相関の集合と不定因数順序の境界を特徴付ける物理原理の探索を動機付けている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:34:32 GMT)
A compact unshielded optically-pumped magnetic gradiometer [4.1] 光ポンピング磁気勾配計(OPG)は、磁気異常検出や生体磁気測定などの応用において重要な役割を果たす。
本研究は, 電流OPGを, 電圧, 周波数, 光回転, 磁場差動モードの4種類に分類する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:17:59 GMT)
Variational Quantum Algorithm for Constrained Topology Optimization [4.1] 制約付き位相最適化のための新しい変分量子アルゴリズムを提案する。
提案する量子アルゴリズムのゲート複雑性を解析する。
このアルゴリズムはトラス構造やMesserschmitt-B"olkow-Blohmビームなどのコンプライアンス問題で実証される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:02:23 GMT)
Generative modeling through internal high-dimensional chaotic activity [4.0] 生成モデリングは、トレーニングデータセットの統計特性が類似した新しいデータポイントを作成することを目的としている。
本稿では,学習データセットから新たなデータポイントを生成する手段として,高次元カオスシステムの内部カオス力学を用いる方法を検討する。
単純な学習ルールは、一連のバニラアーキテクチャでこの目標を達成することができ、標準精度測定によって生成されたデータポイントの品質を特徴付けることができることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:17:59 GMT)
Nonparametric Control Koopman Operators [3.9] 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:09:40 GMT)
An Efficient 3D Convolutional Neural Network with Channel-wise, Spatial-grouped, and Temporal Convolutions [3.8] 本稿では,ビデオ行動認識のためのシンプルで効率的な3次元畳み込みニューラルネットワークを提案する。
提案するネットワークの性能と効率を,複数のビデオ行動認識データセット上で評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:40:35 GMT)
Mind the Gap: Detecting Black-box Adversarial Attacks in the Making through Query Update Analysis [3.8] アドリアックは機械学習(ML)モデルの整合性を損なう可能性がある。
本稿では,逆ノイズインスタンスが生成されているかどうかを検出するフレームワークを提案する。
適応攻撃を含む8つの最先端攻撃に対するアプローチを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:25:12 GMT)
Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises [3.8] Test-Time Adaptation (TTA) は、未ラベルのテストデータを使用して、ソースデータにアクセスせずに分散シフトに取り組むことを目的としている。
既存のTTAメソッドは、突発的な分布シフトがソースモデルからの以前の知識を破壊するため、このようなマルチモーダルシナリオで失敗する。
そこで我々は,2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:36:16 GMT)
Is Bellman Equation Enough for Learning Control? [3.7] ベルマン方程式のユニークな解は連続状態空間において成り立たないことを示す。
次に, 既約解と既約解の指数的不均衡に起因する不安定解への収束という, 値に基づく手法で共通の障害モードを示す。
最後に,この問題に対処するための構築による安定解の収束を保証する肯定的なニューラルアーキテクチャを導入する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:20:34 GMT)
Large Language Models for Multilingual Previously Fact-Checked Claim Detection [3.7] 本稿では,複数言語による事実チェックによるクレーム検出のための大規模言語モデル (LLM) の総合評価について述べる。
20言語にまたがる7つのLLMをモノリンガル・クロスリンガル・セッティングで評価する。
この結果から,LLMは高リソース言語ではよく機能するが,低リソース言語では苦戦していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:56:43 GMT)
Experience Replay with Random Reshuffling [3.7] 教師付き学習では、データセットをエポック毎にシャッフルし、データを逐次的に消費することが一般的であり、これはランダムリシャッフル(RR)と呼ばれる。
RRをリプレイ体験に拡張するサンプリング手法を提案する。
提案手法をAtariベンチマークで評価し, 深層強化学習の有効性を実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:37:22 GMT)
In-Depth Analysis of Automated Acne Disease Recognition and Classification [3.6] 本稿では,アクネ認識と分類のための自動エキスパートシステムを提案する。
提案手法は,6種類の真菌疾患を分類・評価するために,機械学習に基づく手法を用いている。
実験の結果、ランダムフォレスト(RF)の精度は98.50%に達した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:58:44 GMT)
SAR-W-MixMAE: SAR Foundation Model Training Using Backscatter Power Weighting [3.6] マスク付きオートエンコーダ(MAE)などの基礎モデルアプローチや、そのバリエーションが衛星画像に適用されている。
セマンティックラベリングによるデータセット作成の困難さと光学画像に対する高ノイズコンテントのため、SAR(Synthetic Aperture Radar)データは基礎モデルの分野ではあまり研究されていない。
本研究では,マスク付きオートエンコーダ,特にSentinel-1 SAR画像上のMixMAEとそのSAR画像分類タスクへの影響について検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:20:53 GMT)
SCB-dataset: A Dataset for Detecting Student Classroom Behavior [3.6] このデータセットは、20クラスにわたる7428のイメージと106830のラベルで構成されている。
我々は、SCB-Dataset5が、教育における人工知能の将来的な応用の基盤となると信じている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:52:24 GMT)
World Models for Anomaly Detection during Model-Based Reinforcement Learning Inference [3.6] 学習ベースのコントローラは、安全性と信頼性に関する懸念から、現実世界のアプリケーションから意図的に排除されることが多い。
モデルベース強化学習における最先端の世界モデルがどのようにトレーニングフェーズを超えて活用され、デプロイされたポリシーが十分に親しみのある状態空間の領域内でのみ動作するかを検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:25:01 GMT)
Towards a robust R2D2 paradigm for radio-interferometric imaging: revisiting DNN training and architecture [3.6] R2D2 Deep Neural Network (DNN)シリーズは、最近、電波干渉計における画像形成のために導入された。
シリーズ収束、トレーニング手法、DNNアーキテクチャの観点からR2D2を再考する。
残差がノイズと互換性がある場合、再構成プロセスが停止する収束基準を導入する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:26:45 GMT)
Understanding LLM Development Through Longitudinal Study: Insights from the Open Ko-LLM Leaderboard [3.6] 本稿では,Open Ko-LLM Leaderboardにおける先行研究の限界に対処するため,11ヶ月にわたる縦断的研究を行う。
分析期間を延長することで,韓国の大規模言語モデル(LLM)の発展過程をより包括的に理解することを目指す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:21:18 GMT)
AI Literacy in K-12 and Higher Education in the Wake of Generative AI: An Integrative Review [3.5] AIリテラシーの介入について議論し、設計する方法については、研究者や実践者の間ではほとんど合意がない。
本稿では,2020年以降に出版された実証的および理論的AIリテラシー研究の検証に,統合的レビュー手法を適用した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:01:11 GMT)
Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents [3.5] 我々は8つの異なる防御効果を評価し、それら全てを適応攻撃を用いてバイパスし、連続して50%以上の攻撃成功率を達成する。
本研究は,ロバスト性と信頼性を確保するために,防御設計における適応攻撃評価の必要性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:32:46 GMT)
Simplifying Deep Temporal Difference Learning [3.5] 安定を保ちながら、政治外のTDトレーニングを加速し、簡素化できるかどうかを検討する。
我々の重要な理論的結果は、LayerNormのような正規化技術が証明可能な収束性TDアルゴリズムが得られることを初めて示している。
よりシンプルなオンラインQ-LearningアルゴリズムであるPQNを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:00:31 GMT)
Computer-aided shape features extraction and regression models for predicting the ascending aortic aneurysm growth rate [3.4] 局所的および大域的形状特徴は、上昇する大動脈瘤の成長を予測するために比較される。
動脈瘤は根部近くにあり,初径が大きいと成長が速くなる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:21:20 GMT)
Shakespearean Sparks: The Dance of Hallucination and Creativity in LLMs' Decoding Layers [3.4] 大型言語モデル(LLM)は幻覚として知られており、しばしば創造性に結びつく現象である。
復号時に異なるLCM層にまたがるハロシン化と創造性を定量化する評価フレームワークHCLを導入する。
私たちの経験的分析は、層深さ、モデルタイプ、モデルサイズで整合した幻覚と創造性のトレードオフを明らかにします。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:27:00 GMT)
CADDI: An in-Class Activity Detection Dataset using IMU data from low-cost sensors [3.4] 安価なIMUセンサを用いたクラス内アクティビティ検出のための新しいデータセットを提案する。
データセットは、典型的な教室のシナリオで12人の参加者が実行した、瞬間的および連続的な19の多様なアクティビティで構成されている。
加速度計、ジャイロスコープ、回転ベクトルデータ、および同期ステレオ画像を含み、センサーと視覚データを用いたマルチモーダルアルゴリズムを開発するための包括的なリソースを提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:29:57 GMT)
From Metaphor to Mechanism: How LLMs Decode Traditional Chinese Medicine Symbolic Language for Modern Clinical Relevance [3.4] 従来の中国医学(TCM)のメタファーを正確に解釈し、西洋医学の概念にマッピングするための新しい多エージェント・チェーン・オブ・思想(CoT)フレームワークを提案する。
メタファに富んだTCMデータセットを構築するための方法論を詳述し、マルチエージェントコラボレーションとCoT推論を効果的に統合するための戦略について議論し、メタファ解釈を導く理論的基盤を明確化する。
本研究は, 臨床意思決定, クロスシステム教育, 統合医療研究を支援することを目的としており, 最終的に, TCMの象徴的言語を西洋医学の機械的焦点と整合させるための堅牢な足場を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:22:49 GMT)
CoServe: Efficient Collaboration-of-Experts (CoE) Model Inference with Limited Memory [3.4] GPT-4のような大規模言語モデルは資源集約型であるが、近年の進歩により、より小さな専門的な専門家が特定のタスクにおいてそれらより優れていることが示唆されている。
Collaboration-of-Expertsアプローチは、複数のエキスパートモデルを統合し、生成された結果の精度を改善し、精度クリティカルなアプリケーションに対して大きなポテンシャルを提供する。
メモリが制限された異種CPUおよびGPU上での効率的なCoEモデルサービスシステムであるCoServeを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:25:05 GMT)
Finite-temperature quantum topological order in three dimensions [3.3] 我々は、十分に小さいがゼロでない温度で長距離の絡み合いを示す3次元システムを特定する。
通常の3次元トーリック符号の変種であるフェルミオントーリック符号は、創発的なフェルミオン点様励起を認めている。
非零温度における位相秩序のさらなる例は、異常な2-形式対称性を持つ離散ゲージ理論によって与えられると推測する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:00 GMT)
A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping [3.3] グローバル測位システム(GPS)、慣性計測ユニット(IMU)、4Dミリ波レーダとカメラを統合したマルチセンサUAVシステムにより、この問題に対する効果的な解決策を提供することができる。
予め最適化された特徴マッチング手法を導入し、マッチング速度と精度を向上させる。
実験の結果,提案手法は短時間で正確な特徴マッチングを実現できることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:59:54 GMT)
DeLTa: A Decoding Strategy based on Logit Trajectory Prediction Improves Factuality and Reasoning Ability [3.3] 本稿では,事実的精度と推論的推論を両立させる新しい復号法を提案する。
提案手法は,トランスフォーマーの下位層から上位層へのロジットの軌跡を解析することにより,次の確率を調節する。
TruthfulQAの実験では、DeLTaはベースラインよりも4.9%改善されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:07:17 GMT)
Detecting LLM-Generated Korean Text through Linguistic Feature Analysis [3.2] LLM生成韓国語テキストを検出するための最初のベンチマークデータセットであるKatFishを紹介する。
音声の間隔パターン,部分音声の多様性,コンマ使用法を調べた結果,人文文とLLM生成韓国語文との言語的差異が明らかになった。
KatFishNetはAUROCよりも平均19.78%高い。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:26:41 GMT)
Realizing Quantum Adversarial Defense on a Trapped-ion Quantum Processor [3.2] 我々は、イオントラップ量子プロセッサ上に、データ再ロードに基づく量子分類器を実装した。
MNISTデータセットに優れたロバスト性を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:22:59 GMT)
Fixing the AdS$_3$ metric from the pure state entanglement entropies of CFT$_2$ [3.2] バルク内の測地線長を持つ摂動型CFT$$の純状態UVおよびIR絡み合いエントロピーを同定する。
我々の導出は静的シナリオと共変シナリオの両方で成り立つ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:06:45 GMT)
A Practical Introduction to Kernel Discrepancies: MMD, HSIC & KSD [3.2] 本稿では、最大平均離散性(MMD)、Hilbert-Schmidt Independence Criterion(HSIC)、Kernel Stein Discrepancy(KSD)に焦点をあてる。
一般的なV統計学やU統計学など、これらの相違点の様々な推定器が提示される。
カーネル帯域幅の選択の重要性は強調され、それが不一致推定の振る舞いにどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:42:34 GMT)
Regression and Forecasting of U.S. Stock Returns Based on LSTM [3.1] 本稿では、米国株式市場における3つの株式セクター、Manuf、Hitec、およびその他の投資リターンについて分析する。
ファマ・フレンチの3要素モデル、カーハートの4要素モデル、ファマ・フレンチの5要素モデルに基づいている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:25:14 GMT)
Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles [3.1] センサーの配置が小さくても、特に長距離での出力が著しく低下する可能性がある。
本稿では,センサの相違点を検出する,単純で汎用的で効率的なマルチタスク学習手法を実証する。
また, 補正の不確かさを予測し, 予測誤認識値のフィルタリングや拡散に役立てることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:23:27 GMT)
Making Better Mistakes in CLIP-Based Zero-Shot Classification with Hierarchy-Aware Language Prompts [3.0] 私たちはCLIPベースのゼロショット分類において、より良い誤りを犯すことを紹介します。
提案手法は, 5つのデータセットの総合的な比較において, 関連手法よりも優れている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:54:50 GMT)
Frankenstein Optimizer: Harnessing the Potential by Revisiting Optimization Tricks [2.9] 様々な適応アルゴリズムの機構を組み合わせたフランケンシュタインを提案する。
我々は、フランケンシュタインが既存の適応アルゴリズムと勾配降下(SGD)を超えることを示す。
本研究では,学習過程におけるカーネルアライメント解析とロスランドスケープの可視化を通じて,適応アルゴリズムの理解を深める。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:25:54 GMT)
Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair [2.9] 本稿では,問題コンテンツ(記述とメッセージ)とスタックエラートレースを用いてバグギーメソッドをローカライズするDevLoReを提案する。
異なるアーティファクトを組み込むことで、DevLoReはシングルとノンシングルのバグギーメソッドの49.3%と47.6%をうまく見つけることができた。
これは現在の最先端のAPRメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:06:35 GMT)
Identifying two-dimensional topological phase transition by entanglement spectrum : A fermion Monte Carlo study [2.9] 我々は粒子数とスピン対称性を利用してフェルミオン系の絡み合いスペクトルを解く。
我々は多体相互作用の異なるタイプのトポロジカル相転移の存在を検証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:49:50 GMT)
Trace of the Times: Rootkit Detection through Temporal Anomalies in Kernel Activity [2.9] カーネルルートキットはステルス操作を可能にするため、検出が困難である。
既存の検出アプローチは、新しいルートキットを検出できないシグネチャや、検出すべきルートキットに関するドメイン知識を必要とするシグネチャに依存している。
我々のフレームワークはカーネルにプローブを注入し、関連するシステムコール内の関数のタイムスタンプを測定し、関数の実行時間の分布を計算し、統計的テストを用いて時間シフトを検出する。
公開されているデータセットに対するオープンソース実装の評価は、システム状態の異なる5つのシナリオでF1スコア98.7%の高い検出精度を示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:43:38 GMT)
MonoLite3D: Lightweight 3D Object Properties Estimation [2.9] 本稿では,限られたリソースを持つハードウェア環境向けに設計された組み込みデバイスフレンドリーな軽量ディープラーニング手法であるMonoLite3Dネットワークを紹介する。
MonoLite3Dネットワークは、3Dオブジェクトの複数の特性を推定することに焦点を当てた最先端技術である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:31:09 GMT)
RAAD-LLM: Adaptive Anomaly Detection Using LLMs and RAG Integration [2.9] 本稿では,適応型異常検出のための新しいフレームワークであるRAAD-LLMを提案する。
ドメイン固有の知識を効果的に活用することにより、RAAD-LLMは時系列データにおける異常の検出を強化する。
その結果,実世界のデータセットでは,70.7から89.1に精度が向上した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:20:43 GMT)
Federated Learning for Privacy-Preserving Feedforward Control in Multi-Agent Systems [2.9] フィードフォワード制御(FF)制御にフェデレーション学習を統合する新しい手法を提案する。
このアプローチにより、FFコントローラのプライバシ保護、通信効率、分散化された継続的改善が可能になる。
自動運転のユースケースにおける本手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:07:25 GMT)
Semi-Supervised Audio-Visual Video Action Recognition with Audio Source Localization Guided Mixup [2.8] 映像と音声を併用した映像行動認識のための音声・視覚SSLを提案する。
UCF-51, Kinetics-400, VGGSoundデータセットの実験では,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:13:56 GMT)
A Comparative Evaluation of Quantification Methods [2.8] 量子化は、目に見えないデータに基づいてクラスラベルの分布を推定する問題を表す。
本研究では,40以上のデータセットに対する24の異なる手法を比較し,バイナリとマルチクラス定量化設定を考慮して検討する。
一般に全ての競合より優れているアルゴリズムは存在しないが、しきい値選択に基づくMedian SweepやTSMaxメソッドを含む一連の手法を識別する。
マルチクラス設定では,HDx法,一般化確率調整数,reme法,エネルギ距離最小化法,EMなど,異なるアルゴリズム群が優れた性能を発揮することを観察する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:20:55 GMT)
REAct: Rational Exponential Activation for Better Learning and Generalization in PINNs [2.8] 本稿では,4つの学習可能な形状パラメータからなるタンの一般化形式であるRational Exponential Activation(REAct)を紹介する。
実験により、REActは多くの標準およびベンチマークのアクティベーションより優れており、熱問題ではMSEがタンよりも3桁も低いことが示されている。
また、関数近似のタスクを最適化し、逆問題におけるノイズの除去を改善し、様々なノイズレベルに対してより正確なパラメータ推定を行う。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:28:59 GMT)
BdSLW401: Transformer-Based Word-Level Bangla Sign Language Recognition Using Relative Quantization Encoding (RQE) [2.8] Banglaのような低リソース言語に対する手話認識は、手話のバリエーション、視点の変化、限られたデータセットに悩まされている。
BdSLW401は18の注釈付きシグナーから401の符号と102,176のビデオサンプルを持つ大規模で多視点の単語レベルBandgla Sign Language(BdSL)データセットである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:34:06 GMT)
Wikipedia in the Era of LLMs: Evolution and Risks [2.7] 既存のデータを通じてウィキペディアにおけるLarge Language Models (LLM) の影響を分析し、シミュレーションを用いて潜在的なリスクを探索する。
その結果,Wikipedia の記事は LLM の影響を受けており,特定のカテゴリーの約1%-2% が影響していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:58:13 GMT)
Reflective-Net: Learning from Explanations [2.7] 従来のラベル付きデータと説明を組み合わせることで、分類精度と訓練効率が大幅に向上することがわかった。
トレーニング中は、正しいクラスや予測されたクラスの説明だけでなく、他のクラスの説明も使いました。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:42:03 GMT)
Adopt a PET! An Exploration of PETs, Policy, and Practicalities for Industry in Canada [2.6] プライバシー向上技術(PET)は、私たちのデジタル社会に存在するプライバシー問題に対する技術的解決策である。
プライバシー上の課題の増加と、世界中の政府によって提案されている新しい規制の増加にもかかわらず、PETの採用率は低い。
我々は,新たなプライバシ規制が産業の意思決定プロセスに与える影響と,プライバシ規制がPETの採用にどのような影響を及ぼすかを検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:08:56 GMT)
Evaluating Knowledge Generation and Self-Refinement Strategies for LLM-based Column Type Annotation [2.6] 本稿では,コラム型アノテーションの知識生成と自己補充戦略を実験的に比較する。
トークン使用量とコストの両面から,F1の性能と効率の両面から,これらの戦略を評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:32:59 GMT)
Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function [2.5] 計算オーバーヘッドを最小限に抑えたトポロジ対応ニューラルネットワークセグメンテーション法を提案する。
マウス脳の3次元光顕微鏡画像の公開データセット上で,その効果を実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:59:53 GMT)
Rethinking Reuse in Dependency Supply Chains: Initial Analysis of NPM packages at the End of the Chain [2.5] 本稿では,サードパーティパッケージへの依存を最小限に抑えるためのソフトウェア開発プラクティスの転換を提唱する。
これらのエンドツーエンドパッケージは、エコシステムにおいて重要な役割を担っているため、ユニークな洞察を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:26:34 GMT)
Multiscale Embedding for Quantum Computing [2.5] 本稿では,従来のQM/MM埋め込みとブートストラップ埋め込みを結びつける新しいマルチスケール埋め込み方式を提案する。
また,メモリ資源が制限された古典的コンピュータを用いて,拡張システム上でのBE計算を容易にする混合基底BE方式を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:25:42 GMT)
Multilingualism, Transnationality, and K-pop in the Online #StopAsianHate Movement [2.5] 我々は、世界中の2200万人のユーザーから650万の「#StopAsianHate」ツイートを分析し、60の異なる言語にまたがる。
英語ツイートのスパイクは米国の暴力犯罪によって引き起こされるが、非英語ツイートのスパイクは、アジア諸国の象徴的な代表者に対する反アジア感情の国際的インシデントによって引き起こされる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:21:22 GMT)
Multilingual Relative Clause Attachment Ambiguity Resolution in Large Language Models [2.4] 大型言語モデル (LLM) は相対節 (RC) のアタッチメントの曖昧さを解消する。
我々はLLMが言語の複雑さの中で人間的な解釈を達成できるかどうかを評価する。
我々は、英語、スペイン語、フランス語、ドイツ語、日本語、韓国語でモデルを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:56:56 GMT)
Domain Adaptation for Offline Reinforcement Learning with Limited Samples [2.4] オフライン強化学習は、静的ターゲットデータセットから効果的なポリシーを学ぶ。
ターゲットデータセットの品質とサイズに依存しており、ターゲットデータセットの限られたサンプルが利用可能であれば劣化する。
本稿では,各データセットに割り当てられた重みがオフラインRLの性能に与える影響を理論的に検討する最初のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:21:05 GMT)
Interacting Particle Langevin Algorithm for Maximum Marginal Likelihood Estimation [2.4] 我々は,最大限界推定法を実装するための相互作用粒子系のクラスを開発する。
特に、この拡散の定常測度のパラメータ境界がギブス測度の形式であることを示す。
特定の再スケーリングを用いて、このシステムの幾何学的エルゴディディティを証明し、離散化誤差を限定する。
時間的に一様で、粒子の数で増加しない方法で。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:20:36 GMT)
Creating Sorted Grid Layouts with Gradient-based Optimization [2.3] 本稿では,「無効」な置換行列の生成を確保すること,ベクトル間の類似性を反映したグリッド上の配置を最適化すること,の2つの相反する目標のバランスをとる新しい損失関数を提案する。
提案手法は,従来の手法に比べてソート品質の優れたソートグリッドレイアウトを生成する上で有望な結果を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:49:42 GMT)
Do we still need Human Annotators? Prompting Large Language Models for Aspect Sentiment Quad Prediction [2.3] 本稿では,ASQPタスクにおけるゼロおよび少数ショット学習のための大規模言語モデルの能力について検討する。
F1スコアは最先端の微調整モデルよりわずかに低いが,従来報告されていたゼロショットと少数ショットのパフォーマンスを上回っている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:51:34 GMT)
Reap the Wild Wind: Detecting Media Storms in Large-Scale News Corpora [2.2] 本稿では,大規模ニュース記事のコーパスにおいて,メディア・ストームを識別する反復的ヒューマン・イン・ザ・ループ手法を提案する。
本手法の適用性は,まず,特定の時間枠内にメディアストームの最初のリストを補足すること,および新しい時間帯におけるメディアストームを検出することの2つのシナリオで実証する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:10:27 GMT)
One Model to Train them All: Hierarchical Self-Distillation for Enhanced Early Layer Embeddings [2.1] 1Bパラメータを持つモジュール型マルチエグジットエンコーダであるMODcularSTARENCODERを導入し、コード検索の範囲内での複数のタスクに有用である。
本アーキテクチャは,構文構造と意味構造を体系的に捉えることで,テキスト・ツー・コード検索とコード・ツー・コード検索の強化に重点を置いている。
また、コード翻訳によって構築された新しいデータセットもリリースし、様々なプログラミング言語にまたがって、従来のテキスト-コードベンチマークをシームレスに拡張しました。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:08:17 GMT)
Incorporating graph neural network into route choice model [2.1] 本稿では,グラフニューラルネットワーク(GNN)に再帰ロジットモデルを統合するハイブリッドモデルを提案する。
数学的には、GNNの使用は予測性能の向上だけでなく、非関連代替資産の独立を緩和する上で有益であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:16:55 GMT)
Implicit Bias in LLMs: A Survey [2.1] 本稿では,大規模言語モデルにおける暗黙バイアスに関する既存の文献を包括的にレビューする。
まず、心理学における暗黙の偏見に関連する重要な概念、理論、方法を紹介する。
検出方法は,単語関連,タスク指向テキスト生成,意思決定の3つの主要なアプローチに分類する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:49:37 GMT)
Stochastic Resetting Mitigates Latent Gradient Bias of SGD from Label Noise [2.0] 本稿では,チェックポイントからのリセットにより,ディープニューラルネットワーク(DNN)をノイズラベルでトレーニングする際の一般化性能が大幅に向上することを示す。
ノイズの多いラベルが存在する場合、DNNはまずデータの一般的なパターンを学習するが、徐々に破損したデータを記憶し、過度に適合する。
勾配降下(SGD)のダイナミクスを分解することにより,雑音ラベルによる遅延勾配バイアスの挙動を同定し,一般化を損なう。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:51:53 GMT)
A new Linear Time Bi-level $\ell_{1,\infty}$ projection ; Application to the sparsification of auto-encoders neural networks [2.0] 我々は、$ell_1,infty$ノルムの時間複雑性が、行列 $ntimes m$ に対して$mathcalObig(n m big)$ であることを示す。
実験によると、我々の2レベル$ell_1,infty$プロジェクションは、実際の最速アルゴリズムよりも2.5ドル速い。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:41:42 GMT)
Mutual Information Bounded by Fisher Information [2.0] 我々は、フィッシャー情報の観点から、相互情報に対する一般的な上限を導出する。
次にそれらを量子ケースに一般化し、量子フィッシャー情報の観点からホレヴォ情報を束縛する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:54:17 GMT)
FairSense-AI: Responsible AI Meets Sustainability [2.0] テキストと画像の両方のバイアスを検出し緩和するフレームワークであるFairSense-AIを紹介する。
我々は、FairSense-AIが、公正性の社会的次元と、大規模AIデプロイメントにおける持続可能性の必要性の両方に対処することによって、責任あるAI利用を促進する方法を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:43:57 GMT)
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [2.0] 本稿では,新しい言語インフォームドハイパースペクトル画像合成法であるTxt2HSI-LDM(VAE)を提案する。
ハイパースペクトルデータの高次元性に対処するため、普遍変分オートエンコーダ(VAE)は、データを低次元の潜在空間にマッピングするように設計されている。
VAEは、拡散モデルによって生成された潜時空間から言語条件を入力としてHSIをデコードする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:20:32 GMT)
How to compute the volume in low dimension? [2.0] 凸体の体積を推定することは理論計算機科学における標準的な問題である。
我々は、この問題の決定論的、ランダム化、および量子的クエリの複雑さを、高精度な極限で厳しく特徴づける。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:38:51 GMT)
Four Principles for Physically Interpretable World Models [2.0] 未来の高次元観測を確実に予測できる信頼できる世界モデルの必要性が高まっている。
本稿では,物理情報から物理的解釈可能な世界モデルへの根本的な変化を論じる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:19:32 GMT)
AI Enabled User-Specific Cyberbullying Severity Detection with Explainability [1.9] 本稿では, 心理的要因(自尊心, 不安, 抑うつ), オンライン行動(ネットワーク利用, 学歴), 人口統計特性(人種, 性別, 民族性), ソーシャルメディアのコメントなど, ユーザ固有の属性を取り入れたAIモデルを提案する。
LSTMモデルは,ユーザレベルの属性だけでなく,ソーシャルメディアコメントの感情的,話題的,言葉2vec表現を取り入れた146の特徴を用いて訓練されている。
以上の結果から、ヘイトコメント以外にも、特定の人種・性別グループに属する被害者は、より頻繁に標的にされ、うつ病、懲戒的問題、自尊心の低さを呈することが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:11:42 GMT)
MedFuncta: Modality-Agnostic Representations Based on Efficient Neural Fields [1.9] 我々は、ニューラルネットワークに基づくモダリティに依存しない連続データ表現であるMedFunctaを紹介する。
医療信号の冗長性を利用して、単一インスタンスから大規模データセットにニューラルネットワークをスケールする方法を実証する。
我々は、この方向の研究を促進するために、 > 550kの注釈付きニューラルネットワークの大規模なデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:08:22 GMT)
Hierarchical Refinement: Optimal Transport to Infinity and Beyond [1.9] 最適なトランスポート(OT)は、最小コストの対応を通じてデータセットを整列する原則的な方法として、機械学習において大きな成功を収めている。
シンクホーンは点数において2次空間の複雑さを持ち、拡張性はより大きなデータセットに制限される。
低ランクOTサブプロブレムを用いてデータセットのマルチスケールパーティションを動的に構築するアルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:00:12 GMT)
Augmenting Chest X-ray Datasets with Non-Expert Annotations [1.9] 非専門的アノテーションを組み込むことで,2つの公開胸部X線データセットを強化する。
専門家ラベルによく一般化する非専門アノテーションで胸部ドレイン検出器を訓練する。
本研究は,基礎的真理アノテーションの品質に対する意識を高めるための病理学的合意研究である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:04:45 GMT)
PainDiffusion: Learning to Express Pain [1.9] 自然主義的な顔面痛表情を合成する生成モデルPainDiffusionを紹介する。
PainDiffusionは連続的な潜伏空間で動作し、より滑らかで自然な顔の動きを保証する。
本手法は、痛み表現性や感情などの本質的な特徴を取り入れ、パーソナライズされた、制御可能な痛み表現合成を可能にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:11:49 GMT)
Don't Get Too Excited -- Eliciting Emotions in LLMs [1.8] 本稿では,大規模言語モデル(LLM)における影響制御の課題について考察する。
我々は,その感情表現範囲を評価するために,最先端のオープンウェイトLLMを評価した。
モデルの能力を定量化し、幅広い感情のスペクトルを表現し、相互作用の間どのように変動するかを定量化する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:06:41 GMT)
Beyond the Lens: Quantifying the Impact of Scientific Documentaries through Amazon Reviews [1.8] 科学を大衆に浸透させることは、知名度の高い人々にとって非常に重要だ。
いくつかの科学論文に対するAmazonのレビューの量的影響と感情分析。
データセットには1043のAmazonレビューからの1296の人文が含まれている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:46:28 GMT)
PANTHER: Pluginizable Testing Environment for Network Protocols [1.8] PANTHERは、ネットワークプロトコルをテストし、仕様を正式に検証するためのモジュラーフレームワークである。
そのモジュール設計は複雑なプロトコル特性を検証し、動的な振る舞いに適応し、拡張性のためにシームレスなプラグイン統合を容易にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:56:03 GMT)
A Hypernetwork-Based Approach to KAN Representation of Audio Signals [1.7] Inlicit Neural representations (INR) はマルチメディアデータを効率的に符号化する方法として有名になったが、音声信号への応用は限られている。
本研究では,学習可能なアクティベーション関数を用いた新しいアーキテクチャであるKAN(Kolmogorov-Arnold Network)を,音声表現のための効果的なINRモデルとして紹介する。
そこで我々は,INRパラメータを更新するハイパーネットワークアーキテクチャであるFewSoundを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:08:45 GMT)
Interpretable Interaction Modeling for Trajectory Prediction via Agent Selection and Physical Coefficient [1.7] 本稿では、手動で対話エージェントを選択し、Transformerの注目スコアを新たに計算された物理相関係数に置き換えるASPILinを提案する。
驚くべきことに、これらの単純な修正は予測性能を大幅に改善し、計算コストを大幅に削減することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:07:09 GMT)
Do you monitor CI Practices? I don't know. You tell me: A case study [1.7] ブラジルの3つの公共組織における現実シナリオにおける7つのCIプラクティスの監視の効果を評価することを目的としている。
企業はCIプラクティスの監視を採用し、CIサービスがこの監視をダッシュボードに統合することを推奨しています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:30:06 GMT)
Near-Term Spin-Qubit Architecture Design via Multipartite Maximally-Entangled States [1.6] 回路レベルの忠実度測定とともに、真の多部量子絡み合いの質を確認する4つの指標を導入する。
我々は,スピンキュービットデバイスの期待するハードウェア特性と適切なコンパイル手法を組み合わせたシミュレーションを考案した。
疎結合なスピン量子格子は、我々の測定値と最も高接続のデバイスアーキテクチャの値に匹敵する値に近づくことができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:24:00 GMT)
Vibration-Assisted Hysteresis Mitigation for Achieving High Compensation Efficiency [1.5] テンドンシース機構 (TSM) は, 最小侵襲手術 (MIS) の応用に広く用いられている。
TSMは、摩擦、逆転、腱伸長のリードが大きなトラッキングエラーの原因である。
本稿では,振動支援による摩擦緩和とデッドゾーン低減のための補償手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:36:19 GMT)
Privacy-Preserving Fair Synthetic Tabular Data [1.5] WGAN-GPモデルに基づくプライバシー保護・公正な合成データ生成装置であるPF-WGANを提案する。
プライバシと公正性の制約を加えて、プライバシを保存する公正なデータを生成することで、元のWGAN-GPを修正しました。
このアプローチにより、個人のプライバシを保護し、特定のグループに対してバイアスをかけないデータセットの公開が可能になる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:51:00 GMT)
SYN-LUNGS: Towards Simulating Lung Nodules with Anatomy-Informed Digital Twins for AI Training [1.5] 肺がんスクリーニングのための生成モデルは、データ不足によって制限され、一般化可能性と臨床応用性に影響を与える。
詳細なアノテーションで高品質な3DCT画像を生成するためのフレームワークであるSyn-LUNGSを紹介する。
データセットには1,044個のCTスキャンから3,072個の結節画像が含まれ、512個の病変と174個のデジタルツインがある。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:18:40 GMT)
Closing the Intent-to-Reality Gap via Fulfillment Priority Logic [1.5] 本稿では,FPL(Fulfillment Priority Logic)を構築する目的達成の概念について述べる。
われわれの新しいバランスポリシー勾配アルゴリズムは、FPL仕様を利用して、ソフトアクター批評家と比較して最大500%のサンプル効率を達成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:45:20 GMT)
Loss Landscape of Shallow ReLU-like Neural Networks: Stationary Points, Saddle Escape, and Network Embedding [1.5] 経験的二乗損失を学習したReLU様活性化関数を持つ一層ニューラルネットワークの損失状況について検討した。
トレーニング中の損失減少を著しく抑制するネットワークの定常点を同定する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:56:57 GMT)
Evaluating CrowdSplat: Perceived Level of Detail for Gaussian Crowds [1.4] 3次元ガウススプラッティングはリアルタイムの群衆レンダリングの潜在的手法として研究されている。
本研究では,3次元ガウスアバターの知覚品質を判定する2つの代替的強制選択実験を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:17:14 GMT)
CrowdSplat: Exploring Gaussian Splatting For Crowd Rendering [1.4] 本稿では,3次元ガウススプラッティングをリアルタイム,高品質な群衆レンダリングに活用する新しいアプローチであるCrowdSplatを提案する。
CrowdSplatは、リアルタイムアプリケーションにおける動的で現実的なクラウドシミュレーションのための実行可能なソリューションである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:25:51 GMT)
Danoliteracy of Generative Large Language Models [1.4] デンマーク語と文化能力の尺度であるemphDanoliteracyを評価するためのGLLMベンチマークを提案する。
デンマーク語で GLLM のシナリオ性能のばらつきを95% で説明できる強力な要因が1つ見いだされる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:13:20 GMT)
Flexible Prefrontal Control over Hippocampal Episodic Memory for Goal-Directed Generalization [1.4] 人間は数日から何年も前にエピソード記憶を復元し、新しいが構造的に関係のある状況にまたがって行動のコンテキスト化と一般化を行う。
前頭前皮質(PFC)と海馬(HPC)の相互作用による脳の課題要求に基づくてんかん記憶の制御能力
ゴール指向一般化のためのPFC-HPC相互作用機構を組み込んだ強化学習モデルを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:04:54 GMT)
Weakly-Constrained 4D Var for Downscaling with Uncertainty using Data-Driven Surrogate Models [1.4] 動的ダウンスケーリングは通常、数値的な天気予報ソルバを使用して粗いデータをより高い空間分解能に洗練する。
FourCastNetのようなデータ駆動モデルは、予測のための従来のNWPモデルに代わる有望な選択肢として登場した。
本稿では、データ同化手法を用いて、ダウンスケーリングタスクに使用する場合の安定化を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:33:54 GMT)
Out-of-Distribution Segmentation in Autonomous Driving: Problems and State of the Art [1.4] 我々は,OoD(Out-of-Distribution)セグメンテーションにおける技術の現状を概観し,実世界のアプリケーションとしての自動運転における道路障害物検出に着目した。
我々は、広く使われている2つのベンチマーク、SegmentMeIfYouCan Obstacle TrackとLostAndFound-NoKnownで既存のメソッドのパフォーマンスを分析した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:52:38 GMT)
Generative Tools for Graphical Assets: Empirical Guidelines based on Game Designers' and Developers' Preferences [1.4] 我々は16人のゲームデザイナと開発者とともにユーザスタディを行い、グラフィカルな資産のための生成ツールの好みについて検討した。
この結果は、初期の設計段階がすべての参加者に好まれていることを浮き彫りにしている。
デザイナーや開発者は、品質の犠牲で大量のバリエーションを作成するためにそのようなツールを使うのを好む。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:18:50 GMT)
Robust Multi-Source Domain Adaptation under Label Shift [1.3] 教師なしマルチソースドメイン適応は、ソースドメインからのラベル付きサンプルを用いて、ターゲットドメイン内のラベルなしサンプルのラベルを予測することを目的としている。
対象ドメインのクラス比のロバストな推定のための,ドメイン重み付き経験的リスク最小化フレームワークについて検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:17:34 GMT)
Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments [1.3] 本稿では,未知の静的環境における局所軌道計画のための最適集合のオンライン推定のための学習に基づく新しいアプローチを提案する。
モデル予測制御(MPC)ローカルプランナの終端セット制約として、集合の神経表現を用いる。
我々は,提案手法であるNTC-MPCを物理ロボットに展開し,ベースラインが故障した場合の障害物を安全に回避できることを実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:33:17 GMT)
A Multimodal Symphony: Integrating Taste and Sound through Generative AI [1.3] 本稿では味覚情報を音楽に変換するマルチモーダル生成モデルについて述べる。
本稿では,各楽曲に提供される詳細な味覚記述に基づいて,音楽生成モデル(MusicGEN)の微調整版を用いて音楽を生成する実験を行う。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:48:48 GMT)
LINGOLY-TOO: Disentangling Memorisation from Reasoning with Linguistic Templatisation and Orthographic Obfuscation [1.3] 本稿では,モデル性能推定における暗記の影響を低減する言語推論問題を生成するための枠組みを提案する。
本稿では,言語推論のための評価ベンチマークであるlingOLY-TOOを開発するために,このフレームワークを適用した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:57:47 GMT)
Weighted Euclidean Distance Matrices over Mixed Continuous and Categorical Inputs for Gaussian Process Models [1.2] Weighted Euclidean distance matrices Gaussian Process (WEGP)を紹介する。
この入力のすべてのカテゴリ選択の中からユークリッド距離行列(EDM)を推定することにより、各カテゴリ入力に対するカーネル関数を構築する。
我々は,合成および実世界の最適化問題において,優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:55:22 GMT)
Sequential Learning in the Dense Associative Memory [1.2] 本稿では,生体神経ネットワーク研究のツールとして,連想記憶(DAM)について検討する。
DAMにおけるシーケンシャルラーニングの基礎的ベンチマークを,様々なシーケンシャルラーニング手法を用いて実施する。
逐次学習の結果を分析し,DAMの行動にこれまで見つからなかった変化を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:41:17 GMT)
Goat Optimization Algorithm: A Novel Bio-Inspired Metaheuristic for Global Optimization [1.2] 本稿では,ヤギの適応採餌,戦略運動,寄生虫の回避行動に触発された,生物にインスパイアされたメタヒューリスティックな最適化手法を提案する。
アルゴリズムの性能は標準の単調なベンチマーク関数で評価される。
その結果,GOAはバイオインスパイアされた最適化技術において有望な進歩であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:44:07 GMT)
Classifying States of the Hopfield Network with Improved Accuracy, Generalization, and Interpretability [1.2] 本研究では、異なるプロトタイプタスクから派生した状態に基づいて、異なる分類モデルの一般化可能性について検討する。
単純なモデルは解釈可能なままの安定性比を上回ることがよく分かる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:29:42 GMT)
Anytime-Constrained Equilibria in Polynomial Time [1.2] 本稿では,実現可能な政策の計算的特徴を含む任意の時間制約均衡の包括的理論を提案する。
また、アクション制約付きマルコフゲームに対する効率的な計算の第一理論も開発し、これは独立した関心を持つかもしれない。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:40:33 GMT)
Privacy Preservation Techniques (PPTs) in IoT Systems: A Scoping Review and Future Directions [1.2] 本研究は,2010年から2023年にかけてのIoTシステムに関するこれまでの研究で使用されている,さまざまな種類のプライバシ保護技術(PPT)のスコーピングレビューを行った。
PPTはさまざまなプライバシの目標を達成し、IoTシステム内の潜在的なプライバシの脅威を軽減することで、さまざまなプライバシの懸念に対処する。
この調査では、IoTの顕著なプライバシ目標やプライバシタイプなど、重要な発見について論じている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:03:45 GMT)
Trust and Friction: Negotiating How Information Flows Through Decentralized Social Media [1.1] 分散されたソーシャルメディアプロトコルにより、独立したユーザホスト型サーバのユーザは、セルフガバナンス中に相互に対話できる。
コミュニティベースのこのソーシャルメディアガバナンスのモデルは、情報フローに関する適切な意思決定の新しい機会を開く。
我々は,分散型ソーシャルメディアネットワークであるFediverseのユーザ23名を対象に,半構造化インタビューを行った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:29:32 GMT)
Network Traffic Classification Using Machine Learning, Transformer, and Large Language Models [1.1] 本研究では,ネットワークトラフィックの分類,Webへのトラフィックの分類,ブラウジング,バックアップ,電子メールなど,さまざまなモデルを用いた。
Arbor Edge Defender(AED)デバイスから,30,959の観測結果と19の特徴からなる包括的なデータセットを収集した。
Naive Bayes, Decision Tree, Random Forest, Gradient Boosting, XGBoost, Deep Networks (DNN), Transformer, and two Large Language Models (LLMs) with zero- and few-shot learning。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:18:58 GMT)
Overcoming Slow Decision Frequencies in Continuous Control: Model-Based Sequence Reinforcement Learning for Model-Free Control [1.1] 本稿では、与えられた入力状態に対するアクションのシーケンスを生成するために設計されたRLアルゴリズムであるSequence Reinforcement Learning(SRL)を紹介する。
SRLは、異なる時間スケールで動作するモデルとアクタークリティカルアーキテクチャの両方を利用することで、アクションシーケンスを学習する際の課題に対処する。
我々は,SRLを一連の連続制御タスクで評価し,その性能が最先端のアルゴリズムに匹敵することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:11:25 GMT)
TwinLiteNetPlus: A Stronger Model for Real-time Drivable Area and Lane Segmentation [1.1] 本稿では,現在最先端(SOTA)モデルの高計算コストに対応するため,TwinLiteNetPlusを提案する。
TwinLiteNetPlusは、標準および深さ的に分離可能な拡張畳み込みを導入し、高い精度を維持しながら複雑さを低減している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:29:23 GMT)
Towards a Taxonomy for Autonomy in Large-Scale Agile Software Development [1.1] 本稿では,大規模アジャイル開発における自律性のためのフレームワーク構築に向けた取り組みについて述べる。
予備版では5つのレベルと21の自律性が3つの領域に分類されている。
このような自律性の側面は、大規模アジャイルソフトウェア開発における自律性の限界を分析したり定義したりする際に考慮することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:15:16 GMT)
One Patient's Annotation is Another One's Initialization: Towards Zero-Shot Surgical Video Segmentation with Cross-Patient Initialization [1.1] ビデオオブジェクトセグメンテーションは、リアルタイムな外科的ビデオセグメンテーションに適した新興技術である。
しかし、追跡されたオブジェクトを選択するために手動で介入する必要があるため、その採用は限られている。
本研究では,他の患者からの注釈付きフレームを追跡フレームとして使用することで,この課題を革新的な解決法で解決する。
この非従来的アプローチは、患者の追跡フレームの使用実績と一致したり、超えたりすることさえできる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:11:03 GMT)
Malware Classification from Memory Dumps Using Machine Learning, Transformers, and Large Language Models [1.0] 本研究では,異なる特徴セットとデータ構成を用いたマルウェア分類タスクにおける各種分類モデルの性能について検討する。
XGBはTop 45 Featuresで87.42%の精度を達成し、他の全てのモデルを上回った。
ディープラーニングモデルはパフォーマンスが悪く、RNNは66.71%の精度でトランスフォーマーは71.59%に達した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:24:21 GMT)
LLM Misalignment via Adversarial RLHF Platforms [1.0] 強化学習は、言語モデルと人間の嗜好の整合において顕著な性能を示した。
RLHFプラットフォームは報酬モデリングやRLHFファインチューニングといった便利な機能を提供する。
公開されているRLHFツールをターゲットとしたアタックを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:38:54 GMT)
Hierarchical graph sampling based minibatch learning with chain preservation and variance reduction [1.0] グラフサンプリングに基づくグラフ畳み込みネットワーク(GCN)は、ミニバッチトレーニング中に前と後ろの伝播からサンプリングを分離する。
階層的なグラフサンプリングに基づく学習手法であるHIS_GCNsを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:08:45 GMT)
Remote Sensing Image Classification Using Convolutional Neural Network (CNN) and Transfer Learning Techniques [1.0] 本研究では, 送電塔, 森林, 農地, 山々の航空画像の分類について検討した。
分類ジョブを完了するには、畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて入力写真から特徴を抽出する。
本研究では,移動学習モデル,特にMobileNetV2がランドスケープ分類に有効であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:19:18 GMT)
Achievable rates in non-asymptotic bosonic quantum communication [1.0] ガウス流路の非漸近容量の計算容易な下界を求める。
我々は2つのガウス状態間のトレース距離を固定精度で計算できる最初のアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:34:13 GMT)
SAGE-Amine: Generative Amine Design with Multi-Property Optimization for Efficient CO2 Capture [1.0] SAGE-AmineはCO2捕捉に適した新しいアミンを設計するための生成モデリング手法である。
アミンデータセットに基づいてトレーニングされた自己回帰自然言語処理モデルを活用することで、新しいアミンを生成する。
これは、CO2捕捉のための既知のアミンをスクラッチから同定し、シングルプロパティ最適化を成功させた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:02:36 GMT)
SPG: Improving Motion Diffusion by Smooth Perturbation Guidance [1.0] Smooth Perturbation Guidanceは、デノナイジングステップの運動を時間的に滑らかにすることで弱いモデルを構築する。
この研究は、異なるモデルアーキテクチャとタスクを包括的に分析する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:00:05 GMT)
How Ambiguous Are the Rationales for Natural Language Reasoning? A Simple Approach to Handling Rationale Uncertainty [1.0] 本研究では,自然言語推論のモデル性能におけるあいまいな有理性の役割について検討する。
そこで本研究では,理論のあいまいさに応じて2つの異なる推論経路を選択するための簡単な方法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:22:10 GMT)
Training a multilayer dynamical spintronic network with standard machine learning tools to perform time series classification [1.0] 本稿では,スピントロニック振動子を動的ニューロンとして用いたハードウェア上でのリカレントニューラルネットワークの実現を提案する。
9.83pm2.91%の精度でシーケンシャル桁分類タスクを解く。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:41:49 GMT)
Examining the Mental Health Impact of Misinformation on Social Media Using a Hybrid Transformer-Based Approach [1.0] 虚偽の物語の未確認の拡散は、精神的健康に大きな影響を与え、ストレス、不安、誤報によって引き起こされるパラノイアに寄与する。
本研究では,RoBERTa-LSTM分類器を用いたハイブリッドトランスフォーマーによる誤情報検出,メンタルヘルスへの影響評価,誤情報曝露に関連する障害の分類を行う。
提案モデルでは, 誤情報, 精神保健への影響, 障害分類の精度が98.4, 87.8, 77.3であった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:45:17 GMT)
Revolutionizing Traffic Management with AI-Powered Machine Vision: A Step Toward Smart Cities [0.9] 本研究では、人工知能(AI)と機械ビジョン技術が交通システムに革命をもたらす可能性を探求する。
本研究は、高度な監視カメラとディープラーニングアルゴリズムを活用して、車両、交通異常、運転者の挙動をリアルタイムに検出するシステムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:50:42 GMT)
Federated nnU-Net for Privacy-Preserving Medical Image Segmentation [0.9] フェデレートラーニング(Federated Learning)は、患者のプライバシを保護するために、分散的な方法でセグメンテーションモデルをトレーニングするアプローチのひとつだ。
フェデレーションフィンガープリント抽出(FFE)と非対称フェデレーション平均化(AsymFedAvg)という2つの新しいフェデレーション学習手法をnnU-Netフレームワークに導入する。
プライバシーに制約のある機関における分散トレーニングの研究と展開をさらに促進するため、当社のプラグインプレイフレームワークを一般公開する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:20:06 GMT)
DermaSynth: Rich Synthetic Image-Text Pairs Using Open Access Dermatology Datasets [0.9] Derma Synthは、45,205の画像からキュレートされた92,020の合成画像-テキストペアのデータセットである。
Gemini 2.0を用いた最先端の視覚大言語モデルを利用して、多種多様なリッチな合成テキストを生成する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:36:10 GMT)
Aggregation Strategies for Efficient Annotation of Bioacoustic Sound Events Using Active Learning [0.9] アクティブラーニング(AL)のための新しい不確実性集約戦略であるTop K Entropyを紹介する。
トップKエントロピーは、すべてのセグメントで不確実性を平均化するのではなく、オーディオ録音における最も不確実なセグメントを優先する。
より少ない音響イベントを持つデータセットにおいて、ラベルの少ない場合、同じモデル性能につながることが示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:08:33 GMT)
A generalized approach to label shift: the Conditional Probability Shift Model [0.9] Conditional Probability Shift (CPS) は、特定の特徴が変化したクラス変数の条件分布をキャプチャする。
多項回帰を用いたクラス変数の条件付き確率のモデル化に基づくCPSMを提案する。
CPSMの有効性は、合成データセットの実験およびMIMIC医療データベースを用いたケーススタディを通じて実証される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:07:20 GMT)
Annotating and Inferring Compositional Structures in Numeral Systems Across Languages [0.8] 本稿では,数値アノテーションの簡易かつ効果的な符号化方式と,コンピュータ支援方式による数値システムのコーディングを支援するワークフローを提案する。
試料を網羅的に分析し,基礎構造と表面形態構造との系統的比較に着目する。
サブワードトークン化アルゴリズムは,低リソースシナリオにおける形態素の発見には有効ではないことを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:33:16 GMT)
Analysing Multiscale Clusterings with Persistent Homology [0.8] マルチスケールクラスタリングフィルタ(MCF)を導入する。
MCFは、粗さを増大させるスケールをまたいだパーティションのシーケンスで任意のクラスタ割り当てを符号化する。
MCF の 0 次元持続ホモロジーは、この列の階層の度合いを測定する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:28:03 GMT)
Evaluating Creative Short Story Generation in Humans and Large Language Models [0.8] 大規模言語モデル (LLM) は高品質なストーリーを生成する能力を示したが、創造的なストーリー記述能力は未探索のままである。
我々は,5文の創造的ストーリー記述タスクを用いて,60 LLMと60人の短いストーリー生成において,創造性を体系的に分析する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:10:59 GMT)
Client-Aided Secure Two-Party Computation of Dynamic Controllers [0.8] 提案プロトコルは,2つのサーバに対するコントローラ計算のアウトソーシングを実現する。
プロトコルの実現性は、PIDとオブザーバベースの制御の数値的な例を通して示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:35:47 GMT)
Hamiltonian Learning at Heisenberg Limit for Hybrid Quantum Systems [0.7] ハイブリッドスピンボソン系におけるハミルトン学習がハイゼンベルク極限を達成することを実証する。
我々のアルゴリズムは、ハミルトン結合パラメータをルート平均二乗誤差(RMSE)$epsilon$まで推定し、総進化時間スケーリングを$T sim MathcalO(epsilon-1)$とすることができる。
また、分散量子センシングに基づく代替アルゴリズムも提供し、測定あたりの最大進化時間を著しく短縮する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:48:26 GMT)
BiasICL: In-Context Learning and Demographic Biases of Vision Language Models [0.7] 視覚言語モデル (VLM) は, 診断において有望であるが, テキスト内学習 (ICL) を用いた場合の集団間パフォーマンスはいまだによく分かっていない。
胸部X線写真からの皮膚病変の悪性度予測と気胸検出の2つの医療画像課題において, 実演例の人口構成がVLMパフォーマンスに与える影響について検討した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:45:54 GMT)
From Voices to Worlds: Developing an AI-Powered Framework for 3D Object Generation in Augmented Reality [0.7] MatrixはAugmented Reality(AR)環境でリアルタイム3Dオブジェクト生成用に設計された高度なAIベースのフレームワークである。
最先端のテキストから3D生成AIモデル,多言語音声からテキストへの翻訳,および大規模言語モデルを統合することで,音声コマンドによるシームレスなユーザインタラクションを実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:31:51 GMT)
Catheter Detection and Segmentation in X-ray Images via Multi-task Learning [0.7] 複数の予測ヘッドとresnetアーキテクチャを統合した畳み込みニューラルネットワークモデルを提案する。
また,電極検出とカテーテルセグメンテーションを同時に行うためのマルチタスク学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:32:32 GMT)
Encountering Friction, Understanding Crises: How Do Digital Natives Make Sense of Crisis Maps? [0.7] 本研究では、危機地図と対話する若いデジタルネイティブ視聴者のセンスメイキングについて検討する。
これらのクラスタに接続された摩擦点を識別する。カラー概念との闘い、コンテキストの欠如への応答、個人的なつながりの欠如、不信などである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:01:31 GMT)
Technique Inference Engine: A Recommender Model to Support Cyber Threat Hunting [0.7] サイバー脅威ハンティングは、ネットワーク内の潜伏脅威を積極的に探すプラクティスである。
キャンペーンの一部として同時に発生する可能性のあるテクニックを特定する上で,アナリストを支援するために,Technology Inference Engineを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:31:43 GMT)
Confidential Prompting: Protecting User Prompts from Cloud LLM Providers [0.7] クラウドホスト型大規模言語モデル(LLM)サービスにおけるユーザインプットの確保という課題に対処する。
秘密計算を用いてユーザプロンプトを信頼された実行環境に閉じ込めるセキュアなパーティショルドデコーディング(SPD)を導入する。
また,新しい暗号手法であるPrompt Obfuscation(PO)を導入し,SPDに対する復元攻撃に対する堅牢性を確保する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:58:42 GMT)
Nonlinear energy-preserving model reduction with lifting transformations that quadratize the energy [0.7] 本研究は, 一般非線形性を有する保守型PDEに対する構造保存2次還元次モデルを導出するために, 昇降変態を用いた非線形モデル還元法を提案する。
提案手法は, オンライン段階における精度と計算効率の両面から, 最先端構造保存型超減算法と競合する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:42:37 GMT)
Discovering Antagonists in Networks of Systems: Robot Deployment [0.7] カバータスクを実行するロボット群における身体動作に対して,文脈異常検出法を提案し,適用した。
スウォームの正常な動作のシミュレーションを用いて、ロボットの動きの可能性を予測するために正規化フローを訓練する。
適用中、観測された動作の予測可能性は、ロボットエージェントを通常的または対角的と分類する検出基準によって使用される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:15:40 GMT)
Improving Oil Slick Trajectory Simulations with Bayesian Optimization [0.6] 我々は,MEIK-II数値油流出モデルとベイズ最適化フレームワークを統合する。
水平拡散率やドリフト係数といった重要なパラメータに焦点を当てる。
提案手法は,デフォルトパラメータを持つ制御シミュレーションと比較して,FSSを5.82%から11.07%に体系的に改善することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:14:16 GMT)
Wyckoff Transformer: Generation of Symmetric Crystals [0.6] 内部対称性は、物理的、化学的、電子的性質を決定する上で基本的な役割を果たす。
空間群対称性に基づく材料生成モデルWyFormerを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:50:10 GMT)
Residual Kolmogorov-Arnold Network for Enhanced Deep Learning [0.6] 我々はRKAN(Residual Kolmogorov-Arnold Network)を導入する。
提案するRKANモジュールは,よく知られたベンチマークデータセットのベースモデルに対して一貫した改善を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:34:37 GMT)
A dataset-free approach for self-supervised learning of 3D reflectional symmetries [0.6] 我々は,入力オブジェクト自体にのみデータセット解析を必要とせず,単一のオブジェクトの対称性を検出することを学習する自己教師モデルについて検討する。
基礎的真理ラベルの必要性を除去する自己教師型学習戦略を設計する。
私たちのモデルはより効率的で効果的で、最小限の計算資源とデータリソースで動作します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:22:08 GMT)
Blaze: Compiling JSON Schema for 10x Faster Validation [0.6] guardrailsは、Web APIの開発者に、入力が構造にマッチすることを保証するための便利な機能を提供する。
Blazeは複雑なスキーマを数秒から数分で効率的な表現にコンパイルし、ビルド時に最小限のオーバーヘッドを追加する。
Blazeにはいくつかのユニークな最適化が組み込まれており、既存のバリデータと比べて平均して10倍のバリデーション時間を短縮している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:35:51 GMT)
Weight transport through spike timing for robust local gradients [0.5] 機能的ニューラルネットワークの可塑性は、しばしばコストの勾配降下として表される。
これにより、局所的な計算との整合が難しい対称性の制約が課される。
本稿では、スパイクタイミング統計を用いて、効果的な相互接続間の非対称性を抽出し、補正するスパイクベースのアライメント学習を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:05:39 GMT)
ttta: Tools for Temporal Text Analysis [0.5] ほとんどのNLP技術は、時間に関してコーパスは均質であると考えている。
これは、単語やフレーズの意味が時間とともに変化するため、バイアスのある結果につながる、単純化である。
tttaパッケージは、時間とともにテキストデータを分析するためのツールのコレクションとして機能するはずである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:50:21 GMT)
Llamarine: Open-source Maritime Industry-specific Large Language Model [0.4] Llamarineは,海洋航法に特化して設計された,最初のオープンソースのLarge Language Model (LLM) である。
Llamarine 1.0は、海事教科書、研究出版物、ウィキペディアのウェブテキストを含む高品質なコーパスの訓練と微調整を継続して開発されている。
主な貢献は、(a)権威源からの総合的な海洋データセットのキュレーション、モデルの知識ベースにおける深度と信頼性を確保すること、(b)汎用LSMよりも高精度で複雑な航法課題を推論できる基礎モデルの開発、(c)ベンチマークの作成である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:23:10 GMT)
Mixed-State Quantum Denoising Diffusion Probabilistic Model [0.4] 本稿では,混合状態量子復調拡散確率モデル(MSQuDDPM)を提案する。
MSQuDDPMは、前方拡散過程における脱分極ノイズチャネルとパラメータ化量子回路と、後方除極ステップにおける射影測定を統合する。
量子アンサンブル生成タスクにおけるMSQuDDPMの評価を行い,その性能を実証した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:15:50 GMT)
Attack Tree Distance: a practical examination of tree difference measurement within cyber security [0.3] 実際の攻撃木を比較する方法が確立されていない。
我々は,4つの比較方法を定義し,学生を対象にした学習結果から作成した攻撃木のデータセットと比較した。
ノードラベルの比較方法として意味的類似性を適用することは有効なアプローチである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:05:07 GMT)
Performance of Zero-Shot Time Series Foundation Models on Cloud Data [0.3] 時系列基礎モデル(FM)は、ゼロショットマルチドメイン予測の一般的なパラダイムとして登場した。
我々は、よく知られたFMが、この設定で意味のある、あるいは正確なゼロショット予測を生成できないことを実証する。
FMが突然、不規則でランダムに見える予測を出力するケースなど、興味深い病理もいくつか紹介する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:02:59 GMT)
Explainable AI for Autism Diagnosis: Identifying Critical Brain Regions Using fMRI Data [0.3] 自閉症スペクトラム障害(ASD)の早期診断と介入は、自閉症者の生活の質を著しく向上させることが示されている。
ASDの客観的バイオマーカーは診断精度の向上に役立つ。
深層学習(DL)は,医療画像データから疾患や病態を診断する上で,優れた成果を上げている。
本研究の目的は, ASD の精度と解釈性を向上させることであり, ASD を正確に分類できるだけでなく,その動作に関する説明可能な洞察を提供する DL モデルを作成することである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:46:19 GMT)
A Phylogenetic Approach to Genomic Language Modeling [0.3] 系統樹上のヌクレオチド進化を明示的にモデル化するgLMを訓練するための新しいフレームワークを提案する。
本手法では,トレーニング中の損失関数にアライメントを組み込むことで予測を行う。
我々はこの枠組みを適用し、単一シーケンスのみから機能的に破壊的な変異を予測するモデルであるPhyloGPNを訓練した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:53:03 GMT)
Multimodal Deep Learning for Subtype Classification in Breast Cancer Using Histopathological Images and Gene Expression Data [0.3] 本稿では,乳がんをBRCAに分類する深層マルチモーダル学習フレームワークを提案する。
提案手法では,ResNet-50モデルを用いて画像の特徴抽出を行う。
本研究は, 乳がん亜型分類における深層学習の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:24:33 GMT)
Train on classical, deploy on quantum: scaling generative quantum machine learning to a thousand qubits [0.3] 量子回路に基づく瞬時生成モデルは,古典的ハードウェア上で効率的に学習可能であることを示す。
データ依存型パラメータ初期化戦略と組み合わせることで、不規則な高原の問題に遭遇することはない。
量子モデルは高次元データからうまく学習でき、単純なエネルギーベースの古典的生成モデルと比較して驚くほどよく機能する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:02 GMT)
Applications of Entropy in Data Analysis and Machine Learning: A Review [0.3] エントロピーの概念は他の物理学や数学の分野にも浸透した。
このレビューの主題は、データ分析と機械学習における彼らの応用である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:43:48 GMT)
Network Anomaly Detection for IoT Using Hyperdimensional Computing on NSL-KDD [0.2] 本稿では,超次元計算(HDC)技術を用いたネットワーク異常検出手法を提案する。
提案手法は,大規模データ処理におけるHDCの効率を利用して,未知の攻撃パターンと未知の攻撃パターンを識別する。
このモデルはKDDTrain+サブセットで91.55%の精度を達成し、従来のアプローチよりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:19:26 GMT)
Intrusion Detection in IoT Networks Using Hyperdimensional Computing: A Case Study on the NSL-KDD Dataset [0.2] IoT(Internet of Things)ネットワークの急速な拡張により,新たなセキュリティ課題が導入された。
本研究では,超次元コンピューティング(HDC)に基づく検出フレームワークを提案し,ネットワーク侵入を識別・分類する。
提案手法は,通常のトラフィックパターンを正確に識別しつつ,DoS,プローブ,R2L,U2Rなどの攻撃カテゴリを効果的に識別する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:33:37 GMT)
Intolerable Risk Threshold Recommendations for Artificial Intelligence [0.2] フロンティアAIモデルは、公共の安全、人権、経済の安定、社会的価値に深刻なリスクをもたらす可能性がある。
リスクは、意図的に敵の誤用、システム障害、意図しないカスケード効果、複数のモデルにまたがる同時障害から生じる可能性がある。
16のグローバルAI産業組織がFrontier AI Safety Commitmentsに署名し、27の国とEUは、これらのしきい値を定義する意図を宣言した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:30:37 GMT)
Scholar Name Disambiguation with Search-enhanced LLM Across Language [0.2] 本稿では,複数の言語にまたがる検索強化言語モデルを用いて,名前の曖昧さを改善する手法を提案する。
検索エンジンの強力なクエリ書き換え、意図認識、およびデータインデックス機能を利用することで、エンティティの識別やプロファイルの抽出を行うため、よりリッチな情報を集めることができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:04:59 GMT)
Accuracy Assessment of OpenAlex and Clarivate Scholar ID with an LLM-Assisted Benchmark [0.2] Web of Science (WOS) 誌の上位四国誌 (Q1) の著者は、国、規律、および対応する著者論文の数に基づいている。
各グループについて,100人の学者を選抜し,検索強化大言語モデルを用いて各論文に注意深い注記を行った。
これらのアノテーションを用いて、OpenAlexとClarivateで対応するIDを特定し、関連するすべての論文を抽出し、Q1 WOSジャーナルにフィルタリングし、アノテーション付きデータセットと比較して精度とリコールを算出した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:28:50 GMT)
Integrating Predictive and Generative Capabilities by Latent Space Design via the DKL-VAE Model [0.2] 本稿では,変分オートエンコーダ(VAE)の生成能力とDeep Kernel Learning(DKL)の予測特性を統合するフレームワークを提案する。
VAEは高次元データの潜在表現を学び、新しい構造を生成する。
DKLはこの潜在空間をガウス過程(GP)回帰(英語版)(Gaussian Process (GP) regression) を通じて対象特性に沿って構造化することで洗練する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:05:04 GMT)
CORDIC Is All You Need [0.2] 線形MAC計算と非線形反復活性化関数のためのCORDICブロックを用いたパイプラインアーキテクチャを提案する。
このアプローチでは、Reconfigurable Processing Engine(RPE)ベースのsystolic配列に重点を置いている。
FPGAの実装により、リソースの節約に2.5ドル、以前の作業に比較して3ドルまで削減できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:23:27 GMT)
Tool or Tutor? Experimental evidence from AI deployment in cancer diagnosis [0.2] 本稿では,AIによる訓練とAIによるタスク完了を補完し,この仮説を肺癌診断の文脈で検証することを提案する。
以上の結果から,AI統合トレーニングとAI支援が独立して診断性能を向上する一方で,それらの組み合わせが最高の精度を示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:39:55 GMT)
Melting of devil's staircases in the long-range Dicke-Ising model [0.1] 反強磁性長距離イジングモデルに対する量子位相図を示す。
我々は、非超ラディアン位相の効率的なディックモデルへの正確なマッピングを利用する。
量子ゆらぎを定量的に扱うために、一般化されたワームホール量子モンテカルロアルゴリズムを用いる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:55:12 GMT)
Measuring Intrinsic Dimension of Token Embeddings [0.1] トークン埋め込みのIDを,小規模言語モデルや現代大規模言語モデルに推定する。
モデルスケールが大きくなるにつれて冗長性が増加するのを観察する。
埋め込み層にLoRAを適用すると、推定IDの周囲の急激なパープレキシティ低下が観測される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:19:01 GMT)
Classical and mixed classical-quantum systems from van Hove's unitary representation of contact transformations [0.1] 我々はヒルベルト空間における古典力学の新しい定式化を開発する。
古典力学との整合性については、波動関数の位相を固定する制約を課さなければならない。
定式化は量子二レベル系の測定に適用される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:46:16 GMT)
Current and quantum transport factor of fermionic system in fermionic bath [0.1] システム密度行列のマスター方程式を導出し, システムと貯水池のエネルギー交換を考慮した。
量子輸送係数は古典システムと異なり、高温ではカルノット効率に近づくが、低温では異なる。
この研究はフェルミオン系における量子輸送の理解を深め、将来の量子熱力学の研究の基礎となる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:17:08 GMT)
Satellite image classification with neural quantum kernels [0.1] 本稿では,量子機械学習技術を用いた衛星画像の分類手法を提案する。
我々は、ソーラーパネルを含む画像の分類に焦点をあて、複雑な現実世界の分類問題に対処する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:26:23 GMT)
Tutorial on Using Machine Learning and Deep Learning Models for Mental Illness Detection [0.0] 本チュートリアルは、ソーシャルメディア上でのメンタルヘルス検出に機械学習およびディープラーニング手法を適用する際の共通の課題に対処するためのガイダンスを提供する。
実世界の例とステップバイステップの指示は、これらのテクニックを効果的に適用する方法を実証する。
これらのアプローチを共有することで、このチュートリアルは、研究者がより信頼性が高く、広く適用可能なメンタルヘルス研究モデルを構築するのを助けることを目的としている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 05:13:07 GMT)
Zero-Shot Multi-Label Classification of Bangla Documents: Large Decoders Vs. Classic Encoders [0.0] バングラ語は3億人以上の母語話者によって話され、世界でも6番目に話されている言語である。
32種類の最先端モデルの評価結果から,既存の強力なエンコーダやデコーダは,Bangla Zero-Shot-MLCタスクの高精度化に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:39:07 GMT)
Zero-Shot Complex Question-Answering on Long Scientific Documents [0.0] 本稿では,社会科学研究者がフル長の研究論文に対して質問応答を行うことを可能にするゼロショットパイプラインフレームワークを提案する。
提案手法は事前学習された言語モデルを統合し,マルチスパン抽出,マルチホップ推論,ロングアンサー生成といった難解なシナリオに対処する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:12:18 GMT)
YARE-GAN: Yet Another Resting State EEG-GAN [0.0] GAN(Generative Adversarial Networks)は、現実的なニューラルネットワークの合成において有望であることを示す。
本研究では、静止状態の脳波データを生成するために、グラディエントペナルティ付きワッサーシュタインGANを実装した。
本結果は,実際の脳波データの統計的特徴とスペクトル特性を効果的に捉えていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:01:10 GMT)
Will Neural Scaling Laws Activate Jevons' Paradox in AI Labor Markets? A Time-Varying Elasticity of Substitution (VES) Analysis [0.0] 我々は,4つの重要なメカニズムを通じて,AI開発と労働代行を結びつけるモデルを構築した。
この研究は、AIがますます人間の労働の代わりになると主張する産業の背景にある経済的理由を評価するための、シンプルなフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:55:30 GMT)
Will I Get Hate Speech Predicting the Volume of Abusive Replies before Posting in Social Media [0.0] テキスト、テキストメタデータ、ツイートメタデータ、アカウント機能という4種類の機能を調べます。
これにより、ユーザやコンテンツが、虐待的な返信の数を予測するのにどの程度役立つかを理解するのに役立ちます。
私たちの目的の1つは、ツイートが受ける虐待的な反応の量が、ツイートの内容や、それを投稿するユーザのアイデンティティによって動機付けられる範囲を決定することです。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:04:21 GMT)
Vestigial Order from an Excitonic Mother State in Kagome Superconductors $A$V$_3$Sb$_5$ [0.0] A$V$_3$Sb$_5$$$A$=K,Rb,Cs)における排他的母状態から派生した固有順序の理論を開発する。
外場の適用は相融次数パラメータ多様体の部分集合を安定化させ、印加されたプローブに依存する対称性破砕応答を生成する。
提案した励起性母状態は、微調整なしでプローブ依存対称性の破れパターンを説明でき、光学分光法により追加のシグネチャを予測できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:00 GMT)
VWAP Execution with Signature-Enhanced Transformers: A Multi-Asset Learning Approach [0.0] 本稿では,VWAP(Volume Weighted Average Price)の実行に対する新しいアプローチを提案する。
私は、複数のアセットにまたがってトレーニングされた1つのニューラルネットワークが、従来のアセット固有のモデルに匹敵するパフォーマンスを達成できることを実証します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:50:20 GMT)
Universal whirling magnetic orders in non-Heisenberg Tsai-type quasicrystal approximants [0.0] Au-Ga-Dy系における非ハイゼンベルク型1/1近似結晶の磁気秩序について検討した。
その結果、[111]結晶軸に沿って渦巻く非コプラナー、強磁性(FM)、反強磁性(AFM)スピン配置が明らかになった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:44:31 GMT)
Unification of Stochastic and Quantum Thermodynamics in Scalar Field Theory via a Model with Brownian Thermostat [0.0] 実スカラー場理論における熱緩和のための量子マスター方程式を導出する体系的手法を提案する。
我々は、量子熱力学の第一法則と第二法則を満たす方法で、熱、仕事、エントロピーを定義する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:48:29 GMT)
Unclonable Encryption with Continuous Variables [0.0] 本稿では,最初の連続可変(CV)暗号方式を提案する。
私たちの構成では、古典的なメッセージはまず古典的にエンコードされ、次にエラー訂正コードを使用してエンコードされます。
我々は,Broadbent と Lord が導入したフレームワークにおいて,クローンゲームから CV モノガミー・オブ・アングルメントゲームへ還元することで,不規則性を証明した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:10:15 GMT)
Ultrastrong coupling, nonselective measurement and quantum Zeno dynamics [0.0] ボーソニック貯水池に線形に結合した開量子系の力学について検討する。
超強結合限界において、システムは非選択的測定を行い、有効ゼノ・ハミルトニアンに従って一元的に進化することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:50:37 GMT)
Trust, Experience, and Innovation: Key Factors Shaping American Attitudes About AI [0.0] 本稿は、AI技術の新たな進歩の具体的な成果に関する懸念の度合いについて考察する。
関心の方向と強度に関連する重要な変数には、ChatGPTのような大きな言語モデルを使った事前経験がある。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:08:20 GMT)
Towards a complexity-theoretic dichotomy for TQFT invariants [0.0] 固定$(2+1)$-dimensional TQFT over $mathbbC$ に対して、閉3次元多様体上の不変量(正確には)を計算する問題は、時間内に解決可能であることを示す。
我々の証明は、$mathbbC$を超える重み付き制約満足度問題に関するCaiとChenの結果の応用である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:05:46 GMT)
Towards Differential Handling of Various Blur Regions for Accurate Image Deblurring [0.0] 本稿では,異なるぼかし領域に対して差分処理を行うディファレンシャルハンドリングネットワーク(DHNet)を提案する。
具体的には、非線形特性を劣化ネットワークに統合するVolterraブロック(VBlock)を設計する。
モデルがぼやけた領域の様々な劣化度に適応的に対応できるようにするため,分解度認識エキスパートモジュールを考案した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 02:05:57 GMT)
Time series classification with random convolution kernels: pooling operators and input representations matter [0.0] 本稿では,SelF-Rocketと呼ばれるMiniRocketに基づく,高速時系列分類(TSC)のための新しいアプローチを提案する。
トレーニングプロセス中に最適な入力表現とプーリング演算子を動的に選択する。
カリフォルニア大学リバーサイド校(UCR)のベンチマークデータセットで最先端の精度を実現している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:52:43 GMT)
Thermodynamic Computing via Autonomous Quantum Thermal Machines [0.0] 我々は,自律型量子熱機械に基づく古典計算のための物理モデルを開発した。
熱力学ニューロンのネットワークは任意の所望の機能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:20:42 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0] フェルミ表面(FL)を持つフェルミ液体は、再構成された「小さなフェルミポケット」を持つスピン密度波状態(SDW)への量子相転移を持つことができる。
FL-SDW量子相転移における空間障害の影響の研究は、低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:49:26 GMT)
The Effectiveness of Large Language Models in Transforming Unstructured Text to Standardized Formats [0.0] 本研究では,非構造化テキストを構造化形式に変換する大規模言語モデルの能力を体系的に評価する。
実験により、数発のプロンプトを持つGPT-4oがブレークスルー性能を達成することが明らかとなった。
これらの発見は、様々な領域にまたがる自動構造化データ生成の新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:14:28 GMT)
Teaching AI to Handle Exceptions: Supervised Fine-Tuning with Human-Aligned Judgment [0.0] 大規模言語モデル(LLM)はエージェントAIシステムへと進化している。
推論に優れるLCMでさえ、政策に厳格に従うため、人間の判断から大きく逸脱していることを示す。
次に、例外を処理するためにAIエージェントをチューニングするための3つのアプローチを評価する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:00:37 GMT)
TFHE-SBC: Software Designs for Fully Homomorphic Encryption over the Torus on Single Board Computers [0.0] 本稿では,クライアント側TFHE操作を高速化し,通信とエネルギー効率を実現するため,SBC固有の新しい設計TFHE-SBCを提案する。
実験の結果,TFHE-SBC暗号は2486倍高速で,通信効率は512倍,エネルギー効率は12~2004倍向上した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:36:58 GMT)
Systematic Modulation of Charge and Spin in Graphene Nanoribbons on MgO [0.0] Ag(001)上に成長したMgO層上に積層されたグラフェンナノリボン(GNR)の電子占有の系統的操作を示す。
GNRは、その長さと形状に依存する整数数の電子電荷を宿る。
我々は、MgO超薄膜がサポートするGNRが、量子センシングや量子処理への応用のためにカスタマイズされたデバイスへの扉を開くことができることを期待する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:20:26 GMT)
Seeding for Success: Skill and Stochasticity in Tabletop Games [0.0] ゲームはしばしば、サイコロやシャッフルカードデッキの形でランダム要素を組み込む。
このランダム性は、プレイヤーの経験や遭遇した様々なゲーム状況に重要な貢献をする。
ゲームが面白く、ゲームのプレイヤの楽しみに寄与するランダム性のレベルと、結果自体が効果的にランダムであり、ゲームが退屈になるレベルとの間には緊張関係がある。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:58:59 GMT)
Seeded Poisson Factorization: Leveraging domain knowledge to fit topic models [0.0] 本稿では,シードワードを通じてドメイン知識を組み込むことにより,Poisson Factorizationフレームワークを拡張した新しいアプローチであるSeeded Poisson Factorization(SPF)を紹介する。
SPFは、トピック固有の項強度の事前分布を変更することで、より解釈可能で構造化されたトピック発見を可能にする。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:05:13 GMT)
Section 230: A Juridical History [0.0] 1996年通信規制法第230条は、インターネットの歴史において最も重要な法律である。
この法律は時代と歩調を合わせておらず、現在、裁判所や立法府への深い執着の源となっている。
本条は、現在地へどのように到達したかを調べることで、改革者のガイドブックとして機能する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:09:40 GMT)
Scene-based nonuniformity correction with homography transformation [0.0] カメラベースの熱焦点面アレイ(UC-FPA)は、LWIR(Long-wave infrared)イメージングの用途に有用である。
農業用リモートセンシングの典型的な屋外環境では、UC-FPAをベースとしたカメラはオフセットやゲインの漂流に悩まされることがある。
オブジェクトの熱グラフィック値と、ゲインとオフセットは、数組のシフトした画像に頼って、共同で推定できることが示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:50:58 GMT)
Sample size determination for machine learning in medical research [0.0] 機械学習(ML)の手法は、医学研究の様々な領域でますます使われている。
本稿では,MLを用いた医学研究のためのサンプルサイズ決定手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:33:45 GMT)
SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models [0.0] SPIDERは、Skin、Colorectal、Toraxなど、複数の臓器タイプをカバーする、公開可能なパッチレベルデータセットとしては最大である。
注目型分類ヘッドと組み合わせた特徴抽出器として,Hibou-Lファンデーションモデルを用いてSPIDERでトレーニングしたベースラインモデルを提案する。
これらのモデルは、複数の組織カテゴリにわたる最先端のパフォーマンスを達成し、将来のデジタル病理研究の強力なベンチマークとなる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:57:12 GMT)
Robust Detection of Extremely Thin Lines Using 0.2mm Piano Wire [0.0] 本研究では,エレベーターシャフト内の自動設置ロボットの位置を正確に決定する基準線(0.2mm厚のピアノワイヤ)を検出するアルゴリズムを開発した。
予備処理段階でフーリエ変換を利用した実験4(FCH)では,LtoL,LtoR,RtoLのデータセットが最も高い検出率を達成した。
本研究では,エレベーターシャフト設置時のロボットの位置を正確に計算し,制御できる基準線検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:05:33 GMT)
Representation Learning for Time-Domain High-Energy Astrophysics: Discovery of Extragalactic Fast X-ray Transient XRT 200515 [0.0] 本稿では,高エネルギーデータセットにおける異常検出,教師なし分類,類似性検索などの下流タスクの表現学習手法を提案する。
これにより、チャンドラのアーカイブデータに新しい銀河外高速X線トランジェント(FXT)、XRT 200515、ニードル・イン・ザ・ヘイスタックのイベント、チャンドラのFXTが発見された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:31:11 GMT)
Reply to Pavičić's 'Comment on "Optimal conversion of Kochen-Specker sets into bipartite perfect quantum strategies"' (arXiv:2502.13787) [0.0] Pavivci'cは、私たちの論文の10の文は間違っていると主張している。
我々は、パヴィヴィチ・デックが我々の仕事について行った他の主張に反応する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:00:06 GMT)
Radar Pulse Deinterleaving with Transformer Based Deep Metric Learning [0.0] 特定のパルス列に記録されているエミッターの数は不明である。
本稿では,合成データに三重項損失を学習した変圧器を用いて,この問題に対する計量学習手法を提案する。
このモデルは、調整された相互情報スコア0.882の他の深層学習モデルと比較して、強い結果が得られる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:27:17 GMT)
Quantum state exclusion for group-generated ensembles of pure states [0.0] 有限群によって生成される純状態の任意の集合に対する最適量子状態排除に対する完全な解を提供する。
完全排除が不可能な場合、最小限のエラーと曖昧な除外という2つの自然な拡張を導入する。
そこで本研究では,障害確率と測定値の最適プロトコルと解析式を導出する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:47:02 GMT)
Quantum probability for statisticians; some new ideas [0.0] いくつかの観点から、量子確率は統計的な設定において役割を果たすかもしれないと論じられている。
量子基底に対する新しいアプローチは、マクロ的な設定で等しく有効であるように見える仮定を持つ。
量子確率の統計的応用の可能性に関するアイデアのリストを提供し、議論する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:18:49 GMT)
Quantum memristor with vacuum--one-photon qubits [0.0] チューナブルビームスプリッタに入る真空1光子量子ビットで光量子メムリスタを実現することができる。
入力状態のコヒーレンスを量子メムリスタで保存することを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:22:03 GMT)
Quantum integration of decay rates at second order in perturbation theory [0.0] 摂動量子場理論において、高エネルギー物理学における全崩壊率の量子計算を2次で行う。
この研究は、2つの最近の最先端の進歩の合流点を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:54:18 GMT)
Quantum Computer Does Not Need Coherent Quantum Access for Advantage [0.0] 量子スピードアップの大多数は、古典的な情報をコヒーレントな量子的にアクセスできるサブルーチンに依存している。
最適化のための量子勾配降下アルゴリズムを開発し,多種多様な応用を享受する基礎技術である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:24:28 GMT)
QCLAB: A Matlab Toolbox for Quantum Computing [0.0] QCLABは、量子回路の構築、表現、シミュレーションのためのオブジェクト指向ツールボックスである。
QCLAB++はGPU加速量子回路シミュレーションに最適化された補完的なC++パッケージとして機能する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:25:46 GMT)
Prompting Science Report 1: Prompt Engineering is Complicated and Contingent [0.0] これは、ビジネス、教育、政策リーダーがAIを扱う技術的詳細を理解するのを助けるための一連の短いレポートの最初のものだ。
LLM(Large Language Model)がベンチマークをパスするかどうかを測定するための標準は存在しない。
特定のプロンプトアプローチが LLM の特定の質問に答えられるかどうかを事前に知るのは難しい。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:09:12 GMT)
Probing new forces with nuclear-clock quintessometers [0.0] 核異性体転移に基づくクロックは、例外的な安定性と精度を約束する。
トリウム229異性体の低遷移エネルギーは真空紫外レーザーによって励起され、微妙な相互作用に非常に敏感であるため、理想的な候補となる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:01 GMT)
Orientation tracking method for anisotropic particles [0.0] 本稿では,複数の異方性粒子の位置と配向を時間とともに追跡するアルゴリズムについて述べる。
本手法のロバスト性と誤差を定量化し,ノイズ,画像サイズ,使用カメラ数,カメラ配置の影響について検討する。
提案手法は, 粒子形状の異なる粒子に対して有効であり, 複数の粒子の同時追跡に成功し, 異なる種類の粒子を識別できることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:56:29 GMT)
Order Theory in the Context of Machine Learning [0.0] IVNNは整数重みを持つネットワークを指すが、真のバイアスである。
n$ の点を持つすべての列に対して、対応する位数ポリトープが存在する。
4点のポーズがニューラルネットワークを誘導し、それを2ドル2セントの畳み込みフィルタと解釈する方法を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 12:32:31 GMT)
On a certain inequality for the sum of norms and reverse uncertainty relations [0.0] 内積空間における2つのベクトルのノルムの和に対する単純な不等式を証明する。
いわゆる「逆不確実性関係」を導出し、その性質を解析する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:57:11 GMT)
Nuclear spin relaxation in solid state defect quantum bits via electron-phonon coupling in their optical excited state [0.0] 我々は、14$Nの核スピンのスピン-格子緩和が、軌道自由度との強い絡み合いにより著しく強化されていることを示す。
我々は、軌道縮退を示す三角欠陥に対して、軌道依存のスピンハミルトニアンを予測するための単純で汎用的なテクスタイブイニシアト方式を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:41:01 GMT)
Normal variance mixture with arcsine law of an interpolating walk between persistent random walk and quantum walk [0.0] 限界分布はアルクトシン法則と通常の分散混合により記述されることを示す。
1次元格子上の1つのパラメータを用いて、量子ウォークと永続的(関連する)ランダムウォークを補間するモデルを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:47:42 GMT)
Nonlocal characteristics of two-qubit gates and their argand diagrams [0.0] 2ビットゲートの非局所部分の正方形固有値のアーガンド図に現れるコードの有用性を示し,その非局所特性について検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:54:43 GMT)
Nonadiabatic quantum kinetic equations and Dirac-Heisenberg-Wigner formalism for Schwinger pair production in time-varying electric fields with multiple components [0.0] シュウィンガー対生成のための非断熱的量子力学方程式とディラック・ハイゼンベルク・ウィグナー形式は導出され、等価であることが証明されている。
急速に振動する電場の場合、非断熱的量子論的アプローチは中間時間におけるペア生成をより有意義に記述することができる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:50:27 GMT)
Multi-Step Deep Koopman Network (MDK-Net) for Vehicle Control in Frenet Frame [0.0] 本稿では、深層ニューラルネットワークを用いて全車動特性を捉える、新しいディープラーニングベースのクープマンモデリング手法を提案する。
二重車線変更操作において, 同定線形モデルと比較して, クープマンモデルの精度が優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:57:38 GMT)
Multi-Agent System for AI-Assisted Extraction of Narrative Arcs in TV Series [0.0] シリアライズされたテレビ番組は複雑なストーリーラインの上に構築されており、簡単に分析できない方法で追跡と進化が難しい。
本稿では,これらのナラティブアークの抽出と解析を目的としたマルチエージェントシステムを提案する。
このシステムは、Grey's Anatomy(ABC 2005-)の第1シーズンにテストされ、アンソロジー(自己完結)、ソープ(関連性重視)、ジェンレ・スペクティフィック(Genre-Specific)の3種類のアークを識別する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:27:14 GMT)
Moment method and continued fraction expansion in Floquet Operator Krylov Space [0.0] 再帰法は複素力学を1次元の効果的な非相互作用問題にマッピングする。
この応用により、自己相関関数が与えられたとき、対応するクリロフ角を構成することができるモーメント法が存在することを示す。
安定な$m$-周期動力学は連続分数法、指数関数的に崩壊し、パワー・ローで崩壊するストロボスコープ力学を用いて導かれる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 04:27:31 GMT)
Meta-Learning to Explore via Memory Density Feedback [0.0] メタ学習を利用した探索アルゴリズムや学習の学習について検討する。
エージェントは、訓練の最盛期にさえ、単一のエピソードで探索の進捗を最大化することを学ぶ。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:55:38 GMT)
Meson dynamics from locally exciting a particle-conserving $Z_2$ lattice gauge theory [0.0] 粒子保存1D$Z$格子ゲージ理論において局所的な高エネルギー励起から生じる閉じ込められた中間子を特徴付ける。
この力学は、異なる大きさの中間子の重ね合わせの伝播によって特徴づけられる。
この現象は線形閉じ込めの結果であり、強い閉じ込め限界と弱い閉じ込め限度の両方において有効であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:09:44 GMT)
Measuring Political Preferences in AI Systems: An Integrative Approach [0.0] この研究は、主要なAIシステムにおける政治的偏見を評価するために、マルチメソッドアプローチを採用する。
その結果、現代のAIシステムでは、一貫した左利きバイアスが示される。
AIシステムにおける組織的な政治的偏見の存在は、視点の多様性の低減、社会的分極の増大、AI技術における公的な不信の可能性などのリスクを引き起こす。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:40:28 GMT)
Measurement-Induced Crossover of Quantum Jump Statistics in Postselection-Free Many-Body Dynamics [0.0] 連続監視多体系における量子ジャンプのサブシステム変動の非自明な交叉を示す。
揺らぎはポアソニアン測度が十分に弱いというポアソニアン統計に従い、標準体積法$propto L$を示すが、異常で普遍的なスケーリング法$propto Lalpha :(alphasim 2.7)$ 超ポアソニアン測度を示す超ポアソニアン測度は強い測定強度を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:03:40 GMT)
Markets for Models [0.0] 我々は、企業が予測を改善するためにモデルを消費者に販売する市場を調査する。
市場構造は、利用可能なモデルの統計的性質に微妙で非単調な方法に依存することができることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:07:02 GMT)
Linear Multidimensional Regression with Interactive Fixed-Effects [0.0] 本稿では,3次元以上の多次元パネルデータの線形モデルについて検討する。
主推定器は二重脱バイアス法を用い、2つの予備ステップを必要とする。
ビールの需要弾力性を推定する手法が提案されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 17:30:58 GMT)
Learning finite symmetry groups of dynamical systems via equivariance detection [0.0] 任意の関数の基底となる有限同変対称性群を発見するためのデータ駆動型モデルであるEquivariance Seeker Model (ESM)を導入する。
ESMを特に力学系に適用し、観測された軌道データから直接それらの対称性群を同定する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:17:37 GMT)
LADDER: Self-Improving LLMs Through Recursive Problem Decomposition [0.0] LADDERは、大規模言語モデルが問題解決能力を自律的に改善できるフレームワークである。
数学的統合の課題において, LADDERの有効性を実証する。
また、TTRLを導入し、推論時にテスト問題の変種について強化学習を行う。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:30:32 GMT)
LABIIUM: AI-Enhanced Zero-configuration Measurement Automation System [0.0] 本稿では,実験の合理化とユーザの生産性向上を目的としたAIによる計測自動化システムであるLABIiumを紹介する。
Lab-Automation-Measurement Bridges (LAMBs)はVSCodeやPythonといった標準ツールを使ったシームレスなインスツルメンタ接続を可能にし、セットアップのオーバーヘッドをなくす。
この評価は、LABIiumが研究室の生産性を高め、研究と産業におけるデジタルトランスフォーメーションを支援する能力を強調している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:15:36 GMT)
Krylov space approach to Singular Value Decomposition in non-Hermitian systems [0.0] 非エルミート確率行列とハミルトン行列に対する三対角化法を提案する。
この手法は特異値の実と非負の性質を利用し、非エルミート系で典型的に見られる複素固有値をバイパスする。
我々は、非エルミート対称性クラスの部分集合内の2次元非エルミート確率行列に対するクリロフ複雑性を解析的に計算する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 01:46:47 GMT)
Gravitational entanglement witness through Einstein ring image [0.0] 空間量子重ね合わせにおける質量源によって誘導される弱い重力場において、重力レンズとアインシュタイン環像を探索することにより、量子理論と重力の相互作用を探索する。
我々は、質量源と他の系の量子絡み合いを生成する最初の量子化ニュートン重力(QG)モデルと、絡み合いを生じないシュル・オーディンガー・ニュートン重力(SN)モデルという、2つの異なる重力モデルで伝播する量子化マスレススカラー場を解析する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:08:20 GMT)
Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction [0.0] コモビディティ(Comorbidity)は、単一の患者において複数の医療条件の同時発生であり、疾患の管理と結果に大きな影響を及ぼす。
本研究は,病原性予測のためのTSPE(Subgraph Positional morbidities)を導入したトランスフォーマーを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:59:34 GMT)
Giant moment increase by ultrafast laser light [0.0] 2d磁石の多数スピン伝導帯に調整されたレーザ光がCrI$_3$となり、CrSBrは超高速の巨大モーメントを発生させる。
我々は,超高速光パルスが磁気モーメントを減少させる機構を確立し,フェムト秒間における磁性物質に対する光制御の可能性を高めることを目的とした。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:38:46 GMT)
Giant Rabi frequencies between qubit and excited hole states in silicon quantum dots [0.0] その結果, 最低励起状態を含む遷移は, 地上の2重項よりも数桁大きいRabi周波数を示すことがわかった。
固有状態の対称性との明確な関係が出現し、応用バイアスによるラビ周波数の広い調整性も現れる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:22:34 GMT)
Generative Modeling of Microweather Wind Velocities for Urban Air Mobility [0.0] 本研究は, 安全で信頼性が高く, 耐候性のある都市空力(UAM)ソリューションの追求により, マイクロウェザー風速のキャラクタリゼーションのための生成モデル手法を提案する。
この研究は、計算効率のよい風速をモデル化し、ランダムな変動を捉えることを目的としており、永久的なフィールド計測のキャンペーンよりも一時的なものしか必要としない。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:03:15 GMT)
Generation of polarization-entangled photon pairs from two interacting quantum emitters [0.0] 絡み合った光子対は量子通信と量子暗号の鍵となる要素である。
2つの相互作用する量子エミッタから偏光-絡み合った光子対が放出可能であることを示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:03:21 GMT)
Generating Quantum Reservoir State Representations with Random Matrices [0.0] ランダム行列を用いた貯水池計算の新たな手法を実証する。
私たちは、原子スケールのデバイスが現実世界の計算アプリケーションにどのように使われるのかを動機付けています。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:50:12 GMT)
Generalized Quantum Signal Processing and Non-Linear Fourier Transform are equivalent [0.0] 量子信号処理(QSP)と量子特異値変換(QSVT)は、量子プロシージャの開発において強力な技術である。
近年の研究では、QSPプロトコルの数値計算に非線形フーリエ解析(NLFA)を用いることで、安定性が証明可能であることが示されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:02:38 GMT)
General Relativistic Center-of-Mass Coordinates for Composite Quantum Particles [0.0] 原子インターフェロメトリモデルは、しばしばアドホックな方法でのみ相対論的効果を含む。
我々は、曲線時空における光マターダイナミクスを得るために、質量と相対座標の特殊相対論的中心を一般化する。
我々は、曲面時空における電磁場と相互作用する、完全に1量子化された2粒子原子のハミルトニアンを得る。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 13:04:32 GMT)
Gauging non-invertible symmetries on the lattice [0.0] 1+1d格子ハミルトニアン系における有限非可逆対称性のゲージ化の処方則を提供する。
ゲージ法では、各リンクに2つの量子ビットを導入し、非可逆対称性に対して「ゲージ場」のコサインを再生する。
通常の$bbZ$をガウグするクラマース・ワニエ変換と同様に、ガウグはガウグマップで要約できる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:00:00 GMT)
From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks [0.0] 我々は、AIの安全性に関する現在主流の議論で無視されている生物学的、経済的動機付けのテーマを紹介します。
これらのテーマには、有界および生物学的目的に対するホメオスタシス、非有界、手段的、ビジネス目的に対するリターンの減少、持続可能性原理、資源共有が含まれる。
上記のテーマで8つの主要なベンチマーク環境を実装し、エージェントAIにおける重要な落とし穴と課題を明らかにします。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:42:06 GMT)
FourierNAT: A Fourier-Mixing-Based Non-Autoregressive Transformer for Parallel Sequence Generation [0.0] 本稿では、デコーダにフーリエを混合して並列に出力シーケンスを生成する非自己回帰変換器(NAT)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:08:39 GMT)
Fast exact recovery of noisy matrix from few entries: the infinity norm approach [0.0] データサイエンスの中心的な問題である行列回復問題は、比較的小さなエントリのサンプルから行列A$を回収することである。
そのようなタスクは一般には不可能であるが、ランダムなエントリのサブセットから正確な時間で$A$を高い確率で回収できることが示されている。
基底行列が有界な精度を持つことを考えると、雑音の場合においても正確な回復が達成できることが示される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:50:33 GMT)
Exploring the Non-Markovian Dynamics in Depolarizing Maps [0.0] この研究は、非マルコビアン性を同定し定量化する様々な方法をもたらす。
進化中に追跡された軌道は、CPの可視性の喪失と非マルコビアン性の出現を示す。
システム次元とキュービット数の増大が特異性と非マルコビアン性に与える影響を述べる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 15:34:47 GMT)
Exploring Model Quantization in GenAI-based Image Inpainting and Detection of Arable Plants [0.0] 安定ディフュージョンベースのインペインティングを利用して、10%のインクリメントでトレーニングデータを段階的に増加させ、最大200%まで増やすフレームワークを提案する。
本手法は,mAP50測定値を用いて,最先端物体検出モデルであるYOLO11(l)とRT-DETR(l)の2つを用いて評価を行った。
Jetson Orin Nano上での下流モデルの展開は、リソース制約のある環境での我々のフレームワークの実用可能性を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 09:05:01 GMT)
Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison [0.0] VQA(Visual Question Answering)は、コンピュータビジョンと自然言語処理の交差において重要なタスクとして登場した。
本稿では,従来のVQAデータセット,ベースラインモデル,手法,および5つの高度なVQAモデルの比較研究について述べる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:43:01 GMT)
Enhancing the Product Quality of the Injection Process Using eXplainable Artificial Intelligence [0.0] 本研究では, 射出成形品の欠陥率を低減するため, 最適射出成形工程制御システムを提案する。
製品の改善プロセスを制御する主な機能は、SHapley Additive exPlanationsによって抽出される。
本研究で提示される方法論を検証するために,KAMPが提供する実際の射出成形型AI製造データセットを用いる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 06:59:01 GMT)
English Please: Evaluating Machine Translation for Multilingual Bug Reports [0.0] 本研究は,バグ報告における機械翻訳(MT)性能の総合評価としては初めてである。
我々は、BLEU、BERTScore、COMET、METEOR、ROUGEなど、複数の機械翻訳メトリクスを使用している。
DeepLは一貫して他のシステムより優れており、強い語彙的および意味的なアライメントを示している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:24:09 GMT)
Energetic Analysis of Emerging Quantum Communication Protocols [0.0] 本稿では,短期量子ネットワークに適用される様々な量子技術とプロトコルのエネルギー要求をモデル化する枠組みの基礎を述べる。
両部ネットワークプロトコルと多部ネットワークプロトコルのエネルギー消費に関するベンチマークを示す。
フォトニックセットアップのエネルギー消費を推定するオープンソースソフトウェアも提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:34:38 GMT)
Efficient detection of nonclassicality using moments of the Wigner function [0.0] 負のウィグナー関数によって特徴づけられる量子状態を検出するための基準を提供する。
本手法は, 単純関数の計算を伴う Wigner 関数のモーメントを評価することに依存する。
実実験において,モードSWAP演算子を用いてこれらのモーメントを実現する実験手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:20:22 GMT)
EchoQA: A Large Collection of Instruction Tuning Data for Echocardiogram Reports [0.0] 集中治療のための医療情報マートから得られたエコー心電図を用いた質問応答(QA)データセットについて紹介する。
このデータセットは、心疾患とその重症度に対処する771,244のQAペアからなる、心疾患のQAシステムを強化するために特別に設計された。
我々は,ゼロショット評価のためのオープンソースおよびバイオメディカル固有モデル,ゼロショット評価のためのクローズソースモデルを含む大規模言語モデル(LLM)を比較した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:45:45 GMT)
ESSPI: ECDSA/Schnorr Signed Program Input for BitVMX [0.0] 本稿では,ECDSA/Schnorrシグネチャを最適化してBitVMXプログラム入力に署名するESSPIを紹介する。
ウィンターニッツ符号に基づく現在の最高比1:200と比較して,最適な1:1データ拡張を実現する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:40:55 GMT)
Controlling nonergodicity in quantum many-body systems by reinforcement learning [0.0] 量子非エルゴディティ制御のためのモデルフリー・ディープ強化学習フレームワークを開発した。
我々は, DRLエージェントが量子多体系を効率的に学習できることを実証するために, パラダイム的一次元傾斜Fermi-Hubbardシステムを用いた。
連続制御プロトコルと観測は実験的に実現可能である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:01:25 GMT)
Confidence HNC: A Network Flow Technique for Binary Classification with Noisy Labels [0.0] 本稿では,クラスタ内のサンプル間の大きな類似性と,クラスタと補体間の大きな相違性という,2つの目的のバランスをとる分類法について考察する。
HNCまたはSNCと呼ばれるこの方法は、シードノードまたはラベル付きサンプルを必要とし、そのうちの少なくとも1つはクラスタにあり、少なくとも1つは補体である。
ここでの貢献は、信頼HNCと呼ばれるHNCに基づくノイズラベルの存在における新しい方法である。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:21:40 GMT)
Compare different SG-Schemes based on large least square problems [0.0] 本研究は、最小二乗問題に基づいて、一般的な勾配に基づくスキームをレビューする。
この作業の結果を生み出したコードはhttps://github.com/q-viper/gradients-based-methods-on-large-least-squareで公開されている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:47:15 GMT)
Comparative study of divacancies in 3C-, 4H- and 6H-SiC [0.0] 6H-および3C-SiCの多様性は共鳴励起でも安定であると予想される。
6H-および3C-SiCの多様性は共鳴励起でも安定であると予想される。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:21:17 GMT)
Comparative Analysis of Lightweight Kubernetes Distributions for Edge Computing: Security, Resilience and Maintainability [0.0] 本研究は,k3s,k0s,KubeEdge,OpenYurtの軽量分布を比較し,解析する。
結果は、k3sとk0sは単純さのために開発が容易だが、KubeEdgeやOpenYurtに比べてセキュリティコンプライアンスが低いことを示している。
パフォーマンス、セキュリティ、レジリエンス、保守性の間のトレードオフを強調し、エッジ環境にデプロイする実践者のための洞察を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:05:40 GMT)
Chemically resolved nuclear magnetic resonance spectroscopy by longitudinal magnetization detection with a diamond magnetometer [0.0] 固体スピンに基づく非誘導型磁気センサは、少量の核磁気共鳴(NMR)検出に有望な解決策を提供する。
本研究では,ラムゼイ干渉法を用いて解析者の横スピン前駆体を縦磁化(M_z)に変換するラムゼイ-M_zプロトコルを実証する。
エタノールの1nL検出体積に対してNMR分光を行い、化学シフト構造を無視できる歪みで解決する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 00:16:05 GMT)
Charges in light cones and quenched infrared radiation [0.0] 電気的に帯電した状態と結果として生じる電磁場は、実際に実験を行うことのできる時空領域で考慮される。
突撃(ガウスの法則への感謝)の間の分野は、即刻慣性観察者のために消滅する。
その結果,光円錐に対する操作と観測の制限は,光円錐の矢印によって規定され,ローレンツイン赤外遮断に相当することがわかった。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:05:49 GMT)
Can Diffusion Models Provide Rigorous Uncertainty Quantification for Bayesian Inverse Problems? [0.0] 本研究では,BIPSDAと呼ばれる拡散モデルに基づく後方サンプリングのための新しいフレームワークを提案する。
このフレームワークは、最近提案された拡散モデルに基づく後方サンプリングアルゴリズムを統一し、設計選択の柔軟な組み合わせによって実現可能な新しいアルゴリズムを含む。
以上の結果から,BIPSDAアルゴリズムは画像の塗布やX線トモグラフィーに基づく問題に対して高い性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 21:07:15 GMT)
CQ CNN: A Hybrid Classical Quantum Convolutional Neural Network for Alzheimer's Disease Detection Using Diffusion Generated and U Net Segmented 3D MRI [0.0] 臨床MRIデータからアルツハイマー病(AD)を検出することは、医用画像研究の活発な領域である。
量子コンピューティングの最近の進歩は、従来の手法よりも優れたモデルを開発する新しい機会を提供する。
臨床用3次元MRIデータを用いたAD検出のためのエンドツーエンドの古典的量子畳み込みニューラルネットワーク(CQ CNN)を提案する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:08:47 GMT)
Blockchain Technology Adoption in Food Bank Supply Chains: A Rough DEMATEL-Based Approach [0.0] 食品銀行は、食品寄付管理の改善、リアルタイム在庫追跡の提供、ブロックチェーン技術の導入による食品安全規制の遵守を保証することができる。
食品銀行サプライチェーンの効率性、オープン性、信頼性は、この統合によって大幅に向上し、より持続的で成功している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:29:57 GMT)
Autoionization-enhanced Rydberg dressing by fast contaminant removal [0.0] ライドバーグドレッシングは長寿命の原子状態における絡み合い生成の強力なツールである。
アルカリ土類状原子中の自己イオン化遷移を利用した汚染物質の迅速除去を実証した。
我々は、最大144個の原子のシステムサイズに対して、これまで達成されたよりも桁違いに大きなデューティサイクルを維持しながら、等級の寿命を向上させる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 23:53:16 GMT)
Atomistic tight-binding Hartree-Fock calculations of multielectron configurations in P-doped silicon devices: wavefunction reshaping [0.0] シリコン中のドナーベースの量子デバイスは、普遍量子コンピューティングとアナログ量子シミュレーションのための魅力的なプラットフォームである。
シリコン中の1つのリン原子と選択されたリン二量体における多電子状態の原子計算と詳細な解析を行った。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:14:36 GMT)
Are some books better than others? [0.0] 本書のレビューが実際の本の内容と慣用的読者の傾向によってどれだけ強く決定されるかを定量化する。
人気小説やノンフィクションのオンラインレビューは、この本よりも10倍も多くの情報を持っている。
書籍の評価は、経験豊富なレビューライターの間で、カジュアルな読者よりも一般化している。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 14:43:43 GMT)
Analysis of electron spectra dynamics in a moving periodical ponderomotive potential [0.0] 光ビート波によって生じる相互作用電位における電子のダイナミクスを解析的に記述する。
エネルギー/分子スペクトルで周期的に交互に変化する鋭い電子分布ピークの構造を見いだす。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 20:28:15 GMT)
An rf-SQUID-based traveling-wave parametric amplifier with -84 dBm input saturation power across more than one octave bandwidth [0.0] トラベリングウェーブパラメトリック増幅器(TWPA)は、量子回路の読み出しと暗黒物質の探索に欠かせない道具となっている。
本稿では,rf-SQUIDをベースとした平均飽和電力-84dBmのJosephson TWPAの実装について報告する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 10:55:10 GMT)
An Accelerated Alternating Partial Bregman Algorithm for ReLU-based Matrix Decomposition [0.0] 本稿では,非負行列上に補正されたスパース低ランク特性について検討する。
本稿では,クラスタリングと圧縮タスクに有用な構造を取り入れた新しい正規化項を提案する。
我々は、任意の$Lge 1$に対して常に持つ$L$-smoothプロパティを維持しながら、対応する閉形式解を導出する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 08:20:34 GMT)
Alternative Framework to Quantize Fermionic Fields [0.0] 場の量子論において、古典場の量子化は伝統的に正準量子化またはファインマン経路積分形式主義によって達成される。
本研究では,拡張定常動作原理に基づく代替手法を提案する。
我々のアプローチは波動関数に対する非線形シュリンガー方程式をもたらし、非正規化不可能な理論の量子化に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 07:38:03 GMT)
A Systematic Literature Review on Safety of the Intended Functionality for Automated Driving Systems [0.0] 自動走行は、車両の外部環境と内部環境の両方を感知することに依存する。
ISO 21448は、ADSが意図した機能内で安全に動作することを保証することを目的とした、Intended Functionality (SOTIF)の標準である。
この課題は、SOTIFに関する広範囲かつ体系的な文献が限られているにもかかわらず、車両の安全性を確保することである。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 11:04:36 GMT)
A Simplified Retriever to Improve Accuracy of Phenotype Normalizations by Large Language Models [0.0] 本稿では,Human Phenotype Ontology (HPO) を検索することで,大規模言語モデル(LLM)の精度を向上させる簡易検索手法を提案する。
本研究では,最先端LCMの正規化精度が62.3%から90.3%に向上することを示した。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 19:15:49 GMT)
A Quantum Neural Network Transfer-Learning Model for Forecasting Problems with Continuous and Discrete Variables [0.0] 本研究では,予測問題に対する伝達学習手法として設計した連続可変量子ニューラルネットワーク(CV-QNN)モデルを提案する。
提案した量子技術は、たった8つのトレーニング可能なパラメータと、絡み合うための2本のワイヤを持つ単一の量子層と、10個の量子ゲートを持つ単純な構造を特徴としている。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 22:38:51 GMT)
A Purpose-oriented Study on Open-source Software Commits and Their Impacts on Software Quality [0.0] コミットを分類し、分類を自動化するために予測モデルをトレーニングし、異なる目的のコミットによってコミット品質がどのように影響するかを調査します。
これらの影響を特定することで、品質を改善するための変更をコミットするためのガイドラインを新たに確立します。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 03:14:57 GMT)
A Note on the Complexity of the Spectral Gap Problem [0.0] 局所ハミルトニアンのスペクトルギャップを推定する問題は、クラス$PQMA[log]$:QMAクエリの対数的な数にアクセスする時間に含まれていることが知られている。
スペクトルギャップ問題は、多対一(Karp)還元の下でQMAハードであることの簡単な証明を与える。
スペクトルギャップ問題(Spectral Gap problem)の複雑さは、多くの還元の下で特徴づけられる。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 16:13:30 GMT)
A New $\sim 5σ$ Tension at Characteristic Redshift from DESI DR1 and DES-SN5YR observations [0.0] 我々は,マルチタスクガウスプロセスフレームワークを用いて,角径距離(D_A$)のモデルに依存しない再構成を行う。
我々は、バリオンドラッグエポック$r_d$の共振音の水平方向をプランクの最適値に調整する。
我々の発見によると、$zsim 1.63$で、$H(z)$はPlanck-2018 $Lambda$CDM予測と完全に一致している。
$zsim 0.512$とすると、導出された$H(z)$は5sigma$以上の相違を示す。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:58:15 GMT)
$2+1$ dimensional Floquet systems and lattice fermions: Exact bulk spectral equivalence [0.0] フロケ絶縁体と呼ばれる周期的に駆動される系は連続時間で、静的フェルミオン理論は離散時間で結ばれている。
ここでは、Floquet物理を高次元で捉えるための静的離散時間理論の可能性について検討する。
論文参考訳(メタデータ) (Tue, 04 Mar 2025 18:11:01 GMT)