Towards Unified Latent Space for 3D Molecular Latent Diffusion Modeling [80.6] 3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
本稿では,3次元分子を結合した潜在空間から潜在配列に圧縮する多モードVAEを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:03:49 GMT)
More is Less: The Pitfalls of Multi-Model Synthetic Preference Data in DPO Safety Alignment [80.0] 直接選好最適化(DPO)は、人間のフィードバックによる強化学習の、シンプルで効果的な代替手段として登場した。
我々の研究は、DPOアライメントに関連する、目覚ましい、安全性に特有な現象を明らかにした。
選択されたペアと拒否されたペアに対してのみ自己生成されたレスポンスを使用することで、より強力なモデルからのレスポンスを含む構成を大幅に上回る。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:36:40 GMT)
ChatGarment: Garment Estimation, Generation and Editing via Large Language Models [79.5] ChatGarmentは、大規模な視覚言語モデル(VLM)を活用して、3D衣服の見積もり、生成、編集を自動化する新しいアプローチである。
ウィジェット内の画像やスケッチから縫製パターンを推定し、テキスト記述から生成し、ユーザー指示に基づいて衣服を編集することができる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:47:55 GMT)
Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.0] 伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。
これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。
我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:43:45 GMT)
SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models [78.1] シミュレーションは,実画像に翻訳する空間的適性を与えるのに驚くほど効果的であることを示す。
シミュレーションにおける完全アノテーションは、擬似アノテーション実画像の既存のアプローチよりも効果的であることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:59:24 GMT)
CodeUpdateArena: Benchmarking Knowledge Editing on API Updates [77.8] コードドメインの知識編集のためのベンチマークであるCodeUpdateArenaを提示する。
私たちのベンチマークのインスタンスは、プログラム合成例と組み合わせた合成API関数のアップデートで構成されています。
ベンチマークでは、7つのPythonパッケージから54の関数へ、さまざまなタイプの更新をカバーしています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:15:55 GMT)
Understanding and Mitigating Language Confusion in LLMs [77.0] 我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。
Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。
言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:31:53 GMT)
Geometric Median Matching for Robust k-Subset Selection from Noisy Data [75.9] 最適分解点1/2のロバストな推定器であるGeometric Medianを利用する新しいk-subset選択法を提案する。
提案手法は, k-subset を反復的に選択し,部分集合の平均が(潜在的に)ノイズデータセットの GM に近似し,任意の汚損の下でもロバスト性を確保する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:12:07 GMT)
How to Train Long-Context Language Models (Effectively) [75.5] 言語モデル(LM)の継続学習と教師付き微調整(SFT)を行い,長文情報の有効利用について検討した。
コードリポジトリと書籍は長いデータの優れた情報源であることがわかったが、それらと高品質の短文データを組み合わせることが不可欠である。
最終モデルであるProLong-8Bは、128Kの同様のサイズのモデル間で、最先端の長文性能を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:26:46 GMT)
Scaling Laws in Scientific Discovery with AI and Robot Scientists [72.3] 自律的なジェネラリスト科学者(AGS)の概念は、エージェントAIとエンボディロボットを組み合わせて、研究ライフサイクル全体を自動化している。
AGSは科学的発見に必要な時間と資源を大幅に削減することを目指している。
これらの自律的なシステムが研究プロセスにますます統合されるにつれて、科学的な発見が新しいスケーリング法則に従うかもしれないという仮説を立てる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:55:11 GMT)
Tree-based Models for Vertical Federated Learning: A Survey [71.8] ツリーベースのモデルは、その有効性、堅牢性、解釈可能性により、幅広い現実世界のアプリケーションで大きな成功を収めている。
木質モデルの違いと進歩を実証的に観察するための一連の実験を行った。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:16:09 GMT)
Learning to (Learn at Test Time): RNNs with Expressive Hidden States [69.8] 本稿では,線形複雑性と表現的隠蔽状態を持つシーケンスモデリング層をインスタンス化するフレームワークを提案する。
隠れた状態はテストシーケンスでもトレーニングによって更新されるので、私たちのレイヤはテスト時間トレーニング層と呼ばれます。
Transformerと同様に、TT-LinearとTT-MLPはより多くのトークンを条件付けすることでパープレキシティを減少させるが、Mambaは16kコンテキスト以降は不可能である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:30:11 GMT)
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments [55.5] 物理推論に基づく映像生成モデル評価のためのベンチマークであるMorpheusを紹介する。
物理現象を捉えた80の現実世界のビデオが保存法によってガイドされている。
我々の研究結果によると、プロンプトやビデオコンディショニングが進んだとしても、現在のモデルは物理原理をエンコードするのに苦労している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:21:17 GMT)
Retrieving Semantics from the Deep: an RAG Solution for Gesture Synthesis [55.5] RAG-Gestureは、意味的に豊かなジェスチャーを生成するための拡散に基づくジェスチャー生成手法である。
我々は、明示的なドメイン知識を用いて、共同音声ジェスチャーのデータベースから動きを検索する。
提案手法では,各検索挿入が生成したシーケンスに対して与える影響量を調整可能なガイダンス制御パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:37:26 GMT)
Networking Systems for Video Anomaly Detection: A Tutorial and Survey [55.3] ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。
ディープラーニングとエッジコンピューティングの進歩により、VADは大きな進歩を遂げた。
この記事では、NSVADの初心者向けの包括的なチュートリアルを紹介します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:41:14 GMT)
HUMOS: Human Motion Model Conditioned on Body Shape [54.2] 身体形状に基づく生成運動モデルを構築するための新しいアプローチを提案する。
非ペアデータを使ってこのモデルをトレーニングすることが可能であることを示す。
得られたモデルは、多種多様で、物理的に妥当で、動的に安定した人間の動きを生成する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:40:12 GMT)
Reasoning Under 1 Billion: Memory-Augmented Reinforcement Learning for Large Language Models [53.5] 強化学習(RL)を伴う大規模言語モデル(LLM)は、複雑な推論タスクにおいて有望な改善を示す。
RLは10億のパラメータを持つ小さなLLMでは、効果的に探索するために必要な事前訓練能力が欠如しているため、依然として困難である。
この研究は、この課題に対処するためにエピソード記憶を活用する、新しい本質的なモチベーションアプローチを導入する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:46:17 GMT)
The quasi-semantic competence of LLMs: a case study on the part-whole relation [53.4] 我々は,アンフィパル・ホール関係,すなわちアンフェロニミーの知識について検討する。
Emphquasi-semantic'のモデルは、単にemphquasi-semantic'の能力を持つだけで、深い推論特性の取得には至っていないことを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:41:26 GMT)
RobuNFR: Evaluating the Robustness of Large Language Models on Non-Functional Requirements Aware Code Generation [52.9] NFR対応コード生成におけるLLMのロバスト性を評価するため,RobuNFRを提案する。
実験の結果,コード生成におけるNFRを考慮した場合,RobuNFRは試験LLMの問題を明らかにすることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:55:35 GMT)
Diffusion at Absolute Zero: Langevin Sampling Using Successive Moreau Envelopes [conference paper] [52.7] 本稿では,$pi(x)proptoexp(-U(x))$という形のGibbs分布から,潜在的に$U(x)$でサンプリングする方法を提案する。
拡散モデルに着想を得て、ターゲット密度の近似の列 $(pit_k)_k$ を考えることを提案し、そこで$pit_kapprox pi$ for $k$ small に対して $pit_k$ は、$k$のサンプリングに好適な性質を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:30:51 GMT)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.5] 予測モデルは、現実世界のタスクで不完全な情報を扱う必要があることが多い。
現在の大規模言語モデル(LLM)は正確な推定には不十分である。
本稿では,新しい確率的推論フレームワークBIRDを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:41:51 GMT)
The Foundations of Tokenization: Statistical and Computational Concerns [51.4] トークン化は、NLPパイプラインにおける重要なステップである。
NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。
本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:07:13 GMT)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.1] LlamaRestTestは、2つのLLM(Large Language Models)を使って現実的なテストインプットを生成する新しいアプローチである。
私たちは、GPTを使った仕様強化ツールであるRESTGPTなど、最先端のREST APIテストツールに対して、これを評価しています。
私たちの研究は、REST APIテストにおいて、小さな言語モデルは、大きな言語モデルと同様に、あるいは、より良く機能することができることを示しています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:42:32 GMT)
How Post-Training Reshapes LLMs: A Mechanistic View on Knowledge, Truthfulness, Refusal, and Confidence [46.5] 大規模言語モデル(LLM)の成功にはポストトレーニングが不可欠である
学習後効果をよりよく理解するために,4つの視点からベースとポストトレーニング後のLLMを比較した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:30:55 GMT)
Leveraging LLM For Synchronizing Information Across Multilingual Tables [45.8] 本稿では,多言語情報同期のための大規模言語モデル (LLM) について検討し,ゼロショットプロンプトを拡張性のあるソリューションとして用いた。
本稿では,古くなったウィキペディアのテーブルを更新する実世界のプロセスをシミュレートした,情報更新データセットを提案する。
その結果, 単一プロンプトアプローチは, 協調性や正確性を高めるタスク分解戦略を導入し, 最適以下の結果をもたらすことが判明した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:15:18 GMT)
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations [45.6] 我々はScholarCopilotを紹介した。ScholarCopilotは学術書記のための既存の大規模言語モデルを強化するために設計された統合フレームワークである。
ScholarCopilotは、検索トークン[RET]を生成して学術的な参照をいつ取得するかを決定し、引用データベースに問い合わせる。
私たちは1つのフレームワーク内で生成タスクと引用タスクの両方を共同で最適化し、効率を向上します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:07:29 GMT)
RePoseD: Efficient Relative Pose Estimation With Known Depth Information [45.4] 本稿では,2つのカメラの相対的なポーズを,関連する単眼深度に対応する点対応から推定する新しい枠組みを提案する。
新しいソルバは、スピードと精度の点で最先端のディープ・アウェア・ソルバより優れている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:07:38 GMT)
ConMo: Controllable Motion Disentanglement and Recomposition for Zero-Shot Motion Transfer [44.3] ConMoは、被写体の動きとカメラの動きを歪め、再構成するフレームワークである。
多様な対象に対してより正確なモーションコントロールを可能にし、マルチオブジェクトシナリオのパフォーマンスを向上させる。
ConMoは、被写体のサイズや位置の編集、被写体除去、セマンティックな修正、カメラモーションシミュレーションなど、幅広いアプリケーションをアンロックする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:15:52 GMT)
MegaMath: Pushing the Limits of Open Math Corpora [44.1] MegaMathは、多種多様な数学に焦点を当てたソースからキュレートされたオープンデータセットである。
MegaMathは、既存のオープン数学事前トレーニングデータセットの中で、最大で最高品質の371Bトークンを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:52:07 GMT)
OSV: One Step is Enough for High-Quality Image to Video Generation [44.1] 一貫性蒸留とGANトレーニングを効果的に組み合わせた2段階トレーニングフレームワークを提案する。
また,ビデオラテントを復号化する必要のない新しいビデオ識別器の設計を提案する。
本モデルでは,高画質映像を1ステップで生成可能であり,多段精細化の柔軟性が期待できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:00:51 GMT)
Haphazard Inputs as Images in Online Learning [44.1] 本稿では,オンライン学習環境における様々な特徴空間を,その場で一定次元の画像表現に変換することを提案する。
この単純で斬新なアプローチはモデルに依存しないため、どんな視覚ベースのモデルでもハファザード入力に適用できる。
画像表現は、一貫性のない入力データをシームレスに処理し、提案手法をスケーラブルかつ堅牢にする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:14:05 GMT)
Bridging the Theoretical Gap in Randomized Smoothing [44.0] 本稿では,理論的証明されたロバスト性と経験的精度のギャップを埋める新しい枠組みを提案する。
我々のアプローチは、認証されたロバスト性の境界を厳しくし、実際にモデルロバスト性をより正確に反映します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:05:49 GMT)
STING-BEE: Towards Vision-Language Model for Real-World X-ray Baggage Security Inspection [43.7] STCrayは、21の脅威カテゴリにわたる46,642のイメージキャプチャペアスキャンからなる、最初のマルチモーダルX線バッグセキュリティデータセットである。
STCrayはドメインを意識したコヒーレントなキャプションを保証する特別なプロトコルで慎重に開発されています。
これにより、さまざまな視覚言語タスクをサポートするSTING-BEEという、ドメイン対応のビジュアルAIアシスタントをトレーニングすることができます。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:59:12 GMT)
THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models [43.4] 大規模視覚言語モデル(LVLM)の幻覚は未解決の問題である。
最近のベンチマークでは、オープンエンドな自由形式の応答の幻覚には対処していない。
LVLM出力におけるI型幻覚を定量的に評価する新しいフレームワークであるTHRONEを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:59:23 GMT)
VoiceCraft-Dub: Automated Video Dubbing with Neural Codec Language Models [43.2] テキストと顔の手がかりから高品質な音声を合成する,ビデオダビングの自動化手法であるVoiceCraft-Dubを提案する。
この課題は、映画製作、マルチメディア制作、音声障害者支援に広く応用されている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:24:47 GMT)
Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and Harmonization [43.0] Comprehensive Relightingは、あらゆるシーンから任意の身体部分を持つ人間の画像やビデオから照明を制御し調和させる、最初のオールインワンのアプローチである。
実験では、Comprehensive Relightingは強力な一般化性と時間的コヒーレンスを示し、既存の画像に基づく人間のリライトと調和の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:10:50 GMT)
OmniCam: Unified Multimodal Video Generation via Camera Control [42.9] カメラの位置やポーズを変えることで多様な視覚効果を実現するカメラ制御は、広く注目を集めている。
既存の手法は複雑な相互作用や限定的な制御能力といった課題に直面している。
我々は、誘導時間的に一貫したビデオを生成する統合カメラフレームワークであるOmniCamを紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:38:30 GMT)
VISTA: Unsupervised 2D Temporal Dependency Representations for Time Series Anomaly Detection [42.7] 時系列異常検出(TSAD)は、ラベルのない時系列データの中で稀で潜在的に有害な事象を明らかにするのに不可欠である。
本稿では,これらの課題を克服するために,トレーニング不要で教師なしのTSADアルゴリズムであるVISTAを紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:20:49 GMT)
When Can You Trust Your Explanations? A Robustness Analysis on Feature Importances [42.4] 説明の堅牢性は、システムと提供された説明の両方を信頼する上で、中心的な役割を果たす。
本稿では,非対向摂動に対するニューラルネットワーク説明の頑健さを解析するための新しいアプローチを提案する。
さらに,様々な説明を集約するアンサンブル手法を提案し,モデルの決定を理解し,頑健さを評価することによって,説明の融合がいかに有用かを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:59:16 GMT)
Direction-Aware Hybrid Representation Learning for 3D Hand Pose and Shape Estimation [42.0] 暗黙的な画像特徴と明示的な2次元共同座標特徴を融合する学習方向対応ハイブリッド特徴(DaHyF)を提案する。
提案手法は,DAHyF表現による3次元手振りを直接予測し,コントラスト学習に基づく予測信頼度を用いて,モーションキャプチャ時のジッタリングを低減する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:52:59 GMT)
The role of spectator modes in the quantum-logic spectroscopy of single trapped molecular ions [41.9] 本研究では、状態依存型光双極子力に依存する測定プロトコルに直接かかわらないオブザーバモードの役割について検討する。
二イオン弦の力に対する応答を変調するデバイ・ウォラー型効果を同定し、弦のすべての常温モードを冷却することで、N$+$分子イオンの偏移基底状態を検出することができることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:37:24 GMT)
Estimating Scene Flow in Robot Surroundings with Distributed Miniaturized Time-of-Flight Sensors [41.5] 本研究では,ロボット本体上に分散した時間飛行(ToF)センサから得られた低密度・雑音点雲からのシーンフロー推定手法を提案する。
提案手法は,連続するフレームからクラスタリングし,高密度な動きの流れを推定するために反復閉点(ICP)を適用した。
我々は、静止点と移動点を区別するために適合度に基づく分類と、幾何学的対応を洗練させるために不整合除去戦略を用いる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:57:51 GMT)
VARGPT-v1.1: Improve Visual Autoregressive Large Unified Model via Iterative Instruction Tuning and Reinforcement Learning [40.8] VARGPT-v1.1は高度な統合視覚自己回帰モデルである。
このモデルは、視覚的理解のための次世代予測と画像合成のための次世代生成という2つのパラダイムを保存している。
マルチモーダル理解とテキスト・ツー・イメージ・インストラクション・フォロータスクにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:06:28 GMT)
MatterChat: A Multi-Modal LLM for Material Science [40.3] マルチモーダルな多モード言語モデルであるMatterChatを紹介する。
そこで,MatterChatは材料特性予測と人間-AIインタラクションの性能を大幅に向上させることを示す。
また、より高度な科学的推論やステップバイステップの物質合成などの応用においても有用性を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:39:34 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: Progress and Challenges [40.1] この調査は、初期の単一モーダル法から洗練された多モーダルアプローチへのディープフェイク検出の進化を辿るものである。
本稿では,検出手法の構造化された分類法を提案し,GANベースから拡散モデル駆動型ディープフェイクへの遷移を解析する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:47:44 GMT)
Generative Evaluation of Complex Reasoning in Large Language Models [39.2] 大規模言語モデル(LLM)における推論評価に特化して設計された生成的評価フレームワークであるKUMOを紹介する。
自動パイプラインを通じて、KUMOは、超人記憶よりも真の一般化を示すために、オープンエンドドメインにまたがる新しいタスクを連続的に生成する。
我々は、KUMOが作成した100のドメインにまたがる5000のタスクに対して、23の最先端LCMを評価し、大学生に対する推論能力をベンチマークした。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:54:18 GMT)
TAMT: Temporal-Aware Model Tuning for Cross-Domain Few-Shot Action Recognition [39.1] クロスドメイン行動認識(CDFSAR)は近年研究の関心を集めている。
本稿では,CDFSARのための簡易かつ効果的なベースラインであるTemporal-Aware Model Tuning (TAMT)を提案する。
我々のTAMTは、ソースデータと微調整対象データで事前トレーニングを行うことで、複数のターゲットデータに対する単一のソースによる再トレーニングを回避することで、デカップリングパラダイムを含む。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:10:13 GMT)
Multifaceted Evaluation of Audio-Visual Capability for MLLMs: Effectiveness, Efficiency, Generalizability and Robustness [38.6] マルチモーダル大言語モデル (MLLM) は近年,多様なモーダルからの情報処理と理解において大きな成功を収めている。
人気が高まっているにもかかわらず、これらのモデルの音声視覚能力を評価する包括的な評価はいまだに残っていない。
本稿では,MLLMの音響視覚能力の多面的評価を行い,有効性,効率性,一般化性,堅牢性という4つの重要な側面に着目した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:24:17 GMT)
PanGu-$π$ Pro:Rethinking Optimization and Architecture for Tiny Language Models [38.6] モバイルデバイスにおける言語モデルの適用は、計算とメモリコストに大きな課題に直面している。
本研究では,1Bパラメータを持つ小さな言語モデルに基づいて,各成分の効果を分析するための実験的な研究を慎重に設計する。
いくつかの設計公式は、特に小さな言語モデルに有効であることが実証的に証明されている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:13:53 GMT)
MG-MotionLLM: A Unified Framework for Motion Comprehension and Generation across Multiple Granularities [36.4] MG-MotionLLMは多粒運動の理解と生成のための統一運動言語モデルである。
本稿では,新しい補助課題を取り入れた包括的多粒度学習手法を提案する。
MG-MotionLLMは,従来のテキスト・トゥ・モーションタスクやモーション・トゥ・テキストタスクにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:53:41 GMT)
Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme [36.3] 本研究は、視覚モデル(VLM)における強化学習(RL)のための透明でゼロスクラッチなフレームワークを導入する。
複数のモデルとデータセットにまたがって検証される、最小限の機能を備えた4ステップパイプラインを提供する。
さらに、トレーニング力学と反射行動を評価するために、標準化された評価手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:53:28 GMT)
Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction [36.0] スケルトン拡散(Skeleton Diffusion)は、人体に明らかな誘導バイアスを埋め込む潜伏拡散モデルである。
我々のアプローチは、手足の歪みのような人工物を避けながら、常に現実的な予測を生成する。
現実世界のデータセットに新しいベンチマークを設定する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:35:42 GMT)
Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.9] 歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。
本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:46:31 GMT)
Prompt Optimization with Logged Bandit Data [34.8] クリックなどの自然なユーザフィードバックを用いて,プロンプトを用いてパーソナライズされた文を生成するために,大規模言語モデル(LLM)パイプラインを最適化する方法について検討する。
本稿では, 生成文間の類似性を生かしてポリシー勾配を推定する, カーネルベースの非政治勾配法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:40:40 GMT)
What Makes for a Good Stereoscopic Image? [34.1] SCOPEは,多種多様な知覚歪みと人工物を含む実画像と合成立体画像からなる新しいデータセットである。
また、データセット上でトレーニングされた経験評価のステレオ品質のための新しいモデルiSQoEを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:26:17 GMT)
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation [34.1] 我々は,ヘッドビデオ生成のためのエンドツーエンドビデオ拡散フレームワークであるtextbfACTalkerを紹介する。
マルチコントロールのために,複数の枝を持つ並列マンバ構造を設計し,それぞれが個別の駆動信号を用いて特定の顔領域を制御する。
提案手法は,多様な信号によって駆動される自然な顔映像を生成し,マンバ層は相反なく複数の駆動モードをシームレスに統合することを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:44:41 GMT)
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation [33.1] 大規模言語モデル(LLM)の出現は機械翻訳(MT)の景観を大きく変えた。
我々は、アンダーリソース設定への効果的な適応を可能にする、少数ショットプロンプト、クロスランガル転送、パラメータ効率の微調整などの手法を解析する。
幻覚, 評価の不整合, 遺伝バイアスなどの持続的課題について検討するとともに, 翻訳品質向上のためのLCM駆動メトリクスの評価を行った。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:30:35 GMT)
TROVE: A Challenge for Fine-Grained Text Provenance via Source Sentence Tracing and Relationship Classification [33.0] 医療、法律、ニュースなどの高度な領域では、コンテンツがどこでどのように作られるかを理解することが不可欠である。
テキストpROVEnance(テキストpROVEnance)チャレンジを導入し、ターゲットテキストの各文を特定のソース文にトレースする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:56:04 GMT)
Randomized Pairwise Learning with Adaptive Sampling: A PAC-Bayes Analysis [32.8] ペアワイズ学習モデルの学習のためのデータ適応型サンプリング手法を用いて最適化について検討する。
ポイントワイズ学習とペアワイズ学習の顕著な違いは、入力ペア間の統計的上昇である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:24:01 GMT)
End-To-End Self-Tuning Self-Supervised Time Series Anomaly Detection [32.7] 時系列異常検出(TSAD)は、環境センサ、産業タイプ、患者バイオマーカーなど、多くの応用を見出す。
TSADの2倍の課題は、様々な種類の時系列異常を検出できる汎用的で教師なしのモデルである。
TSAP for TSA "on autoPilot"を導入します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:00:13 GMT)
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D [32.5] 本研究では,3次元地上構造を持つシーンデータ上に構築された新しい2次元空間データ生成およびアノテーションパイプラインを提案する。
複数の公開データセットにまたがって数千のシーンから生成される大規模データセットであるSPAR-7Mを構築した。
さらに,空間能力をより包括的に評価するためのベンチマークであるSPAR-Benchを紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:34:23 GMT)
A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models [32.5] 大規模なAIモデルは、医療、教育、法律など、高度な分野に展開されている。
これらの課題は、モデルの能力と現実世界のアプリケーションのニーズを整合させるために、学際的な革新を必要とします。
我々は,ユーザの要求を満たすためのイノベーションを階層的に抽象化することで,このギャップに対処するフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:40:11 GMT)
Learning Audio-guided Video Representation with Gated Attention for Video-Text Retrieval [30.7] ビデオテキスト検索は、ビデオ理解とマルチモーダル情報検索において最重要となる。
音声を組み込んだ従来のモデルは、有用か否かにかかわらず音声入力を盲目的に利用し、その結果、準最適映像表現となる。
GATEd attention (AVIGATE) を用いた音声誘導型VIdeo表現学習のための新しいビデオテキスト検索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:45:36 GMT)
Self-Calibrating Gaussian Splatting for Large Field of View Reconstruction [30.5] 本稿では,カメラパラメータ,レンズ歪み,3次元ガウス表現を協調的に最適化する自己校正フレームワークを提案する。
本手法により,広角レンズで撮影した大視野視野(FOV)画像から高品質なシーン再構成が可能となり,少ない画像からシーンをモデル化することができる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:24:51 GMT)
Evaluating Molecule Synthesizability via Retrosynthetic Planning and Reaction Prediction [30.2] 現在の医薬品設計モデルを用いた湿式実験における重要な課題は、薬理学的特性と合成可能性とのトレードオフである。
分子合成性を評価するための新しいデータ駆動計量を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:16:18 GMT)
DuplexMamba: Enhancing Real-time Speech Conversations with Duplex and Streaming Capabilities [29.7] 本稿では,マンバをベースとした音声とテキストの対話のためのマルチモーダル・デュプレックスモデルを提案する。
DuplexMambaは同時入力処理と出力生成を可能にし、動的に調整してリアルタイムストリーミングをサポートする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:26:48 GMT)
WonderTurbo: Generating Interactive 3D World in 0.72 Seconds [29.6] 我々は,0.72秒以内で3Dシーンの新たな視点を生成できる,初めてのリアルタイムインタラクティブな3Dシーン生成フレームワークであるWonderTurboを紹介する。
具体的には、WonderTurboは幾何学的および外見的モデリングの両方を3Dシーン生成で高速化する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:10:47 GMT)
Toward General and Robust LLM-enhanced Text-attributed Graph Learning [29.6] UltraTAGはLLM強化TAG学習のための統一パイプラインである。
UltraTAG-Sは、現実世界のTAGに固有のスパシティ問題に取り組むために設計された堅牢なインスタンス化である。
実験の結果,UltraTAG-Sは既存のベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:24:18 GMT)
VinaBench: Benchmark for Faithful and Consistent Visual Narratives [29.1] 忠実なビジュアルな物語を生み出すという課題に対処する新しいベンチマークであるVinaBenchを提案する。
以上の結果から,VinaBenchの知識制約による学習は,生成した視覚的物語の忠実性と結束性を効果的に向上させることが示された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:28:19 GMT)
Moment Quantization for Video Temporal Grounding [29.1] 我々は、新しいモーメント量子化に基づくビデオ時間グラウンド法(MQVTG)を提案する。
MQVTGは入力ビデオを様々な離散ベクトルに量子化し、関連するモーメントと無関係なモーメントの識別を強化する。
本手法は,関係する特徴を効果的にグループ化し,無関係な特徴を分離し,差別の強化を目標とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:21:14 GMT)
Photon-number-resolving single-photon detector with a system detection efficiency of 98% and photon-number resolution of 32 [28.6] 単一光子系検出効率(SDE)は98%、暗カウントレートは20cpsである。
検出器は3dB-SDEで41MHzの高速で動作し、低タイミングジッタは40psである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 01:15:49 GMT)
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation [28.2] OpenAIのGPT4oモデルは、画像生成と編集において驚くほど優れた機能を示している。
本報告では、GPT-ImgEvalというファーストルック評価ベンチマークについて述べる。
GPT-4oの性能は,生成品質,(2)編集能力,(3)世界知識インフォームド合成の3つの重要な側面にまたがっている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:23:16 GMT)
LearNAT: Learning NL2SQL with AST-guided Task Decomposition for Large Language Models [28.2] 複雑なNL2タスクにおいて,タスク分解と強化学習により,LLM(Large Language Models)の性能を向上させる新しいフレームワークを提案する。
LearNATはGPT-4に匹敵する性能を実現し、効率とアクセシビリティを向上させる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:59:44 GMT)
Image Coding for Machines via Feature-Preserving Rate-Distortion Optimization [28.0] 本稿では,特徴量間の距離を歪み指標として,タスク損失に対する圧縮の影響を低減する手法を提案する。
我々は、ブロックベースのエンコーダを用いて歪み項を計算可能にするために、RDOの定式化を単純化する。
SSEに基づくRDOと比較して、同じコンピュータビジョンの精度で最大10%のビットレートを節約できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:11:26 GMT)
SkyReels-A2: Compose Anything in Video Diffusion Transformers [27.3] 本稿では、任意の視覚要素を合成ビデオに組み込むことができる制御可能なビデオ生成フレームワークSkyReels-A2を提案する。
このタスク要素をビデオ(E2V)と呼び、各参照要素の忠実さを保ち、シーンのコヒーレントな構成を確保し、自然な出力を達成することが主な課題である。
本稿では,多要素表現を生成プロセスに注入し,要素固有の一貫性とグローバルコヒーレンスとテキストアライメントのバランスをとる,新しい画像-テキスト共同埋め込みモデルを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:50:50 GMT)
F-ViTA: Foundation Model Guided Visible to Thermal Translation [27.2] そこで我々は,F-ViTAを提案する。F-ViTAは,基礎モデルに埋め込まれた一般世界の知識を利用して,翻訳改善のための拡散過程を導出する手法である。
本モデルでは, オフ・オブ・ディストリビューション(OOD)のシナリオを一般化し, 同じ可視像からLWIR, MWIR, 近赤外(NIR)の変換を生成する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:47:06 GMT)
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision [25.3] 重要なロボットビジョンタスクにおけるマルチモーダル融合の応用を体系的に検討する。
視覚言語モデル(VLM)と従来のマルチモーダル融合法を比較し,その利点,限界,シナジーを分析した。
クロスモーダルアライメント、効率的な融合戦略、リアルタイムデプロイメント、ドメイン適応といった重要な研究課題を特定します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:53:07 GMT)
Can AI Solve the Peer Review Crisis? A Large Scale Cross Model Experiment of LLMs' Performance and Biases in Evaluating over 1000 Economics Papers [25.2] 本研究では,大規模言語モデル(LLM)による学術的査読プロセスの強化の可能性について,系統的バイアスを伴わずに,経済研究の質を確実に評価することによって検討する。
2つの相補的な実験で4つのLLMの大規模評価を行った。
我々は、GPT、Gemma、LLaMAが、匿名で提示された同じ論文に対して、上位の男性作家やエリート機関からの投稿に対して、かなり高い評価を割り当てていることを発見した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:12:13 GMT)
JailDAM: Jailbreak Detection with Adaptive Memory for Vision-Language Model [25.2] マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクに優れるが、有害なコンテンツを生成する大きなリスクを生じさせる。
ジェイルブレイク攻撃は、モデル内の安全メカニズムを回避し、不適切なコンテンツや安全でないコンテンツを生成する意図的な操作を指す。
JAILDAMと呼ばれるテスト時間適応フレームワークを導入し、これらの問題に対処する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:00:28 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0] Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。
本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。
予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:12:03 GMT)
SAM-REF: Introducing Image-Prompt Synergy during Interaction for Detail Enhancement in the Segment Anything Model [24.8] 軽量精細機を用いて画像とプロンプトを完全に統合する2段階精細化フレームワークを提案する。
我々のSAM-REFモデルは、効率を損なうことなくセグメンテーション品質に関するほとんどの指標において、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:38:19 GMT)
Leveraging Modality Tags for Enhanced Cross-Modal Video Retrieval [24.8] ビデオ検索のためのモダリティ補助概念(MAC-VR)を紹介する。
我々は、潜在空間におけるモダリティの整合と、補助潜在概念の学習と整合性を提案する。
5つの多様なデータセットについて広範な実験を行う。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:30:52 GMT)
Heterogeneous Mixture of Experts for Remote Sensing Image Super-Resolution [23.4] 我々は、Mixture of Experts (MoE)モデルを導入し、異種専門家の集合を設計する。
これらの専門家は複数の専門家グループに分けられ、各グループのエキスパートはグループ間で異質でありながら同質である。
UCMerced および AID データセットを用いた実験により,提案手法がSR再構成精度に優れていることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:27:53 GMT)
The Value of Information in Human-AI Decision-making [23.4] 情報の価値を特徴付けるための決定論的枠組みを提供する。
本稿では,モデル選択,人間-AI性能の実証評価,説明設計におけるフレームワークの利用について紹介する。
本稿では,意思決定における情報価値を説明するために,サリエンシに基づく説明手法であるSHAPを適用した新しい情報ベース説明手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:57:23 GMT)
LPA3D: 3D Room-Level Scene Generation from In-the-Wild Images [23.3] LPA-GAN(LPA-GAN)は、LPAのカメラポーズの先行を推定するために、特定の修正を組み込んだ新しいNeRFベースの生成手法である。
本手法は,ビュー・ツー・ビューの整合性とセマンティック・ノーマル性に優れる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:18:48 GMT)
CoLa -- Learning to Interactively Collaborate with Large LMs [22.4] 自動ガイドを学習するための新しい自己指導型学習パラダイムであるCoLaを紹介する。
我々は,人間によるQAデータセットの人間による研究を行うことにより,人間と自動ガイドの戦略を比較した。
自動ガイドは,その戦略を推論者の能力に適応させることで人間より優れていることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:34:36 GMT)
ConsistencyDet: A Few-step Denoising Framework for Object Detection Using the Consistency Model [22.3] 本稿では,物体検出を認知拡散過程として記述するための新しいフレームワークを提案する。
textbfConsistencyDetと呼ばれるこのフレームワークは、Consistency Modelとして知られる革新的な概念を活用している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:19:04 GMT)
MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception [22.2] MMTL-UniADはマルチモーダルなマルチタスク学習フレームワークである。
ドライバーの行動(例えば、周りを見回したり話したり)、ドライバーの感情(例えば、不安、幸福)、車両の挙動(例えば、駐車、旋回)、交通状況(例えば、交通渋滞、交通のスムーズさ)を同時に認識する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:23:27 GMT)
VEGAS: Towards Visually Explainable and Grounded Artificial Social Intelligence [22.1] ソーシャルインテリジェンスクエリ(Social Intelligence Queries、Social-IQ)は、モデルのソーシャルインテリジェンスレベルを評価するための主要なマルチモーダルベンチマークである。
本稿では,視覚的説明可能・接地型人工知能(VEGAS)モデルを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:48:21 GMT)
BECAME: BayEsian Continual Learning with Adaptive Model MErging [21.6] BECAMEという2段階のフレームワークを導入し、勾配予測と適応的マージの専門知識を相乗化する。
我々のアプローチは、最先端のCLメソッドと既存のマージ戦略より優れています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:07:28 GMT)
FM2DS: Few-Shot Multimodal Multihop Data Synthesis with Knowledge Distillation for Question Answering [21.5] マルチモーダルなマルチホップ質問応答 (MMQA) には、複数のソースからの画像やテキストを推論する必要がある。
既存の方法は、シングルホップ、シングルモダリティ、短いテキストに焦点を当てている。
MMQAのための高品質なデータセットを作成するための最初のフレームワークであるFM2DSを紹介します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:39:17 GMT)
Predictive Coding for Decision Transformer [21.3] 決定変換器(DT)アーキテクチャは、様々な領域で約束されている。
最初の成功にもかかわらず、DTはゴール条件付きRLのいくつかの挑戦的なデータセットで性能が劣っている。
本稿では、一般化された将来の条件付けを活用してDT手法を強化するPCDT(Predictive Coding for Decision Transformer)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:35:28 GMT)
Understanding Depth and Height Perception in Large Visual-Language Models [21.2] 視覚言語モデル(VLM)の幾何学的理解を評価することに注力する。
形状や大きさといった基本的な幾何学的性質の知覚には優れていますが、深さや高さの知覚には一貫して苦労しています。
本研究の目的は, 幾何学的理解を深めた VLM の開発方法を明らかにすることである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:06:48 GMT)
Towards Mobile Sensing with Event Cameras on High-agility Resource-constrained Devices: A Survey [21.0] 本稿は2014-2024年の間に文献を調査する。
イベントベースのモバイルセンシングシステムの概要を提供する。
本稿では,視覚計測,物体追跡,光フロー推定,3次元再構成など,モバイルセンシングにおけるイベントカメラの重要応用について論じる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:53:09 GMT)
MedConv: Convolutions Beat Transformers on Long-Tailed Bone Density Prediction [20.9] 骨密度予測のための畳み込みモデルであるMedConvを導入する。
提案手法は従来の最先端手法に比べて精度が最大21%向上し,ROC AUCは20%向上した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:23:35 GMT)
Productively Deploying Emerging Models on Emerging Platforms: A Top-Down Approach for Testing and Debugging [20.9] textscTapMLは、さまざまなプラットフォームでのモデルのデプロイを合理化するために設計されたトップダウンのアプローチである。
textscTapMLは、新興MLモデルをデプロイするMLC-LLMプロジェクトにおいて、デフォルトの開発メソッドとして使用されている。
2年以内に、textscTapMLは、5つの新興プラットフォームにまたがる27のモデルアーキテクチャに105の新興モデルのデプロイを加速した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 23:20:47 GMT)
LLM Library Learning Fails: A LEGO-Prover Case Study [20.3] レゴプロバーは, 数学的推論のための再利用可能な補題を学習する。
学習したレムマの直接再利用の証拠は見つからず、学習したレムマのソフト再利用に対する証拠も見つからない。
本研究は,これらの手法の有効性について,重大な誤解が存在することを示唆している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:53:51 GMT)
Benchmark of Segmentation Techniques for Pelvic Fracture in CT and X-ray: Summary of the PENGWIN 2024 Challenge [20.1] PENGWINは自動破折セグメンテーションを推し進めることを目的としていた。
トップパフォーマンスCTアルゴリズムは、平均的なフラグメントワイド結合(IoU)を0.930で達成し、良好な精度を示した。
最も優れたアルゴリズムは0.774のIoUに達し、解剖学的構造が重なり合うことによって生じる大きな課題を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:19:36 GMT)
APSeg: Auto-Prompt Model with Acquired and Injected Knowledge for Nuclear Instance Segmentation and Classification [19.8] 核インスタンスのtextbfSegmentation と classification に関する知識を取得,注入した textbfAuto-textbfPrompt モデルを提案する。
APSegは,(1)分布ガイド付き提案オフセットモジュール(textbfDG-POM)と(2)カテゴリ記述から派生した形態的知識を注入するカテゴリ知識セマンティックインジェクションモジュール(textbfCK-SIM)の2つの知識認識モジュールを組み込んでいる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:28:51 GMT)
The Dual-Route Model of Induction [19.8] 概念レベルの誘導ヘッドを導入し、個々のトークンの代わりに語彙単位全体をコピーする。
概念誘導ヘッドは単語レベルの翻訳のような意味的なタスクに責任があることを示し、一方トークン誘導ヘッドは動詞でしかできないタスクには不可欠である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:40:31 GMT)
Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.1] 交通信号システム(TSCS)は、効率的な車両の流れを育むインテリジェントな交通管理に不可欠である。
本稿では,インテリジェントトラフィックエッジネットワークを実現するための新しいTSCSフレームワークを提案する。
我々は,マルチエージェントソフトアクター・クリニック(MA-SAC)強化学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:50:50 GMT)
Output Prediction of Quantum Circuits based on Graph Neural Networks [19.0] 本稿では,量子回路の出力期待値を予測するためのグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。
我々は,同じデータセット上での畳み込みニューラルネットワーク(CNN)に対する雑音条件と雑音条件の両方において,GNNの予測性能を比較した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:43:44 GMT)
VIP: Video Inpainting Pipeline for Real World Human Removal [18.3] VIP (Video Inpainting Pipeline) は、現実世界の人間除去アプリケーションのための、新規な無作為なビデオインパインティングフレームワークである。
VIPはモーションモジュールによる最先端のテキスト・トゥ・ビデオモデルを強化し、潜伏空間におけるプログレッシブ・デノーミングのために変分オートエンコーダ(VAE)を使用する。
実世界の様々なシナリオにおいて,VIPは時間的一貫性と視覚的忠実性に優れることを示した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:40:10 GMT)
Noiser: Bounded Input Perturbations for Attributing Large Language Models [17.8] 本稿では,各入力埋め込みに有界雑音を課す摂動型FA法であるノイズ器を紹介する。
ノイズは、信頼度と応答性の両方の観点から、既存の勾配、注意に基づく、摂動に基づくFA法を一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:59:37 GMT)
Exploring Individual Factors in the Adoption of LLMs for Specific Software Engineering Tasks [17.8] 本研究では,技術導入に伴う個々の属性と大規模言語モデル(LLM)の関係について検討する。
その結果、タスク固有の採用は異なる要因の影響を受けており、その一部は単独で考えると、採用に悪影響を及ぼすことが判明した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:07:04 GMT)
An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.8] ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。
ECGFounderは内部検証セットのエキスパートレベルのパフォーマンスを達成し、AUROCは80の診断で0.95を超えている。
微調整されたECGFounderは、人口統計分析、臨床イベント検出、心拍数横断診断においてベースラインモデルを上回っている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:42:11 GMT)
Deep Reinforcement Learning via Object-Centric Attention [17.6] タスク関連エンティティを選択的に保存し,無関係な視覚情報をフィルタリングするOcCAM(Object-Centric Attention via Masking)を導入する。
OCCAMは、従来のピクセルベースのRLと類似または類似した性能を示しながら、新しい摂動を著しく改善し、サンプルの複雑さを低減させる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:48:27 GMT)
GPG: A Simple and Strong Reinforcement Learning Baseline for Model Reasoning [17.5] グループポリシーグラディエント(GPG)と呼ばれる最小主義的RLアプローチを提案する。
従来の手法とは異なり、GAGは元のRL目標を直接最適化するので、損失関数のサロゲートが不要になる。
本手法は補助的な技術や調整に頼ることなく優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:53:41 GMT)
RASP: Revisiting 3D Anamorphic Art for Shadow-Guided Packing of Irregular Objects [17.4] 我々は3Dアナモルフィックアートからの洞察に基づいて3Dオブジェクトアレンジメントを行う。
RASPは,任意の形状の3Dオブジェクトを有界体積内に配置する,微分可能なレンダリングベースのフレームワークである。
我々は多視点アナモルフィックアートのアートイラストを提示し、多視点から意味のある表現を実現した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:33:49 GMT)
Hide and Seek in Noise Labels: Noise-Robust Collaborative Active Learning with LLM-Powered Assistance [17.4] ノイズラベル(LNL)からの学習は、収集されたトレーニングデータが誤ったラベルや破損したラベルを含むことができる多くの実世界のシナリオで発生する課題である。
既存のソリューションのほとんどは、ノイズの多いラベルを特定し、アクティブな学習を採用して、人間の専門家にノイズを問う。
本稿では,大規模な言語モデルと,雑音ラベルから学習するための小さなモデルを組み合わせた,能動的学習に基づく革新的な協調学習フレームワークであるNossalを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:36:39 GMT)
DaKultur: Evaluating the Cultural Awareness of Language Models for Danish with Native Speakers [17.4] 我々はデンマークのミッドリソース言語に対する最初の文化的評価研究を行い、母国語話者は異なるモデルに文化的認識を必要とする課題を解決するよう促す。
人口統計学的に多様性のある63人の1,038人のインタラクションの分析は、文化的適応に対するオープンな課題を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:52:42 GMT)
Mixture of Attentions For Speculative Decoding [17.3] 投機的復号法(SD)は、より小さなモデルを利用して将来のトークンを効率的に提案し、それを大規模言語モデルによって並列に検証する。
SDモデルには、トレーニング中のオン・ポリティネスの欠如や部分観測可能性の欠如など、いくつかの制限がある。
SD用ミクチャ・オブ・アテンションの導入により,小型モデルのより基礎的なアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:35:01 GMT)
Revisiting Weight Averaging for Model Merging [16.5] モデルマージは、個別に調整されたモデルのパラメータを追加のトレーニングなしで組み合わせることで、マルチタスク学習者を構築することを目的としている。
ウェイト平均化は、ウェイト平均化自身を中心としたタスクベクトルを暗黙的に誘導する。
これらの中心となるタスクベクトルに低ランク近似を適用することにより、マージ性能が大幅に向上する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:46:20 GMT)
Enhancing Chart-to-Code Generation in Multimodal Large Language Models via Iterative Dual Preference Learning [16.2] Chart2Codeは、チャート・ツー・コード生成のための新しい反復的な二重選好学習フレームワークである。
Chart2Codeは、ディストリビューション外のチャート・ツー・コード生成品質を継続的に改善する。
我々のフレームワークは、チャート理解における今後の進歩の道を開く。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:51:20 GMT)
A Framework for Adapting Human-Robot Interaction to Diverse User Groups [16.2] 適応型ロボットインタラクション(HRI)のための新しいフレームワークを提案する。
私たちの主な貢献は、オープンソースのコードベースを備えた適応型ROSベースのHRIフレームワークの開発です。
このフレームワークは、高度な音声認識と音声活動検出を通じて、自然な相互作用をサポートする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:22:27 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1] 本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。
計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。
異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:30:16 GMT)
DiSRT-In-Bed: Diffusion-Based Sim-to-Real Transfer Framework for In-Bed Human Mesh Recovery [16.1] 頭上深度画像からの人体メッシュ復元のためのSim-to-Real Transfer Frameworkを提案する。
本稿では,実世界のベッド内ポーズと身体推論のシナリオにおける一般化を支援するために,合成データと実データとのギャップを埋める拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:57:16 GMT)
Beyond Accuracy: The Role of Calibration in Self-Improving Large Language Models [15.6] 大規模言語モデル(LLM)は目覚ましい自己改善能力を示している。
本研究では,信頼度推定への影響を調査し,信頼度推定への影響について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:39:54 GMT)
ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization [15.6] 既存の透かし手法は、堅牢性と隠蔽のバランスをとるという課題に直面している。
本稿では, 透かしを積極的に隠蔽し, より強力な透かしの埋め込みを可能にするための透かし隠蔽法を提案する。
様々な拡散モデルの実験では、画像改ざんであっても透かしが検証可能であることが示されている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:11:31 GMT)
C*: Unifying Programming and Verification in C [15.5] C* は C プログラミングのための言語設計の証明である。
プログラマが実装コードと並行して証明コードブロックを埋め込むことで、リアルタイムの検証を可能にする。
C* は C を共通言語として使用することで実装と証明コード開発を統合する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:22:22 GMT)
Why do LLMs attend to the first token? [15.5] 大規模言語モデル(LLM)は、シーケンスの最初のトークンに大きく関与する傾向があり、いわゆるアテンションシンクを生成する。
我々は、このメカニズムがLLMの過剰混合を回避する方法を提供すると理論的、実証的に主張する。
理論的直観を検証し、文脈長、深さ、データパッキングなどの選択がシンク行動にどのように影響するかを示す実験を行う。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:17:55 GMT)
A Bias-Free Training Paradigm for More General AI-generated Image Detection [15.4] 良く設計された法医学的検知器は、データバイアスを反映するのではなく、生成物固有のアーティファクトを検出する必要がある。
本稿では,実画像から偽画像を生成する,バイアスのない学習パラダイムであるB-Freeを提案する。
我々は,最先端検出器の一般化とロバスト性の両方において有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:36:19 GMT)
CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion [15.3] 大規模な言語モデル(LLM)は、必要なコンテキストを提供するために、入力に複数のテキストチャンクを組み込むことが多い。
長いLLM入力のプリフィルを高速化するため、別のLLM入力のプレフィックスとしてコンテキストが再利用された場合、テキストのKVキャッシュをプリコンプリートし、KVキャッシュを再使用することができる。
本稿では,KVキャッシュを高速に組み合わせて,高価なプリフィルと同世代の品質を実現する方法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:49:22 GMT)
MD-ProjTex: Texturing 3D Shapes with Multi-Diffusion Projection [15.1] MD-ProjTexは,事前訓練されたテキスト・ツー・イメージ拡散モデルを用いた3次元形状の高速で一貫したテクスチャ生成手法である。
我々のアプローチの核となるのは、紫外線空間における多視点整合性機構であり、異なる視点におけるコヒーレントなテクスチャを保証する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:58:06 GMT)
Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [15.1] 非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:32:48 GMT)
Retrieval-Augmented Purifier for Robust LLM-Empowered Recommendation [15.1] LLM(Large Language Model)を利用したレコメンデーションシステムは、パーソナライズされたレコメンデーションフレームワークに革命をもたらした。
既存のLLMを動力とするRecSysは、小さな摂動に対して非常に脆弱であることが示されている。
有害なユーザプロファイルを浄化するために,外部の協調信号を検索して新しいフレームワーク(RETURN)を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:22:30 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.0] 大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークのタスク成功率をGPT-4o miniのHugging Face Agentsと比較して29%改善し、GPT-4oのコストを36倍以上削減した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:11:55 GMT)
Do Two AI Scientists Agree? [15.0] 2つのAIモデルが同じ科学的タスクでトレーニングされている場合、彼らは同じ理論または2つの異なる理論を学ぶだろうか?
我々は、物理の標準問題に基づいて訓練されたAI科学者として、ハミルトン・ラグランジアンニューラルネットワークであるMASSを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:58:44 GMT)
Measuring temporal effects of agent knowledge by date-controlled tool use [15.0] 本研究では,大規模言語モデル (LLM) エージェントの知識変数を測定するために,異なる日付制御ツール (DCT) を用いてエージェントの挙動を評価する。
検索エンジンの時間性はツール依存エージェントのパフォーマンスに変換されるが,基本モデルの選択や明示的な推論命令によって緩和可能であることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:53:20 GMT)
Large (Vision) Language Models are Unsupervised In-Context Learners [14.9] 完全教師なし適応のための共同推論フレームワークを導入する。
ゼロショット推論とは異なり、関節推論は与えられたタスクの全ての入力に対して同時に予測を行う。
我々の実験は、標準のゼロショットアプローチよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:33:02 GMT)
Efficient Model Editing with Task-Localized Sparse Fine-tuning [14.8] そこで本稿では,明示的な線形化を必要とせず,最小限の干渉でスパースタスクベクトルを構築できるTaLoSを提案する。
事前学習されたモデルには、タスク間の勾配感度が一貫して低いパラメータのサブセットが含まれていることがわかった。
実験により,TaLoSは,タスクの追加や否定において,現在の手法より優れている一方で,トレーニングと推論の効率が向上することが証明された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:20:06 GMT)
Scene Splatter: Momentum 3D Scene Generation from Single Image with Video Diffusion Model [14.8] Scene Splatterは、単一の画像から一般的なシーンを生成するビデオ拡散のための運動量に基づくパラダイムである。
我々は,映像の詳細を向上し,シーンの一貫性を維持するために,オリジナルの特徴からノイズの多いサンプルをモメンタとして構築する。
我々は,映像拡散モデルを用いて,高忠実度と一貫した新奇なビューを生成する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:00:44 GMT)
Towards Generalizing Temporal Action Segmentation to Unseen Views [14.8] 我々は、トレーニング中にモデルを評価するためのカメラビューが利用できない、見えないビューアクションセグメンテーションのためのプロトコルを定義する。
本稿では,この課題に対処する時間的行動セグメンテーションのアプローチを提案する。
シーケンス損失とアクション損失を導入し、異なるビューをまたいだ一貫したビデオとアクションの表現を容易にする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:53:59 GMT)
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization [14.7] 3D Gaussian Splatting (3DGS) は3次元再構成において顕著な効果を示し, 実時間放射場レンダリングによる高品質な結果を得た。
単一のシーンを再構築するためには通常、59個の浮動小数点パラメータで表現された数百万のガウススプラットが必要であり、結果として約1GBのメモリが生成される。
本稿では,属性コードブックを個別に構築し,離散コードインデックスのみを格納する圧縮手法を提案する。具体的には,ノイズ置換ベクトル量子化手法を用いて,コードブックとモデル特徴を協調的にトレーニングし,勾配降下最適化とパラメータ離散化の整合性を確保する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:19:34 GMT)
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation [14.5] 何千もの挑戦的なビデオを含む新しいデータセットであるViCaSを紹介します。
本ベンチマークでは,全体的/高レベルの理解と言語誘導,画素精度のセグメンテーションに関するモデルを評価する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:52:24 GMT)
Distillation Improves Visual Place Recognition for Low Quality Images [13.4] リアルタイムの視覚的ローカライゼーションはしばしばオンラインコンピューティングを利用しており、クエリ画像やビデオは視覚的位置認識(VPR)のためにリモートサーバに送信される。
限られたネットワーク帯域幅は、画像品質の低下と、大域的な画像記述子の劣化を必要とし、VPRの精度を低下させる。
本稿では,高品質な画像から特徴表現を学習し,低品質な画像からより識別性の高い記述子を抽出する知識蒸留手法を用いて,記述子抽出レベルでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:47:09 GMT)
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step [13.2] VideoSceneは、ビデオ拡散モデルを蒸留して、ワンステップで3Dシーンを生成する。
VideoSceneは従来のビデオ拡散モデルよりも高速で優れた3Dシーン生成結果が得られる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:07:13 GMT)
Learning Phase Distortion with Selective State Space Models for Video Turbulence Mitigation [13.1] 大気の乱流は、長距離イメージングシステムにおける画像劣化の主な原因である。
多くの深層学習に基づく乱流緩和法 (TM) が提案されているが, それらは遅い, メモリ不足であり, 一般化が不十分である。
本稿では,(1)選択状態空間モデル(MambaTM)に基づく乱流緩和ネットワークと(2)学習遅延位相歪み(LPD)の2つの概念に基づく新しいTM法を提案する。
提案手法は,様々な合成および実世界のTMベンチマークにおいて,推定速度が大幅に向上した現状のネットワークを超越した手法である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:33:18 GMT)
Utility Theory of Synthetic Data Generation [12.5] 本稿では,統計的学習フレームワークにおける実用理論の確立により,実践と理論のギャップを埋める。
合成データに基づいてトレーニングされたモデルの一般化とランキングの2つのユーティリティメトリクスを考慮に入れている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:24:10 GMT)
DEFOM-Stereo: Depth Foundation Model Based Stereo Matching [12.2] DEFOM-Stereoはモノクローナルディープキューとの堅牢なステレオマッチングを容易にするために構築されている。
SOTA法と比較してより強いゼロショットの一般化があることが確認された。
我々のモデルは、個々のベンチマークにおいて、以前のモデルより同時に優れています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 01:15:43 GMT)
Multi-Mission Tool Bench: Assessing the Robustness of LLM based Agents through Related and Dynamic Missions [12.2] 大規模言語モデル(LLM)は、高度な理解と計画能力のため、ツール呼び出しのエージェントとして強力な可能性を示している。
ベンチマークでは、各テストケースは複数の相互関連ミッションから構成される。
また,エージェント決定の精度と効率を動的決定木を用いて評価する手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:21:33 GMT)
Pixel-level and Semantic-level Adjustable Super-resolution: A Dual-LoRA Approach [12.1] 本稿では,2つの LoRA モジュールを事前訓練した安定拡散(SD)モデルで学習し,改良および調整可能な SR 結果を実現する PiSA-SR を提案する。
デフォルト設定では、PiSA-SRは単一の拡散ステップで実行でき、実際のSRをリードすることで、品質と効率の両方を達成できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:58:27 GMT)
X-Capture: An Open-Source Portable Device for Multi-Sensory Learning [11.6] 我々は,X-Captureを紹介した。X-Captureは,実世界のマルチセンサーデータ収集のための,オープンソースでポータブルで費用対効果の高いデバイスである。
1000ドル以下のビルドコストで、X-Captureはマルチセンサーデータセットの作成を民主化する。
X-Captureは、AIにおける人間のような感覚表現の進化の基礎を成している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:44:25 GMT)
ReuseDroid: A VLM-empowered Android UI Test Migrator Boosted by Active Feedback [11.6] 本稿では,大規模視覚言語モデル(VLM)によるGUIテストマイグレーションのための新しいマルチエージェントフレームワークであるREUSEDROIDを提案する。
REUSEDROIDの洞察は、同じアプリ間で共有されるコアロジックのみに基づいて、テストを移行することである。
テストマイグレーションデータセットであるLinPro上でREUSEDROIDを評価する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:45:09 GMT)
Challenges and Trends in Egocentric Vision: A Survey [11.6] エゴセントリックな視覚は、人間の体に装着されたカメラやセンサーを通して、視覚的およびマルチモーダルなデータをキャプチャする。
本稿では,自我中心の視覚理解に関する研究を包括的に調査する。
最新の進歩を要約することで、拡張現実、バーチャルリアリティ、エンボディドインテリジェンスといった分野において、エゴセントリックなビジョン技術の幅広い応用が期待できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:06:35 GMT)
Interference trapping of populations in a semi-infinite coupled-resonator waveguide [11.5] 1D結合共振器アレイ(CRA)に局所結合した2レベルエミッタ(2LE)のエネルギー構造とダイナミクスについて検討する。
単一励起部分空間のエネルギースペクトルは、散乱状態を持つ連続バンド、境界状態を持つ離散レベル、および境界状態の数の変化を特徴とする量子相転移を特徴とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:45:42 GMT)
Task as Context Prompting for Accurate Medical Symptom Coding Using Large Language Models [11.5] Task as Context (TACO) Promptingは、タスク固有のコンテキストをプロンプトに埋め込むことで、タスクの抽出とリンクを統一する新しいフレームワークである。
また,Vacine Adverse Event Reporting System (VAERS) レポートから得られた人間による注釈付きデータセットであるSYMPCODERについても紹介した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:57:17 GMT)
A Survey and Evaluation of Adversarial Attacks for Object Detection [11.5] 深層学習モデルは、信頼できるが誤った予測をすることを欺くような敵対的な例に対して脆弱である。
この脆弱性は、自動運転車、セキュリティ監視、安全クリティカルな検査システムなどの高リスクなアプリケーションに重大なリスクをもたらす。
本稿では,対象検出アーキテクチャに特有の敵攻撃を分類するための新しい分類枠組みを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:40:36 GMT)
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models [11.5] ステートスペースモデル(SSM)は、一貫したメモリ使用量と高性能のため、トランスフォーマーの魅力的な代替品として浮上している。
これを解決するために、ビット幅の少ないデータフォーマットでSSMを定量化することで、モデルのサイズを減らし、ハードウェアアクセラレーションの恩恵を受けることができる。
We present Quamba2, compatible with W8A8, W4A8, W4A16 for both Mamba1 and Mamba2 backbones。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:04:19 GMT)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.4] 大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。
LLMは現実世界の会話クエリの複雑さを無視することが多い。
LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:13:30 GMT)
You Think, You ACT: The New Task of Arbitrary Text to Motion Generation [11.3] 本稿では,制限されたアクションテキストを任意のテキストに拡張する。
明示的なアクションラベルのないシーンテキストは、複雑で多様な産業におけるモデルの実用性を高めることができる。
任意のテキストからアクション命令を抽出し,その後に動作を生成する,シンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:30:59 GMT)
Impact of helium ion irradiation on the thermal properties of superconducting nanowire single-photon detectors [11.3] NbN SNSPDの熱特性に及ぼすHeイオン照射の影響について検討した。
本研究は,SNSPDのポストプロセッシング技術として,イオン照射の意義について考察した。
この研究はまた、超伝導薄膜におけるSNSPD物理と欠陥工学の理解を深めている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:54:30 GMT)
A Bayesian account of pronoun and neopronoun acquisition [10.8] 代名詞選択における個人差を明示的にモデル化することについて議論する。
ネストした中華レストラン・フランチャイズ・プロセスに基づく確率的グラフィカル・モデリング手法を提案する。
このようなモデルが,代名詞や名前を記号的知識に迅速に組み込む方法の多様性を説明できることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:49:08 GMT)
FLEXtime: Filterbank learning to explain time series [10.7] 時系列からの予測を説明する最先端の手法では、各ステップごとにインスタンスワイズ・サリエンシ・マスクを学習する。
本稿では,信号分解に確立された信号処理手法に頼って,解釈可能な部分に対する時間系列説明可能性について,有意なマップとして考察する。
具体的には、バンドパスフィルタのバンクを用いて時系列を周波数帯域に分割するFLEXtimeと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:04:46 GMT)
Do LLMs Consider Security? An Empirical Study on Responses to Programming Questions [10.7] ChatGPTは、開発者にコンテキスト固有の情報をボランティアして、安全なコーディングプラクティスを促進する。
我々は,3つのLLM(Claude 3, GPT-4, Llama 3)が示すセキュリティ意識の程度を評価する。
私たちの調査によると、3つのモデルすべてが、脆弱性を正確に検知し、ユーザに警告するのに苦労しており、データセット全体の検出率は12.6%から40%に過ぎません。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:13:44 GMT)
Quantifiers and witnesses for the nonclassicality of measurements and of states [10.6] 量子論における任意の過程に適用可能な非古典性の統一的な概念を提案する。
我々は、状態、測定、およびそれらのセットに固有の非古典性を特徴づけ、定量化するための証明書と手段を提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:01:56 GMT)
Evaluating and Enhancing Segmentation Model Robustness with Metamorphic Testing [10.6] SegRMTは、遺伝的アルゴリズムを利用して空間変換とスペクトル変換のシーケンスを最適化するテスト手法である。
実験の結果、SegRMTはDeepLabV3のmIoU(Intersection over Union)を6.4%に削減した。
敵の訓練に使用する場合、SegRMTはモデルのパフォーマンスを向上し、mIoUの改善を最大73%向上させる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:15:45 GMT)
FlowKV: A Disaggregated Inference Framework with Low-Latency KV Cache Transfer and Load-Aware Scheduling [10.3] Flow KVは非凝集型推論フレームワークである。
これにより、KVキャッシュの平均伝送遅延を0.944sから0.053sに96%削減できる。
これは、通常、計算の不均衡、極端な過負荷条件など、様々なシナリオでピークシステムのスループットを達成する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:58:05 GMT)
A Framework for Developing University Policies on Generative AI Governance: A Cross-national Comparative Study [10.0] 本研究は,米国,日本,中国の主要大学の比較分析を行った。
ジェネレーティブ・人工知能(GAI)の応用とガバナンスに関する制度全体にわたる政策について検討する。
理論的な洞察と実践的なガイダンスを提供するため, GAI のための大学政策開発フレームワーク (UPDF-GAI) を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:33:35 GMT)
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance [9.9] 本稿では,DreamActor-M1 を用いた拡散トランスフォーマ (DiT) ベースのフレームワークを提案する。
動作誘導のために、暗黙の表情、3次元頭部球体、および3次元体骨格を統合したハイブリッド制御信号は、表情と身体運動の堅牢な制御を実現する。
実験により,本手法は,肖像画,上半身,全体生成の表現的結果を提示し,最先端の成果よりも優れることが示された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:51:10 GMT)
Cooperative Inference for Real-Time 3D Human Pose Estimation in Multi-Device Edge Networks [9.4] 本研究では,モバイルエッジコンピューティングネットワークにおけるリアルタイムな3次元ポーズ推定のための新しい協調推論手法を提案する。
本稿では,提案手法の性能を,推定精度とエンドツーエンド遅延の観点から数値解析する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:58:29 GMT)
MonoGS++: Fast and Accurate Monocular RGB Gaussian SLAM [9.4] 高速かつ高精度なSLAM法であるMonoGS++を提案する。
当社のアプローチでは,ハードウェア依存を低減し,RGB入力のみを必要としており,オンラインビジュアルオドメトリー(VO)を利用して,疎点雲をリアルタイムに生成する。
提案手法は,従来のMonoGSに比べて,毎秒5.57倍のフレーム(fps)向上を実現した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:51:51 GMT)
Observation of Quantum Darwinism and the Origin of Classicality with Superconducting Circuits [9.1] 自然に量子世界から日々の古典的な観察を合理化するにはどうすればいいのか?
量子ダーウィン主義は古典主義の出現を説明する魅力的な枠組みを提供する。
我々は、古典性と量子相互情報の飽和をサポートする高度に構造化された分岐量子状態を観察した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:21:40 GMT)
Noise-Agnostic Quantum Error Mitigation with Data Augmented Neural Models [9.0] 我々は、ノイズを事前に知ることなく、ノイズのないデータをトレーニングすることなく、量子誤差軽減を実現するニューラルネットワークを構築した。
我々のアプローチは、量子回路や、多体・連続変数量子系の力学に適用される。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:30:14 GMT)
Cognitive Memory in Large Language Models [8.1] 本稿では,Large Language Models (LLMs) における記憶機構について検討し,文脈に富む応答の重要性,幻覚の減少,効率の向上などを強調した。
メモリは、インプットプロンプト、短期記憶処理の即時コンテキスト、外部データベースや構造を介して実装された長期記憶に対応して、インプットプロンプト、短期記憶、長期記憶に分類する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:58:19 GMT)
How I Warped Your Noise: a Temporally-Correlated Noise Prior for Diffusion Models [7.9] ノイズサンプル列における時間的相関を保存するための新しい手法を提案する。
$int$-noise(積分ノイズ)は、個々のノイズサンプルを連続的に統合されたノイズフィールドとして再解釈する。
$int$-noiseは、ビデオ復元、サロゲートレンダリング、条件付きビデオ生成など、さまざまなタスクに使用できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:49:56 GMT)
Decidabilities of local unitary equivalence for entanglement witnesses and states [7.8] 2つの状態が局所的ユニタリ(LU)演算で等価かどうかを検討する。
我々は、LU決定可能性の観点から、エルミート作用素の集合間の関係を導入する。
2つのプロジェクタに対して、部分的なSLU同値は全体の同値性を保証することができないことを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:05:53 GMT)
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets [7.7] 我々は、ビデオとアクションデータの両方を政策学習に活用できるフレームワークUnified World Models (UWM)を提案する。
各拡散時間ステップを単純に制御することで、UWMはポリシー、フォワードダイナミクス、逆ダイナミクス、ビデオジェネレータを柔軟に表現することができる。
以上の結果から,UWMは大規模で異種なデータセットをスケーラブルなロボット学習に活用する上で,有望なステップとなることが示唆された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:38:59 GMT)
MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs [7.6] MultiBLiMP 1.0は言語的最小ペアの多言語ベンチマークである。
101の言語と6つの言語現象をカバーし、125,000以上の最小のペアを含んでいる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:05:50 GMT)
Explanation Space: A New Perspective into Time Series Interpretability [7.5] 本稿では,時間領域で訓練されたモデルを他の説明空間で解釈できる簡易かつ効果的な手法を提案する。
トレーニングされたモデルやXAIメソッドを変更することなく,既存のプラットフォームに容易に統合できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:21:19 GMT)
SelfMedHPM: Self Pre-training With Hard Patches Mining Masked Autoencoders For Medical Image Segmentation [7.4] 我々は、CT多臓器分割タスク(selfMedHPM)のためのマスク付きオートエンコーダをハードパッチマイニングするMIM自己学習フレームワークを提案する。
目標データのトレーニングセットに基づいてViT自己調整を行い、まずパッチ損失を予測し、次のマスクの位置を決定する補助損失予測器を導入する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:28:21 GMT)
Fingerprinting Implementations of Cryptographic Primitives and Protocols that Use Post-Quantum Algorithms [7.4] 我々はキー交換とデジタル署名プリミティブを解析し,フィンガープリント後量子(PQ)アルゴリズムの実現可能性を評価する。
プロトコルレベルの分析では、PQキー交換の存在とタイプを検出することができる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:27:35 GMT)
CornerPoint3D: Look at the Nearest Corner Instead of the Center [7.3] 3Dオブジェクト検出は、LiDAR点雲から物体の中心、寸法、回転を予測することを目的としている。
LiDARはオブジェクトの近辺のみを捕捉し、センターベースの検出器はクロスドメインタスクのローカライズ精度が低い。
本研究では、CenterPoint上に構築され、ヒートマップを用いて各物体の最も近い角の学習と検出を監督する新しい3Dオブジェクト検出器CornerPoint3Dを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:33:43 GMT)
A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery [7.2] 白黒のアナログ写真は、現代の物体検出フレームワークにおいて大きな課題を呈している。
本研究では、デオルドフィケーションを用いた画像カラー化と、Real-ESRGANによる超高解像度化という、GAN(Generative Adrial Networks)に基づく2段階画像強調パイプラインを提案する。
その結果, カラー化と超高分解能の組み合わせにより検出性能が著しく向上し, YOLOv11nは平均平均精度(mAP)が85%を超えることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:53:48 GMT)
LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems [7.2] フェルミ問題(Fermi Problems、FP)は、人間のような論理と数値推論を必要とする数学的推論タスクである。
AIの進歩にもかかわらず、FPはいまだにあまり探索されていない。
本研究は,大規模言語モデル(LLM)のFP解決能力と限界を明らかにするための探索的研究である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:13:36 GMT)
Derivation of the Landau-Zener formula via functional equations [7.2] 関数方程式による基本的異なるアプローチを用いたランダウ・ツェナー遷移確率の導出について述べる。
我々の研究は、ランダウ・ツェナー転移確率の指数形式の起源に関する新たな知見を提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:40:25 GMT)
Perturbative Variational Quantum Eigensolver based on Reduced Density Matrix Method [7.1] 摂動変動型量子固有解法(PT-VQE)を提案する。
PT-VQEは標準的なVQEよりも優れ、化学的精度が向上する。
この方法は、大規模システムの正確な量子シミュレーションのために、資源効率が高く実践的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:20:20 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0] Out-of-Distribution (OOD) 検出は安全なデプロイメントに不可欠である。
ニューラル・コラプス現象に触発されて,我々は多目的かつ効率的なOOD検出法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:16:58 GMT)
Prevalidated ridge regression is a highly-efficient drop-in replacement for logistic regression for high-dimensional data [6.7] 分類誤差やログロスの点から,ロジスティック回帰と一致する有意なリッジ回帰モデルを提案する。
モデルの係数をスケールし、予測値のセットのログロスを最小限に抑える。
これは、隆起回帰モデルに適合する過程で既に計算された量を利用して、名目追加の計算コストでスケーリングパラメータを見つける。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:27:35 GMT)
Convolution-Based Converter : A Weak-Prior Approach For Modeling Stochastic Processes Based On Conditional Density Estimation [6.6] 畳み込み型変換器 (CBC) は, 目標の確率を推定する上で, 強い, 固定された事前を除去する手法を開発するために提案される。
CBCは、強い、または固定された前もって目標の条件付き確率を暗黙的に推定する。
我々の手法は、既存の基準線を複数の指標で上回る。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:41:46 GMT)
CAD: Confidence-Aware Adaptive Displacement for Semi-Supervised Medical Image Segmentation [6.6] 半教師付き医療画像セグメンテーションは、最小限の専門家アノテーションを活用することを目的としている。
本稿では,信頼度の高い最大の低信頼領域を高信頼パッチで選択的に識別し,置き換えるフレームワークである自信認識適応変位(CAD)を紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:08:03 GMT)
A Survey of Large Language Models in Mental Health Disorder Detection on Social Media [6.5] 本稿では,ソーシャルメディア上でのメンタルヘルス問題検出におけるLarge Language Models(LLMs)の可能性を検討することを目的とする。
本論文は、うつ病や不安などの最も一般的な精神疾患に焦点を当て、また精神障害や外因性障害も取り入れている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:43:14 GMT)
HATFormer: Historic Handwritten Arabic Text Recognition with Transformers [6.4] アラビア文字のデータセットは英語に比べて小さく、一般化可能なアラビアHTRモデルを訓練することは困難である。
本稿では,HATFormerを提案する。HATFormerはトランスフォーマーをベースとしたエンコーダデコーダアーキテクチャで,最先端のHTRモデルに基づいている。
我々の研究は、複雑な言語固有の課題を持つ低リソース言語に英語のHTRメソッドを適用する可能性を示している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:56:58 GMT)
Bitcoin: A Non-Continuous Time System [6.3] 私たちは、Bitcoinの時間的不連続に寄与する3つの中核的な側面に焦点を当てています。
これらの要素が組み合わさってBitcoinの時間構造を作り、従来の計算や物理学で見られる連続的な時間システムとは根本的に異なる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:18:19 GMT)
PromptMap: An Alternative Interaction Style for AI-Based Image Generation [6.2] PromptMapは、ユーザーが膨大な合成プロンプトを探索できるテキスト・ツー・イメージAIのための新しいインタラクションスタイルである。
PromptMapは、セマンティックな類似性によって視覚的にイメージをグループ化し、ユーザーは関連するサンプルを見つけることができる。
本研究は,ユーザに対して,良好な画像出力の実現を促すことによって,使い慣れないインタラクションスタイルを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:27:56 GMT)
SemCAFE: When Named Entities make the Difference Assessing Web Source Reliability through Entity-level Analytics [5.9] SemCAFEは、その評価にエンティティ関連性を組み込むことで、ニュースの信頼性を検出するように設計されたシステムである。
各ニュース記事のセマンティック指紋を作成することで、SemCAFEは、2022年のロシアによるウクライナ侵攻に関する46,020件と3,407件の信頼できない記事の信頼性を評価することができた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:14:43 GMT)
Representation and Regression Problems in Neural Networks: Relaxation, Generalization, and Numerics [5.9] 浅層ニューラルネットワーク(NN)の訓練に伴う3つの非次元最適化問題に対処する。
我々はこれらの問題と表現を凸化し、不在緩和ギャップを証明するために代表者勾配を適用した。
我々はこれらの境界に対する鍵パラメータの影響を分析し、最適な選択を提案する。
高次元データセットに対して,勾配降下と組み合わせて効率的な解を求めるスペーシフィケーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:29:53 GMT)
Explanations of Large Language Models Explain Language Representations in the Brain [5.8] 本稿では、言語処理と脳神経活動の関連性を高めるために、説明可能なAI(XAI)を用いた新しいアプローチを提案する。
帰属法を適用することで,先行する単語が予測に与える影響を定量化する。
より強い属性は、生物学的説明法を評価するために脳のアライメントを示唆している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:56:08 GMT)
ADO-LLM: Analog Design Bayesian Optimization with In-Context Learning of Large Language Models [5.6] 本稿では,大規模言語モデル(LLM)とベイジアン最適化を統合したアナログ設計最適化手法であるADO-LLMを提案する。
ADO-LLMは、LLMのドメイン知識を注入して実行可能な設計ポイントを迅速に生成し、高価値な設計領域を見つけるためのBOの非効率性を改善する能力を活用している。
提案手法を2種類のアナログ回路上で評価し,設計効率と性能の顕著な向上を実証した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:40:58 GMT)
Reinforcement Learning for Solving the Pricing Problem in Column Generation: Applications to Vehicle Routing [5.6] 我々は強化学習(RL)を用いて、価格問題(PP)において最も負のコストの低い列を見つける。
我々のモデルは、他のメカニズムの助けなしに価格問題を独立して解決するので、エンドツーエンドのメカニズムをデプロイします。
提案手法は,100件の顧客を抱えるインスタンスに対して,非常に短い実行時間で,300倍以上の速度で,線形緩和を合理的な目標ギャップまで解くことができることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:22:19 GMT)
Transformer-based Multivariate Time Series Anomaly Localization [5.6] 時空間異常スコア(英: Space-Time Anomaly Score、STAS)は、変圧器の潜在表現と時空間統計モデルとの接続にインスパイアされた新しい計量である。
統計的特徴異常スコア(SFAS)は、異常に関する統計的特徴を分析してSTASを補完し、それらの組み合わせは誤報を減らすのに役立つ。
実世界の実験と合成データセットは、検出タスクとローカライゼーションタスクの両方において、最先端の手法よりもモデルの方が優れていることを示している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:48:54 GMT)
Towards Green AI-Native Networks: Evaluation of Neural Circuit Policy for Estimating Energy Consumption of Base Stations [5.5] 無線ハードウェアとAIベースのネットワーク管理ソフトウェアの最適化は、無線アクセスネットワークにおいてかなりのエネルギー節約をもたらす。
基盤となる機械学習(ML)モデルを実行するには、さらなる計算とエネルギが必要になる。
本研究は, 基地局のエネルギー消費を推定するために, スパース構造化ニューラルサーキットポリシ(NCP)の新たな利用法を評価する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:22:39 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [5.2] 大規模言語モデル(LLM)は、コードに関連するタスクにおいて顕著な機能を示した。
LLMが多様なプログラムを理解し処理する能力を考えると、汎用的なサロゲートモデルを構築する上で有望な方向性を示す。
SURGEは、1160ドル(約1万1000円)の価格問題で、8ドル(約8万3000円)の鍵となる側面をカバーしたベンチマークです。
オープンソースおよびプロプライエタリ LLM の実証分析を通じて,スケーリング法則,データ効率,予測精度を検討した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:54:20 GMT)
Implicit Neural Differential Model for Spatiotemporal Dynamics [5.2] In-PiNDiffは、安定時間力学のための新しい暗黙の物理積分型ニューラル微分可能解法である。
深い平衡モデルにインスパイアされたIm-PiNDiffは、暗黙の固定点層を用いて状態を前進させ、堅牢な長期シミュレーションを可能にする。
Im-PiNDiffは優れた予測性能、数値安定性の向上、メモリとコストの大幅な削減を実現している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:07:18 GMT)
A Memory-Augmented LLM-Driven Method for Autonomous Merging of 3D Printing Work Orders [5.2] 3Dプリンティングオーダーの効率の良いマージは、製造ラインの処理効率を大幅に向上させることができる。
本稿では,大規模言語モデル(LLM)による作業順序の自律的統合について述べる。
自己記憶学習戦略を取り入れることにより、自律的なオーダーマージのためのインテリジェントエージェントを構築することにより、オーダ割り当ての精度と精度が向上する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:50:29 GMT)
Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video Understanding in Novel Domains [4.9] 本研究では,(1)ステップ認識と(2)ビデオ質問応答の2つのタスクを含むベンチマークであるSpacewalk-18を紹介する。
タンデムにおいて、この2つのタスクは、(1)新しいドメインに一般化すること、(2)長期の時間的文脈とマルチモーダル(視覚的・音声的)情報を活用すること、の2つのモデルの能力の定量化である。
我々は,モデル微調整を伴わずに大幅な性能向上をもたらすような要約手法により,有望な適応を見いだす。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:40:28 GMT)
Route Recommendations for Traffic Management Under Learned Partial Driver Compliance [4.7] 本稿では,運転者の部分的コンプライアンスを明示的に学習し,現実的な順守の下での交通流を最適化する経路推薦フレームワークを提案する。
提案手法は,ベースライン戦略に比べて旅行時間を著しく短縮する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:31:16 GMT)
Late Breaking Results: Breaking Symmetry- Unconventional Placement of Analog Circuits using Multi-Level Multi-Agent Reinforcement Learning [4.7] アナログレイアウトの非従来的設計空間を探索する目的駆動型マルチレベルマルチエージェントQ-ラーニングフレームワークを提案する。
提案手法は,最先端のレイアウト技術よりも優れたバラツキ性能を実現する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:44:34 GMT)
LLM Social Simulations Are a Promising Research Method [4.6] 大規模言語モデル(LLM)の社会シミュレーションは,5つの難題に対処することで実現可能であると論じる。
LLMの社会シミュレーションは、心理学、経済学、社会学、マーケティングのパイロット実験など、すでに探索的な研究に利用できると信じている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:01:26 GMT)
ESC: Erasing Space Concept for Knowledge Deletion [4.6] 我々は、両方の懸念を考慮し、適切な指標であるKR(Knowledge Retention score)を提供する高度なタスクであるKD(Knowledge Deletion)という新しい概念を紹介した。
本研究では,その機能に係わるアクティベーションを排除して,知識を忘れるための重要な部分空間を制限する,Easing Space Concept (ESC) という新しい学習自由消去手法を提案する。
各種データセットおよびモデルを用いた実験により,提案手法が高速かつ最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:53:09 GMT)
Wormhole Memory: A Rubik's Cube for Cross-Dialogue Retrieval [4.6] 本研究では,異なる対話間で任意に検索可能なルービックキューブとしてメモリを実現するワームホールメモリモジュール(WMM)を提案する。
実験結果から,WMMは対話間のメモリ取得能力と定量的指標の安定性を示した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:45:58 GMT)
Reducing Reasoning Costs: The Path of Optimization for Chain of Thought via Sparse Attention Mechanism [4.6] この研究は、いくつかの関連するトークンにのみ焦点をあてるスパースアテンションメカニズムを使うことを提案する。
この実験は、MIT OpenCourseWareの線形代数テスト問題の解法において、このモデルの推論時間、正当性スコア、思考長の連鎖とo1プレビューを比較して比較した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:11:23 GMT)
Unlocking LLM Repair Capabilities in Low-Resource Programming Languages Through Cross-Language Translation and Multi-Agent Refinement [4.5] 本稿では,新しい言語間プログラム修復手法 LANTERN を提案する。
提案手法は,LLMが弱い補修能力を示す言語から,より強力な性能を示す言語へ,欠陥コードを戦略的に翻訳する。
我々は,11言語にまたがる5,068のバグを含む総合的な多言語ベンチマークであるxCodeEvalについて評価を行った。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:56:58 GMT)
GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings [4.4] ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。
8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:58:18 GMT)
Distributed Temporal Graph Learning with Provenance for APT Detection in Supply Chains [4.4] 高度な永続脅威(APT)は、しばしばサプライチェーン脆弱性(SCV)をエントリポイントとして利用する。
現在の防衛戦略は、主に、オープンソースソフトウェア(OSS)におけるプレーンテキストソースコード分析を使用した整合性保証や検出のためのブロックチェーンに重点を置いている。
本稿では,マルチソースデータを統合し,包括的動的グラフ前駆体を構築し,時間グラフ学習を用いてリアルタイムにAPTの挙動を検出する手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:42:26 GMT)
Distilling Multi-view Diffusion Models into 3D Generators [4.3] 本稿では,多視点拡散モデル(MV-DM)をガウススプラッティングを用いた3次元ジェネレータに拡散させる定式化であるDD3Gを紹介する。
DD3GはMV-DMから広範囲の視覚的および空間的知識を圧縮し統合する。
本稿では,パターン抽出とプログレッシブデコーディングのフェーズからなるジェネレータPEPDを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 01:44:53 GMT)
Distributed Log-driven Anomaly Detection System based on Evolving Decision Making [4.2] CEDLogは、Apache AirflowとDaskを統合することで、スケーラブルな処理のために分散コンピューティングを実装するフレームワークである。
CEDLogでは、イベントログに存在する重要な特徴を用いて、多層パーセプトロン(MLP)とグラフ畳み込みネットワーク(GCN)の合成によって異常を検出する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:50:30 GMT)
Design of AI-Powered Tool for Self-Regulation Support in Programming Education [4.2] 大きな言語モデル(LLM)ツールは、高品質な補助を提供する可能性を示している。
しかし、これらのツールの多くは、機関的な学習管理システムとは独立して運用されている。
この分離は、学習材料を活用する能力と、適切なコンテキスト対応のフィードバックを生成するためのコンテキストを行使する能力を制限する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:47:33 GMT)
Beating full state tomography for unentangled spectrum estimation [4.2] スペクトル推定のための最もよく知られたアルゴリズムは、完全な状態トモグラフィーと同じくらい多くのコピーを必要とする。
これは、アンタングル計測の設定ではそうではないことを示す。
そこで本研究では,スペクトル推定のサンプル複雑性が全状態トモグラフィーでのみ改善できることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:29:12 GMT)
Reasoning Inconsistencies and How to Mitigate Them in Deep Learning [4.1] この論文は予測的不整合を検出し定量化する2つの技術に貢献している。
トレーニングデータのバイアスから不整合を緩和するため,本論文では,データ効率のよいサンプリング手法を提案する。
最後に、この論文は、複雑な推論タスクのためにモデルを最適化する2つのテクニックを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:40:55 GMT)
NSSI-Net: A Multi-Concept GAN for Non-Suicidal Self-Injury Detection Using High-Dimensional EEG in a Semi-Supervised Framework [4.0] 青年期における自傷は、身体的および精神的な健康にとって深刻な脅威である。
本研究では,NSSIに関連する脳波の特徴を効果的にモデル化する,高度な半教師付き敵ネットワークNSSI-Netを提案する。
モデルの有効性と信頼性が実証され、既存の機械学習やディープラーニングに比べてパフォーマンスが5.44%向上した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:50:48 GMT)
Agglomerating Large Vision Encoders via Distillation for VFSS Segmentation [3.9] 医用画像分割作業における低複雑性モデルの性能向上のための新しい枠組みを提案する。
集約されたモデルは12のセグメンテーションタスクにまたがる優れた一般化を示すが、特殊なモデルは各タスクに対して明示的な訓練を必要とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:38:09 GMT)
Advancing Semantic Caching for LLMs with Domain-Specific Embeddings and Synthetic Data [3.9] 本報告では, セマンティックキャッシングの精度向上を, 特別に調整された埋め込みモデルを用いて検討する。
そこで本研究では,ターゲットとした実世界と合成されたデータセットを微調整した,より小さなドメイン固有埋め込みモデルを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:27:02 GMT)
We Need Improved Data Curation and Attribution in AI for Scientific Discovery [3.8] 本研究では, 実実験データとは対照的に, 合成データの役割について検討する。
オープンアクセスプラットフォームで利用可能な実験データセットの約4分の3は、比較的低い採用率である。
本稿では,実際の実験データの透かしに焦点をあてることにより,合成データ検出の自動化に向けた継続的な取り組みを補うことを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:07:52 GMT)
Towards Reinforcement Learning for Exploration of Speculative Execution Vulnerabilities [3.8] 投機的実行脆弱性は、それらを悪用するためには、集中的な手作業とハードウェアの深い知識が必要です。
本稿では,強化学習を利用して,ポストシリコン(ブラックボックス)マイクロプロセッサの投機的実行リークを検出するフレームワークSpecRLを紹介する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:52:24 GMT)
Digital Forensics in the Age of Large Language Models [3.7] 大規模言語モデル(LLM)は、様々なデジタル法医学的タスクを自動化し、拡張する強力なツールとして登場した。
本稿は,LLMがデジタル法医学のアプローチに革命をもたらした経緯を,アクセス可能かつ体系的に概観することを目的とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:32:15 GMT)
Sliced Wasserstein Discrepancy in Disentangling Representation and Adaptation Networks for Unsupervised Domain Adaptation [3.7] DRANet-SWDは、教師なし領域適応のための画像の内容とスタイル表現をアンタングルする既存の作業の拡張である。
領域適応におけるスタイル変化を捉えるため,グラマーマトリックス損失に対するSWDの潜在的利点について検討した。
その結果、SWDは特徴分布の統計的比較をより堅牢にし、より優れたスタイル適応をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:43:47 GMT)
SparQSim: Simulating Scalable Quantum Algorithms via Sparse Quantum State Representations [3.7] We present SparQSim, a quantum simulator implement in C++ based by the Feynman-based method。
SparQSimはレジスタレベルで動作し、量子状態の非ゼロ成分のみを格納する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:28:02 GMT)
Probabilistic Pontryagin's Maximum Principle for Continuous-Time Model-Based Reinforcement Learning [3.6] 平均ハミルトニアンの最小化は平均コストを最適化するために必要な最適条件であることを示す。
我々のアプローチは、学習力学で不確実なシステムを制御するための原則的で実践的なフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:51:20 GMT)
Incorporating the ChEES Criterion into Sequential Monte Carlo Samplers [3.5] Hamiltonian Monte Carlo (HMC) は、非パラメトリックベイズ推論を行う強力な計算コストの方法である。
No-U-Turn Sampler (NUTS)は、これらのハイパーパラメータを選択するのに非常に効果的であるが、実行が遅く、GPUアーキテクチャには適していない。
NUTSの代替として、ChEES-HMC(ChEES-HMC)のエストリマトの変化は、GPU上でのNUTSよりも高速であるだけでなく、後方からのサンプリングをより効率的に行うことが示されている。
SMCサンプリングは、後方から重み付けされたサンプルを出力する別のサンプリング方法である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:25:19 GMT)
Augmenting Anonymized Data with AI: Exploring the Feasibility and Limitations of Large Language Models in Data Enrichment [3.5] 大規模言語モデル(LLM)は、テキスト生成と理解の両方において高度な機能を示している。
データアーカイブへのそれらの適用は、データ対象に関する機密情報の民営化を促進する可能性がある。
このデータは、保護されていないとしても、開示と身元確認の両方の観点からプライバシー上のリスクをもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:26:59 GMT)
Fourier Sliced-Wasserstein Embedding for Multisets and Measures [3.4] ユークリッド空間に$mathbbRd$を超える多重集合と測度を埋め込む新しい方法を提案する。
我々は、$mathbbRd$ 以上の分布をバイ・リプシッツな方法でユークリッド空間に埋め込むことは不可能であることを証明した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:51:40 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [3.3] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。
既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。
そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:16:35 GMT)
GeoRAG: A Question-Answering Approach from a Geographical Perspective [3.2] Geographic Question Answering (GeoQA) は、地理的領域における自然言語クエリに対処する。
従来のQAシステムは、限定的な理解、低い検索精度、弱い相互作用性、複雑なタスクの不十分な処理に悩まされている。
本研究は、ドメイン固有の微調整と迅速なエンジニアリングを統合した知識強化型QAフレームワークであるGeoRAGについて述べる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:36:26 GMT)
CHARMS: Cognitive Hierarchical Agent with Reasoning and Motion Styles [3.2] 本稿では、推論と動作スタイルを用いた認知階層型エージェント(CHARMS)を提案する。
このモデルは、他の車両の振る舞いを推論し、異なる意思決定スタイルで反応することができる。
本稿では,Poisson認知階層理論に基づいて,新たな駆動シナリオ生成手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:15:19 GMT)
Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research [3.2] 我々は、アクションマスキングによる人間の知識を含めることの利点と欠点を分析した。
我々は,アクションマスキングを使わずにトレーニングされたポリシーに対して,アクションマスキングが大幅に改善できることを見出した。
我々は、アクションマスクが過度に制限された場合、最適以下の結果をもたらす可能性を強調する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:00:04 GMT)
Monotonicity of the von Neumann Entropy under Quantum Convolution [3.1] 古典的な場合、i.d.random変数の正規化和全体のエントロピーの列が単調に増加することが示されている。
我々は量子エントロピーパワーの不等式の一般化を証明し、任意の状態の$n$フォールド対称畳み込みのフォン・ノイマンエントロピーを比較することができる。
このエントロピーパワーの不等式の量子古典バージョンを提案し、量子状態と古典的確率変数の間の畳み込み作用の下でのフォン・ノイマンエントロピーの挙動をよりよく理解するのに役立つ。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 01:45:45 GMT)
Learning Geometrically-Informed Lyapunov Functions with Deep Diffeomorphic RBF Networks [3.1] データから証明関数を学習するための微分型関数学習フレームワークを提案する。
RBFネットワークに基づく微分同相写像を構築するための新しい手法を提案する。
実世界のデータから微分同相リアプノフ関数を学習することで、我々のアプローチを実証する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:09:17 GMT)
SHapley Estimated Explanation (SHEP): A Fast Post-Hoc Attribution Method for Interpreting Intelligent Fault Diagnosis [3.1] ポストホック解釈性は、モデル構造を変更することなくネットワークの柔軟性とスケーラビリティを維持する能力によって人気を集めている。
近年、ドメイン変換とSHAPを組み合わせることで、説明をより情報的なドメインに拡張することで、解釈可能性が改善されている。
本稿では、SHAPの計算コストに対処するため、パッチワイド属性とSHEP(SHapley Estimated Explanation)を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:56:07 GMT)
Improving Object Detection by Modifying Synthetic Data with Explainable AI [3.1] 本稿では,合成画像の設計効率を向上させるための新しい概念的アプローチを提案する。
XAI技術は、これらの画像を生成するために使用される3Dメッシュモデルを修正する、ループ中の人間プロセスを導く。
合成データは、トレーニング中に見えない方向の車両の検出を4.6%改善できることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:02:11 GMT)
Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking [3.0] ペイントショップ問題では、異なる色に割り当てられた車両の無秩序な受信シーケンスを再シャッフルする必要がある。
フレキシブルな問題変種に対する色変化を最小限に抑えるための強化学習手法を提案する。
提案手法は,既存の手法と比較して,問題の大きさによって色の変化をかなり低減することを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:37:40 GMT)
AI red-teaming is a sociotechnical challenge: on values, labor, and harms [3.0] 赤いチーム」がAIモデルをテストするための主要なアプローチになった。
私たちは、レッドチームの背後にある価値と前提を理解することの重要性を強調します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:24:20 GMT)
A direct algebraic proof for the non-positivity of Liouvillian eigenvalues in Markovian quantum dynamics [3.0] マルコフ開量子系はリンドブラッドマスター方程式 $partial_trho =mathcalL(rho)$ で記述される。
有限次元ヒルベルト空間を持つ系に対しては、すべての固有値の実部が非正であることは、リウヴィリアンの基本的な性質である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:54:25 GMT)
FEASE: Shallow AutoEncoding Recommender with Cold Start Handling via Side Features [2.9] ユーザとアイテムのコールドは、レコメンデーションシステムの産業的応用において重要な課題となる。
ユーザ側とアイテム側の両方をシームレスに統合する拡張EASEモデル(FEASE)を導入する。
コールドスタート項目を効果的に推奨し, 余分なバイアスを伴わずにコールドスタートユーザを扱い, バランスをとる方法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:27:55 GMT)
Magnetic Field Detection Using a Two-Qubit System Under Noisy Heisenberg Interaction [2.8] ノイズの多い2量子ビット系を用いた磁界検出器の設計法を提案する。
磁場はデコヒーレンス過程に大きく影響しないが、時間とともに帰還確率に顕著な振動をもたらす。
これらの結果は、実用的な量子ベースの磁場検出器の実現の可能性を示している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:00:41 GMT)
Improving User Experience with FAICO: Towards a Framework for AI Communication in Human-AI Co-Creativity [2.3] 本稿では、共同創造型AIのためのAIコミュニケーション(FAICO)を設計するためのフレームワークの設計について紹介する。
FAICOは、AIコミュニケーションの重要な側面とそのユーザエクスペリエンスへの影響を示し、効果的なAIコミュニケーションの設計をガイドする。
当社のフレームワークを,デザイナのためのデザインカードとユーザのための設定ツールという,2つの実用的なツールに変換するための実行可能な方法を示します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:29:53 GMT)
Error Bounds on the Universal Lindblad Equation in the Thermodynamic Limit [2.3] これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。
これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:32:21 GMT)
AC-LoRA: Auto Component LoRA for Personalized Artistic Style Image Generation [2.3] AC-LoRAは、LoRA行列の信号成分とノイズ成分を自動的に分離し、高速で効率的なパーソナライズされた芸術的スタイルの画像生成を可能にする。
結果は、FID、CLIP、DINO、ImageRewardを用いて検証され、平均9%の改善が得られた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:56:01 GMT)
CoTAL: Human-in-the-Loop Prompt Engineering, Chain-of-Thought Reasoning, and Active Learning for Generalizable Formative Assessment Scoring [2.2] チェーン・オブ・ソート(CoT)のような手法は、教師が科学の形式的評価を格付けできるようにする。
これらの手法が複数の領域でキュリキュラにまたがる一般化の程度は、まだほとんど証明されていない。
書式評価評価のための LLM ベースのアプローチである Chain-of-Thought Prompting + Active Learning (CoTAL) を導入する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:53:34 GMT)
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models [2.2] REINFORCE++は、バッチの正規化報酬をベースラインとして使用しながら、批判モデルを削除する新しいアプローチである。
プロンプトセットのトランケーションを必要とせずに、様々な報酬モデルに対して堅牢なパフォーマンスを示す。
既存のREINFORCE法と比較して、RLHFとロングチェーン設定の両方において優れた一般化を実現している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:20:56 GMT)
Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish [2.1] 本研究では,ルクセンブルク語に対する評価ツール等の言語習熟度試験の実施可能性について検討した。
また,ChatGPTやClaude,DeepSeek-R1といった大規模モデルは高いスコアを得るのが一般的である。
また,このような言語試験における性能は,他のNLP課題における性能を予測するためにも有効であることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:39:22 GMT)
From Consumption to Collaboration: Measuring Interaction Patterns to Augment Human Cognition in Open-Ended Tasks [2.0] ジェネレーティブAIの台頭、特に大規模言語モデル(LLM)は、知識労働における認知過程を根本的に変えるものである。
本稿では、認知活動モード(探索対搾取)と認知エンゲージメントモード(建設対有害)の2つの側面に沿って相互作用パターンを分析する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:20:36 GMT)
Automated Video-EEG Analysis in Epilepsy Studies: Advances and Challenges [2.0] てんかんは通常、脳波(EEG)と長期ビデオEEG(vEEG)モニタリングによって診断される。
機械学習の最近の進歩は、脳波とビデオデータを用いたリアルタイムの発作検出と予測において有望であることを示している。
本稿では,ビデオ-EEG自動解析の最近の展開を概観し,マルチモーダルデータの統合について論じる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:13:16 GMT)
NeuroAI for AI Safety [2.0] 一般知能を持つ唯一のエージェントは人間である。
神経科学は、現在未調査で未使用の技術的AI安全性の重要な鍵を握るかもしれない。
我々は神経科学に触発されたAI安全性へのいくつかの道のりを強調し、批判的に評価する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:40:12 GMT)
Quantum Gibbs states are locally Markovian [2.0] 有界相互作用次数を持つ任意のハミルトニアンに対して、量子ギブス状態は任意の温度で局所マルコフであることが示される。
任意の低温での仮想時間進化作用素の正規化方式を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 01:54:42 GMT)
Layers at Similar Depths Generate Similar Activations Across LLM Architectures [1.9] 我々は24個のオープンウェイトLDMの異なる層での活性化によって誘導される近接関係について検討した。
1)モデル内のレイヤによって異なる傾向があり、2)モデルの対応するレイヤ間でほぼ共有されていることが分かりました。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:02:30 GMT)
Huge Ensembles Part II: Properties of a Huge Ensemble of Hindcasts Generated with Spherical Fourier Neural Operators [1.9] 第1部では,球面ニューラル演算子に基づくアンサンブルを作成した。
第2部では,2023年夏の1日7,424人からなる巨大なアンサンブル(HENS)を生成している。
HENSは予測分布の尾部を正確にサンプリングし、内部変数の詳細なサンプリングを行う。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:40:12 GMT)
Direction switchable single-photon emitter using a Rydberg polariton [1.9] Rydberg 偏光子を用いた方向切替可能な単一光子エミッタを示す。
我々は、textitN出力チャネルとユニティルーティング効率を備えた単一光子の量子ルーティングを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:35:36 GMT)
On the Volatility of Shapley-Based Contribution Metrics in Federated Learning [1.8] フェデレートラーニング(Federated Learning, FL)は、協調型およびプライバシ保護型機械学習パラダイムである。
FLにおける重要な課題は、多様な参加者からの貢献を公平かつ正確に割り当てることにある。
不正確な割り当ては信頼を損なう可能性があり、不公平な補償につながるため、参加者は連合への参加または積極的に貢献するインセンティブを欠く可能性がある。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:13:46 GMT)
From Questions to Insights: Exploring XAI Challenges Reported on Stack Overflow Questions [1.8] 解釈可能性の欠如は、AIモデルの実用的使用を制限する主要な障壁である。
XAI技術(例えばSHAP、LIME)はこれらのモデルの性能を解釈するために使われてきた。
我々は,これらの課題,その重症度,XAI技術をより使いやすくするための特徴を明らかにするために,探索的研究を行った。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 23:33:46 GMT)
Test Amplification for REST APIs Using "Out-of-the-box" Large Language Models [1.8] 私たちはChatGPTとGitHubのCopilotを使ってREST APIテストスイートを増幅した経験を報告します。
私たちは、最も強力なテストスイートをもたらすプロンプトについて、一連のガイドラインと教訓を導き出します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:28:07 GMT)
Mixtera: A Data Plane for Foundation Model Training [1.8] 基礎モデルトレーニングのためのデータプレーンであるMixteraを構築、提示します。
Mixteraはトレーニングをボトルネックにせず、256GH200スーパーチップにスケールする。
また、視覚言語モデルにおける混合の役割についても検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:29:01 GMT)
Narrative Studio: Visual narrative exploration using LLMs and Monte Carlo Tree Search [1.8] 木のようなインタフェースを備えたブラウザ内物語探索環境を提案する。
各ブランチは、システムとユーザ定義のプロンプトによってガイドされた反復LDM推論によって拡張される。
また、生成したテキストをエンティティグラフにグラウンドすることで、ユーザによる物語コヒーレンスの向上を可能にします。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:31:07 GMT)
Toward Automated Qualitative Analysis: Leveraging Large Language Models for Tutoring Dialogue Evaluation [1.8] 本研究では,大きな言語モデル(LLM)を活用して,5つの指導戦略の有効性を評価するシステムを提案する。
教員-学生チャットルームの公開データセットを用いて、学習戦略を、希望的または望ましくないものとして採用するかのどちらかに分類する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:08:03 GMT)
MAD: A Magnitude And Direction Policy Parametrization for Stability Constrained Reinforcement Learning [1.7] 我々は、強化学習(RL)のための政策パラメータ化であるマグニチュード・アンド・ディレクション(MAD)ポリシーを導入する。
MADポリシは、クローズドループ安定性を損なうことなく、状態依存機能に対する明示的なフィードバックを導入する。
DDPG(Deep Deterministic Policy gradient)法で訓練されたMADポリシが,見当たらないシナリオに一般化されていることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:26:26 GMT)
SLACK: Attacking LiDAR-based SLAM with Adversarial Point Injections [1.7] LiDARベースのSLAMに対する学習に基づく攻撃を研究する主な研究は存在しない。
本研究は,LiDARの品質を劣化させることなく,数点の点注入でLiDARスキャンを攻撃するための,エンド・ツー・エンドの深部生成敵モデルであるSLACKを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 23:52:49 GMT)
Limits of trust in medical AI [1.6] AIシステムは信頼でき、信頼性があり、信頼できない。
患者は医療的意思決定のためにAIシステムに頼る必要があるため、臨床実践における関係性への信頼の欠如を生み出す可能性がある。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:03:18 GMT)
Scenario Discovery for Urban Planning: The Case of Green Urbanism and the Impact on Stress [1.3] 本研究は, 都市計画におけるシナリオディスカバリーを適用して, ストレス低減における都市植生介入の有効性を評価する。
植生をベースとしたソリューションがストレス応答の緩和に成功または失敗する主要な介入しきい値を特定する。
植生の増加は, ストレスレベルが低く, 高密度の都市環境, 群集, 個々人の心理的特性と相関していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:23:17 GMT)
Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life [1.3] 本稿では,RUL推定のための統計モデルと機械学習モデルを統合するハイブリッドサバイバル分析フレームワークを提案する。
提案手法は,時系列バッテリーデータを経路シグネチャを用いた時系列データに変換することにより,有効生存モデルを実現する。
我々は、CoxベースのサバイバルモデルやDeepHitやMTLRといった機械学習ベースの手法を含む5つのモデルを適用し、時間とともに障害のない確率を推定する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:38:07 GMT)
3D Gaussian Splatting against Moving Objects for High-Fidelity Street Scene Reconstruction [1.3] 本稿では,ダイナミックストリートシーン再構築のための新しい3次元ガウス点分布法を提案する。
提案手法では,高忠実度な静的シーンを保存しながらオブジェクトの移動を除去する。
実験により, 大規模動的環境における再現性の向上, レンダリング性能の向上, 適応性の向上が示された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:39:45 GMT)
Robustly identifying concepts introduced during chat fine-tuning using crosscoders [1.3] クロスコーダは、ベースモデルと微調整モデルの両方において遅延方向として表される解釈可能な概念の共用辞書を学習する、最近のモデル微分法である。
両モデルに実際に存在するとき,概念を微調整モデルに固有のものと誤帰できるクロスコーダL1のトレーニング損失に起因する2つの問題を同定する。
BatchTopKの損失でクロスコーダをトレーニングし、これらの問題を大幅に軽減し、より真にチャット特化され、高度に解釈可能な概念を見つけます。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:50:24 GMT)
Multi-Screaming-Channel Attacks: Frequency Diversity for Enhanced Attacks [1.3] サイドチャネル攻撃は、その漏洩を分析して、被害者システムから内部データを検索する。
本研究は, 漏れを伝達する周波数の多様性を利用して, 攻撃性能を向上させる方法について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:58:10 GMT)
Building functional and mechanistic models of cortical computation based on canonical cell type connectivity [1.2] 本稿では,皮質構造に関する現在の知識を考察し,計算モデルにおける2つの基本原理を抽出する。
第1の原則は、皮質細胞型が異なる計算的役割を果たすことである。
第2の原則は、皮質の接続性は、細胞タイプ間の接続性の標準的な青写真のみによって効率的に特徴づけられることである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:08:12 GMT)
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition [1.2] MG-Genは単一の画像からベクトル形式でデータを再構成する。
テキストの可読性と入力整合性を保ちながら動作図を生成することを実験的に確認する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:52:12 GMT)
Leveraging Static Relationships for Intra-Type and Inter-Type Message Passing in Video Question Answering [1.2] 本稿では,静的な関係に基づく型内および型間メッセージパッシングの推論手法を提案する。
ANetQAデータセットとNext-QAデータセットの実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:14:41 GMT)
Systematic Evaluation of Large Vision-Language Models for Surgical Artificial Intelligence [1.2] 大規模ビジョンランゲージモデルは、AI駆動の画像理解のための新しいパラダイムを提供する。
この柔軟性は、専門家がアノテートしたデータが不足している医療全体において特に有望である。
本稿では,外科的AIにおける17の視覚的理解課題を対象に,11の最先端VLMの総合的分析を行う。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:42:56 GMT)
How Deep Do Large Language Models Internalize Scientific Literature and Citation Practices? [1.1] 論文の引用において,大規模言語モデル (LLM) がマシュー効果の強化に寄与していることが示唆された。
我々はGPT-4oが生成した274,951個の参照を1万件の論文に対して分析した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:04:56 GMT)
Language Models Guidance with Multi-Aspect-Cueing: A Case Study for Competitor Analysis [1.1] 競合分析では、複数の側面を評価し、情報的な決定を行うためのトレードオフのバランスを取る。
最近のLarge Language Models (LLMs) は、そのようなトレードオフを推理するが、固有の制限に対処する印象的な能力を示している。
競争市場に対する理解を深めるために, LLM にビジネス的側面を組み込むことが, モデル性能を継続的に向上させることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:18:11 GMT)
Exploring energy consumption of AI frameworks on a 64-core RV64 Server CPU [1.1] 今日の急速な技術進歩の時代には、人工知能(AI)の応用には大規模で高性能でデータ集約的な計算が必要であり、かなりのエネルギー需要をもたらしている。
ハードウェアメーカーは、RISC-Vアーキテクチャが著名なプレイヤーとして登場し、新しい、効率的で専門的なソリューションを開発している。
ソフトウェア開発者は新しいアルゴリズムとフレームワークを作成しているが、そのエネルギー効率はしばしば不明である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:27:10 GMT)
Koney: A Cyber Deception Orchestration Framework for Kubernetes [1.1] 我々は、偽装技術について「コードとして」記述するために、偽装ポリシー文書を記述する。
サービスメッシュやeBPFといったクラウドネイティブテクノロジを活用して、コンテナ化されたソフトウェアアプリケーションに自動的にトラップを追加しています。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:37:14 GMT)
CARE: Confidence-Aware Regression Estimation of building density fine-tuning EO Foundation Models [1.0] 本研究は、回帰出力とともに信頼度を計算・割り当てするEO衛星データを用いたファンデーションモデルの開発である。
このモデルCAREは、EOデータに対するファンデーションモデルの下流タスクとして回帰結果に対する信頼度を算出し、低信頼領域に対する信頼度を考慮した自己補正学習手法を実行する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:04:54 GMT)
The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context [0.9] アライメントチューニングにより、大きな言語モデルは、推論、命令追従、有害な世代を最小化できる。
広く展開されているにもかかわらず、これらのモデルはモノリンガルバイアスを示し、言語間のアライメントの有効性に関する懸念を提起する。
現在のアライメント手法は主に英語に重点を置いており、アライメント機構が多言語設定にどのように一般化するかははっきりしない。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:46:46 GMT)
Research Paper Recommender System by Considering Users' Information Seeking Behaviors [0.9] 論文レコメンデーションにおける主要なアプローチの1つは、コンテンツベースのフィルタリングである。
本稿では,この情報を考慮に入れたコンテンツに基づくフィルタリングレコメンデーション手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:11:58 GMT)
Anomaly Detection in Time Series Data Using Reinforcement Learning, Variational Autoencoder, and Active Learning [0.8] このアプローチは、データセンタやセンサネットワーク、ファイナンスといった領域において重要なものだ。
本手法は, 深層強化学習(DRL)と変分オートエンコーダ(VAE)とアクティブラーニングを組み合わせることで, これらの制約を克服する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:41:52 GMT)
Level Up Peer Review in Education: Investigating genAI-driven Gamification system and its influence on Peer Feedback Effectiveness [0.8] 本稿では、Generative AI(GenAI)アシストと統合されたゲーミフィケーションピアアセスメントプラットフォームであるSocratiqueを紹介する。
Socratiqueはゲーム要素を取り入れることで、学生により多くのフィードバックを提供する動機付けを目指している。
治療群では, 明瞭度, 関連性, 特異性について, より自発的なフィードバックが得られた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:30:25 GMT)
Am I Being Treated Fairly? A Conceptual Framework for Individuals to Ascertain Fairness [0.8] 我々は、自動意思決定(ADM)システムの特性として、公正性の改善を論じる。
本稿では,ADMシステムのエンドユーザーを支援する様々なツールを組み合わせることにより,公正性を確認するための概念的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:28:19 GMT)
Navigating in High-Dimensional Search Space: A Hierarchical Bayesian Optimization Approach [0.8] HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。
一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:37:26 GMT)
EvoChain: A Framework for Tracking and Visualizing Smart Contract Evolution [0.7] EvoChainはスマートコントラクトの進化を追跡し視覚化するためのフレームワークである。
データ層、API層、ユーザインターフェース層で構成される。
我々のデータセットは、約13万のアップグレード可能なプロキシと、約15,000の歴史的バージョンを含んでいる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:41:48 GMT)
Hierarchical Policy-Gradient Reinforcement Learning for Multi-Agent Shepherding Control of Non-Cohesive Targets [0.7] 非凝集性ターゲットのマルチエージェントシェパーディングのための分散強化学習ソリューションを提案する。
提案アーキテクチャは,ターゲット選択とターゲット運転とを,近似ポリシ最適化を通じて統合する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:56:57 GMT)
Imaginary eigenvalues of Hermitian Hamiltonian with an inverted potential well and transition to the real spectrum at exceptional point by a non-Hermitian interaction [0.6] エルミート・ハミルトニアン(英語版)は、ヘルミート性は実スペクトルの十分条件であるという一般的な信念とは対照的に、虚固有値を持つことができる。
非エルミート相互作用を持つ量子ハミルトニアンの古典的対応は、正準変数の複素函数である。
これは変数の正準変換によって、ハミルトニアンの1対1の量子古典対応を示す実函数となる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:16:12 GMT)
Optimization of partially isolated quantum harmonic oscillator memory systems by mean square decoherence time criteria [0.6] ハイゼンベルクの画像量子記憶は、デコヒーレンス水平線上で初期状態を維持する能力を利用する。
系変数の重み付き平均二乗偏差に対する忠実度しきい値で以前に定義された量子メモリヒーレンス時間を用いて、このアプローチを部分的に分離されたサブシステムに適用する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:10:07 GMT)
The Myth of Immutability: A Multivocal Review on Smart Contract Upgradeability [0.6] セキュリティと信頼性の促進のようなブロックチェーンプラットフォーム上のスマートコントラクトの不変性は、更新やバグ修正、デプロイ後の新機能の追加といった課題を提起する。
学術研究や産業において様々なアップグレードメカニズムが提案されているにもかかわらず、それらのトレードオフと実践的意味に関する包括的な分析は欠如している。
本研究の目的は,既存のスマートコントラクトアップグレードメカニズムを体系的に識別し,分類し,評価することである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:02:46 GMT)
CanonNet: Canonical Ordering and Curvature Learning for Point Cloud Analysis [0.6] CanonNetは、2つの補完的なコンポーネントで構成される軽量ニューラルネットワークである。
CanonNetは、標準点の順序付けと配向を生成する前処理パイプラインである。
また,ネットワークが正確な曲率値を持つ合成曲面から学習する幾何学的学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:58:57 GMT)
Adaptive Student's t-distribution with method of moments moving estimator for nonstationary time series [0.5] 我々は最近提案された移動推定器の哲学に焦点を当てる。
例えば、安価な指数移動平均を用いてパラメータを推定することができる。
また、$rho(x)sim |x|-nu-1$尾形、極端な事象の確率を記述する$nu$の進化も提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:32:33 GMT)
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration [0.5] IMPACT (Image Metric with Pretrained Model-Agnostic Comparison for Transmodality registration) は、マルチモーダル画像登録のための新しい類似度尺度である。
大規模事前訓練セグメンテーションモデルから抽出した深い特徴の比較に基づいて意味的類似度尺度を定義する。
胸椎CT/CBCTおよび骨盤MR/CTデータセットを含む5つの難易度3次元登録課題について検討した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:03:23 GMT)
Ontologies in Design: How Imagining a Tree Reveals Possibilites and Assumptions in Large Language Models [0.5] 価値に基づく分析は重要であるが、これらのシステムを分析する上ではあまり認識されていない。
多元主義との実践に基づく関わりの必要性を示唆し、設計の方向性を検討するための4つの方向性を提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:04:36 GMT)
Steiner Traveling Salesman Problem with Quantum Annealing [0.4] シュタイナー旅行セールスマン問題(Steiner Traveling Salesman Problem、STSP)は、古典的な旅行セールスマン問題の変種である。
STSPのNPハード性を考えると、この問題に対処するための量子的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:29:57 GMT)
Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole [0.3] ギニアビサウクレオール(キリオール)の機械翻訳のための新しいデータセットについて紹介する。
このデータセットは、主に宗教的なデータ(聖書とジェホバの証人からのテキスト)と、少数の一般ドメインデータ(辞書からの)で構成されている。
学習時に対象領域から300の文を追加することで、翻訳性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:14:19 GMT)
Engineering Artificial Intelligence: Framework, Challenges, and Future Direction [0.3] 本稿では,「ABCDE」をエンジニアリングAIの重要な要素として紹介する。
統一的で体系的なAIエコシステムフレームワークを提案する。
本稿では,包括的視点を提供することで,AIの戦略的実装を進めることを目的とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:30:10 GMT)
A Study on Adversarial Robustness of Discriminative Prototypical Learning [0.2] 本稿では,Adv-DPNP (Adversarial Deep Positive-Negative Prototypes) という新たな対人訓練フレームワークを提案する。
Adv-DPNPは、差別的なプロトタイプベースの学習と敵の訓練を統合している。
提案手法では, 正の試作アライメント, 負の試作反発, 整合正則化を組み合わせた複合損失関数を用いる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:42:58 GMT)
Flow State: Humans Enabling AI Systems to Program Themselves [0.2] 我々は,Human-AI共同設計を中心としたプラットフォームであるPocketflowを紹介した。
PocketflowはPythonフレームワークであり、意図的に最小限だが相乗的なコア抽象化セットの上に構築されている。
非常に小さなコードしか持たない堅牢でベンダに依存しない基盤を提供し、明らかにオーバーヘッドを減らします。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:25:46 GMT)
The Potential of Citizen Platforms for Requirements Engineering of Large Socio-Technical Software Systems [0.2] 参加型市民プラットフォーム(Participatory citizen platform)は、政策立案と熟考型民主主義に市民をデジタル的により深く関与させる革新的なソリューションである。
本稿では,要件工学と組み合わせたプラットフォームについて論じ,ソフトウェア工学の文脈におけるパイロット研究の道を開く。
この論文は、公共セクターにおける大規模社会技術ソフトウェアシステムの研究にも貢献する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:25:25 GMT)
Explainable AI-Driven Detection of Human Monkeypox Using Deep Learning and Vision Transformers: A Comprehensive Analysis [0.2] mpoxは動物園で流行するウイルス病で、公衆衛生に重大な影響を及ぼす。
症状が麻疹や鶏痘の症状とどのように一致しているかから,早期臨床診断は困難である。
深層学習(DL)技術と併用した医用画像は, 皮膚領域を解析することにより, 疾患検出の改善を約束している。
本研究は,皮膚病変画像データセットを用いて,深層学習と視覚トランスフォーマーに基づくモデルをスクラッチからトレーニングする可能性について検討した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 19:45:22 GMT)
Optical and magnetic response by design in GaAs quantum dots [0.1] 量子ネットワーク技術は、ネットワークノードのコアコンポーネントとして単一の光子にスピン量子ビットとそのインターフェースを使用する。
準ひずみのない局所液滴エッチングエピタキシー成長法により得られるGaAs量子ドット(QD)は、高いQD対称性を仮定することにより、スピンおよび光学特性を予測可能であることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:43:01 GMT)
Phases and phase transition in Grover's algorithm with systematic noise [0.0] 我々は、系統的なノイズの存在下で、標準量子アルゴリズム(Grover's algorithm for unordered search on $L$ qubits)を考える。
RMT解析は多体ダイナミクスの相転移と相転移の解析的予測を可能にする。
我々は、コールド原子、閉じ込められたイオン、超伝導プラットフォームを含む現実的な量子コンピュータにおける非システムノイズとの関連についてコメントする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:15:27 GMT)
State-of-the-Art Translation of Text-to-Gloss using mBART : A case study of Bangla [0.0] 聴覚障害と愚かな人口は170万人であるにもかかわらず、バングラ手話(BdSL)は未調査領域である。
ドイツとアメリカで使われている文法規則に基づくグロス生成からインスピレーションを得て,BdSLに適応する。
トレーニング済みmBART-50とmBERT-multiclass-uncasedモデルをデータセット上で微調整した。
私たちのmBART-50ファネチューンは、PHOENIX-14TベンチマークでState-of-the-Artのパフォーマンスを示しました。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:47:51 GMT)
Translation of Fetal Brain Ultrasound Images into Pseudo-MRI Images using Artificial Intelligence [0.0] 第3三期では、胎児の脳の複雑さは定量的データを抽出するために高い画像品質を必要とする。
対照的に、MRI(MRI)は優れた画像品質と組織分化を提供するが、利用できなく、高価であり、時間を要する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:59:33 GMT)
Towards Assessing Deep Learning Test Input Generators [0.0] 本稿では,TIG(State-of-the-art Test Input Generators)の総合評価について述べる。
この結果から,TIG間の堅牢性,テストケース生成のばらつき,計算効率などの重要なトレードオフが明らかになった。
本稿では,特定の目的やデータセットの特徴に適合した適切なTIGを選択するための実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 07:06:55 GMT)
Topological response in open quantum systems with weak symmetries [0.0] オープン量子系では、系の環境との相互作用は2種類の対称性をもたらす。
弱い対称性は、物質の異なる相を区別するトポロジカルな応答を保護できることを示す。
特に, 環境との結合は, 弱い対称性によって保護された状態への相転移を誘導できることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:00:10 GMT)
Topological Insights from State Manipulation in a Classical Elastic System [0.0] 外部ドライバと結合したグラニュラーを操作することにより, 2レベル弾性ビットにおけるベリー位相の制御された蓄積を示す。
重要な成果は、様々な系の状態に対するベリー位相の計算であり、システムのトポロジカルな性質に関する洞察を明らかにすることである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:31:43 GMT)
Thermodynamic Properties and Magnetocaloric Effect in a Rotating 2DEG under the Sagnac Effect [0.0] 我々は、有効質量(m*$)と重力質量(m_G$)の回転と区別がエネルギーレベルと熱力学特性に与える影響を分析する。
我々は、磁場下での電子系の熱力学を理解するためには、回転効果と有効質量特性が重要であると結論づける。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 23:03:02 GMT)
The effect of curvature on local observables in quantum field theory [0.0] 時空の局所化領域における曲率による実場の2乗場振幅の期待値に対する先行順序補正を計算する。
次に、粒子検出器モデルに適用し、局所場プローブにおける時空曲率の影響を定量化する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:00:02 GMT)
The Less Intelligent the Elements, the More Intelligent the Whole. Or, Possibly Not? [0.0] 線形外挿に基づく予測を行う能力を持つ捕食者と捕食者の両方を授けることで,新しい種類の動的平衡が現れることがわかった。
単純なエージェントは複雑な集団的行動の出現を好むが、個人が互いの行動の1次微分を取る能力は、任意の順序の微分の集合計算を可能にすることを示唆する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 16:33:24 GMT)
The Author Is Sovereign: A Manifesto for Ethical Copyright in the Age of AI [0.0] AIの時代、著者はアルゴリズムによるコンテンツスクラップ、"フェアユース"のような法的グレーゾーン、そして同意や補償なしに創造的な労働から利益を得るプラットフォームによって静かに浸食されている。
この短い宣言は、著者が知的ドメインの主権を持つシステムという、過激な代替案を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:12:42 GMT)
Systematic Literature Review: Explainable AI Definitions and Challenges in Education [0.0] 説明可能なAI(XAI)は、ブラックボックスのアルゴリズムプロセスを透明なものにしようと試みている。
本総説は,文学におけるXAIの諸定義について考察し,教育におけるXAIの課題について考察することを目的とする。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:43:35 GMT)
Suppression of decoherence dynamics by a dissipative bath at strong coupling [0.0] オープン量子系におけるデコヒーレンスの制御は、量子コヒーレント効果に依存する量子技術の出現によって大きな関心を集めている。
本研究では,非可換系の演算子を介して複数の浴槽に結合した系のデコヒーレンスダイナミクスについて検討する。
浴室間の協調効果を生かして, 迅速な脱コヒーレンスを緩和するための新しい戦略を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:41:29 GMT)
Steve: LLM Powered ChatBot for Career Progression [0.0] 我々は、候補者がAIによる面接を実行して、現在のキャリアステージを評価し、コースワークをキュレートして、次のレベルに進むことができるプラットフォームを開発する。
本手法は,事前定義されたキャリア・トラジェクトリ,関連スキル,そして,進歩に必要なスキルを得るための最善のリソースを推奨する手法を取り入れたものである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:24:22 GMT)
State Specific Measurement Protocols for the Variational Quantum Eigensolver [0.0] 本稿では,ハミルトニアン予想値の近似計算に依存する新しい測定プロトコルを提案する。
測定回路における測定およびゲート深さの30%から80%の低減を実現する。
これにより、スケーラブルで安価な測定プロトコルが提供され、物理的システムへの変分アプローチの適用が進展する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 20:32:43 GMT)
Simulation of Atomic Layer Deposition with a Quantum Computer [0.0] エミュレータ上での量子計算によるジルコニウムの原子層堆積(ALD)の研究について述べる。
ALDプロセス制御は、スピントロニクス、ナノチューブ、再生可能エネルギー貯蔵など、いくつかの技術応用において重要である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 22:01:00 GMT)
Responsible Development of Offensive AI [0.0] 本研究は、リスクに対する社会的利益のバランスをとるための優先順位を確立することを目的とする。
この研究で評価された攻撃的AIの2つの形態は、Capture-The-Flag問題を解決する脆弱性検出エージェントとAIを利用したマルウェアである。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:37:38 GMT)
Reservoir Computing: A New Paradigm for Neural Networks [0.0] 1940年代初頭、最初の人工ニューロンモデルは純粋に数学的概念として作られた。
リカレントニューラルネットワーク(RNN)は、従来のニューラルネットワークの困難を悪化させる。
これらの問題の解決策として、Reservoir Computingが登場します。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:34:51 GMT)
Quantum theory does not need complex numbers [0.0] 量子論には複素数が必要であるという決定的な議論が提示された。
実数のみに基づく量子論の定式化が可能であることを示す。
複素数は量子論における単なる便利さであると結論付ける。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:53:19 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0] 本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。
我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:32:13 GMT)
Quantum Generative Models for Image Generation: Insights from MNIST and MedMNIST [0.0] 本稿では,固有量子発生雑音と調整ノイズスケジューリング機構の2つの新しいノイズ戦略を紹介する。
我々は,MNISTデータセットとMedMNISTデータセットのモデル評価を行い,その実現可能性と性能について検討した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:40:26 GMT)
Quantum Deep Sets and Sequences [0.0] 本稿では、量子機械学習ツールボックスを拡張した量子深層集合モデルを提案する。
このモデルのためにいくつかの変種が提示される。
量子深集合とシーケンス(QDS)の有効性と汎用性を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:14:17 GMT)
Quantum Algorithm for Green's Functions Measurements in the Fermi-Hubbard Model [0.0] 本稿では,量子回路に適応したKubo式と,Hubbardモデルを用いた新しい量子アルゴリズムを提案する。
これは、フェルミオン作用素の双線型のみを使用してグリーンのクラスタ関数に直接アクセスすることができ、アダマールテストの使用を回避できる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:31:48 GMT)
On the Clustering of Conditional Mutual Information via Dissipative Dynamics [0.0] 条件付き相互情報(CMI)は、多体系における量子相関を特徴づける重要な量として注目されている。
CMIは有限温度ギブス状態において急速に崩壊すると考えられている。
これまでの研究は、クラスタ展開技術を用いた高温体制でこの問題に対処した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:06:55 GMT)
On shallow feedforward neural networks with inputs from a topological space [0.0] 位相空間(TFNN)からの入力を用いたフィードフォワードニューラルネットワークの研究
浅い TFNN に対する普遍近似定理を証明し、この位相空間上で定義された任意の連続函数を近似する能力を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 06:48:46 GMT)
Objective Reduction of the Wave Function Demonstrated on Superconducting Quantum Compute [0.0] 超伝導トランスモン量子ビットを用いた波動関数崩壊実験について述べる。
実験では、この測定結果を用いて、推定10e-12kgの質量を約1mm離れた2つの場所の1つに移動させた。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:32:19 GMT)
Numerical Framework for Multimode Jaynes- and Tavis-Cummings Models Incorporating the Modified Langevin Noise Formalism: Non-Markovian Analysis of Atom-Field Interactions in Dissipative Electromagnetic Environments [0.0] 本稿では,Langevinノイズフォーマリズムを多モードJaynes-およびTavis-Cummingsモデルに統合する新しい数値フレームワークを提案する。
提案手法は従来の量子マスター方程式では説明できない非マルコフ原子動力学を捉える。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:00:32 GMT)
Language Models reach higher Agreement than Humans in Historical Interpretation [0.0] 本稿では,人間による歴史的アノテーションと大規模言語モデルの比較を行う。
この結果はどちらも文化的な偏見を呈していることを示しているが、大きな言語モデルは短い文章からの歴史的事実の解釈についてより深いコンセンサスを達成している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:37:45 GMT)
LLMs as Deceptive Agents: How Role-Based Prompting Induces Semantic Ambiguity in Puzzle Tasks [0.0] この研究は人気のパズルゲーム"Connections"にインスパイアされている。
ゼロショットプロンプト、ロールインジェクトされた逆転プロンプト、ヒューマンクラフトの例を比較した。
明示的な対立エージェントの挙動が意味的曖昧さを著しく高めることを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 03:45:58 GMT)
LLM-Guided Evolution: An Autonomous Model Optimization for Object Detection [0.0] 機械学習では、ニューラルネットワークサーチ(NAS)はモデル設計のドメイン知識と、有望なパフォーマンスを達成するために大量の試行錯誤を必要とする。
Large Language Model (LLM)-Guided Evolution (GE)フレームワークは、CIFARデータ上の画像分類アルゴリズムのモデルソースコードを直接修正するためにLLMを組み込むことによって、このアプローチを変革した。
LLM-GEは平均平均精度を92.5%から94.5%に向上させるなど,大幅な性能向上を図った。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 05:06:06 GMT)
Isospectral oscillators as a resource for quantum information processing [0.0] 超対称性量子力学の枠組みで見られるように、高調波振動子に量子系をアイソスペクトルとして扱う。
我々はその非ガウス性を定量化し、その非古典性を評価する。
逆に、非ガウス的および非古典的定常状態が得られ、これらの特徴は非ゼロ温度で持続する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:00:01 GMT)
Hybrid Deep Learning Model to Estimate Cognitive Effort from fNIRS Signals in Educational Game Playing [0.0] 本研究では,ハイブリッド深層学習モデルを用いて,機能的近赤外分光法(fNIRS)データと性能スコアに基づく認知的努力を推定する。
相対的神経効率(RNE)と相対的神経関与(RNI)は、認知活動を表すために用いられる2つの指標である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:54:59 GMT)
How Artificial Intelligence Leads to Knowledge Why: An Inquiry Inspired by Aristotle's Posterior Analytics [0.0] この研究は、人工知能の中でアリストテレスの知識と知識の区別を明らかにするために、因果系の理論的枠組みを導入する。
外部介入の効果を予測することは、なぜかという知識だけで実現可能であり、そのようなタスクに必要な知識をより正確に理解することができると論じている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:37:05 GMT)
Hong-Ou-Mandel interference of more than 10 indistinguishable atoms [0.0] ホン・ウー・マンデル効果は多くの区別できない粒子にまで広がり、複雑な干渉パターンをもたらす。
ここでは、無視できない損失を持つ系において、最大12個の識別不可能な中性原子との干渉を実証する。
我々の手法は、非常に大きな数にスケールする可能性を提供し、区別不可能な粒子を持つ量子情報やハイゼンベルク制限原子干渉計における有望な応用を提示する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:30:05 GMT)
High-dimensional ridge regression with random features for non-identically distributed data with a variance profile [0.0] 高次元回帰フレームワークにおけるランダム特徴モデルの振る舞いは、機械学習の文献に注目される問題となっている。
非イド特徴ベクトルの設定におけるランダム特徴モデルの性能について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:20:08 GMT)
Harnessing Nonlinear Dynamics for Time-Driven Berry Phase in Classical Systems [0.0] 本研究では, 2つの球状顆粒からなる古典非線形系における時間駆動ベリー相の蓄積について検討した。
我々は,系の弾性特性をブロッホ状態にマッピングする摂動モデルを開発し,周波数依存ベリー位相の理論的予測を検証した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:07:12 GMT)
Graphs are everywhere -- Psst! In Music Recommendation too [0.0] グラフはジャンルベースのレコメンデーションを強化する上で重要な役割を果たす。
本研究では,グラフ畳み込み学習におけるグラフ畳み込みネットワーク(GCN),グラフSAGE,グラフトランスフォーマー(GT)モデルの有効性について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 14:00:52 GMT)
Graph Attention for Heterogeneous Graphs with Positional Encoding [0.0] グラフニューラルネットワーク(GNN)は、グラフデータモデリングのデファクトスタンダードとして登場した。
この研究は、異種グラフの最も効果的な方法を特定するために、様々なGNNアーキテクチャをベンチマークする。
その結果,これらの作業においてグラフ注意ネットワークが優れていることがわかった。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:00:02 GMT)
Distributional Semantics, Holism, and the Instability of Meaning [0.0] 大規模言語モデルは、いわゆる分散意味論的アプローチに基づいて構築される。
ホリズムに対する標準的な反対は不安定性の代償である。
言語モデルが示す不安定性は、単語間の関係の構造とスケールによって制約されていると論じる。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:48:22 GMT)
Digital implementations of deep feature extractors are intrinsically informative [0.0] 我々は、統一された枠組みにおけるエネルギー伝播速度の上限を証明した。
本研究では,1)離散領域入力信号を持つ特徴抽出器,2)畳み込みニューラルネットワーク(CNN)の散乱によるグローバル指数エネルギー減衰を示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:12:56 GMT)
Dephasing-Induced Distribution of Entanglement in Tripartite Quantum Systems [0.0] 貯水池メモリは、マルチパーティント絡みに影響を及ぼすデコヒーレンスダイナミクスを弱める手段を提供する。
量子系の非コヒーレンスに対する堅牢性は、絡み合いの分布に依存することを示す。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:03:12 GMT)
Deep learning for music generation. Four approaches and their comparative evaluation [0.0] メロディーの最初のセットは、言語モデルとして使用されるわずかに修正されたビジュアルトランスフォーマーニューラルネットワークによって生成される。
第2の旋律は、チャットソナライゼーションと古典的なトランスフォーマーニューラルネットワークを組み合わせることで生成される。
第3の旋律は、シリンジャーリズム理論と古典的なトランスフォーマーニューラルネットワークを組み合わせることで生成される。
第4の旋律はOpenAIが提供するGPT3変換器を用いて生成される。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:51:07 GMT)
Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation [0.0] 本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。
アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 21:09:59 GMT)
Critical Scaling of the Quantum Wasserstein Distance [0.0] 量子臨界系の2つの基底状態間の量子ワッサーシュタイン距離が臨界スケーリングを示すことを示す。
この結果は、物質の量子臨界相の基底状態の学習に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 15:47:56 GMT)
Convex optimization over a probability simplex [0.0] そこで我々は,確率的単純度よりも凸問題を最適化するために,新しい反復スキームCauchy-Simplexを提案する。
Cauchy-Simplex の各イテレーションは単純な操作で構成されており、高次元問題に適している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:58:05 GMT)
Comparative Analysis of Deepfake Detection Models: New Approaches and Perspectives [0.0] この研究は、GenConViTモデルに焦点を当て、ディープフェイクを識別するための異なるアプローチを調査し、比較する。
研究を文脈化するために、ディープフェイクの社会的および法的影響と、それらの創造と検出の技術的基礎に対処する。
その結果、GenConViTは微調整後、精度(93.82%)と一般化能力において優れた性能を示した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 02:10:27 GMT)
Cognitive Prompts Using Guilford's Structure of Intellect Model [0.0] 大規模言語モデル(LLM)は強力な言語生成能力を示すが、しばしば構造化推論に苦しむ。
本稿では,モデル応答の明瞭さ,コヒーレンス,適応性を向上させるために,SOIにインスパイアされた推論を強制する新しい認知促進手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 09:08:48 GMT)
Bias in Large Language Models Across Clinical Applications: A Systematic Review [0.0] 大規模言語モデル(LLM)は、医療に急速に統合され、様々な臨床業務を強化することを約束している。
本研究は, LLMの有病率, 出所, 徴候, 臨床的意義について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:32:08 GMT)
Beyond Conventional Transformers: The Medical X-ray Attention (MXA) Block for Improved Multi-Label Diagnosis Using Knowledge Distillation [0.0] 我々は,X線異常検出の課題に対処するための新しい注意機構である,医療用X線注意ブロック(MXA)を提案する。
提案手法は曲線(AUC)の0.85の領域を達成し,ベースラインモデル(AUC)の0.66に比べて0.19の絶対的な改善を実現した。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 04:55:42 GMT)
An optimal bound on long-range distillable entanglement [0.0] 蒸留可能なエンタングルメントの上限を$D$次元で証明する。
回転不変な状態に対しては、境界は1/rD$に強化される。
皮肉なことに、共形場論における空間状態は飽和から遠く離れており、蒸留可能な絡み合いはどのものよりも早く崩壊する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 18:00:00 GMT)
An Overview of Josephson Junctions Based QPUs [0.0] 超伝導ジョセフソン接合に基づく量子処理ユニットは、量子コンピューティングの大幅な進歩を約束する。
しかし、それらはデコヒーレンス、スケーラビリティの制限、エラー修正オーバーヘッドといった重要な課題に直面している。
本稿では,基本量子現象と実用工学的課題の両方を探求し,これらの課題を考察する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 11:26:52 GMT)
An Assessment of the CO2 Emission Reduction Potential of Residential Load Management in Developing and Developed Countries [0.0] 断続的な再生可能エネルギーが電力網を支配しており、2040年まで化石燃料を電力網から排出する主要な力であると予測されている。
間欠的な再生可能エネルギーに基づくグリッドは、太陽と風の供給と電力需要の季節的ミスマッチによって挑戦される。
我々は,開発途上国における住宅負荷管理からCO2削減を推定する文献を体系的にレビューした。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 17:55:12 GMT)
Advancing Air Quality Monitoring: TinyML-Based Real-Time Ozone Prediction with Cost-Effective Edge Devices [0.0] 本稿では, オゾン濃度をリアルタイムに予測する新しいTinyMLシステムを提案する。
このシステムはArduino Nano 33 BLE Senseマイクロコントローラを使用し、一酸化炭素(CO)検出のためのMQ7センサーと温度と圧力測定のための内蔵センサーを備えている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:48:24 GMT)
Adaptive path planning for efficient object search by UAVs in agricultural fields [0.0] 本稿では,UAVを用いた農業分野における対象探索のための適応経路プランナを提案する。
プランナーは、高高度の飛行経路を使用し、検出ネットワークが不確実である場合に、追加の低高度検査を計画する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:47:31 GMT)
Accelerating IoV Intrusion Detection: Benchmarking GPU-Accelerated vs CPU-Based ML Libraries [0.0] Internet of Vehicles(IoV)は、高度な侵入検知システムを必要とするサイバーセキュリティ攻撃に直面する可能性がある。
本稿では,従来のCPUベースの実装と比較して,GPUアクセラレーションライブラリ(cuML)の性能上の利点について検討する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 08:42:45 GMT)
A time-stepping deep gradient flow method for option pricing in (rough) diffusion models [0.0] 拡散モデルにおける欧州オプションの価格設定のための新しいディープラーニングアプローチを開発する。
提案手法は,大額の金銭に対するオプション価格の振舞いを尊重し,オプション価格の既知境界に固執する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:52:37 GMT)
A quantum random access memory (QRAM) using a polynomial encoding of binary strings [0.0] 量子ランダムアクセスメモリ(QRAM)は量子オラクルを実現するための有望なアーキテクチャである。
我々はQRAMの新しい設計を開発し、Clifford+T回路で実装する。
我々は、Tカウントを減らし、クォービット数を同じにしながら、T深度を指数的に改善する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:18:43 GMT)
A Systematic Review of Security Vulnerabilities in Smart Home Devices and Mitigation Techniques [0.0] この研究は、スマートホームエコシステムにおけるセキュリティの脅威を調査し、それらをネットワーク層、デバイスレベル、およびクラウドベースのAI駆動システムからの脆弱性に分類する。
研究結果は、量子後暗号化とAI駆動の異常検出が組み合わさって、セキュリティを高めるのに非常に効果的であることを示している。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 00:03:53 GMT)
A Physics-Informed Meta-Learning Framework for the Continuous Solution of Parametric PDEs on Arbitrary Geometries [0.0] 任意の測地上での偏微分方程式(PDE)の連続およびパラメトリック解に対する暗黙的有限演算子学習(iFOL)を導入する。
本稿では,連続パラメータと解空間のマッピングを確立するための物理インフォームドエンコーダデコーダネットワークを提案する。
我々はこれらの特徴を批判的に評価し、定常PDEと過渡PDEの両方で見つからないサンプルに一般化するネットワークの能力を解析する。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 10:24:00 GMT)
A Framework for the Assurance of AI-Enabled Systems [0.0] 本稿では,AIシステムのリスク管理と保証のためのクレームベースのフレームワークを提案する。
論文のコントリビューションは、AI保証のためのフレームワークプロセス、関連する定義のセット、AI保証における重要な考慮事項に関する議論である。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 13:44:01 GMT)
A Comparative Study of PDF Parsing Tools Across Diverse Document Categories [0.0] DocLayNetデータセットを使用して、6つのドキュメントカテゴリで10の人気のあるPDF解析ツールを比較した。
テキスト抽出では、PyMuPDFとpypdfiumは概して他のものよりも優れていたが、すべてのテキスト抽出は科学と特許の文書で苦労した。
テーブル検出では、TATRは金融、特許、法と規制、科学のカテゴリーで優れている。
論文参考訳(メタデータ) (Thu, 03 Apr 2025 12:09:36 GMT)