Fugu-MT: arxivの論文翻訳(概要)

Measurement of LLM's Philosophies of Human Nature [113.5]
大規模言語モデル(LLM)を対象とする標準化された心理尺度を設計する。現在のLSMは、人間に対する信頼の欠如を示す。本稿では,LLMが継続的に価値体系を最適化できるメンタルループ学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:22:19 GMT)
LEACE: Perfect linear concept erasure in closed form [97.8]
概念消去は、埋め込みから特定の機能を削除することを目的としている。 LEAst-squares Concept Erasure (LEACE) は、すべての線形分類器が可能な限り少ない埋め込みで概念を検出することを確実に防止する閉形式手法である。 LEACEを"concept scrubbing"と呼ばれる新しい手法で大規模言語モデルに適用し、ネットワーク内の各層からターゲット概念情報を消去する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:51:37 GMT)
Efficient Long Video Tokenization via Coordinate-based Patch Reconstruction [93.7]
CoordTokは、座標ベースの表現から入力ビデオの対応するパッチへのマッピングを学ぶビデオトークンである。 CoordTokは、ビデオを分解された三面体表現にエンコードし、ランダムにサンプリングされた$(x,y,t)$座標に対応するパッチを再構築する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:29:28 GMT)
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing [90.7]
RISEBenchはReasoning-Informed ViSual Editing (RISE)の最初のベンチマークである。 RISEBenchは、時間、因果、空間、論理的推論の4つの主要な推論タイプに焦点を当てている。本稿では,人間の判断とLMM-as-a-judgeアプローチの両方を用いて,指示推論,外観整合性,視覚的可視性を評価する評価フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:56 GMT)
Theoretical Insights in Model Inversion Robustness and Conditional Entropy Maximization for Collaborative Inference Systems [89.4]
協調推論により、クラウドサーバに機密データを公開することなく、エンドユーザは強力なディープラーニングモデルを活用することができる。近年の研究では、これらの中間機能は、情報が漏洩し、生データをモデル反転攻撃(MIA)によって再構築できるため、プライバシーを十分に保持できないことが判明している。この研究はまず、与えられた中間特徴の入力の条件エントロピーが、任意のMIAの下での再構成平均二乗誤差(MSE)の保証された下界を与えることを理論的に証明する。そして、ガウス混合推定に基づいて、この条件付きエントロピーを有界化するための微分可能かつ可解な尺度を導出し、逆ロバスト性を高める条件付きエントロピーアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:50:56 GMT)
Generative Classifier for Domain Generalization [84.9]
ドメインの一般化は、分散シフトに対するコンピュータビジョンモデルの一般化性を目的としている。生成駆動型ドメイン一般化(GCDG)を提案する。 GCDGは3つの重要なモジュールから構成される: 異種性学習(HLC)、純粋相関(SCB)、横成分バランス(DCB)。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:38:33 GMT)
Towards Unified Latent Space for 3D Molecular Latent Diffusion Modeling [80.6]
3次元分子生成は、薬物発見と物質科学に不可欠である。既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。本稿では,3次元分子を結合した潜在空間から潜在配列に圧縮する多モードVAEを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:03:49 GMT)
More is Less: The Pitfalls of Multi-Model Synthetic Preference Data in DPO Safety Alignment [80.0]
直接選好最適化(DPO)は、人間のフィードバックによる強化学習の、シンプルで効果的な代替手段として登場した。我々の研究は、DPOアライメントに関連する、目覚ましい、安全性に特有な現象を明らかにした。選択されたペアと拒否されたペアに対してのみ自己生成されたレスポンスを使用することで、より強力なモデルからのレスポンスを含む構成を大幅に上回る。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:36:40 GMT)
ChatGarment: Garment Estimation, Generation and Editing via Large Language Models [79.5]
ChatGarmentは、大規模な視覚言語モデル(VLM)を活用して、3D衣服の見積もり、生成、編集を自動化する新しいアプローチである。ウィジェット内の画像やスケッチから縫製パターンを推定し、テキスト記述から生成し、ユーザー指示に基づいて衣服を編集することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:47:55 GMT)
Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.0]
伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:43:45 GMT)
SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models [78.1]
シミュレーションは,実画像に翻訳する空間的適性を与えるのに驚くほど効果的であることを示す。シミュレーションにおける完全アノテーションは、擬似アノテーション実画像の既存のアプローチよりも効果的であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:24 GMT)
CodeUpdateArena: Benchmarking Knowledge Editing on API Updates [77.8]
コードドメインの知識編集のためのベンチマークであるCodeUpdateArenaを提示する。私たちのベンチマークのインスタンスは、プログラム合成例と組み合わせた合成API関数のアップデートで構成されています。ベンチマークでは、7つのPythonパッケージから54の関数へ、さまざまなタイプの更新をカバーしています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:15:55 GMT)
Understanding and Mitigating Language Confusion in LLMs [77.0]
我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。 Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:31:53 GMT)
Geometric Median Matching for Robust k-Subset Selection from Noisy Data [75.9]
最適分解点1/2のロバストな推定器であるGeometric Medianを利用する新しいk-subset選択法を提案する。提案手法は, k-subset を反復的に選択し,部分集合の平均が(潜在的に)ノイズデータセットの GM に近似し,任意の汚損の下でもロバスト性を確保する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:12:07 GMT)
How to Train Long-Context Language Models (Effectively) [75.5]
言語モデル(LM)の継続学習と教師付き微調整(SFT)を行い,長文情報の有効利用について検討した。コードリポジトリと書籍は長いデータの優れた情報源であることがわかったが、それらと高品質の短文データを組み合わせることが不可欠である。最終モデルであるProLong-8Bは、128Kの同様のサイズのモデル間で、最先端の長文性能を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:26:46 GMT)
Scaling Laws in Scientific Discovery with AI and Robot Scientists [72.3]
自律的なジェネラリスト科学者(AGS)の概念は、エージェントAIとエンボディロボットを組み合わせて、研究ライフサイクル全体を自動化している。 AGSは科学的発見に必要な時間と資源を大幅に削減することを目指している。これらの自律的なシステムが研究プロセスにますます統合されるにつれて、科学的な発見が新しいスケーリング法則に従うかもしれないという仮説を立てる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:55:11 GMT)
Tree-based Models for Vertical Federated Learning: A Survey [71.8]
ツリーベースのモデルは、その有効性、堅牢性、解釈可能性により、幅広い現実世界のアプリケーションで大きな成功を収めている。木質モデルの違いと進歩を実証的に観察するための一連の実験を行った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:16:09 GMT)
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation [71.3]
この研究は、記号的突然変異を通じて形式的な定理を構成するデータ合成のフレームワークであるAlchemyを提案する。マドリブにおける各候補定理について、書き直しや適用に使用できるすべてのイベーシブルな定理を同定する。その結果、マドリブの定理の数は110kから6Mへと桁違いに増加する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:08:09 GMT)
APHQ-ViT: Post-Training Quantization with Average Perturbation Hessian Based Reconstruction for Vision Transformers [71.2]
平均摂動ヘシアン (APH) を用いた重要度推定に基づく新しいPTQ手法である textbfAPHQ-ViT を提案する。本稿では,線形量子化器を用いたAPHQ-ViTが既存のPTQ法よりも3ビット,4ビットの差が大きいことを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:48:56 GMT)
Cultural Learning-Based Culture Adaptation of Language Models [70.1]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:16:26 GMT)
EvMic: Event-based Non-contact sound recovery from effective spatial-temporal modeling [70.0]
音波が物体にぶつかると、高周波で微妙な視覚変化をもたらす振動を誘発する。イベントカメラハードウェアの最近の進歩は、その視覚的聴覚回復への応用に有益であることを示している。イベントストリームからの時空間情報を完全に活用した,非接触音の回復のための新しいパイプラインを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:51:17 GMT)
Learning to (Learn at Test Time): RNNs with Expressive Hidden States [69.8]
本稿では,線形複雑性と表現的隠蔽状態を持つシーケンスモデリング層をインスタンス化するフレームワークを提案する。隠れた状態はテストシーケンスでもトレーニングによって更新されるので、私たちのレイヤはテスト時間トレーニング層と呼ばれます。 Transformerと同様に、TT-LinearとTT-MLPはより多くのトークンを条件付けすることでパープレキシティを減少させるが、Mambaは16kコンテキスト以降は不可能である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:30:11 GMT)
Efficient Autoregressive Shape Generation via Octree-Based Adaptive Tokenization [68.1]
既存の方法では、すべての形状を固定サイズのトークンにエンコードし、3Dデータにまたがるスケールと複雑さの固有のバリエーションを無視している。形状の複雑さに応じて潜在表現の次元を調節する新しいフレームワークであるOctoreeをベースとした適応トークン化を提案する。当社の手法では,同等の視覚的品質を維持しながら,固定サイズの手法に比べてトークン数を50%削減する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:57:52 GMT)
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement [68.1]
既存の統一モデルでは、理解、生成、編集という3つの基本的な機能を統一モデルで扱うのに苦労している。 ILLUME+は、きめ細かいテクスチャとテキスト整合したセマンティクスを保存できる統合されたデュアルビジュアルトークンーであるDualViTokを導入した。また、画像デトケナイザとして拡散モデルを用いて、生成品質と高効率超解像を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:43:14 GMT)
Re-thinking Temporal Search for Long-Form Video Understanding [67.1]
長文ビデオ理解のための時間探索パラダイムを再考する。本稿では,空間探索問題として高価な時間探索を行う軽量検索フレームワークT*を提案する。実験の結果,既存の手法と統合した場合,T*はSOTA長大映像理解性能を著しく向上させることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:03:10 GMT)
Parallelized Autoregressive Visual Generation [66.0]
本稿では,並列化された自己回帰視覚生成のための簡易かつ効果的な手法を提案する。本手法は,画像生成タスクと映像生成タスクの両方において,最大9.5倍の高速化を実現し,品質劣化を最小限に抑えた3.6倍の高速化を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:34:24 GMT)
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention [62.2]
グループベース微分差分キャプション法 Group-based Differential Memory Attention (GDMA)モジュール。新しい評価指標DisWordRate
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:19:51 GMT)
LogiCity: Advancing Neuro-Symbolic AI with Abstract Urban Simulation [60.9]
我々は,複数の動的エージェントを持つ都市型環境を対象とした,カスタマイズ可能な一階述語論理(FOL)に基づく最初のシミュレータであるLogiCityを紹介する。 LogiCityは、IsAmbulance(X)やIsClose(X, Y)のような意味的および空間的概念を用いた多様な都市要素をモデル化する LogiCityの重要な機能は、ユーザ設定可能な抽象化のサポートであり、論理的推論のためにカスタマイズ可能なシミュレーションの複雑さを可能にする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:00:11 GMT)
Rip Current Segmentation: A Novel Benchmark and YOLOv8 Baseline Results [60.7]
リップ電流は、世界中の多くのビーチで致命的な事故や怪我の原因となっている。新たに作成された多角形アノテーションを例として,2,466ドルの画像を含む包括的データセットを提案する。約2,400ドル(約2,800円)のドローンビデオからなる新しいデータセットを30FPS$で取得し,インスタンスセグメンテーション用のポリゴンとオブジェクト検出用のバウンディングボックスの両方でアノテートする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:14:16 GMT)
Adapting Large Language Models for Multi-Domain Retrieval-Augmented-Generation [59.6]
マルチドメインアプリケーションは、多様なベンチマークの欠如やドメイン外一般化の貧弱といった課題に直面している。我々は8つのソースから様々な質問応答タスクを抽出し、13のドメインをカバーした多種多様なベンチマークを導入する。以上の結果から,マルチドメインRAGロバスト性を改善するための重要な戦略が浮かび上がっている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:03:40 GMT)
Concept Lancet: Image Editing with Compositional Representation Transplant [58.9]
Concept Lancetは、画像編集における原則的表現操作のためのゼロショットプラグイン・アンド・プレイフレームワークである。本稿では,抽出された視覚概念の表現の疎線型結合として,潜時(テキスト埋め込み,拡散スコア)空間におけるソース入力を分解する。我々は、対応する編集方向を強制するために、カスタマイズされた概念移植プロセスを実行する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:58 GMT)
Exploring Dynamic Transformer for Efficient Object Tracking [58.1]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。 DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:58:45 GMT)
InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation [57.3]
In-context Learning (ICL) は、大規模言語モデル(LLM)において重要であるが、その有効性は有限コンテキストウィンドウによって制約される。本稿では,LLMにおけるコンテキストとパラメータを,短期記憶と長期記憶に並列化するフレームワークであるInfiniteICLを紹介する。提案手法は,コンテキスト長を90%削減し,フルコンテキストプロンプトの平均性能を103%向上することを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:53:06 GMT)
RipVIS: Rip Currents Video Instance Segmentation Benchmark for Beach Monitoring and Safety [57.2]
RipVISは、リップ電流セグメンテーション用に設計された大規模ビデオインスタンスセグメンテーションベンチマークである。我々のデータセットは、波の破れパターン、堆積物の流れ、水色の変化など、様々な視覚的文脈を包含している。結果は複数のメトリクスで報告され、特にリコールの優先順位付けと偽陰性の低減に$F$スコアに重点を置いている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:29:08 GMT)
Conformal Prediction Under Feedback Covariate Shift for Biomolecular Design [56.9]
本稿では,トレーニングデータとテストデータが統計的に依存した環境での予測不確実性を定量化する手法を提案する。モチベーション・ユースケースとして,本手法が設計したタンパク質の適合性予測の不確かさを定量化する方法を実データで示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:33:26 GMT)
HALO: Human-Aligned End-to-end Image Retargeting with Layered Transformations [55.8]
Imageは、画像のアスペクト比を変更しながら、その内容と構造を少ない視覚的アーティファクトで維持することを目的としている。 HALOは構造を水平層と非塩分層に分解し、異なる層に異なるラップフィールドを適用する。本手法は,平均ベースラインよりも18.4%高いユーザ嗜好を達成している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:53:19 GMT)
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments [55.5]
物理推論に基づく映像生成モデル評価のためのベンチマークであるMorpheusを紹介する。物理現象を捉えた80の現実世界のビデオが保存法によってガイドされている。我々の研究結果によると、プロンプトやビデオコンディショニングが進んだとしても、現在のモデルは物理原理をエンコードするのに苦労している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:21:17 GMT)
Retrieving Semantics from the Deep: an RAG Solution for Gesture Synthesis [55.5]
RAG-Gestureは、意味的に豊かなジェスチャーを生成するための拡散に基づくジェスチャー生成手法である。我々は、明示的なドメイン知識を用いて、共同音声ジェスチャーのデータベースから動きを検索する。提案手法では,各検索挿入が生成したシーケンスに対して与える影響量を調整可能なガイダンス制御パラダイムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:37:26 GMT)
Networking Systems for Video Anomaly Detection: A Tutorial and Survey [55.3]
ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。ディープラーニングとエッジコンピューティングの進歩により、VADは大きな進歩を遂げた。この記事では、NSVADの初心者向けの包括的なチュートリアルを紹介します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:41:14 GMT)
BOP Challenge 2024 on Model-Based and Model-Free 6D Object Pose Estimation [55.1]
一連のパブリックコンペティションの第6回は、6Dオブジェクトでアートの状態をキャプチャするために組織された。 2024年、我々は3Dオブジェクトモデルが利用できず、提供された参照ビデオからのみオブジェクトをオンボードする必要がある新しいモデルフリータスクを導入した。我々は、テスト画像で見える物体の同一性が入力として提供されない、より実用的な6Dオブジェクト検出タスクを定義した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:55:19 GMT)
HUMOS: Human Motion Model Conditioned on Body Shape [54.2]
身体形状に基づく生成運動モデルを構築するための新しいアプローチを提案する。非ペアデータを使ってこのモデルをトレーニングすることが可能であることを示す。得られたモデルは、多種多様で、物理的に妥当で、動的に安定した人間の動きを生成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:40:12 GMT)
QID: Efficient Query-Informed ViTs in Data-Scarce Regimes for OCR-free Visual Document Understanding [53.7]
トレーニング済みのVision-Language Modelを新しいデータセットで微調整することは、ビジョンエンコーダの最適化に不足することが多い。視覚エンコーダにクエリの埋め込みを統合する,新しい,合理化されたアーキテクチャ保存アプローチであるQIDを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:47:16 GMT)
Reasoning Under 1 Billion: Memory-Augmented Reinforcement Learning for Large Language Models [53.5]
強化学習(RL)を伴う大規模言語モデル(LLM)は、複雑な推論タスクにおいて有望な改善を示す。 RLは10億のパラメータを持つ小さなLLMでは、効果的に探索するために必要な事前訓練能力が欠如しているため、依然として困難である。この研究は、この課題に対処するためにエピソード記憶を活用する、新しい本質的なモチベーションアプローチを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:46:17 GMT)
The quasi-semantic competence of LLMs: a case study on the part-whole relation [53.4]
我々は,アンフィパル・ホール関係,すなわちアンフェロニミーの知識について検討する。 Emphquasi-semantic'のモデルは、単にemphquasi-semantic'の能力を持つだけで、深い推論特性の取得には至っていないことを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:41:26 GMT)
GTR: Graph-Table-RAG for Cross-Table Question Answering [53.1]
テーブルコーパスをヘテロジニアスグラフに再構成するグラフテーブル-テーブル-RAG フレームワーク GTR を提案する。 GTRは、高いデプロイメント効率を維持しながら、より優れたクロステーブル質問応答性能を示し、実際の実用性を示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:15:30 GMT)
Exploration-Driven Generative Interactive Environments [53.1]
我々は、低コストで自動収集されたインタラクションデータに多くの仮想環境を使用することに重点を置いている。仮想環境におけるランダムエージェントのみを用いたトレーニングフレームワークを提案する。我々のエージェントは環境固有の報酬に完全に依存しているため、新しい環境に容易に適応できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:01:41 GMT)
RobuNFR: Evaluating the Robustness of Large Language Models on Non-Functional Requirements Aware Code Generation [52.9]
NFR対応コード生成におけるLLMのロバスト性を評価するため,RobuNFRを提案する。実験の結果,コード生成におけるNFRを考慮した場合,RobuNFRは試験LLMの問題を明らかにすることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:55:35 GMT)
Diffusion at Absolute Zero: Langevin Sampling Using Successive Moreau Envelopes [conference paper] [52.7]
本稿では,$pi(x)proptoexp(-U(x))$という形のGibbs分布から,潜在的に$U(x)$でサンプリングする方法を提案する。拡散モデルに着想を得て、ターゲット密度の近似の列 $(pit_k)_k$ を考えることを提案し、そこで$pit_kapprox pi$ for $k$ small に対して $pit_k$ は、$k$のサンプリングに好適な性質を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:30:51 GMT)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.5]
予測モデルは、現実世界のタスクで不完全な情報を扱う必要があることが多い。現在の大規模言語モデル(LLM)は正確な推定には不十分である。本稿では,新しい確率的推論フレームワークBIRDを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:41:51 GMT)
The Foundations of Tokenization: Statistical and Computational Concerns [51.4]
トークン化は、NLPパイプラインにおける重要なステップである。 NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:07:13 GMT)
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models [50.6]
スパースオートエンコーダ (SAEs) は,大規模言語モデル (LLMs) の解釈可能性と操舵性を向上させることが示されている。本研究では,SAEをCLIPなどの視覚言語モデル(VLM)に適用し,視覚表現における単意味性を評価するための総合的な枠組みを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:58:35 GMT)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.1]
LlamaRestTestは、2つのLLM(Large Language Models)を使って現実的なテストインプットを生成する新しいアプローチである。私たちは、GPTを使った仕様強化ツールであるRESTGPTなど、最先端のREST APIテストツールに対して、これを評価しています。私たちの研究は、REST APIテストにおいて、小さな言語モデルは、大きな言語モデルと同様に、あるいは、より良く機能することができることを示しています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:42:32 GMT)
TinyML NLP Scheme for Semantic Wireless Sentiment Classification with Privacy Preservation [49.8]
本稿では,エネルギー効率の高いプライバシ保護型Tiny Machine Learning(TinyML)フレームワークとしてスプリットラーニング(SL)を紹介した。以上の結果から,SLは計算能力とCO2排出量を大幅に削減し,プライバシの向上を図っている。本研究は、エッジデバイスにプライバシ保護、エネルギー効率の高いNLPモデルをデプロイする際の洞察を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:49:10 GMT)
HQViT: Hybrid Quantum Vision Transformer for Image Classification [48.7]
本稿では,モデル性能を向上しつつ,モデルトレーニングを高速化するHybrid Quantum Vision Transformer(HQViT)を提案する。 HQViTは振幅エンコーディングによる全画像処理を導入し、位置エンコーディングを追加せずにグローバルな画像情報をよりよく保存する。様々なコンピュータビジョンデータセットの実験により、HQViTは既存のモデルよりも優れており、最大10.9%(MNIST 10-classification task)の改善を実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:13:34 GMT)
Ridge Leverage Score Sampling for $\ell_p$ Subspace Approximation [47.8]
NPハードネスに対処するための一般的なアプローチは、強力なコアセットを計算することである。我々は$ell_p$サブスペース近似を$tilde O(kepsilon-4/p)$ for $p2$と$tilde O(kp/2epsilon-p)$ for $p>2$に対して強コアセットを構築するアルゴリズムを得る。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:14:11 GMT)
AnesBench: Multi-Dimensional Evaluation of LLM Reasoning in Anesthesiology [47.5]
麻酔学における大規模言語モデル(LLM)の推論能力を体系的に評価した。 AnesBenchは3段階にわたる麻酔学関連推論を評価するために設計された言語間ベンチマークである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:54:23 GMT)
Enforcing View-Consistency in Class-Agnostic 3D Segmentation Fields [46.7]
Radiance Fieldsは、複数の画像から3Dシーンをモデリングするための強力なツールになっている。いくつかの手法は2Dセマンティックマスクを用いてうまく機能するが、クラスに依存しないセグメンテーションにはあまり一般化しない。より最近の手法では、コントラスト学習を用いて高次元の3次元特徴場を最適化することでこの問題を回避することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:23:37 GMT)
ConsDreamer: Advancing Multi-View Consistency for Zero-Shot Text-to-3D Generation [46.6]
本研究では, スコア蒸留プロセスにおける条件項と条件項の両方を精製することにより, ビューバイアスを緩和する新しいフレームワークであるConsDreamerを提案する。 ConsDreamerはテキストから3D生成におけるマルチフェイスのJanus問題を効果的に軽減し、視覚的品質と一貫性の両方において既存の手法より優れていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:43:23 GMT)
How Post-Training Reshapes LLMs: A Mechanistic View on Knowledge, Truthfulness, Refusal, and Confidence [46.5]
大規模言語モデル(LLM)の成功にはポストトレーニングが不可欠である学習後効果をよりよく理解するために,4つの視点からベースとポストトレーニング後のLLMを比較した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:30:55 GMT)
Leveraging LLM For Synchronizing Information Across Multilingual Tables [45.8]
本稿では,多言語情報同期のための大規模言語モデル (LLM) について検討し,ゼロショットプロンプトを拡張性のあるソリューションとして用いた。本稿では,古くなったウィキペディアのテーブルを更新する実世界のプロセスをシミュレートした,情報更新データセットを提案する。その結果, 単一プロンプトアプローチは, 協調性や正確性を高めるタスク分解戦略を導入し, 最適以下の結果をもたらすことが判明した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:15:18 GMT)
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations [45.6]
我々はScholarCopilotを紹介した。ScholarCopilotは学術書記のための既存の大規模言語モデルを強化するために設計された統合フレームワークである。 ScholarCopilotは、検索トークン[RET]を生成して学術的な参照をいつ取得するかを決定し、引用データベースに問い合わせる。私たちは1つのフレームワーク内で生成タスクと引用タスクの両方を共同で最適化し、効率を向上します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:07:29 GMT)
RePoseD: Efficient Relative Pose Estimation With Known Depth Information [45.4]
本稿では,2つのカメラの相対的なポーズを,関連する単眼深度に対応する点対応から推定する新しい枠組みを提案する。新しいソルバは、スピードと精度の点で最先端のディープ・アウェア・ソルバより優れている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:07:38 GMT)
Controlling measurement-induced phase transitions with tunable detector coupling [45.0]
2つの競合する測定によって駆動される量子多体系の進化を研究する。システムと検出器間の可変結合による正の演算子値測定を用いる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:21:00 GMT)
Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset [44.9]
白血病は世界で10番目に頻繁に診断されるがんであり、がん関連死亡の原因の1つとなっている。医学画像の深層学習の進歩にもかかわらず、白血病解析には多種多様なマルチタスクデータセットが欠けている。大規模WBCデータセットと,その属性を用いてWBCを検出する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:04:02 GMT)
Marine Saliency Segmenter: Object-Focused Conditional Diffusion with Region-Level Semantic Knowledge Distillation [44.5]
海洋衛生(MSS)は、様々な視覚に基づく海洋探査において重要な役割を担っている。拡散モデルに基づく新しい海洋塩分セグメンタDiffMSSを提案する。我々は、過度に信頼された誤認識を抑制するために、専用決定論的コンセンサスサンプリングを開発する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:31:36 GMT)
ConMo: Controllable Motion Disentanglement and Recomposition for Zero-Shot Motion Transfer [44.3]
ConMoは、被写体の動きとカメラの動きを歪め、再構成するフレームワークである。多様な対象に対してより正確なモーションコントロールを可能にし、マルチオブジェクトシナリオのパフォーマンスを向上させる。 ConMoは、被写体のサイズや位置の編集、被写体除去、セマンティックな修正、カメラモーションシミュレーションなど、幅広いアプリケーションをアンロックする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:15:52 GMT)
MegaMath: Pushing the Limits of Open Math Corpora [44.1]
MegaMathは、多種多様な数学に焦点を当てたソースからキュレートされたオープンデータセットである。 MegaMathは、既存のオープン数学事前トレーニングデータセットの中で、最大で最高品質の371Bトークンを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:52:07 GMT)
TSPE: Task-Specific Prompt Ensemble for Improved Zero-Shot Audio Classification [44.1]
TSPE(Task-Specific Prompt Ensemble)は、ALEのゼロショット性能を高める訓練不要なハードプロンプト手法である。ラベル情報を活用して、「ラウド」や「フェブル」のような適切な音響特性と、「トンネル」や「ストリート」のような適切な音源を識別する。音声テキストアライメントを向上させるため、TSPE生成タスク固有のプロンプト間でプロンプトアンサンブルを行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:09:23 GMT)
OSV: One Step is Enough for High-Quality Image to Video Generation [44.1]
一貫性蒸留とGANトレーニングを効果的に組み合わせた2段階トレーニングフレームワークを提案する。また,ビデオラテントを復号化する必要のない新しいビデオ識別器の設計を提案する。本モデルでは,高画質映像を1ステップで生成可能であり,多段精細化の柔軟性が期待できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:00:51 GMT)
Haphazard Inputs as Images in Online Learning [44.1]
本稿では,オンライン学習環境における様々な特徴空間を,その場で一定次元の画像表現に変換することを提案する。この単純で斬新なアプローチはモデルに依存しないため、どんな視覚ベースのモデルでもハファザード入力に適用できる。画像表現は、一貫性のない入力データをシームレスに処理し、提案手法をスケーラブルかつ堅牢にする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:14:05 GMT)
Bridging the Theoretical Gap in Randomized Smoothing [44.0]
本稿では,理論的証明されたロバスト性と経験的精度のギャップを埋める新しい枠組みを提案する。我々のアプローチは、認証されたロバスト性の境界を厳しくし、実際にモデルロバスト性をより正確に反映します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:05:49 GMT)
STING-BEE: Towards Vision-Language Model for Real-World X-ray Baggage Security Inspection [43.7]
STCrayは、21の脅威カテゴリにわたる46,642のイメージキャプチャペアスキャンからなる、最初のマルチモーダルX線バッグセキュリティデータセットである。 STCrayはドメインを意識したコヒーレントなキャプションを保証する特別なプロトコルで慎重に開発されています。これにより、さまざまな視覚言語タスクをサポートするSTING-BEEという、ドメイン対応のビジュアルAIアシスタントをトレーニングすることができます。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:12 GMT)
THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models [43.4]
大規模視覚言語モデル(LVLM)の幻覚は未解決の問題である。最近のベンチマークでは、オープンエンドな自由形式の応答の幻覚には対処していない。 LVLM出力におけるI型幻覚を定量的に評価する新しいフレームワークであるTHRONEを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:23 GMT)
VoiceCraft-Dub: Automated Video Dubbing with Neural Codec Language Models [43.2]
テキストと顔の手がかりから高品質な音声を合成する,ビデオダビングの自動化手法であるVoiceCraft-Dubを提案する。この課題は、映画製作、マルチメディア制作、音声障害者支援に広く応用されている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:24:47 GMT)
Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and Harmonization [43.0]
Comprehensive Relightingは、あらゆるシーンから任意の身体部分を持つ人間の画像やビデオから照明を制御し調和させる、最初のオールインワンのアプローチである。実験では、Comprehensive Relightingは強力な一般化性と時間的コヒーレンスを示し、既存の画像に基づく人間のリライトと調和の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:10:50 GMT)
OmniCam: Unified Multimodal Video Generation via Camera Control [42.9]
カメラの位置やポーズを変えることで多様な視覚効果を実現するカメラ制御は、広く注目を集めている。既存の手法は複雑な相互作用や限定的な制御能力といった課題に直面している。我々は、誘導時間的に一貫したビデオを生成する統合カメラフレームワークであるOmniCamを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:38:30 GMT)
VISTA: Unsupervised 2D Temporal Dependency Representations for Time Series Anomaly Detection [42.7]
時系列異常検出(TSAD)は、ラベルのない時系列データの中で稀で潜在的に有害な事象を明らかにするのに不可欠である。本稿では,これらの課題を克服するために,トレーニング不要で教師なしのTSADアルゴリズムであるVISTAを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:20:49 GMT)
Causal Self-supervised Pretrained Frontend with Predictive Code for Speech Separation [42.6]
音声分離(SS)は、複数話者の音声混在を単一話者の音声ストリームに切り離そうとする。過去と現在の情報のみに依存する因果分離モデルは、リアルタイムストリーミングに有望なソリューションを提供する。本稿では,将来の情報を因果モデルに暗黙的に組み込むことで,トレーニングと実行時の推論のミスマッチを軽減するための小説を紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:18:30 GMT)
When Can You Trust Your Explanations? A Robustness Analysis on Feature Importances [42.4]
説明の堅牢性は、システムと提供された説明の両方を信頼する上で、中心的な役割を果たす。本稿では,非対向摂動に対するニューラルネットワーク説明の頑健さを解析するための新しいアプローチを提案する。さらに,様々な説明を集約するアンサンブル手法を提案し,モデルの決定を理解し,頑健さを評価することによって,説明の融合がいかに有用かを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:59:16 GMT)
PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation [42.1]
本稿では,RGB画像からの新しいオブジェクト推定手法であるPicoPoseを紹介する。 PicoPoseはレンダリングされたオブジェクトテンプレートのオブジェクトにマッチし、ベストマッチしたテンプレートを特定し、粗い対応を確立する。これは、平面内回転、スケール、および2D翻訳を含む2次元アフィン変換を世界規模で回帰することで、対応を円滑にする。 PicoPoseはRAN/SACで計算されたオブジェクトポーズの精度を大幅に改善する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:16:41 GMT)
Direction-Aware Hybrid Representation Learning for 3D Hand Pose and Shape Estimation [42.0]
暗黙的な画像特徴と明示的な2次元共同座標特徴を融合する学習方向対応ハイブリッド特徴(DaHyF)を提案する。提案手法は,DAHyF表現による3次元手振りを直接予測し,コントラスト学習に基づく予測信頼度を用いて,モーションキャプチャ時のジッタリングを低減する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:52:59 GMT)
The role of spectator modes in the quantum-logic spectroscopy of single trapped molecular ions [41.9]
本研究では、状態依存型光双極子力に依存する測定プロトコルに直接かかわらないオブザーバモードの役割について検討する。二イオン弦の力に対する応答を変調するデバイ・ウォラー型効果を同定し、弦のすべての常温モードを冷却することで、N$+$分子イオンの偏移基底状態を検出することができることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:37:24 GMT)
Estimating Scene Flow in Robot Surroundings with Distributed Miniaturized Time-of-Flight Sensors [41.5]
本研究では,ロボット本体上に分散した時間飛行(ToF)センサから得られた低密度・雑音点雲からのシーンフロー推定手法を提案する。提案手法は,連続するフレームからクラスタリングし,高密度な動きの流れを推定するために反復閉点(ICP)を適用した。我々は、静止点と移動点を区別するために適合度に基づく分類と、幾何学的対応を洗練させるために不整合除去戦略を用いる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:57:51 GMT)
Multi-Modal Framing Analysis of News [41.4]
本稿では,大規模(ヴィジュアル言語)モデルを用いたマルチモーダル・マルチラベルフレーミング解析を大規模に実施する手法を提案する。従来の定性的な作業で発見された問題固有のフレーム分析を用いて、トピックの高度にパーティショナリなフレーミングを識別する。本稿では,ニュース中のテキストと画像の両方のスケーラブルな統合的フレーミング分析を行う方法を示し,メディアバイアスを理解するためのより完全な画像を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:31:11 GMT)
CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models [41.4]
Diffusion-Free Guidance (CFG) は拡散流モデルにおいて画像の忠実度と制御性を改善するために広く採用されている手法である。そこで, CFG-Zero* を改良した CFG-Zero* を提案する。 (a) 最適化スケール, (a) スカラーを解析的に最適化して推定速度の不正確さを補正し, (b) 名前の * を補正し, (b) ODE ソルバの最初の数ステップをゼロにする 0-init。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:03:32 GMT)
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization [41.2]
TokenHSIは、マルチスキル統一と柔軟な適応が可能なトランスフォーマーベースのポリシーである。主要な洞察は、ヒューマノイドの受容を別の共有トークンとしてモデル化することである。我々のポリシーアーキテクチャは可変長入力をサポートし、学習したスキルを新しいシナリオに柔軟に適応できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:28:08 GMT)
VARGPT-v1.1: Improve Visual Autoregressive Large Unified Model via Iterative Instruction Tuning and Reinforcement Learning [40.8]
VARGPT-v1.1は高度な統合視覚自己回帰モデルである。このモデルは、視覚的理解のための次世代予測と画像合成のための次世代生成という2つのパラダイムを保存している。マルチモーダル理解とテキスト・ツー・イメージ・インストラクション・フォロータスクにおける最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:06:28 GMT)
MatterChat: A Multi-Modal LLM for Material Science [40.3]
マルチモーダルな多モード言語モデルであるMatterChatを紹介する。そこで,MatterChatは材料特性予測と人間-AIインタラクションの性能を大幅に向上させることを示す。また、より高度な科学的推論やステップバイステップの物質合成などの応用においても有用性を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:39:34 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: Progress and Challenges [40.1]
この調査は、初期の単一モーダル法から洗練された多モーダルアプローチへのディープフェイク検出の進化を辿るものである。本稿では,検出手法の構造化された分類法を提案し,GANベースから拡散モデル駆動型ディープフェイクへの遷移を解析する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:47:44 GMT)
Generative Evaluation of Complex Reasoning in Large Language Models [39.2]
大規模言語モデル(LLM)における推論評価に特化して設計された生成的評価フレームワークであるKUMOを紹介する。自動パイプラインを通じて、KUMOは、超人記憶よりも真の一般化を示すために、オープンエンドドメインにまたがる新しいタスクを連続的に生成する。我々は、KUMOが作成した100のドメインにまたがる5000のタスクに対して、23の最先端LCMを評価し、大学生に対する推論能力をベンチマークした。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:54:18 GMT)
TAMT: Temporal-Aware Model Tuning for Cross-Domain Few-Shot Action Recognition [39.1]
クロスドメイン行動認識(CDFSAR)は近年研究の関心を集めている。本稿では,CDFSARのための簡易かつ効果的なベースラインであるTemporal-Aware Model Tuning (TAMT)を提案する。我々のTAMTは、ソースデータと微調整対象データで事前トレーニングを行うことで、複数のターゲットデータに対する単一のソースによる再トレーニングを回避することで、デカップリングパラダイムを含む。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:10:13 GMT)
Multifaceted Evaluation of Audio-Visual Capability for MLLMs: Effectiveness, Efficiency, Generalizability and Robustness [38.6]
マルチモーダル大言語モデル (MLLM) は近年,多様なモーダルからの情報処理と理解において大きな成功を収めている。人気が高まっているにもかかわらず、これらのモデルの音声視覚能力を評価する包括的な評価はいまだに残っていない。本稿では,MLLMの音響視覚能力の多面的評価を行い,有効性,効率性,一般化性,堅牢性という4つの重要な側面に着目した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:24:17 GMT)
PanGu-$π$ Pro:Rethinking Optimization and Architecture for Tiny Language Models [38.6]
モバイルデバイスにおける言語モデルの適用は、計算とメモリコストに大きな課題に直面している。本研究では,1Bパラメータを持つ小さな言語モデルに基づいて,各成分の効果を分析するための実験的な研究を慎重に設計する。いくつかの設計公式は、特に小さな言語モデルに有効であることが実証的に証明されている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:13:53 GMT)
Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation [38.3]
混合精度で1時間ビデオを処理する階層型ビデオ言語モデルViLaMPを開発した。 ViLaMPは、4つのビデオ理解ベンチマーク、特に長めのコンテンツで優れたパフォーマンスを誇っている。特にViLaMPは、単一のNVIDIA A100 GPU上で超長いビデオ(最大10Kフレーム)を処理できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:55:09 GMT)
Charm: The Missing Piece in ViT fine-tuning for Image Aesthetic Assessment [36.6]
視覚変換器(ViT)は通常、ダウンスケーリングやトリミングによって得られる小さな、固定サイズの画像に基づいて訓練される。本稿では,コンポジション,高解像度,アスペクト比,マルチスケール情報を同時に保存する新しいトークン化手法であるCharmを紹介する。 Charmは画像美的評価のためのViT性能と一般化性を改善する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:19:04 GMT)
ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization [36.6]
元Ante Reasoning Preference Optimization (ERPO)は、大規模言語モデルのための新しい安全アライメントフレームワークである。提案手法は,まず,教師付き微調整(SFT)による推定モデルと,直接選好最適化(DPO)による安全性,有用性,効率性の向上,および,長さ制御された反復選好最適化戦略による推論遅延の緩和の3段階からなる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:07:38 GMT)
MG-MotionLLM: A Unified Framework for Motion Comprehension and Generation across Multiple Granularities [36.4]
MG-MotionLLMは多粒運動の理解と生成のための統一運動言語モデルである。本稿では,新しい補助課題を取り入れた包括的多粒度学習手法を提案する。 MG-MotionLLMは,従来のテキスト・トゥ・モーションタスクやモーション・トゥ・テキストタスクにおいて優れた性能を発揮する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:53:41 GMT)
Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme [36.3]
本研究は、視覚モデル(VLM)における強化学習(RL)のための透明でゼロスクラッチなフレームワークを導入する。複数のモデルとデータセットにまたがって検証される、最小限の機能を備えた4ステップパイプラインを提供する。さらに、トレーニング力学と反射行動を評価するために、標準化された評価手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:53:28 GMT)
Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction [36.0]
スケルトン拡散(Skeleton Diffusion)は、人体に明らかな誘導バイアスを埋め込む潜伏拡散モデルである。我々のアプローチは、手足の歪みのような人工物を避けながら、常に現実的な予測を生成する。現実世界のデータセットに新しいベンチマークを設定する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:35:42 GMT)
Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.9]
歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:46:31 GMT)
Prompt Optimization with Logged Bandit Data [34.8]
クリックなどの自然なユーザフィードバックを用いて,プロンプトを用いてパーソナライズされた文を生成するために,大規模言語モデル(LLM)パイプラインを最適化する方法について検討する。本稿では, 生成文間の類似性を生かしてポリシー勾配を推定する, カーネルベースの非政治勾配法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:40:40 GMT)
What Makes for a Good Stereoscopic Image? [34.1]
SCOPEは,多種多様な知覚歪みと人工物を含む実画像と合成立体画像からなる新しいデータセットである。また、データセット上でトレーニングされた経験評価のステレオ品質のための新しいモデルiSQoEを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:26:17 GMT)
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation [34.1]
我々は,ヘッドビデオ生成のためのエンドツーエンドビデオ拡散フレームワークであるtextbfACTalkerを紹介する。マルチコントロールのために,複数の枝を持つ並列マンバ構造を設計し,それぞれが個別の駆動信号を用いて特定の顔領域を制御する。提案手法は,多様な信号によって駆動される自然な顔映像を生成し,マンバ層は相反なく複数の駆動モードをシームレスに統合することを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:44:41 GMT)
Adaptive Frequency Enhancement Network for Remote Sensing Image Semantic Segmentation [33.5]
本稿では、適応周波数と空間特徴の相互作用モジュール(AFSIM)と選択特徴の融合モジュール(SFM)の2つの重要なコンポーネントを統合した適応周波数拡張ネットワーク(AFENet)を提案する。 AFSIMは入力画像の内容に応じて、高周波数特徴と低周波特徴を動的に分離・変調する。 SFMは、ネットワークの表現能力を高めるために、グローバルコンテキストとローカル詳細機能を選択的に融合する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:42:49 GMT)
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation [33.1]
大規模言語モデル(LLM)の出現は機械翻訳(MT)の景観を大きく変えた。我々は、アンダーリソース設定への効果的な適応を可能にする、少数ショットプロンプト、クロスランガル転送、パラメータ効率の微調整などの手法を解析する。幻覚, 評価の不整合, 遺伝バイアスなどの持続的課題について検討するとともに, 翻訳品質向上のためのLCM駆動メトリクスの評価を行った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:30:35 GMT)
TROVE: A Challenge for Fine-Grained Text Provenance via Source Sentence Tracing and Relationship Classification [33.0]
医療、法律、ニュースなどの高度な領域では、コンテンツがどこでどのように作られるかを理解することが不可欠である。テキストpROVEnance(テキストpROVEnance)チャレンジを導入し、ターゲットテキストの各文を特定のソース文にトレースする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:56:04 GMT)
Randomized Pairwise Learning with Adaptive Sampling: A PAC-Bayes Analysis [32.8]
ペアワイズ学習モデルの学習のためのデータ適応型サンプリング手法を用いて最適化について検討する。ポイントワイズ学習とペアワイズ学習の顕著な違いは、入力ペア間の統計的上昇である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:24:01 GMT)
End-To-End Self-Tuning Self-Supervised Time Series Anomaly Detection [32.7]
時系列異常検出(TSAD)は、環境センサ、産業タイプ、患者バイオマーカーなど、多くの応用を見出す。 TSADの2倍の課題は、様々な種類の時系列異常を検出できる汎用的で教師なしのモデルである。 TSAP for TSA "on autoPilot"を導入します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:00:13 GMT)
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D [32.5]
本研究では,3次元地上構造を持つシーンデータ上に構築された新しい2次元空間データ生成およびアノテーションパイプラインを提案する。複数の公開データセットにまたがって数千のシーンから生成される大規模データセットであるSPAR-7Mを構築した。さらに,空間能力をより包括的に評価するためのベンチマークであるSPAR-Benchを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:34:23 GMT)
A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models [32.5]
大規模なAIモデルは、医療、教育、法律など、高度な分野に展開されている。これらの課題は、モデルの能力と現実世界のアプリケーションのニーズを整合させるために、学際的な革新を必要とします。我々は,ユーザの要求を満たすためのイノベーションを階層的に抽象化することで,このギャップに対処するフレームワークを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:40:11 GMT)
Empower Vision Applications with LoRA LMM [32.4]
低ランク適応(LoRA)は、外部知識を大規模言語モデル(LMM)に統合する有望な方法を提供する既存のLoRAモデルは計算コストが大きすぎるため、非常にレイテンシが高い。多様なビジョンタスクの強化とLoRA LMMによるビジョンアプリケーション強化を目的としたエンドツーエンドソリューションを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:56:46 GMT)
Context-Aware Self-Adaptation for Domain Generalization [32.1]
ドメインの一般化は、ソーストレーニング領域で適切な学習アルゴリズムを開発することを目的としている。ドメイン一般化のためのコンテキスト認識自己適応(CASA)と呼ばれる新しい2段階のアプローチを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:33:38 GMT)
Invisible Backdoor Attack against Self-supervised Learning [31.8]
自己教師付き学習(SSL)モデルは、バックドア攻撃に対して脆弱である。本稿では,自己教師型モデルに対する非受容的で効果的なバックドア攻撃を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:05:03 GMT)
A Watermark for Black-Box Language Models [31.8]
LLMからシーケンスをサンプリングする機能のみを必要とする原則的な透かし方式を提案する。性能保証を提供し、ホワイトボックスアクセスが利用可能である場合にどのように活用できるかを実証し、包括的実験によって既存のホワイトボックススキームよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:13:21 GMT)
On Distributed Larger-Than-Memory Subset Selection With Pairwise Submodular Functions [31.3]
証明可能な近似保証付き分散バウンディングアルゴリズムを提案する。 CIFAR-100 と ImageNet の高品質なサブセットは,集中型手法と比較して,品質が損なわれるか,あるいは損なわれない。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:19:38 GMT)
Bacon-Shor Board Games [31.1]
コードにしきい値を与えるために数値的に観察する。均一な回路レベルのノイズモデルの下では、最小ウェイト完全マッチングで復号する場合、約0.3%の閾値を観測する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:36:03 GMT)
Learning Audio-guided Video Representation with Gated Attention for Video-Text Retrieval [30.7]
ビデオテキスト検索は、ビデオ理解とマルチモーダル情報検索において最重要となる。音声を組み込んだ従来のモデルは、有用か否かにかかわらず音声入力を盲目的に利用し、その結果、準最適映像表現となる。 GATEd attention (AVIGATE) を用いた音声誘導型VIdeo表現学習のための新しいビデオテキスト検索フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:45:36 GMT)
Self-Calibrating Gaussian Splatting for Large Field of View Reconstruction [30.5]
本稿では,カメラパラメータ,レンズ歪み,3次元ガウス表現を協調的に最適化する自己校正フレームワークを提案する。本手法により,広角レンズで撮影した大視野視野(FOV)画像から高品質なシーン再構成が可能となり,少ない画像からシーンをモデル化することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:24:51 GMT)
Evaluating Molecule Synthesizability via Retrosynthetic Planning and Reaction Prediction [30.2]
現在の医薬品設計モデルを用いた湿式実験における重要な課題は、薬理学的特性と合成可能性とのトレードオフである。分子合成性を評価するための新しいデータ駆動計量を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:16:18 GMT)
DuplexMamba: Enhancing Real-time Speech Conversations with Duplex and Streaming Capabilities [29.7]
本稿では,マンバをベースとした音声とテキストの対話のためのマルチモーダル・デュプレックスモデルを提案する。 DuplexMambaは同時入力処理と出力生成を可能にし、動的に調整してリアルタイムストリーミングをサポートする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:26:48 GMT)
WonderTurbo: Generating Interactive 3D World in 0.72 Seconds [29.6]
我々は,0.72秒以内で3Dシーンの新たな視点を生成できる,初めてのリアルタイムインタラクティブな3Dシーン生成フレームワークであるWonderTurboを紹介する。具体的には、WonderTurboは幾何学的および外見的モデリングの両方を3Dシーン生成で高速化する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:10:47 GMT)
Toward General and Robust LLM-enhanced Text-attributed Graph Learning [29.6]
UltraTAGはLLM強化TAG学習のための統一パイプラインである。 UltraTAG-Sは、現実世界のTAGに固有のスパシティ問題に取り組むために設計された堅牢なインスタンス化である。実験の結果,UltraTAG-Sは既存のベースラインを著しく上回ることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:24:18 GMT)
VinaBench: Benchmark for Faithful and Consistent Visual Narratives [29.1]
忠実なビジュアルな物語を生み出すという課題に対処する新しいベンチマークであるVinaBenchを提案する。以上の結果から,VinaBenchの知識制約による学習は,生成した視覚的物語の忠実性と結束性を効果的に向上させることが示された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:28:19 GMT)
Moment Quantization for Video Temporal Grounding [29.1]
我々は、新しいモーメント量子化に基づくビデオ時間グラウンド法(MQVTG)を提案する。 MQVTGは入力ビデオを様々な離散ベクトルに量子化し、関連するモーメントと無関係なモーメントの識別を強化する。本手法は,関係する特徴を効果的にグループ化し,無関係な特徴を分離し,差別の強化を目標とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:21:14 GMT)
Photon-number-resolving single-photon detector with a system detection efficiency of 98% and photon-number resolution of 32 [28.6]
単一光子系検出効率(SDE)は98%、暗カウントレートは20cpsである。検出器は3dB-SDEで41MHzの高速で動作し、低タイミングジッタは40psである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:15:49 GMT)
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation [28.2]
OpenAIのGPT4oモデルは、画像生成と編集において驚くほど優れた機能を示している。本報告では、GPT-ImgEvalというファーストルック評価ベンチマークについて述べる。 GPT-4oの性能は,生成品質,(2)編集能力,(3)世界知識インフォームド合成の3つの重要な側面にまたがっている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:23:16 GMT)
LearNAT: Learning NL2SQL with AST-guided Task Decomposition for Large Language Models [28.2]
複雑なNL2タスクにおいて,タスク分解と強化学習により,LLM(Large Language Models)の性能を向上させる新しいフレームワークを提案する。 LearNATはGPT-4に匹敵する性能を実現し、効率とアクセシビリティを向上させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:59:44 GMT)
Image Coding for Machines via Feature-Preserving Rate-Distortion Optimization [28.0]
本稿では,特徴量間の距離を歪み指標として,タスク損失に対する圧縮の影響を低減する手法を提案する。我々は、ブロックベースのエンコーダを用いて歪み項を計算可能にするために、RDOの定式化を単純化する。 SSEに基づくRDOと比較して、同じコンピュータビジョンの精度で最大10%のビットレートを節約できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:11:26 GMT)
SkyReels-A2: Compose Anything in Video Diffusion Transformers [27.3]
本稿では、任意の視覚要素を合成ビデオに組み込むことができる制御可能なビデオ生成フレームワークSkyReels-A2を提案する。このタスク要素をビデオ(E2V)と呼び、各参照要素の忠実さを保ち、シーンのコヒーレントな構成を確保し、自然な出力を達成することが主な課題である。本稿では,多要素表現を生成プロセスに注入し,要素固有の一貫性とグローバルコヒーレンスとテキストアライメントのバランスをとる,新しい画像-テキスト共同埋め込みモデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:50:50 GMT)
F-ViTA: Foundation Model Guided Visible to Thermal Translation [27.2]
そこで我々は,F-ViTAを提案する。F-ViTAは,基礎モデルに埋め込まれた一般世界の知識を利用して,翻訳改善のための拡散過程を導出する手法である。本モデルでは, オフ・オブ・ディストリビューション(OOD)のシナリオを一般化し, 同じ可視像からLWIR, MWIR, 近赤外(NIR)の変換を生成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:47:06 GMT)
Evolving Generalizable Parallel Algorithm Portfolios via Domain-Agnostic Instance Generation [27.1]
一般化は、データからトレーニングする際の中核的な目的である。並列アルゴリズムポートフォリオ(PAP)とインスタンス人口を同時に進化させることによって、共進化的アプローチはこの課題に対処する。本研究は,パラメタライズドサーチ(DACE)のドメインに依存しない共進化という,汎用的で既成のPAP構築手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:18:35 GMT)
MegaScale-Infer: Serving Mixture-of-Experts at Scale with Disaggregated Expert Parallelism [26.9]
Mixture-of-Experts (MoE)は、大規模言語モデル(LLM)をスケールし、性能を向上し、計算の複雑さを減らし、大きな可能性を誇示している。大規模MOEモデルを提供するための効率よく費用効率の良いシステムであるMegaScale-Inferを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:20:44 GMT)
Understanding Aha Moments: from External Observations to Internal Mechanisms [26.8]
大規模推論モデル(LRM)は複雑な問題を推論することができる。言語パターン,不確実性の記述,「推論崩壊」から潜在空間の解析まで,LRMにおける「アハモーメント」について検討した。この「アハモーメント」は、モデルが問題の難しさに対する認識を変えることで、複雑な問題を解決するのに役立ちます。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:22:20 GMT)
L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression [26.6]
本稿では,短期動作と長期動作の両方に対応可能な適応動作推定モジュールを提案する。また、モーション符号化のビットコストを大幅に削減できる適応型モーション予測モジュールを提案する。実験の結果、L-LBVCは従来のLVC法よりも大幅に優れており、一部のテストデータセットではVVC(VTM)を上回ります。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:15:45 GMT)
TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.1]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:13:51 GMT)
Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving [26.0]
Java、TypeScript、JavaScript、Go、Rust、C、C++をカバーするマルチ言語問題解決ベンチマークであるMulti-SWE-benchを紹介します。これには合計1,632の高品質なインスタンスが含まれており、68のエキスパートアノテータによって2,456の候補から慎重にアノテートされた。 3つの代表的手法を用いて,Multi-SWE-benchに基づく一連の最先端モデルの評価を行った。大規模強化学習(RL)トレーニングデータセットの構築を目的とした,オープンソースコミュニティのMulti-SWE-RLを立ち上げた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:06:17 GMT)
Inference-Time Scaling for Generalist Reward Modeling [25.6]
強化学習(RL)は大規模言語モデル(LLM)のポストトレーニングにおいて広く採用されている。 RLの主な課題は、検証可能な質問や人工ルールを超えて、様々な領域のLLMに対して正確な報酬信号を得ることである。本研究では,一般問合せに対する推論計算により,報酬モデルを改善する方法について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:19:49 GMT)
Toward Real-world BEV Perception: Depth Uncertainty Estimation via Gaussian Splatting [25.4]
鳥眼視(Bird's-eye view, BEV)は、複数のビューイメージを融合させる統一表現を提供するため、注目されている。近年の最先端モデルでは、BEV知覚をクエリ学習として定式化するプロジェクションベースの手法を用いて、明示的な深さ推定を回避している。本稿では,非投射型手法を再検討し,深度不確実性モデリングにより拡張する,新しい不確実性を考慮したBEV認識フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:01:32 GMT)
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision [25.3]
重要なロボットビジョンタスクにおけるマルチモーダル融合の応用を体系的に検討する。視覚言語モデル(VLM)と従来のマルチモーダル融合法を比較し,その利点,限界,シナジーを分析した。クロスモーダルアライメント、効率的な融合戦略、リアルタイムデプロイメント、ドメイン適応といった重要な研究課題を特定します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:53:07 GMT)
Can AI Solve the Peer Review Crisis? A Large Scale Cross Model Experiment of LLMs' Performance and Biases in Evaluating over 1000 Economics Papers [25.2]
本研究では,大規模言語モデル(LLM)による学術的査読プロセスの強化の可能性について,系統的バイアスを伴わずに,経済研究の質を確実に評価することによって検討する。 2つの相補的な実験で4つのLLMの大規模評価を行った。我々は、GPT、Gemma、LLaMAが、匿名で提示された同じ論文に対して、上位の男性作家やエリート機関からの投稿に対して、かなり高い評価を割り当てていることを発見した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:12:13 GMT)
JailDAM: Jailbreak Detection with Adaptive Memory for Vision-Language Model [25.2]
マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクに優れるが、有害なコンテンツを生成する大きなリスクを生じさせる。ジェイルブレイク攻撃は、モデル内の安全メカニズムを回避し、不適切なコンテンツや安全でないコンテンツを生成する意図的な操作を指す。 JAILDAMと呼ばれるテスト時間適応フレームワークを導入し、これらの問題に対処する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:00:28 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0]
Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:12:03 GMT)
SAM-REF: Introducing Image-Prompt Synergy during Interaction for Detail Enhancement in the Segment Anything Model [24.8]
軽量精細機を用いて画像とプロンプトを完全に統合する2段階精細化フレームワークを提案する。我々のSAM-REFモデルは、効率を損なうことなくセグメンテーション品質に関するほとんどの指標において、最先端の手法よりも優れています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:38:19 GMT)
Leveraging Modality Tags for Enhanced Cross-Modal Video Retrieval [24.8]
ビデオ検索のためのモダリティ補助概念(MAC-VR)を紹介する。我々は、潜在空間におけるモダリティの整合と、補助潜在概念の学習と整合性を提案する。 5つの多様なデータセットについて広範な実験を行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:30:52 GMT)
SocialGesture: Delving into Multi-person Gesture Understanding [24.4]
SocialGestureは、マルチパーソンジェスチャー分析に特化した最初の大規模データセットである。 SocialGestureはさまざまな自然なシナリオを備え、複数のジェスチャー解析タスクをサポートする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:21:06 GMT)
Scalable Private Search with Wally [23.9]
Wallyは、大規模なデータベースに対する効率的な検索クエリをサポートするプライベート検索システムである。 3.2百万のエントリを持つデータベースでは、Wallyのクエリ/秒(QPS)は7-28倍高く、通信はTiptoeより6.69-31倍小さい。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:58:52 GMT)
On Vanishing Variance in Transformer Length Generalization [23.7]
また,今日のフロンティアモデルにおいても,より長いシーケンス長はマルチヘッドアテンションモジュールの出力のばらつきを減少させることを示した。分析では, この改善は分散の消失による分布シフトを完全に排除したものではないものの, 削減したと考えられる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:56 GMT)
Efficient Training of Multi-task Neural Solver for Combinatorial Optimization [23.7]
本稿では,統合型マルチタスクニューラルソルバを実現するための,汎用的で効率的なトレーニングパラダイムを提案する。本手法は, 制約付きトレーニング予算の範囲内であっても, 全体的な性能を著しく向上させる。また,本手法は単一タスク学習やマルチタスク学習と比較して最高の結果を得た。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:31:44 GMT)
ToxicSQL: Migrating SQL Injection Threats into Text-to-SQL Models via Backdoor Attack [23.4]
セキュリティ上の懸念はほとんど未解決であり、特にバックドア攻撃の脅威である。 Toxicは、新しいバックドア攻撃フレームワークである。我々は、0.44%の有毒データを注入するだけで79.41%の攻撃成功率となり、データベースのセキュリティに重大なリスクが生じることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:16:53 GMT)
Heterogeneous Mixture of Experts for Remote Sensing Image Super-Resolution [23.4]
我々は、Mixture of Experts (MoE)モデルを導入し、異種専門家の集合を設計する。これらの専門家は複数の専門家グループに分けられ、各グループのエキスパートはグループ間で異質でありながら同質である。 UCMerced および AID データセットを用いた実験により,提案手法がSR再構成精度に優れていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:27:53 GMT)
The Value of Information in Human-AI Decision-making [23.4]
情報の価値を特徴付けるための決定論的枠組みを提供する。本稿では,モデル選択,人間-AI性能の実証評価,説明設計におけるフレームワークの利用について紹介する。本稿では,意思決定における情報価値を説明するために,サリエンシに基づく説明手法であるSHAPを適用した新しい情報ベース説明手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:57:23 GMT)
LPA3D: 3D Room-Level Scene Generation from In-the-Wild Images [23.3]
LPA-GAN(LPA-GAN)は、LPAのカメラポーズの先行を推定するために、特定の修正を組み込んだ新しいNeRFベースの生成手法である。本手法は,ビュー・ツー・ビューの整合性とセマンティック・ノーマル性に優れる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:18:48 GMT)
Safety Modulation: Enhancing Safety in Reinforcement Learning through Cost-Modulated Rewards [23.2]
セーフ強化学習(Safe Reinforcement Learning, セーフRL)は、RLエージェントをトレーニングして、安全性の制約を守りながら、実環境におけるパフォーマンスを最大化することを目的としている。本稿では,安全なポリシ関数学習を可能にする,SMPO(Safety Modulated Policy Optimization)と呼ばれる新しい安全なRL手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:35:22 GMT)
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis [23.0]
条件付き画像合成は、芸術的創造や仮想現実といった幅広い応用において重要な課題である。本稿では,条件付き画像合成を多種多様な条件単位のモジュラー結合として扱う新しい手法を提案する。我々のフレームワークは、多様な条件生成タスクに対するモデルの適応性を向上し、その適用範囲を大幅に拡大します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:39:13 GMT)
Computing High-dimensional Confidence Sets for Arbitrary Distributions [22.9]
最良球の体積と競合する体積が$exp(tildeO(d2/3)$因子)の信頼集合を求めるアルゴリズムが見つかる。我々の結果は、信頼セットの適切な(不適切な)学習と適切な(不適切な)学習を、興味深い分離を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:05:10 GMT)
AD-GPT: Large Language Models in Alzheimer's Disease [22.8]
医学情報検索のための強力なツールとして,大規模言語モデル (LLM) が登場した。しかし、その正確さと深さは、アルツハイマー病(AD)のような専門領域に限られている。本稿では,AD関連遺伝子・神経生物学的情報の検索と解析を強化するために,ドメイン特異的な事前学習型トランスフォーマであるAD-GPTを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:49:10 GMT)
MAD: Makeup All-in-One with Cross-Domain Diffusion Model [22.7]
私たちは、様々なメイクタスクに1つのモデルを使用する最初の試みを行っている。異なる構成タスクをクロスドメイン翻訳として定式化し、クロスドメイン拡散モデルを用いて全てのタスクを遂行する。正確なテキスト・ツー・メイクアップアプリケーションをサポートするため,MT-Textデータセットを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:52:31 GMT)
Scaling Analysis of Interleaved Speech-Text Language Models [22.6]
音声言語モデル(SLM)のスケーリング分析は、SLMがテキストよりもはるかに多くの計算とデータを必要とすることを予測している。現代のSLMは、知識伝達を可能にするために、音声テキストインターリーブを用いて事前訓練されたTextLMから初期化されることが多い。我々は,数ダースをトレーニングし,スケーリングの傾向を分析することで,インターリーブSLMのスケーリング分析を行う。この設定下において、SLMは計算によってより効率的にスケールできる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:46:56 GMT)
Variational Online Mirror Descent for Robust Learning in Schrödinger Bridge [22.5]
Sch"odinger Bridge (SB) は確率的生成モデルの普遍的なクラスへと進化してきた。ミラー降下(MD)によるシンクホーンアルゴリズムに関する最近の研究が注目されている。本稿では,SB問題に対する分散オンラインMD(OMD)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:18:47 GMT)
CoLa -- Learning to Interactively Collaborate with Large LMs [22.4]
自動ガイドを学習するための新しい自己指導型学習パラダイムであるCoLaを紹介する。我々は,人間によるQAデータセットの人間による研究を行うことにより,人間と自動ガイドの戦略を比較した。自動ガイドは,その戦略を推論者の能力に適応させることで人間より優れていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:34:36 GMT)
ConsistencyDet: A Few-step Denoising Framework for Object Detection Using the Consistency Model [22.3]
本稿では,物体検出を認知拡散過程として記述するための新しいフレームワークを提案する。 textbfConsistencyDetと呼ばれるこのフレームワークは、Consistency Modelとして知られる革新的な概念を活用している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:19:04 GMT)
MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception [22.2]
MMTL-UniADはマルチモーダルなマルチタスク学習フレームワークである。ドライバーの行動(例えば、周りを見回したり話したり)、ドライバーの感情(例えば、不安、幸福)、車両の挙動(例えば、駐車、旋回)、交通状況(例えば、交通渋滞、交通のスムーズさ)を同時に認識する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:23:27 GMT)
VEGAS: Towards Visually Explainable and Grounded Artificial Social Intelligence [22.1]
ソーシャルインテリジェンスクエリ(Social Intelligence Queries、Social-IQ)は、モデルのソーシャルインテリジェンスレベルを評価するための主要なマルチモーダルベンチマークである。本稿では,視覚的説明可能・接地型人工知能(VEGAS)モデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:48:21 GMT)
BECAME: BayEsian Continual Learning with Adaptive Model MErging [21.6]
BECAMEという2段階のフレームワークを導入し、勾配予測と適応的マージの専門知識を相乗化する。我々のアプローチは、最先端のCLメソッドと既存のマージ戦略より優れています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:07:28 GMT)
FM2DS: Few-Shot Multimodal Multihop Data Synthesis with Knowledge Distillation for Question Answering [21.5]
マルチモーダルなマルチホップ質問応答 (MMQA) には、複数のソースからの画像やテキストを推論する必要がある。既存の方法は、シングルホップ、シングルモダリティ、短いテキストに焦点を当てている。 MMQAのための高品質なデータセットを作成するための最初のフレームワークであるFM2DSを紹介します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:39:17 GMT)
GPTQv2: Efficient Finetuning-Free Quantization for Asymmetric Calibration [21.5]
GPTQv2は、大規模トランスアーキテクチャを圧縮するための微調整不要な量子化法である。 1つのGPU上で405B言語変換器とEVA-02を量子化し、画像ネットの精度を90%向上させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:30:43 GMT)
Taylor Series-Inspired Local Structure Fitting Network for Few-shot Point Cloud Semantic Segmentation [21.4]
少数のショットポイントクラウドセマンティックセグメンテーションは、限定されたラベル付きデータを使用して、ポイントクラウドシーンで"見えない"新しいカテゴリを正確にセグメンテーションすることを目的としている。そこで本研究では,数点のクラウドセマンティックセグメンテーションセグメンテーションのための事前学習不要な局所構造適合ネットワークを提案する。具体的には、不規則点雲の局所構造表現を適合問題として扱い、TaylorConvと呼ばれる新しい局所構造適合畳み込みを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:19:06 GMT)
Attention-Aware Multi-View Pedestrian Tracking [21.4]
最近の多視点歩行者検出モデルは、早期統合戦略の可能性を強調している。この戦略は、検出と追跡の両方のパフォーマンスを改善することが示されている。本稿では,多視点歩行者追跡シナリオに注意機構を組み込んだ新しいモデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:53:08 GMT)
Predictive Coding for Decision Transformer [21.3]
決定変換器(DT)アーキテクチャは、様々な領域で約束されている。最初の成功にもかかわらず、DTはゴール条件付きRLのいくつかの挑戦的なデータセットで性能が劣っている。本稿では、一般化された将来の条件付けを活用してDT手法を強化するPCDT(Predictive Coding for Decision Transformer)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:35:28 GMT)
Understanding Depth and Height Perception in Large Visual-Language Models [21.2]
視覚言語モデル(VLM)の幾何学的理解を評価することに注力する。形状や大きさといった基本的な幾何学的性質の知覚には優れていますが、深さや高さの知覚には一貫して苦労しています。本研究の目的は, 幾何学的理解を深めた VLM の開発方法を明らかにすることである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:06:48 GMT)
Towards Mobile Sensing with Event Cameras on High-agility Resource-constrained Devices: A Survey [21.0]
本稿は2014-2024年の間に文献を調査する。イベントベースのモバイルセンシングシステムの概要を提供する。本稿では,視覚計測,物体追跡,光フロー推定,3次元再構成など,モバイルセンシングにおけるイベントカメラの重要応用について論じる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:53:09 GMT)
MedConv: Convolutions Beat Transformers on Long-Tailed Bone Density Prediction [20.9]
骨密度予測のための畳み込みモデルであるMedConvを導入する。提案手法は従来の最先端手法に比べて精度が最大21%向上し,ROC AUCは20%向上した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:23:35 GMT)
Productively Deploying Emerging Models on Emerging Platforms: A Top-Down Approach for Testing and Debugging [20.9]
textscTapMLは、さまざまなプラットフォームでのモデルのデプロイを合理化するために設計されたトップダウンのアプローチである。 textscTapMLは、新興MLモデルをデプロイするMLC-LLMプロジェクトにおいて、デフォルトの開発メソッドとして使用されている。 2年以内に、textscTapMLは、5つの新興プラットフォームにまたがる27のモデルアーキテクチャに105の新興モデルのデプロイを加速した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:20:47 GMT)
SPACE: SPike-Aware Consistency Enhancement for Test-Time Adaptation in Spiking Neural Networks [20.8]
Spiking Neural Networks (SNN) は人工ニューラルネットワーク (ANN) の生物学的に妥当な代替品である従来のテスト時間適応法は、SNNのユニークな計算力学に対処できない。我々は、$textbfSP$ike-$textbfA$ware $textbfC$onsistency $textbfE$nhancement (SPACE)を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:05:05 GMT)
Fine-Tuning Visual Autoregressive Models for Subject-Driven Generation [20.7]
主観駆動型生成のための最初のVARに基づくアプローチを提案する。我々は,言語ドリフトを軽減するため,複雑性を低減し,事前蒸留を行うための選択的層チューニングを導入する。提案手法は, 様々な指標において拡散ベースラインを著しく上回り, その実用性を実証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:12:55 GMT)
Explainable and Interpretable Forecasts on Non-Smooth Multivariate Time Series for Responsible Gameplay [20.4]
Actionable Forecasting Network (AFN) は、3つの排他的目的に関連する相互依存的な課題に対処する。 AFNは、SOM-VAEベースのSOTAネットワークと比較して、プレイヤーデータ上の予測のMSEを25%改善する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:49:24 GMT)
TailedCore: Few-Shot Sampling for Unsupervised Long-Tail Noisy Anomaly Detection [20.3]
メモリベースの異常検出モデルであるTailedCore を構築した。教師なし長尾雑音検出設定におけるTailedCore の有効性を広範囲に検証し,ほとんどの設定において TailedCore が最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:14:57 GMT)
LLM Library Learning Fails: A LEGO-Prover Case Study [20.3]
レゴプロバーは, 数学的推論のための再利用可能な補題を学習する。学習したレムマの直接再利用の証拠は見つからず、学習したレムマのソフト再利用に対する証拠も見つからない。本研究は,これらの手法の有効性について,重大な誤解が存在することを示唆している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:53:51 GMT)
Benchmark of Segmentation Techniques for Pelvic Fracture in CT and X-ray: Summary of the PENGWIN 2024 Challenge [20.1]
PENGWINは自動破折セグメンテーションを推し進めることを目的としていた。トップパフォーマンスCTアルゴリズムは、平均的なフラグメントワイド結合(IoU)を0.930で達成し、良好な精度を示した。最も優れたアルゴリズムは0.774のIoUに達し、解剖学的構造が重なり合うことによって生じる大きな課題を浮き彫りにした。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:19:36 GMT)
APSeg: Auto-Prompt Model with Acquired and Injected Knowledge for Nuclear Instance Segmentation and Classification [19.8]
核インスタンスのtextbfSegmentation と classification に関する知識を取得,注入した textbfAuto-textbfPrompt モデルを提案する。 APSegは,(1)分布ガイド付き提案オフセットモジュール(textbfDG-POM)と(2)カテゴリ記述から派生した形態的知識を注入するカテゴリ知識セマンティックインジェクションモジュール(textbfCK-SIM)の2つの知識認識モジュールを組み込んでいる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:28:51 GMT)
The Dual-Route Model of Induction [19.8]
概念レベルの誘導ヘッドを導入し、個々のトークンの代わりに語彙単位全体をコピーする。概念誘導ヘッドは単語レベルの翻訳のような意味的なタスクに責任があることを示し、一方トークン誘導ヘッドは動詞でしかできないタスクには不可欠である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:40:31 GMT)
OmniTalker: Real-Time Text-Driven Talking Head Generation with In-Context Audio-Visual Style Replication [19.7]
我々は,リアルタイムゼロショットシナリオにおけるテキストと参照ビデオから,同期音声と音声ヘッドビデオを同時に生成するエンドツーエンド統合フレームワークを提案する。提案手法は,特にスタイル保存や音声-ビデオ同期に優れた生成品質の既存手法を超越した手法である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:48:13 GMT)
Bootstrapped Model Predictive Control [19.7]
本稿では,ブートストラップ方式でポリシー学習を行う新しいアルゴリズムであるBootstrapped Model Predictive Control(BMPC)を紹介する。 BMPCは、MPCの専門家を模倣してネットワークポリシーを学び、その結果、MPCプロセスのガイドにこのポリシーを使用する。本手法は,各種連続制御タスクの先行作業よりも優れた性能を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:21:53 GMT)
Reward Generation via Large Vision-Language Model in Offline Reinforcement Learning [19.5]
オフライン強化学習(RL)では、固定データセットからの学習が、環境とのリアルタイムインタラクションが高価またはリスクの高いドメインに対して、有望なソリューションを提供する。人間の関与なしにオフラインデータから報酬を生成するために,RG-VLM(Large Vision-Language Models)によるリワード生成を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:11:18 GMT)
Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning [19.5]
i-QNは、アクション値関数の調整されたシーケンスを学習することで、複数の連続したベルマン更新を可能にする、原則化されたアプローチである。 i-QNは理論的に根拠があり、値ベースおよびアクター批判的手法でシームレスに使用できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:58:46 GMT)
ConfEviSurrogate: A Conformalized Evidential Surrogate Model for Uncertainty Quantification [19.4]
サーロゲートモデル(英: Surrogate model)とは、シミュレーションノイズからモデル予測エラーまで、複雑なシミュレーションデータを科学的に近似するために不可欠なモデルである。 ConfEviSurrogateは,高次明細分布を効率よく学習できる新しいコンフォーマル化証拠サロゲートモデルである。我々のモデルは、宇宙論、海洋力学、流体力学を含む様々なシミュレーションにおいて、正確な予測と頑健な不確実性推定を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:44:14 GMT)
Noise-Aware Generalization: Robustness to In-Domain Noise and Out-of-Domain Generalization [19.4]
マルチソースドメイン一般化(DG)は、モデルロバストネスを新しいディストリビューションに改善することを目的としている。しかし、DG法はしばしばラベルノイズの影響を見落とし、訓練中にモデルを混乱させ、性能を低下させる。本稿では,分布シフトとラベルノイズの両方でモデルを評価する,この未探索空間について検討する。提案するDL4ND手法は,単一領域内で識別不可能なノイズサンプルが,各領域で比較した場合に大きく変化する場合が多いという観測を生かして,ノイズ検出を改善する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:37:57 GMT)
Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.1]
交通信号システム(TSCS)は、効率的な車両の流れを育むインテリジェントな交通管理に不可欠である。本稿では,インテリジェントトラフィックエッジネットワークを実現するための新しいTSCSフレームワークを提案する。我々は,マルチエージェントソフトアクター・クリニック(MA-SAC)強化学習アルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:50:50 GMT)
Output Prediction of Quantum Circuits based on Graph Neural Networks [19.0]
本稿では,量子回路の出力期待値を予測するためのグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。我々は,同じデータセット上での畳み込みニューラルネットワーク(CNN)に対する雑音条件と雑音条件の両方において,GNNの予測性能を比較した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:43:44 GMT)
IBCB: Efficient Inverse Batched Contextual Bandit for Behavioral Evolution History [18.8]
多くのストリーミングアプリケーションでは、オンライン意思決定者は意思決定プロセス中にオンライン学習に従事している。これは、経験豊富な専門家からのデータしか利用できない既存の模倣学習アプローチに新たな課題をもたらす。本稿では,環境報酬パラメータの推定を効率的に行うことができる逆バッチコンテキスト帯域幅フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:30:15 GMT)
GenDR: Lightning Generative Detail Restorator [18.5]
我々は,より大きい潜伏空間を持つテーラー拡散モデルから抽出した生成詳細復元のための1段階拡散モデルGenDRを提案する。実験の結果,GenDRは定量的な測定値と視覚的忠実度の両方で最先端の性能を達成できた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:51:38 GMT)
VIP: Video Inpainting Pipeline for Real World Human Removal [18.3]
VIP (Video Inpainting Pipeline) は、現実世界の人間除去アプリケーションのための、新規な無作為なビデオインパインティングフレームワークである。 VIPはモーションモジュールによる最先端のテキスト・トゥ・ビデオモデルを強化し、潜伏空間におけるプログレッシブ・デノーミングのために変分オートエンコーダ(VAE)を使用する。実世界の様々なシナリオにおいて,VIPは時間的一貫性と視覚的忠実性に優れることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:40:10 GMT)
Noiser: Bounded Input Perturbations for Attributing Large Language Models [17.8]
本稿では,各入力埋め込みに有界雑音を課す摂動型FA法であるノイズ器を紹介する。ノイズは、信頼度と応答性の両方の観点から、既存の勾配、注意に基づく、摂動に基づくFA法を一貫して上回っていることを実証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:59:37 GMT)
Exploring Individual Factors in the Adoption of LLMs for Specific Software Engineering Tasks [17.8]
本研究では,技術導入に伴う個々の属性と大規模言語モデル(LLM)の関係について検討する。その結果、タスク固有の採用は異なる要因の影響を受けており、その一部は単独で考えると、採用に悪影響を及ぼすことが判明した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:07:04 GMT)
An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.8]
ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。 ECGFounderは内部検証セットのエキスパートレベルのパフォーマンスを達成し、AUROCは80の診断で0.95を超えている。微調整されたECGFounderは、人口統計分析、臨床イベント検出、心拍数横断診断においてベースラインモデルを上回っている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:42:11 GMT)
Deep Reinforcement Learning via Object-Centric Attention [17.6]
タスク関連エンティティを選択的に保存し,無関係な視覚情報をフィルタリングするOcCAM(Object-Centric Attention via Masking)を導入する。 OCCAMは、従来のピクセルベースのRLと類似または類似した性能を示しながら、新しい摂動を著しく改善し、サンプルの複雑さを低減させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:48:27 GMT)
Beyond Non-Expert Demonstrations: Outcome-Driven Action Constraint for Offline Reinforcement Learning [17.6]
本稿では,現実的なデータを用いたオフライン強化学習の課題,特に準最適行動ポリシを通じて収集された非専門的データに対処する。このような状況下では、学習したポリシーは、オフラインデータから悪いデモンストレーションを扱うのに十分な柔軟性を維持しながら、分散シフトを管理するのに十分な安全でなければならない。本稿では,行動方針の実証的行動分布への依存度を低減し,その悪影響を低減しようとする,アウトカム駆動行動柔軟性(ODAF)と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:40:35 GMT)
GPG: A Simple and Strong Reinforcement Learning Baseline for Model Reasoning [17.5]
グループポリシーグラディエント(GPG)と呼ばれる最小主義的RLアプローチを提案する。従来の手法とは異なり、GAGは元のRL目標を直接最適化するので、損失関数のサロゲートが不要になる。本手法は補助的な技術や調整に頼ることなく優れた性能を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:53:41 GMT)
RASP: Revisiting 3D Anamorphic Art for Shadow-Guided Packing of Irregular Objects [17.4]
我々は3Dアナモルフィックアートからの洞察に基づいて3Dオブジェクトアレンジメントを行う。 RASPは,任意の形状の3Dオブジェクトを有界体積内に配置する,微分可能なレンダリングベースのフレームワークである。我々は多視点アナモルフィックアートのアートイラストを提示し、多視点から意味のある表現を実現した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:33:49 GMT)
Hide and Seek in Noise Labels: Noise-Robust Collaborative Active Learning with LLM-Powered Assistance [17.4]
ノイズラベル(LNL)からの学習は、収集されたトレーニングデータが誤ったラベルや破損したラベルを含むことができる多くの実世界のシナリオで発生する課題である。既存のソリューションのほとんどは、ノイズの多いラベルを特定し、アクティブな学習を採用して、人間の専門家にノイズを問う。本稿では,大規模な言語モデルと,雑音ラベルから学習するための小さなモデルを組み合わせた,能動的学習に基づく革新的な協調学習フレームワークであるNossalを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:36:39 GMT)
DaKultur: Evaluating the Cultural Awareness of Language Models for Danish with Native Speakers [17.4]
我々はデンマークのミッドリソース言語に対する最初の文化的評価研究を行い、母国語話者は異なるモデルに文化的認識を必要とする課題を解決するよう促す。人口統計学的に多様性のある63人の1,038人のインタラクションの分析は、文化的適応に対するオープンな課題を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:52:42 GMT)
Mixture of Attentions For Speculative Decoding [17.3]
投機的復号法(SD)は、より小さなモデルを利用して将来のトークンを効率的に提案し、それを大規模言語モデルによって並列に検証する。 SDモデルには、トレーニング中のオン・ポリティネスの欠如や部分観測可能性の欠如など、いくつかの制限がある。 SD用ミクチャ・オブ・アテンションの導入により,小型モデルのより基礎的なアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:35:01 GMT)
Asynchronous BFT Consensus Made Wireless [17.0]
Asynchronous Byzantine fault-tolerant (BFT)コンセンサスプロトコルは、無線アプリケーションにとってますます重要になっている。これらのプロトコルは有線ネットワークにおいて有効であることが証明されているが、無線環境への適応は重大な課題である。非同期BFTコンセンサスは、高いメッセージ複雑性に悩まされ、ネットワークの混雑と非効率に繋がる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:57:23 GMT)
MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators [17.0]
我々は、高量子化MoEを低ランク補償器の混合で拡張する新しい方法であるMiLoを紹介する。 MiLoはキャリブレーションデータに依存しないので、キャリブレーションセットに過度に適合することなく、さまざまなMoEモデルやデータセットに一般化することができる。評価の結果、MiLoは様々なタスクでSoTA MoEモデル上で既存の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:54:17 GMT)
RBR4DNN: Requirements-based Testing of Neural Networks [16.9]
ディープニューラルネットワーク(DNN)テストは、障害が深刻な結果をもたらすクリティカルシステムの信頼性と安全性に不可欠である。本稿では, セマンティックな特徴空間で定式化された自然言語要求を用いた要件ベースのテストスイート生成手法を提案する。 MNIST、CelebA-HQ、ImageNet、および自律運転データセットに関する我々の実験は、生成されたテストスイートが現実的で、多様性があり、事前条件と整合性があり、欠陥を明らかにすることができることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:24:49 GMT)
MRUCT: Mixed Reality Assistance for Acupuncture Guided by Ultrasonic Computed Tomography [16.8]
中国人は筋肉の記憶と触覚フィードバックに頼って針を挿入し、正確な治療ポイントを狙う。新しい実践者は、しばしば試行錯誤を通じて学び、熟達し、患者の信頼を得るために長年の経験を必要とする。我々は,超音波計算トモグラフィとMR(Mixed Reality)技術を統合したMRUCTという革新的なシステムを開発した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:36:01 GMT)
Improving Harmful Text Detection with Joint Retrieval and External Knowledge [16.7]
本研究では,学習済み言語モデルと知識グラフを統合し,有害テキスト検出の精度と堅牢性を向上させるための共同検索フレームワークを提案する。実験結果から, 結合探索法は単一モデルベースラインよりも有意に優れていた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:37:55 GMT)
Hummus: A Dataset of Humorous Multimodal Metaphor Use [16.7]
本研究は,コミュニティで注目されていないマルチモーダルメタファーのユーモラスな能力に焦点を当てたものである。我々は、ユーモアの特異性理論、概念メタファー理論、VUアムステルダムメタファーコーパスの背後にあるアノテーションスキームからインスピレーションを得る。データセットとコードを.com/xiaoyuisrain/humorous-multimodal-metaphor-useでリリースします。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:15:01 GMT)
BOOST: Bootstrapping Strategy-Driven Reasoning Programs for Program-Guided Fact-Checking [16.7]
プログラム誘導推論は、複雑なクレームの事実チェックにおいて有望であることを示している。それまでの作業は、アドホックなデモを伴う、数発のコンテキスト内学習に依存していた。本稿では,数ショット推論プログラム生成のためのブートストラップベースのフレームワークであるBOOSTを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:38:45 GMT)
Revisiting Weight Averaging for Model Merging [16.5]
モデルマージは、個別に調整されたモデルのパラメータを追加のトレーニングなしで組み合わせることで、マルチタスク学習者を構築することを目的としている。ウェイト平均化は、ウェイト平均化自身を中心としたタスクベクトルを暗黙的に誘導する。これらの中心となるタスクベクトルに低ランク近似を適用することにより、マージ性能が大幅に向上する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:46:20 GMT)
Enhancing Chart-to-Code Generation in Multimodal Large Language Models via Iterative Dual Preference Learning [16.2]
Chart2Codeは、チャート・ツー・コード生成のための新しい反復的な二重選好学習フレームワークである。 Chart2Codeは、ディストリビューション外のチャート・ツー・コード生成品質を継続的に改善する。我々のフレームワークは、チャート理解における今後の進歩の道を開く。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:51:20 GMT)
A Framework for Adapting Human-Robot Interaction to Diverse User Groups [16.2]
適応型ロボットインタラクション(HRI)のための新しいフレームワークを提案する。私たちの主な貢献は、オープンソースのコードベースを備えた適応型ROSベースのHRIフレームワークの開発です。このフレームワークは、高度な音声認識と音声活動検出を通じて、自然な相互作用をサポートする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:22:27 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1]
本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:30:16 GMT)
DiSRT-In-Bed: Diffusion-Based Sim-to-Real Transfer Framework for In-Bed Human Mesh Recovery [16.1]
頭上深度画像からの人体メッシュ復元のためのSim-to-Real Transfer Frameworkを提案する。本稿では,実世界のベッド内ポーズと身体推論のシナリオにおける一般化を支援するために,合成データと実データとのギャップを埋める拡散モデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:57:16 GMT)
TILP: Differentiable Learning of Temporal Logical Rules on Knowledge Graphs [16.1]
時間的論理規則学習のための差別化可能なフレームワークであるTILPを提案する。本稿では、tKGにおける時間的特徴モデリング、例えば、再発、時間的秩序、一対の関係と期間の間隔、および学習過程に組み込んだ時間的特徴モデリングを提案する。提案するフレームワークは,解釈可能な結果を提供しながら,ベースライン手法の性能を向上させることができることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:08:28 GMT)
Concept Bottleneck Large Language Models [15.9]
CB-LLMsは本質的に解釈可能な大規模言語モデルを構築するためのフレームワークである。テキスト分類とテキスト生成という2つの重要なNLPタスクに対してCB-LLMを構築する。埋め込み解釈により、ユーザーは有害なコンテンツ、ステアモデル行動、そして望ましくない概念を透過的に識別することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:27:39 GMT)
ICPL: Few-shot In-context Preference Learning via LLMs [15.8]
我々は,Large Language Models (LLM) が,サンプル効率のよい選好学習を実現するために,ネイティブな選好学習機能を備えていることを示す。我々は,LLMの文脈内学習機能を用いて,人間のクエリ非効率を抑えるインコンテキスト優先学習(ICPL)を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:27:46 GMT)
Towards Computation- and Communication-efficient Computational Pathology [15.7]
我々は Magni-Aligned Global-Local Transformer (MAGA-GLTrans) と呼ばれる新しい通信効率のフレームワークを提案する。提案手法は,高精細化ではなく,低精細化入力を用いた効率的な解析を行うことにより,計算時間,ファイル転送要求,ストレージオーバーヘッドを大幅に削減する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:25:19 GMT)
Beyond Accuracy: The Role of Calibration in Self-Improving Large Language Models [15.6]
大規模言語モデル(LLM)は目覚ましい自己改善能力を示している。本研究では,信頼度推定への影響を調査し,信頼度推定への影響について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:39:54 GMT)
ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization [15.6]
既存の透かし手法は、堅牢性と隠蔽のバランスをとるという課題に直面している。本稿では, 透かしを積極的に隠蔽し, より強力な透かしの埋め込みを可能にするための透かし隠蔽法を提案する。様々な拡散モデルの実験では、画像改ざんであっても透かしが検証可能であることが示されている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:11:31 GMT)
C*: Unifying Programming and Verification in C [15.5]
C* は C プログラミングのための言語設計の証明である。プログラマが実装コードと並行して証明コードブロックを埋め込むことで、リアルタイムの検証を可能にする。 C* は C を共通言語として使用することで実装と証明コード開発を統合する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:22:22 GMT)
SmartFL: Semantics Based Probabilistic Fault Localization [15.5]
テストベースの障害ローカライゼーションは、過去数十年間、ソフトウェアエンジニアリングに重点を置いてきた。フォールトローカライゼーションアプローチにおけるプログラムセマンティクスのモデル化は重要である。私たちのキーとなるアイデアは、プログラム値の正しさのみをモデル化し、その完全な意味論をモデル化することで、有効性とスケーラビリティのバランスを達成できるということです。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:35:04 GMT)
Why do LLMs attend to the first token? [15.5]
大規模言語モデル(LLM)は、シーケンスの最初のトークンに大きく関与する傾向があり、いわゆるアテンションシンクを生成する。我々は、このメカニズムがLLMの過剰混合を回避する方法を提供すると理論的、実証的に主張する。理論的直観を検証し、文脈長、深さ、データパッキングなどの選択がシンク行動にどのように影響するかを示す実験を行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:17:55 GMT)
A Bias-Free Training Paradigm for More General AI-generated Image Detection [15.4]
良く設計された法医学的検知器は、データバイアスを反映するのではなく、生成物固有のアーティファクトを検出する必要がある。本稿では,実画像から偽画像を生成する,バイアスのない学習パラダイムであるB-Freeを提案する。我々は,最先端検出器の一般化とロバスト性の両方において有意な改善が認められた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:36:19 GMT)
CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion [15.3]
大規模な言語モデル(LLM)は、必要なコンテキストを提供するために、入力に複数のテキストチャンクを組み込むことが多い。長いLLM入力のプリフィルを高速化するため、別のLLM入力のプレフィックスとしてコンテキストが再利用された場合、テキストのKVキャッシュをプリコンプリートし、KVキャッシュを再使用することができる。本稿では,KVキャッシュを高速に組み合わせて,高価なプリフィルと同世代の品質を実現する方法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:49:22 GMT)
MD-ProjTex: Texturing 3D Shapes with Multi-Diffusion Projection [15.1]
MD-ProjTexは,事前訓練されたテキスト・ツー・イメージ拡散モデルを用いた3次元形状の高速で一貫したテクスチャ生成手法である。我々のアプローチの核となるのは、紫外線空間における多視点整合性機構であり、異なる視点におけるコヒーレントなテクスチャを保証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:58:06 GMT)
Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [15.1]
非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:32:48 GMT)
Retrieval-Augmented Purifier for Robust LLM-Empowered Recommendation [15.1]
LLM(Large Language Model)を利用したレコメンデーションシステムは、パーソナライズされたレコメンデーションフレームワークに革命をもたらした。既存のLLMを動力とするRecSysは、小さな摂動に対して非常に脆弱であることが示されている。有害なユーザプロファイルを浄化するために,外部の協調信号を検索して新しいフレームワーク(RETURN)を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:22:30 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.0]
大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。 KGoTはGAIAベンチマークのタスク成功率をGPT-4o miniのHugging Face Agentsと比較して29%改善し、GPT-4oのコストを36倍以上削減した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:11:55 GMT)
Do Two AI Scientists Agree? [15.0]
2つのAIモデルが同じ科学的タスクでトレーニングされている場合、彼らは同じ理論または2つの異なる理論を学ぶだろうか? 我々は、物理の標準問題に基づいて訓練されたAI科学者として、ハミルトン・ラグランジアンニューラルネットワークであるMASSを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:58:44 GMT)
Measuring temporal effects of agent knowledge by date-controlled tool use [15.0]
本研究では,大規模言語モデル (LLM) エージェントの知識変数を測定するために,異なる日付制御ツール (DCT) を用いてエージェントの挙動を評価する。検索エンジンの時間性はツール依存エージェントのパフォーマンスに変換されるが,基本モデルの選択や明示的な推論命令によって緩和可能であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:53:20 GMT)
Large (Vision) Language Models are Unsupervised In-Context Learners [14.9]
完全教師なし適応のための共同推論フレームワークを導入する。ゼロショット推論とは異なり、関節推論は与えられたタスクの全ての入力に対して同時に予測を行う。我々の実験は、標準のゼロショットアプローチよりも大幅に改善されている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:33:02 GMT)
Efficient Model Editing with Task-Localized Sparse Fine-tuning [14.8]
そこで本稿では,明示的な線形化を必要とせず,最小限の干渉でスパースタスクベクトルを構築できるTaLoSを提案する。事前学習されたモデルには、タスク間の勾配感度が一貫して低いパラメータのサブセットが含まれていることがわかった。実験により,TaLoSは,タスクの追加や否定において,現在の手法より優れている一方で,トレーニングと推論の効率が向上することが証明された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:20:06 GMT)
Scene Splatter: Momentum 3D Scene Generation from Single Image with Video Diffusion Model [14.8]
Scene Splatterは、単一の画像から一般的なシーンを生成するビデオ拡散のための運動量に基づくパラダイムである。我々は,映像の詳細を向上し,シーンの一貫性を維持するために,オリジナルの特徴からノイズの多いサンプルをモメンタとして構築する。我々は,映像拡散モデルを用いて,高忠実度と一貫した新奇なビューを生成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:00:44 GMT)
Towards Generalizing Temporal Action Segmentation to Unseen Views [14.8]
我々は、トレーニング中にモデルを評価するためのカメラビューが利用できない、見えないビューアクションセグメンテーションのためのプロトコルを定義する。本稿では,この課題に対処する時間的行動セグメンテーションのアプローチを提案する。シーケンス損失とアクション損失を導入し、異なるビューをまたいだ一貫したビデオとアクションの表現を容易にする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:53:59 GMT)
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization [14.7]
3D Gaussian Splatting (3DGS) は3次元再構成において顕著な効果を示し, 実時間放射場レンダリングによる高品質な結果を得た。単一のシーンを再構築するためには通常、59個の浮動小数点パラメータで表現された数百万のガウススプラットが必要であり、結果として約1GBのメモリが生成される。本稿では,属性コードブックを個別に構築し,離散コードインデックスのみを格納する圧縮手法を提案する。具体的には,ノイズ置換ベクトル量子化手法を用いて,コードブックとモデル特徴を協調的にトレーニングし,勾配降下最適化とパラメータ離散化の整合性を確保する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:19:34 GMT)
Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models [14.6]
本研究では,対象のマスクを応用して対象の再構成を可能にし,オブジェクト中心モデルを実現する手法を提案する。提案手法は,オブジェクト中心のガウス表現とメッシュ表現を,ベースラインに比べて最大で96%小さく,最大で71%高速なコンパクトオブジェクトモデルを再構成する。これらの表現は、外見の編集や物理シミュレーションのような下流のアプリケーションに、追加の処理なしですぐに利用することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:01:02 GMT)
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation [14.5]
何千もの挑戦的なビデオを含む新しいデータセットであるViCaSを紹介します。本ベンチマークでは,全体的/高レベルの理解と言語誘導,画素精度のセグメンテーションに関するモデルを評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:52:24 GMT)
HGFormer: Topology-Aware Vision Transformer with HyperGraph Learning [14.3]
知覚探索のためのハイパーグラフの概念を紹介する。具体的には,HyperGraph Transformer (HGFormer) と呼ばれるトポロジ対応の視覚変換器を提案する。我々は効果的で統一的な表現を開発し、鮮明で詳細なシーンの描写を実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:58:01 GMT)
Pushing the Limit of PPG Sensing in Sedentary Conditions by Addressing Poor Skin-sensor Contact [14.1]
光胸腺撮影は、心臓血管の健康を監視するために広く用いられる非侵襲的手法である。鎮静条件下での皮膚感覚接触はPSG信号の形態を歪め、必須波形の特徴の喪失や変化を引き起こす。 CPセンサは, 接触圧が歪んだPSG信号を理想的な形態を持つものに変換する新しい手法である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:22:15 GMT)
Hyperspectral Remote Sensing Images Salient Object Detection: The First Benchmark Dataset and Baseline [14.1]
HRSI-SODデータセットはHRSSDと呼ばれ,704個のハイパースペクトル画像と5327個のピクセルレベルのアノテート・サリエント・オブジェクトを含む。 HRSSDデータセットは、大規模な変動、さまざまなフォアグラウンド・バックグラウンド・リレーション、マルチサリアント・オブジェクトのために、健全なオブジェクト検出アルゴリズムに重大な課題を提起する。我々は、ディープ・スペクトル・サリエンシ・ネットワーク(DSSN)と呼ばれるHRSI-SODの革新的で効率的なベースラインモデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:12:42 GMT)
A Framework for Robust Cognitive Evaluation of LLMs [13.8]
大規模言語モデル(LLM)の創発的認知能力は広く観察されているが、その性質と基盤メカニズムはいまだによく分かっていない。我々は,LLMの認知能力を体系的に評価するフレームワークであるCognitivEvalを開発した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:35:54 GMT)
FIND: Fine-grained Information Density Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis [13.8]
FIND(textbfFine-fine textbfInformation textbfDensity Guided Adaptive RAG)は、疾患診断シナリオにおけるRAGの信頼性を向上させる新しいフレームワークである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:07:07 GMT)
Temporal Gaussian Copula For Clinical Multivariate Time Series Data Imputation [13.8]
時間的ガウスコプラモデル (TGC) を3次MTS計算のために提案する。我々は、データ管理におけるロバスト性を改善するために、期待最大化(EM)アルゴリズムを用いる。我々のTGCモデルでは,テストデータセットの欠落率に強いロバスト性を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:44:05 GMT)
MaRI: Material Retrieval Integration across Domains [13.7]
既存の手法は、形状不変および光に照らされた材料表現をキャプチャするデータセットに依存している。合成材料と実世界の材料間の特徴空間ギャップを橋渡しするフレームワークであるMaRIを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:30:21 GMT)
A universal approximation theorem for nonlinear resistive networks [13.6]
レジストレータネットワークは、機械学習のためのアナログコンピューティングプラットフォームとして研究されている。電圧源, 線形抵抗器, ダイオード, 電圧制御電圧源からなる回路網は, 連続関数を任意の精度で近似できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:42:39 GMT)
MultiNeRF: Multiple Watermark Embedding for Neural Radiance Fields [13.6]
MultiNeRFは、単一ニューラルネットワークフィールド(NeRF)モデルでレンダリングされた画像に、複数のユニークなキー付き透かしを埋め込む。提案手法は,既存の形状と外観のグリッドと並行して専用の透かしグリッドを組み込むことにより,天相RF NeRFモデルを拡張した。入力識別子に基づいて動的に透かしを活性化するFiLMベースの条件変調機構を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:06:04 GMT)
Multi-marginal Schrödinger Bridges with Iterative Reference Refinement [13.5]
実践者は、しばしば複数の時点のサンプルスナップショットを用いて、観測されていない人口軌道を推測することを目的としている。複数の時間点にわたるサンプルスナップショットから観測されていない軌跡を学習する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:49:52 GMT)
Distillation Improves Visual Place Recognition for Low Quality Images [13.4]
リアルタイムの視覚的ローカライゼーションはしばしばオンラインコンピューティングを利用しており、クエリ画像やビデオは視覚的位置認識(VPR)のためにリモートサーバに送信される。限られたネットワーク帯域幅は、画像品質の低下と、大域的な画像記述子の劣化を必要とし、VPRの精度を低下させる。本稿では,高品質な画像から特徴表現を学習し,低品質な画像からより識別性の高い記述子を抽出する知識蒸留手法を用いて,記述子抽出レベルでこの問題に対処する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:47:09 GMT)
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step [13.2]
VideoSceneは、ビデオ拡散モデルを蒸留して、ワンステップで3Dシーンを生成する。 VideoSceneは従来のビデオ拡散モデルよりも高速で優れた3Dシーン生成結果が得られる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:07:13 GMT)
Learning Phase Distortion with Selective State Space Models for Video Turbulence Mitigation [13.1]
大気の乱流は、長距離イメージングシステムにおける画像劣化の主な原因である。多くの深層学習に基づく乱流緩和法 (TM) が提案されているが, それらは遅い, メモリ不足であり, 一般化が不十分である。本稿では,(1)選択状態空間モデル(MambaTM)に基づく乱流緩和ネットワークと(2)学習遅延位相歪み(LPD)の2つの概念に基づく新しいTM法を提案する。提案手法は,様々な合成および実世界のTMベンチマークにおいて,推定速度が大幅に向上した現状のネットワークを超越した手法である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:33:18 GMT)
LexPam: Legal Procedure Awareness-Guided Mathematical Reasoning [12.9]
既存の法的LLMは一般的な司法質問応答を行うことができるが、それらの数学的推論能力は訓練されていない。現在、法的文脈におけるLLMの推論能力の検証と強化を支援する法的数学的推論データセットが欠如している。我々は、LexPamという、法的手続き的認知によって導かれる強化学習アルゴリズムを導入し、法的シナリオにおける数学的推論能力を向上させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:54:53 GMT)
In-situ three-dimensional strain engineering of solid-state quantum emitters in photonic structures towards scalable quantum networks [12.9]
我々は,ポリジメチルシロキサン(PDMS)スタンプをベースとした低温対応型ひずみ工学プラットフォームを開発した。フォトニックナノ構造に埋め込まれた量子ドットに対して、その場で3次元ひずみ制御が達成される。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:00:25 GMT)
Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking [12.7]
本稿では,最小限の微調整で精度を保ちながら予測自由な動的スペーシフィケーション手法を提案する。本稿では、キャッシュの状態とアクティベーションの規模を考慮し、キャッシュヒット率をさらに向上させる新しいキャッシュ対応マスキング戦略について述べる。 DIPは46%のメモリ削減と40%のスループット向上を実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:28:51 GMT)
Utility Theory of Synthetic Data Generation [12.5]
本稿では,統計的学習フレームワークにおける実用理論の確立により,実践と理論のギャップを埋める。合成データに基づいてトレーニングされたモデルの一般化とランキングの2つのユーティリティメトリクスを考慮に入れている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:24:10 GMT)
DEFOM-Stereo: Depth Foundation Model Based Stereo Matching [12.2]
DEFOM-Stereoはモノクローナルディープキューとの堅牢なステレオマッチングを容易にするために構築されている。 SOTA法と比較してより強いゼロショットの一般化があることが確認された。我々のモデルは、個々のベンチマークにおいて、以前のモデルより同時に優れています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:15:43 GMT)
Multi-Mission Tool Bench: Assessing the Robustness of LLM based Agents through Related and Dynamic Missions [12.2]
大規模言語モデル(LLM)は、高度な理解と計画能力のため、ツール呼び出しのエージェントとして強力な可能性を示している。ベンチマークでは、各テストケースは複数の相互関連ミッションから構成される。また,エージェント決定の精度と効率を動的決定木を用いて評価する手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:21:33 GMT)
Pixel-level and Semantic-level Adjustable Super-resolution: A Dual-LoRA Approach [12.1]
本稿では,2つの LoRA モジュールを事前訓練した安定拡散(SD)モデルで学習し,改良および調整可能な SR 結果を実現する PiSA-SR を提案する。デフォルト設定では、PiSA-SRは単一の拡散ステップで実行でき、実際のSRをリードすることで、品質と効率の両方を達成できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:58:27 GMT)
X-Capture: An Open-Source Portable Device for Multi-Sensory Learning [11.6]
我々は,X-Captureを紹介した。X-Captureは,実世界のマルチセンサーデータ収集のための,オープンソースでポータブルで費用対効果の高いデバイスである。 1000ドル以下のビルドコストで、X-Captureはマルチセンサーデータセットの作成を民主化する。 X-Captureは、AIにおける人間のような感覚表現の進化の基礎を成している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:44:25 GMT)
ReuseDroid: A VLM-empowered Android UI Test Migrator Boosted by Active Feedback [11.6]
本稿では,大規模視覚言語モデル(VLM)によるGUIテストマイグレーションのための新しいマルチエージェントフレームワークであるREUSEDROIDを提案する。 REUSEDROIDの洞察は、同じアプリ間で共有されるコアロジックのみに基づいて、テストを移行することである。テストマイグレーションデータセットであるLinPro上でREUSEDROIDを評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:45:09 GMT)
Challenges and Trends in Egocentric Vision: A Survey [11.6]
エゴセントリックな視覚は、人間の体に装着されたカメラやセンサーを通して、視覚的およびマルチモーダルなデータをキャプチャする。本稿では,自我中心の視覚理解に関する研究を包括的に調査する。最新の進歩を要約することで、拡張現実、バーチャルリアリティ、エンボディドインテリジェンスといった分野において、エゴセントリックなビジョン技術の幅広い応用が期待できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:06:35 GMT)
Interference trapping of populations in a semi-infinite coupled-resonator waveguide [11.5]
1D結合共振器アレイ(CRA)に局所結合した2レベルエミッタ(2LE)のエネルギー構造とダイナミクスについて検討する。単一励起部分空間のエネルギースペクトルは、散乱状態を持つ連続バンド、境界状態を持つ離散レベル、および境界状態の数の変化を特徴とする量子相転移を特徴とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:45:42 GMT)
Task as Context Prompting for Accurate Medical Symptom Coding Using Large Language Models [11.5]
Task as Context (TACO) Promptingは、タスク固有のコンテキストをプロンプトに埋め込むことで、タスクの抽出とリンクを統一する新しいフレームワークである。また,Vacine Adverse Event Reporting System (VAERS) レポートから得られた人間による注釈付きデータセットであるSYMPCODERについても紹介した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:57:17 GMT)
A Survey and Evaluation of Adversarial Attacks for Object Detection [11.5]
深層学習モデルは、信頼できるが誤った予測をすることを欺くような敵対的な例に対して脆弱である。この脆弱性は、自動運転車、セキュリティ監視、安全クリティカルな検査システムなどの高リスクなアプリケーションに重大なリスクをもたらす。本稿では,対象検出アーキテクチャに特有の敵攻撃を分類するための新しい分類枠組みを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:40:36 GMT)
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models [11.5]
ステートスペースモデル(SSM)は、一貫したメモリ使用量と高性能のため、トランスフォーマーの魅力的な代替品として浮上している。これを解決するために、ビット幅の少ないデータフォーマットでSSMを定量化することで、モデルのサイズを減らし、ハードウェアアクセラレーションの恩恵を受けることができる。 We present Quamba2, compatible with W8A8, W4A8, W4A16 for both Mamba1 and Mamba2 backbones。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:04:19 GMT)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.4]
大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。 LLMは現実世界の会話クエリの複雑さを無視することが多い。 LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:13:30 GMT)
You Think, You ACT: The New Task of Arbitrary Text to Motion Generation [11.3]
本稿では,制限されたアクションテキストを任意のテキストに拡張する。明示的なアクションラベルのないシーンテキストは、複雑で多様な産業におけるモデルの実用性を高めることができる。任意のテキストからアクション命令を抽出し,その後に動作を生成する,シンプルで効果的なフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:30:59 GMT)
Impact of helium ion irradiation on the thermal properties of superconducting nanowire single-photon detectors [11.3]
NbN SNSPDの熱特性に及ぼすHeイオン照射の影響について検討した。本研究は,SNSPDのポストプロセッシング技術として,イオン照射の意義について考察した。この研究はまた、超伝導薄膜におけるSNSPD物理と欠陥工学の理解を深めている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:54:30 GMT)
Emotion Recognition Using Convolutional Neural Networks [11.2]
我々は、ディープラーニングを用いて静止画像とリアルタイムビデオの両方に感情認識を適用することができる感情認識システムを開発した。提案システムは2つの異なるデータセットでテストされ、80%以上の精度を達成した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:08:32 GMT)
Measuring Large Language Models Capacity to Annotate Journalistic Sourcing [11.2]
本稿では,ニュース記事のソーシングの特定と注釈付けにおいて,大規模言語モデルを評価するシナリオについて述べる。我々の精度は、LLMベースのアプローチが、ストーリー内のすべてのソースステートメントを識別し、ソースのタイプを等しく一致させることで、より捕えられることを示唆している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:54:12 GMT)
Dynamic Assortment Selection and Pricing with Censored Preference Feedback [11.0]
本稿では,テキストセンタ型マルチノミアルロジット(C-MNL)選択モデルに基づく新しいフレームワークを提案する。売り手は価格で一連の商品を提示し、買い手は価格より高い価格で商品をフィルタリングし、残りの選択肢から少なくとも1つの商品を購入する。我々のアルゴリズムは $tildeO(dfrac32sqrtT/kappa)$ と $tildeO(d2sqrtT/kappa) の残差を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:56:08 GMT)
Refining CLIP's Spatial Awareness: A Visual-Centric Perspective [10.9]
コントラスト言語-画像事前学習は、言語とのグローバルな整合性が優れているが、空間情報に対する感度は限られている。最近のアプローチでは、高密度マルチモーダルタスクにおけるCLIPの性能を高めるために、Rerea-Language Alignmentを導入している。本稿では,CLIP固有の空間構造を保存し,上記の劣化を緩和する空間相関蒸留(SCD)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:04:56 GMT)
Adapting World Models with Latent-State Dynamics Residuals [10.9]
ReDRAWは、シミュレーションで事前訓練され、ターゲット環境に調整された潜在状態自己回帰世界モデルである。これにより、RLエージェントを、修正された動的条件の下で想像上のロールアウトで最適化し、現実世界にデプロイすることが可能になる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:41:30 GMT)
All-day Depth Completion via Thermal-LiDAR Fusion [10.9]
種々の照明条件における熱-LiDAR深度補完の実現可能性と堅牢性について検討した。深度境界の明瞭度を高めるために,Contrastive Learning と Pseudo-Supervision (COPS) を利用するフレームワークを提案する。また,この課題の理解と今後の研究を促進するために,熱-LiDAR深度完了における重要な課題を詳細に分析する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:45:03 GMT)
A Bayesian account of pronoun and neopronoun acquisition [10.8]
代名詞選択における個人差を明示的にモデル化することについて議論する。ネストした中華レストラン・フランチャイズ・プロセスに基づく確率的グラフィカル・モデリング手法を提案する。このようなモデルが,代名詞や名前を記号的知識に迅速に組み込む方法の多様性を説明できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:49:08 GMT)
FLEXtime: Filterbank learning to explain time series [10.7]
時系列からの予測を説明する最先端の手法では、各ステップごとにインスタンスワイズ・サリエンシ・マスクを学習する。本稿では,信号分解に確立された信号処理手法に頼って,解釈可能な部分に対する時間系列説明可能性について,有意なマップとして考察する。具体的には、バンドパスフィルタのバンクを用いて時系列を周波数帯域に分割するFLEXtimeと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:04:46 GMT)
Do LLMs Consider Security? An Empirical Study on Responses to Programming Questions [10.7]
ChatGPTは、開発者にコンテキスト固有の情報をボランティアして、安全なコーディングプラクティスを促進する。我々は,3つのLLM(Claude 3, GPT-4, Llama 3)が示すセキュリティ意識の程度を評価する。私たちの調査によると、3つのモデルすべてが、脆弱性を正確に検知し、ユーザに警告するのに苦労しており、データセット全体の検出率は12.6%から40%に過ぎません。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:13:44 GMT)
Quantifiers and witnesses for the nonclassicality of measurements and of states [10.6]
量子論における任意の過程に適用可能な非古典性の統一的な概念を提案する。我々は、状態、測定、およびそれらのセットに固有の非古典性を特徴づけ、定量化するための証明書と手段を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:01:56 GMT)
Evaluating and Enhancing Segmentation Model Robustness with Metamorphic Testing [10.6]
SegRMTは、遺伝的アルゴリズムを利用して空間変換とスペクトル変換のシーケンスを最適化するテスト手法である。実験の結果、SegRMTはDeepLabV3のmIoU(Intersection over Union)を6.4%に削減した。敵の訓練に使用する場合、SegRMTはモデルのパフォーマンスを向上し、mIoUの改善を最大73%向上させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:15:45 GMT)
FlowKV: A Disaggregated Inference Framework with Low-Latency KV Cache Transfer and Load-Aware Scheduling [10.3]
Flow KVは非凝集型推論フレームワークである。これにより、KVキャッシュの平均伝送遅延を0.944sから0.053sに96%削減できる。これは、通常、計算の不均衡、極端な過負荷条件など、様々なシナリオでピークシステムのスループットを達成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:58:05 GMT)
Expertized Caption Auto-Enhancement for Video-Text Retrieval [10.3]
本稿では,自動字幕強調手法を提案する。本手法は完全にデータ駆動型であり,データ収集や計算処理の負荷を軽減できるだけでなく,自己適応性も向上する。 MSR-VTTでは68.5%,MSVDでは68.1%,DiDeMoでは62.0%,Top-1リコール精度は68.5%であった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:15:17 GMT)
Quantum singular value transformation without block encodings: Near-optimal complexity with minimal ancilla [10.2]
我々は量子特異値変換(QSVT)のための新しいアルゴリズムを開発した。この結果は量子アルゴリズムの新しいフレームワークを提供し、ほぼ最適性能を維持しながらハードウェアのオーバーヘッドを低減させる。応用として,量子線形系と基底状態特性推定のためのエンドツーエンド量子アルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:24:15 GMT)
R+X: Retrieval and Execution from Everyday Human Videos [10.2]
R+Xは、ロボットが日々の仕事をしている人間の、長く、ひそかで、一人称的なビデオからスキルを学ぶことができるフレームワークである。人間から言語コマンドが与えられた後、R+Xはまず、関連する振る舞いを含む短いビデオクリップを検索し、テキスト内模倣学習法を条件付けしてそのスキルを実行する。実験の結果、R+Xは人間の動画をロバストなロボットのスキルに翻訳することに成功し、R+Xはいくつかの方法よりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:12:23 GMT)
Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.1]
我々は、企業が商品をT$シーケンシャルに販売するコンテキスト動的価格問題について研究する。まず、最適な後悔は対数的因子の次数$sqrtdT$であることを示す。我々の研究は、複雑なプライバシー制約の下で動的価格に拡張され、公開データを活用することにより、プライバシーとユーティリティのトレードオフが改善されます。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:03:05 GMT)
Zero-Shot Image Restoration Using Few-Step Guidance of Consistency Models (and Beyond) [10.0]
そこで本研究では,CMを用いたゼロショット復元方式を提案する。画像の超解像, 劣化, 塗装に対するアプローチの利点を実証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:29:24 GMT)
A Framework for Developing University Policies on Generative AI Governance: A Cross-national Comparative Study [10.0]
本研究は,米国,日本,中国の主要大学の比較分析を行った。ジェネレーティブ・人工知能(GAI)の応用とガバナンスに関する制度全体にわたる政策について検討する。理論的な洞察と実践的なガイダンスを提供するため, GAI のための大学政策開発フレームワーク (UPDF-GAI) を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:33:35 GMT)
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance [9.9]
本稿では,DreamActor-M1 を用いた拡散トランスフォーマ (DiT) ベースのフレームワークを提案する。動作誘導のために、暗黙の表情、3次元頭部球体、および3次元体骨格を統合したハイブリッド制御信号は、表情と身体運動の堅牢な制御を実現する。実験により,本手法は,肖像画,上半身,全体生成の表現的結果を提示し,最先端の成果よりも優れることが示された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:51:10 GMT)
Improving Efficiency in Federated Learning with Optimized Homomorphic Encryption [9.8]
フェデレーション・ラーニング(Federated Learning)とは、機械学習において、複数のデバイスがプライベートデータを共有せずにモデル上で連携できるようにする手法である。 FLにおけるプライバシの鍵となるのは、暗号化データ上で直接計算を行うことができるホモモルフィック暗号化(HE)である。私の研究は、堅牢なプライバシー保証を維持しながら、これらの非効率性に対処する新しいアルゴリズムを紹介します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:50:07 GMT)
STOOD-X methodology: using statistical nonparametric test for OOD Detection Large-Scale datasets enhanced with explainability [9.7]
アウト・オブ・ディストリビューション(OOD)検出は、特にモデル障害が深刻な結果をもたらすような、安全性に敏感なアプリケーションにおいて、マシンラーニングにおいて重要なタスクである。 STOOD-Xは,OOD検出のための統計的非パラメトリックテストとeXplainabilityの強化を組み合わせた2段階の手法である。最初の段階では、STOOD-Xは特徴空間距離とWilcoxon-Mann-Whitneyテストを使用して、特定の特徴分布を仮定せずにOODサンプルを同定する。第2段階では、BLUEと整合して、各決定を駆動する特徴を明らかにする、ユーザフレンドリーなコンセプトベースの視覚的説明を生成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:26:03 GMT)
Robust Unsupervised Domain Adaptation for 3D Point Cloud Segmentation Under Source Adversarial Attacks [9.6]
非教師なしドメイン適応(UDA)フレームワークは、クリーンデータ上での3Dポイントクラウドセマンティックセグメンテーションモデルの優れた一般化機能を示している。本研究では, 点雲面に小さな摂動しか持たないデータセットを著しく汚染できるステルス対向点雲発生攻撃を提案する。生成されたデータにより、我々はさらに対策としてAdversarial Adaptation Framework(AAF)を開発する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:58:42 GMT)
A User-Tunable Machine Learning Framework for Step-Wise Synthesis Planning [9.5]
MHNpathは、コンピュータ支援合成計画のための機械学習駆動の逆合成ツールである。我々は、ChemByDesignの複雑な分子を含むケーススタディを通じて、その効果を実証する。ケーススタディでは, グリーン溶媒を用いたより短く, 安価で, 温暖な経路を生成できることが判明した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:23:21 GMT)
Robust entangled photon generation by Floquet-engineered two-colour pulses [9.5]
共鳴2光子励起によって駆動される量子エミッタは、決定論的に生成される絡み合った光子対の主源である。ここでは、ロバスト性を大幅に向上し、レーザフィルタリングの要求を低減したバイエクシトン調製方式をいかに特定できるかを示す。バイオエクシトン占有率は96%を超え、93.4%の忠実度で光子対の絡み合いを保っている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:45:33 GMT)
Cooperative Inference for Real-Time 3D Human Pose Estimation in Multi-Device Edge Networks [9.4]
本研究では,モバイルエッジコンピューティングネットワークにおけるリアルタイムな3次元ポーズ推定のための新しい協調推論手法を提案する。本稿では,提案手法の性能を,推定精度とエンドツーエンド遅延の観点から数値解析する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:58:29 GMT)
MonoGS++: Fast and Accurate Monocular RGB Gaussian SLAM [9.4]
高速かつ高精度なSLAM法であるMonoGS++を提案する。当社のアプローチでは,ハードウェア依存を低減し,RGB入力のみを必要としており,オンラインビジュアルオドメトリー(VO)を利用して,疎点雲をリアルタイムに生成する。提案手法は,従来のMonoGSに比べて,毎秒5.57倍のフレーム(fps)向上を実現した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:51:51 GMT)
Detecting Plant VOC Traces Using Indoor Air Quality Sensors [9.2]
植物は、病原体、捕食者、光、温度などの非生物的・生物的ストレス因子に曝されると、テルペン(VOCの一種)を産生する。制御された実験で16テルペンを測定して、これらのセンサーの感度を定量化し、現実的な環境で最も有望なテルペンを特定し、テストした。本研究は, 植物VOC検出の課題を克服する基盤を確立し, 将来のスマートビルにおける室内環境の質を高めるため, 先進的プラントベースセンサーの活用を図った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:18:35 GMT)
UNDO: Understanding Distillation as Optimization [9.1]
UNDO: Understanding Distillation as Optimization frameworkを紹介します。各イテレーションは、生徒の学習不足を直接対象とし、教師に調整された強化された合理性を提供する動機を与える。様々な数学的・常識的推論タスクに関する実証的な評価は、我々の反復蒸留法UNDOが標準の1段階蒸留法を大幅に上回っていることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:18:51 GMT)
Observation of Quantum Darwinism and the Origin of Classicality with Superconducting Circuits [9.1]
自然に量子世界から日々の古典的な観察を合理化するにはどうすればいいのか? 量子ダーウィン主義は古典主義の出現を説明する魅力的な枠組みを提供する。我々は、古典性と量子相互情報の飽和をサポートする高度に構造化された分岐量子状態を観察した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:21:40 GMT)
Noise-Agnostic Quantum Error Mitigation with Data Augmented Neural Models [9.0]
我々は、ノイズを事前に知ることなく、ノイズのないデータをトレーニングすることなく、量子誤差軽減を実現するニューラルネットワークを構築した。我々のアプローチは、量子回路や、多体・連続変数量子系の力学に適用される。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:30:14 GMT)
Brightness Perceiving for Recursive Low-Light Image Enhancement [8.9]
本稿では,高ダイナミックレンジ低照度画像強調のための輝度知覚に基づくフレームワークを提案する。アダプティブ・コントラストとテクスチャ・エンハンスメント・ネットワーク(ACT-Net)とブライトネス・パーセプション・ネットワーク(BP-Net)の2つの並列サブネットワークで構成されている。提案手法は,既存の11種類の代表法と比較し,参照基準と参照基準を含まない新しいSOTA性能を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:53:33 GMT)
Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study [8.8]
ダウンストリーム性能を著しく低下させるタスク特化命令の文字・単語レベルの編集について検討した。平均的に、自己否定は、代替戦略よりも大幅に高いパフォーマンス向上を達成することが分かっています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:17:56 GMT)
A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model [8.7]
ベイズ非パラメトリックIRTの最近の進歩とプロセス時系列法を組み合わせて、縦断観測から潜在形質の動的構造を捉える。一般化された動的ガウス過程アイテム応答理論(GD-GPIRT)とマルコフ連鎖モンテカルロサンプリングアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:37:26 GMT)
Spline-based Transformers [8.7]
スプラインベースのトランスフォーマーは、要素の入力シーケンスをスムーズな軌道として潜時空間に埋め込む。従来の位置符号化と比較して,提案手法の優れた性能を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:42:07 GMT)
Noise Calibration and Spatial-Frequency Interactive Network for STEM Image Enhancement [8.5]
本稿では,STEM画像のノイズキャリブレーション,データ合成,拡張手法について述べる。まず,よりリアルなSTEM画像の合成に用いるSTEMノイズキャリブレーション法を提案する。次に、これらのパラメータを用いて、通常の原子配列とランダムな原子配列の両方を考慮したより一般的なデータセットを開発する。最後に,STEM画像強調のための空間周波数対話型ネットワークを設計し,原子配列の周期性によって形成される周波数領域の情報を探索する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:11:57 GMT)
MinkOcc: Towards real-time label-efficient semantic occupancy prediction [8.2]
MinkOccはカメラとLiDARのためのマルチモーダルな3Dセマンティック占有予測フレームワークである。競争精度を維持しつつ、手動ラベリングへの依存を90%削減する。我々は、MinkOccをキュレートされたデータセットを超えて拡張することを目指しており、自動運転における3Dセマンティック占有率予測のより広範な現実的な展開を可能にしている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:31:56 GMT)
The Overcooked Generalisation Challenge [8.1]
我々はOGC(Overcooked Generalisation Challenge)を紹介する。これは、新しいパートナーやOvercooked-AI環境のレベルに直面するエージェントのゼロショット協調能力を研究する最初のベンチマークである。我々は,Overcookedにおける汎用エージェントを訓練するための自動カリキュラムを生成するために,最先端のデュアルカリキュラム設計(DCD)手法を併用したインタフェースを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:32:15 GMT)
Cognitive Memory in Large Language Models [8.1]
本稿では,Large Language Models (LLMs) における記憶機構について検討し,文脈に富む応答の重要性,幻覚の減少,効率の向上などを強調した。メモリは、インプットプロンプト、短期記憶処理の即時コンテキスト、外部データベースや構造を介して実装された長期記憶に対応して、インプットプロンプト、短期記憶、長期記憶に分類する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:58:19 GMT)
Boosting End-to-End Database Isolation Checking via Mini-Transactions (Extended Version) [7.9]
ミニトランザクション(MT)は、一般的なワークロードよりもはるかに高速に実行されるコンパクトで短いトランザクションである。線形時間および二次時間における強い孤立度を検証するための高効率なアルゴリズムを開発した。 MTCと呼ばれるツールに検証アルゴリズムとMTワークロードジェネレータを実装した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:26:00 GMT)
How I Warped Your Noise: a Temporally-Correlated Noise Prior for Diffusion Models [7.9]
ノイズサンプル列における時間的相関を保存するための新しい手法を提案する。 $int$-noise(積分ノイズ)は、個々のノイズサンプルを連続的に統合されたノイズフィールドとして再解釈する。 $int$-noiseは、ビデオ復元、サロゲートレンダリング、条件付きビデオ生成など、さまざまなタスクに使用できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:49:56 GMT)
Decidabilities of local unitary equivalence for entanglement witnesses and states [7.8]
2つの状態が局所的ユニタリ(LU)演算で等価かどうかを検討する。我々は、LU決定可能性の観点から、エルミート作用素の集合間の関係を導入する。 2つのプロジェクタに対して、部分的なSLU同値は全体の同値性を保証することができないことを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:05:53 GMT)
Learning quantum Gibbs states locally and efficiently [7.7]
熱平衡における量子多体系の基礎となるハミルトニアンの学習は、量子学習理論と実験科学の基本的な課題である。我々は, 局所項である$n$-qubit $D$-dimensional Hamiltonian を, サンプル複雑性を伴う加法誤差$epsilon$ に学習する学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:42:23 GMT)
6DOPE-GS: Online 6D Object Pose Estimation using Gaussian Splatting [7.7]
1台のRGB-Dカメラで6Dオブジェクトのポーズを推定・追跡する新しい手法である6DOPE-GSを提案する。その結果,6DOPE-GSはモデルレス同時ポーズトラッキングと再構築のための最先端ベースラインの性能と一致していることがわかった。また,実世界の環境下での動的物体追跡と再構成のための手法の適合性を実証した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:25:40 GMT)
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets [7.7]
我々は、ビデオとアクションデータの両方を政策学習に活用できるフレームワークUnified World Models (UWM)を提案する。各拡散時間ステップを単純に制御することで、UWMはポリシー、フォワードダイナミクス、逆ダイナミクス、ビデオジェネレータを柔軟に表現することができる。以上の結果から,UWMは大規模で異種なデータセットをスケーラブルなロボット学習に活用する上で,有望なステップとなることが示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:38:59 GMT)
MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs [7.6]
MultiBLiMP 1.0は言語的最小ペアの多言語ベンチマークである。 101の言語と6つの言語現象をカバーし、125,000以上の最小のペアを含んでいる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:05:50 GMT)
HyperRAG: Enhancing Quality-Efficiency Tradeoffs in Retrieval-Augmented Generation with Reranker KV-Cache Reuse [7.5]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の性能向上のための強力なパラダイムとして登場した。 RAGパイプラインの品質と効率のトレードオフを最適化するシステムであるHyperRAGを提案する。我々は、HyperRAGがデコーダのみのリランカで2～3倍のスループット向上を実現し、従来のRAGサービスと比較して下流のパフォーマンス向上を実現していることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:08:42 GMT)
Explanation Space: A New Perspective into Time Series Interpretability [7.5]
本稿では,時間領域で訓練されたモデルを他の説明空間で解釈できる簡易かつ効果的な手法を提案する。トレーニングされたモデルやXAIメソッドを変更することなく,既存のプラットフォームに容易に統合できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:21:19 GMT)
SelfMedHPM: Self Pre-training With Hard Patches Mining Masked Autoencoders For Medical Image Segmentation [7.4]
我々は、CT多臓器分割タスク(selfMedHPM)のためのマスク付きオートエンコーダをハードパッチマイニングするMIM自己学習フレームワークを提案する。目標データのトレーニングセットに基づいてViT自己調整を行い、まずパッチ損失を予測し、次のマスクの位置を決定する補助損失予測器を導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:28:21 GMT)
RANGE: Retrieval Augmented Neural Fields for Multi-Resolution Geo-Embeddings [7.4]
RANGEと呼ばれる新しい検索戦略を提案する。本手法は,複数の類似した位置の視覚的特徴を組み合わせることで,位置の視覚的特徴を推定できるという直感に基づいて構築する。その結果、RANGEは既存の最先端モデルよりも優れており、多くのタスクにおいてかなりの差があることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:20:24 GMT)
Fingerprinting Implementations of Cryptographic Primitives and Protocols that Use Post-Quantum Algorithms [7.4]
我々はキー交換とデジタル署名プリミティブを解析し,フィンガープリント後量子(PQ)アルゴリズムの実現可能性を評価する。プロトコルレベルの分析では、PQキー交換の存在とタイプを検出することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:27:35 GMT)
CornerPoint3D: Look at the Nearest Corner Instead of the Center [7.3]
3Dオブジェクト検出は、LiDAR点雲から物体の中心、寸法、回転を予測することを目的としている。 LiDARはオブジェクトの近辺のみを捕捉し、センターベースの検出器はクロスドメインタスクのローカライズ精度が低い。本研究では、CenterPoint上に構築され、ヒートマップを用いて各物体の最も近い角の学習と検出を監督する新しい3Dオブジェクト検出器CornerPoint3Dを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:33:43 GMT)
A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery [7.2]
白黒のアナログ写真は、現代の物体検出フレームワークにおいて大きな課題を呈している。本研究では、デオルドフィケーションを用いた画像カラー化と、Real-ESRGANによる超高解像度化という、GAN(Generative Adrial Networks)に基づく2段階画像強調パイプラインを提案する。その結果, カラー化と超高分解能の組み合わせにより検出性能が著しく向上し, YOLOv11nは平均平均精度(mAP)が85%を超えることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:53:48 GMT)
LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems [7.2]
フェルミ問題(Fermi Problems、FP)は、人間のような論理と数値推論を必要とする数学的推論タスクである。 AIの進歩にもかかわらず、FPはいまだにあまり探索されていない。本研究は,大規模言語モデル(LLM)のFP解決能力と限界を明らかにするための探索的研究である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:13:36 GMT)
Derivation of the Landau-Zener formula via functional equations [7.2]
関数方程式による基本的異なるアプローチを用いたランダウ・ツェナー遷移確率の導出について述べる。我々の研究は、ランダウ・ツェナー転移確率の指数形式の起源に関する新たな知見を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:40:25 GMT)
Perturbative Variational Quantum Eigensolver based on Reduced Density Matrix Method [7.1]
摂動変動型量子固有解法(PT-VQE)を提案する。 PT-VQEは標準的なVQEよりも優れ、化学的精度が向上する。この方法は、大規模システムの正確な量子シミュレーションのために、資源効率が高く実践的なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:20:20 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0]
Out-of-Distribution (OOD) 検出は安全なデプロイメントに不可欠である。ニューラル・コラプス現象に触発されて,我々は多目的かつ効率的なOOD検出法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:16:58 GMT)
Disentanglement in Difference: Directly Learning Semantically Disentangled Representations by Maximizing Inter-Factor Differences [7.0]
差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差 dSpritesと3DShapesデータセットの実験結果は、提案したDiDが既存の主流メソッドよりも優れていることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:28:18 GMT)
Movement-Prediction-Adjusted Naïve Forecast [6.9]
本研究は,重み付けされた動き予測項を付加した,移動予測の原型である移動予測(動き予測)を提案する。方向精度が向上するにつれて、調整された「Na」予測の誤差が減少する。この結果から, 運動予測調整Na" 予測は, 対称ランダムウォーク特性を持つ時系列に対して, 新たな最適点予測となる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:44:51 GMT)
Prevalidated ridge regression is a highly-efficient drop-in replacement for logistic regression for high-dimensional data [6.7]
分類誤差やログロスの点から,ロジスティック回帰と一致する有意なリッジ回帰モデルを提案する。モデルの係数をスケールし、予測値のセットのログロスを最小限に抑える。これは、隆起回帰モデルに適合する過程で既に計算された量を利用して、名目追加の計算コストでスケーリングパラメータを見つける。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:27:35 GMT)
Convolution-Based Converter : A Weak-Prior Approach For Modeling Stochastic Processes Based On Conditional Density Estimation [6.6]
畳み込み型変換器 (CBC) は, 目標の確率を推定する上で, 強い, 固定された事前を除去する手法を開発するために提案される。 CBCは、強い、または固定された前もって目標の条件付き確率を暗黙的に推定する。我々の手法は、既存の基準線を複数の指標で上回る。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:41:46 GMT)
CAD: Confidence-Aware Adaptive Displacement for Semi-Supervised Medical Image Segmentation [6.6]
半教師付き医療画像セグメンテーションは、最小限の専門家アノテーションを活用することを目的としている。本稿では,信頼度の高い最大の低信頼領域を高信頼パッチで選択的に識別し,置き換えるフレームワークである自信認識適応変位(CAD)を紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:08:03 GMT)
A Survey of Large Language Models in Mental Health Disorder Detection on Social Media [6.5]
本稿では,ソーシャルメディア上でのメンタルヘルス問題検出におけるLarge Language Models(LLMs)の可能性を検討することを目的とする。本論文は、うつ病や不安などの最も一般的な精神疾患に焦点を当て、また精神障害や外因性障害も取り入れている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:43:14 GMT)
HATFormer: Historic Handwritten Arabic Text Recognition with Transformers [6.4]
アラビア文字のデータセットは英語に比べて小さく、一般化可能なアラビアHTRモデルを訓練することは困難である。本稿では,HATFormerを提案する。HATFormerはトランスフォーマーをベースとしたエンコーダデコーダアーキテクチャで,最先端のHTRモデルに基づいている。我々の研究は、複雑な言語固有の課題を持つ低リソース言語に英語のHTRメソッドを適用する可能性を示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:56:58 GMT)
Bitcoin: A Non-Continuous Time System [6.3]
私たちは、Bitcoinの時間的不連続に寄与する3つの中核的な側面に焦点を当てています。これらの要素が組み合わさってBitcoinの時間構造を作り、従来の計算や物理学で見られる連続的な時間システムとは根本的に異なる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:18:19 GMT)
PromptMap: An Alternative Interaction Style for AI-Based Image Generation [6.2]
PromptMapは、ユーザーが膨大な合成プロンプトを探索できるテキスト・ツー・イメージAIのための新しいインタラクションスタイルである。 PromptMapは、セマンティックな類似性によって視覚的にイメージをグループ化し、ユーザーは関連するサンプルを見つけることができる。本研究は,ユーザに対して,良好な画像出力の実現を促すことによって,使い慣れないインタラクションスタイルを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:27:56 GMT)
DRTR: Distance-Aware Graph Representation Learning [6.2]
距離対応マルチホップメッセージパッシングと動的トポロジ改善を統合した新しいグラフ学習フレームワークである textbfDRTR を提案する。 emphDistance Recomputatorはアダプティブアテンションを使用して意味的に弱いエッジをプーンし、emphTopology Reconstructorは、遠いが関連するノード間の潜時接続を確立する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:37:56 GMT)
Quantum Lipschitz Bandits [6.2]
リプシッツ・バンディットは、期待される報酬関数がリプシッツ条件を満たすバンディット問題の重要な変種である。連続的な行動空間と非線形報酬関数の課題に対処するために、最初の量子リプシッツバンディットアルゴリズムを導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:39:04 GMT)
Detecting and removing bloated dependencies in CommonJS packages [6.1]
サーバサイドJavaScriptアプリケーションにおける肥大した依存関係を調査するための最初の研究について述べる。そこで我々は,OSファイルシステムをモニタし,実行中にどの依存関係にアクセスできないかを決定するトレースベースの動的解析手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:50:06 GMT)
Secure Generalization through Stochastic Bidirectional Parameter Updates Using Dual-Gradient Mechanism [6.0]
フェデレーテッド・ラーニング(FL)は、分散クライアントにおけるプライバシー保護による協調トレーニングによって注目を集めている。近年の研究では、FLフレームワーク内であっても、個人データを敵に公開するリスクが指摘されている。モデルパラメータをきめ細かいレベルで体系的に摂動することで,各クライアントに対して多様なモデルを生成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:06:57 GMT)
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement [5.9]
圧縮低照度画像を改善するために,HPGN(Hybrid priors-guided Network)を提案する。提案手法では、JPEG品質係数(QF)とDCT量子化行列(QM)をフル活用して、効率的なジョイントタスクプラグアンドプレイモジュールの設計を指導する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:06:24 GMT)
SemCAFE: When Named Entities make the Difference Assessing Web Source Reliability through Entity-level Analytics [5.9]
SemCAFEは、その評価にエンティティ関連性を組み込むことで、ニュースの信頼性を検出するように設計されたシステムである。各ニュース記事のセマンティック指紋を作成することで、SemCAFEは、2022年のロシアによるウクライナ侵攻に関する46,020件と3,407件の信頼できない記事の信頼性を評価することができた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:14:43 GMT)
Representation and Regression Problems in Neural Networks: Relaxation, Generalization, and Numerics [5.9]
浅層ニューラルネットワーク(NN)の訓練に伴う3つの非次元最適化問題に対処する。我々はこれらの問題と表現を凸化し、不在緩和ギャップを証明するために代表者勾配を適用した。我々はこれらの境界に対する鍵パラメータの影響を分析し、最適な選択を提案する。高次元データセットに対して,勾配降下と組み合わせて効率的な解を求めるスペーシフィケーションアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:29:53 GMT)
Explanations of Large Language Models Explain Language Representations in the Brain [5.8]
本稿では、言語処理と脳神経活動の関連性を高めるために、説明可能なAI(XAI)を用いた新しいアプローチを提案する。帰属法を適用することで,先行する単語が予測に与える影響を定量化する。より強い属性は、生物学的説明法を評価するために脳のアライメントを示唆している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:56:08 GMT)
ADO-LLM: Analog Design Bayesian Optimization with In-Context Learning of Large Language Models [5.6]
本稿では,大規模言語モデル(LLM)とベイジアン最適化を統合したアナログ設計最適化手法であるADO-LLMを提案する。 ADO-LLMは、LLMのドメイン知識を注入して実行可能な設計ポイントを迅速に生成し、高価値な設計領域を見つけるためのBOの非効率性を改善する能力を活用している。提案手法を2種類のアナログ回路上で評価し,設計効率と性能の顕著な向上を実証した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:40:58 GMT)
Reinforcement Learning for Solving the Pricing Problem in Column Generation: Applications to Vehicle Routing [5.6]
我々は強化学習(RL)を用いて、価格問題(PP)において最も負のコストの低い列を見つける。我々のモデルは、他のメカニズムの助けなしに価格問題を独立して解決するので、エンドツーエンドのメカニズムをデプロイします。提案手法は,100件の顧客を抱えるインスタンスに対して,非常に短い実行時間で,300倍以上の速度で,線形緩和を合理的な目標ギャップまで解くことができることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:22:19 GMT)
Transformer-based Multivariate Time Series Anomaly Localization [5.6]
時空間異常スコア(英: Space-Time Anomaly Score、STAS)は、変圧器の潜在表現と時空間統計モデルとの接続にインスパイアされた新しい計量である。統計的特徴異常スコア(SFAS)は、異常に関する統計的特徴を分析してSTASを補完し、それらの組み合わせは誤報を減らすのに役立つ。実世界の実験と合成データセットは、検出タスクとローカライゼーションタスクの両方において、最先端の手法よりもモデルの方が優れていることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:48:54 GMT)
GSR4B: Biomass Map Super-Resolution with Sentinel-1/2 Guidance [5.5]
我々は、この問題を、LRバイオマスマップを100ドルから10ドルまで高めることを目的としたガイド超解法(GSR)とみなした。衛星画像からの直接回帰に対して,超解像AGBマップとガイダンスの有無を比較した。以上の結果から,GSR フレームワークを大規模に正確な HR バイオマスマッピングに適用できる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:49:33 GMT)
Towards Green AI-Native Networks: Evaluation of Neural Circuit Policy for Estimating Energy Consumption of Base Stations [5.5]
無線ハードウェアとAIベースのネットワーク管理ソフトウェアの最適化は、無線アクセスネットワークにおいてかなりのエネルギー節約をもたらす。基盤となる機械学習(ML)モデルを実行するには、さらなる計算とエネルギが必要になる。本研究は, 基地局のエネルギー消費を推定するために, スパース構造化ニューラルサーキットポリシ(NCP)の新たな利用法を評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:22:39 GMT)
Page Classification for Print Imaging Pipeline [5.3]
我々は以前,テキストのみ,画像のみ,あるいはその両方を混合した画像の分類を行う,SVMベースの分類手法を考案した。本稿では,より高度なSVMに基づく分類手法を開発し,さらに4つの新機能を用いて5種類の画像の分類を行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:36:53 GMT)
ArtFormer: Controllable Generation of Diverse 3D Articulated Objects [5.3]
本稿では,3次元調音物体のモデリングと条件生成のための新しい枠組みを提案する。トークンのツリーとして記述されたオブジェクトをパラメータ化し、トランスフォーマーを用いてオブジェクトの高レベルな幾何コードとその運動的関係を生成する。提案手法により,高品質な形状と部品数の異なる多種多様なオブジェクトの生成が可能となる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:16:29 GMT)
Blockchain and Distributed Ledger Technologies for Cyberthreat Intelligence Sharing [5.3]
DLT(Distributed Ledger Technology)は、インテリジェンス共有を変革する可能性のある新興技術である。本稿では,情報共有の包括的理解と,その強化におけるDLTの役割について述べる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:38:42 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [5.2]
大規模言語モデル(LLM)は、コードに関連するタスクにおいて顕著な機能を示した。 LLMが多様なプログラムを理解し処理する能力を考えると、汎用的なサロゲートモデルを構築する上で有望な方向性を示す。 SURGEは、1160ドル(約1万1000円)の価格問題で、8ドル(約8万3000円)の鍵となる側面をカバーしたベンチマークです。オープンソースおよびプロプライエタリ LLM の実証分析を通じて,スケーリング法則,データ効率,予測精度を検討した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:54:20 GMT)
Implicit Neural Differential Model for Spatiotemporal Dynamics [5.2]
In-PiNDiffは、安定時間力学のための新しい暗黙の物理積分型ニューラル微分可能解法である。深い平衡モデルにインスパイアされたIm-PiNDiffは、暗黙の固定点層を用いて状態を前進させ、堅牢な長期シミュレーションを可能にする。 Im-PiNDiffは優れた予測性能、数値安定性の向上、メモリとコストの大幅な削減を実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:07:18 GMT)
A Memory-Augmented LLM-Driven Method for Autonomous Merging of 3D Printing Work Orders [5.2]
3Dプリンティングオーダーの効率の良いマージは、製造ラインの処理効率を大幅に向上させることができる。本稿では,大規模言語モデル(LLM)による作業順序の自律的統合について述べる。自己記憶学習戦略を取り入れることにより、自律的なオーダーマージのためのインテリジェントエージェントを構築することにより、オーダ割り当ての精度と精度が向上する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:50:29 GMT)
Noisy Annotations in Semantic Segmentation [5.1]
本研究は,各種モデルによるセグメンテーションマスクの品質について光を当てる。ラベルノイズによる学習に対処するために設計された一般的な手法の有効性に挑戦する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:32:09 GMT)
FT-Transformer: Resilient and Reliable Transformer with End-to-End Fault Tolerant Attention [5.0]
トランスフォーマーモデルは、依存関係をキャプチャするために自己保持機構を活用し、様々なアプリケーションで例外的なパフォーマンスを示す。既存のフォールトトレランス法は、切り離されたカーネルを使用して各操作を別々に保護し、かなりの計算とメモリオーバーヘッドを発生させる。本稿では、エンドツーエンドのフォールトトレラントな注意を組み込んだトランスフォーマーモデルのための新しいエラー耐性フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:05:08 GMT)
Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video Understanding in Novel Domains [4.9]
本研究では,(1)ステップ認識と(2)ビデオ質問応答の2つのタスクを含むベンチマークであるSpacewalk-18を紹介する。タンデムにおいて、この2つのタスクは、(1)新しいドメインに一般化すること、(2)長期の時間的文脈とマルチモーダル(視覚的・音声的)情報を活用すること、の2つのモデルの能力の定量化である。我々は,モデル微調整を伴わずに大幅な性能向上をもたらすような要約手法により,有望な適応を見いだす。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:40:28 GMT)
Route Recommendations for Traffic Management Under Learned Partial Driver Compliance [4.7]
本稿では,運転者の部分的コンプライアンスを明示的に学習し,現実的な順守の下での交通流を最適化する経路推薦フレームワークを提案する。提案手法は,ベースライン戦略に比べて旅行時間を著しく短縮する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:31:16 GMT)
Late Breaking Results: Breaking Symmetry- Unconventional Placement of Analog Circuits using Multi-Level Multi-Agent Reinforcement Learning [4.7]
アナログレイアウトの非従来的設計空間を探索する目的駆動型マルチレベルマルチエージェントQ-ラーニングフレームワークを提案する。提案手法は,最先端のレイアウト技術よりも優れたバラツキ性能を実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:44:34 GMT)
LLM Social Simulations Are a Promising Research Method [4.6]
大規模言語モデル(LLM)の社会シミュレーションは,5つの難題に対処することで実現可能であると論じる。 LLMの社会シミュレーションは、心理学、経済学、社会学、マーケティングのパイロット実験など、すでに探索的な研究に利用できると信じている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:01:26 GMT)
ESC: Erasing Space Concept for Knowledge Deletion [4.6]
我々は、両方の懸念を考慮し、適切な指標であるKR(Knowledge Retention score)を提供する高度なタスクであるKD(Knowledge Deletion)という新しい概念を紹介した。本研究では,その機能に係わるアクティベーションを排除して,知識を忘れるための重要な部分空間を制限する,Easing Space Concept (ESC) という新しい学習自由消去手法を提案する。各種データセットおよびモデルを用いた実験により,提案手法が高速かつ最先端の性能を実現することを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:53:09 GMT)
Wormhole Memory: A Rubik's Cube for Cross-Dialogue Retrieval [4.6]
本研究では,異なる対話間で任意に検索可能なルービックキューブとしてメモリを実現するワームホールメモリモジュール(WMM)を提案する。実験結果から,WMMは対話間のメモリ取得能力と定量的指標の安定性を示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:45:58 GMT)
Reducing Reasoning Costs: The Path of Optimization for Chain of Thought via Sparse Attention Mechanism [4.6]
この研究は、いくつかの関連するトークンにのみ焦点をあてるスパースアテンションメカニズムを使うことを提案する。この実験は、MIT OpenCourseWareの線形代数テスト問題の解法において、このモデルの推論時間、正当性スコア、思考長の連鎖とo1プレビューを比較して比較した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:11:23 GMT)
Unlocking LLM Repair Capabilities in Low-Resource Programming Languages Through Cross-Language Translation and Multi-Agent Refinement [4.5]
本稿では,新しい言語間プログラム修復手法 LANTERN を提案する。提案手法は,LLMが弱い補修能力を示す言語から,より強力な性能を示す言語へ,欠陥コードを戦略的に翻訳する。我々は,11言語にまたがる5,068のバグを含む総合的な多言語ベンチマークであるxCodeEvalについて評価を行った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:56:58 GMT)
GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings [4.4]
ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。 8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:58:18 GMT)
Distributed Temporal Graph Learning with Provenance for APT Detection in Supply Chains [4.4]
高度な永続脅威(APT)は、しばしばサプライチェーン脆弱性(SCV)をエントリポイントとして利用する。現在の防衛戦略は、主に、オープンソースソフトウェア(OSS)におけるプレーンテキストソースコード分析を使用した整合性保証や検出のためのブロックチェーンに重点を置いている。本稿では,マルチソースデータを統合し,包括的動的グラフ前駆体を構築し,時間グラフ学習を用いてリアルタイムにAPTの挙動を検出する手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:42:26 GMT)
Distilling Multi-view Diffusion Models into 3D Generators [4.3]
本稿では,多視点拡散モデル(MV-DM)をガウススプラッティングを用いた3次元ジェネレータに拡散させる定式化であるDD3Gを紹介する。 DD3GはMV-DMから広範囲の視覚的および空間的知識を圧縮し統合する。本稿では,パターン抽出とプログレッシブデコーディングのフェーズからなるジェネレータPEPDを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:44:53 GMT)
FairDAG: Consensus Fairness over Concurrent Causal Design [4.3]
研究によると、敵は取引注文を利用して利益を抽出している。この問題は、無許可と許可のブロックチェーンの両方に影響する。本稿ではDAGベースのコンセンサスプロトコルを利用するFairDAG-ABとFairDAG-RLを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:38:03 GMT)
Distributed Log-driven Anomaly Detection System based on Evolving Decision Making [4.2]
CEDLogは、Apache AirflowとDaskを統合することで、スケーラブルな処理のために分散コンピューティングを実装するフレームワークである。 CEDLogでは、イベントログに存在する重要な特徴を用いて、多層パーセプトロン(MLP)とグラフ畳み込みネットワーク(GCN)の合成によって異常を検出する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:50:30 GMT)
Design of AI-Powered Tool for Self-Regulation Support in Programming Education [4.2]
大きな言語モデル(LLM)ツールは、高品質な補助を提供する可能性を示している。しかし、これらのツールの多くは、機関的な学習管理システムとは独立して運用されている。この分離は、学習材料を活用する能力と、適切なコンテキスト対応のフィードバックを生成するためのコンテキストを行使する能力を制限する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:47:33 GMT)
Beating full state tomography for unentangled spectrum estimation [4.2]
スペクトル推定のための最もよく知られたアルゴリズムは、完全な状態トモグラフィーと同じくらい多くのコピーを必要とする。これは、アンタングル計測の設定ではそうではないことを示す。そこで本研究では,スペクトル推定のサンプル複雑性が全状態トモグラフィーでのみ改善できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:29:12 GMT)
Reasoning Inconsistencies and How to Mitigate Them in Deep Learning [4.1]
この論文は予測的不整合を検出し定量化する2つの技術に貢献している。トレーニングデータのバイアスから不整合を緩和するため,本論文では,データ効率のよいサンプリング手法を提案する。最後に、この論文は、複雑な推論タスクのためにモデルを最適化する2つのテクニックを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:40:55 GMT)
Improving log-based anomaly detection through learned adaptive filter [4.1]
State-of-the-the-art unsupervised methodは、ログシーケンスが与えられた次のログイベントを予測し、同じフィルタ条件を使用する固定設定を適用する。深部強化学習(DRL)は、動的環境におけるインテリジェントな意思決定に広く応用されている。 DRLに基づく新しい手法を提案し、学習適応フィルタを構築し、異なるログシーケンスに対して異なる正規/異常フィルタしきい値を適用する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:31:24 GMT)
Quantile Activation: Correcting a Failure Mode of ML Models [4.0]
本稿では、計算コストを大幅に増大させることなく、この問題に対処する単純なアクティベーション関数、量子アクティベーション(QAct)を提案する。提案した量子化活性化(QAct)は、その文脈分布内のニューロン活性化の相対的な量子化位置を出力する。 DINOv2は、はるかに大きなネットワークとデータセットでトレーニングされているにも関わらず、このアプローチが予想外にDINOv2(小さかった)を上回っていることが分かりました。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:10:12 GMT)
Counterfactual Inference under Thompson Sampling [4.0]
パラメータおよび結果分布の多様さに基づいて, 行動確率の正確かつ効率的に計算可能な表現を導出する。これにより、リコメンダシステムのオフライン評価など、カウンターファクト推論が重要となる、さまざまな実用的なユースケースが開かれます。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:31:40 GMT)
NSSI-Net: A Multi-Concept GAN for Non-Suicidal Self-Injury Detection Using High-Dimensional EEG in a Semi-Supervised Framework [4.0]
青年期における自傷は、身体的および精神的な健康にとって深刻な脅威である。本研究では,NSSIに関連する脳波の特徴を効果的にモデル化する,高度な半教師付き敵ネットワークNSSI-Netを提案する。モデルの有効性と信頼性が実証され、既存の機械学習やディープラーニングに比べてパフォーマンスが5.44%向上した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:50:48 GMT)
Agglomerating Large Vision Encoders via Distillation for VFSS Segmentation [3.9]
医用画像分割作業における低複雑性モデルの性能向上のための新しい枠組みを提案する。集約されたモデルは12のセグメンテーションタスクにまたがる優れた一般化を示すが、特殊なモデルは各タスクに対して明示的な訓練を必要とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:38:09 GMT)
Advancing Semantic Caching for LLMs with Domain-Specific Embeddings and Synthetic Data [3.9]
本報告では, セマンティックキャッシングの精度向上を, 特別に調整された埋め込みモデルを用いて検討する。そこで本研究では,ターゲットとした実世界と合成されたデータセットを微調整した,より小さなドメイン固有埋め込みモデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:27:02 GMT)
We Need Improved Data Curation and Attribution in AI for Scientific Discovery [3.8]
本研究では, 実実験データとは対照的に, 合成データの役割について検討する。オープンアクセスプラットフォームで利用可能な実験データセットの約4分の3は、比較的低い採用率である。本稿では,実際の実験データの透かしに焦点をあてることにより,合成データ検出の自動化に向けた継続的な取り組みを補うことを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:07:52 GMT)
Towards Reinforcement Learning for Exploration of Speculative Execution Vulnerabilities [3.8]
投機的実行脆弱性は、それらを悪用するためには、集中的な手作業とハードウェアの深い知識が必要です。本稿では,強化学習を利用して,ポストシリコン(ブラックボックス)マイクロプロセッサの投機的実行リークを検出するフレームワークSpecRLを紹介する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:52:24 GMT)
Digital Forensics in the Age of Large Language Models [3.7]
大規模言語モデル(LLM)は、様々なデジタル法医学的タスクを自動化し、拡張する強力なツールとして登場した。本稿は,LLMがデジタル法医学のアプローチに革命をもたらした経緯を,アクセス可能かつ体系的に概観することを目的とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:32:15 GMT)
Sliced Wasserstein Discrepancy in Disentangling Representation and Adaptation Networks for Unsupervised Domain Adaptation [3.7]
DRANet-SWDは、教師なし領域適応のための画像の内容とスタイル表現をアンタングルする既存の作業の拡張である。領域適応におけるスタイル変化を捉えるため,グラマーマトリックス損失に対するSWDの潜在的利点について検討した。その結果、SWDは特徴分布の統計的比較をより堅牢にし、より優れたスタイル適応をもたらすことが示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:43:47 GMT)
SparQSim: Simulating Scalable Quantum Algorithms via Sparse Quantum State Representations [3.7]
We present SparQSim, a quantum simulator implement in C++ based by the Feynman-based method。 SparQSimはレジスタレベルで動作し、量子状態の非ゼロ成分のみを格納する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:28:02 GMT)
Autonomous Human-Robot Interaction via Operator Imitation [3.7]
我々は、オペレーターデータを模倣するモデルを訓練することで、自律的な対話型ロボットを作成することを提案する。我々のモデルは人間とロボットの相互作用のデータセットに基づいて訓練されている。提案手法は,専門家-オペレーターのベースラインに匹敵する,単純で自律的な人間-ロボットの相互作用を可能にする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:06:44 GMT)
Probabilistic Pontryagin's Maximum Principle for Continuous-Time Model-Based Reinforcement Learning [3.6]
平均ハミルトニアンの最小化は平均コストを最適化するために必要な最適条件であることを示す。我々のアプローチは、学習力学で不確実なシステムを制御するための原則的で実践的なフレームワークを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:51:20 GMT)
Incorporating the ChEES Criterion into Sequential Monte Carlo Samplers [3.5]
Hamiltonian Monte Carlo (HMC) は、非パラメトリックベイズ推論を行う強力な計算コストの方法である。 No-U-Turn Sampler (NUTS)は、これらのハイパーパラメータを選択するのに非常に効果的であるが、実行が遅く、GPUアーキテクチャには適していない。 NUTSの代替として、ChEES-HMC(ChEES-HMC)のエストリマトの変化は、GPU上でのNUTSよりも高速であるだけでなく、後方からのサンプリングをより効率的に行うことが示されている。 SMCサンプリングは、後方から重み付けされたサンプルを出力する別のサンプリング方法である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:25:19 GMT)
Augmenting Anonymized Data with AI: Exploring the Feasibility and Limitations of Large Language Models in Data Enrichment [3.5]
大規模言語モデル(LLM)は、テキスト生成と理解の両方において高度な機能を示している。データアーカイブへのそれらの適用は、データ対象に関する機密情報の民営化を促進する可能性がある。このデータは、保護されていないとしても、開示と身元確認の両方の観点からプライバシー上のリスクをもたらす可能性がある。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:26:59 GMT)
Fourier Sliced-Wasserstein Embedding for Multisets and Measures [3.4]
ユークリッド空間に$mathbbRd$を超える多重集合と測度を埋め込む新しい方法を提案する。我々は、$mathbbRd$ 以上の分布をバイ・リプシッツな方法でユークリッド空間に埋め込むことは不可能であることを証明した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:51:40 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [3.3]
人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:16:35 GMT)
Graph Attention-Driven Bayesian Deep Unrolling for Dual-Peak Single-Photon Lidar Imaging [3.3]
単光子ライダーイメージングは高解像度と長距離の能力のために3Dイメージングにおいて大きな利点がある。 1ピクセル当たりの複数のターゲットを持つノイズの多い環境では、適用が難しい。デュアルピーク単光子ライダーイメージングのためのディープアンローリングアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:57:26 GMT)
Industrial Internet Robot Collaboration System and Edge Computing Optimization [3.3]
本稿では,ディープラーニングに基づく移動ロボットのグローバルパス制御方式を提案する。提案モデルでは,エッジデバイスでローカルデータを処理し,ロボットと中央サーバ間の通信負担を軽減する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:15:10 GMT)
State-Space Model Inspired Multiple-Input Multiple-Output Spiking Neurons [3.2]
スパイキングニューラルネットワーク(SNN)では、情報処理の主単位は内部状態のニューロンである。一般マルチインプット・マルチアウトプット(MIMO)スパイキングニューロンモデルを提案する。内部状態が広いニューロン数が少ないSNNでは,ニューロンの出力チャネル数を増やすことで,大きな性能向上が得られることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:55:11 GMT)
GeoRAG: A Question-Answering Approach from a Geographical Perspective [3.2]
Geographic Question Answering (GeoQA) は、地理的領域における自然言語クエリに対処する。従来のQAシステムは、限定的な理解、低い検索精度、弱い相互作用性、複雑なタスクの不十分な処理に悩まされている。本研究は、ドメイン固有の微調整と迅速なエンジニアリングを統合した知識強化型QAフレームワークであるGeoRAGについて述べる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:36:26 GMT)
CHARMS: Cognitive Hierarchical Agent with Reasoning and Motion Styles [3.2]
本稿では、推論と動作スタイルを用いた認知階層型エージェント(CHARMS)を提案する。このモデルは、他の車両の振る舞いを推論し、異なる意思決定スタイルで反応することができる。本稿では,Poisson認知階層理論に基づいて,新たな駆動シナリオ生成手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:15:19 GMT)
Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research [3.2]
我々は、アクションマスキングによる人間の知識を含めることの利点と欠点を分析した。我々は,アクションマスキングを使わずにトレーニングされたポリシーに対して,アクションマスキングが大幅に改善できることを見出した。我々は、アクションマスクが過度に制限された場合、最適以下の結果をもたらす可能性を強調する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:00:04 GMT)
Ga$_2$O$_3$ TCAD Mobility Parameter Calibration using Simulation Augmented Machine Learning with Physics Informed Neural Network [3.2]
実験データを用いて,機械学習を用いてTCADパラメータのキャリブレーションを行う可能性を示す。オートエンコーダ(AE)とニューラルネットワーク(AE-NN)とからなるマシンを用いる。 TCAD抽出パラメーターは、パラメータの質がプリターンオン・レジームのエキスパートに匹敵するが、オンステート・レジームでは良くないことを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:09:43 GMT)
Monotonicity of the von Neumann Entropy under Quantum Convolution [3.1]
古典的な場合、i.d.random変数の正規化和全体のエントロピーの列が単調に増加することが示されている。我々は量子エントロピーパワーの不等式の一般化を証明し、任意の状態の$n$フォールド対称畳み込みのフォン・ノイマンエントロピーを比較することができる。このエントロピーパワーの不等式の量子古典バージョンを提案し、量子状態と古典的確率変数の間の畳み込み作用の下でのフォン・ノイマンエントロピーの挙動をよりよく理解するのに役立つ。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:45:45 GMT)
Learning Geometrically-Informed Lyapunov Functions with Deep Diffeomorphic RBF Networks [3.1]
データから証明関数を学習するための微分型関数学習フレームワークを提案する。 RBFネットワークに基づく微分同相写像を構築するための新しい手法を提案する。実世界のデータから微分同相リアプノフ関数を学習することで、我々のアプローチを実証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:09:17 GMT)
SHapley Estimated Explanation (SHEP): A Fast Post-Hoc Attribution Method for Interpreting Intelligent Fault Diagnosis [3.1]
ポストホック解釈性は、モデル構造を変更することなくネットワークの柔軟性とスケーラビリティを維持する能力によって人気を集めている。近年、ドメイン変換とSHAPを組み合わせることで、説明をより情報的なドメインに拡張することで、解釈可能性が改善されている。本稿では、SHAPの計算コストに対処するため、パッチワイド属性とSHEP(SHapley Estimated Explanation)を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:56:07 GMT)
Improving Object Detection by Modifying Synthetic Data with Explainable AI [3.1]
本稿では,合成画像の設計効率を向上させるための新しい概念的アプローチを提案する。 XAI技術は、これらの画像を生成するために使用される3Dメッシュモデルを修正する、ループ中の人間プロセスを導く。合成データは、トレーニング中に見えない方向の車両の検出を4.6%改善できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:02:11 GMT)
Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking [3.0]
ペイントショップ問題では、異なる色に割り当てられた車両の無秩序な受信シーケンスを再シャッフルする必要がある。フレキシブルな問題変種に対する色変化を最小限に抑えるための強化学習手法を提案する。提案手法は,既存の手法と比較して,問題の大きさによって色の変化をかなり低減することを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:37:40 GMT)
AI red-teaming is a sociotechnical challenge: on values, labor, and harms [3.0]
赤いチーム」がAIモデルをテストするための主要なアプローチになった。私たちは、レッドチームの背後にある価値と前提を理解することの重要性を強調します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:24:20 GMT)
A direct algebraic proof for the non-positivity of Liouvillian eigenvalues in Markovian quantum dynamics [3.0]
マルコフ開量子系はリンドブラッドマスター方程式 $partial_trho =mathcalL(rho)$ で記述される。有限次元ヒルベルト空間を持つ系に対しては、すべての固有値の実部が非正であることは、リウヴィリアンの基本的な性質である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:54:25 GMT)
FEASE: Shallow AutoEncoding Recommender with Cold Start Handling via Side Features [2.9]
ユーザとアイテムのコールドは、レコメンデーションシステムの産業的応用において重要な課題となる。ユーザ側とアイテム側の両方をシームレスに統合する拡張EASEモデル(FEASE)を導入する。コールドスタート項目を効果的に推奨し, 余分なバイアスを伴わずにコールドスタートユーザを扱い, バランスをとる方法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:27:55 GMT)
Data Spatial Programming [2.8]
オブジェクト指向プログラミング(OOP)のセマンティクスを拡張する新しいプログラミングモデルであるデータ空間プログラミングを導入する。このトポロジカル空間におけるデータ要素間の関係を形式化することにより、我々のアプローチは複雑なシステムのより直感的なモデリングを可能にする。このパラダイムは、エージェントベースのシステム、ソーシャルネットワーク、リレーショナルデータ処理、ニューラルネットワーク、分散システム、有限状態マシン、その他の空間指向の計算問題など、コンピュータ科学における幅広い問題を表現する際に、従来のOOPの制限に対処する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:11:54 GMT)
Magnetic Field Detection Using a Two-Qubit System Under Noisy Heisenberg Interaction [2.8]
ノイズの多い2量子ビット系を用いた磁界検出器の設計法を提案する。磁場はデコヒーレンス過程に大きく影響しないが、時間とともに帰還確率に顕著な振動をもたらす。これらの結果は、実用的な量子ベースの磁場検出器の実現の可能性を示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:00:41 GMT)
MultiTSF: Transformer-based Sensor Fusion for Human-Centric Multi-view and Multi-modal Action Recognition [2.8]
マルチモーダル・マルチビュー観測による行動認識は、監視、ロボティクス、スマート環境における応用において大きな可能性を秘めている。マルチモーダルマルチビュー変換器を用いたセンサフュージョン(MultiTSF)を提案する。提案手法はトランスフォーマーを用いて動的にビュー間の関係をモデル化し,複数のビューにまたがる時間的依存関係をキャプチャする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:04:05 GMT)
MultiSensor-Home: A Wide-area Multi-modal Multi-view Dataset for Action Recognition and Transformer-based Sensor Fusion [2.8]
マルチモーダル・マルチビュー・アクション認識はコンピュータビジョンにおいて急速に成長している分野である。現在のデータセットは、広い環境条件、非同期データストリーム、フレームレベルのアノテーションの欠如など、現実の課題に対処できないことが多い。マルチモーダル・マルチビュー変換器を用いたセンサフュージョン(MultiTSF)法を提案し,マルチセンサ・ホーム・データセットを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:23:08 GMT)
Mind the Gap? Not for SVP Hardness under ETH! [2.7]
指数時間仮説(ETH)に基づく基本格子問題に対する新しい硬さ結果の証明まず、[1, infty)$ の任意の $p に対して、$mathsfCVP_p,gamma$ ($ell_p$-norm 近似ベクトル問題) が明示的な定数 $gamma > 1$ が存在することを示す。次に、$mathsfSVP_p,gamma$ ($ell_p$-norm) のランダム化 ETH-hardness 結果を証明する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:32:32 GMT)
Analytical Discovery of Manifold with Machine Learning [2.7]
GAMLA (Global Analytical Manifold Learning using Auto-Encoding) を導入する。 GAMLAは、基礎となる多様体のキャラクタリ表現と補表現の両方を導出するために、自動符号化フレームワーク内で2ラウンドのトレーニングプロセスを採用している。 2つの表現を合わせて潜在空間全体を分解し、したがって多様体を取り巻く局所空間構造を特徴づけることができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:53:00 GMT)
Resource-Optimized Grouping Shadow for Efficient Energy Estimation [2.6]
本稿では,新たな重なり合うグループ化戦略と凸最適化による推定誤差を最小化することにより,測定資源を最適に割り当てるリソース・ド・グルーピング・シャドー(ROGS)アルゴリズムを提案する。数値実験により, ROGS は, 量子コンピュータ上での回路のコンパイル・実行に要するコスト要因に対処するため, 従来手法に比べて, 精度の高い推定精度の確保に要する量子回路を著しく少なくすることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:21:17 GMT)
PROMPTFUZZ: Harnessing Fuzzing Techniques for Robust Testing of Prompt Injection in LLMs [2.4]
大規模言語モデル(LLM)は、人間のようなテキストを生成する強力な能力のため、様々なアプリケーションで広く利用されている。プロンプトインジェクション攻撃は、モデルの最初の命令を悪意のあるプロンプトで上書きし、生成されたテキストを操作する。本稿では,ファジィ技術を利用した新規な試験フレームワークであるProMPTFUZZを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:03:17 GMT)
Semiparametric Counterfactual Regression [2.4]
一般化可能なフレームワーク内での非実効的回帰のための2つの頑健なスタイル推定器を提案する。当社のアプローチでは,標準手法を維持しながら適応性を高めるために,漸進的な介入を用いる。解析の結果,提案した推定器は幅広い問題に対して$sqrn$-consistencyと正規性が得られることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:32:26 GMT)
Quantum state preparation for multivariate functions [2.3]
振幅が多変量関数をエンコードする量子状態を作成するためのプロトコルを開発する。我々は、実用的かつ短期的資源の観点から、要件を解析する。我々は、24量子ビットと最大237個の2量子ビットゲートを量子化されたH2-1量子プロセッサ上で使用する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:56:37 GMT)
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling [2.3]
正書法データセットを一貫した音韻表現に変換するツールであるG2P+を紹介する。また、31言語にまたがる子育て音声の音声データセットであるIPA CHILDESを提示する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:22:19 GMT)
CALICO: Part-Focused Semantic Co-Segmentation with Large Vision-Language Models [2.3]
本稿では,マルチイメージ部分レベルの推論セグメンテーションのためのLVLM(Large Vision-Language Model)を提案する。セマンティックな部分レベルの対応を識別する新しい対応抽出モジュールと、この情報をLVLMに埋め込む適応対応モジュールである。パラメータの0.3%しか微調整されていないCALICOは,この課題に対して高いパフォーマンスを実現していることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:25 GMT)
Improving User Experience with FAICO: Towards a Framework for AI Communication in Human-AI Co-Creativity [2.3]
本稿では、共同創造型AIのためのAIコミュニケーション(FAICO)を設計するためのフレームワークの設計について紹介する。 FAICOは、AIコミュニケーションの重要な側面とそのユーザエクスペリエンスへの影響を示し、効果的なAIコミュニケーションの設計をガイドする。当社のフレームワークを,デザイナのためのデザインカードとユーザのための設定ツールという,2つの実用的なツールに変換するための実行可能な方法を示します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:29:53 GMT)
Error Bounds on the Universal Lindblad Equation in the Thermodynamic Limit [2.3]
これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:32:21 GMT)
CrystalFormer-RL: Reinforcement Fine-Tuning for Materials Design [2.3]
自己回帰変換器を用いた材料生成モデルCrystalFormerへの強化微細調整の適用について検討する。報酬信号の最適化により、微調整は識別モデルからの知識を生成モデルに注入する。生成したモデルであるCrystalFormer-RLは、生成した結晶の安定性を向上し、望ましいが矛盾する材料特性を持つ結晶の発見に成功した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:59:30 GMT)
CRC-SGAD: Conformal Risk Control for Supervised Graph Anomaly Detection [2.3]
統計リスク制御をグラフ異常検出(GAD)に統合するフレームワークを提案する。 FNR(False Negative Rate)とFPR(False Positive Rate)の両方に対して理論的に保証されたバウンドを提供する。 4つのデータセットと5つのGADモデルに対する実験は、FNRおよびFPR制御および予測セットサイズにおいて統計的に有意な改善を示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:27:49 GMT)
AC-LoRA: Auto Component LoRA for Personalized Artistic Style Image Generation [2.3]
AC-LoRAは、LoRA行列の信号成分とノイズ成分を自動的に分離し、高速で効率的なパーソナライズされた芸術的スタイルの画像生成を可能にする。結果は、FID、CLIP、DINO、ImageRewardを用いて検証され、平均9%の改善が得られた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:56:01 GMT)
CoTAL: Human-in-the-Loop Prompt Engineering, Chain-of-Thought Reasoning, and Active Learning for Generalizable Formative Assessment Scoring [2.2]
チェーン・オブ・ソート(CoT)のような手法は、教師が科学の形式的評価を格付けできるようにする。これらの手法が複数の領域でキュリキュラにまたがる一般化の程度は、まだほとんど証明されていない。書式評価評価のための LLM ベースのアプローチである Chain-of-Thought Prompting + Active Learning (CoTAL) を導入する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:53:34 GMT)
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models [2.2]
REINFORCE++は、バッチの正規化報酬をベースラインとして使用しながら、批判モデルを削除する新しいアプローチである。プロンプトセットのトランケーションを必要とせずに、様々な報酬モデルに対して堅牢なパフォーマンスを示す。既存のREINFORCE法と比較して、RLHFとロングチェーン設定の両方において優れた一般化を実現している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:20:56 GMT)
Data-Driven Object Tracking: Integrating Modular Neural Networks into a Kalman Framework [2.1]
マルチオブジェクト追跡(MOT)における重要な課題に対処する3つのニューラルネットワーク(NN)モデルを導入する。 3つのネットワークはすべて、リアルタイムで組み込み環境で動作するように設計されている。公的なKITTI追跡データセットを用いて評価を行った結果,追跡性能が大幅に向上したことが示された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:13:38 GMT)
LLM-Augmented Graph Neural Recommenders: Integrating User Reviews [2.1]
本稿では,グラフニューラルネットワーク(GNN)ベースのモデルと大規模言語モデル(LLM)を用いて,レビューアウェアな表現を生成するフレームワークを提案する。提案手法は,ユーザの行動信号と言語信号の両方が効果的に捕捉されるように,テキストから得られる特徴に対するユーザとテムの相互作用のバランスをとる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:40:09 GMT)
Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish [2.1]
本研究では,ルクセンブルク語に対する評価ツール等の言語習熟度試験の実施可能性について検討した。また,ChatGPTやClaude,DeepSeek-R1といった大規模モデルは高いスコアを得るのが一般的である。また,このような言語試験における性能は,他のNLP課題における性能を予測するためにも有効であることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:39:22 GMT)
From Consumption to Collaboration: Measuring Interaction Patterns to Augment Human Cognition in Open-Ended Tasks [2.0]
ジェネレーティブAIの台頭、特に大規模言語モデル(LLM)は、知識労働における認知過程を根本的に変えるものである。本稿では、認知活動モード(探索対搾取)と認知エンゲージメントモード(建設対有害)の2つの側面に沿って相互作用パターンを分析する枠組みを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:20:36 GMT)
Automated Video-EEG Analysis in Epilepsy Studies: Advances and Challenges [2.0]
てんかんは通常、脳波(EEG)と長期ビデオEEG(vEEG)モニタリングによって診断される。機械学習の最近の進歩は、脳波とビデオデータを用いたリアルタイムの発作検出と予測において有望であることを示している。本稿では,ビデオ-EEG自動解析の最近の展開を概観し,マルチモーダルデータの統合について論じる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:13:16 GMT)
NeuroAI for AI Safety [2.0]
一般知能を持つ唯一のエージェントは人間である。神経科学は、現在未調査で未使用の技術的AI安全性の重要な鍵を握るかもしれない。我々は神経科学に触発されたAI安全性へのいくつかの道のりを強調し、批判的に評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:40:12 GMT)
Quantum Gibbs states are locally Markovian [2.0]
有界相互作用次数を持つ任意のハミルトニアンに対して、量子ギブス状態は任意の温度で局所マルコフであることが示される。任意の低温での仮想時間進化作用素の正規化方式を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:54:42 GMT)
Layers at Similar Depths Generate Similar Activations Across LLM Architectures [1.9]
我々は24個のオープンウェイトLDMの異なる層での活性化によって誘導される近接関係について検討した。 1)モデル内のレイヤによって異なる傾向があり、2)モデルの対応するレイヤ間でほぼ共有されていることが分かりました。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:02:30 GMT)
Huge Ensembles Part II: Properties of a Huge Ensemble of Hindcasts Generated with Spherical Fourier Neural Operators [1.9]
第1部では,球面ニューラル演算子に基づくアンサンブルを作成した。第2部では,2023年夏の1日7,424人からなる巨大なアンサンブル(HENS)を生成している。 HENSは予測分布の尾部を正確にサンプリングし、内部変数の詳細なサンプリングを行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:40:12 GMT)
Direction switchable single-photon emitter using a Rydberg polariton [1.9]
Rydberg 偏光子を用いた方向切替可能な単一光子エミッタを示す。我々は、textitN出力チャネルとユニティルーティング効率を備えた単一光子の量子ルーティングを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:35:36 GMT)
Optimal Invariant Bases for Atomistic Machine Learning [1.9]
多くの機械学習モデルは原子の局所環境を記述するが、その多くは不完全または機能的依存である。我々は、パターン認識文学から既存の原子論的な表現に至るまでの技法を用いて、完全性を満たす最小の集合を生成する。これにより、各ニューロンに最大5体パターンを認識可能な、メッセージパッシングネットワークアーキテクチャが新たに構築されることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:35:44 GMT)
Implementation of a quantum addressable router using superconducting qubits [1.9]
2つのネイティブ制御iSWAPゲートに基づくルーティングプロトコルを実装するために、固定周波数トランスモンキュービットを使用するQ2ルータを実現する。平均ルーティング忠実度は95.3%と推定され、主にデコヒーレンスや状態準備、測定による誤差がある。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:24:44 GMT)
Huge Ensembles Part I: Design of Ensemble Weather Forecasts using Spherical Fourier Neural Operators [1.9]
機械学習を使って、巨大な天気のアンサンブルのヒンドキャストを生成します。第1部:球状フーリエニューラル演算子(SFNO)に基づくアンサンブル天気予報システムの構築パートII: MLの極端な天気予報は信頼性と差別性を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:13:49 GMT)
Geospatial Artificial Intelligence for Satellite-based Flood Extent Mapping: Concepts, Advances, and Future Perspectives [1.8]
衛星ベースの洪水範囲マッピングのためのGeoAIは、人工知能技術と衛星データを統合し、洪水イベントを特定し、その影響を評価する。一次出力は、しばしば洪水範囲の地図を含み、影響地域を詳細に表し、不確実性推定や変化検出などの分析出力も含む。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:08:22 GMT)
On the Volatility of Shapley-Based Contribution Metrics in Federated Learning [1.8]
フェデレートラーニング(Federated Learning, FL)は、協調型およびプライバシ保護型機械学習パラダイムである。 FLにおける重要な課題は、多様な参加者からの貢献を公平かつ正確に割り当てることにある。不正確な割り当ては信頼を損なう可能性があり、不公平な補償につながるため、参加者は連合への参加または積極的に貢献するインセンティブを欠く可能性がある。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:13:46 GMT)
From Questions to Insights: Exploring XAI Challenges Reported on Stack Overflow Questions [1.8]
解釈可能性の欠如は、AIモデルの実用的使用を制限する主要な障壁である。 XAI技術(例えばSHAP、LIME)はこれらのモデルの性能を解釈するために使われてきた。我々は,これらの課題,その重症度,XAI技術をより使いやすくするための特徴を明らかにするために,探索的研究を行った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:33:46 GMT)
Test Amplification for REST APIs Using "Out-of-the-box" Large Language Models [1.8]
私たちはChatGPTとGitHubのCopilotを使ってREST APIテストスイートを増幅した経験を報告します。私たちは、最も強力なテストスイートをもたらすプロンプトについて、一連のガイドラインと教訓を導き出します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:28:07 GMT)
Mixtera: A Data Plane for Foundation Model Training [1.8]
基礎モデルトレーニングのためのデータプレーンであるMixteraを構築、提示します。 Mixteraはトレーニングをボトルネックにせず、256GH200スーパーチップにスケールする。また、視覚言語モデルにおける混合の役割についても検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:29:01 GMT)
Narrative Studio: Visual narrative exploration using LLMs and Monte Carlo Tree Search [1.8]
木のようなインタフェースを備えたブラウザ内物語探索環境を提案する。各ブランチは、システムとユーザ定義のプロンプトによってガイドされた反復LDM推論によって拡張される。また、生成したテキストをエンティティグラフにグラウンドすることで、ユーザによる物語コヒーレンスの向上を可能にします。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:31:07 GMT)
Toward Automated Qualitative Analysis: Leveraging Large Language Models for Tutoring Dialogue Evaluation [1.8]
本研究では,大きな言語モデル(LLM)を活用して,5つの指導戦略の有効性を評価するシステムを提案する。教員-学生チャットルームの公開データセットを用いて、学習戦略を、希望的または望ましくないものとして採用するかのどちらかに分類する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:08:03 GMT)
MAD: A Magnitude And Direction Policy Parametrization for Stability Constrained Reinforcement Learning [1.7]
我々は、強化学習(RL)のための政策パラメータ化であるマグニチュード・アンド・ディレクション(MAD)ポリシーを導入する。 MADポリシは、クローズドループ安定性を損なうことなく、状態依存機能に対する明示的なフィードバックを導入する。 DDPG(Deep Deterministic Policy gradient)法で訓練されたMADポリシが,見当たらないシナリオに一般化されていることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:26:26 GMT)
SLACK: Attacking LiDAR-based SLAM with Adversarial Point Injections [1.7]
LiDARベースのSLAMに対する学習に基づく攻撃を研究する主な研究は存在しない。本研究は,LiDARの品質を劣化させることなく,数点の点注入でLiDARスキャンを攻撃するための,エンド・ツー・エンドの深部生成敵モデルであるSLACKを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:52:49 GMT)
Limits of trust in medical AI [1.6]
AIシステムは信頼でき、信頼性があり、信頼できない。患者は医療的意思決定のためにAIシステムに頼る必要があるため、臨床実践における関係性への信頼の欠如を生み出す可能性がある。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:03:18 GMT)
The Amenability Framework: Rethinking Causal Ordering Without Estimating Causal Effects [1.6]
本稿では,介入の影響を受けやすい個体の潜伏傾向に基づく概念的枠組みを提案する。次に、予測スコアがアメナビリティーの効果的なプロキシとなる条件を定式化する。その結果,予測モデルは介入効果による個人格付けにおける因果効果推定よりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:20:48 GMT)
Properties of Fixed Points of Generalised Extra Gradient Methods Applied to Min-Max Problems [1.6]
min-max問題の目的関数のサドル点とEGG固定点との接続について議論する。適切なステップサイズ選択の下では、サドル点の集合(ナッシュ平衡)が GEG の安定な固定点の部分集合であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:48:39 GMT)
Low-cost Embedded Breathing Rate Determination Using 802.15.4z IR-UWB Hardware for Remote Healthcare [1.6]
超広帯域(UWB)チャネルインパルス応答(CIR)データから呼吸速度を予測する畳み込みニューラルネットワーク(CNN)を提案する。 46KBのメモリを必要とするnRF52840システムにアルゴリズムをデプロイし,192msの推論時間で動作可能であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:54:25 GMT)
Agentic Large Language Models, a survey [1.5]
エージェントLLMはエージェントとして機能する大きな言語モデルである。文献は、推論、リフレクション、検索の3つのカテゴリに従って整理する。重要な応用は、医療診断、物流、金融市場分析である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:32:44 GMT)
Efficient Annotator Reliability Assessment with EffiARA [1.5]
EffiARAは、アノテーションタスクに必要なリソースの理解からアノテーション付きデータセットのコンパイルまで、アノテーションパイプライン全体をサポートするフレームワークである。このフレームワークの有効性は、アノテータ信頼度に基づくソフトラベル凝集とサンプル重み付けによる分類性能の向上と、アノテータ間の全体的な合意の増大という2つの先行研究によって支持されている。この作業は、EffiARA Pythonパッケージとそれに伴うwebtoolを導入し、システムに対してアクセス可能なグラフィカルユーザインターフェースを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:24:47 GMT)
Protecting entanglement witnesses with randomized measurements [1.5]
絡み合いは量子情報科学にとって不可欠である。最近の研究では、測定における小さなエラーでさえ、目撃者の有効性を著しく損なう可能性があることが示されている。この問題を解決するためにランダム化計測に基づく手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:56:11 GMT)
Grammar-based Ordinary Differential Equation Discovery [1.5]
常微分方程式(ODE)の終端発見のための新しい枠組みを提案する。提案手法は形式的形式性低減と高次元空間を効率的に探索するための探索を組み合わせたものである。 Godeは、最先端のトランスフォーマーベースのモデルよりもサンプリングとパラメータ効率が良いことを証明している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:28:13 GMT)
Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation [1.4]
1) 最適化手法と2) 最適化手法の2つのアプローチが進化した。 Floxelsは、計算コストのごく一部で同等のパフォーマンスを達成しながら、教師なしの手法の中でEulerFlowにしか勝っていない。 FloxelsはEulerFlow上で60～140倍の大幅なスピードアップを実現し、1シーケンスあたりのランタイムを1日から10分に短縮する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:17:18 GMT)
Optimizing Resource Allocation to Mitigate the Risk of Disruptive Events in Homeland Security and Emergency Management [1.4]
米国の国土安全保障は、複数の脅威や危険が発生する可能性があるため、恐ろしい課題に直面している。自然災害、テロ攻撃などの人為的な事故、技術的失敗は重大な損害、死者、負傷、経済的な損失をもたらす。本稿では、政策立案者が予算制約を満たしつつ、脅威や危険のリスクを最も軽減するプロジェクトを特定し、選択するための最適化に基づく意思決定支援モデルを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:49:15 GMT)
A Scalable Synthesis Algorithm for Reversible Functions [1.4]
本稿では,変換に基づく可逆回路の正確な合成法を提案する。合成アルゴリズムが高入力可逆関数を扱えるような新しい探索空間削減手法が提案されている。実験結果から, 最先端の精密合成法に比べ, Tゲートの量で最大99%の改善が得られた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:29:33 GMT)
Orbit Determination through Cosmic Microwave Background Radiation [1.3]
本研究では、宇宙マイクロ波背景放射(CMB)を初期軌道決定(IOD)の基準信号として用いることを検討する。本研究は、CMBのユニークな特性を活用することにより、既存の環境データに頼らずに、宇宙船の速度と位置を推定する新しい手法を提案する。その結果、CMBは宇宙船の自律性と柔軟性を高める可能性があることが示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:44:22 GMT)
Observation of non-Hermitian dislocation bound states and dislocation skin effects [1.3]
本研究では,2次元音響的NHチャーン格子におけるNH転位境界状態 (NHDS) と転位誘起NH皮膚効果の実験的観察を行った。本研究は, 格子欠陥によるNHトポロジーの探索と, 欠陥工学的トポロジーデバイスへの新たな道を開くための実験的経路を開拓した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:59:25 GMT)
Improved Compact Genetic Algorithms with Efficient Caching [1.3]
我々は同じ染色体の冗長な評価を避ける手段として,cGAにおけるキャッシュの概念を紹介した。提案手法は,cGAと等価に動作するが,関数評価の回数を減らすことにより,アルゴリズムの時間効率を向上させる。提案手法は, エリート主義に基づくcGAの選択圧の高いキャッシング機構をさらに一般化する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:47:26 GMT)
Scenario Discovery for Urban Planning: The Case of Green Urbanism and the Impact on Stress [1.3]
本研究は, 都市計画におけるシナリオディスカバリーを適用して, ストレス低減における都市植生介入の有効性を評価する。植生をベースとしたソリューションがストレス応答の緩和に成功または失敗する主要な介入しきい値を特定する。植生の増加は, ストレスレベルが低く, 高密度の都市環境, 群集, 個々人の心理的特性と相関していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:23:17 GMT)
Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life [1.3]
本稿では,RUL推定のための統計モデルと機械学習モデルを統合するハイブリッドサバイバル分析フレームワークを提案する。提案手法は,時系列バッテリーデータを経路シグネチャを用いた時系列データに変換することにより,有効生存モデルを実現する。我々は、CoxベースのサバイバルモデルやDeepHitやMTLRといった機械学習ベースの手法を含む5つのモデルを適用し、時間とともに障害のない確率を推定する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:38:07 GMT)
3D Gaussian Splatting against Moving Objects for High-Fidelity Street Scene Reconstruction [1.3]
本稿では,ダイナミックストリートシーン再構築のための新しい3次元ガウス点分布法を提案する。提案手法では,高忠実度な静的シーンを保存しながらオブジェクトの移動を除去する。実験により, 大規模動的環境における再現性の向上, レンダリング性能の向上, 適応性の向上が示された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:39:45 GMT)
Robustly identifying concepts introduced during chat fine-tuning using crosscoders [1.3]
クロスコーダは、ベースモデルと微調整モデルの両方において遅延方向として表される解釈可能な概念の共用辞書を学習する、最近のモデル微分法である。両モデルに実際に存在するとき,概念を微調整モデルに固有のものと誤帰できるクロスコーダL1のトレーニング損失に起因する2つの問題を同定する。 BatchTopKの損失でクロスコーダをトレーニングし、これらの問題を大幅に軽減し、より真にチャット特化され、高度に解釈可能な概念を見つけます。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:50:24 GMT)
Multi-Screaming-Channel Attacks: Frequency Diversity for Enhanced Attacks [1.3]
サイドチャネル攻撃は、その漏洩を分析して、被害者システムから内部データを検索する。本研究は, 漏れを伝達する周波数の多様性を利用して, 攻撃性能を向上させる方法について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:58:10 GMT)
Building functional and mechanistic models of cortical computation based on canonical cell type connectivity [1.2]
本稿では,皮質構造に関する現在の知識を考察し,計算モデルにおける2つの基本原理を抽出する。第1の原則は、皮質細胞型が異なる計算的役割を果たすことである。第2の原則は、皮質の接続性は、細胞タイプ間の接続性の標準的な青写真のみによって効率的に特徴づけられることである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:08:12 GMT)
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition [1.2]
MG-Genは単一の画像からベクトル形式でデータを再構成する。テキストの可読性と入力整合性を保ちながら動作図を生成することを実験的に確認する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:52:12 GMT)
Leveraging Static Relationships for Intra-Type and Inter-Type Message Passing in Video Question Answering [1.2]
本稿では,静的な関係に基づく型内および型間メッセージパッシングの推論手法を提案する。 ANetQAデータセットとNext-QAデータセットの実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:14:41 GMT)
Systematic Evaluation of Large Vision-Language Models for Surgical Artificial Intelligence [1.2]
大規模ビジョンランゲージモデルは、AI駆動の画像理解のための新しいパラダイムを提供する。この柔軟性は、専門家がアノテートしたデータが不足している医療全体において特に有望である。本稿では,外科的AIにおける17の視覚的理解課題を対象に,11の最先端VLMの総合的分析を行う。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:42:56 GMT)
How Deep Do Large Language Models Internalize Scientific Literature and Citation Practices? [1.1]
論文の引用において,大規模言語モデル (LLM) がマシュー効果の強化に寄与していることが示唆された。我々はGPT-4oが生成した274,951個の参照を1万件の論文に対して分析した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:04:56 GMT)
Language Models Guidance with Multi-Aspect-Cueing: A Case Study for Competitor Analysis [1.1]
競合分析では、複数の側面を評価し、情報的な決定を行うためのトレードオフのバランスを取る。最近のLarge Language Models (LLMs) は、そのようなトレードオフを推理するが、固有の制限に対処する印象的な能力を示している。競争市場に対する理解を深めるために, LLM にビジネス的側面を組み込むことが, モデル性能を継続的に向上させることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:18:11 GMT)
Exploring energy consumption of AI frameworks on a 64-core RV64 Server CPU [1.1]
今日の急速な技術進歩の時代には、人工知能(AI)の応用には大規模で高性能でデータ集約的な計算が必要であり、かなりのエネルギー需要をもたらしている。ハードウェアメーカーは、RISC-Vアーキテクチャが著名なプレイヤーとして登場し、新しい、効率的で専門的なソリューションを開発している。ソフトウェア開発者は新しいアルゴリズムとフレームワークを作成しているが、そのエネルギー効率はしばしば不明である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:27:10 GMT)
Koney: A Cyber Deception Orchestration Framework for Kubernetes [1.1]
我々は、偽装技術について「コードとして」記述するために、偽装ポリシー文書を記述する。サービスメッシュやeBPFといったクラウドネイティブテクノロジを活用して、コンテナ化されたソフトウェアアプリケーションに自動的にトラップを追加しています。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:37:14 GMT)
Enhancing Customer Contact Efficiency with Graph Neural Networks in Credit Card Fraud Detection Workflow [1.1]
本稿では,不正取引の識別精度を高めるために,グラフ畳み込みネットワーク(RGCN)を組み込んだ不正検出フレームワークを提案する。提案手法の有効性を評価するため,IBMクレジットカードトランザクションデータセットを用いて実験を行った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:50:45 GMT)
Multi-Head Adaptive Graph Convolution Network for Sparse Point Cloud-Based Human Activity Recognition [1.1]
グラフ畳み込みフレームワークに適応的なアプローチを導入する。単一の共有重み関数の代わりに、マルチヘッド適応カーネル(MAK)モジュールは複数の動的カーネルを生成する。本手法により、コンボリューションカーネルは様々な局所的特徴に適応できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:19:20 GMT)
LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect [1.0]
本稿では,チュニジア・アラビア方言の音韻的・語彙的特徴を捉えたLinTOデータセットを提案する。これらのデータセットには、さまざまなソースからのさまざまなテキストと、多様な話者を特徴とする実世界のオーディオサンプルが含まれている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:05:56 GMT)
BioX-CPath: Biologically-driven Explainable Diagnostics for Multistain IHC Computational Pathology [1.0]
BioX-CPathは、全スライド画像(WSI)分類のための説明可能なグラフニューラルネットワークアーキテクチャである。 BioX-CPathはStain-Aware Attention Pooling (SAAP)モジュールを導入した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:47:49 GMT)
CARE: Confidence-Aware Regression Estimation of building density fine-tuning EO Foundation Models [1.0]
本研究は、回帰出力とともに信頼度を計算・割り当てするEO衛星データを用いたファンデーションモデルの開発である。このモデルCAREは、EOデータに対するファンデーションモデルの下流タスクとして回帰結果に対する信頼度を算出し、低信頼領域に対する信頼度を考慮した自己補正学習手法を実行する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:04:54 GMT)
The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context [0.9]
アライメントチューニングにより、大きな言語モデルは、推論、命令追従、有害な世代を最小化できる。広く展開されているにもかかわらず、これらのモデルはモノリンガルバイアスを示し、言語間のアライメントの有効性に関する懸念を提起する。現在のアライメント手法は主に英語に重点を置いており、アライメント機構が多言語設定にどのように一般化するかははっきりしない。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:46:46 GMT)
Research Paper Recommender System by Considering Users' Information Seeking Behaviors [0.9]
論文レコメンデーションにおける主要なアプローチの1つは、コンテンツベースのフィルタリングである。本稿では,この情報を考慮に入れたコンテンツに基づくフィルタリングレコメンデーション手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:11:58 GMT)
Anomaly Detection in Time Series Data Using Reinforcement Learning, Variational Autoencoder, and Active Learning [0.8]
このアプローチは、データセンタやセンサネットワーク、ファイナンスといった領域において重要なものだ。本手法は, 深層強化学習(DRL)と変分オートエンコーダ(VAE)とアクティブラーニングを組み合わせることで, これらの制約を克服する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:41:52 GMT)
Flexible Moment-Invariant Bases from Irreducible Tensors [0.8]
不変量の集合は、それが入力の退化に対して完全で独立で堅牢であれば最適である。 2つの一般的なモーメント不変のアプローチを組み合わせることで、この脆弱性を克服する方法を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:25:35 GMT)
Level Up Peer Review in Education: Investigating genAI-driven Gamification system and its influence on Peer Feedback Effectiveness [0.8]
本稿では、Generative AI(GenAI)アシストと統合されたゲーミフィケーションピアアセスメントプラットフォームであるSocratiqueを紹介する。 Socratiqueはゲーム要素を取り入れることで、学生により多くのフィードバックを提供する動機付けを目指している。治療群では, 明瞭度, 関連性, 特異性について, より自発的なフィードバックが得られた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:30:25 GMT)
Am I Being Treated Fairly? A Conceptual Framework for Individuals to Ascertain Fairness [0.8]
我々は、自動意思決定(ADM)システムの特性として、公正性の改善を論じる。本稿では,ADMシステムのエンドユーザーを支援する様々なツールを組み合わせることにより,公正性を確認するための概念的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:28:19 GMT)
Navigating in High-Dimensional Search Space: A Hierarchical Bayesian Optimization Approach [0.8]
HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:37:26 GMT)
EvoChain: A Framework for Tracking and Visualizing Smart Contract Evolution [0.7]
EvoChainはスマートコントラクトの進化を追跡し視覚化するためのフレームワークである。データ層、API層、ユーザインターフェース層で構成される。我々のデータセットは、約13万のアップグレード可能なプロキシと、約15,000の歴史的バージョンを含んでいる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:41:48 GMT)
Hierarchical Policy-Gradient Reinforcement Learning for Multi-Agent Shepherding Control of Non-Cohesive Targets [0.7]
非凝集性ターゲットのマルチエージェントシェパーディングのための分散強化学習ソリューションを提案する。提案アーキテクチャは,ターゲット選択とターゲット運転とを,近似ポリシ最適化を通じて統合する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:56:57 GMT)
Knowledge Graph Completion with Mixed Geometry Tensor Factorization [0.7]
低階テンソル近似を用いた知識グラフ補完のための新しい幾何学的手法を提案する。我々は、新しい双曲的相互作用項を持つタッカーテンソル分解に基づいて、事前訓練された、十分に確立されたユークリッドモデルを増強する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:54:43 GMT)
QUITS: A modular Qldpc code circUIT Simulator [0.6]
QUITSはQLDPCコードのためのモジュールで柔軟な回路レベルのシミュレータである。本稿では,Tremblay,Delfosse,Beverlandから改善したシンドローム抽出回路を提案する。現状のQLDPCコードとデコーダの性能を様々な設定で評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:14:13 GMT)
Pareto-Optimized Open-Source LLMs for Healthcare via Context Retrieval [0.6]
本研究は、低コストで高性能な医療AIのためのオープンソースのLarge Language Models(LLM)を強化するために、最適化されたコンテキスト検索を活用する。提案手法は, プロプライエタリモデルのコストのごく一部で, 医療質問応答における最先端の精度を実現することを実証する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:05:45 GMT)
Improving Counterfactual Truthfulness for Molecular Property Prediction through Uncertainty Quantification [0.6]
XAIの介入は、複雑なブラックボックスモデルの解釈可能性を改善することを目的としている。分子特性予測において、反事実的説明は予測行動を理解する方法を提供する。本研究では,不確実性の高い候補をフィルタするための不確実性推定手法の統合を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:07:30 GMT)
Imaginary eigenvalues of Hermitian Hamiltonian with an inverted potential well and transition to the real spectrum at exceptional point by a non-Hermitian interaction [0.6]
エルミート・ハミルトニアン(英語版)は、ヘルミート性は実スペクトルの十分条件であるという一般的な信念とは対照的に、虚固有値を持つことができる。非エルミート相互作用を持つ量子ハミルトニアンの古典的対応は、正準変数の複素函数である。これは変数の正準変換によって、ハミルトニアンの1対1の量子古典対応を示す実函数となる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:16:12 GMT)
Optimization of partially isolated quantum harmonic oscillator memory systems by mean square decoherence time criteria [0.6]
ハイゼンベルクの画像量子記憶は、デコヒーレンス水平線上で初期状態を維持する能力を利用する。系変数の重み付き平均二乗偏差に対する忠実度しきい値で以前に定義された量子メモリヒーレンス時間を用いて、このアプローチを部分的に分離されたサブシステムに適用する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:10:07 GMT)
The Myth of Immutability: A Multivocal Review on Smart Contract Upgradeability [0.6]
セキュリティと信頼性の促進のようなブロックチェーンプラットフォーム上のスマートコントラクトの不変性は、更新やバグ修正、デプロイ後の新機能の追加といった課題を提起する。学術研究や産業において様々なアップグレードメカニズムが提案されているにもかかわらず、それらのトレードオフと実践的意味に関する包括的な分析は欠如している。本研究の目的は,既存のスマートコントラクトアップグレードメカニズムを体系的に識別し,分類し,評価することである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:02:46 GMT)
CanonNet: Canonical Ordering and Curvature Learning for Point Cloud Analysis [0.6]
CanonNetは、2つの補完的なコンポーネントで構成される軽量ニューラルネットワークである。 CanonNetは、標準点の順序付けと配向を生成する前処理パイプラインである。また,ネットワークが正確な曲率値を持つ合成曲面から学習する幾何学的学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:58:57 GMT)
Compositionality Unlocks Deep Interpretable Models [0.5]
$chi$-netは、テンソルネットワークの合成多線形構造とディープニューラルネットワークの表現性と効率を組み合わせた、本質的に解釈可能なアーキテクチャである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:07:54 GMT)
Handover and SINR-Aware Path Optimization in 5G-UAV mmWave Communication using DRL [0.5]
UAV支援5G mmWave無線ネットワークにおける経路最適化のための新しいモデルフリーアクタ・アクタ・クリティック・ディープ・強化学習(AC-DRL)フレームワークを提案する。我々は、gNBに接続されたUAVが最短時間で所望の目的地への最適な経路を決定することができるAC-RLエージェントを訓練する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:28:04 GMT)
The Self-Learning Agent with a Progressive Neural Network Integrated Transformer [0.5]
本稿では,LLaMA 3.2とプログレッシブニューラルネットワーク(PNN)を統合し,対話型AIとコード生成の連続学習を行う自己学習エージェントを提案する。実験結果は適応性とメモリ安定性の向上を示し、このアプローチをAI(Artificial General Intelligence, AGI)に向けたスケーラブルなステップとして位置づけた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:13:31 GMT)
Quantization of nonlinear non-Hamiltonian systems [0.5]
量子論の発展において、ディラックらは古典的ハミルトニアン系が正準量子化(canonical Quantization)によって量子にマッピングできることに気付いた。ここでは、非ハミルトン系が同じ物理条件を尊重しながら体系的に量子化できるかどうかを論じる。開系理論の活用により、すべての系がリンドブラディアンの形で時間発展の物理的生成元を許すことを具体的に証明する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:25:41 GMT)
SemiISP/SemiIE: Semi-Supervised Image Signal Processor and Image Enhancement Leveraging One-to-Many Mapping sRGB-to-RAW [0.5]
本稿では,これらのタスクの画質を向上させるsRGB-to-RAW法を提案する。提案手法は,SRGB-to-RAW法による半教師付き学習により,様々なデータセット上での各種モデルの画質向上に成功している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:28:16 GMT)
Adaptive Student's t-distribution with method of moments moving estimator for nonstationary time series [0.5]
我々は最近提案された移動推定器の哲学に焦点を当てる。例えば、安価な指数移動平均を用いてパラメータを推定することができる。また、$rho(x)sim |x|-nu-1$尾形、極端な事象の確率を記述する$nu$の進化も提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:32:33 GMT)
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration [0.5]
IMPACT (Image Metric with Pretrained Model-Agnostic Comparison for Transmodality registration) は、マルチモーダル画像登録のための新しい類似度尺度である。大規模事前訓練セグメンテーションモデルから抽出した深い特徴の比較に基づいて意味的類似度尺度を定義する。胸椎CT/CBCTおよび骨盤MR/CTデータセットを含む5つの難易度3次元登録課題について検討した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:03:23 GMT)
Ontologies in Design: How Imagining a Tree Reveals Possibilites and Assumptions in Large Language Models [0.5]
価値に基づく分析は重要であるが、これらのシステムを分析する上ではあまり認識されていない。多元主義との実践に基づく関わりの必要性を示唆し、設計の方向性を検討するための4つの方向性を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:04:36 GMT)
Steiner Traveling Salesman Problem with Quantum Annealing [0.4]
シュタイナー旅行セールスマン問題(Steiner Traveling Salesman Problem、STSP)は、古典的な旅行セールスマン問題の変種である。 STSPのNPハード性を考えると、この問題に対処するための量子的アプローチを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:29:57 GMT)
Exploiting Unstructured Sparsity in Fully Homomorphic Encrypted DNNs [0.4]
プライバシーに敏感な環境でのディープニューラルネットワーク(DNN)は、完全同型暗号化(FHE)における計算オーバーヘッドによって制約される本稿では,FHE行列乗算法における非構造的空間性について,モデルの精度要件を維持しつつ,その負担を軽減する方法として検討する。本研究では,任意の行列乗法で空間空間を利用でき,全ての空間領域において,ベースラインナイーブアルゴリズムと比較して実行時利益が得られることを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:45:18 GMT)
Global-Order GFlowNets [0.4]
Order-Preserving (OP) GFlowNetsは、複雑なマルチオブジェクト(MOO)ブラックボックス最適化問題に対処することに成功した。我々は,Global-Order GFlowNetsを導入し,局所的な秩序をグローバルな秩序に変えることで,これらの対立を解決する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:43:52 GMT)
ZClip: Adaptive Spike Mitigation for LLM Pre-Training [0.4]
大規模言語モデル(LLM)のトレーニングには、勾配不安定性や損失スパイクなど、数多くの課題がある。定数法やノルム法のような従来の勾配クリッピング技術は、これらの問題に効果的に対処できない。本研究では,時間とともに勾配規範の統計的特性に基づいてクリッピング閾値を動的に調整する適応的勾配クリッピングアルゴリズムZClipを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:41:55 GMT)
Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole [0.3]
ギニアビサウクレオール(キリオール)の機械翻訳のための新しいデータセットについて紹介する。このデータセットは、主に宗教的なデータ(聖書とジェホバの証人からのテキスト)と、少数の一般ドメインデータ(辞書からの)で構成されている。学習時に対象領域から300の文を追加することで、翻訳性能が大幅に向上することがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:14:19 GMT)
Engineering Artificial Intelligence: Framework, Challenges, and Future Direction [0.3]
本稿では,「ABCDE」をエンジニアリングAIの重要な要素として紹介する。統一的で体系的なAIエコシステムフレームワークを提案する。本稿では,包括的視点を提供することで,AIの戦略的実装を進めることを目的とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:30:10 GMT)
A Study on Adversarial Robustness of Discriminative Prototypical Learning [0.2]
本稿では,Adv-DPNP (Adversarial Deep Positive-Negative Prototypes) という新たな対人訓練フレームワークを提案する。 Adv-DPNPは、差別的なプロトタイプベースの学習と敵の訓練を統合している。提案手法では, 正の試作アライメント, 負の試作反発, 整合正則化を組み合わせた複合損失関数を用いる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:42:58 GMT)
Flow State: Humans Enabling AI Systems to Program Themselves [0.2]
我々は,Human-AI共同設計を中心としたプラットフォームであるPocketflowを紹介した。 PocketflowはPythonフレームワークであり、意図的に最小限だが相乗的なコア抽象化セットの上に構築されている。非常に小さなコードしか持たない堅牢でベンダに依存しない基盤を提供し、明らかにオーバーヘッドを減らします。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:25:46 GMT)
The Potential of Citizen Platforms for Requirements Engineering of Large Socio-Technical Software Systems [0.2]
参加型市民プラットフォーム(Participatory citizen platform)は、政策立案と熟考型民主主義に市民をデジタル的により深く関与させる革新的なソリューションである。本稿では,要件工学と組み合わせたプラットフォームについて論じ,ソフトウェア工学の文脈におけるパイロット研究の道を開く。この論文は、公共セクターにおける大規模社会技術ソフトウェアシステムの研究にも貢献する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:25:25 GMT)
Explainable AI-Driven Detection of Human Monkeypox Using Deep Learning and Vision Transformers: A Comprehensive Analysis [0.2]
mpoxは動物園で流行するウイルス病で、公衆衛生に重大な影響を及ぼす。症状が麻疹や鶏痘の症状とどのように一致しているかから,早期臨床診断は困難である。深層学習(DL)技術と併用した医用画像は, 皮膚領域を解析することにより, 疾患検出の改善を約束している。本研究は,皮膚病変画像データセットを用いて,深層学習と視覚トランスフォーマーに基づくモデルをスクラッチからトレーニングする可能性について検討した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:45:22 GMT)
Optical and magnetic response by design in GaAs quantum dots [0.1]
量子ネットワーク技術は、ネットワークノードのコアコンポーネントとして単一の光子にスピン量子ビットとそのインターフェースを使用する。準ひずみのない局所液滴エッチングエピタキシー成長法により得られるGaAs量子ドット(QD)は、高いQD対称性を仮定することにより、スピンおよび光学特性を予測可能であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:43:01 GMT)
Safety-Aware Multi-Agent Learning for Dynamic Network Bridging [0.1]
エージェントは2つの移動目標間の通信経路を維持することを学ばなければならない。我々は,局所的な集合点更新による衝突回避を強制する制御理論安全フィルタを統合する。その結果,分散マルチエージェントタスクにおいて,局所的安全執行と分散学習を効果的に組み合わせることが示唆された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:25:41 GMT)
Tensor tree learns hidden relational structures in data to construct generative models [0.1]
テンソル木で表される量子波動関数の振幅として対象分布関数を表現して生成モデルを構築するための一般的な方法を提案する。 i)ランダムパターン、(ii)QMNIST手書き桁、(iii)ベイジアンネットワーク、(iv)S&P500における株価変動パターンのパターンである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:56:46 GMT)
Quantum Dissipative Continuous Time Crystals [0.1]
平均場理論では説明できない2つの異なる時間-結晶相が見つかる。そのうちの1つは、量子揺らぎの存在下でのみ現れる。提案モデルは、中性原子配列における相互作用するリドバーグ状態のレーザー駆動力学に直接適用される。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:41:45 GMT)
Self-bound monolayer crystals of ultracold polar molecules [0.1]
経路積分量子モンテカルロシミュレーションを用いた超低温双極子分子の物理について検討する。我々の計算は、以前予想されていたよりも低い相互作用強度で自己バウンド量子滴の形成を予測する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:23:58 GMT)
Phases and phase transition in Grover's algorithm with systematic noise [0.0]
我々は、系統的なノイズの存在下で、標準量子アルゴリズム(Grover's algorithm for unordered search on $L$ qubits)を考える。 RMT解析は多体ダイナミクスの相転移と相転移の解析的予測を可能にする。我々は、コールド原子、閉じ込められたイオン、超伝導プラットフォームを含む現実的な量子コンピュータにおける非システムノイズとの関連についてコメントする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:15:27 GMT)
State-of-the-Art Translation of Text-to-Gloss using mBART : A case study of Bangla [0.0]
聴覚障害と愚かな人口は170万人であるにもかかわらず、バングラ手話(BdSL)は未調査領域である。ドイツとアメリカで使われている文法規則に基づくグロス生成からインスピレーションを得て,BdSLに適応する。トレーニング済みmBART-50とmBERT-multiclass-uncasedモデルをデータセット上で微調整した。私たちのmBART-50ファネチューンは、PHOENIX-14TベンチマークでState-of-the-Artのパフォーマンスを示しました。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:47:51 GMT)
Translation of Fetal Brain Ultrasound Images into Pseudo-MRI Images using Artificial Intelligence [0.0]
第3三期では、胎児の脳の複雑さは定量的データを抽出するために高い画像品質を必要とする。対照的に、MRI(MRI)は優れた画像品質と組織分化を提供するが、利用できなく、高価であり、時間を要する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:59:33 GMT)
Towards Assessing Deep Learning Test Input Generators [0.0]
本稿では,TIG(State-of-the-art Test Input Generators)の総合評価について述べる。この結果から,TIG間の堅牢性,テストケース生成のばらつき,計算効率などの重要なトレードオフが明らかになった。本稿では,特定の目的やデータセットの特徴に適合した適切なTIGを選択するための実践的ガイダンスを提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:06:55 GMT)
Topological response in open quantum systems with weak symmetries [0.0]
オープン量子系では、系の環境との相互作用は2種類の対称性をもたらす。弱い対称性は、物質の異なる相を区別するトポロジカルな応答を保護できることを示す。特に, 環境との結合は, 弱い対称性によって保護された状態への相転移を誘導できることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:10 GMT)
Topological Insights from State Manipulation in a Classical Elastic System [0.0]
外部ドライバと結合したグラニュラーを操作することにより, 2レベル弾性ビットにおけるベリー位相の制御された蓄積を示す。重要な成果は、様々な系の状態に対するベリー位相の計算であり、システムのトポロジカルな性質に関する洞察を明らかにすることである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:31:43 GMT)
Token-Driven GammaTune: Adaptive Calibration for Enhanced Speculative Decoding [0.0]
投機的復号化は大きな言語モデル推論を加速させる。 textitGammaTune と textitGammaTune+ を導入し,トークンの受入率に基づいて投機長を動的に調整する学習自由適応アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:31:40 GMT)
Thermodynamic Properties and Magnetocaloric Effect in a Rotating 2DEG under the Sagnac Effect [0.0]
我々は、有効質量(m*$)と重力質量(m_G$)の回転と区別がエネルギーレベルと熱力学特性に与える影響を分析する。我々は、磁場下での電子系の熱力学を理解するためには、回転効果と有効質量特性が重要であると結論づける。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:03:02 GMT)
The effect of curvature on local observables in quantum field theory [0.0]
時空の局所化領域における曲率による実場の2乗場振幅の期待値に対する先行順序補正を計算する。次に、粒子検出器モデルに適用し、局所場プローブにおける時空曲率の影響を定量化する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:02 GMT)
The Less Intelligent the Elements, the More Intelligent the Whole. Or, Possibly Not? [0.0]
線形外挿に基づく予測を行う能力を持つ捕食者と捕食者の両方を授けることで,新しい種類の動的平衡が現れることがわかった。単純なエージェントは複雑な集団的行動の出現を好むが、個人が互いの行動の1次微分を取る能力は、任意の順序の微分の集合計算を可能にすることを示唆する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:33:24 GMT)
The Author Is Sovereign: A Manifesto for Ethical Copyright in the Age of AI [0.0]
AIの時代、著者はアルゴリズムによるコンテンツスクラップ、"フェアユース"のような法的グレーゾーン、そして同意や補償なしに創造的な労働から利益を得るプラットフォームによって静かに浸食されている。この短い宣言は、著者が知的ドメインの主権を持つシステムという、過激な代替案を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:12:42 GMT)
Systematic Literature Review: Explainable AI Definitions and Challenges in Education [0.0]
説明可能なAI(XAI)は、ブラックボックスのアルゴリズムプロセスを透明なものにしようと試みている。本総説は,文学におけるXAIの諸定義について考察し,教育におけるXAIの課題について考察することを目的とする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:43:35 GMT)
SymDQN: Symbolic Knowledge and Reasoning in Neural Network-based Reinforcement Learning [0.0]
我々は既存のDuelDQNアーキテクチャを拡張した新しいモジュラーアプローチであるSymDQNを紹介する。モジュールはアクションポリシー学習をガイドし、強化学習エージェントが環境に関する推論と整合した振る舞いを表示できるようにする。我々のアーキテクチャは、性能とエージェントの精度の両方において、学習を大幅に改善することを示します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:51:11 GMT)
Suppression of decoherence dynamics by a dissipative bath at strong coupling [0.0]
オープン量子系におけるデコヒーレンスの制御は、量子コヒーレント効果に依存する量子技術の出現によって大きな関心を集めている。本研究では,非可換系の演算子を介して複数の浴槽に結合した系のデコヒーレンスダイナミクスについて検討する。浴室間の協調効果を生かして, 迅速な脱コヒーレンスを緩和するための新しい戦略を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:41:29 GMT)
Steve: LLM Powered ChatBot for Career Progression [0.0]
我々は、候補者がAIによる面接を実行して、現在のキャリアステージを評価し、コースワークをキュレートして、次のレベルに進むことができるプラットフォームを開発する。本手法は,事前定義されたキャリア・トラジェクトリ,関連スキル,そして,進歩に必要なスキルを得るための最善のリソースを推奨する手法を取り入れたものである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:24:22 GMT)
State Specific Measurement Protocols for the Variational Quantum Eigensolver [0.0]
本稿では,ハミルトニアン予想値の近似計算に依存する新しい測定プロトコルを提案する。測定回路における測定およびゲート深さの30%から80%の低減を実現する。これにより、スケーラブルで安価な測定プロトコルが提供され、物理的システムへの変分アプローチの適用が進展する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 20:32:43 GMT)
Simulation of Atomic Layer Deposition with a Quantum Computer [0.0]
エミュレータ上での量子計算によるジルコニウムの原子層堆積(ALD)の研究について述べる。 ALDプロセス制御は、スピントロニクス、ナノチューブ、再生可能エネルギー貯蔵など、いくつかの技術応用において重要である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:01:00 GMT)
Semiconductor Wafer Map Defect Classification with Tiny Vision Transformers [0.0]
ウエハ欠陥分類に最適化された軽量ビジョントランス (ViT) フレームワークであるViT-Tinyを提案する。 ViT-Tinyは、MSF-TransやCNNベースのアーキテクチャなど、ViT-BaseとSOTA(State-of-the-art)モデルよりも優れている。 98.4%のF1スコアを達成し、4つの欠陥分類でMSF-Transを2.94%上回り、2つの欠陥分類では2.86%のリコールを改善し、3つの欠陥分類では3.13%の精度で精度を上げている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:18:00 GMT)
Semantic segmentation of forest stands using deep learning [0.0]
深層学習法はコンピュータビジョンにおいて大きな可能性を証明してきたが、森の起伏への応用は未解明のままである。本研究では,マルチクラスセグメンテーション問題としてのフレーミングスタンドデライン化と,U-NetベースのDLフレームワークの適用という,新しいアプローチを提案する。このモデルは、マルチスペクトル画像、ALSデータ、およびエキスパートインタプリタによって作成された既存のスタンドマップを用いて、訓練され評価された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:47:25 GMT)
Scar-induced imbalance in staggered Rydberg ladders [0.0]
本研究では, スタガードデチューニングを施した2脚はしご上でのリドベルク原子の運動論的拘束モデルについて検討した。 QMBSは、N'eel と Rydberg の真空初期状態のコヒーレントな多体再生と部位依存磁化ダイナミクスをもたらす。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:20:31 GMT)
Scaling Test-Time Inference with Policy-Optimized, Dynamic Retrieval-Augmented Generation via KV Caching and Decoding [0.0]
本稿では,動的検索戦略と強化微調整により,RAG(Retrieval-Augmented Generation)システムを強化する枠組みを提案する。我々のフレームワークは2つの補完手法を統合している: Policy-d Retrieval Augmented Generation (PORAG)とAdaptive Token-Layer Attention Scoring (ATLAS)。我々のフレームワークは幻覚を減らし、ドメイン固有の推論を強化し、従来のRAGシステムよりも優れた効率とスケーラビリティを実現する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 01:23:22 GMT)
SCMPPI: Supervised Contrastive Multimodal Framework for Predicting Protein-Protein Interactions [0.0]
PPI予測のための新しい教師付きコントラスト型マルチモーダルフレームワークSCMPPIを提案する。タンパク質配列の特徴とPPIネットワークトポロジー情報を統合することにより、SCMPPIはPPI予測性能を大幅に向上させる。酵母、ヒト、H.pyloriを含む8つのベンチマークデータセットの実験は、SCMPPIが既存の最先端手法よりも優れていることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:34:02 GMT)
Robust Randomized Low-Rank Approximation with Row-Wise Outlier Detection [0.0]
そこで本研究では,行ワイド逆転汚損が存在する場合に,下層の低ランク構造を効率よく復元する,スケーラブルで非定性なアルゴリズムを提案する。我々のアプローチは、次元を劇的に減らしながらクリーンな行の幾何学を保存する。ランダムスケッチとロバストな統計値を組み合わせることで、崩壊した行が多数存在する場合でも、効率よく正確な分解が得られることが実証された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:43:27 GMT)
Responsible Development of Offensive AI [0.0]
本研究は、リスクに対する社会的利益のバランスをとるための優先順位を確立することを目的とする。この研究で評価された攻撃的AIの2つの形態は、Capture-The-Flag問題を解決する脆弱性検出エージェントとAIを利用したマルウェアである。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:37:38 GMT)
Reservoir Computing: A New Paradigm for Neural Networks [0.0]
1940年代初頭、最初の人工ニューロンモデルは純粋に数学的概念として作られた。リカレントニューラルネットワーク(RNN)は、従来のニューラルネットワークの困難を悪化させる。これらの問題の解決策として、Reservoir Computingが登場します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:34:51 GMT)
Quantum theory does not need complex numbers [0.0]
量子論には複素数が必要であるという決定的な議論が提示された。実数のみに基づく量子論の定式化が可能であることを示す。複素数は量子論における単なる便利さであると結論付ける。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:53:19 GMT)
Quantum synchronization blockade induced by nonreciprocal coupling [0.0]
2つの非相互結合量子ファンデルポル発振器のセットアップにおける3つの競合同期機構の相互作用について検討する。散逸性相互作用は反相ロックを引き起こすが、コヒーレント相互作用は双安定相ロックと活性状態を育てる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:29:32 GMT)
Quantum shockwave at the quasi-relativistic resonance [0.0]
強エネルギー散逸を伴う衝撃波の形での量子波関数特異点に強い長手場が導かれることを示す。グラフェン中のディラック電子は, 有効質量が小さいため, 特に強い効果を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:41:39 GMT)
Quantum many-body thermal machines enabled by atom-atom correlations [0.0]
超低温原子ガス中の2次原子-原子相関により直接動作可能な量子多体熱機械のクラスについて検討する。熱機関, 冷凍機, 熱加速器, ヒーターなど, これらの熱機械を意図した状態に作動させることは, 原子と原子の相関がなければ不可能であることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:56:19 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0]
本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:32:13 GMT)
Quantum Key Distribution over Complex Networks [0.0]
既存のファイバーネットワーク上での量子鍵分布(QKD)について検討する。信頼性のあるノードを持つネットワークと、連続可変(CV)スキームに焦点を当てる。しかし, 実効CVネットワークでは, キーレートの急激な減衰により, 小空間やハブの存在など, 複雑なネットワークの特異な特性の多くが失われる。これらの特性はCVプロトコルとDVプロトコルの両方からなるハイブリッドネットワークを考慮すると復元できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:05:44 GMT)
Quantum Generative Models for Image Generation: Insights from MNIST and MedMNIST [0.0]
本稿では,固有量子発生雑音と調整ノイズスケジューリング機構の2つの新しいノイズ戦略を紹介する。我々は,MNISTデータセットとMedMNISTデータセットのモデル評価を行い,その実現可能性と性能について検討した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:40:26 GMT)
Quantum Deep Sets and Sequences [0.0]
本稿では、量子機械学習ツールボックスを拡張した量子深層集合モデルを提案する。このモデルのためにいくつかの変種が提示される。量子深集合とシーケンス(QDS)の有効性と汎用性を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:14:17 GMT)
Quantum Algorithm for Green's Functions Measurements in the Fermi-Hubbard Model [0.0]
本稿では,量子回路に適応したKubo式と,Hubbardモデルを用いた新しい量子アルゴリズムを提案する。これは、フェルミオン作用素の双線型のみを使用してグリーンのクラスタ関数に直接アクセスすることができ、アダマールテストの使用を回避できる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:31:48 GMT)
Quantized Markov chain couplings that prepare Qsamples [0.0]
マルコフ連鎖を定量化する新しい手法を提案する。この手法はマルコフ連鎖結合法に基づいている。量子写像の収束時間はマルコフ連鎖のカップリング時間に直接関係していることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:48:47 GMT)
Photon distillation schemes with reduced resource costs based on multiphoton Fourier interference [0.0]
複数の不完全光子からの不明瞭な誤差を低減した単一光子を調製する,光子蒸留を実現するためのスケーラブルなスキームを提案する。提案方式は1ステップで任意のエラー低減を実現し,プロトコルの複数ラウンドの必要性を解消する。このスキームは、フォトニック量子コンピュータにおける誤り訂正符号のしきい値を高め、フォトニック量子コンピュータを構築するのに必要なリソースを削減する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:14:04 GMT)
POE-$Δ$: a framework for change engineering [0.0]
本研究は, 新たな枠組みのモチベーション, 理論的基礎, 特性, 評価について論じる。 POE-$Delta$は設計とエンジニアリングに根ざしており、変更問題の表現、構造化、探索のための体系的なサポートを提供することを目的としている。 POE-$Delta$を定義し評価するために10年以上にわたってデザインサイエンスリサーチの方法論が適用された。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:28:06 GMT)
Online Multivariate Regularized Distributional Regression for High-dimensional Probabilistic Electricity Price Forecasting [0.0]
オンライン多変量正規化分布回帰モデルを提案する。オンライン推定では、バッチフィッティングの80倍から400倍のスピードアップが得られる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:08:51 GMT)
On the Clustering of Conditional Mutual Information via Dissipative Dynamics [0.0]
条件付き相互情報(CMI)は、多体系における量子相関を特徴づける重要な量として注目されている。 CMIは有限温度ギブス状態において急速に崩壊すると考えられている。これまでの研究は、クラスタ展開技術を用いた高温体制でこの問題に対処した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:06:55 GMT)
On shallow feedforward neural networks with inputs from a topological space [0.0]
位相空間(TFNN)からの入力を用いたフィードフォワードニューラルネットワークの研究浅い TFNN に対する普遍近似定理を証明し、この位相空間上で定義された任意の連続函数を近似する能力を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 06:48:46 GMT)
Objective Reduction of the Wave Function Demonstrated on Superconducting Quantum Compute [0.0]
超伝導トランスモン量子ビットを用いた波動関数崩壊実験について述べる。実験では、この測定結果を用いて、推定10e-12kgの質量を約1mm離れた2つの場所の1つに移動させた。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:32:19 GMT)
Numerical Framework for Multimode Jaynes- and Tavis-Cummings Models Incorporating the Modified Langevin Noise Formalism: Non-Markovian Analysis of Atom-Field Interactions in Dissipative Electromagnetic Environments [0.0]
本稿では,Langevinノイズフォーマリズムを多モードJaynes-およびTavis-Cummingsモデルに統合する新しい数値フレームワークを提案する。提案手法は従来の量子マスター方程式では説明できない非マルコフ原子動力学を捉える。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:00:32 GMT)
Noise-Affected Dynamical Quantum Phase Transitions [0.0]
量子位相遷移(DQPT)に対する非相関ノイズの影響について, 2つの異なるシナリオにおいて, 臨界点にまたがる量子ランプによる検討を行った。まず、臨界駆動磁場によるXYモデルの緩やかな傾斜に対して、Loschmidt振幅が時間内に全領域で消失する興味深い反直観現象が発生することを示す。また、DQPTが完全に消滅する限界ランプ速度と、標準DQPTを持つレジームと臨界領域を時間的に分離する臨界ランプ速度は、共に普遍的なスケーリング関数によって記述されることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:54:52 GMT)
No Free Lunch with Guardrails [0.0]
我々は,現行のガードレールが実用性を維持しつつ誤用を効果的に防ぐかどうかを評価する。調査の結果,ガードレール付き無料ランチは存在せず,セキュリティ強化がしばしばユーザビリティの犠牲となることが確認された。ユーザビリティを維持しつつリスクを最小限に抑える優れたガードレールを設計するための青写真を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:34:57 GMT)
Monitored Fluctuating Hydrodynamics [0.0]
グローバル対称性の存在下では、これらの条件アンサンブルが測定誘起シャープニングの相転移を受ける可能性があることを示す。拡散多体量子系に対する既知の電荷吸収遷移の単純な流体力学的導出を与える。我々の定式化は、自然に電流や密度勾配などの一般的な観測値を監視し、鋭い遷移の情報理論的診断を直接計算することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:19:18 GMT)
Measure-independent description of wave-particle duality via coherence [0.0]
コヒーレンスによる測度非依存の相補関係を提供する。我々の関係は波動粒子の双対性と量子コヒーレンスの関係を明らかにし、またコヒーレンスを正当化する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:09:31 GMT)
Magic State Injection with Erasure Qubits [0.0]
消去量子ビットは、フォールトトレラント量子コンピューティングに必要な膨大なリソースに取り組むための有望なアプローチである。我々は,この研究を,フォールトトレラント量子計算の重要かつ資源集約的なコンポーネントであるマジックステートインジェクション(マジックステートインジェクション)に拡張する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:01 GMT)
Lower bounds on entanglement entropy without twin copy [0.0]
我々は、断熱的に準備された基底状態のビットストリングと関連するシャノンエントロピー$S_ABX$を計算する。広い範囲の格子間隔とデチューニングにおいて、$IX_AB$は通常、$S_AvN$が大きい地域では$S_AvN$より20%低い。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:00:23 GMT)
Low Rank Factorizations are Indirect Encodings for Deep Neuroevolution [0.0]
低ランク化ニューロエボリューション(低ランク化ニューロエボリューション:低ランク化ニューロエボリューション:低ランク化ニューロエボリューション:低ランク化ニューロエボリューション:低ランク化ニューロエボリューション)を導入する。本稿では,トランスフォーマを用いた言語モデリングタスクと,連続的かつ離散的な視覚に基づく強化学習タスクについて評価する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:31:48 GMT)
Logarithmic entanglement lightcone from eigenstate correlations in the many-body localised phase [0.0]
固有状態相関の枠組みを用いて時間進化作用素の演算子絡みについて検討する。このアプローチは、MBL系における固有状態相関と創発的絡み合い構造との基本的な関係を明らかにする。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:57:10 GMT)
Localized Definitions and Distributed Reasoning: A Proof-of-Concept Mechanistic Interpretability Study via Activation Patching [0.0]
本研究は, CLAP(Activation Patching)による因果層属性を用いたGPT-2モデルにおける知識表現の局所化について検討する。 CLAPは、正しい回答生成に責任を負う重要な神経層を特定する。最終出力層が完全に復元された精度(100%回復)にパッチを当てると、定義的知識が局所化されることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:54:50 GMT)
Local-density correlation functional from the force-balance equation [0.0]
我々は,力バランス方程式に基づく基底状態の解析的相関エネルギー関数を導出する。この関数は、同質電子ガスの局所密度相関と比較し、原子系の性能が向上することを示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:54:32 GMT)
LiDAR-based Object Detection with Real-time Voice Specifications [0.0]
本稿では,リアルタイム音声仕様を用いたLiDARオブジェクト検出システムを提案する。 3000サンプルのサブセットで87.0%の精度を達成し、200サンプルのベースラインである67.5%を超えている。 Tkinterのプロトタイプは、Edge TTS(en-IN-PrabhatNeural)と3Dビジュアライゼーションとリアルタイムフィードバックを使って、インドの男性による自然な音声出力を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:50:38 GMT)
Learning and Improving Backgammon Strategy [0.0]
オンライン手法とオフライン手法の特徴を組み合わせた新しい学習手法が提示される。現在のチャンピオンである人間やコンピュータのバックギャモンプレイヤーと同じくらい、あるいはおそらくは良いレベルのプレーが達成されている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:27:22 GMT)
Language Models reach higher Agreement than Humans in Historical Interpretation [0.0]
本稿では,人間による歴史的アノテーションと大規模言語モデルの比較を行う。この結果はどちらも文化的な偏見を呈していることを示しているが、大きな言語モデルは短い文章からの歴史的事実の解釈についてより深いコンセンサスを達成している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:37:45 GMT)
LLMs as Deceptive Agents: How Role-Based Prompting Induces Semantic Ambiguity in Puzzle Tasks [0.0]
この研究は人気のパズルゲーム"Connections"にインスパイアされている。ゼロショットプロンプト、ロールインジェクトされた逆転プロンプト、ヒューマンクラフトの例を比較した。明示的な対立エージェントの挙動が意味的曖昧さを著しく高めることを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 03:45:58 GMT)
LLM-Guided Evolution: An Autonomous Model Optimization for Object Detection [0.0]
機械学習では、ニューラルネットワークサーチ(NAS)はモデル設計のドメイン知識と、有望なパフォーマンスを達成するために大量の試行錯誤を必要とする。 Large Language Model (LLM)-Guided Evolution (GE)フレームワークは、CIFARデータ上の画像分類アルゴリズムのモデルソースコードを直接修正するためにLLMを組み込むことによって、このアプローチを変革した。 LLM-GEは平均平均精度を92.5%から94.5%に向上させるなど,大幅な性能向上を図った。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 05:06:06 GMT)
Isospectral oscillators as a resource for quantum information processing [0.0]
超対称性量子力学の枠組みで見られるように、高調波振動子に量子系をアイソスペクトルとして扱う。我々はその非ガウス性を定量化し、その非古典性を評価する。逆に、非ガウス的および非古典的定常状態が得られ、これらの特徴は非ゼロ温度で持続する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:00:01 GMT)
Integrating Identity-Based Identification against Adaptive Adversaries in Federated Learning [0.0]
Federated Learning(FL)は、プライバシ保護、分散機械学習のための有望なパラダイムとして登場した。このような脅威の1つは、脆弱性クライアントの再接続(RMC)の存在である。これはFLのオープン接続を利用して、修正された攻撃戦略でシステムに再接続する。 FL環境におけるセキュリティ対策としてIBI(Identity-Based Identification)の統合を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:58:27 GMT)
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant [0.0]
大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声ベースのタスクへの応用は依然として困難である。本稿では,音声とテキストのインターリーブシーケンスをシームレスに処理する混合モーダルモデルを提案する。本稿では,多言語音声認識データセットの事前学習を含む包括的学習手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:57:22 GMT)
Hybrid Deep Learning Model to Estimate Cognitive Effort from fNIRS Signals in Educational Game Playing [0.0]
本研究では,ハイブリッド深層学習モデルを用いて,機能的近赤外分光法(fNIRS)データと性能スコアに基づく認知的努力を推定する。相対的神経効率(RNE)と相対的神経関与(RNI)は、認知活動を表すために用いられる2つの指標である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:54:59 GMT)
How Artificial Intelligence Leads to Knowledge Why: An Inquiry Inspired by Aristotle's Posterior Analytics [0.0]
この研究は、人工知能の中でアリストテレスの知識と知識の区別を明らかにするために、因果系の理論的枠組みを導入する。外部介入の効果を予測することは、なぜかという知識だけで実現可能であり、そのようなタスクに必要な知識をより正確に理解することができると論じている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:37:05 GMT)
Hong-Ou-Mandel interference of more than 10 indistinguishable atoms [0.0]
ホン・ウー・マンデル効果は多くの区別できない粒子にまで広がり、複雑な干渉パターンをもたらす。ここでは、無視できない損失を持つ系において、最大12個の識別不可能な中性原子との干渉を実証する。我々の手法は、非常に大きな数にスケールする可能性を提供し、区別不可能な粒子を持つ量子情報やハイゼンベルク制限原子干渉計における有望な応用を提示する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:30:05 GMT)
High-dimensional ridge regression with random features for non-identically distributed data with a variance profile [0.0]
高次元回帰フレームワークにおけるランダム特徴モデルの振る舞いは、機械学習の文献に注目される問題となっている。非イド特徴ベクトルの設定におけるランダム特徴モデルの性能について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:20:08 GMT)
Harnessing Nonlinear Dynamics for Time-Driven Berry Phase in Classical Systems [0.0]
本研究では, 2つの球状顆粒からなる古典非線形系における時間駆動ベリー相の蓄積について検討した。我々は,系の弾性特性をブロッホ状態にマッピングする摂動モデルを開発し,周波数依存ベリー位相の理論的予測を検証した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:07:12 GMT)
Graphs are everywhere -- Psst! In Music Recommendation too [0.0]
グラフはジャンルベースのレコメンデーションを強化する上で重要な役割を果たす。本研究では,グラフ畳み込み学習におけるグラフ畳み込みネットワーク(GCN),グラフSAGE,グラフトランスフォーマー(GT)モデルの有効性について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 14:00:52 GMT)
Graph Attention for Heterogeneous Graphs with Positional Encoding [0.0]
グラフニューラルネットワーク(GNN)は、グラフデータモデリングのデファクトスタンダードとして登場した。この研究は、異種グラフの最も効果的な方法を特定するために、様々なGNNアーキテクチャをベンチマークする。その結果,これらの作業においてグラフ注意ネットワークが優れていることがわかった。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:02 GMT)
Finite steady-state current defies non-Hermitian many-body localization [0.0]
非エルミート多体ローカライゼーション(NH MBL)は、オープンシステムにおける安定なローカライゼーションのシナリオとして考えられる。本研究では,不規則な非エルミート型XXZスピン鎖の輸送特性について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:24:39 GMT)
Federated Learning in Adversarial Environments: Testbed Design and Poisoning Resilience in Cybersecurity [0.0]
本稿では,フェデレート・ラーニング(FL)テストベッドの設計と実装に焦点をあて,サイバーセキュリティの応用と毒性攻撃に対するレジリエンスの評価に焦点をあてる。 Flowerフレームワークを実行することでRaspberry PiとNvidia Jetsonハードウェアを使用して構築されたテストベッドは、さまざまなFLフレームワークの実験を容易にし、パフォーマンス、スケーラビリティ、統合の容易さを評価します。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 19:24:17 GMT)
FedMSE: Semi-supervised federated learning approach for IoT network intrusion detection [0.0]
IoTの台頭によりサイバー攻撃面が拡大し、データ可用性、計算リソース、転送コスト、特にプライバシ保護に関する懸念から、従来の集中型機械学習手法が不十分になった。 Shrink AutoencoderとCentroid One-class Classifier(SAE-CEN)を組み合わせた半教師付きフェデレーション学習モデルを開発した。このアプローチは,通常のネットワークデータを効果的に表現し,分散戦略における異常を正確に識別することにより侵入検知性能を向上させる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:16:55 GMT)
Feature Engineering on LMS Data to Optimize Student Performance Prediction [0.0]
本稿では,地域総合大学学習管理システム(LMS)の成績とログインデータから,工学的特徴について考察する。私たちは、これらの特徴を機械学習に活用するための、多数のエンジニアリングされた機能とアプローチを比較します。より包括的な学生のパフォーマンスモデルにこれらの特徴を含めることの意味を要約して結論付ける。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:11:42 GMT)
Extending CREAMT: Leveraging Large Language Models for Literary Translation Post-Editing [0.0]
本研究では,大規模言語モデル(LLM)による後編集文体翻訳の実現可能性について検討する。以上の結果から,LLM生成後翻訳は人間の翻訳に比べて編集時間を大幅に短縮し,創造性も向上した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:48:09 GMT)
Explainable Artificial Intelligence (XAI) for Malware Analysis: A Survey of Techniques, Applications, and Open Challenges [0.0]
説明可能なAI(XAI)は、強力な検出能力を保ちながら、モデルの解釈可能性を向上させることで、このギャップに対処する。我々は,既存のXAIフレームワーク,マルウェア分類・検出への応用,およびマルウェア検出モデルをより解釈可能なものにする上での課題について検討する。この調査は、サイバーセキュリティにおけるMLのパフォーマンスと説明可能性のギャップを埋めようとしている研究者や実践者にとって、貴重なリソースとなる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 22:09:42 GMT)
Evaluating AI Recruitment Sourcing Tools by Human Preference [0.0]
本研究では,AI駆動型採用ソーシングツールの性能評価を目的としたベンチマーク手法を提案する。私たちはデータセットを作成して、主要なAIベースのソリューションであるLinkedIn Recruiterと当社独自のシステムであるPearch.aiによって生成された検索結果の比較分析を実行しました。我々は、AIに基づく評価と人間の判断を強く関連付け、高度なAI技術が人材獲得の有効性を大幅に向上させる可能性を強調した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:33:43 GMT)
Ethics of Blockchain Technologies [0.0]
この章は、ブロックチェーン倫理を技術倫理の幅広い分野に位置づけ、その目標と指針を概説する。次に、パーミッションレスシステム、インセンティブメカニズム、プライバシの懸念など、ブロックチェーンアプリケーションのユニークな倫理的課題について検討する。第三に、ブロックチェーンの倫理はエンジニアリングの規律としてアプローチされるべきであり、複雑なシステムにおけるトレードオフの分析と設計を強調している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:36:12 GMT)
Enhancing Air Quality Monitoring: A Brief Review of Federated Learning Advances [0.0]
本稿では,大気環境モニタリングにおけるフェデレートラーニングの応用について概説する。汚染物質を予測し、環境データを管理する効果を強調している。本稿は、通信オーバーヘッド、インフラストラクチャ要求、一般化可能性の問題、計算複雑性、セキュリティ脆弱性などの課題を含む、この領域に適用されたFLの重要な制限も挙げている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:36:02 GMT)
Effective Mode Description for Macroscopic Fabry Pérot Cavities [0.0]
光学キャビティにおけるフォトニックモードの準連続性は、強い光・物質結合状態において効果的に振舞う。これらの有効モードのモード体積はFabry-P'erotキャビティミラーの物理面積に依存しないことを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:58:18 GMT)
Edge Intelligence for Wildlife Conservation: Real-Time Hornbill Call Classification Using TinyML [0.0]
本研究では,マレーシアにおけるホルンビル呼び出しの分類とモニタリングにおいて,機械学習,特にTinyMLが果たす重要な役割について検討する。提案手法は、音声データの事前処理、MFE(Mel-Frequency Energy)を用いた特徴抽出、Arduino Nano 33 BLEへのモデル展開を含む。このモデルはエッジインパルスを用いて訓練され、実際のテストを通じて検証され、ホルンビル種の同定において高い精度を達成する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:43:23 GMT)
Dual axis atomic magnetometer and gyroscope enabled by nuclear spin perturbation [0.0]
本研究では,1つの希ガス種とアルカリ種とのコマグネトメトリー法を提案する。自己補償を用いたよく知られた装置と似ているが、我々は高貴なガスを制御できる磁気パルスを導入する。これらの応用パルスは、磁気ノイズの影響を単に抑制するのではなく、我々のスキームを計測することができる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 23:27:37 GMT)
Distributional Semantics, Holism, and the Instability of Meaning [0.0]
大規模言語モデルは、いわゆる分散意味論的アプローチに基づいて構築される。ホリズムに対する標準的な反対は不安定性の代償である。言語モデルが示す不安定性は、単語間の関係の構造とスケールによって制約されていると論じる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:48:22 GMT)
Digital implementations of deep feature extractors are intrinsically informative [0.0]
我々は、統一された枠組みにおけるエネルギー伝播速度の上限を証明した。本研究では,1)離散領域入力信号を持つ特徴抽出器,2)畳み込みニューラルネットワーク(CNN)の散乱によるグローバル指数エネルギー減衰を示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:12:56 GMT)
Determining Sphere Radius through Pairwise Distances [0.0]
距離が誤差で測定されたときの半径を決定する最も一般的な場合を考える。解には必要最小限の 4 点と任意の N 個の点を用いる。我々は、対距離の行列を通して球の半径に対する新しい閉形式解を提供する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 07:15:15 GMT)
Dephasing-Induced Distribution of Entanglement in Tripartite Quantum Systems [0.0]
貯水池メモリは、マルチパーティント絡みに影響を及ぼすデコヒーレンスダイナミクスを弱める手段を提供する。量子系の非コヒーレンスに対する堅牢性は、絡み合いの分布に依存することを示す。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:03:12 GMT)
Delineate Anything: Resolution-Agnostic Field Boundary Delineation on Satellite Imagery [0.0]
大規模でマルチ解像度なインスタンスデータセットであるField Boundary Instance - 22Mデータセット(FBIS-22M)を紹介した。我々は、FBIS-22Mデータセットに基づいてトレーニングされたインスタンスセグメンテーションモデルであるDelineate Anythingを提案する。提案モデルでは,mAP@0.5で88.5%,mAP@0.5:0.95で103%の大幅な改善を実現した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:37:04 GMT)
Deep learning for music generation. Four approaches and their comparative evaluation [0.0]
メロディーの最初のセットは、言語モデルとして使用されるわずかに修正されたビジュアルトランスフォーマーニューラルネットワークによって生成される。第2の旋律は、チャットソナライゼーションと古典的なトランスフォーマーニューラルネットワークを組み合わせることで生成される。第3の旋律は、シリンジャーリズム理論と古典的なトランスフォーマーニューラルネットワークを組み合わせることで生成される。第4の旋律はOpenAIが提供するGPT3変換器を用いて生成される。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:51:07 GMT)
Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation [0.0]
本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 21:09:59 GMT)
Critical Scaling of the Quantum Wasserstein Distance [0.0]
量子臨界系の2つの基底状態間の量子ワッサーシュタイン距離が臨界スケーリングを示すことを示す。この結果は、物質の量子臨界相の基底状態の学習に影響を及ぼす。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 15:47:56 GMT)
Convex optimization over a probability simplex [0.0]
そこで我々は,確率的単純度よりも凸問題を最適化するために,新しい反復スキームCauchy-Simplexを提案する。 Cauchy-Simplex の各イテレーションは単純な操作で構成されており、高次元問題に適している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:58:05 GMT)
Comparative Analysis of Deepfake Detection Models: New Approaches and Perspectives [0.0]
この研究は、GenConViTモデルに焦点を当て、ディープフェイクを識別するための異なるアプローチを調査し、比較する。研究を文脈化するために、ディープフェイクの社会的および法的影響と、それらの創造と検出の技術的基礎に対処する。その結果、GenConViTは微調整後、精度(93.82%)と一般化能力において優れた性能を示した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 02:10:27 GMT)
Cognitive Prompts Using Guilford's Structure of Intellect Model [0.0]
大規模言語モデル(LLM)は強力な言語生成能力を示すが、しばしば構造化推論に苦しむ。本稿では,モデル応答の明瞭さ,コヒーレンス,適応性を向上させるために,SOIにインスパイアされた推論を強制する新しい認知促進手法を提案する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 09:08:48 GMT)
Bias in Large Language Models Across Clinical Applications: A Systematic Review [0.0]
大規模言語モデル(LLM)は、医療に急速に統合され、様々な臨床業務を強化することを約束している。本研究は, LLMの有病率, 出所, 徴候, 臨床的意義について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:32:08 GMT)
Beyond Conventional Transformers: The Medical X-ray Attention (MXA) Block for Improved Multi-Label Diagnosis Using Knowledge Distillation [0.0]
我々は,X線異常検出の課題に対処するための新しい注意機構である,医療用X線注意ブロック(MXA)を提案する。提案手法は曲線(AUC)の0.85の領域を達成し,ベースラインモデル(AUC)の0.66に比べて0.19の絶対的な改善を実現した。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 04:55:42 GMT)
Atrial constitutive neural networks [0.0]
本研究は,ニューラルネットワークを用いた心房組織の力学的挙動を特徴付ける新しい手法を提案する。健康なヒトの心房の2軸引張試験データに基づいて,最も適切な新素材モデルを自動的に発見する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:35:49 GMT)
Asymptotic Exceptional Steady States in Dissipative Dynamics [0.0]
熱力学限界における異常定常状態の禁忌シナリオにシステムがどのようにアプローチするかを示す。量子ジャンプの強度$W$をパラメータとして扱うと、物理値$W=1$の並外れた定常状態は、動的不安定の開始を示唆する臨界状態として理解される可能性がある。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:02 GMT)
Apparent teleportation of indistinguishable particles [0.0]
量子テレポーテーション(quantum teleportation)と近年の量子粒子テレポーテーション(quantum particle teleportation)という2つの現象が量子力学によって予測された。本稿では,第3のテレポーテーション現象について紹介する。これは標準模型の識別不能な素粒子と反粒子の自然な結果であると考えられる。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 16:42:54 GMT)
An optimal bound on long-range distillable entanglement [0.0]
蒸留可能なエンタングルメントの上限を$D$次元で証明する。回転不変な状態に対しては、境界は1/rD$に強化される。皮肉なことに、共形場論における空間状態は飽和から遠く離れており、蒸留可能な絡み合いはどのものよりも早く崩壊する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 18:00:00 GMT)
An Overview of Josephson Junctions Based QPUs [0.0]
超伝導ジョセフソン接合に基づく量子処理ユニットは、量子コンピューティングの大幅な進歩を約束する。しかし、それらはデコヒーレンス、スケーラビリティの制限、エラー修正オーバーヘッドといった重要な課題に直面している。本稿では,基本量子現象と実用工学的課題の両方を探求し,これらの課題を考察する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 11:26:52 GMT)
An Assessment of the CO2 Emission Reduction Potential of Residential Load Management in Developing and Developed Countries [0.0]
断続的な再生可能エネルギーが電力網を支配しており、2040年まで化石燃料を電力網から排出する主要な力であると予測されている。間欠的な再生可能エネルギーに基づくグリッドは、太陽と風の供給と電力需要の季節的ミスマッチによって挑戦される。我々は,開発途上国における住宅負荷管理からCO2削減を推定する文献を体系的にレビューした。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 17:55:12 GMT)
Advancing Air Quality Monitoring: TinyML-Based Real-Time Ozone Prediction with Cost-Effective Edge Devices [0.0]
本稿では, オゾン濃度をリアルタイムに予測する新しいTinyMLシステムを提案する。このシステムはArduino Nano 33 BLE Senseマイクロコントローラを使用し、一酸化炭素(CO)検出のためのMQ7センサーと温度と圧力測定のための内蔵センサーを備えている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:48:24 GMT)
Adaptive path planning for efficient object search by UAVs in agricultural fields [0.0]
本稿では,UAVを用いた農業分野における対象探索のための適応経路プランナを提案する。プランナーは、高高度の飛行経路を使用し、検出ネットワークが不確実である場合に、追加の低高度検査を計画する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:47:31 GMT)
Accelerating IoV Intrusion Detection: Benchmarking GPU-Accelerated vs CPU-Based ML Libraries [0.0]
Internet of Vehicles(IoV)は、高度な侵入検知システムを必要とするサイバーセキュリティ攻撃に直面する可能性がある。本稿では,従来のCPUベースの実装と比較して,GPUアクセラレーションライブラリ(cuML)の性能上の利点について検討する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 08:42:45 GMT)
A time-stepping deep gradient flow method for option pricing in (rough) diffusion models [0.0]
拡散モデルにおける欧州オプションの価格設定のための新しいディープラーニングアプローチを開発する。提案手法は,大額の金銭に対するオプション価格の振舞いを尊重し,オプション価格の既知境界に固執する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:52:37 GMT)
A quantum random access memory (QRAM) using a polynomial encoding of binary strings [0.0]
量子ランダムアクセスメモリ(QRAM)は量子オラクルを実現するための有望なアーキテクチャである。我々はQRAMの新しい設計を開発し、Clifford+T回路で実装する。我々は、Tカウントを減らし、クォービット数を同じにしながら、T深度を指数的に改善する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:18:43 GMT)
A Systematic Review of Security Vulnerabilities in Smart Home Devices and Mitigation Techniques [0.0]
この研究は、スマートホームエコシステムにおけるセキュリティの脅威を調査し、それらをネットワーク層、デバイスレベル、およびクラウドベースのAI駆動システムからの脆弱性に分類する。研究結果は、量子後暗号化とAI駆動の異常検出が組み合わさって、セキュリティを高めるのに非常に効果的であることを示している。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 00:03:53 GMT)
A Sensorimotor Vision Transformer [0.0]
Sensorimotor Transformer (SMT) は人間の眼球運動に触発された視覚モデルである。 SMTは、本質的な2次元(i2D)特徴に基づいて、最も健全なパッチを特定し、選択する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:37:44 GMT)
A Physics-Informed Meta-Learning Framework for the Continuous Solution of Parametric PDEs on Arbitrary Geometries [0.0]
任意の測地上での偏微分方程式(PDE)の連続およびパラメトリック解に対する暗黙的有限演算子学習(iFOL)を導入する。本稿では,連続パラメータと解空間のマッピングを確立するための物理インフォームドエンコーダデコーダネットワークを提案する。我々はこれらの特徴を批判的に評価し、定常PDEと過渡PDEの両方で見つからないサンプルに一般化するネットワークの能力を解析する。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 10:24:00 GMT)
A Framework for the Assurance of AI-Enabled Systems [0.0]
本稿では,AIシステムのリスク管理と保証のためのクレームベースのフレームワークを提案する。論文のコントリビューションは、AI保証のためのフレームワークプロセス、関連する定義のセット、AI保証における重要な考慮事項に関する議論である。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 13:44:01 GMT)
A Comparative Study of PDF Parsing Tools Across Diverse Document Categories [0.0]
DocLayNetデータセットを使用して、6つのドキュメントカテゴリで10の人気のあるPDF解析ツールを比較した。テキスト抽出では、PyMuPDFとpypdfiumは概して他のものよりも優れていたが、すべてのテキスト抽出は科学と特許の文書で苦労した。テーブル検出では、TATRは金融、特許、法と規制、科学のカテゴリーで優れている。
論文参考訳（メタデータ） (Thu, 03 Apr 2025 12:09:36 GMT)