Seeing World Dynamics in a Nutshell [132.8] NutWorldはモノクロ動画をダイナミックな3D表現に変換するフレームワークである。
我々は,NutWorldがリアルタイムにダウンストリームアプリケーションを実現しつつ,高忠実度ビデオ再構成品質を実現することを実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:59:52 GMT)
Lost in Edits? A $λ$-Compass for AIGC Provenance [120.0] 本稿では,実測出力と操作された出力を頑健に識別し,識別する新しい潜在空間属性法を提案する。
LambdaTracerは、InstructPix2Pixのようなテキスト誘導編集ツールによって自動化されるか、Adobe Photoshopのような編集ソフトウェアで手動で実行されるか、様々な反復編集プロセスで有効である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:24:25 GMT)
What Makes for Good Visual Instructions? Synthesizing Complex Visual Reasoning Instructions for Visual Instruction Tuning [111.0] マルチモーダル大言語モデル(MLLM)のゼロショット一般化能力向上に視覚的指導チューニングが不可欠である
我々は,高品質な視覚的推論命令を自動生成する体系的手法を開発した。
実験結果から, MLLMの強化性能が一貫した結果を得た。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:06:42 GMT)
Cliqueformer: Model-Based Optimization with Structured Transformers [102.6] 大規模なニューラルネットワークは予測タスクに優れるが、タンパク質工学や材料発見といった設計問題への応用には、オフラインモデルベース最適化(MBO)の問題を解決する必要がある。
機能的グラフィカルモデル(FGM)を用いてブラックボックス関数の構造を学習するトランスフォーマーベースのアーキテクチャであるCliqueformerを提案する。
化学および遺伝子設計タスクを含む様々な領域において、Cliqueformerは既存の方法よりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:16:48 GMT)
One-Prompt-One-Story: Free-Lunch Consistent Text-to-Image Generation Using a Single Prompt [101.2] テキスト画像生成モデルは、入力プロンプトから高品質な画像を生成することができる。
彼らはストーリーテリングのアイデンティティ保存要件の一貫性のある生成をサポートするのに苦労している。
本稿では,一貫したテキスト・画像生成のための新しいトレーニングフリー手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:32:22 GMT)
From Yes-Men to Truth-Tellers: Addressing Sycophancy in Large Language Models with Pinpoint Tuning [91.8] 大規模言語モデル(LLM)は、ユーザプロンプトへの順守を、妥当な応答よりも優先する傾向がある。
近年の研究では、教師付き微調整(SFT)を用いて、梅毒問題を軽減することが提案されている。
そこで本研究では,特定の目的のために関心のあるモジュールを調整した新しいピンポイントチューニング(SPT)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:09:32 GMT)
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights [89.6] より小規模な学生モデルの推論と反映の両方を教師モデルを用いて監督し,修正するフレームワークであるSuperCorrectを提案する。
第1段階では、教師モデルから階層的な高レベルかつ詳細な思考テンプレートを抽出し、よりきめ細かい推論思考を導き出す学生モデルを指導する。
第2段階では、学生モデルの自己補正能力を高めるために、クロスモデル協調直接選好最適化(DPO)を導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:47:11 GMT)
Virgo: A Preliminary Exploration on Reproducing o1-like MLLM [89.5] スロー思考推論システムは、推論中の思考時間をスケールすることで、広く注目を集めている。
マルチモーダル大規模言語モデル(MLLM)への適応にも関心が高まっている。
本稿では,少量のテキスト長文思考データを用いて,有能なMLLMを微調整することで,簡単なアプローチを探索する。
自然言語で表現されたこれらの長文推論プロセスは,MLLMに効果的に転送できることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:17:01 GMT)
WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [86.0] 大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:50:07 GMT)
Segment Any 3D Gaussians [85.9] 本稿では, 3次元ガウススプレイティング(3D-GS)に基づく高効率3Dプロンプト可能なセグメンテーション法であるSAGAについて述べる。
入力として2D視覚的プロンプトが与えられたとき、SAGAは対応する3Dターゲットを4ミリ秒以内に3Dガウスで表現できる。
我々は,SAGAが最先端の手法に匹敵する品質で,リアルタイムな多粒度セグメンテーションを実現することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:25:47 GMT)
Fast T2T: Optimization Consistency Speeds Up Diffusion-Based Training-to-Testing Solving for Combinatorial Optimization [83.7] 雑音レベルから与えられたインスタンスの最適解への直接写像を学習し、最小限のショットで高品質な生成を容易にすることを提案する。
これは、サンプル間の差を最小限に抑える最適化一貫性トレーニングプロトコルによって達成される。
The Traveling Salesman Problem (TSP) と Maximal Independent Set (MIS) は、ソリューションの品質と効率の両方に関して、Fast T2Tの優位性を実証している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:13:43 GMT)
LMFusion: Adapting Pretrained Language Models for Multimodal Generation [81.8] LMFusionは、事前訓練されたテキストのみの大規模言語モデル(LLM)をマルチモーダル生成機能で強化するフレームワークである。
複数モーダル生成モデルをスクラッチから事前訓練する手法と比較して, LMFusionは画像理解を20%改善し, 画像生成を3.6%改善し, FLOPの50%しか利用できないことを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:26:38 GMT)
FuXi-$α$: Scaling Recommendation Model with Feature Interaction Enhanced Transformer [81.1] 近年の進歩は、大規模レコメンデーションモデルに逐次レコメンデーションモデルを拡張することが効果的な戦略であることを示している。
これらの問題に対処するために、FuXi-$alpha$と呼ばれる新しいモデルを提案する。
我々のモデルは既存のモデルよりも優れており、モデルのサイズが大きくなるにつれてその性能は継続的に向上する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:46:54 GMT)
Mojito: Motion Trajectory and Intensity Control for Video Generation [79.9] 本稿では,テキスト・ビデオ生成のための運動軌跡と強度制御の両方を組み込んだ拡散モデルであるMojitoを紹介する。
実験は, 高精度な軌道制御と強度制御を高い計算効率で実現する上で, モジトの有効性を実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:06:37 GMT)
DreamDPO: Aligning Text-to-3D Generation with Human Preferences via Direct Preference Optimization [75.6] 人間の好みを3D生成プロセスに統合する最適化ベースのフレームワークであるDreamDPOを提案する。
DreamDPOは、きめ細かい制御性を実現しながら、正確なポイントワイドの品質評価への依存を減らす。
実験により、DreamDPOは競争力を発揮し、高品質で制御可能な3Dコンテンツを提供することが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:03:08 GMT)
Emulation of satellite up-link quantum communication with entangled photons [75.4] 我々は、極非縮退光子の超明るい光源を実証し、エミュレートされた高損失衛星シナリオにおいて量子鍵分布を行う。
先駆的なMiciusアップリンク実験の1つに対応するロスプロファイルと10kmのテレコムファイバーで区切られた地上のエンドユーザーにより、制限の1回のオーバーパスで5.2kbitのセキュアな鍵蓄積を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:14:55 GMT)
Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1] 本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:05:42 GMT)
Unanswerability Evaluation for Retrieval Augmented Generation [74.3] UAEval4RAGは、RAGシステムが解答不能なクエリを効果的に処理できるかどうかを評価するために設計されたフレームワークである。
我々は、6つの未解決カテゴリを持つ分類を定義し、UAEval4RAGは、多様で挑戦的なクエリを自動的に合成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:21:06 GMT)
Latent Space Energy-based Neural ODEs [73.0] 本稿では,連続時間列を表現するために設計された新しい深部力学モデルを提案する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
振動系, ビデオ, 実世界の状態系列(MuJoCo)の実験結果から, 学習可能なエネルギーベース先行モデルの方が既存のモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:54:13 GMT)
BARE: Combining Base and Instruction-Tuned Language Models for Better Synthetic Data Generation [71.5] 本研究では,ベースモデルの多様性とインストラクション学習モデルの品質を組み合わせた合成データ生成手法であるBase-Refineを提案する。
BARE生成データによる微調整は, GSM8Kの命令のみのデータよりも101%, RAFTのSOTA法より18.4%向上することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:15:19 GMT)
IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation [70.9] IterCompは、複数のモデルから合成対応モデルの好みを集約する新しいフレームワークである。
クローズドループ方式で構成性を向上する反復的フィードバック学習法を提案する。
IterCompは、拡散モデルと合成生成のための報酬フィードバック学習の新たな研究の道を開く。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:02:19 GMT)
OceanChat: The Effect of Virtual Conversational AI Agents on Sustainable Attitude and Behavior Change [70.2] 本論文では,大規模言語モデルを活用した対話型システムであるOceanChatについて述べる。
人類同型と種認証のバランスをとることで、OceanChatは、インタラクティブな物語が環境知識と現実世界の行動変化のギャップを埋める方法を示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:45:33 GMT)
LARM: Large Auto-Regressive Model for Long-Horizon Embodied Intelligence [68.3] 最近のエンボディエージェントは、主に強化学習(RL)または大規模言語モデル(LLM)に基づいて構築されている。
本研究では, 提案したレフェリーRLを, 開発した大規模自己回帰モデル(LARM)上で実施することにより, 欠点を回避しつつ, それらの利点を組み合わせる。
具体的には、LARMは軽量なLLM(5Bパラメータよりも小さい)上に構築され、テキストではなく次のアクションを直接出力する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:06:21 GMT)
QuantSpec: Self-Speculative Decoding with Hierarchical Quantized KV Cache [67.8] 大きな言語モデル(LLM)は、長いコンテキスト設定のためにエッジデバイスにデプロイされることが増えている。
これらのシナリオでは、キーバリュー(KV)キャッシュがGPUメモリとレイテンシの両方において主要なボトルネックとなっている。
そこで本研究では,ターゲットモデルのアーキテクチャを共有するが,階層的な4ビット量子化KVキャッシュと4ビット量子化重みを併用して高速化を行う,新たな自己推論型デコーディングフレームワークであるQuantSpecを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:43:48 GMT)
Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.6] 統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:55:45 GMT)
Do Large Language Model Benchmarks Test Reliability? [66.2] モデル信頼性の定量化について検討する。
信頼性評価におけるこのギャップにより、我々はいわゆるプラチナベンチマークの概念を提案する。
我々は、これらのプラチナベンチマークにおいて、幅広いモデルを評価し、実際、フロンティアLSMは、単純なタスクで失敗を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:58:19 GMT)
A Theoretical Analysis of Self-Supervised Learning for Vision Transformers [66.1] マスク付きオートエンコーダ(MAE)とコントラスト学習(CL)は異なる種類の表現をキャプチャする。
我々は,MAEとCLの両目的に対して,一層ソフトマックス型視覚変換器(ViT)のトレーニングダイナミクスについて検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:22:26 GMT)
ECM: A Unified Electronic Circuit Model for Explaining the Emergence of In-Context Learning and Chain-of-Thought in Large Language Model [64.2] In-Context Learning (ICL) と Chain-of-Thought (CoT) は、大規模言語モデルにおいて出現する能力である。
ICLとCoTをよりよく理解するための電子回路モデル(ECM)を提案する。
ECMは, 様々なプロンプト戦略において, LLMの性能を効果的に予測し, 説明する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:22:33 GMT)
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? [64.0] MME-RealWorldは、これまでで最大の手動アノテーション付きベンチマークであり、最も高解像度で、現実世界のアプリケーションに焦点を当てている。
私たちの結果は、最も先進的なモデルでさえベンチマークに苦戦していることを示しています。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:44:02 GMT)
Robust Autonomy Emerges from Self-Play [63.4] 我々は、前例のない規模のシミュレーションにおいて、頑健で自然主義的な運転が、完全に自己プレイから現れることを示す。
Gigaflowは、42年間の主観的な運転体験を1時間に合成し、訓練することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:41:05 GMT)
One Model to Rule them All: Towards Universal Segmentation for Medical Images with Text Prompts [62.6] 6502個の解剖学的用語を含む,ヒト解剖学上の最初のマルチモーダル知識ツリーを構築した。
トレーニングのために、最大かつ最も包括的なセグメンテーションデータセットを構築します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:01:45 GMT)
Pioneer: Physics-informed Riemannian Graph ODE for Entropy-increasing Dynamics [61.7] 幅広いエントロピー増加動的システムに対する物理インフォームドグラフODEを提案する。
我々は、物理法則に従って、証明可能なエントロピーの非減少を報告する。
実証的な結果は、実際のデータセット上でのPioneerの優位性を示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:54:30 GMT)
MJ-VIDEO: Fine-Grained Benchmarking and Rewarding Video Preferences in Video Generation [61.2] MJ-BENCH-VIDEOは,5つの重要な側面にわたる映像生成を評価するために設計された大規模ビデオ選好ベンチマークである。
我々は,MJ-VIDEO(Mixture-of-Experts-based video reward model)を提案する。
MJ-VIDEOは, 全体として17.58%, 15.87%の改善がみられた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:29:16 GMT)
General Time-series Model for Universal Knowledge Representation of Multivariate Time-Series data [61.2] 周波数領域で異なる時間粒度(または対応する周波数分解能)の時系列が異なる結合分布を示すことを示す。
時間領域と周波数領域の両方からタイムアウェア表現を学習するために,新しいFourierナレッジアテンション機構を提案する。
自己回帰的空白埋め込み事前学習フレームワークを時系列解析に初めて組み込み、生成タスクに依存しない事前学習戦略を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:20:04 GMT)
FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.2] 本稿では,セグメンテーションマスクの暗黙分布を表現するために,画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを紹介する。
本フレームワークは,セグメンテーションマスクの正確なサンプリングと関連する統計指標の計算を可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:35:14 GMT)
MentalArena: Self-play Training of Language Models for Diagnosis and Treatment of Mental Health Disorders [59.5] メンタルヘルス障害は世界で最も深刻な病気の1つである。
プライバシーに関する懸念は、パーソナライズされた治療データのアクセシビリティを制限する。
MentalArenaは、言語モデルをトレーニングするためのセルフプレイフレームワークである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:15:14 GMT)
Teaching Language Models to Critique via Reinforcement Learning [59.4] 我々は、textttCTRL$でトレーニングされた批評家が、パスレートを大幅に向上し、ベースモデルとより強力なジェネレータモデルの両方でエラーを軽減することを示した。
また、これらの批判モデルが正確な生成報酬モデルとして機能し、反復的批評・修正によるテストタイムスケーリングを可能にすることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:18:46 GMT)
Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework [59.1] 衣料品全体を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。
OutfitGANにはセマンティックアライメントモジュールがあり、既存のファッションアイテムと合成アイテムのマッピング対応を特徴付ける。
提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:13:53 GMT)
Towards Realistic Data Generation for Real-World Super-Resolution [59.0] RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:53:27 GMT)
Disentangling CLIP Features for Enhanced Localized Understanding [58.7] 提案するUnmix-CLIPは,相互特徴情報(MFI)の低減と特徴の絡み合いの改善を目的とした新しいフレームワークである。
COCO-14データセットでは、Unmix-CLIPは機能の類似性を24.9%削減している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:20:31 GMT)
Shot2Story: A New Benchmark for Comprehensive Understanding of Multi-shot Videos [58.5] マルチショットビデオ理解ベンチマークShot2Storyには、詳細なショットレベルのキャプション、包括的なビデオ要約、質問応答ペアがある。
予備実験では、マルチショットビデオの長大かつ包括的な要約を生成するための課題がいくつか示されている。
生成された不完全な要約は、既存のビデオ理解タスクにおいて、すでに競合的なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:57:59 GMT)
MotionAgent: Fine-grained Controllable Video Generation via Motion Field Agent [58.1] テキスト誘導画像-映像生成のための微粒なモーション制御を実現するMotionAgentを提案する。
キーとなる技術は、テキストプロンプトの動作情報を明示的な運動場に変換するモーション・フィールド・エージェントである。
我々はVBenchのサブセットを構築し、テキストと生成されたビデオの動作情報のアライメントを評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:26:07 GMT)
A Mirror Descent-Based Algorithm for Corruption-Tolerant Distributed Gradient Descent [57.6] 本研究では, 分散勾配降下アルゴリズムの挙動を, 敵対的腐敗の有無で解析する方法を示す。
汚職耐性の分散最適化アルゴリズムを設計するために、(怠慢な)ミラー降下からアイデアをどう使うかを示す。
MNISTデータセットの線形回帰、サポートベクトル分類、ソフトマックス分類に基づく実験は、我々の理論的知見を裏付けるものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:11:29 GMT)
CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing [57.0] CITERはトークンレベルのルーティング戦略を通じて、小規模および大規模言語モデル(SLMs & LLMs)間の効率的な協調を可能にする。
実時間および資源制約のあるアプリケーションに対して有望なソリューションを提供するため、CITERは高品質な生成を保ちながら推論コストを削減できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:26:35 GMT)
Weak-to-Strong Diffusion with Reflection [56.4] Weak-to-Strong Diffusion (W2SD) を提案し、理想モデルと強モデルとのギャップを近似する。
広範囲な実験により、W2SDは人間の嗜好、美的品質、即効性を改善することが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:01:26 GMT)
Masked Autoencoders Are Effective Tokenizers for Diffusion Models [56.1] MAETokは自己エンコーダであり、再構築の忠実さを維持しながら意味的にリッチな潜在空間を学習する。
MaETokは1.69のgFIDで76倍高速トレーニングが可能で、512x512世代で31倍高い推論スループットを実現している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:42:04 GMT)
All-in-One Image Compression and Restoration [55.3] 我々はオールインワン画像の圧縮と復元のための統一的なフレームワークを提案する。
様々な劣化に対する画像復元機能を画像圧縮のプロセスに組み込む。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:21:05 GMT)
Towards Automated Knowledge Integration From Human-Interpretable Representations [55.2] 我々は,情報メタ学習の原理を理論的に導入・動機付けし,自動的かつ制御可能な帰納バイアス選択を可能にする。
データ効率と一般化を改善するための情報メタラーニングのメリットと限界を実証的に示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:40:54 GMT)
CTR-Driven Advertising Image Generation with Multimodal Large Language Models [53.4] 本稿では,Click-Through Rate (CTR) を主目的とし,マルチモーダル大言語モデル(MLLM)を用いた広告画像の生成について検討する。
生成した画像のCTRをさらに改善するため、強化学習(RL)を通して事前学習したMLLMを微調整する新たな報酬モデルを提案する。
本手法は,オンラインとオフラインの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:06:02 GMT)
SPRI: Aligning Large Language Models with Context-Situated Principles [53.1] Situated-PRInciples (SPRI) は、各入力クエリに対して、リアルタイムでガイド原則を自動生成し、各レスポンスを整合させるように設計されている。
我々は,SPRIを3つのタスクで評価し,SPRIが複雑なドメイン固有のタスクの原理を導出できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:32:29 GMT)
A Complexity-Based Theory of Compositionality [53.0] AIでは、構成表現は配布外一般化の強力な形式を可能にすることができる。
ここでは、構成性に関する直観を考慮し、拡張する構成性の公式な定義を提案する。
この定義は概念的には単純で量的であり、アルゴリズム情報理論に基礎を置いており、あらゆる表現に適用できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:11:18 GMT)
Interactive Visualization Recommendation with Hier-SUCB [52.1] 本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:14:45 GMT)
AttNS: Attention-Inspired Numerical Solving For Limited Data Scenarios [51.9] 限定データによる微分方程式の解法として,注目型数値解法(AttNS)を提案する。
AttNSは、モデル一般化とロバスト性の向上におけるResidual Neural Networks(ResNet)のアテンションモジュールの効果にインスパイアされている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:23:15 GMT)
Position: Multimodal Large Language Models Can Significantly Advance Scientific Reasoning [51.1] MLLM(Multimodal Large Language Models)は、テキスト、画像、その他のモダリティを統合する。
本稿では,MLLMが数学,物理,化学,生物学などの分野にまたがる科学的推論を著しく前進させることができることを論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:05:27 GMT)
FedMobileAgent: Training Mobile Agents Using Decentralized Self-Sourced Data from Diverse Users [50.8] 我々はFedMobileAgentを提案する。FedMobileAgentは、多様なユーザーからの自己ソースデータを用いてモバイルエージェントを訓練するフレームワークである。
分散環境では、FedMobileAgentは集中型人間アノテーションモデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:26:17 GMT)
TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation [50.2] 本稿では,メタラーニングフレームワークにおける textbfDataset textbfDistillation 手法である textbfTD3 を紹介する。
TD3は、オリジナルのデータから完全に表現力のある合成配列の要約を蒸留する。
拡張技術により、学習者は合成要約を忠実に適合させ、アンプループでの正確な更新を確実にすることができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:13:25 GMT)
SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer [50.0] 本稿では,テキスト・画像生成における効率的なスケーリングを実現する線形拡散変換器であるSANA-1.5を提案する。
効率的なトレーニングスケーリング、モデルの深さ決定、推論時間スケーリングの3つの重要なイノベーションを紹介します。
これらの戦略を通じて、SANA-1.5はGenEvalのテキスト計算画像アライメントスコア0.72を達成し、推論スケーリングによりさらに0.80に改善できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:23:36 GMT)
Efficient and Flexible Neural Network Training through Layer-wise Feedback Propagation [49.4] ニューラルネットワークのような予測器のための新しいトレーニング原理であるLFP(Layer-wise Feedback Propagation)を提案する。
LFPは、与えられたタスクの解決へのそれぞれの貢献に基づいて、個々のニューロンに報酬を分解する。
提案手法は,ネットワークの有用な部分を補強し,有害な部分を弱めるという欲求的アプローチを実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:37:52 GMT)
Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.4] 知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:04:33 GMT)
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads [49.1] スパースアテンションは、コンテキスト内のトークンのサブセットに選択的に出席する。
スパース・アテンションが今日の大規模言語モデルでモデルの品質を維持することができるかどうかは不明だ。
本稿では,Sparsely-Sharded(S2) attention, a Triton library that provide kernel optimization for sparse attention for sparse attention to customizable per-head and per-context-range levels。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:39:43 GMT)
LoCA: Location-Aware Cosine Adaptation for Parameter-Efficient Fine-Tuning [47.8] 位置認識コサイン適応(LoCA)は離散逆コサイン変換(iDCT)に基づく新しい周波数領域パラメーター効率微調整法である
分析の結果,周波数領域を慎重に選択した周波数領域近似は,従来の低ランク手法の表現率を上回ることが判明した。
多様な言語および視覚的微調整タスクの実験は、LoCAが低ランク法に匹敵する計算能力を維持しながら、パラメータ効率を向上することを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:14:34 GMT)
An Augmented Backward-Corrected Projector Splitting Integrator for Dynamical Low-Rank Training [47.7] 必要なQR分解数を削減できる新しい低ランクトレーニング手法を提案する。
提案手法は,プロジェクタ分割方式に拡張ステップを組み込むことにより,局所最適解への収束を確保する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:03:50 GMT)
Contrast-Aware Calibration for Fine-Tuned CLIP: Leveraging Image-Text Alignment [46.9] 視覚言語モデル(VLM)は例外的な能力を示しており、迅速な微調整によって下流のタスクに迅速に適応することができる。
オープン語彙設定などの非トレーニングクラスを含む分類タスクでは、微調整されたVLMは、しばしば訓練クラスに過度に適合し、信頼スコアと未確認クラスの実際の精度の誤調整をもたらす。
既存の信頼性キャリブレーション手法では、トレーニングパラメータやトレーニングデータセットの特徴の分析が必要であり、対応する列車データなしで未確認のクラスを一般化する能力を制限している。
5つの微調整方法を持つ11のデータセットを含む実験において、CACは、列車と見知らぬクラスの両方において、常に最高の校正効果を達成した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:47:41 GMT)
Linearized Optimal Transport pyLOT Library: A Toolkit for Machine Learning on Point Clouds [46.9] pyLOTライブラリは、リニアライズド・最適なトランスポート(LOT)技術とダウンストリームタスクで使用するメソッドのPython実装を提供する。
このパイプラインは、固定参照分布から最適トランスポートマップを介して確率分布をヒルベルト空間に埋め込み、この線形化により、オフ・ザ・シェルフ(線形)機械学習アルゴリズムを用いて下流タスクを完了させることができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:34:38 GMT)
Leveraging the true depth of LLMs [46.8] 大規模言語モデルは高い計算要求を犠牲にして素晴らしい能力を示す。
本研究では,事前学習したLLMの深度を,性能に悪影響を及ぼすことなく低減する方法をいくつか検討する。
本稿では,これらを並列に評価可能なペアにグループ化することで,層間の疎結合を利用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:26:27 GMT)
Invariant debiasing learning for recommendation via biased imputation [46.7] 不変情報と変量情報の両方からユーザの偏りのない嗜好を自動的に学習する,新しい軽量知識蒸留フレームワーク(KDDebias)を提案する。
提案手法は,推薦システムにおけるSOTA非教師付きバイアスモデルと比較して,50%未満の学習パラメータで大幅な改善を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:38:10 GMT)
A Survey of Sample-Efficient Deep Learning for Change Detection in Remote Sensing: Tasks, Strategies, and Challenges [46.6] 深層学習(DL)の急速な発展により,大量のリモートセンシング画像(RSI)上で,自動的かつ高精度かつ堅牢な変化検出(CD)が可能になった。
CD手法の進歩にもかかわらず、実際の文脈における実践的応用は、多様な入力データと応用コンテキストのために制限されている。
本稿では,様々なCDタスクに関する文献的手法と,サンプル限定シナリオでDLベースのCDメソッドをトレーニングおよびデプロイするための戦略とテクニックを要約する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:36:09 GMT)
Demystifying Long Chain-of-Thought Reasoning in LLMs [46.4] ロングチェーン・オブ・シント(CoT)は、バックトラックやエラー修正のような戦略を可能にする。
強化学習(Reinforcement Learning, RL)は、これらの能力を開発する上で重要な方法である。
モデルが長いCoT軌道を生成できる重要な要素を同定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:13:32 GMT)
Deep Learning-based Event Data Coding: A Joint Spatiotemporal and Polarity Solution [45.8] イベントカメラは、時間的・極性的な情報によって構成された大量のピクセルレベルのイベントを生成する。
本稿では,単一ポイントのクラウド表現を取り入れた新しい損失型深層学習型統合イベントデータ符号化(DL-JEC)ソリューションを提案する。
対象のコンピュータビジョンタスクのパフォーマンスを損なうことなく、符号化の速度を低下させながら、損失のあるイベントデータを使用できることが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:39:55 GMT)
CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts [45.8] 文化固有の概念の知識を探索するための視覚的質問応答ベンチマークであるCROPEを紹介する。
いくつかの最先端のオープンビジョンと言語モデルの評価は、文化固有の概念と共通の概念の相違が大きいことを示す。
文脈知識を用いた実験は、モデルがマルチモーダル情報を効果的に活用し、文化固有の概念を描写に結びつけるのに苦労していることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:02:34 GMT)
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning [44.8] 大規模言語モデル(LLM)は、チェーン・オブ・シークレット(CoT)データに基づいて訓練された場合、推論と計画が優れている。
そこで我々は,遅延離散トークンを用いて推論過程を部分的に抽象化するハイブリッド表現を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:33:00 GMT)
GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models [44.8] GLOVは、大型言語モデル(LLM)が視覚言語モデル(VLM)の暗黙エンコーダとして機能することを可能にする。
GLOVは、オブジェクト認識のためのデュアルエンコーダ(CLIP)とVLデコーダ(LlaVA)モデルに対して、最大15.0%と57.5%の性能向上を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:50 GMT)
Bilevel ZOFO: Bridging Parameter-Efficient and Zeroth-Order Techniques for Efficient LLM Fine-Tuning and Meta-Training [44.5] First-Order (FO)imats を用いた下流タスクのための微調整済みのLarge Language Model (LLMs) は、重要な計算課題を示す。
本稿では,ZO法をPEFTで補完し,ハードプロンプトに対する感度を緩和する二段階最適化フレームワークを提案する。
我々のBilevel ZOFO法では,PEFTモデルの勾配とベースモデルの前方通過のみを必要とする二重ループ最適化方式を採用している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:47:44 GMT)
Exploiting Exogenous Structure for Sample-Efficient Reinforcement Learning [44.2] マルコフ決定過程(MDPs)の構造クラスであるExo-MDPsについて検討する。
外因性状態はエージェントの行動とは独立して進化し、内因性状態は状態成分と行動の両方に基づいて決定的に進化する。
Exo-MDPは在庫管理、ポートフォリオ管理、ライドシェアリングなどのアプリケーションに有用である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:49:21 GMT)
Learning from Active Human Involvement through Proxy Value Propagation [44.1] アクティブな人間の関与から学ぶことで、トレーニング中に人間の被験者が積極的に介入し、AIエージェントに示すことができる。
本稿では,ポリシー最適化のためのプロクシー値伝搬という,報酬のないアクティブな人間関与手法を提案する。
本手法は,グランドセフト自動車Vにおける運転の難易度を含む,多種多様な制御装置による連続的かつ離散的な制御課題の解決を学習することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:07:37 GMT)
MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding [44.0] 現代のビデオ大言語モデル(VLLM)は、ビデオ理解のための一様フレームサンプリングに依存していることが多い。
入力ビデオから最も代表的なフレームを選択し,保持する最大ボリューム原理に基づく学習自由度手法であるMaxInfoを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:57:07 GMT)
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2 [43.9] 我々はTrinh et al. (2024)で導入されたAlphaGeometryの大幅な改良版であるAlphaGeometry2を提案する。
これを実現するために、まず最初のAlphaGeometry言語を拡張して、オブジェクトの動きに関わる難しい問題に対処する。
これは他の追加とともに、国際数学オリンピアード(IMO)2000-2024幾何問題におけるAlphaGeometry言語の適用率を66%から88%に大幅に改善した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:02:03 GMT)
Sloth: scaling laws for LLM skills to predict multi-benchmark performance across families [43.4] 大規模言語モデル(LLM)のスケーリング法則は、サイズやトレーニングデータといったパラメータに基づいてパフォーマンスを予測する。
我々は、公開されているベンチマークデータを活用する新しいスケーリング法則であるSkills Scaling Laws (SSLaws)を提案する。
パラメータ同定と経験的評価について,12のベンチマークで理論的に検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:50:59 GMT)
Exploring Retrospective Meeting Practices and the Use of Data in Agile Teams [43.2] 本研究は, 心理的安全性やデータ収集の切り離し, ふりかえりミーティングへのデータ統合など, プロジェクトデータ活用の障壁について検討する。
調査の結果、チームは定期的にプロジェクトデータを収集するが、ふりかえりの間に体系的にそれを採用することはめったにないことがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:33:53 GMT)
NNetNav: Unsupervised Learning of Browser Agents Through Environment Interaction in the Wild [43.1] NNetNavは、ブラウザエージェントのトレーニングのための合成デモを生成するウェブサイトとの教師なしインタラクションの方法である。
textttLLama-3.1-8b 10k NNetNavの自己生成デモでは、WebArenaで16%、WebVoyagerで35%以上の成功率が得られる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:56:51 GMT)
ReGLA: Refining Gated Linear Attention [43.0] 線形注意は、標準変圧器に固有の2次時空の複雑さを減らすように設計されている。
我々は、以前の提案が見落としていたいくつかの重要な問題に対処する機能マッピング機能を開発した。
また, ゲーティング機構の飽和現象を探索し, 精製モジュールで補強した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:00:16 GMT)
Towards Physical Understanding in Video Generation: A 3D Point Regularization Approach [42.6] 三次元幾何学と動的認識を統合した新しい映像生成フレームワークを提案する。
これを実現するために、3Dポイントトラジェクトリで2Dビデオを拡大し、ピクセル空間に配置する。
結果の3D対応ビデオデータセットであるPointVidは、遅延拡散モデルを微調整するために使用される。
ビデオ中の物体の形状と動きを規則化し、望ましくない人工物を排除する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:49:06 GMT)
SoK: On Gradient Leakage in Federated Learning [42.5] フェデレートラーニング(FL)は、生のデータ露出なしに複数のクライアント間で協調的なモデルトレーニングを容易にする。
近年の研究では、クライアントのプライベートトレーニングデータは、逆勾配攻撃(GIAs)として知られる脆弱性であるFLの共有勾配から再構築可能であることが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:07:53 GMT)
The Hidden Life of Tokens: Reducing Hallucination of Large Vision-Language Models via Visual Information Steering [42.1] 生成過程を通してトークンログのランキングを検証し,幻覚の内的ダイナミクスについて検討する。
本稿では,真の情報を促進しつつ幻覚を減少させるトレーニングフリーな推論時間介入フレームワークであるVISTAを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:34:02 GMT)
Bayesian RG Flow in Neural Network Field Theories [41.9] ニューラルネットワーク場理論対応(NNFT)は、ニューラルネットワーク(NN)アーキテクチャから統計場理論(SFT)の空間へのマッピングである。
我々は、NNとSFTの空間を探索する強力な新しいフレームワークを形成するためにBRG-NNFTを作成した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:07:55 GMT)
Position: Theory of Mind Benchmarks are Broken for Large Language Models [41.8] このポジションペーパーは、大きな言語モデルが新しいパートナーにどのように適応するかを直接テストできないため、マインドベンチマークの大多数が壊れていると主張している。
この機能的心の理論は、その行動に関する予測に対して合理的な反応をした後、文脈内でエージェントに適応する能力である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:27:20 GMT)
OverThink: Slowdown Attacks on Reasoning LLMs [41.7] OVERTHINK攻撃は、推論モデルを操作するサードパーティアプリケーションのコストを増幅する可能性がある。
その結果、FreshQAデータセットでは18倍のスローダウン、SQuADデータセットでは46倍のスローダウンが得られた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:58:46 GMT)
Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate [41.6] Supervised Fine-Tuning (SFT) は、与えられた命令に対する注釈付き応答を模倣するために言語モデルを訓練するために一般的に使用される。
批判的思考を強調する人間の学習プロセスに触発されて、批判的微調整(CFT)を提案する。
CFTは、しばしば標準的なSFTによって見落とされがちな、深い分析とニュアンスド理解のトラストを奨励する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:53:10 GMT)
Compressing Large Language Models with Automated Sub-Network Search [41.5] 我々は、下流タスク性能を改善しつつ、モデルサイズの削減を図るため、大規模言語モデルに対するモデル圧縮を検討する。
我々はこれを、構造的コンポーネントを自動生成するニューラルネットワーク探索問題と表現する。
本手法は,11種類のダウンストリームタスクに対して平均9.85%の改善を実現し,デバイス上でのレイテンシを最大22%改善する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:50:46 GMT)
A Systematic Study of Cross-Layer KV Sharing for Efficient LLM Inference [41.1] キー値(KV)キャッシュは大規模言語モデル(LLM)の効率的な推論に有効であることが判明した。
本稿では,近年の手法とその新しいバリエーションを網羅する統一フレームワークを提案する。
KVキャッシュのサイズを2$times$にすると、ほとんどの構成は標準のトランスフォーマーよりも高いスループットを実現することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:22:05 GMT)
TELEClass: Taxonomy Enrichment and LLM-Enhanced Hierarchical Text Classification with Minimal Supervision [41.1] 階層的なテキスト分類は、Webコンテンツ分析やセマンティックインデクシングといった幅広いアプリケーションを用いた基本的なWebテキストマイニングタスクである。
初期の研究は、大量の人間の注釈付きデータを必要とする完全あるいは半教師付き手法に重点を置いていた。
人間の努力を軽減するため、我々は最小限の監督力で階層的なテキスト分類に取り組む:各ノードのクラス名のみを唯一の監督力として利用する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:45:46 GMT)
CAMI: A Counselor Agent Supporting Motivational Interviewing through State Inference and Topic Exploration [41.0] 本稿では、モチベーション・インタビュー(MI)に基づく新しいカウンセラーエージェントCAMIを紹介する。
我々はCAMIの性能を自動評価と手動評価の両方で評価する。
その結果、CAMIは最先端の手法に勝るだけでなく、より現実的なカウンセラー的な行動を示すことがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:09:09 GMT)
Mitigating Forgetting in LLM Supervised Fine-Tuning and Preference Learning [40.4] SFTとRLHF/DPOのトレードオフの観点から,逐次後トレーニングが準最適であることを示す。
本稿では,理論収束保証と逐次後学習フレームワークの性能を実証的に向上した実践的後学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:57:29 GMT)
Deep Linear Network Training Dynamics from Random Initialization: Data, Width, Depth, and Hyperparameter Transfer [40.4] 我々は,枝を1/sqrttextdepth$にスケールした場合に無限の深さ制限を可能にする非残留ニューラルネットワークと残留ニューラルネットワークの両方について記述する。
本モデルでは, 電力法構造データに対する高速化された電力法則トレーニングのダイナミクスを, 最近の研究で観測されたリッチな状態下で回復することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:35:06 GMT)
The Cost of Shuffling in Private Gradient Based Optimization [40.3] その結果, DP-ShuffleGはDP-SGDと比較して, データのシャッフル処理により過大なリスクが生じることがわかった。
我々は、プライベートな最適化に公開データサンプルを統合するハイブリッドアプローチである textitInterleaved-ShuffleG を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:30:00 GMT)
Watermark Smoothing Attacks against Language Models [40.0] スムーシング・アタック(Smoothing Attack)は,新しい透かし除去法である。
我々は、13ドルBから30ドルBまで、オープンソースのモデルに対する攻撃を検証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:13:15 GMT)
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models [39.9] 大規模言語モデル(LLM)は、複雑な推論タスクを解く際、顕著な能力を示した。
物理学の推論の領域は、非常に少ない注意を払われたユニークな課題を提示する。
既存のベンチマークは、学部レベルの物理学の広さと深さでLLMの能力を評価するのに不足することが多い。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:36:53 GMT)
LLM-KT: Aligning Large Language Models with Knowledge Tracing using a Plug-and-Play Instruction [39.6] 知識追跡問題は、学生が過去の質問応答記録に基づいて次の質問に正しく答えられるかどうかを予測することを目的としている。
我々は、texttttextbfLLM-KTという、KTのための大規模言語モデル(LLM)ベースのフレームワークを提案する。
タスクレベルのアライメントのために,LLMの豊富な知識と強力な推論能力を活用して,LLMをKTに整合させるPlug-and-Play命令を設計する。
モダリティレベルのアライメントのために、従来の手法で学習した複数のモダリティを統合するために、プラグインコンテキストとシーケンスを設計する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:21:49 GMT)
Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs [39.2] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の印象的な推論能力を引き出す、広く採用されているプロンプト手法である。
CoTのシーケンシャルな思考構造に触発されて、様々な領域やLLMを含むタスクにまたがる様々な課題に対処するために、多くのChain-of-X(CoX)手法が開発されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:01:59 GMT)
Learning to Coordinate without Communication under Incomplete Information [39.1] 夜間のGnomes at Nightテストベッドでの実験結果から、直接コミュニケーションがなくても効果的な協調戦略を学習できることが示されている。
このような戦略は成功率を著しく高くし、未調整の戦略に比べてゲームを完成させる手順を少なくする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:07 GMT)
Gompertz Linear Units: Leveraging Asymmetry for Enhanced Learning Dynamics [39.1] GoLU は $mathrmGoLU(x) = x, MathrmGompertz(x)$, wheremathrmGompertz(x) = e-e-x$ と定義される新しい自己ゲート活性化関数である。
GoLUの最先端のアクティベーション関数に対する優れたパフォーマンスは、既存のアクティベーション関数に対する堅牢な代替として、GoLUを強調している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:32:22 GMT)
Direct Distributional Optimization for Provable Alignment of Diffusion Models [39.0] 分布最適化の観点から拡散モデルの新しいアライメント手法を提案する。
まず、確率分布に対する一般正規化損失最小化として問題を定式化する。
本研究では,Doob の $h$-transform 技術を用いてスコア関数を近似することにより,学習した分布からのサンプリングを可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:35:15 GMT)
LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models [38.8] 大規模視覚言語モデル(LVLM)は、解剖情報を理解し、眼疾患を診断し、解釈と追跡計画の作成を支援する可能性がある。
我々は、クローズドソース、オープンソース、医療ドメインの13の最先端のLVLM代表をベンチマークした。
その結果,眼科領域では他の領域と比較してLVLMが有意に低下した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:36:42 GMT)
On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts [38.6] 悪意のあるプロンプトや操作されたプロンプトは、テキスト・ツー・イメージモデルを利用して安全でない画像を生成することが知られている。
本稿では,悪質な修正テキスト・ツー・イメージ・モデルによる良性プロンプトからの安全でない画像の能動的生成について検討する。
隠蔽性と性能のバランスをとるステルス毒素攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:16:21 GMT)
SymAgent: A Neural-Symbolic Self-Learning Agent Framework for Complex Reasoning over Knowledge Graphs [38.5] SymAgentは、知識グラフと大規模言語モデルとの協調的な拡張を実現する革新的なニューラルシンボリックエージェントフレームワークである。
我々はKGを動的環境として概念化し、複雑な推論タスクを多段階の対話プロセスに変換することにより、KGが推論プロセスに深く参加できるようにする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:37:05 GMT)
TGB-Seq Benchmark: Challenging Temporal GNNs with Complex Sequential Dynamics [38.5] この問題に触発されて、逐次ダイナミクス付き時間グラフベンチマーク(TGB-Seq)を導入する。
TGB-Seqは、eコマースインタラクション、映画評価、ビジネスレビュー、ソーシャルネットワーク、引用ネットワーク、Webリンクネットワークなど、さまざまな領域にまたがる大規模な実世界のデータセットで構成されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:20:19 GMT)
Consistent Client Simulation for Motivational Interviewing-based Counseling [38.3] メンタルヘルスカウンセリングのための一貫したクライアントシミュレーションを支援する新しいフレームワークを提案する。
我々のフレームワークは、シミュレーションされたクライアントの精神状態を追跡し、状態遷移を制御し、クライアントのモチベーション、信念、望ましい変更計画、受容性と整合した各状態行動を生成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:58:30 GMT)
An analysis of optimization problems involving ReLU neural networks [38.3] 本研究では,混合整数型プログラミング解法における実行時間挙動の解析と改善手法について検討する。
本論文では,これらの手法を3つのベンチマーク問題に対して数値的に比較する。
主要な出発点として、我々は、しばしば望まれるニューラルネットワークモデルの冗長性と、関連する最適化問題を解決するための計算コストとの間のトレードオフを観察し、定量化する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:18:07 GMT)
Edge-aware Feature Aggregation Network for Polyp Segmentation [38.1] 本研究では,ポリプセグメンテーションのためのエッジ対応特徴集約ネットワーク(EFA-Net)を提案する。
EFA-Netは、ポリプセグメンテーションの性能を高めるために、クロスレベルとマルチスケールの機能を完全に活用することができる。
広く採用されている5つの大腸内視鏡データセットの実験結果から,我々のEFA-Netは,一般化と有効性の観点から,最先端のポリプセグメンテーション法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:23:51 GMT)
ImgTrojan: Jailbreaking Vision-Language Models with ONE Image [37.8] 視覚言語モデル(VLM)に対する新しいジェイルブレイク攻撃を提案する。
トレーニングデータに有毒な(画像、テキスト)データペアを含めるシナリオが想定されます。
原文のキャプションを悪意のあるジェイルブレイクプロンプトに置き換えることにより、この手法は毒画像を用いてジェイルブレイク攻撃を行うことができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:20:24 GMT)
HyReaL: Clustering Attributed Graph via Hyper-Complex Space Representation Learning [37.7] 我々は,属性の表現学習を強化するために,強力な四元数特徴変換を備えた超複素空間を導入する。
HyReaLが学習したノード表現は、より差別的で、様々な$k$の下流クラスタリングに適していることが判明した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:37:38 GMT)
Harmony in Divergence: Towards Fast, Accurate, and Memory-efficient Zeroth-order LLM Fine-tuning [37.5] 大規模言語モデル(LLM)は様々なタスクにまたがるが、標準的な一階述語(FO)の微調整にはかなりのメモリを必要とする。
本稿では,FOおよびZO最適化の異なる更新パターンを明らかにするレイヤワイズ分散分析を提案する。
我々はtextbfDivergence-driven textbfZeroth-textbfOrder (textbfDiZO) の最適化を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:03:17 GMT)
Path Planning for Masked Diffusion Model Sampling [37.5] マスク拡散モデル(MDM)の推論において,トークンがマスクされていない順序が生成品質にどのように影響するかを検討する。
本稿では,事前学習したBERTやデノワザを利用したサンプリングフレームワークであるPath Planning (P2)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:52 GMT)
RepLoRA: Reparameterizing Low-Rank Adaptation via the Perspective of Mixture of Experts [37.4] 低ランク適応 (LoRA) は、大規模基盤モデルを微調整するための強力な手法として登場した。
本稿では,LoRAモデルとMixture of Expertsモデルとの関連性を検討することによって,ロラの理論解析を行う。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:03:09 GMT)
Context in Public Health for Underserved Communities: A Bayesian Approach to Online Restless Bandits [36.8] 公衆衛生プログラムに係わる複雑なRMAB設定を柔軟にモデル化するために,Bayesian Learning for Contextual RMABs(BCoR)を提案する。
BCoRの重要な強みは、腕内と腕間の共有情報を利用して、未知のRMAB遷移ダイナミクスを素早く学習する能力である。
実世界のアテンデンスデータを用いた設定を含む、様々な実験的な設定に対して、はるかに高い有限サンプル性能を達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:41:15 GMT)
Lost in Overlap: Exploring Logit-based Watermark Collision in LLMs [36.4] 我々は、透かし攻撃の斬新で一般的な哲学として透かし衝突を導入する。
我々は、透かし衝突が全てのロジットベースの透かしアルゴリズムに脅威をもたらすという総合的なデモンストレーションを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:11:40 GMT)
Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data [36.3] 大規模言語モデル(LLM)の全体的な能力向上におけるデータ多様性の役割について検討する。
本稿では,LLMに2つのアイデンティティを与える新しい手法を提案する。多様性報酬に基づいてデータを認知的に探索し,選択する出力モデルと,選択したデータに調整する入力モデルである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:21:01 GMT)
Unrealized Expectations: Comparing AI Methods vs Classical Algorithms for Maximum Independent Set [36.1] 生成モデルや強化学習といったAI手法は、最近最適化(CO)問題、特にNPハード問題に応用されている。
本稿では、GPUベースの手法と、最大独立集合(MIS)上の古典的CPUベースの手法を比較する。
標準的なグラフファミリの実験では、AIベースのアルゴリズムは性能が上がらず、多くの場合、単一のCPU上で動作している最先端の古典的解法KaMISのソリューション品質に匹敵する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:24:47 GMT)
OmniRL: In-Context Reinforcement Learning by Large-Scale Meta-Training in Randomized Worlds [35.7] 我々は、数十万の多様なタスクをメタトレーニングした、高度に一般化可能なコンテキスト内強化学習モデルであるOmniRLを紹介した。
インコンテキスト学習(ICL)だけでは、勾配に基づく微調整を一切行わず、目に見えない体育館のタスクにうまく対応できることを初めて実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:59:13 GMT)
On Zero-Initialized Attention: Optimal Prompt and Gating Factor Estimation [35.2] LLaMA-Adapterは、学習の安定化と性能向上のためにゼロ次元の注意を生かし、LLaMAモデルの効率的な微調整技術として登場した。
我々は厳密な理論解析を行い、ゼロ次元の注意とエキスパートの混合モデルとの接続を確立する。
我々は、線形および非線形のプロンプトとゲーティング関数が最適に推定できることを証明し、非線形プロンプトは将来のアプリケーションにより大きな柔軟性を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:31:27 GMT)
Comply: Learning Sentences with Complex Weights inspired by Fruit Fly Olfaction [35.2] シーケンス表現を学習するニューラルネットワークComplyを紹介する。
FlyVecは、ハエの嗅覚回路からインスピレーションを得て、単語の埋め込みを学習する。
実験の結果,ComplyはFlyVecに取って代わるだけでなく,最先端モデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:17:37 GMT)
Rethinking Latent Representations in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation [34.5] 行動クローニング(BC)は、ロボット操作において広く採用されている視覚模倣学習手法である。
我々は,潜在表現における冗長性を定量化し緩和するために相互情報を導入する。
本研究は, 様々な方法, バックボーン, 実験環境における潜在表現の冗長性に関する最初の包括的研究である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:13:04 GMT)
Solving Drone Routing Problems with Quantum Computing: A Hybrid Approach Combining Quantum Annealing and Gate-Based Paradigms [34.5] 提案手法はQuantum for Drone Routing(Q4DR)と呼ばれ、この分野でもっとも顕著な2つのパラダイムを統合している。
Q4DRの有効性は、複雑さが増大する3つのユースケースを通して示される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:37:19 GMT)
Deep Learning Library Testing: Definition, Methods and Challenges [33.6] ディープラーニング(DL)ライブラリは、基礎となる最適化と計算を行う。
DLライブラリはバグに免疫がなく、ユーザの個人資産や安全性に深刻な脅威をもたらす可能性がある。
本稿では,各種DLライブラリに関する試験研究の概要について述べる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:29:52 GMT)
Digitized Counterdiabatic Quantum Algorithms for Logistics Scheduling [33.0] 本稿では,2つのスケジューリング問題に対して,ディジタル化された反断熱量子最適化(DCQO)アルゴリズムを提案する。
ジョブショップスケジューリング問題では,特定の制約下で複数のタスクを実行するロボットの最適なスケジュールを見つけることを目的としている。
旅行セールスパーソンの問題は、すべての都市をカバーし、最短の旅行距離と関連する経路を見つけることである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:37:38 GMT)
KDA: A Knowledge-Distilled Attacker for Generating Diverse Prompts to Jailbreak LLMs [32.1] 我々は,SOTA攻撃者の知識を,知識拡散攻撃者(KDA)と呼ばれる単一のオープンソースモデルに抽出することを提案する。
KDAは、複数のSOTAオープンソースおよび商用ブラックボックスLSMをターゲットにして、より高い攻撃成功率とコスト時間効率を達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:50:34 GMT)
Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion [32.1] コンピュータビジョンタスクでは、様々な表現、ドメイン、モダリティから特徴が生まれる。
より効果的な融合のためにこれらのグラフパワーを組み合わせるための学習可能なグラフ融合演算子を導入する。
我々のアプローチは関係中心であり、均質な空間で機能し、数学的に原理化されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:39:31 GMT)
MEETING DELEGATE: Benchmarking LLMs on Attending Meetings on Our Behalf [31.9] 大規模言語モデル(LLM)は、自然言語の生成と推論において、その強力な能力を実証している。
LLMを用いた会議委任システムのプロトタイプを開発し、実際の会議書き起こしを用いたベンチマークを作成する。
GPT-4/4oは、アクティブなエンゲージメント戦略と慎重なエンゲージメント戦略のバランスの取れた性能を維持している。
Gemini 1.5 Proはより慎重で、Gemini 1.5 FlashとLlama3-8B/70Bはよりアクティブな傾向を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:25:43 GMT)
Disentangling the Impact of Quasiparticles and Two-Level Systems on the Statistics of Superconducting Qubit Lifetime [31.9] 超伝導量子ビット寿命の時間変動である$T_$は、フォールトトレラントな量子コンピュータを構築する際のさらなる課題をもたらす。
温度関数として幾何学的フットプリントと表面誘電率の異なるキュービットについてT_$の測定を行った。
我々は,小フットプリントの量子ビットにおける$Gamma_$分散が,大フットプリントの量子ビットよりもQPやTLSの変動の影響を受けやすいことを発見した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:23:26 GMT)
Membership Inference Attack Should Move On to Distributional Statistics for Distilled Generative Models [31.8] メンバーシップ推論攻撃(MIA)は、特定のデータインスタンスがモデルをトレーニングするために使用されたかどうかを決定する。
本論文は, 既存のMIAのEmpdistilled Generative Modelに対する展望を明らかにする。
学生が生成したデータと潜在的メンバー/非メンバーデータとの間の説明的分布の相違を計測するEmphsetベースのMIAフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:11:23 GMT)
Causal Composition Diffusion Model for Closed-loop Traffic Generation [31.5] 本稿では,これらの課題に対処するための構造誘導拡散フレームワークであるCausal Compositional Diffusion Model (CCDiff)を紹介する。
まず、制約付き最適化問題として、制御可能で現実的な閉ループシミュレーションの学習を定式化する。
そして、CCDiffは拡散過程に直接因果構造を自動同定し注入することにより、現実主義に固執しながら制御性を最大化する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:08:12 GMT)
Functional 3D Scene Synthesis through Human-Scene Optimization [30.9] 我々のアプローチは、シンプルだが効果的な原理に基づいており、我々はシーン合成を条件に、人間によって使用可能な部屋を生成する。
この人間中心のシーン生成が実現可能であれば、部屋のレイアウトは機能し、より一貫性のある3D構造に繋がる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:00:24 GMT)
Omni-DNA: A Unified Genomic Foundation Model for Cross-Modal and Multi-Task Learning [30.8] 我々は2000万から10億のパラメータからなるクロスモーダルマルチタスクモデルのファミリーであるOmni-DNAを紹介する。
本手法は, (i) 次のトークン予測目標によるDNA配列の事前学習, (ii) マルチモーダルなタスク固有トークンの拡張, 複数下流タスクの微調整の2段階からなる。
Nucleotide TransformerとGBベンチマークで評価すると、Omni-DNAは26タスク中18タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:20:52 GMT)
Explanation Regularisation through the Lens of Attributions [30.7] 説明正則化(ER)は、テキスト分類器に予測を導出する方法として導入された。
これは、入力属性手法の出力が人間の注釈付き論理とどの程度うまく一致しているかを測定する補助的な説明損失を導入することで達成される。
従来の研究は、特にモデルを導くのに使われたものと異なる属性技術を用いて、信頼度を測定する場合、その依存度に対するガイダンスの影響を過小評価していた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:33:49 GMT)
Efficient Implementation of Arbitrary Two-Qubit Gates via Unified Control [30.7] ネイティブゲートセットは、基本量子演算の精度を管理し、量子アルゴリズムを実装する複雑さを規定する。
本稿では,任意の2ビットゲートを生成可能な統一的で多目的なゲートスキームを実験的に実証する。
一般的に使用される2量子ユニタリの広い範囲にわたって、99.37 pm 0.07%$の平均的な高忠実度を実現する。
この結果から,単一インタラクションの能力を完全に活用することで,包括的で高精度なゲートセットが得られることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:00:34 GMT)
A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion [30.4] 本稿では,HugWBCを提案する。
HuGWBCは、現実世界のヒューマノイドロボットが、歩行(ランニング)、ジャンプ(ジャンプ)、立ち上がり、ホッピング(ホッピング)などのさまざまな自然歩行を、カスタマイズ可能なパラメータで生成することを可能にする。
HuGWBCはまた、遠隔操作のような外部上体コントローラからのリアルタイム介入をサポートし、ロコ操作を可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:26:01 GMT)
Aggregate to Adapt: Node-Centric Aggregation for Multi-Source-Free Graph Domain Adaptation [29.7] 教師なしグラフ領域適応(UGDA)は、ラベル付きソースグラフからラベルなしターゲットグラフへの知識の転送に焦点を当てている。
本稿では,ノードの粒度に適応するGraphATAという新しいモデルを提案する。
また、モデル中心の手法と層中心の手法の両方に一般化するGraphATAの能力を実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:41:32 GMT)
SimulPL: Aligning Human Preferences in Simultaneous Machine Translation [29.4] 同時機械翻訳(SiMT)は、ストリーミングソース入力を受信しながら翻訳を生成する。
SiMTシナリオのオーディエンスは、正確な翻訳、より単純な構文、不要なレイテンシなど、明確な好みを持っている。
そこで我々は,SiMTタスクに適した選好学習フレームワークSimulPLを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:36:08 GMT)
Label Anything: An Interpretable, High-Fidelity and Prompt-Free Annotator [29.3] 従来の手動ラベリングは、ロバストモデルをトレーニングするために大量のデータに注釈を付けるのに高コストである。
本稿では,解釈可能な高忠実度データアノテータとして機能するラベル随伴モデル (LAM) を提案する。
LAMは複数の実世界のデータセットに対して高忠実度アノテーション(ほぼ100%mIoU)を生成することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:14:52 GMT)
The Nonlinear Filter Model of Stream Cipher Redivivus [28.9] 非線形フィルタモデルは、セキュアストリーム暗号の設計において、古くよく理解されたアプローチである。
我々は、既知の攻撃に対して$kappa$-bitセキュアなストリーム暗号の具体的な提案を行った。
80$-bit、28$-bit、2656$-bitのセキュリティレベルの場合、対応するストリーム暗号の回路はそれぞれ1743.5、2771.5、5607.5 NANDゲートが必要である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:37:40 GMT)
Comparative Analysis of FPGA and GPU Performance for Machine Learning-Based Track Reconstruction at LHCb [28.6] 大型ハドロン衝突型加速器における光度と粒度の増加は、より効率的なデータ処理ソリューションの必要性を喚起している。
荷電粒子トラックのための有望なツールとして機械学習が登場した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:01:55 GMT)
Advancing Weight and Channel Sparsification with Enhanced Saliency [27.9] プルーニングは、冗長パラメータを除去することでモデルを加速し、圧縮することを目的としている。
この除去は不可逆であり、しばしば刈り取られたモデルでは性能が劣る。
我々は、非構造的または構造的空間性に対する所定の重要性基準を強化するために、効率的で革新的なパラダイムを導入します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:56:55 GMT)
Robust Scene Change Detection Using Visual Foundation Models and Cross-Attention Mechanisms [27.9] 本稿では,視覚基礎モデルDINOv2の頑健な特徴抽出機能を活用したシーン変化検出手法を提案する。
我々は,VL-CMU-CDとPSCDの2つのベンチマークデータセットに対するアプローチと,その視点評価バージョンについて検討した。
実験では,F1スコアにおいて,特に画像ペア間の幾何学的変化を伴うシナリオにおいて,顕著な改善が示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:25:58 GMT)
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training [27.9] スモール言語モデル (SLM) はエッジデバイスにおける幅広い応用のために注目されている。
高い性能を持つSLMを得るには、計算コストがかなりかかるスクラッチからモデルを事前訓練するか、既存の大規模言語モデル(LLM)を圧縮し、事前訓練に比べて性能が低下し低下する。
1) レイヤーワイド適応プルーニング (Adapt-Pruner) は, LLM において極めて有効であり, 既存のプルーニング技術よりも顕著な改善が得られ, 2) さらなるトレーニングを施した適応プルーニングは, スクラッチから事前学習したプルーニングに匹敵するモデルとなる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:57:40 GMT)
Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation [27.8] 既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
クエリ効率の良いオンラインブラックボックスターゲット生成のための,新しい,シンプルなアルゴリズムである textbfFast Direct を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:49:21 GMT)
Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics [27.7] 本稿では,動的衣料アニメーションを用いた仮想試着などのアプリケーションにおいて重要な領域である3D衣料生成に焦点を当てた。
そこで我々はDress-1-to-3という新しいパイプラインを紹介した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:49:03 GMT)
Algorithmic Inheritance: Surname Bias in AI Decisions Reinforces Intergenerational Inequality [27.6] 名前はしばしば社会的地位、富、血統の暗黙のマーカーを伝え、体系的偏見と世代間不平等を永続させる方法で知覚を形成する。
この研究は、姓がAIによる意思決定にどう影響するかを調査する最初の試みである。
我々の研究結果によると、エリートな姓はAIが生成するパワー、知性、富の認識を継続的に増加させ、それによってAIが主導する意思決定に高い文脈で影響を及ぼす。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:25:26 GMT)
Prepending or Cross-Attention for Speech-to-Text? An Empirical Comparison [27.4] 本研究では,高密度機能プリペンディング(DFP)とクロスアテンションアーキテクチャの性能を比較した。
DFPは広く採用されているが,本研究の結果はDFPのクロスアテンションに対する優位性を示すものではない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:40:51 GMT)
Large Language Models Are Universal Recommendation Learners [27.2] 大規模言語モデル(LLM)は、普遍的なレコメンデーション学習者として機能する。
本稿では、アイテム表現のためのマルチモーダル融合モジュールと効率的な候補生成のためのシーケンス・イン・セット・アウト・アプローチを提案する。
分析の結果,推薦結果はテキスト入力に非常に敏感であることが判明した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:56:52 GMT)
Learning Effective NeRFs and SDFs Representations with 3D Generative Adversarial Networks for 3D Object Generation [27.1] ICCV 2023 OmniObject3D Challengeの3次元オブジェクト生成ソリューションを提案する。
本研究では,3次元オブジェクト生成のための3次元生成支援ネットワーク(GAN)を用いた学習効率の高いNeRFとSDFの表現について検討する。
このソリューションはICCV 2023 OmniObject3D Challengeでトップ3に入っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:05:56 GMT)
Maximizing the Position Embedding for Vision Transformers with Global Average Pooling [26.8] 視覚変換器では、位置埋め込み(PE)がトークンの順序を捉える上で重要な役割を果たす。
各レイヤにPEを提供し、トークン埋め込みに独立したレイヤ正規化を適用するレイヤワイズ方式が、この制限を克服するために採用されている。
本稿では,クラストークンの代わりにグローバル平均プーリング(GAP)法を用いた場合,階層構造で発生する矛盾する結果を特定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:29:05 GMT)
EBBS: An Ensemble with Bi-Level Beam Search for Zero-Shot Machine Translation [26.7] ゼロショット翻訳は、第3の言語をピボットすることで実現できる。
本稿では,新しい2レベルビーム探索アルゴリズムを用いたアンサンブル手法であるESBSを提案する。
2つの人気のある多言語翻訳データセットの結果は、ESBSが直接変換とピボット翻訳を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:44:43 GMT)
Evidence of P-wave Pairing in K$_2$Cr$_3$As$_3$ Superconductors from Phase-sensitive Measurement [26.7] 最近発見された超伝導体A$Cr$_3$As$_3$(A = K, Rb, Cs)の研究を行う。
K$Cr$_3$As$_3$で超伝導量子干渉デバイス(SQUID)を作製し、位相感度測定を行う。
これらのSQUIDは、電流-位相関係において2次高調波成分の罪(2$pi$)を顕著に示し、0-と$pi$-相の混和を示唆している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:29:54 GMT)
Variable Bregman Majorization-Minimization Algorithm and its Application to Dirichlet Maximum Likelihood Estimation [26.4] 本稿では,微分可能部分の和として表現される凸関数と,非滑らかな項を最小化する,新しいブレグマン降下アルゴリズムを提案する。
VBMM(Variable Bregman Majorization-Minimization)アルゴリズムと呼ばれるこの手法は、Bregman Proximal Gradient法を拡張している。
数値実験により、VBMMアルゴリズムは収束速度において既存の手法よりも優れていることを確認した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:54:19 GMT)
DenseReviewer: A Screening Prioritisation Tool for Systematic Review based on Dense Retrieval [26.3] 関連する研究を優先順位付けすることで、下流の体系的なレビュー作成タスクを早期に開始し、時間を節約できる。
提案手法は,従来の能動的学習法よりも有効性と効率性に優れていた。
ツールの設計を説明し、スクリーニングをどのように役立つかを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:42:59 GMT)
Why Has Predicting Downstream Capabilities of Frontier AI Models with Scale Remained Elusive? [26.0] 本稿では,質問応答ベンチマークにおけるスケーリングの予測を困難にする重要な要因を明らかにする。
ダウンストリーム性能は、性能とスケールの統計的関係を段階的に劣化させる一連の変換によって負のログ確率から計算されることを示す。
計算量の増加に伴う誤った選択に対する確率質量と確率質量の相関関係について検討し,テキスト不正確な選択に対するスケーリング法則が達成可能であることを示唆した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:44:38 GMT)
GS-CPR: Efficient Camera Pose Refinement via 3D Gaussian Splatting [25.8] 本稿では,新しいテストタイムカメラ・ポーズ・リファインメント(CPR)フレームワーク,GS-CPRを提案する。
このフレームワークは、最先端の絶対ポーズ回帰とシーン座標回帰法の局所化精度を高める。
3DGSモデルは高品質な合成画像と深度マップを描画し、2D-3D対応の確立を容易にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:25:44 GMT)
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts [25.5] Time-MoEは、より大きく、より有能な基礎モデルを予測するために設計された、スケーラブルで統一されたアーキテクチャである。
Time-MoEは、予測毎にネットワークのサブセットだけを活性化することで、計算効率を向上させる。
時系列基礎モデルを24億のパラメータに拡張し,予測精度を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:32:34 GMT)
Elucidating the Preconditioning in Consistency Distillation [25.2] 整合性ギャップに応じて事前条件を解析的に最適化する「textitAnalytic-Precond」を提案する。
そこで我々は,Analytic-Precondがトラジェクトリ・ジャンパーの学習を容易にし,生徒のトラジェクトリと教師のトラジェクトリのアライメントを高め,一貫性トラジェクトリモデルのトレーニングアクセラレーションを2倍から3倍に向上できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:30:37 GMT)
Yeah, Un, Oh: Continuous and Real-time Backchannel Prediction with Fine-tuning of Voice Activity Projection [24.7] yeah"や"oh"といった短いバックチャネルの発話は、スムーズでエンゲージメントな対話を促進する上で重要な役割を担っている。
本稿では,微調整音声活動予測モデルを用いて,リアルタイムかつ連続的なバックチャネル予測を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:06:40 GMT)
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets [24.4] 大規模言語モデル(LLM)エージェントは人間の振る舞いをモデル化するためのシミュレーションツールとして注目を集めている。
社会経済システムのシミュレートにLLMを活用する新しいマルチエージェントフレームワークであるTwinMarketを紹介した。
我々のアプローチは、個人の意思決定と集団社会経済パターンの間の複雑な相互作用に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:18:13 GMT)
HACK: Homomorphic Acceleration via Compression of the Key-Value Cache for Disaggregated LLM Inference [24.1] Disaggregated Large Language Model (LLM) 推論は、計算集約型プリフィルステージとメモリ集約型デコードステージを分離する。
キーバリュー(KV)データを2つのステージ間で送信することは、特に長いプロンプトにおいてボトルネックとなる可能性がある。
分散LDM推論のためのKVキャッシュ(HACK)の圧縮によるホモモルフィック高速化を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:09:51 GMT)
Efficiently Serving Large Multimodal Models Using EPD Disaggregation [24.1] Encode-Prefill-Decode Disaggregation(エンコード・プリフィル・デコード・デコード・デアグリゲーション)という,エンコード・プリフィル・デコード・デコード・デアグリゲーション(Encode-Prefill-Decode Disaggregation)というフレームワークを紹介した。
メモリ効率の大幅な向上(使用率の削減)、バッチサイズ(最大22$times$大きなもの)、10$times$より多くのイメージ/リクエスト、2.2$times$より大きなKVキャッシュ。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:55:47 GMT)
FedP$^2$EFT: Federated Learning to Personalize Parameter Efficient Fine-Tuning for Multilingual LLMs [23.9] フェデレートラーニング(FL)は多言語多言語大言語モデル(LLM)を多言語多言語多言語データで訓練することを可能にする。
We propose FedP$2$EFT, a federated learning-to-personalize method for multilingual LLMs in cross-device FL settings。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:36:21 GMT)
Advancing Drug Discovery with Enhanced Chemical Understanding via Asymmetric Contrastive Multimodal Learning [23.9] 非対称コントラスト型マルチモーダルラーニング(ACML)を導入し,分子理解を高め,創薬の進歩を加速する。
ACMLは効果的な非対称コントラスト学習の力を利用して、様々な化学修飾物から分子グラフ表現への情報をシームレスに伝達する。
このフレームワークの有効性を,大規模な相互モダリティ検索と異性判別タスクによって実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:28:53 GMT)
E-3SFC: Communication-Efficient Federated Learning with Double-way Features Synthesizing [23.6] モデルサイズの指数的成長は、学習(FL)における通信負担を大幅に増加させた。
圧縮勾配を伝送することでこの負担を軽減する既存の手法は、高い圧縮誤差に直面し、モデルの性能を低下させる。
本研究では,拡張シングルステップ合成機能と呼ばれる体系的アルゴリズムを提案する。
E-3SFCは3つのサブコンポーネント、すなわちSingle-Step Synthetic Features (3SFC)、ダブルウェイ圧縮アルゴリズム、通信予算スケジューラから構成される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:31:21 GMT)
Reveal the Mystery of DPO: The Connection between DPO and RL Algorithms [23.4] Reinforcement Learning from Human Feedback (RLHF)アルゴリズムが導入された。
これらのアルゴリズムは、トレーニングに明示的な報酬(あるいは値)関数を必要とするかどうかに基づいて、2つの主要なフレームワークに分けることができる。
我々は、DPO、RL、その他のRLHFアルゴリズムに関連する3つの重要な側面に焦点を当てる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:41:43 GMT)
Kronecker Mask and Interpretive Prompts are Language-Action Video Learners [23.3] 対照的な言語イメージ事前学習は、画像に基づく視覚学習を大幅に進歩させた。
近年の研究では、行動認識のためのCLIPのテキストまたは視覚分岐の調整に焦点が当てられている。
両ブランチの適応は不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:03:58 GMT)
LIMO: Less is More for Reasoning [23.3] 複雑な数学的推論能力は驚くほど少ない例で効果的に導出できることを実証する。
提案するモデルLIMOは数学的推論において前例のない性能を示す。
LIMOは10種類のベンチマークで40.5%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:23:45 GMT)
A Systematic Literature Review on Explainability for Machine/Deep Learning-based Software Engineering Research [23.3] 本稿では,ソフトウェア工学の文脈におけるAIモデルの説明可能性の向上を目的とした,体系的な文献レビューを行う。
我々は,XAI技術がこれまで成功してきたSEタスク,(2)異なるXAI手法の分類と分析,(3)既存の評価手法を考察することを目的としている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:10:05 GMT)
Clone-Resistant Weights in Metric Spaces: A Framework for Handling Redundancy Bias [23.3] 距離空間の要素の集合が与えられる。
要素の分布は任意であり、おそらく逆である。
このような(敵対的な)操作に耐性のある方法で要素を重み付けできますか?
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:50:51 GMT)
MapFusion: A Novel BEV Feature Fusion Network for Multi-modal Map Construction [23.2] 本研究では,新しいマルチモーダルバードアイビュー (BEV) 機能融合手法であるMapFusionを提案する。
本稿では,2つのBEV特徴空間間の相互作用を可能にするクロスモーダル・インタラクション・トランスフォーメーション(CIT)モジュールを提案する。
また,異なるモダリティから有意な情報を適応的に選択するための効果的なデュアルダイナミックフュージョン(DDF)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:25:45 GMT)
SimSort: A Powerful Framework for Spike Sorting by Large-Scale Electrophysiology Simulation [23.2] スパイクソートは神経記録において重要なプロセスであり、脳内の電極によって記録された個々のニューロンから電気信号を識別し、分離する。
textbfSimSortはスパイクソートのための事前学習フレームワークである。
注目すべきは、シミュレーションデータセットでトレーニングされた場合、SimSortは実世界のスパイクソートタスクに対して、ゼロショットの強い一般化を実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:19:41 GMT)
Can LLMs Assist Annotators in Identifying Morality Frames? -- Case Study on Vaccination Debate on Social Media [23.0] 大規模言語モデル(LLM)は、数ショットの学習を通じて新しいタスクを適応できる。
本研究は,ソーシャルメディア上での予防接種討論において,人間アノテータによる道徳的枠組みの同定を支援するLLMの可能性を探るものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:16:10 GMT)
The Cake that is Intelligence and Who Gets to Bake it: An AI Analogy and its Implications for Participation [22.9] 機械学習は、教師なし学習がベースとなり、教師なし学習がアイシングを追加し、強化学習がトップのチェリーとなる。
私たちは、単純な構造的なメタファからAIシステムの完全なライフサイクルまで、この「インテリジェンスであるケーキ」のアナロジーを拡張します。
本稿では、各ステップの社会的影響と、それらが機械学習内の統計的仮定によってどのように束縛されているかを説明する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:51:19 GMT)
Distilling Implicit Multimodal Knowledge into Large Language Models for Zero-Resource Dialogue Generation [22.6] ゼロリソースコンテキストにおけるリッチな対話生成のための視覚的暗黙的知識蒸留フレームワーク(VIKDF)を提案する。
VIKDFは、知識蒸留と知識統合の2つの主要な段階で構成されている。
実験の結果,VIKDFは,高品質な対話を生成する上で,既存の最先端モデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:54:42 GMT)
Understanding Generalization of Federated Learning: the Trade-off between Model Stability and Optimization [22.6] Federated Learning(FL)は、複数のデバイスで機械学習モデルをトレーニングする分散学習アプローチである。
FLはデータの不均一性のためにしばしば課題に直面し、クライアント間の一貫性のないローカルオプティマに繋がる。
本稿ではアルゴリズムに依存した過剰リスク最小化のための革新的な一般化ダイナミクス解析フレームワークLibraを紹介する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:02:26 GMT)
PERP: Rethinking the Prune-Retrain Paradigm in the Era of LLMs [22.6] パラメータの小さなサブセットを更新すれば、刈り込み後の回復や性能向上に十分であることを示す。
標準のLoRAとは異なり、スパシティを損なうことなくアダプタを再びマージできる2つの新しいLoRA変種を導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:10:23 GMT)
Limitations of Data-Driven Spectral Reconstruction -- Optics-Aware Analysis and Mitigation [22.1] コスト効率のよいRGBカメラで撮影したRGB画像からスペクトル情報を抽出することを目的とした,データ駆動型スペクトル再構成の最近の取り組み。
我々は、現在のデータセットとオーバーフィッティングに関する実用的制限と、RGB画像に符号化された情報の性質に関する基本的な制限の両方を評価する。
本稿では,メタデータデータ拡張と光学レンズ収差の組み合わせを利用して,RGB画像へのメタデータ情報の符号化を改善することを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:31:19 GMT)
Disproving Program Equivalence with LLMs [22.0] ProbeGenは、2つ以上の実行可能なコードと、その等価性に対する反例を検索するホワイトボックスメソッドである。
ProbeGenは、ベンチマークによる単体テストにより、基礎的真理と等価であると考えられるサンプルの18%を反証することを示した。
ProbeGenを使うことで、意味的な自己整合性のためにLLMサンプルをセマンティックにクラスタリングし、pass@1を10%改善できます。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:54:17 GMT)
The Alternative Annotator Test for LLM-as-a-Judge: How to Statistically Justify Replacing Human Annotators with LLMs [22.0] LLM-as-a-judge"パラダイムでは、人間が伝統的に行ってきたタスクにおいて、アノテータや評価役としてLarge Language Modelsを採用している。
研究結果や洞察を形成する上での役割にもかかわらず、LLMがヒトのアノテーターを置き換えることができるかどうかを判断するための標準的あるいは厳格な手順は存在しない。
LLMアノテーションの使用を正当化するためには、アノテーション付き例の控えめなサブセットだけを必要とする新しい統計手順である代替アノテーションテスト(alt-test)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:24:26 GMT)
Identity-free Artificial Emotional Intelligence via Micro-Gesture Understanding [21.9] 我々は、人体言語の特殊グループ、マイクロ・ジェスチャ(MG)に焦点を当てる。
MGは、意図的な行動ではなく、内的感情によって引き起こされる意図しない行動である。
本研究は,マイクロ・ジェスチャの微妙な空間的および短時間の時間的特性を考慮し,反復性を伴う様々な拡張戦略を探求し,より適切な拡張方法を決定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:06:38 GMT)
Out-of-Distribution Detection using Synthetic Data Generation [21.6] In- and out-of-distriion (OOD) 入力は、分類システムの信頼性の高いデプロイに不可欠である。
本稿では,Large Language Models (LLMs) の生成能力を利用して,高品質なOODプロキシを生成する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:22:09 GMT)
IRIS: An Immersive Robot Interaction System [21.5] IRISは、複数のシミュレータ、ベンチマーク、さらにはヘッドセットもすでにサポートしている、新しくて容易に拡張可能なフレームワークである。
統一されたシーン仕様はシミュレータや現実世界のセンサーから直接生成され、XRヘッドセットに送信され、XRで同じシーンを生成する。
IRISはUnity Frameworkをサポートするあらゆるデバイスにデプロイできる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:56:26 GMT)
SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner [21.4] 本稿では,自衛隊(SelfDefend)と呼ばれる総称LDMジェイルブレイク防御フレームワークを紹介する。
主要なjailbreak攻撃に対して,メインストリームのGPT-3.5/4モデルを使用することを実証的に検証した。
防衛の堅牢性をさらに向上し、コストを最小化するために、我々は専用のオープンソース防衛モデルをチューニングするためにデータ蒸留アプローチを採用している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:29:07 GMT)
RouteFinder: Towards Foundation Models for Vehicle Routing Problems [21.3] RouteFinderは、異なる車両ルーティング問題(VRP)に対処するための総合的な基盤モデルフレームワークである。
属性の組み合わせを効率的に処理できる統合VRP環境を提案する。
48種類のVRPでの実験では、RouteFinderは最近の最先端の学習方法よりも優れていた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:27:54 GMT)
Reasoning-as-Logic-Units: Scaling Test-Time Reasoning in Large Language Models Through Logic Unit Alignment [21.1] CoT(Chain-of-Thought)のプロンプトによって,大規模言語モデル(LLM)の推論能力の向上が期待できる。
本稿では、生成したプログラムと対応するNL記述との間に論理単位を整列させることにより、より信頼性の高い推論経路を構築するReasoning-as-Logic-Units (RaLU)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:23:18 GMT)
MakeAnything: Harnessing Diffusion Transformers for Multi-Domain Procedural Sequence Generation [21.0] MakeAnythingは拡散トランスフォーマー(DIT)に基づくフレームワークで、細調整を利用して、一貫した手続きシーケンスを生成するためにDITのコンテキスト内機能を活性化する。
また、画像生成のための非対称低ランク適応(LoRA)を導入し、デコーダ層を適応的に調整しながらパラメータを凍結することで、タスク固有性能を一般化する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:44:42 GMT)
Physics-Informed Deep Learning Model for Line-integral Diagnostics Across Fusion Devices [20.9] 線積分測定による2次元プラズマプロファイルの迅速再構築は核融合において重要である。
本稿では、オニオンと呼ばれる物理インフォームドモデルアーキテクチャを導入し、モデルの性能を向上させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:35:08 GMT)
COFFE: A Code Efficiency Benchmark for Code Generation [20.8] LLM生成したコードソリューションの時間効率を評価するためのコード生成ベンチマークであるCOFFEを提案する。
COFFEには関数レベルとファイルレベルのコード生成にそれぞれ398と358の問題がある。
時間評価指標として,CPU命令数に基づくefficienct@kを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:08:51 GMT)
Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search [20.7] 本稿では,テキストベースPerson Anomaly Search(TPAS)におけるWWW 2025チャレンジに対するHFUT-LMCチームのソリューションについて述べる。
この課題の主な目的は、歩行者画像の大きな図書館内で正常または異常な行動を示す歩行者を正確に識別することである。
類似したテキスト記述による認識の難しさに対処するために、SCA(Simisity Coverage Analysis)戦略を導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:45:09 GMT)
LNQ 2023 challenge: Benchmark of weakly-supervised techniques for mediastinal lymph node quantification [20.6] 縦隔リンパ節定量化(LNQ)課題は,第26回医用画像コンピューティングとコンピュータ支援介入に関する国際会議(MICCAI 2023)と連携して実施された。
この課題は、新しい部分的に注釈付けされたデータセットと堅牢な評価フレームワークを提供することで、弱教師付きセグメンテーション手法を推進することを目的としていた。
結果は、弱教師付きアプローチのポテンシャルと現在の限界の両方を強調した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:46:24 GMT)
RS-YOLOX: A High Precision Detector for Object Detection in Satellite Remote Sensing Images [20.6] 本稿では,衛星リモートセンシング画像の自動検出のための改良型YOLOXモデルを提案する。
ネットワークの機能学習能力を高めるために,YOLOXのバックボーンネットワークにおいて,効率的なチャネル注意(ECA)を用いた。
トレーニングにおける正と負のサンプル数のバランスをとるために,Varifocal Loss関数を用いた。
Slicing Aided Hyper Inferenceと呼ばれるオープンソースのフレームワークを用いて,高速なリモートセンシングオブジェクト検出器を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:05:33 GMT)
Almost Surely Safe Alignment of Large Language Models at Inference-Time [20.5] 高い能力を持つ大規模言語モデル(LLM)でさえ、バイアスや安全でない応答を発生させることができる。
本稿では,新しい推論時間アライメント手法を提案する。
我々は、マルコフ決定プロセスとして安全な推論時間応答をフレーミングすることでこれを達成している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:47:19 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非線形プログラム(MINLP)は、エネルギーシステムや輸送といった様々な領域で発生する。
MINLPは特に大規模な解決が難しいことで知られている。
本稿では,解の積分性を保証するための2つの学習可能な補正層と,解の実現性を改善するための後処理ステップを備えた新しいディープラーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:01:20 GMT)
SymmCD: Symmetry-Preserving Crystal Generation with Diffusion Models [20.4] 結晶対称性を生成過程に組み込んだ新しい生成モデルであるSymphCDを提案する。
結晶を2つの成分に分解し,拡散による共同分布を学習する。
The Materials Projectのサブセット上でSymCDの競争性能を示し、現実的な対称性と予測特性を持つ多種多様で有効な結晶を得る。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:48:48 GMT)
UITrans: Seamless UI Translation from Android to HarmonyOS [20.3] 私たちは、Android用にデザインされた最初の自動UI変換ツールであるUITransをHarmonyOSに提示します。
6つのAndroidアプリケーションの評価では、UITrans翻訳の成功率は、コンポーネント、ページ、プロジェクトレベルでそれぞれ90.1%、89.3%、89.2%である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:11:45 GMT)
A Mixture-Based Framework for Guiding Diffusion Models [19.8] デノナイジング拡散モデルはベイズ逆問題(英語版)の分野において大きな進歩をもたらした。
近年のアプローチでは、事前学習した拡散モデルを用いて、そのような問題を広範囲に解決している。
本研究はこれらの中間分布の新たな混合近似を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:26:06 GMT)
Multivariate Conformal Prediction using Optimal Transport [19.6] コンフォーマル予測(CP)は、機械学習モデルの不確実性を定量化する。
多次元設定において共形予測集合を構成するための原理的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:56:41 GMT)
BFS-Prover: Scalable Best-First Tree Search for LLM-based Automatic Theorem Proving [19.6] 本稿では,Best-First Searchが大規模定理証明タスクにおいて競争性能を達成できるかどうかを考察する。
textttBFS-Proverは,3つの重要なイノベーションを特徴とする,スケーラブルなエキスパートイテレーションフレームワークです。
textttBFS-ProverはMiniF2Fテストセットで71.31ドルのスコアを獲得し、複雑な木探索方法の必要性を認識している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:33:36 GMT)
Every Angle Is Worth A Second Glance: Mining Kinematic Skeletal Structures from Multi-view Joint Cloud [19.5] スパース角観測による多対人モーションキャプチャは、自己と相互閉塞の両方からの干渉の下で難しい問題である。
我々は,対象のIDに関係なく,すべてのカメラビューから同じタイプの2次元関節を三角測量し,ジョイントクラウドを形成することを提案する。
ジョイントクラウドは、同一のジョイントタイプとターゲットIDから持ち上げられた有効なジョイントと、異なる2Dソースからの偽造ジョイントで構成されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:02:28 GMT)
Scaling laws in wearable human activity recognition [19.5] スケーリング法則は、モデルキャパシティと事前学習データボリュームをリンクすることで、より原則化された設計への移行を支援する可能性がある。
事前学習データとトランスフォーマーアーキテクチャの両方を網羅的に網羅的に探索することにより,HARのスケーリング法則を初めて確立する。
これらのスケーリング法則は,3つのHARベンチマークデータセットのダウンストリーム性能向上に寄与することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:00:08 GMT)
Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical Study [19.5] 本稿では,文脈内サンプル数の増加が評価結果の一貫性と品質に及ぼす影響について検討する。
GPT-4oのような先進LLMは、ゼロショットや少数ショットのレギュレーションよりも多ショットのレギュレーションにおいて優れた性能を示すことを示す実験結果が得られた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:42:43 GMT)
When Pre-trained Visual Representations Fall Short: Limitations in Visuo-Motor Robot Learning [19.4] トレーニング済みの視覚表現を視覚運動ロボット学習に統合することは、視覚エンコーダをゼロから訓練するための有望な代替手段として登場した。
PVRは、時間的絡み合いや、小さなシーンの摂動があっても一般化できないなど、政策学習の文脈において重要な課題に直面している。
本研究は、これらの欠点を特定し、対処するための解決策を提案する。まず、時間的知覚とタスク完了の感覚でPVR機能を増強し、効果的に時間内にそれらを切り離す。
第2に,タスク関連ローカル機能への選択的参加を学習するモジュールを導入し,アウト・オブ・ディストリビューション(out-of-distribution)の評価においてロバスト性を高める。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:25:46 GMT)
DynVFX: Augmenting Real Videos with Dynamic Content [19.4] 本稿では,動的コンテンツを新たに生成した実世界の映像を拡大する手法を提案する。
入力ビデオと、所望の内容を記述した簡単なテキスト命令が与えられた場合、本手法は動的オブジェクトや複雑なシーン効果を合成する。
新しいコンテンツの位置、外観、動きは、元の映像にシームレスに統合される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:14:55 GMT)
Policies and Evaluation for Online Meeting Summarization [19.4] オンライン会議要約の最初の体系的な研究を行う。
そこで本研究では,オンライン要約を行うためのポリシーをいくつか提案する。
AutoMinデータセットの実験では、オンラインモデルは強力な要約を生成することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:15:00 GMT)
Cardinality Estimation on Hyper-relational Knowledge Graphs [19.3] 3つの事実を持つ知識グラフ(KG)上のクエリに対する心的推定(CE)は大きな成功を収めた。
しかし、KGs上のサンプリングや要約などの既存のCEメソッドは、HKGsに対して不満足に実行する。
本稿では,複数のGNN層からの出力を適応的に結合し,修飾器情報を効果的に組み込んだグラフニューラルネットワーク(GNN)モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:24:43 GMT)
RiemannGFM: Learning a Graph Foundation Model from Riemannian Geometry [19.3] グラフニューラルネットワークは、非ユークリッド構造であるグラフデータの学習に優れるが、一般化能力に欠けることが多い。
近年,大規模言語モデルの活用が試みられている。
鍵となる革新は、木やサイクルの単純で効果的な構造語彙の発見である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:06:09 GMT)
Web Execution Bundles: Reproducible, Accurate, and Archivable Web Measurements [19.2] WebRECは,現在の最先端の精度と比較したWeb測定ツールである。
我々はまた、幅広いWebサイト行動の正確かつ再現可能な測定のためのアーカイブフォーマットである.webを提示する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:46:09 GMT)
On Fairness of Unified Multimodal Large Language Model for Image Generation [19.1] 最新のU-MLLMをベンチマークした結果、ほとんどの場合、性別や人種バイアスなど、大きな人口統計バイアスが示されることがわかった。
我々の分析は、偏見は主に言語モデルに由来することを示している。
本稿では、人口分布と合成データとのバランスをとるために、新しいバランスの取れた選好モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:21:03 GMT)
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering [19.1] ルール誘導型検索拡張生成方式(RuleRAG-ICL)を提案する。
RuleQAの実験では、Recall@10では+89.2%の検索品質が向上し、Exact Matchでは+103.1%の回答精度が向上した。
さらに、既存のRAGデータセット4つの実験では、ルールQAのルールを提供することで、ルールRAGが有効であることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:15:11 GMT)
A Unified Knowledge-Distillation and Semi-Supervised Learning Framework to Improve Industrial Ads Delivery Systems [19.0] 産業広告ランキングシステムは従来、ラベル付きインプレッションデータに依存しており、過度な適合、モデルのスケーリングによる漸進的な増加、トレーニングとサービスデータの相違によるバイアスといった課題につながっている。
広告ランク付けのための知識・蒸留・半教師付き学習(UK)のための統一フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:14:07 GMT)
Minerva: A Programmable Memory Test Benchmark for Language Models [18.5] 本稿では、モデルがメモリを効果的に活用できる能力を評価するために、包括的なテストを自動的に生成するフレームワークを提案する。
我々は、検索、リコール、編集、マッチング、文脈記憶における情報の比較といったアトミックなタスクのモデルを評価する。
我々のベンチマークでは,LLMのメモリ能力の解釈可能かつ詳細な評価が可能である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:53:45 GMT)
Assessing Open-world Forgetting in Generative Image Model Customization [18.2] 我々は、意図しない変更の広大な範囲を特徴付けるために、オープンワールドの忘れという概念を導入する。
モデル適応であっても,新たに導入された概念をはるかに超越した領域において,意味的ドリフトが著しく影響されることが示唆された。
本稿では,新しい概念を取り入れつつ,本来の能力を効果的に維持する機能正規化戦略を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:06:11 GMT)
Improve Decoding Factuality by Token-wise Cross Layer Entropy of Large Language Models [18.1] 本稿では,余分な訓練を必要とせずに幻覚を緩和するEntropy eNhanced Decoding (END)を提案する。
ENDは、堅牢なQA精度を維持しつつ、生成したコンテンツの真しさと情報性を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:19:52 GMT)
MobiCLR: Mobility Time Series Contrastive Learning for Urban Region Representations [18.1] インフローとアウトフローのモビリティパターンから意味論的に意味のある埋め込みをキャプチャする新しい都市域表現学習モデルを提案する。
シカゴ、ニューヨーク、ワシントンD.C.で、収入、教育の達成、社会的脆弱性を予測する実験を行っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:18:43 GMT)
MetaFE-DE: Learning Meta Feature Embedding for Depth Estimation from Monocular Endoscopic Images [18.0] 既存の手法ではRGB画像から直接深度情報を推定する。
メタ機能埋め込み(MetaFE)と呼ばれる新しい概念を紹介する。
本稿では,分子内深度推定のための2段階の自己教師型学習パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:52:30 GMT)
Scaling Laws for Upcycling Mixture-of-Experts Language Models [17.8] 大規模言語モデル(LLM)の事前トレーニングはリソース集約的であり、ハイエンドのGPUクラスタでも数ヶ月のトレーニング時間を必要とすることが多い。
そのような計算要求を緩和する2つのアプローチがある: より小さなモデルを再利用して、より大きなモデルをトレーニングする(アップサイクル)、そして、Mix-of-experts (MoE)のような計算効率の良いモデルを訓練する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:11:13 GMT)
The ODE Method for Stochastic Approximation and Reinforcement Learning with Markovian Noise [17.5] 近似アルゴリズムを解析する根本的な課題は、その安定性を確立することである。
我々は、マルティンゲール差分雑音設定からマルコフ雑音設定へ有界な安定性に対するボルカール・メインの定理を拡張した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:20:11 GMT)
Channel Gain Map Construction based on Subregional Learning and Prediction [17.5] チャネルゲインマップ(CGM)の構築は,環境に配慮した6G無線通信の実現に不可欠である。
本稿では,データ駆動クラスタリングにより地図全体をサブリージョンに分割する,部分領域学習に基づくCGM構築手法を提案する。
本研究では,不均一なサブリージョンサンプリングによる予測精度の向上と,サブリージョン境界周辺のデータ再利用のトレーニングを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:22:47 GMT)
TYPEPULSE: Detecting Type Confusion Bugs in Rust Programs [17.5] Rustは型変換をサポートし、安全なRustはこれらの変換のセキュリティを保証する。
これらの変換は、メモリ破損の深刻な問題を引き起こす可能性がある。
C/C++の型混乱バグに関する広範な研究にもかかわらず、Rustの型混乱バグの研究はまだ不足している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:27:08 GMT)
AlphaAdam:Asynchronous Masked Optimization with Dynamic Alpha for Selective Updates [17.5] 大規模言語モデル(LLM)の最適化フレームワークであるAlphaAdamを提案する。
パラメータの更新を分離し、その強度を動的に調整することで、AlphaAdamは収束を加速し、トレーニングの安定性を向上させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:23:18 GMT)
Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation [17.5] TTFT(Time-to-first-Token)の改良は、現代の大規模言語モデル(LLM)推論エンジンにおいて本質的に重要な目標である。
長文および中文の問合せに対してTTFTを高速化するトレーニングフリーフレームワークであるSpecPrefillを提案する。
各種タスクのセットでSpecPrefillを評価した上で、実際のエンドツーエンド設定とアブレーション研究の両方において、パフォーマンス改善の総合的なベンチマークを行った。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:22:06 GMT)
Parallel AutoRegressive Models for Multi-Agent Combinatorial Optimization [17.4] マルチエージェントタスクのための高品質なソリューションを効率的に構築するための強化学習フレームワークを提案する。
PARCOは,(1)並列ソリューション構築において効果的なエージェント協調を可能にするトランスフォーマーベースの通信層,(2)低レイテンシ,並列エージェント決定のためのマルチポインタ機構,(3)優先度ベースのコンフリクトハンドラの3つの重要なコンポーネントを統合する。
提案手法が最先端の学習手法より優れているマルチエージェント車両ルーティングおよびスケジューリング問題においてPARCOを評価し,強力な一般化能力と計算効率を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:49:54 GMT)
Robust Biharmonic Skinning Using Geometric Fields [17.2] スキンニングの手法はメッシュにまたがる各自由度の影響を分配する重み関数に依存している。
メッシュフリーでロバストな自動スキンニング手法を導入し,ボリュームメッシュを使わずに,最先端のスキンニングウェイトを生成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:02:08 GMT)
Double Distillation Network for Multi-Agent Reinforcement Learning [16.9] 本稿では,2つの蒸留モジュールを組み込んだDouble Distillation Network(DDN)について紹介する。
外部蒸留モジュールは、グローバルガイドネットワークとローカルポリシーネットワークを使用し、グローバルトレーニングとローカル実行のギャップを緩和するために蒸留を利用する。
さらに、内部蒸留モジュールは、状態情報から引き出された固有報酬を導入し、エージェントの探索能力を高める。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:31:55 GMT)
FactorGCL: A Hypergraph-Based Factor Model with Temporal Residual Contrastive Learning for Stock Returns Prediction [16.7] 時間的残留的コントラスト学習(FactorGCL)を用いたハイパーグラフに基づく因子モデルを提案する。
ストックリターンを予測するために, 人為的に設計された先行要因を補う隠蔽因子を抽出するために, カスケード残差ハイパーグラフアーキテクチャを設計する。
実株市場データに関する我々の実験は、FacterGCLが既存の最先端手法より優れていることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:37:15 GMT)
Dual-Flow: Transferable Multi-Target, Instance-Agnostic Attacks via In-the-wild Cascading Flow Optimization [16.7] 本稿では,マルチターゲットのインスタンス非依存型対向攻撃のための新しいDual-Flowフレームワークを提案する。
本手法は,対戦訓練モデルなどの防御機構に対する強い強靭性を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:38:33 GMT)
TensorQC: Towards Scalable Distributed Quantum Computing via Tensor Networks [16.6] 量子処理ユニット(QPU)は、正確な結果を得るために、多数の高品質キュービットを含む必要がある。
ほとんどの科学的および産業的な古典的な計算処理は分散システム上で並列に行われる。
本稿では、スタンドアロンのQPUやそれ以前の回路切断技術には難易度の高いベンチマークを実行することを実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:42:07 GMT)
A New World in the Depths of Microcrypt: Separating OWSGs and Quantum Money from QEFID [16.5] EFI対が存在する量子ユニタリオラクルが存在することを示すが、OWSGは存在しない。
私たちは、オラクル、QEFID、片道パズルを通じて、OWSGや他のMicrocryptプリミティブから切り離しています。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:35:31 GMT)
Conformal Uncertainty Indicator for Continual Test-Time Adaptation [16.2] 連続テスト時間適応(CTTA)のための整形不確かさ指標(CUI)を提案する。
我々は、コンフォーマル予測(CP)を利用して、特定のカバレッジ確率を持つ真のラベルを含む予測セットを生成する。
実験により,CUIが不確かさを効果的に推定し,既存のCTTA法にまたがる適応性能を向上させることが確認された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:47:18 GMT)
REALEDIT: Reddit Edits As a Large-scale Empirical Dataset for Image Transformations [16.2] 既存の画像編集モデルは、現実の要求を満たすのに苦労している。
本稿では,Redditからのユーザ要求と人為的な編集機能を備えた大規模な画像編集データセットREALEDITを紹介する。
以上の結果から,既存のモデルではこれらのタスクが不足しており,現実的なトレーニングデータの必要性が強調されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:35:48 GMT)
Human-Aligned Image Models Improve Visual Decoding from the Brain [16.2] 我々は,脳の信号を画像にマッピングするために,人間のアライン画像エンコーダを導入する。
我々の経験的結果は、この単純な修正によって画像検索精度が最大21%向上することを示すこの仮説を支持している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:14:51 GMT)
CLIP Behaves like a Bag-of-Words Model Cross-modally but not Uni-modally [16.1] 近年の研究では、CLIPの合成概念を効果的に表現する能力に疑問が呈されている。
特に、CLIPは、画像やテキストに複数のオブジェクトが存在する場合、対応するオブジェクトに属性を正しくバインドするのに苦労している。
本稿では,コサイン類似性を計算する前に,テキスト埋め込みに線形変換を適用した線形属性結合CLIP(LABCLIP)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:28:57 GMT)
LLMs can be easily Confused by Instructional Distractions [16.1] 大規模言語モデルは、タスクに続く命令において例外的なスキルを示す。
この強度は、モデルが特定の命令を無視しなければならない場合に脆弱性になる可能性がある。
DIM-Benchと呼ばれる新しいベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:52:57 GMT)
Improving Consistency Models with Generator-Augmented Flows [16.0] 一貫性モデルは、ニューラルネットワークの単一前方通過におけるスコアベース拡散の多段階サンプリングを模倣する。
それらは、一貫性の蒸留と一貫性のトレーニングの2つの方法を学ぶことができる。
本稿では,一貫性モデルから得られたノイズデータを対応する出力へ転送する新しい流れを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:57:34 GMT)
ExploreSelf: Fostering User-driven Exploration and Reflection on Personal Challenges with Adaptive Guidance by Large Language Models [15.9] リフレクティブプロンプトは方向を提供するために使われており、大きな言語モデル(LLM)は、調整されたガイダンスを提供する可能性を実証している。
We present ExploreSelf, a LLM-driven application designed to empower users to control their reflective journey。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:41:42 GMT)
EuskañolDS: A Naturally Sourced Corpus for Basque-Spanish Code-Switching [15.8] バスク語とスペイン語のコードスイッチングのための自然ソースコーパスを開発するための最初のアプローチを提案する。
提案手法は,すでに利用可能なコーパスからCSテキストを識別する言語識別モデルを用いて構成する。
コーパスの特性を提示し、EuskanolDSという名前で利用できるようにする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:04:42 GMT)
Privacy Token: Surprised to Find Out What You Accidentally Revealed [15.7] プライバシーに敏感なドメインにおけるディープラーニングモデルは、プライバシーリスクに関する懸念を増幅している。
トレーニング中にプライベート勾配から直接導出されるプライバシートークンの概念を提案する。
プライバシートークンは、トレーニングデータからのプライベート情報漏洩の程度に関する貴重な洞察を提供する。
我々は、トレーニングデータと勾配の関係を定量化するために、Mutual Information (MI) をロバストな指標として採用する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:20:20 GMT)
Analysis of Value Iteration Through Absolute Probability Sequences [15.6] 値反復はマルコフ決定過程(MDP)を解くために広く用いられているアルゴリズムである
我々は絶対確率列を用いて新しい解析行を開発し、そのアルゴリズムの収束を$L2$ノルムの観点から検証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:01:32 GMT)
RLOMM: An Efficient and Robust Online Map Matching Framework with Reinforcement Learning [15.6] 本稿では,多様なシナリオを扱う際の堅牢性を確保しつつ,高精度かつ効率的なマッチングを実現する新しいフレームワークを提案する。
まず,オンライン地図マッチング問題をオンラインマルコフ決定プロセスとしてモデル化することから始める。
次に、モデルのロバスト性を高めるために、リアルタイムデータのロバスト処理を可能にする強化学習法を設計する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:26:32 GMT)
Optimal Best Arm Identification with Post-Action Context [15.6] 動作後コンテキストを用いたベストアーム識別の問題を紹介する。
動作後コンテキストの2つの異なるタイプを解析する。
非セパレータ設定では、トラック・アンド・ストップのアルゴリズムをこの設定に拡張できることを実証する。
セパレータ設定では,コンテキスト空間の幾何学を用いてアクションではなくコンテキストを直接追跡する「textitG-tracking$」という新しいサンプリングルールを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:47:05 GMT)
Scalable In-Context Learning on Tabular Data via Retrieval-Augmented Large Language Models [15.6] 拡張性のあるTabICLのための検索拡張言語モデルを提案する。
提案手法では,LLMのための検索誘導型命令チューニングと合わせて,検索モジュールをカスタマイズする。
これにより、LLMはより大きなデータセットを効果的に活用することができ、69の広く認識されているデータセット間での大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:16:41 GMT)
Code-Optimise: Self-Generated Preference Data for Correctness and Efficiency [15.6] Code-Optimiseは、正確性(パス、フェール)とランタイムの両方を学習信号として組み込んだフレームワークです。
私たちのフレームワークは軽量で堅牢で、オーバーフィッティングを減らすためのソリューションを動的に選択します。
副生成物として、生成した溶液の平均長はMBPPで48%、HumanEvalで23%減少する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:29:01 GMT)
The Role of Privacy Guarantees in Voluntary Donation of Private Health Data for Altruistic Goals [15.5] 本研究は,プライバシ・エンハンスメント・テクノロジー(PET)を通じて提供される4つの一般的な保証の下で,新しい治療法を開発するために,米国在住の人々が医療データを寄付する意思について検討する。
以上の結果から, プライバシ保護の明示的なアウトライン化が, 全体的な認識にほとんど影響を与えないことが判明した。
技術コミュニティはPET保証の信頼を高めるメカニズムとして監査を提案してきたが、そのような監査に対する透明性からの制限効果を観察した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:16:47 GMT)
Train-Attention: Meta-Learning Where to Focus in Continual Knowledge Learning [15.5] TAALM(Train-Attention-Augmented Language Model)は,トークンに対する重み付けを動的に予測・適用することにより,学習効率を向上させる。
我々は,TAALMがベースライン上での最先端性能を証明し,従来のCKLアプローチと統合した場合に相乗的互換性を示すことを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:12:13 GMT)
ColPali: Efficient Document Retrieval with Vision Language Models [15.4] 我々は、複数のドメイン、言語、実用的な設定にまたがる様々なページレベルの検索タスクからなるVisual Document Retrieval Benchmark ViDoReを紹介する。
現代のシステムの本質的な複雑さと性能上の欠点は、ドキュメントページのイメージを直接埋め込むことで文書検索を行うという新しい概念を動機付けている。
文書ページの画像から高品質なマルチベクトル埋め込みを生成するために訓練されたビジョン言語モデルColPaliをリリースする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:42:57 GMT)
Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation [15.3] Rankifyは、検索、再ランク付け、RAGを統合するために設計された、強力でモジュール化されたオープンソースツールキットである。
厳密でスパースなリトリーバーを含む幅広い検索技術をサポートし、最先端のリグレードモデルも備えている。
Rankifyには、Huggingfaceで利用可能なベンチマークを容易にするために、検索済みのデータセットのコレクションが含まれている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:38:12 GMT)
Upweighting Easy Samples in Fine-Tuning Mitigates Forgetting [15.3] 下流タスクで事前訓練されたモデルを微調整すると、元の能力は劣化することが多い。
本稿では,事前学習したモデルの損失に基づく微調整データのサンプル重み付け手法を提案する。
我々は,言語と視覚の両方における手法の有効性を実証的に実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:49:59 GMT)
SpaceGNN: Multi-Space Graph Neural Network for Node Anomaly Detection with Extremely Limited Labels [15.0] Node Anomaly Detection (NAD)は、現実世界のシナリオにおける多様な応用のために、ディープラーニングコミュニティで大きな注目を集めている。
従来の手法では、合成データを利用して補助情報を収集する傾向があり、これは有効な解決策ではない。
NADタスクを極端に限定した新しいSpaceGNNモデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:21:03 GMT)
Reflection-Window Decoding: Text Generation with Selective Refinement [14.9] 大規模言語モデル(LLM)におけるテキスト生成の自己回帰復号化は、生成されたコンテンツの洗練や修正を行うための内蔵機構が欠如しているため、本質的には準最適である。
本稿では, すべり反射窓と舗装基準を組み込んだ手法を提案し, 復号化が進むにつれて, 改良と生成を相互に行なえるようにした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:53:08 GMT)
Cache-Craft: Managing Chunk-Caches for Efficient Retrieval-Augmented Generation [14.8] CacheCraftは、テキストチャンクに対応する計算済みKVの再利用を管理するシステムである。
再利用可能なチャンクキャッシュの特定方法、キャッシュの修正に少数の再計算を効率的に行う方法、ハードウェアにチャンクキャッシュを効率よく保存・削除する方法を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:12:33 GMT)
Analyzing (In)Abilities of SAEs via Formal Languages [14.7] 正規言語の合成テストベッド上でスパースオートエンコーダを訓練する。
パフォーマンスは、トレーニングパイプラインの帰納バイアスに敏感です。
我々は、因果関係がSAEトレーニングの中心的標的となる必要があると論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:11:10 GMT)
Optimizing Robustness and Accuracy in Mixture of Experts: A Dual-Model Approach [14.6] Mixture of Experts (MoE) は、複雑な機械学習タスクに専門のエキスパートネットワークを活用することに成功している。
敵攻撃に対する感受性は、堅牢なアプリケーションに展開する上で重要な課題である。
本稿では, 自然精度を維持しつつ, 頑健性をMoEに組み込む方法について論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:45:52 GMT)
Transformers and Their Roles as Time Series Foundation Models [14.6] 我々は,変換器を時系列基礎モデルとして解析し,近似と一般化機能に着目した。
任意の数の共変量を持つ自己回帰モデルにMOIRAIが自動的に適合できることを実証する。
実験は、時系列基礎モデルとしてのトランスフォーマーの有効性を強調し、我々の理論的な結果を支持する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:18:55 GMT)
A Scalable Approach to Probabilistic Neuro-Symbolic Verification [14.6] Neuro-Symbolic Artificial Intelligence (NeSy AI)は、ニューラルネットワークとシンボリック推論を統合するための有望な方向として登場した。
我々は、そのようなNeSy確率論的推論システムの堅牢性を正式に検証する問題に対処する。
確率的NeSy系の近似的・緩和的検証のための最初の手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:29:41 GMT)
Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration [14.6] 本稿では,Long-tailed Medical Diagnosis (LMD) フレームワークを提案する。
私たちのフレームワークは最先端のアプローチを大きく超えています。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:57:23 GMT)
An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization [14.1] アルゴリズムの主要な構成要素は、目的関数の値に基づくランダム性である。
アルゴリズムの収束を代数学で証明し、パラメータ空間でチューニングする。
アルゴリズムの効率性とロバスト性を示す数値的な例をいくつか提示する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:22:44 GMT)
Towards Fair Medical AI: Adversarial Debiasing of 3D CT Foundation Embeddings [14.0] 自己教師付き学習は、大規模未ラベルデータセットから効率的で一般化可能な特徴抽出を可能にすることで、医療画像に革命をもたらした。
近年、自己教師付き基礎モデルは3次元CTデータに拡張され、1408個の特徴を持つコンパクトで情報豊富な埋め込みを生成する。
これらの埋め込みは、年齢、性別、人種などの人口統計情報を符号化することが示されており、臨床応用の公正性に重大なリスクをもたらす。
本稿では,VAEをベースとした対向的デバイアス化フレームワークを提案し,これらの埋め込みを人口統計学の新たな潜在空間に変換する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:32:42 GMT)
Can Cross Encoders Produce Useful Sentence Embeddings? [13.9] クロスエンコーダ(CE)は、関連性を検出するために文ペアで訓練される。
代わりに、デュアルエンコーダ (DE) が文を埋め込むために使われる。
我々はCEを用いてより軽量なDEを蒸留する方法を示し、推論時間では5.15倍のスピードアップを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:09:53 GMT)
Large Language Model Adversarial Landscape Through the Lens of Attack Objectives [13.8] 大規模言語モデル(LLM)は、人工知能における変革的な飛躍を表している。
LLMは、プライバシー、信頼性、セキュリティ、信頼性を脅かす様々な敵攻撃に対して、ますます脆弱になっている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:54:07 GMT)
No Location Left Behind: Measuring and Improving the Fairness of Implicit Representations for Earth Data [13.4] 暗黙の神経表現(INR)は、地球表象の課題に対処する上での公約が増大している。
既存の手法はグローバルな平均性能を不均等に優先する。
FAIR-Earthは、地球表象の不等式を調べ、挑戦するための第一種データセットである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:51:13 GMT)
Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study [13.4] GemmaX2-28は、28言語で最上位の多言語翻訳性能を達成する9Bモデルである。
GemmaX2-28 は TowerInstruct や XALMA などの最先端 (SOTA) モデルより一貫して優れている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:48:33 GMT)
DC-VSR: Spatially and Temporally Consistent Video Super-Resolution with Video Diffusion Prior [13.3] ビデオ解像度(VSR)は、低解像度(LR)から高解像度(HR)ビデオを再構成することを目的としている。
DC-VSRは、空間的および時間的に整合したVSR結果を現実的なテクスチャで生成する。
実験により、DC-VSRは空間的にも時間的にも一貫した高品質なVSRを達成し、以前のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:15:00 GMT)
TruePose: Human-Parsing-guided Attention Diffusion for Full-ID Preserving Pose Transfer [13.1] Pose-Guided Person Image Synthesis (PGPIS)は、特定のターゲットポーズ(例えば骨格)を採用しながら、被験者のアイデンティティをソースイメージから保持する画像を生成する。
拡散に基づくPGPIS法は、ポーズ変換中に顔の特徴を効果的に保存するが、拡散過程を通して元の画像から衣服の詳細を正確に保持するのに苦慮することが多い。
本研究では, 顔と衣服の外観を効果的に保ちながら, 高品質な結果をもたらす新しいアプローチである, パーシング誘導型注意拡散法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:15:11 GMT)
Representations Shape Weak-to-Strong Generalization: Theoretical Insights and Empirical Predictions [13.0] W2SG(Wak-to-Strong Generalization)は、人間が将来超人的な知性をどう導くかを理解するための重要なアナロジーである。
We show that W2SG can be characterized using kernels from the principal component of weak and strong model' internal representations。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:36:00 GMT)
DualFed: Enjoying both Generalization and Personalization in Federated Learning via Hierachical Representations [12.9] パーソナライズド・フェデレーション・ラーニング(PFL)では、高モデル一般化と効果的なパーソナライゼーションの両立が大きな課題となることが広く認識されている。
本論文は肯定的な回答であり,深層モデルが本質的に階層的アーキテクチャを示すという観察の鍵となる。
一般化とパーソナライゼーションに対応する2つの表現を直接生成できる新しい手法であるDualFedを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:52:44 GMT)
The Other Side of the Coin: Unveiling the Downsides of Model Aggregation in Federated Learning from a Layer-peeled Perspective [12.9] FL(Federated Learning)では、複数のクライアントが知識を相互に共有する上で、モデルアグリゲーションが重要なステップとなります。
この一時的な性能低下は、FLモデルの収束を遅くする可能性がある。
本稿では,モデルアグリゲーションの負の影響を軽減するための,単純かつ効果的な戦略を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:45:56 GMT)
Discrete GCBF Proximal Policy Optimization for Multi-agent Safe Optimal Control [12.9] 本稿では,周辺環境の変化や入力制約を処理する離散グラフCBFと,マルチエージェントシステムを対象とした分散型高性能安全ポリシーの両方を学習するフレームワークを提案する。
3つのシミュレーションエンジンにまたがるマルチエージェントタスクのスイート上で,我々の主張を実証的に検証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:51:47 GMT)
SoK: Understanding zk-SNARKs: The Gap Between Research and Practice [12.7] 我々は,zk-SNARKを理論から実践まで包括的に研究し,ギャップと限界を指摘する。
まず、プログラムをzk-SNARKに変換する際の主要なステップを統一するマスターレシピを示す。
2013年以降、40以上のzk-SNARKを調査し、それらのカテゴリとプロパティをリストアップした参照テーブルを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:09:44 GMT)
Lightweight Protocols for Distributed Private Quantile Estimation [12.6] 我々は、各ユーザが1つのデータポイントを1つのドメインに[B]$で保持するときに、1つの量子を推定する2つの強調適応アルゴリズムを考察する。
適応的な設定では、$varepsilon$-LDPアルゴリズムを用い、$O(fraclog Bvarepsilon2alpha2)$ユーザしか必要としないエラー$alpha$内の量子化を推定できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:39:02 GMT)
Understanding and Enhancing the Transferability of Jailbreaking Attacks [12.4] 脱獄攻撃は、オープンソースの大規模言語モデル(LLM)を効果的に操作し、有害な応答を生成する。
本研究は, モデルが意図的知覚に与える影響を分析し, 脱獄攻撃の伝達可能性について検討する。
そこで本研究では,入力中の中性インテリジェントトークンを均一に分散するPerceived-Iportance Flatten (PiF)法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:29:54 GMT)
How do Humans and Language Models Reason About Creativity? A Comparative Analysis [12.4] 評価を用いた例を含む2つの実験が創造性評価にどのように影響するかを検討した。
研究1では, フォーマルな科学や工学の訓練を受けた72人の専門家の創造性評価を, 評価を受けた者(例)と、そうでない者(例)を比較した。
研究2では、最先端のLCMを用いた並列解析により、モデルが独創性を評価する際に、アイデアの非日常性と遠隔性を優先していることが判明した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:08:43 GMT)
Uncertainty Quantification with the Empirical Neural Tangent Kernel [12.4] トレーニング終了時のオーバーパラメータ化ネットワークに対するポストホックサンプリングに基づくUQ手法を提案する。
実験的なニューラルタンジェントカーネルを用いて,ガウス過程の後部を効果的に近似することを示した。
提案手法は, 計算効率の競合するアプローチ(多くの場合, 複数の要因によるコスト削減)に勝るだけでなく, 回帰処理と分類処理の両方において, 様々なUQ指標の最先端性能も維持できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:01:34 GMT)
GazeHTA: End-to-end Gaze Target Detection with Head-Target Association [12.4] 本稿では,視線目標検出のためのエンドツーエンドアプローチを提案する。
GazeHTAは、個人と見ているターゲット画像領域との間のヘッドターゲット接続を予測する。
実験の結果,GazeHTAは最先端の視線目標検出法よりも優れていた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:39:02 GMT)
DiversityOne: A Multi-Country Smartphone Sensor Dataset for Everyday Life Behavior Modeling [12.3] DiversityOneは8つの国(中国、デンマーク、インド、イタリア、メキシコ、モンゴル、パラグアイ、イギリス)にまたがるデータセットで、4週間にわたって772人の大学生のデータを含んでいる。
今日現在、このデータセットは最も大きく、最も多様な公開データセットの1つであり、広範な人口統計学的および精神社会的調査データを特徴としている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:40:05 GMT)
Label Distribution Shift-Aware Prediction Refinement for Test-Time Adaptation [12.2] テスト時間適応(DART)のためのラベル分散シフト予測の改良について紹介する。
DARTは、クラスワイドの混乱パターンに着目して予測を洗練する新しいTTA手法である。
CIFAR-10Cではラベル分布シフトがない場合,CIFAR-10Cでは精度が5-18%向上する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:47:29 GMT)
MAP Image Recovery with Guarantees using Locally Convex Multi-Scale Energy (LC-MUSE) Model [12.2] データ多様体の周囲の局所的に強く凸したマルチスケールの深部エネルギーモデルを提案する。
画像に基づく逆問題では学習エネルギーモデルを使用し、定式化はいくつかの望ましい性質を提供する。
並列磁気共鳴(MR)画像再構成の文脈において,提案手法は最先端の凸正則化器よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:00:55 GMT)
ScholaWrite: A Dataset of End-to-End Scholarly Writing Process [12.2] ScholaWriteデータセットは、完全な原稿のエンドツーエンドの学術的な記述プロセスの、第一級のキーストロークログである。
私たちのデータセットには、5つのプレプリントから得られたキーストロークデータが含まれており、合計62万件のテキスト変更と4ヶ月にわたる注釈が含まれています。
本実験は最終稿ではなく,エンド・ツー・エンドの筆記データの収集の重要性を明らかに示していた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:57:37 GMT)
In Praise of Stubbornness: The Case for Cognitive-Dissonance-Aware Knowledge Updates in LLMs [12.1] 大規模言語モデル(LLM)は、破滅的な忘れをすることなく、その知識を継続的に更新するのに苦労する。
人間は新しい情報を熱心に統合し、既存の信念との矛盾を検知し、精神モデルを選択的に更新する。
本稿では,LLMにおける継続的な知識更新を研究するための,認知にインスパイアされた調査パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:49:33 GMT)
Stein Discrepancy for Unsupervised Domain Adaptation [12.1] 教師なしドメイン適応(UDA)は、ラベル付きソースデータセットからの情報を活用し、関連するがラベルなしのターゲットデータセットの精度を改善する。
従来の手法では、ワッサーシュタイン距離や平均誤差の最大値といった距離を用いていた。
本稿では、ソースとターゲットドメイン間の距離を測定するために、スタイン差分法を用いる新しいアキュダ法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:09:28 GMT)
ExLM: Rethinking the Impact of [MASK] Tokens in Masked Language Models [12.0] Masked Language Models (ML)Mssは入力シーケンスの部分を[MASK]トークンでランダムにマスキングしてトレーニングし、残りのコンテキストに基づいて元のコンテンツを再構築する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:17:30 GMT)
Time Series Anomaly Detection in the Frequency Domain with Statistical Reliability [12.0] 本稿では,周波数領域への選択推論(SI)に基づく統計的に重要な異常検出の最近の進歩について述べる。
提案手法は周波数領域における検出されたCPの統計的意義を$p$-valuesを用いて定量化する。
実験により,提案手法は高い統計的保証を有する真のCPを確実に同定することを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:48:12 GMT)
Parametric Scaling Law of Tuning Bias in Conformal Prediction [12.0] 多くの共形予測手法において、チューニングとキャリブレーションに同じデータセットを活用することで導入されたチューニングバイアス(カバレッジギャップ)が単純なパラメータチューニングには無視できることがわかった。
我々は、チューニングバイアスの定量化と、チューニングバイアスのスケーリング法則の厳密な証明を上界から導出する理論的枠組みを確立する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:26:47 GMT)
ReachAgent: Enhancing Mobile Agent via Page Reaching and Operation [11.9] タスクが与えられたら、モバイルAIエージェントは、複数のステップでモバイルデバイスと対話し、タスクを解決するGUIフローを形成することができる。
この問題に対処するため、MobileReachというトレーニングデータセットを構築しました。
タスク補完能力の向上に焦点を当てた2段階フレームワークであるReachAgentを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:35:23 GMT)
Enhancing Cross-domain Link Prediction via Evolution Process Modeling [11.9] DyExpertはクロスドメインリンク予測のための動的グラフモデルである。
特定の下流グラフの進化パターンを学ぶために、歴史的に進化したプロセスを明示的にモデル化することができる。
DyExpertは多様なドメインにわたる広範な動的グラフによって訓練されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:28:11 GMT)
Interactive Symbolic Regression through Offline Reinforcement Learning: A Co-Design Framework [11.8] シンボリック回帰は、観測データから基礎となる数学的および物理的関係を明らかにする大きな可能性を秘めている。
現在の最先端のアプローチは、通常、ドメインエキスパートの事前知識の統合を考慮していない。
本稿では,大規模な記号回帰のための高度な対話型フレームワークであるSym-Qを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:26:49 GMT)
DeepCell: Multiview Representation Learning for Post-Mapping Netlists [11.8] DeepCellはPMネットリストとAIGの両方からの構造的および機能的な洞察を統合する表現学習フレームワークである。
コアとなるDeepCellは、PMネットリスト表現を自己管理的に洗練する新しいマスク回路モデリング(MCM)メカニズムを採用している。
DeepCellはPMネットリストの表現に新しいベンチマークを設定し、予測精度と再現精度で既存の手法を上回っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:39:47 GMT)
SKI Models: Skeleton Induced Vision-Language Embeddings for Understanding Activities of Daily Living [11.8] 視覚言語埋め込み空間に3Dスケルトンを統合するSKIモデルを導入する。
SKIモデルは骨格言語モデルであるSkeletonCLIPを利用して、共同トレーニングを通じて骨格情報を視覚言語モデル(VLM)とLVLM(Large Vision Language Model)に注入する。
SKIモデルの有効性は、ゼロショットアクション認識およびビデオキャプション生成タスクのために、人気のある3つのADLデータセットで検証される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:57:04 GMT)
COSMosFL: Ensemble of Small Language Models for Fault Localisation [11.7] 投票機構を用いたタスクレベルのLCMアンサンブル手法であるCOSMosを提案する。
本稿では, LLMの精度とエネルギー消費, 推定時間, 使用するトークン数といった様々なコストとの間の費用対効果のトレードオフについて報告する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:09:26 GMT)
Active Exploration via Autoregressive Generation of Missing Data [11.7] 自己回帰シーケンスモデルからのトレーニングと生成の問題として,オンライン意思決定において不確実な定量化と探索を行う。
われわれのアプローチは、適切な行動選択によって明らかになるであろう将来の成果の欠如から生じる不確実性に頼っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:13:43 GMT)
Machine Learning-Driven Student Performance Prediction for Enhancing Tiered Instruction [11.6] 学生のパフォーマンス予測は、教育データマイニングにおいて最も重要な課題の1つである。
広範な予測実験にもかかわらず、機械学習手法は実践的な教育戦略に効果的に統合されていない。
本研究は,機械学習による学生の成績予測とタインド・インストラクションを統合し,対象科目における学生の成績向上を目的とした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:13:25 GMT)
Teaching Large Language Models Number-Focused Headline Generation With Key Element Rationales [11.4] 数中心の見出し生成は、Large Language Models (LLMs) のユニークな挑戦である
本稿では,ニュース記事におけるトピック,エンティティ,数値推論(TEN)のキー要素を構成する有理性を利用するための新しいチェーン・オブ・シント・フレームワークを提案する。
提案手法は,数値推論能力とトピック整合型数値見出し生成能力の強化により,学生のLLM自動生成を指導するものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:39:07 GMT)
TD-M(PC)$^2$: Improving Temporal Difference MPC Through Policy Constraint [11.3] モデルベースの強化学習アルゴリズムは、モデルベースの計画と学習された価値/政治を組み合わせる。
バリューラーニングに標準のSACスタイルのポリシーイテレーションに依存する既存の手法は、しばしばエンハンピスタントな価値過大評価をもたらす。
本稿では,ODAクエリを削減し,価値学習を改善する政策正規化項を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:08:42 GMT)
ZACK: Zero-Overhead LLM Inference Acceleration via Dimensionality Compression of the Key-Value Cache [11.2] ゼロオーバーヘッド圧縮と非圧縮を実現し、注意時間を短縮する最初のKV次元圧縮システムであるZACKを提案する。
ZACKは適応圧縮を採用し、推論への貢献に基づいて、頭や層間のKV圧縮速度を調整している。
総合実験により、ZACKと組み合わせることで、KV圧縮のための最先端のエビクションベースおよび量子化ベースの手法により、KVサイズが最大68%、TTFT(Time-To-First-Token)が最大44%、TBT(Time-Between-Tokens)が最大55%削減されることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:44:56 GMT)
Intent Representation Learning with Large Language Model for Recommendation [11.1] モデルに依存しないフレームワークIRLLRec(Intent Representation Learning with Large Language Model)を提案する。
具体的には、IRLLRecはマルチモーダルなインテント表現を学ぶためにデュアルトウワーアーキテクチャを採用している。
テキストと対話に基づく意図をよりよく一致させるため、融合した意図表現を教師が学習するためにモーメント蒸留を用いる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:08:05 GMT)
Taking a Big Step: Large Learning Rates in Denoising Score Matching Prevent Memorization [11.1] 十分な学習率で勾配降下訓練を行うと、ニューラルネットワークは最小限の局所的な最小限に収束することができない。
実験は,1次元の設定を超えても,記憶予防において学習速度が重要な役割を担っていることを検証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:29:35 GMT)
Adaptive Variational Inference in Probabilistic Graphical Models: Beyond Bethe, Tree-Reweighted, and Convex Free Energies [11.1] 上記の方法を含む近似の2つのクラスを特殊ケースとして解析する。
本稿では,与えられたモデルに自動的に適応する近似を提案し,その有効性を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:33:59 GMT)
OptScaler: A Collaborative Framework for Robust Autoscaling in the Cloud [11.0] 最適化モジュールを通じてプロアクティブおよびリアクティブモジュールを統合する,協調的な自動スケーリングフレームワークであるOpsScalerを提案する。
数値計算の結果,ワークロード予測モデルと協調フレームワークの優位性が示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:14:12 GMT)
METAMON: Finding Inconsistencies between Program Documentation and Behavior using Metamorphic LLM Queries [10.9] 本稿では,既存の検索ベーステスト生成技術を用いて,現在のプログラム動作をテストケース形式でキャプチャするMETAMONを提案する。
MeTAMONはこのタスクでメタモルフィックテストと自己整合性によってサポートされている。
Defects4J v2.0.1の5つのオープンソースプロジェクトを使って生成された9,482対のコードドキュメンテーションとコードスニペットに対する実証的な評価は、METAMONがコードとドキュメントの不整合を精度0.72、リコール0.48で分類できることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:42:50 GMT)
ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models [10.9] サービスロボットは、機能を強化するために、未知のオブジェクトを効果的に認識し、セグメント化する必要がある。
従来の教師付き学習ベースのセグメンテーション技術は、広範な注釈付きデータセットを必要とする。
本稿では,セグメンテーションアプライスモデル (SAM) の強力なゼロショット能力と,自己監督型視覚変換器 (ViT) からの明示的な視覚表現を活用することで,UOISを解く新しいアプローチ (ZISVFM) を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:22:20 GMT)
Controllable Sequence Editing for Counterfactual Generation [10.7] シーケンスモデルは、与えられた条件に基づいてシーケンスの一部を変更することで、カウンターファクトアルを生成する。
CLEFは、即時および遅延効果の両方に関する反実的推論のための制御可能なシーケンス編集モデルである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:33:12 GMT)
Accessible and Portable LLM Inference by Compiling Computational Graphs into SQL [10.6] 大規模言語モデル(LLM)は、しばしば特別なハードウェア、専用のフレームワーク、そしてアクセシビリティを制限する実質的な開発努力を必要とする。
本稿では,LLM推論グラフを intosql クエリに変換するコンパイラを提案する。
私たちの仕事は、アクセス可能でポータブルで効率的なソリューションを提供し、多様なデプロイメント環境におけるLLMの提供を容易にします。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:36:40 GMT)
RadVLM: A Multitask Conversational Vision-Language Model for Radiology [10.5] 本稿では,CXR解釈のためのコンパクトなマルチタスク対話基盤モデルRadVLMを提案する。
以上の結果から,RadVLMは対話能力と視覚的グラウンドニングにおいて最先端の性能を達成することが示唆された。
これらの知見は、臨床的に関連するAIアシスタントとしてのRadVLMの可能性を強調している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:27:02 GMT)
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting [10.5] 本稿では,スパースSfM点雲の適応的および不確実性誘導密度化を実現する新しい3次元再構成フレームワークを提案する。
このパイプラインは不確実性推定を利用して、高分散予測のプルーニングを導く。
合成および実世界のデータセットで行った実験は、提案フレームワークの有効性と実用性を検証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:09:26 GMT)
Universality of stationary entanglement in an optomechanical system driven by non-Markovian noise and squeezed light [10.4] メカニカル発振器と反射コヒーレント光場との絡み合いを、必ずしもマルコフ環境ではなく、一般に検討する。
我々は、コヒーレントレーザー駆動において、周波数非依存で非定常または圧縮された場合、光学的絡み合いが破壊されることを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:21:44 GMT)
Characterizing stationary optomechanical entanglement in the presence of non-Markovian noise [10.4] メカニカルオシレータがガウス入力光場と相互作用するオプティメカルシステムについて検討する。
線形化画像では、入力光場が真空状態である場合、または周波数非依存的に圧縮された場合、発振器と出力光場の定常絡み合いは、それら間のコヒーレント結合とは無関係であることを解析的に証明する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:47:16 GMT)
Isoperimetry is All We Need: Langevin Posterior Sampling for RL with Sublinear Regret [10.3] 後サンプリングベースRL(PSRL)アルゴリズムは、データ分布がLog-Sobolev不等式(LSI)を満たす場合、サブ線形後悔をもたらす
正確な後部からの計算やサンプリングができない場合、Langevinサンプリングに基づくアルゴリズム設計を提案し、LaPSRLを提案する。
LaPSRLは1エピソードあたりのオーダー最適後悔とサブクワッドラティックな複雑さを実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:29:19 GMT)
Policy Abstraction and Nash Refinement in Tree-Exploiting PSRO [10.1] Policy Space Response Oracles (PSRO) は、従来の分析手法では複雑すぎるゲームを解決するために、実験的なゲーム理論解析を深層強化学習 (DRL) とインターリーブする。
ツリー露光PSRO (TE-PSRO) は、広義に粗い経験ゲームモデルを反復的に構築するこのアプローチの変種である。
TE-PSROには2つの方法論的進歩があり、不完全情報の複雑なゲームへの適用性を高めている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:48:16 GMT)
Rates of Convergence in the Central Limit Theorem for Markov Chains, with an Application to TD Learning [10.0] ベクトル値マーチンゲール差分に対して,スタイン法を用いて漸近的でない中心極限定理を証明した。
次に、これらの結果を用いて、平均化を伴う時間差分学習(TD)のための非漸近的中心極限定理を確立することができることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:29:26 GMT)
Training an LLM-as-a-Judge Model: Pipeline, Insights, and Practical Lessons [10.0] 本稿では,文脈認識評価を行うLLM(en:en:en:en:en:en:en:en:LLMs)ジャッジであるThemisを紹介する。
Themisの開発パイプラインの概要を概観し、シナリオに依存した評価プロンプトを強調します。
メタ評価のための人間ラベル付きベンチマークを2つ導入し、テミスが人間の嗜好を経済的に高度に調整できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:35:55 GMT)
Simple Is Effective: The Roles of Graphs and Large Language Models in Knowledge-Graph-Based Retrieval-Augmented Generation [9.8] 大きな言語モデル(LLM)は強い推論能力を示すが、幻覚や時代遅れの知識のような制限に直面している。
本稿では、サブグラフを検索する知識グラフ(KG)ベースのRetrieval-Augmented Generation(RAG)フレームワークを拡張するSubgraphRAGを紹介する。
提案手法は,高効率かつフレキシブルなサブグラフ検索を実現するために,並列3重装飾機構を備えた軽量多層パーセプトロンを革新的に統合する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:45:24 GMT)
FetDTIAlign: A Deep Learning Framework for Affine and Deformable Registration of Fetal Brain dMRI [9.8] 胎児脳dMRI登録のための深層学習手法であるFetDTIAlignを導入し,正確なアフィンと変形可能なアライメントを実現する。
妊娠23週から36週のデータからFetDTIAlignの有効性を検討した。
以上の結果から,胎児脳のdMRI登録における深層学習の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:18:07 GMT)
An Optimized Toolbox for Advanced Image Processing with Tsetlin Machine Composites [9.7] 我々は最近提案されたTMコンポジットアーキテクチャを活用し、様々なTMスペシャリストを紹介した。
カニーエッジ検出、配向勾配のヒストグラム、適応平均しきい値、適応ガウスしきい値、大津しきい値、色温度計、適応色温度計などである。
その結果、TMのCIFAR-10で82.8%の精度で最新の結果を提供するツールボックスが作られた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:23:58 GMT)
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning [9.7] 我々はオオカミ狩猟戦略に触発されたWolfpack Adversarial Attackフレームワークを提案する。
我々はまた、Wolfpack-Adversarial Learning for MARLフレームワークを導入し、提案したWolfpack攻撃に対して堅牢なMARLポリシーをトレーニングする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:59:23 GMT)
Learning Generalizable Features for Tibial Plateau Fracture Segmentation Using Masked Autoencoder and Limited Annotations [9.6] 我々は,CTにおける正確なTPFセグメンテーションのためのマスク付きオートエンコーダ(MAE)に基づく効果的なトレーニング戦略を提案する。
本手法は,大域的な骨格構造と,ラベルなしデータからのき裂の微細化,およびラベル付きデータの微細化にMAEプリトレーニングを利用する。
実験結果から,本手法は半教師付き手法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:44:52 GMT)
Heisenberg-Limited Quantum Metrology without Ancilla [9.6] 目的は、チャネルへの多くのアクセスが許可されたとき、量子チャネル推定の最終的な精度限界を決定することである。
一般に、騒音のない制御可能なアンシラがそれを達成するのに必要である。
この問題に対処するための新しい理論的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:09:18 GMT)
DANDI: Diffusion as Normative Distribution for Deep Neural Network Input [9.5] サプライズアデクシー(SA)はテストアデクシー指標として広く研究されている。
本稿では,Stable Diffusion を用いたSA値の代理入力分布を生成する手法 DANDI を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:14:26 GMT)
Markov chain Monte Carlo without evaluating the target: an auxiliary variable approach [9.4] サンプリングタスクでは、ターゲット分布を正規化定数まで知ることが一般的である。
多くの場合、正規化されていない分布を評価することはコストがかかるか不可能である。
提案手法と受入拒否方式の両方で補助変数を使用できる新しいフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:35:18 GMT)
Proxy Prompt: Endowing SAM and SAM 2 with Auto-Interactive-Prompt for Medical Segmentation [9.4] プリアノテートマスクを用いた非ターゲットデータを利用して自動生成するProxy Prompt (PP)を提案する。
非ターゲットデータから最も代表的な文脈情報を適応的に選択する3段階のコンテキスト選択戦略を考案する。
提案手法は,4つの公開データセット上での最先端性能を達成し,16個の画像マスクでトレーニングした場合でも,完全に訓練されたモデルと同等の結果が得られる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:01:28 GMT)
Adaptive Budget Optimization for Multichannel Advertising Using Combinatorial Bandits [9.2] 本稿では,デジタル広告における予算配分分野への3つの重要な貢献を紹介する。
まず,時間軸を延ばすマルチチャネル広告キャンペーンを模倣するシミュレーション環境を開発する。
第2に,飽和平均関数と目標探索機構を利用して変化点検出を行う帯域幅予算配分戦略を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:29:52 GMT)
GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM [9.1] 動的シーンに適したリアルタイム3DGSベースのSLAMシステムであるGARAD-SLAMを提案する。
追跡の面では、ガウスの動的セグメンテーションを直接実行し、それらをフロントエンドにマッピングして動的点ラベルを得る。
実世界のデータセットを用いた結果から,本手法はベースライン手法と比較して,トラッキングに競争力があることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:44:17 GMT)
Mitigating Information Loss in Tree-Based Reinforcement Learning via Direct Optimization [9.0] 本稿では,SYMbolic tree-based on-policy RLの新しい手法であるSYMPOLを紹介する。
SYMPOLは、ポリシー勾配法と統合されたツリーベースのモデルを採用しており、エージェントはそのアクションを学習し、適応することができる。
我々は、SYMPOLを一連のベンチマークRLタスクで評価し、代替木ベースのRLアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:41:14 GMT)
Mol-LLM: Generalist Molecular LLM with Improved Graph Utilization [8.8] LLM(Large Language Models)は、分子タスクのための一般的なLLMの開発を動機付けている。
ナイーブな次世代予測トレーニングで訓練されたLSMは、元の分子と崩壊した分子の両方に同様の確率スコアを割り当てる。
本稿では, 徹底的なマルチモーダル命令チューニングと分子構造選好最適化に基づく新しいマルチモーダルトレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:14:12 GMT)
How the Stroop Effect Arises from Optimal Response Times in Laterally Connected Self-Organizing Maps [8.8] ストループ効果(Stroop effect)は、色名タスクにおける認知的干渉を指す。
本稿では,自己組織化マップ(SOM)を用いたStroopタスクを実装した。
このモデルは全体の84.2%の精度を達成し、エラーは大幅に減少し、一致した条件下では応答が速くなった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:14:09 GMT)
PaPaGei: Open Foundation Models for Optical Physiological Signals [8.8] 光胸腺撮影は生体信号と心臓血管の健康をモニタリングする主要な非侵襲的手法である。
PPG信号に基づいて訓練された機械学習モデルは、タスク固有であり、一般化に苦慮する傾向がある。
PPG信号のための最初のオープン基盤モデルPaPaGeiを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:14:27 GMT)
Learning Efficient Flocking Control based on Gibbs Random Fields [8.7] Gibbs Random Fields (GRF) を用いたマルチエージェント強化学習フレームワーク
アクションアテンションモジュールは、隣接するロボットの動作意図を暗黙的に予測するために導入される。
提案されたフレームワークは、成功率99%の挑戦的な環境で、マルチロボットシステムの効率的な分散制御ポリシーを学習することを可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:27:58 GMT)
Expertized Caption Auto-Enhancement for Video-Text Retrieval [8.7] 本稿では,表現の質を高め,自己学習による強調字幕における経験主義を緩和する自動字幕強調手法を提案する。
我々の手法は完全にデータ駆動型であり、大量のデータ収集や作業負荷を伴わず、自己適応性も向上する。
MSR-VTTでは68.5%,MSVDでは68.1%,DiDeMoでは62.0%,Top-1リコール精度は68.5%であった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:51:46 GMT)
How Developers Interact with AI: A Taxonomy of Human-AI Collaboration in Software Engineering [8.7] 開発者とAIツール間のインタラクションタイプを分類し,11種類のインタラクションタイプを識別する。
この分類に基づいて、AIインタラクションの最適化、開発者のコントロールの改善、AI支援開発における信頼とユーザビリティの課題への対処に焦点を当てた研究課題を概説する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:11:33 GMT)
A Study in Dataset Distillation for Image Super-Resolution [8.6] 完全なデータセットに匹敵するSR性能を維持しつつ、91.12%のデータセットサイズ削減を実現することができることを示す。
本研究は,SRのデータセット蒸留に関する新たな知見を提供し,今後の発展に向けての段階を定めている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:34:49 GMT)
Spatial-Temporal Knowledge Distillation for Takeaway Recommendation [8.6] 本稿では,2段階の学習プロセスに基づく,テイクアウェイレコメンデーション(STKDRec)のための新しい時空間知識蒸留モデルを提案する。
3つの実世界のデータセットの実験により、STKDRecは最先端のベースラインを大きく上回っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:46:23 GMT)
Is In-Context Universality Enough? MLPs are Also Universal In-Context [8.5] コンテクストにおいて変換器は普遍的であり、コンテキストの任意の実数値連続関数を近似することができることを示す。
このことは、変圧器の成功は誘導バイアスや訓練安定性による可能性が高いことを示唆している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:22:46 GMT)
HSI: A Holistic Style Injector for Arbitrary Style Transfer [8.5] Holistic Style (HSI) は、ターゲットスタイルの芸術的表現を提供する新しいアテンションスタイル変換モジュールである。
HSIは、スタイル転送の特徴とより一致したグローバルなスタイル表現のみに基づいてスタイリゼーションを行う。
提案手法は, 有効性と効率の両面で最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:36:24 GMT)
Sparse Linear Regression and Lattice Problems [8.5] 格子問題の平均ケース硬度を仮定したSLRw.r.t.の全ての効率的なアルゴリズムの平均ケース硬度を示す。
具体的には,SLR に対する格子上の境界距離復号法 (BDD) 問題の変種からインスタンス・バイ・インスタンス・リダクションを与える。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:11:13 GMT)
An Analysis for Reasoning Bias of Language Models with Small Initialization [8.4] 大規模言語モデル(LLM)は、さまざまなタスクにまたがる例外的なパフォーマンスを示すことによって、自然言語処理に革命をもたらした。
本研究では,パラメータ初期化尺度がLLMの訓練行動とタスク嗜好に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:23:26 GMT)
A Decade of Action Quality Assessment: Largest Systematic Survey of Trends, Challenges, and Future Directions [8.3] アクション・クオリティ・アセスメント(AQA)は、低コストな生理療法、スポーツトレーニング、労働力開発などの分野において、大きな意味を持つ。
我々は,システムレビュー・メタアナリシス(PRISMA)フレームワークに推奨される報告項目を用いて,200以上の研究論文を体系的にレビューする。
この調査は、調査トレンド、パフォーマンス比較、課題、今後の方向性に関する詳細な分析を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:33:24 GMT)
Energy & Force Regression on DFT Trajectories is Not Enough for Universal Machine Learning Interatomic Potentials [8.3] MLIP(Universal Machine Learning Interactomic Potentials)は、材料発見のための高速化されたシミュレーションを可能にする。
MLIPは様々な材料に対して大規模分子動力学(MD)シミュレーションを確実かつ正確に行うことができない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:04:21 GMT)
Text-to-CAD Generation Through Infusing Visual Feedback in Large Language Models [8.2] 本稿では,Large Language Models (LLM) をバックボーンとして使用するフレームワークであるCADFusionを紹介する。
CADFusionは質的にも定量的にも性能を著しく向上することを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:43:26 GMT)
RoboGrasp: A Universal Grasping Policy for Robust Robotic Control [8.2] RoboGraspは、トレーニング済みの把握検出モデルとロボット学習を統合する、普遍的な把握ポリシーフレームワークである。
把握精度、安定性、一般化性を大幅に向上させ、数ショットの学習と把握ボックスのプロンプトタスクで最大34%の成功率を達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:04:41 GMT)
Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study [8.1] 本研究では、非英語コーパスにおける道徳的基礎(MF)を測定するための計算手法について検討する。
本研究は,中国語を事例として,機械翻訳テキスト,局所言語語彙,多言語言語モデル,および多言語モデル(LLM)に英語リソースを適用し,非英語テキストのMFを測定することの有効性を評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:17:17 GMT)
Jailbreak Antidote: Runtime Safety-Utility Balance via Sparse Representation Adjustment in Large Language Models [8.0] ジェイルブレイク攻撃は、大きな言語モデルを操作して有害なコンテンツを生成する。
Jailbreak Antidoteは、モデルの内部状態のスパースサブセットを操作することで、安全優先のリアルタイム調整を可能にする。
解析の結果,LLMの安全性関連情報はわずかに分散していることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:23:59 GMT)
IAO Prompting: Making Knowledge Flow Explicit in LLMs through Structured Reasoning Templates [7.8] IAO(Input-Action-Output)は,大規模言語モデルがどのようにアクセスし,その知識を適用するかを明確にモデル化するテンプレートベースの構造的手法である。
IAOは問題を逐次的なステップに分解し、それぞれが使用する入力知識、実行中のアクション、および結果の出力を明確に識別する。
本研究は, LLMにおける知識表現と, より信頼性の高い知識応用のための手法に関する知見を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:14:20 GMT)
Still More Shades of Null: An Evaluation Suite for Responsible Missing Value Imputation [7.6] 本稿では,有意な値計算を行うための評価スイートであるShades-of-NULLを提案する。
我々はShades-of-NULLを用いて29,736の実験パイプラインを含む大規模実験を行った。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:42:46 GMT)
Predicting 3D Motion from 2D Video for Behavior-Based VR Biometrics [7.6] 被験者の右側から取得した2Dボディジョイントを,外部の2Dカメラで撮影する手法を提案する。
本手法では,VRデバイスが追跡していない関節の2次元データを用いて,制御器の過去と将来の3次元トラックを予測する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:19:23 GMT)
SensorChat: Answering Qualitative and Quantitative Questions during Long-Term Multimodal Sensor Interactions [7.5] 我々は,長期センサ監視用に設計された最初のエンドツーエンドQAシステムであるSensorChatを紹介する。
SensorChatは、現実のシナリオにおいて質的(高レベルの推論を必要とする)と定量的(センサーデータからの正確な応答を要求する)の両方に効果的に答える。
SensorChatを実装し,クラウドサーバ上でリアルタイムインタラクションを実現すると同時に,量子化後のエッジプラットフォーム上で完全に動作可能であることを実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:41:59 GMT)
Retrieve, Merge, Predict: Augmenting Tables with Data Lakes [7.4] 本稿では,機械学習タスクの自動テーブル拡張について,詳細な分析を行う。
結合可能なテーブルを検索し、情報をマージし、結果のテーブルと予測する。
私たちは2つのデータレイクを使用します。Open Data US、よく参照された実データレイク、新しい半合成データセットYADL(Yet Another Data Lake)です。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:58:32 GMT)
ACTISM: Threat-informed Dynamic Security Modelling for Automotive Systems [7.3] ACTISM(Automotive Consequence-Driven and Threat-Informed Security Modelling)は、統合セキュリティモデリングフレームワークである。
これは、彼らのサイバーセキュリティ姿勢を動的に更新することで、自動車システムのレジリエンスを高める。
我々は、Tesla Electric Vehicleの車載インフォテインメントシステムの実例に適用することで、ACTISMの有効性を実証する。
本稿では,ACTISMの有用性と今後の方向性について,実践者のアンケート調査結果について報告する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:44:10 GMT)
T-SCEND: Test-time Scalable MCTS-enhanced Diffusion Model [7.3] Test-time Scalable MCTS-enhanced Diffusion Model (T-SCEND)は拡散モデルの推論能力を大幅に改善する新しいフレームワークである。
T-SCENDは、デノナイジングプロセスと、新しいハイブリッドモンテカルロツリーサーチを統合している。
本稿では,T-SCENDの学習目標とスケーラブルな推論手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:38:55 GMT)
ALPET: Active Few-shot Learning for Citation Worthiness Detection in Low-Resource Wikipedia Languages [7.2] Citation Worthiness Detection (CWD) は、記事やコレクション内のどの文を引用と共にバックアップし、それが提供した情報を検証するかを決定する。
本研究では、ALPET(Active Learning)とPET(Pattern-Exploiting Training)を組み合わせたフレームワークを導入し、限られたデータリソースを持つ言語に対するCWDを強化する。
カタルーニャ、バスク、アルバニアのウィキペディアのデータセットに適用すると、ALPETは既存のCCWベースラインを上回り、ラベル付きデータの量を80%以上削減する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:49:41 GMT)
A Mixed-Methods Evaluation of LLM-Based Chatbots for Menopause [7.2] 医療環境におけるLLM(Large Language Models)の統合は注目されている。
更年期関連問合せのためのLLMベースのチャットボットの性能について検討する。
本研究は,健康トピックに対する従来の評価指標の約束と限界を明らかにするものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:56:52 GMT)
Mixture-of-Instructions: Aligning Large Language Models via Mixture Prompting [7.1] 我々はMixture-of-Instructions (MoI)と呼ばれる新しいテクニックを紹介する。
MoIは命令パッキングと多様なシステムプロンプトを組み合わせて言語モデルのアライメント効率を高める戦略を採用している。
提案手法はオープンソースQwen-7B-chatモデルに適用され,Qwen-SFT-MoIの開発が完了した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:56:47 GMT)
Tell2Reg: Establishing spatial correspondence between images by the same language prompts [7.1] 2つの異なる画像上で同じ言語プロンプトで対応する領域ペアを予測可能であることを示す。
これにより、完全に自動化され、トレーニング不要な登録アルゴリズムが実現される。
Tell2Regはトレーニング不要で、データキュレーションとラベル付けのコストと時間のかかる必要がなくなる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:25:02 GMT)
A study of why we need to reassess full reference image quality assessment with medical images [7.0] PSNRとSSIMは、多くの自然画像処理に成功するために知られ、テストされている。
医療シナリオの相違が報告され、開発と実際の臨床応用のギャップを浮き彫りにしている。
本稿では,PSNR と SSIM が新規アルゴリズムの評価に不適であることが証明された事例について概説する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:01:02 GMT)
Disentanglement in Difference: Directly Learning Semantically Disentangled Representations by Maximizing Inter-Factor Differences [7.0] 差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差
dSpritesと3DShapesデータセットの実験結果は、提案したDiDが既存の主流メソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:30:41 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9] 人間の動きの生成と編集はコンピュータグラフィックスと視覚の重要な要素である。
本稿では,多様なタスクの統一的な定式化を可能にする新しいパラダイムであるMotion-Condition-Motionを紹介する。
このパラダイムに基づいて、ソースモーションからターゲットモーションへのマッピングを学習するために、修正フローを組み込んだ統合フレームワーク、MotionLabを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:36:10 GMT)
MARAGE: Transferable Multi-Model Adversarial Attack for Retrieval-Augmented Generation Data Extraction [6.9] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚に対する解決策を提供する。
既存のRAG抽出攻撃は、しばしば手作業によるプロンプトに依存し、その効果を制限している。
我々は、ターゲットRAGシステムに送信されたユーザクエリに付加された逆文字列を最適化するMARAGEと呼ばれるフレームワークを導入し、検索されたRAGデータを含む出力を発生させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:17:01 GMT)
Algorithms with Calibrated Machine Learning Predictions [6.9] 予測を伴うアルゴリズムの分野は、リアルタイムのパフォーマンスを改善するためのオンラインアルゴリズムの設計に機械学習のアドバイスを取り入れている。
このギャップを埋めるための原則的かつ実践的なツールとしてキャリブレーションを提案し、2つのケーススタディを通じてキャリブレーションされたアドバイスの利点を実証する。
スキーレンタルでは,最適な予測依存性能を実現するアルゴリズムを設計し,高分散環境では,キャリブレーションされたアドバイスが不確実性に対する代替手法よりも効果的なガイダンスを提供することを示す。
ジョブスケジューリングでは,予測器を用いることで既存の手法よりも大幅な性能向上が期待できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:41:18 GMT)
An Empirical Study of Methods for Small Object Detection from Satellite Imagery [6.9] 本稿では,リモートセンシング画像から小さな物体を検出するためのオブジェクト検出手法についてレビューする。
都市部における衛星画像からの車検出と農地の衛星画像からのハチボックス検出を応用シナリオとして用いた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:40:54 GMT)
From Features to Transformers: Redefining Ranking for Scalable Impact [6.8] LiGRはLinkedInが開発した大規模ランキングフレームワークである。
本稿では,学習の正規化とユーザ履歴とランキング項目への同時注意を取り入れた改良型トランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:02:01 GMT)
Code Simulation as a Proxy for High-order Tasks in Large Language Models [6.7] 我々は、Large Language Models (LLM) の能力を評価するために、自然主義的および合成的推論タスクのペアを収集する。
我々は、プログラミングにおける共通構造を、自然主義的推論タスクの構成要素の1つとして活用する。
我々の貢献は、手作りの人間注記問題に対するスケーラブルな補完として、LLMの推論能力を総合的にテストすることの上に成り立っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:30:28 GMT)
Observational signature of Lorentz violation in acceleration radiation [6.7] ローレンツ違反(LV)は基礎物理学の研究の活発な領域として現れている。
ブラックホール時空における原子の加速放射に対する潜在的なLV効果を研究するための量子光学的手法を提案する。
我々は、LVが放射束に異なる量子シグネチャを導入し、粒子放出率を著しく調節できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:00:56 GMT)
Efficient Prompt Compression with Evaluator Heads for Long-Context Transformer Inference [6.7] 長文入力は大規模言語モデル(LLM)の有効活用に不可欠である
圧縮されたプロンプト内にキー情報を保持できる,効率的な訓練不要なプロンプト圧縮手法を提案する。
我々は,LLMの入力プロンプトを高速に「スキムスルー」できる評価器ヘッドベースプロンプト圧縮を開発した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:35:38 GMT)
Control Search Rankings, Control the World: What is a Good Search Engine? [6.6] インターネットは数十年も前からあるが、学際的な視点からはまだ解明されていない。
本稿では,4種類の検索エンジン行動の倫理モデルを含む新しい役割ベースアプローチを提案する。
情報検索の研究分野や、新型コロナウイルスの世界的なパンデミックに関わるケーススタディを参考に、これらの倫理モデルを探究する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:45:21 GMT)
Convolution-Based Converter : A Weak-Prior Approach For Modeling Stochastic Processes Based On Conditional Density Estimation [6.6] 畳み込み型変換器 (CBC) は, 目標の確率を推定する上で, 強い, 固定された事前を除去する手法を開発するために提案される。
CBCは、強い、または固定された前もって目標の条件付き確率を暗黙的に推定する。
我々の手法は、既存の基準線を複数の指標で上回る。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:59:34 GMT)
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs [6.5] ニューラルネットワークにおけるバイナリおよびスパース3次重みは、より高速な計算とより軽い表現を可能にする。
バニラRNNは、反復重みの変化に非常に敏感であり、これらの重みの双対化と三元化は本質的に困難である。
本稿では,アダマール行列の特性を利用して二進行列および三進行列のサブセットをパラメータ化する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:22:28 GMT)
A User's Guide to Sampling Strategies for Sliced Optimal Transport [6.5] 本稿では,スライスされた最適輸送のための戦略をサンプリングするためのユーザガイドとして機能する。
本稿では, 建設方法, 生成時間の複雑さ, 理論的保証, および各戦略の条件について詳述する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:28:41 GMT)
Efficient Image Restoration via Latent Consistency Flow Matching [6.5] 本研究は,効率的な遅延画像復元法であるELIRを紹介する。
ELIRは最先端の拡散とフローベースアプローチに比べて4倍以上高速である。
また、4倍以上小さく、リソース制約のあるエッジデバイスへのデプロイに適している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:24:49 GMT)
Robust Reward Alignment in Hypothesis Space [6.4] 本稿では,新鮮かつ幾何学的に解釈可能な視点に基づく,堅牢で効率的な報酬アライメント手法を提案する。
提案手法は,人間の嗜好のバッチに基づいて,報酬仮説空間を「カット」により反復的に洗練する。
未知の誤選好に対処するため, 各バッチに保守的切削手法を導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:30:14 GMT)
Diffusion-based Contrastive Learning for Sequential Recommendation [6.3] 本稿では,CaDiRecという,文脈対応拡散に基づく逐次推薦のためのコントラスト学習を提案する。
CaDiRecは、コンテキスト対応拡散モデルを使用して、シーケンス内の所定の位置に対する代替アイテムを生成する。
フレームワーク全体をエンドツーエンドでトレーニングし、拡散モデルとレコメンデーションモデルの間でアイテムの埋め込みを共有します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:17:55 GMT)
Complexity in Complexity: Understanding Visual Complexity Through Structure, Color, and Surprise [6.3] 本稿では,解釈可能なセグメンテーションに基づくモデルが複雑化に対する構造的,色的,前提的貢献を捉えるのに失敗することについて検討する。
本研究では,空間強度の変動を測定するマルチスケールソベル勾配,複数スケールにわたる色度を定量化するマルチスケール一様色,および大規模言語モデルを用いて生成したサプライズスコアを提案する。
我々の実験は、モデリングの複雑さが以前考えられていたほど単純ではないことを実証し、データセットのバイアスに対処するために、知覚的および意味的な要素を追加する必要があることを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:36:23 GMT)
FSTA-SNN:Frequency-based Spatial-Temporal Attention Module for Spiking Neural Networks [6.2] ニューラルネットワーク(ANN)の代替としてスパイキングニューラルネットワーク(SNN)が登場
本研究では,SNNの固有特性を時間的・空間的両面から解析する。
SNNにおける特徴学習を強化するために,周波数に基づく空間注意モジュール(FSTA)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:50:18 GMT)
YINYANG-ALIGN: Benchmarking Contradictory Objectives and Proposing Multi-Objective Optimization based DPO for Text-to-Image Alignment [6.1] YinYangAlignは、テキスト・トゥ・イメージ(T2I)システムのアライメント忠実度を体系的に定量化するフレームワークである。
6つの基本的かつ本質的に矛盾する設計目標に対処する。
YinYangAlignには、人間のプロンプト、アライメントされた(コセン)応答、AI生成出力のミスアライメント(拒絶)、根底にある矛盾の説明を含む詳細なデータセットが含まれている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:46:20 GMT)
Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations [6.0] IL(Imitation Learning)は、エージェントが報酬信号なしで専門家の行動を模倣することを可能にするが、高次元、雑音、不完全な視覚的観察を伴うクロスドメインシナリオの課題に直面している。
ドメイン不変な特徴を個々のフレームから抽出し,それをシーケンスに適応させて,専門家の行動を分離し,再現する新しいIL手法であるDIFF-ILを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:52:36 GMT)
Scaling Continuous Latent Variable Models as Probabilistic Integral Circuits [6.0] 確率積分回路(PIC)は連続潜伏変数(LV)を定義する記号計算グラフである
PICは、LVを解析的に積分できる場合、そうでなければ、トラクタブル確率回路(PC)によって近似できる。
本稿では、任意の可変分解からDAG形PICを構築するパイプライン、テンソル化回路アーキテクチャを用いたPICのトレーニング手順、神経機能共有技術を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:13:26 GMT)
SymBa: Symbolic Backward Chaining for Structured Natural Language Reasoning [5.9] シンボリック・ソルバとLLMを統合した新しい後方連鎖システムを提案する。
SymBa では、解法が証明過程を制御し、解法が証明を完成させるために新しい情報を必要とする場合にのみ LLM が呼び出される。
完全性を活用して、SymBaは、ベースラインと比較して7つの導出性、リレーショナル、および算術的推論ベンチマークにおいて大幅な改善を達成している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:03:35 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:57:22 GMT)
DA-LIF: Dual Adaptive Leaky Integrate-and-Fire Model for Deep Spiking Neural Networks [5.8] スパイキングニューラルネットワーク(SNN)は、時間的情報を効率的に処理する能力によって評価される。
本稿では,独立に学習可能な減衰を伴う空間的・時間的チューニングを導入したDual Leaky Integrate-and-Fire(DA-LIF)モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:02:07 GMT)
Vertical Federated Learning for Failure-Cause Identification in Disaggregated Microwave Networks [5.8] 本稿では,非凝集マイクロ波ネットワークにおけるフェデレートラーニングの適用について検討する。
実験結果から,集中型シナリオに対して,F1スコアを少なくとも1%の間隔で連続的に達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:09:15 GMT)
Building Bridges between Regression, Clustering, and Classification [5.8] 本研究では,連続したスカラーターゲットを用いて回帰タスクにおけるモデルのトレーニングを改善する手法を提案する。
本手法は, ターゲットエンコーダと予測デコーダを用いて, 分類とクラスタリングのアプローチにインスパイアされた, 異なる方法でタスクをキャスティングすることに基づいている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:45:00 GMT)
LED there be DoS: Exploiting variable bitrate IP cameras for network DoS [5.7] 可変ビットレートIPカメラを向けた単純なレーザーLEDを用いて,映像圧縮の有効性を最大6倍に低減できることを示す。
有線および無線ネットワークに接続されたIPカメラによる実験は、単一のカメラに対するレーザー攻撃がパケットロスを著しく引き起こす可能性があることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:53:59 GMT)
Outlier Synthesis via Hamiltonian Monte Carlo for Out-of-Distribution Detection [5.7] アウト・オブ・ディストリビューション(OOD)検出は、信頼性が高く信頼性の高い機械学習システムの開発に不可欠である。
本稿では,ハミルトニアン・モンテカルロ・アウトリア合成(HamOS)フレームワークを提案する。
分布内データのみに基づいて、マルコフ連鎖は特徴空間を広範囲に横切ることができ、多様かつ代表的な外れ値を生成することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:24:10 GMT)
Position: Editing Large Language Models Poses Serious Safety Risks [5.7] 大規模言語モデルの編集は、ほとんど見落とされた深刻な安全性のリスクをもたらすと我々は主張する。
私たちはAIエコシステムの脆弱性を強調し、検証なしで更新されたモデルの無制限のアップロードとダウンロードを可能にします。
我々は、(i)悪質なモデル編集に対する研究用タンパー耐性モデルと対策をコミュニティに呼びかけ、(ii)AIエコシステムの確保に積極的に取り組みます。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:51:32 GMT)
Mitigating Language Bias in Cross-Lingual Job Retrieval: A Recruitment Platform Perspective [5.6] 本稿では,複数コンポーネントを統合文エンコーダに共同学習するために,マルチタスク・デュアルエンコーダ・フレームワークを用いた統一文エンコーダを提案する。
その結果,本手法はモデルサイズが小さいにもかかわらず,他の最先端モデルよりも優れていた。
また,エンコーダの言語バイアスを評価するために,LBKL(Language Bias Kullback-Leibler Divergence)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:38:56 GMT)
PH-VAE: A Polynomial Hierarchical Variational Autoencoder Towards Disentangled Representation Learning [5.5] Diveral Autoencoder (VAE) は、様々な種類のデータの複雑な確率分布をモデル化するための、シンプルで効率的な生成人工知能手法である。
階層型変動オートエンコーダ (PH-VAE) を開発した。
また,KL(Kulback-Leibler)の変分を置き換えたり一般化したりするために,変分損失関数の多項偏差を新たに提案した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:25:32 GMT)
Think or Step-by-Step? UnZIPping the Black Box in Zero-Shot Prompts [5.4] ZIPスコア(Zero-shot Importance of Perturbation score)は,オープンソースモデルとクローズドソースモデルの両方に適用可能な多目的メトリックである。
ステップ・バイ・ステップ」と「思考」の両方が高いZIPスコアを示す一方で、モデルやタスクによって影響が強くなることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:04:29 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [5.4] 本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。
道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:36:29 GMT)
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs) [5.4] SceneGuided RetrieveRwRは、グラフによる推論と計画のためのフレームワークである。
我々のフレームワークは、数値Q&Aや計画タスクにおいて、既存のLCMベースのアプローチを超越していることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:50:38 GMT)
Globality Strikes Back: Rethinking the Global Knowledge of CLIP in Training-Free Open-Vocabulary Semantic Segmentation [5.3] 最近の研究は、CLIPを修正して、トレーニング不要な方法でセマンティックセグメンテーションを行う(TF-OVSS)。
これらの変更により、CLIPがグローバルコンテキスト情報を集約する能力は大きく低下する。
TF-OVSSタスクを促進するために,CLIPの有益なグローバル知識をマイニングするGCLIPという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:37:50 GMT)
DOLFIN -- Document-Level Financial test set for Machine Translation [5.3] 文書レベル機械翻訳(MT)専用のテストセットを提案する。
データセットは、専門の財務文書から構築される。
テストセットは5つの言語ペアに対する1950年の平均的なアライメントセクションで構成されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:30:40 GMT)
L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration [5.2] 本稿では,非秩序な低重なり点群を登録するL-PRという新しいフレームワークを提案する。
我々はこれらをLiDARフィデューシャルマーカーと呼んでいるが、人気のある AprilTag や ArUco のマーカーと同じである。
提案手法が従来の最先端手法を上回ることを示すため,定性的かつ定量的な実験を行った。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:13:41 GMT)
Posterior SBC: Simulation-Based Calibration Checking Conditional on Data [5.2] シミュレーションベースのキャリブレーションチェック(SBC)は、生成モデルからシミュレーションされたデータに対する反復推論による推論アルゴリズムとモデル実装の検証を指す。
本稿では,後部SBCを提案するとともに,観測データに対する推論条件の検証に有効であることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:35:06 GMT)
STEM: Spatial-Temporal Mapping Tool For Spiking Neural Networks [5.1] スパイキングニューラルネットワーク(SNN)は、バイオインスパイアされた第3世代のニューラルネットワークを約束する。
最近の研究は、ニューラルネットワーク(ANN)と同等の精度で深部SNNモデルを訓練している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:44:15 GMT)
CoS: Enhancing Personalization and Mitigating Bias with Context Steering [5.1] コンテキストは大きな言語モデル(LLM)の応答を著しく形作ることができる
本研究では,自動回帰LDMを推論時に容易に適用可能なトレーニング不要な手法であるContext Steering (CoS)を提案する。
モデルバイアスを低減するために、よりパーソナライズを向上し、不要な影響を緩和するために、文脈の影響を増幅することを含む、CoSの様々な応用を紹介した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:57:44 GMT)
When Machine Learning Gets Personal: Understanding Fairness of Personalized Models [5.0] 機械学習におけるパーソナライズには、人口統計学や医療データなどの個人属性を組み込むことで、モデルを個々のユーザにカスタマイズすることが含まれる。
パーソナライゼーションは予測精度を向上させることができるが、バイアスを増幅し、説明可能性を減らすこともできる。
本研究は、個人化が予測精度と説明品質の両方に与える影響を評価する統一的な枠組みを導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:17:33 GMT)
An Exposition of Pathfinding Strategies Within Lightning Network Clients [4.9] Lightning Networkは、Bitcoinのスケーラビリティ問題に対処するために設計されたピアツーピアネットワークである。
本稿では,Lightning Network ノード実装におけるパスフィンディング戦略の違いについて検討する。
成功率,手数料,パス長,タイムロックなど,さまざまなパスフィニング戦略の有効性を評価した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:45:00 GMT)
Exploring the Security Threats of Knowledge Base Poisoning in Retrieval-Augmented Code Generation [4.9] 本稿では,RACGシステムに関連するセキュリティリスクに関する,最初の総合的研究について述べる。
知識ベースにおける脆弱なコードが、生成されたコードのセキュリティをいかに損なうかに焦点を当てている。
私たちの研究は、単一の有毒コード例でさえ、生成コードの最大48%を妥協できる、知識ベース中毒の重大な脅威を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:49:12 GMT)
Gap-Dependent Bounds for Federated $Q$-learning [4.9] 有限水平マルコフ決定過程(MDPs)におけるオンラインフェデレーション$Q$Learningに対する後悔とコミュニケーションコストの最初のギャップ依存分析を提示する。
我々の新しいフレームワークは、厳密な正の準最適ギャップのようなMDPの良質な構造を利用して、$log T$-type regret boundと洗練された通信コストboundを達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:32:59 GMT)
Leveraging Encoder-only Large Language Models for Mobile App Review Feature Extraction [4.9] 本研究では,エンコーダのみの大規模言語モデルがモバイルアプリレビューから特徴抽出を促進できるという仮説を考察する。
クラウドソーシングされたアノテーションを産業的文脈から活用することにより、特徴抽出を教師付きトークン分類タスクとして再定義する。
実験により,抽出した特徴の精度とリコールが向上し,性能効率が向上することが確認された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:42:36 GMT)
A Match Made in Heaven? Matching Test Cases and Vulnerabilities With the VUTECO Approach [4.9] 本稿では,Javaリポジトリから脆弱性知能テストのインスタンスを収集するディープラーニングベースのアプローチであるVUTECOを紹介する。
VUTECOはFindingタスクに対処し、VUL4Jで検証されたテストケースの完全精度と0.83 F0.5スコアを達成した。
マッチタスクに十分なパフォーマンスを示したにもかかわらず、VUTECOは野生での有効な試合の回収に失敗した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:02:42 GMT)
FACTER: Fairness-Aware Conformal Thresholding and Prompt Engineering for Enabling Fair LLM-Based Recommender Systems [4.8] LLMに基づくリコメンデーションシステムのためのフェアネス対応フレームワークであるFACTERを提案する。
適応的意味分散しきい値と違反トリガー機構を導入することにより、FACTERはバイアスパターンが現れるたびに自動的に公正性制約を厳格化する。
MovieLensとAmazonの実証的な結果は、FACTERが強い推奨精度を維持しつつ、フェアネス違反(最大95.5%)を大幅に低減していることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:07:04 GMT)
Measured Hockey-Stick Divergence and its Applications to Quantum Pufferfish Privacy [4.8] ホッケースティックの発散は, 量子フグのプライバシフレームワークにおいて, 最適なプライバシパラメータを特徴付けることを示す。
また、測定されたホッケースティックのチャンネルのばらつきを導入し、チャネルのプライバシーを確保するためのその応用を探る。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:19:54 GMT)
Fine-Tuning Strategies for Continual Online EEG Motor Imagery Decoding: Insights from a Large-Scale Longitudinal Study [4.8] 本研究では,オンライン縦波脳波(EEG)運動画像(MI)復号における深層学習のための連続的微調整戦略について検討した。
私たちは大規模なユーザグループでこのような戦略を最初に探求した人物です。
本研究は、神経リハビリテーションと補助技術に不可欠な、より安定かつ効率的な長期運動画像復号を可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:57:53 GMT)
REED: Chiplet-Based Accelerator for Fully Homomorphic Encryption [4.7] 本稿では,従来のモノリシック設計の限界を克服する,マルチチップベースのFHEアクセラレータREEDについて紹介する。
その結果、REED 2.5Dマイクロプロセッサはチップ面積96.7 mm$2$、平均電力49.4Wを7nm技術で消費していることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:16:00 GMT)
Conditional Prediction by Simulation for Automated Driving [4.7] この研究は、軌道間の条件依存をモデル化する予測モデルを導入する。
自動走行車に対する様々な候補軌道を仮定することにより,それぞれに条件付き予測を生成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:44:06 GMT)
CAPE: Covariate-Adjusted Pre-Training for Epidemic Time Series Forecasting [4.6] CAPEは、多様な地域からの広範な疾患データセットを活用するために設計された、新しい流行前トレーニングフレームワークである。
下流病のより深い意思決定のために、環境要因を直接モデリングプロセスに統合する。
平均9.9%のフルショット、14.3%のゼロショット設定でトップベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:29:36 GMT)
Contrastive Token-level Explanations for Graph-based Rumour Detection [4.6] ソーシャルメディアは、経済を混乱させ、政治的成果に影響を与え、公衆衛生の危機を悪化させる有害な噂の拡散を促進してきた。
グラフニューラルネットワーク(GNN)ベースのアプローチは、自動噂検出において大きな可能性を秘めている。
既存のグラフ説明可能性技術は、高次元テキスト埋め込みにおける特徴次元間の依存関係によって生じる固有の課題に対処するには不十分である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:14:11 GMT)
Classical and quantum cyclic redundancy check codes [4.6] 古典的環状冗長チェック符号を量子環状冗長チェック符号に拡張する。
これにより、バースト長が量子レイガー境界に達した場合のバースト誤差を補正できる量子安定化器符号を構築することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:58:42 GMT)
Deep Learning-Based Approach for Identification of Potato Leaf Diseases Using Wrapper Feature Selection and Feature Concatenation [4.6] ジャガイモの葉に影響を及ぼす遅発病を検出するために,画像処理と機械学習に基づく自律的手法を提案する。
本手法は,SVMを用いて550個の特徴を選別することにより,99%の精度を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:09:34 GMT)
iVISPAR -- An Interactive Visual-Spatial Reasoning Benchmark for VLMs [4.4] VLM(Vision-Language Models)は、空間的推論と視覚的アライメントに苦しむことで知られている。
エージェントとして機能するVLMの空間的推論能力を評価するために設計された,インタラクティブなマルチモーダルベンチマークであるiVISPARを紹介する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:29:01 GMT)
Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks [4.4] Task-Aware Virtual Training (TAVT)は、トレーニングとアウト・オブ・ディストリビューション(OOD)シナリオの両方のタスク特性をキャプチャする新しいアルゴリズムである。
数値計算の結果,TAVT は様々な MuJoCo および MetaWorld 環境における OOD タスクの一般化を著しく促進することが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:31:50 GMT)
A Multi-Task Learning Approach to Linear Multivariate Forecasting [4.4] 最近の最先端の研究はディバイソン間の相互関係を無視し、それぞれのディバイソンでモデルを用いている。
本稿では,多変量予測をマルチタスク学習問題とみなし,予測の分析を容易にすることを提案する。
我々は,強いベースラインと比較して,挑戦的なベンチマークに対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:34:23 GMT)
3D Face Reconstruction From Radar Images [4.4] レーダ画像からの3次元再構成のための新しいモデルベース手法を提案する。
物理に基づくが微分不可能なレーダを用いた合成レーダ画像のデータセットを生成する。
このデータセットは、CNNベースのエンコーダをトレーニングし、3D形態素顔モデルのパラメータを推定するために使用される。
モデルベースオートエンコーダに解析バイシンセシス方式で再構築を行う。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:26:37 GMT)
Boli: A dataset for understanding stuttering experience and analyzing stuttered speech [4.3] 本稿では,科学的理解と技術開発の促進を目的とした多言語音声データセットであるProject Boliを紹介する。
このデータセットは(a)匿名メタデータ(性別、年齢、国、母国、母国語)と、彼らの日常生活にどのような影響を及ぼすかという質問に対する回答で構成されている。
本稿では,データ収集手順,乱れを経験する人々の要約,イベントの重大度評価,収集したデータの技術的検証など,データセットの包括的分析について述べる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:18:45 GMT)
Agent-OM: Leveraging LLM Agents for Ontology Matching [4.2] 本研究では,オントロジーマッチングシステムのための新しいエージェント駆動設計パラダイムを提案する。
本稿では,検索とマッチングのための2つのシームズエージェントからなるAgent-OM (Agent for Ontology Matching) フレームワークを提案する。
本システムは,OMタスクにおける長年の最高性能に非常に近い結果が得られる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:08:17 GMT)
A Unified Framework for Semi-Supervised Image Segmentation and Registration [4.2] 画像登録モデルを組み込んだ新しい手法を導入し,注釈のないデータに対して擬似ラベルを生成する。
提案手法は2次元脳データセットを用いて評価され, 注釈付きデータのうち1%しか使用せず, 優れた性能を示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:45:00 GMT)
Fair Summarization: Bridging Quality and Diversity in Extractive Summaries [4.2] 本稿では,FairExtractとFairGPTの2つの新しい抽出方法を紹介する。
我々は,これらの手法を,ホワイトアライメント,ヒスパニック,アフリカ系アメリカ人の方言ツイートのダイジェム要約データセットを用いて評価した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:34:44 GMT)
Aero-LLM: A Distributed Framework for Secure UAV Communication and Intelligent Decision-Making [4.2] Aero-LLMは、複数の大規模言語モデル(LLM)を統合するフレームワークで、UAVミッションのセキュリティと運用効率を向上させる。
本稿では,複数の大規模言語モデル(LLM)を統合し,UAVミッションのセキュリティと運用効率を向上させるフレームワークであるAero-LLMを紹介する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:46:27 GMT)
SPARC: Subspace-Aware Prompt Adaptation for Robust Continual Learning in LLMs [4.2] 大規模言語モデル(LLM)のための軽量連続学習フレームワークを提案する。
本手法はタスク・インクリメンタル・ドメイン・インクリメンタル・ラーニング・セットアップにおいて高い知識保持を実現する。
SuperGLUEベンチマークの実験では、PCAベースのプロンプトチューニングとLoRAが組み合わさって、完全知識保持を維持しながら精度を向上し、モデルのパラメータの1%しか利用していないことが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:11:55 GMT)
Enhancing Reasoning to Adapt Large Language Models for Domain-Specific Applications [4.1] SoLOMONは、新しいニューロインスパイアされたLarge Language Model (LLM) Reasoning Networkアーキテクチャである。
本稿では,SLOMONがPmpt Engineering と In-Context Learning 技術を活用して,汎用 LLM の特殊タスクへの迅速な適応を実現する方法を示す。
その結果,SOLOMONインスタンスはLLMインスタンスのベースラインを著しく上回り,最先端の推論モデルであるo1-previewに匹敵する性能を達成した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:27:24 GMT)
Machine Learning-Augmented Optimization of Large Bilevel and Two-stage Stochastic Programs: Application to Cycling Network Design [4.1] 幅広い意思決定問題は、独立したフォロワーを持つ二段階プログラムとして定式化することができる。
これらの問題は、特に多くのフォロワーがいる場合、解決するのが非常に難しいことで知られている。
現実のサイクリングインフラ計画アプリケーションに動機付けられ,そのような問題を解決するための一般的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:17:53 GMT)
Many-body non-Hermitian skin effect with exact steady states in dissipative lattice gauge theory [4.0] 非エルミート皮膚効果の多体版を示す散逸格子ゲージモデルを導入する。
この系は多体相互作用を伴うが、局所ゲージ対称性は定常状態を正確に構築するための柔軟なアプローチを提供する。
本手法は階層的皮膚効果と呼ばれる新しい多体非エルミット皮膚効果を実現するために一般化することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:04 GMT)
Control-oriented Clustering of Visual Latent Representation [4.0] ビヘイビアクローンから学習した画像ベース制御パイプラインにおける視覚表現空間の幾何学について検討する。
神経崩壊現象に触発されて、視覚表現空間におけるクラスタリングの同様の法則を示す。
このようなクラスタリングの法則を,テスト時間性能を改善するアルゴリズムツールとして活用できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:12:00 GMT)
VQA-Levels: A Hierarchical Approach for Classifying Questions in VQA [3.9] 本稿では、新しいベンチマークデータセットを提案する。VQA-Levelsと呼ばれるパイロットバージョンが準備が整っている。
質問は、低レベルの画像特徴に基づく直接回答から、画像内容全体の高レベルの抽象化を必要とするものまで、7つのレベルに分類される。
提案したデータセットを既存のVQAシステムで初期テストした結果、その成功はレベル1(低レベルの特徴)とレベル2(オブジェクト分類)の質問に大きく依存していることが判明した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:28:36 GMT)
A Contemporary Survey of Large Language Model Assisted Program Analysis [3.9] 大規模言語モデル(LLM)は、コード理解における文脈認識能力によって注目を集めている。
サイバーセキュリティにおけるLLMアプリケーションに関する既存の調査にもかかわらず、プログラム分析におけるその役割に特に対処する包括的なレビューは乏しい。
本調査は,プログラム分析実践の進展におけるLCMの可能性を実証し,検出フレームワークの強化やドメイン固有モデルの開発を目指すセキュリティ研究者に実用的な洞察を提供することを目的とする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:27:17 GMT)
Accurate AI-Driven Emergency Vehicle Location Tracking in Healthcare ITS Digital Twin [3.9] 本研究では、構築されたモックDTデータパイプラインフレームワークにAI予測モデル、具体的にはSVR(Support Vector Regression)とDeep Neural Networks(DNN)を統合することを提案する。
様々なテストシナリオを通じて、HITSのDTにおける観察されたギャップを著しく減らす上での方法論の有効性と重要な役割を視覚的に実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:32:07 GMT)
Analyze Feature Flow to Enhance Interpretation and Steering in Language Models [3.8] 本研究では,スパースオートエンコーダによって発見される特徴を,大規模言語モデルの連続的な層にわたって体系的にマッピングする手法を提案する。
データフリーなコサイン類似性技術を使用することで、各ステージで特定の機能が持続、変換、あるいは最初に現れるかを追跡できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:39:34 GMT)
Enhancing Free-hand 3D Photoacoustic and Ultrasound Reconstruction using Deep Learning [3.8] 本研究では,携帯型光音響・超音波(PAUS)画像における3次元再構成を支援するため,グローバルローカル自己保持モジュール(MoGLo-Net)を用いたモーションベース学習ネットワークを提案する。
MoGLo-Netは、連続した超音波画像内の完全に発達したスペックル領域や高発癌組織領域などの臨界領域を利用して、運動パラメータを正確に推定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:59:23 GMT)
AL-Bench: A Benchmark for Automatic Logging [3.8] 本稿では,自動ロギングツールに特化して設計された総合ベンチマークであるAL-Benchを紹介する。
10の広く認識されているプロジェクトから収集された高品質で多様なデータセットが含まれており、ロギングの要件は様々である。
挿入されたログステートメントによるコードのコンパイル可能性と、実行時に生成されたログの品質の両方を評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:32:39 GMT)
Faster Computation of Stabilizer Extent [3.8] 安定度は、ランクベースのシミュレーターを用いてシミュレーションコストを推定するのに有用なツールである。
安定度を計算するために,より高速な数値アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:42:07 GMT)
From Kernels to Features: A Multi-Scale Adaptive Theory of Feature Learning [3.8] この研究は、様々なアプローチをブリッジするマルチスケール適応的特徴学習の理論的枠組みを示す。
ネットワークの確率分布の体系的な拡張により、平均場スケーリングはサドル点近似のみを必要とすることが明らかになった。
注目すべきは、線形ネットワークの平均ネットワーク出力を予測する際に、カーネル適応を有効なカーネル再スケーリングに還元できることである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:26:50 GMT)
Ethical Considerations for the Military Use of Artificial Intelligence in Visual Reconnaissance [3.8] この白書は、軍事的文脈において、人工知能(AI)を責任を持って展開することの重要性を強調している。
この論文は倫理的AIの原則を掘り下げ、特に公正性、説明責任、透明性、倫理(FATE)ガイドラインに焦点を当てている。
これらの倫理原則の適用は、海・空気・土地の領域における3つのユースケースに基づいて論じられている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:16:39 GMT)
Distributed Quantum Dynamics on Near-Term Quantum Processors [3.7] 予測変分量子ダイナミクスの分散変分を開発し,実装する。
我々は、量子通信や古典通信を使わずに、既存のデバイス上で実行できるワイヤ切断技術を採用している。
ノイズの多いシミュレータ上でのフル変動トレーニングを実演し、実際のIBM量子デバイス上で再構成を実行し実行します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:01:04 GMT)
High-frequency near-eye ground truth for event-based eye tracking [3.6] イベントベースのアイトラッキングは、スマートアイウェア技術において、効率的で低消費電力のアイトラッキングのための有望なソリューションである。
イベントベースのデータアノテーションに特化して設計された半自動アノテーションパイプラインを導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:35:15 GMT)
Optimal Task Order for Continual Learning of Multiple Tasks [3.6] 複数のタスクの継続的な学習は、ニューラルネットワークにとって依然として大きな課題である。
本稿では,タスク順序が連続学習にどのように影響するかを考察し,その最適化戦略を提案する。
そこで本研究では,タスク増分連続学習におけるタスク順最適化のための一般化可能なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:43:58 GMT)
Looking for the Inner Music: Probing LLMs' Understanding of Literary Style [3.6] 作者のスタイルはジャンルのスタイルよりも定義しやすい。
代名詞の用法と語順は、両方の文学的スタイルを定義する上で重要である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:20:17 GMT)
Multi-Agent Path Finding under Limited Communication Range Constraint via Dynamic Leading [3.5] 本稿では,限られた通信範囲制約下でのマルチエージェントパス探索問題に対処する新しい枠組みを提案する。
我々は,進行が進行しない場合に,経路計画中にリードエージェントを動的に再選択できる動的リード型マルチエージェントパス探索を開発する。
実験の結果、最大25のエージェントを5つの環境タイプで90%以上の成功率で処理できるフレームワークの有効性が示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:32:43 GMT)
SyMANTIC: An Efficient Symbolic Regression Method for Interpretable and Parsimonious Model Discovery in Science and Beyond [3.4] シンボリック回帰(SR)アルゴリズムであるSyMANTICを導入する。
Symanticは、多数の候補から低次元記述子を効率的に識別する。
我々はSyMANTICが既存のSR手法のコストのごく一部で類似またはより正確なモデルを明らかにすることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:05:25 GMT)
What is in a name? Mitigating Name Bias in Text Embeddings via Anonymization [3.4] テキスト埋め込みモデルは、テキスト内の名前に基づいてテキスト間の類似性を誤って示すことができる。
我々は、名前への参照を削除することを含む推論中に$textittext-anonymization$を提案する。
私たちのシンプルでトレーニングを最適化しないアプローチは、名前バイアスを軽減するために実用的で簡単に実装可能なソリューションを提供します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:54:49 GMT)
Behavioral Homophily in Social Media via Inverse Reinforcement Learning: A Reddit Case Study [3.4] この研究は、ユーザのホモフィリーを定量化するための新しいアプローチを導入する。
まず、まず逆強化学習フレームワークを用いてユーザーのポリシーを推測し、次にこれらのポリシーを行動ホモフィリの尺度として利用する。
我々はこの手法をRedditに適用し、6年間で590万件のインタラクションをケーススタディで調査した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:16:45 GMT)
Data Generation for Hardware-Friendly Post-Training Quantization [3.4] 合成データを用いたゼロショット量子化(ZSQ)は、プライバシとセキュリティ制約下でのポストトレーニング量子化(PTQ)の重要なアプローチである。
既存のデータ生成方法は、ハードウェアフレンドリーな量子化に適したデータを生成するのに苦労することが多い。
ハードウェアフレンドリな量子化のためのデータ生成(DGH)を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:18:29 GMT)
GS-LiDAR: Generating Realistic LiDAR Point Clouds with Panoramic Gaussian Splatting [3.4] GS-LiDARは、パノラマガウススプラッティングで現実的なLiDAR点雲を生成するための新しいフレームワークである。
我々は,パノラマLiDAR監督によって導かれる光線スプラット交差を明示する新しいパノラマレンダリング手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:12:56 GMT)
Limitations of Large Language Models in Clinical Problem-Solving Arising from Inflexible Reasoning [3.3] LLM(Large Language Models)は、医療質問応答(QA)ベンチマークにおいて人間レベルの精度を達成した。
オープンエンドの臨床シナリオをナビゲートする際の制限が最近示されている。
医学的抽象化と推論コーパス(M-ARC)について紹介する。
現状のo1モデルやGeminiモデルを含むLSMは,M-ARCの医師と比較して性能が劣ることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:14:27 GMT)
On the Computational Hardness of Quantum One-Wayness [3.3] Pseudorandom状態は、$n$bitsを$log n + 1$ qubitsに圧縮する。
一方向のステートジェネレータは、古典的に$rmPP$oracleにアクセスできる量子アルゴリズムによって破壊することができる。
我々の結果の興味深い意味は、すべての$t(n) = o(n/log n)$に対して、$t(n)$-copy 1-way状態生成器が無条件に存在することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:02:46 GMT)
Shift of Pairwise Similarities for Data Clustering [3.3] 正規化項がクラスタの2乗サイズの和である場合を考察し、ペアの類似性の適応正規化に一般化する。
これは、ペアの類似性を(適切に)シフトさせ、それらのうちのいくつかを負にする可能性がある。
そこで我々は,新しいクラスタリング問題を解くために,高速な理論的収束率を持つ効率的な局所探索最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:12:04 GMT)
Spoken Language Intelligence of Large Language Models for Language Learning [3.2] 教育分野における大規模言語モデル(LLM)の有効性を評価することに注力する。
上記のシナリオにおけるLLMの有効性を評価するために,新しい複数選択質問データセットを提案する。
また,ゼロショット法や少数ショット法など,様々なプロンプト技術の影響についても検討する。
異なる大きさのモデルは、音韻学、音韻学、第二言語習得の概念をよく理解しているが、実世界の問題に対する推論には限界がある。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:59:28 GMT)
A Temporal Convolutional Network-Based Approach and a Benchmark Dataset for Colonoscopy Video Temporal Segmentation [3.1] ColonTCNは、独自の時間的畳み込みブロックを使用して、大腸内視鏡ビデオの時間的セグメンテーションの時間的依存関係を効率的にキャプチャする学習ベースのアーキテクチャである。
ColonTCNは、評価時に低いパラメータ数を維持しながら、分類精度の最先端性を達成する。
腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下手術を施行した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:21:56 GMT)
Data Dams: A Novel Framework for Regulating and Managing Data Flow in Large-Scale Systems [3.1] 本稿では,データインフロー,ストレージ,アウトフローを最適化する新しいフレームワークであるData Damsを紹介する。
物理的なダム機構にインスパイアされたこのフレームワークは、インテリジェントなスライスコントロールと予測分析を使用してデータフローを制御している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:34:44 GMT)
Metis: A Foundation Speech Generation Model with Masked Generative Pre-training [3.1] Metisは統合音声生成の基礎モデルである。
大規模未ラベル音声データに基づいて事前学習を行う。
その後、多様な音声生成タスクに適応するように微調整される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:36:21 GMT)
On-device Sora: Enabling Diffusion-Based Text-to-Video Generation for Mobile Devices [3.0] 拡散型オンデバイス・テキスト・ビデオ生成のための最初の先駆的ソリューションであるOn-device Soraを提案する。
オンデバイスSoraは、スマートフォンのグレードデバイス上で効率的に動作する。
われわれはiPhone 15 ProでSoraをオンデバイスで実装し、実験により高品質な動画を制作できることが実証された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:42:29 GMT)
Learning Ordinality in Semantic Segmentation [3.0] 本稿では,空間順序分節の新しい手法を提案する。
隣接する画素間の順序整合を強制するための2つの正規化項と新しいメートル法を提案する。
提案手法は,Dice係数の相対的増加を最大15.7%に抑えて,順序数測定の改善と一般化の促進を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:16:08 GMT)
Qrazor: Reliable and Effortless 4-bit LLM Quantization by Significant Data Razoring [3.0] QRazorは、ウェイト、アクティベーション、KVキャッシュの4ビット量子化をトランスフォーマーベース言語モデルで実現可能な、シンプルで効果的な量子化方式である。
まず、8ビットまたは16ビットの整数を用いてデータを量子化し、絶対的な最大スケーリングで完全精度のモデルに近い精度で保存し、次に、重要なデータレイソーシング(SDR)技術を用いて4ビットに圧縮する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:10:45 GMT)
Automating Technical Debt Management: Insights from Practitioner Discussions in Stack Exchange [3.0] 技術的負債管理(TDM)は、長期的なソフトウェアプロジェクトの維持に不可欠である。
ツールの採用は依然として低く、TDM自動化に関するさらなる研究の必要性を示している。
本研究の目的は、TDMにおける自動化に関して、どのTDMアクティビティ実践者が議論しているか、TDMの自動化のために報告するツール、自動化ソリューションを必要とする課題について理解することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:23:44 GMT)
Secure Resource Management in Cloud Computing: Challenges, Strategies and Meta-Analysis [2.9] 本稿では,クラウドワークロードの実行とリソース管理においてセキュリティ上の課題に対処するサイバー脅威対策戦略について検討する。
サイバー脅威対策方法は、防衛戦略、緩和戦略、ハイブリッド戦略の3つのクラスに分類される。
この研究は、セキュアなクラウドリソース管理の課題に効果的に対処できる将来的な方法論を示唆している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:20:35 GMT)
Data Collaboration Analysis with Orthonormal Basis Selection and Alignment [2.9] 基本選択とアライメントフェーズの間に正規正規制約を強制する新しいフレームワークである textbf Orthonormal DC (ODC) を提案する。
任意のターゲットベースを許容する従来のDCとは異なり、ODCはターゲットを正規の正規ベースに制限し、モデルパフォーマンスに関する特定のベースの選択を無視する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:33:52 GMT)
Model-based Analysis of Mining Fairness in a Blockchain [2.9] ブロックチェーンにおけるマイニングフェアネスは、マイニングに投資した計算リソースと、受け取ったブロック報酬の平等を指す。
簡単な数学的モデルを用いたマイニングフェアネスの計算法を提案する。
ブロックチェーンネットワークシミュレーションにより、既存の手法よりもネットワーク内のマイニングフェアネスをはるかに正確に計算できることを検証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:15:25 GMT)
Large Language Model Guided Self-Debugging Code Generation [2.8] PyCapsuleはPythonコード生成の新しいフレームワークである。
プロンプト推論、反復的なエラー処理、ケーステストなどが特徴である。
HumanEvalで最大5.7%、HumanEval-ETで最大10.3%、BigCodeBenchで最大24.4%を達成している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:43:40 GMT)
DiffListener: Discrete Diffusion Model for Listener Generation [2.8] リスナーヘッド生成タスクは、話者のマルチモーダルキューに基づいて、自然な非言語的リスナー応答を生成することを目的としている。
非自己回帰型リスナーヘッド生成のための離散拡散に基づくDiffListenerを提案する。
我々のモデルは、話者の顔情報、音声、テキストを入力とし、さらに表情や動きの時間的ダイナミクスを表現するために、顔差情報を統合する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:57:15 GMT)
From Fog to Failure: How Dehazing Can Harm Clear Image Object Detection [2.8] 本研究は,人間の視覚的手がかりに基づく脱ハジングを物体検出に組み込むことの課題について考察する。
本稿では,光検出装置が関心領域を検知し,空間的注意に基づくデハジングによって拡張する多段階フレームワークを提案する。
霧の環境では有効であるが、この手法は鮮明な画像の性能を予期せず劣化させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:34:57 GMT)
Partially Observed Trajectory Inference using Optimal Transport and a Dynamics Prior [2.7] 軌道推論は、時間的限界のスナップショットから集団の時間的ダイナミクスを回復しようとする。
先行研究は、観測空間に勾配駆動ドリフトを持つ微分方程式(SDE)モデルの下で行われる。
本稿では,この潜在軌道推定問題の解法としてPO-MFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:59:29 GMT)
Signature Reconstruction from Randomized Signatures [2.6] ランダムベクトル場を持つ制御された常微分方程式から、曲線のよく知られたシグネチャ特徴がどの程度再構成できるかを問う。
答えは代数的に関係していることがわかったが、本質的には、制御された常微分方程式の非線形フローから再構成できる符号特徴の数は、その隠れ次元において指数的である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:35:03 GMT)
Enhancing Quantum-ready QUBO-based Suppression for Object Detection with Appearance and Confidence Features [2.6] 物体検出における擬似非拘束バイナリ最適化(QUBO)に基づく抑制は、従来の非最大抑圧(NMS)よりも優れていることが知られている。
本研究は,物体の隠蔽や1つの物体に対する複数の予測の冗長性による予測の重複を識別することを目的とした新しいQUBOの定式化を提案する。
提案手法は,mAPの4.54ポイント,mARの9.89ポイント向上を達成し,現状のQUBOによる抑制を著しく改善することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:35:37 GMT)
Harnessing Large Language Models for Curated Code Reviews [2.6] コードレビューでは、構造化され、関連するコメントを生成することは、コードの問題を識別し、正確なコード変更を容易にするために不可欠である。
既存のコードレビューデータセットは、しばしば騒々しく、未解決であり、AIモデルの学習可能性に制限を課している。
本稿では,最大規模の公開コードレビューデータセットの品質向上を目的としたキュレーションパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:15:09 GMT)
Recommendations Beyond Catalogs: Diffusion Models for Personalized Generation [2.6] 本稿では,確率的拡散に基づくリコメンデータシステムであるREBECAを提案する。
REBECAは、カタログからアイテムを取り出すのではなく、個々の味に合わせた新しいアイテムを合成する。
我々は、実世界のデータに基づいてREBECAを評価し、生成レコメンデーションシステムのための新しいパーソナライズ指標を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:11:47 GMT)
Efficient extraction of medication information from clinical notes: an evaluation in two languages [2.6] 本稿では,患者の治療体制に関連する物質とその関係を抽出するためのトランスフォーマーベースのアーキテクチャを提案する。
提案手法を用いて, ホピトー大学ストラスブール校の注釈付きコーパスを用いて, フランスの臨床ノートのモデルを訓練し, 評価した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:13:08 GMT)
Multi-objective methods in Federated Learning: A survey and taxonomy [2.5] 本稿では,フェデレートラーニングに関連する多目的手法の活用に関する第1の分類法を提案する。
今後の研究に向けて、オープンな課題と可能な方向性を概説する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:06:43 GMT)
Rapid comprehensive characterization of biphoton spatial-polarization hyperentanglement [2.5] 自発的なダウンコンバージョンから発生する空間偏極双光子状態の迅速定量化について述べる。
その結果, 最大次元は251であり, ハイパーエンタングルメントで報告される最も高い次元であることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:08:52 GMT)
Information Theoretic Analysis of PUF-Based Tamper Protection [2.4] 我々は、理論的特性と限界を分析するために、実装から一歩後退する。
ゼロリーク出力量子化を既存の量子化スキームに適用し、ゼロリーク下での再構成誤差確率を推定する。
この結果から,少なくとも459個のPUFセルを3ビット量子化して128ビットのセキュリティレベルを達成する必要があることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:39:41 GMT)
Federated Learning of Dynamic Bayesian Network via Continuous Optimization from Time Series Data [2.4] 現実のシナリオでは、データは複数のエンティティに分散され、動的ベイズネットワークを協調的に学習しようとする。
本研究では,同種時系列データから動的ベイズネットワークの構造を推定するフェデレート学習手法を提案する。
そして、このアプローチを、パーソナライズされたフェデレーション学習フレームワークにおいて、近似演算子を正規化項として組み込むことにより、異種時系列データに拡張する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:35:48 GMT)
How Much Do Code Language Models Remember? An Investigation on Data Extraction Attacks before and after Fine-tuning [2.4] 我々は、事前訓練されたコード言語モデルと微調整されたコード言語モデルの両方を攻撃し、データの抽出可能性について調査する。
微調整は少ないリソースを必要とし、その特殊データに対する有効性のために、小規模でも大規模でもますます利用されている。
データキャリアとライセンス情報は、事前訓練されたモデルと微調整されたモデルから記憶される可能性が最も高い一方、後者は微調整後に忘れられる可能性が最も高い。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:35:55 GMT)
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs [2.3] 本稿では,Rationale-based Multiple Trait Scoring (RMTS)について紹介する。
RMTSは、プロンプトエンジニアリングに基づく大規模言語モデル(LLM)と、より小さな大規模言語モデル(S-LLM)を用いた微調整ベースのエッセイスコアモデルを統合する。
ASAP、ASAP++、Feedback Prizeなどのベンチマークデータセットの実験では、RMTSが特性特異的スコアリングにおいて最先端のモデルとバニラS-LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:52:14 GMT)
Token-based Decision Criteria Are Suboptimal in In-context Learning [2.3] In-Context Learning (ICL) は通常、手動で選択したラベルトークンの出力確率から分類基準を利用する。
トークン確率を放棄し,LMの最後の隠蔽状態に最も近いセントロイドを使用するHiddenを提案する。
6つのモデルと10の分類データセットに関する実験は、Hiddenが現在のトークンベースベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:44:48 GMT)
Practical X-ray Gastric Cancer Diagnostic Support Using Refined Stochastic Data Augmentation and Hard Boundary Box Training [2.3] 提案システムは,90.2%の胃癌に対する感度(SE)を専門家(85.5%)より高い精度で達成する。
また、F1スコアの5.9ポイント改善を示すことにより、同じオブジェクト検出モデルと最先端データ拡張を用いた手法も優れている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:40:22 GMT)
Contrastive Learning for Cold Start Recommendation with Adaptive Feature Fusion [2.2] 本稿では,コントラスト学習を統合したコールドスタートレコメンデーションモデルを提案する。
このモデルは適応的特徴選択モジュールを通じて鍵特徴の重みを動的に調整する。
マルチモーダルな特徴融合機構を組み合わせることで、ユーザ属性、アイテムメタ情報、コンテキスト特徴を統合する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:15:31 GMT)
5G-AKA-HPQC: Hybrid Post-Quantum Cryptography Protocol for Quantum-Resilient 5G Primary Authentication with Forward Secrecy [2.2] 5G認証は、リンク可能性攻撃や量子コンピューティングの脅威に対して脆弱である。
我々は,セキュリティを強化しつつ,既存の標準との互換性を維持するプロトコルであるHPQCの5Gを提案する。
本研究は,セキュアなモバイル認証プロトコルの今後の標準化に寄与する,量子セーフな認証に関する重要な知見を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:05:45 GMT)
Two in context learning tasks with complex functions [2.1] 変圧器モデルに対する数列およびテスト設定における数式関数を用いた文脈学習(ICL)の2つのタスクについて検討する。
本研究は, 注意層を持つモデルであっても, 任意の関数を近似できることを示すことによって, 線形関数の研究を一般化する。
我々のモデルは、複素関数の零点だけでなく、以前に見つからなかった関数のクラスを近似することもできる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:03:36 GMT)
Efficient Global Neural Architecture Search [2.1] 本稿では,異なるネットワークに対する可変トレーニングスキームを用いたアーキテクチャ対応近似を提案する。
提案するフレームワークは,CIFAR-10,CIFAR-100,FashionMNISTデータセットに対して高い競争力を持ちながら,EMNISTとKMNISTの新たな最先端を実現する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:10:17 GMT)
Support estimation in high-dimensional heteroscedastic mean regression [2.1] ランダムな設計と、潜在的にヘテロセダスティックで重み付きエラーを伴う線形平均回帰モデルを考える。
我々は,問題のパラメータに依存するチューニングパラメータを備えた,厳密な凸・滑らかなHuber損失関数の変種を用いる。
得られた推定器に対して、$ell_infty$ノルムにおける符号一貫性と最適収束率を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:36:49 GMT)
Gotham Dataset 2025: A Reproducible Large-Scale IoT Network Dataset for Intrusion Detection and Security Research [2.1] Gotham testbedは、ネットワークセキュリティ研究のための現実的で異質な環境を提供するように設計された、大規模なIoT(Internet of Things)ネットワークのエミュレートである。
ネットワークトラフィックはPacketdumpで捕捉され、良心と悪意のあるトラフィックの両方が記録された。
悪意のあるトラフィックは、Denial of Service(DoS)、Telnete Force(英語版)、Network Scanning(英語版)、CoAP Amplification(英語版)、C&C(英語版)通信の様々な段階を含むスクリプトによる攻撃によって発生した。
データリポジトリは、PCAPフォーマットで生のネットワークトラフィックと、CSVフォーマットで処理されたラベル付きデータとを含む。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:51:18 GMT)
Explain Yourself, Briefly! Self-Explaining Neural Networks with Concise Sufficient Reasons [1.9] 出力の不可欠な部分として、予測の簡潔な理由を生成するためにモデルを訓練する。
以上の結果から,本フレームワークは,競合するポストホック法よりも,簡潔で忠実な部分集合をかなり効率的に生成することが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:29:12 GMT)
Asynchronous Stochastic Gradient Descent with Decoupled Backpropagation and Layer-Wise Updates [1.9] 非同期勾配降下法(ASGD)は訓練速度を改善することができるが、通信とスループットの差により遅延に敏感である。
PD-ASGDは、フォワードとバックのパスに別々のスレッドを使用し、更新を分離し、フォワードとバックのスレッドの比率を高くする。
提案手法では,遅延が存在する場合,同期データ並列処理よりも5.95タイム以上高速に動作しながら,最先端の処理結果に近い結果が得られる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:03:40 GMT)
DP-SGD-Global-Adapt-V2-S: Triad Improvements of Privacy, Accuracy and Fairness via Step Decay Noise Multiplier and Step Decay Upper Clipping Threshold [1.9] DPSGDのサンプルごとの勾配クリッピングとトレーニング中の一様雑音付加は、モデルの有用性と公平性を著しく低下させる。
ステップデカイ雑音乗算器と、ステップワイズで減衰する上クリッピング閾値を有するDP-SGD-Global-Adapt-V2-Sを開発した。
精度は0.9795%、0.6786%、MNIST、CIFAR10、CIFAR100で4.0130%向上する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:23:11 GMT)
TopoCL: Topological Contrastive Learning for Time Series [1.8] 時系列のためのトポロジカルコントラスト学習(TopoCL)を提案する。
TopoCLは、永続的ホモロジーを組み込むことで、情報損失を軽減する。
下流タスク分類,異常検出,予測,伝達学習の4つの実験を行った。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:37:35 GMT)
xai_evals : A Framework for Evaluating Post-Hoc Local Explanation Methods [1.7] xai_evalsは、説明メソッドの生成、ベンチマーク、評価のためのフレームワークを提供する。
SHAP、LIME、Grad-CAM、Integrated Gradients (IG)、Backtraceといった一般的なテクニックを統合している。
xai_evalsは、機械学習モデルの解釈可能性を高め、透明性とAIシステムの信頼を促進する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:17:48 GMT)
Inducing Diversity in Differentiable Search Indexing [1.7] 我々は、MMR(Maximal Marginal Relevance)にインスパイアされたDSIシステムの訓練のためのバランス関係と新しい情報内容(多様性)について検討する。
我々は,NQ320KおよびSMARCOデータセットを用いて,その妥当性と多様性を定量的に評価した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:21:17 GMT)
ProveRAG: Provenance-Driven Vulnerability Analysis with Automated Retrieval-Augmented LLMs [1.7] セキュリティアナリストは、新たに発見された脆弱性をリアルタイムで軽減するという課題に直面している。
1999年以降、30,000以上の共通脆弱性と暴露が特定されている。
2024年には25,000以上の脆弱性が特定されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:01:01 GMT)
SimMark: A Robust Sentence-Level Similarity-Based Watermarking Algorithm for Large Language Models [1.7] SimMarkは、大規模な言語モデルの出力を、モデルの内部ログへのアクセスを必要とせずにトレース可能にする、ポストホックな透かしアルゴリズムである。
実験結果から,SimMark は LLM 生成コンテンツのロバストな透かしのための新しいベンチマークを作成した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:21:01 GMT)
A Structured Reasoning Framework for Unbalanced Data Classification Using Probabilistic Models [1.7] 本稿では,不均衡データに対するマルコフネットワークモデルについて検討し,分類バイアスとマイノリティクラス認識能力不足の問題を解くことを目的とした。
実験の結果,マルコフネットワークは重み付け精度,F1スコア,AUC-ROCなどの指標で良好に動作することがわかった。
将来の研究は、大規模不均衡なデータ環境における効率的なモデルトレーニング、構造最適化、ディープラーニングの統合に焦点を当てることができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:20:47 GMT)
Data Wrangling Task Automation Using Code-Generating Language Models [1.6] 本稿では,不備な値計算,エラー検出,エラー訂正などのタスクに対して実行可能なコードを生成する自動システムを提案する。
本システムは,外部知識を活用してデータ固有のパターンを識別し,メモリ依存タスクとメモリ依存タスクの両方に効果的に対処することを目的としている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:36:29 GMT)
MeDiSumQA: Patient-Oriented Question-Answer Generation from Discharge Letters [1.6] 大規模言語モデル(LLM)は、医療情報を単純化してソリューションを提供する。
安全で患者に優しいテキスト生成のためのLCMの評価は、標準化された評価リソースが欠如しているため困難である。
MeDiSumQAはMIMIC-IV放電サマリーから自動パイプラインを通じて生成されたデータセットである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:56:37 GMT)
A Beam's Eye View to Fluence Maps 3D Network for Ultra Fast VMAT Radiotherapy Planning [1.6] Volumetric Modulated Arc Therapy (VMAT) は、健康な組織を分散しながら放射線を正確に供給することで、がん治療に革命をもたらす。
本稿では,患者データから直接レンスマップを予測することにより,より迅速な深層学習手法を提案する。
我々は、L1とL2の損失の組み合わせと、EclipseとREQUITEデータセットから生成されたRTプランを用いて、教師付き方法でトレーニングした3Dネットワークを開発した。
本ネットワークは,単弧VMAT計画の180個の制御点(CP)に対応する180個のフルレンスマップを共同で予測する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:56:17 GMT)
High-fidelity initialization a logical qubit with multiple injections [1.6] 多重インジェクションによる非クリフォード論理ゲートに対する持続的耐故障性スキームを導入する。
これまでの取り組みと比較して、我々のプロトコルはコード距離の大きな問題を大幅に軽減します。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:37:57 GMT)
Sparse Autoencoders for Hypothesis Generation [1.5] hypotheSAEsはテキストデータ(例:見出し)とターゲット変数(例:クリック)の関係を仮説化する方法である。
テキスト埋め込みでスパースオートエンコーダを訓練し、データ分布を記述する解釈可能な特徴を生成する。
対象変数を予測する機能を選択し,(3)各特徴の自然言語解釈を生成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:58:02 GMT)
Assessing Research Impact in Indian Conference Proceedings: Insights from Collaboration and Citations [1.5] この調査は、Springer's Lecture Notes in Networks and Systems Seriesによってインデックスされたカンファレンスの出版物に展開される。
このシリーズで世界570の国際会議が開催され、177の開催国はインドのみであった。
本研究は,これらの会議手続における研究効果を評価し,主要なコントリビュータを特定することを目的とする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:45:36 GMT)
AAD-DCE: An Aggregated Multimodal Attention Mechanism for Early and Late Dynamic Contrast Enhanced Prostate MRI Synthesis [1.5] DCE-MRIはガドリニウム系コントラスト剤(Gad)を投与する。
DCE-MR画像を合成する従来のディープラーニングアプローチでは、解剖学における局所的な灌流情報に焦点をあてていない非造影または低用量造影MRI画像が採用されている。
本稿では,グローバルおよびローカルな識別器からなるアグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリケーション・アグリゲーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・ア・アグリゲーション・ア・ア・ア・ア・ア・
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:44:23 GMT)
Implementing Large Quantum Boltzmann Machines as Generative AI Models for Dataset Balancing [1.5] 本研究では,D-Wave のペガサス量子ハードウェア上での生成モデルとして大きな量子ボルツマンマシン (QRBM) を実装し,制限侵入検知システム (IDS) におけるデータセット不均衡に対処する。
QRBMは660万以上の攻撃サンプルを合成し、4200万レコード以上のバランスの取れたデータセットを達成した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:25:27 GMT)
Minimax-Optimal Dimension-Reduced Clustering for High-Dimensional Nonspherical Mixtures [1.5] 各クラスタ内の非球面(異方性)ノイズは、実世界のデータに広く存在している。
本研究では,高次元非球面混合モデルに基づくクラスタリングにおける最小値と最適統計手法について検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:35:49 GMT)
Kozax: Flexible and Scalable Genetic Programming in JAX [1.4] Kozaxは任意の問題に対するシンボリック表現を進化させる遺伝的プログラミングフレームワークである。
高性能でスケーラブルな機械学習のためのフレームワークであるJAXを使ってKozaxを実装します。
我々は、自然法則の方程式を発見し、隠れた動的変数の方程式を復元し、制御ポリシーを進化させるために、Kozaxの成功した応用を実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:12:17 GMT)
Can Large Language Models Capture Video Game Engagement? [1.4] 我々は、ビデオの連続的な影響アノテーションを注釈化し、うまく予測する一般的な大規模言語モデルの能力を包括的に評価する。
我々は, LLMアーキテクチャ, モデルサイズ, 入力モダリティ, プロンプト戦略, エンゲージメント予測に対する接地真理処理法の影響について, 2400以上の実験を行った。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:14:47 GMT)
Hybrid Deep Learning Framework for Classification of Kidney CT Images: Diagnosis of Stones, Cysts, and Tumors [1.4] 本研究では,プレトレーニングされたResNet101とカスタムCNNを統合して腎臓CT画像の分類を行うハイブリッドディープラーニングモデルを提案する。
12,446枚のCT画像と高度な特徴マッピング技術のデータセットを使用して、ハイブリッドCNNモデルはスタンドアロンのResNet101より優れています。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:38:35 GMT)
Demonstration of Robust and Efficient Quantum Property Learning with Shallow Shadows [1.4] 本稿では,現在の量子コンピューティングプラットフォーム上での量子状態の特徴付けのためのロバストプロトコルを提案する。
提案プロトコルは, 期待値, 忠実度, 絡み合いエントロピーなどの状態特性を, サンプルの複雑さを低く保ちながら正確に復元する。
この理論的および実験的分析を組み合わせることで、ロバストな浅い影プロトコルは、スケーラブルで堅牢でサンプル効率のよいプロトコルとして位置づけられる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:08:44 GMT)
End-to-end QKD network with non-localized trust [1.4] エンド・ツー・エンドのセキュリティサービスへの道のりにある石の1つは、このプロトコルを使用することで取り除かれる可能性がある。
提案提案では, ツインフィールドQKDと古典的ポストプロセッシングと通信を併用し, Alice と Bob が秘密鍵を共有できるようにする。
AliceとBobの中間ノードの連立関係は、新しいスキームを破るために必要であり、セキュリティの観点から信頼性の高いノードアプローチを著しく上回っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:15:35 GMT)
Kolmogorov-Arnold Networks for Time Series Granger Causality Inference [1.3] 我々は最近提案されたコルモゴロフ・アルノルドネットワーク(KAN)を因果推論の領域に拡張する新しいアーキテクチャを提案する。
カン層から基底重みを抽出することにより、KANGCIは時系列からグレンジャー因果関係を効果的に推定する。
また,元の時系列や時間反転時系列からより優れた推論性能を持つ因果関係を自動的に選択するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:26:49 GMT)
Investigating Privacy Bias in Training Data of Language Models [1.3] プライバシーバイアス(英: privacy bias)とは、あるコンテキスト内で情報の流れが適切に流れる際の歪を指す。
このスキューは、既存の期待に沿うか、システムの問題の症状を示すかもしれない。
文脈整合性に基づく手法を用いてプライバシーバイアスを評価する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:31:01 GMT)
AI-driven materials design: a mini-review [1.3] 過去数十年の材料設計における重要な計算の進歩を要約する。
我々は,従来のスクリーニング手法から,深層生成モデルによって駆動される逆生成へのパラダイムシフトを強調した。
このレビューは、将来の機能性材料の設計のアプローチ、進展、展望の簡単なガイドとして機能するかもしれない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:59:15 GMT)
Clinically-Inspired Hierarchical Multi-Label Classification of Chest X-rays with a Penalty-Based Loss Function [1.3] 本稿では,臨床診断性を高めるマルチラベル胸部X線(CXR)画像分類法を提案する。
臨床的に有意な診断関係を捉えるため,階層的なラベル分類を取り入れた。
実験では,受信機動作特性曲線(AUROC)の0.903の平均値を得た。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:15:06 GMT)
AI-Based Thermal Video Analysis in Privacy-Preserving Healthcare: A Case Study on Detecting Time of Birth [1.3] 熱画像を用いた自動ToB検出のためのAI駆動ビデオベースシステムを提案する。
性能評価中に熱ビデオクリップ中のToBの検出において,91.4%の精度,97.4%のリコールを実現した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:01:49 GMT)
PalimpChat: Declarative and Interactive AI analytics [1.2] PalimpChatはチャットベースのPalimpzestインターフェースで、ユーザーは自然言語だけでAIパイプラインを作成し、実行することができる。
本稿では、PalimpChatがPalimpzestによってどのようにサポートされ、バイオメディカルデータの抽出や分析などの複雑なAIを単純化するかに焦点を当てる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:06:59 GMT)
Energy-Efficient Flying LoRa Gateways: A Multi-Agent Reinforcement Learning Approach [1.2] 無人航空機(UAV)に搭載された空飛ぶLoRaゲートウェイを配備し、LoRaエンドデバイス(ED)からデータを収集し、中央サーバに送信する。
我々の主な目的は、送信電力(TP)、拡散係数(SF)、帯域幅(W)、EDアソシエーションの合同最適化により、無線LoRaネットワークのグローバルシステムエネルギー効率(EE)を最大化することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:16:40 GMT)
Online Learning Algorithms in Hilbert Spaces with $β-$ and $φ-$Mixing Sequences [1.2] 我々は、ミキシングプロセスと呼ばれる依存プロセスのクラスに基づいて、再生カーネルヒルベルト空間におけるオンラインアルゴリズムについて研究する。
本研究では, (β-) と (phi-) の混合係数によって依存構造が特徴づけられる厳密な定常マルコフ連鎖を解析する。
我々の発見は、i.i.d.観測の既存のエラー境界を拡張し、i.i.d.ケースが我々のフレームワークの特別な例であることを実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:09:07 GMT)
Uncertainty Quantification and Propagation in Surrogate-based Bayesian Inference [1.1] 代理モデルはより複雑なシミュレーションモデルに対する概念近似である。
代理体の不確かさを定量化し、伝播することは、通常、特別な分析ケースに限られる。
本稿では,測定データを用いた代理モデルを用いたベイズ推定の3つの手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:22:09 GMT)
Examining Two Hop Reasoning Through Information Content Scaling [1.1] 2つの質問と回答のデータセットをそのサイズで学習するトランスフォーマーの能力について検討する。
キャパシティスケーリングと一般化はどちらも、潜伏する2つのホップQAは、トランスフォーマーがそれぞれの事実を2回学ぶ必要があるという仮説を支持している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:13:04 GMT)
Investigating Corporate Social Responsibility Initiatives: Examining the case of corporate Covid-19 response [1.1] 本稿では,政策立案者が最もポピュラーなトピック認識手法をどのように実装できるかを示す。
我々は,Covid-19パンデミックの早期および進行期の企業プレスリリースに,人気のあるNLP手法を適用した。
本研究で実施されるステップは、他の社会的意思決定コンテキストにおける関連文書から洞察を得るために複製することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:09:34 GMT)
CORTEX: A Cost-Sensitive Rule and Tree Extraction Method [1.1] ツリーベースおよびルールベース機械学習モデルは、説明可能な人工知能(XAI)において重要な役割を果たす
これらの透明モデルは通常、ブラックボックスモデルの論理を説明するためのポストホックXAIアプローチであるサロゲートモデリングで使用される。
本研究では,新しいルールベースXAIアルゴリズムであるCORTEX法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:20:34 GMT)
Evidence is All We Need: Do Self-Admitted Technical Debts Impact Method-Level Maintenance? [1.0] Self-Admitted Technical Debt (SATD)は、開発者がソースコードのコメントを通じて技術的負債を明示的に認める現象である。
本稿では,SATDがソフトウェア保守の様々な面に与える影響を,方法論レベルで実証的に検討することを目的とする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:09:05 GMT)
Sorting the Babble in Babel: Assessing the Performance of Language Detection Algorithms on the OpenAlex Database [1.0] 本稿では,自動言語検出アルゴリズムに基づく各種言語分類手法の設計,使用,評価に焦点をあてる。
データベースの各主要言語に対するこれらの異なるプロシージャのパフォーマンスを、精度、リコール、処理時間の観点から評価する。
これらの結果は, 言語横断的, ビブリオメトリックスに基づく研究・分析のためのOpenAlexデータベースの非並列的可能性の確認と育成に有効であることが期待されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:29:09 GMT)
Chaos into Order: Neural Framework for Expected Value Estimation of Stochastic Partial Differential Equations [1.0] 本稿では,離散化の必要性を排除し,不確実性を明示的にモデル化するSPDE推定のための新しいニューラルネットワークフレームワークを提案する。
これは、SPDEの期待値を直接非分散的に推定できる最初のニューラルネットワークフレームワークであり、科学計算における一歩となる。
本研究は, ニューラルベースSPDEソルバの潜在可能性, 特に従来の手法が不安定な高次元問題に対する可能性を明らかにした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:27:28 GMT)
Holevo Cramér-Rao bound for multi-parameter estimation in nonlinear interferometers [0.9] 非線形干渉計は 標準量子限界を超える可能性がある
両モードが変位推定を行う場合,Holevo Cram'er-Rao Bound (HCRB) を導出する。
HCRBは2つのホモダイン測定の結果と等しいが, SLD-CRBは小さな圧縮パラメータでは飽和しない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:17:42 GMT)
OpenSTARLab: Open Approach for Spatio-Temporal Agent Data Analysis in Soccer [0.9] スポーツアナリティクスは、より専門的で洗練されたものになり、詳細なパフォーマンスデータが利用できるようになった。
サッカーでは、イベントと追跡データの効果的な利用は、ゲームのダイナミクスを捕捉し分析するための基本となる。
本稿では,スポーツにおける時間的エージェントデータ分析の民主化を目的としたオープンソースフレームワークであるOpenSTARLabを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:14:18 GMT)
Mapping and Localization Using LiDAR Fiducial Markers [0.9] Dissertationは、LiDARフィデューシャルマーカーを用いたマッピングとローカライゼーションのための新しいフレームワークを提案する。
Intensity Image-based LiDAR Fiducial Marker (IFM)システムを導入する。
LFMに基づく新しいマッピングとローカライズ手法は、順序のない低オーバーラップ点雲を登録する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:33:59 GMT)
A Systematic Approach for Assessing Large Language Models' Test Case Generation Capability [0.8] 大規模言語モデル (LLM) を評価するために,制御フロー構造と可変利用構成 (GBCV) から生成したベンチマークを提案する。
基本的な制御フロー構造と変数使用量を活用することで、GBCVは、単純なプログラムから複雑なプログラムの範囲を作成する柔軟なフレームワークを提供する。
以上の結果から,GPT-4oは複雑なプログラム構造において優れた性能を示し,全てのモデルが単純な条件下で境界値を効果的に検出するが,算術計算では問題に直面することが示唆された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:51:44 GMT)
Error Mitigation of BQP Computations using Measurement-Based Verification [0.8] 既存のツールを量子検証と測定ベースの量子計算から利用して、我々のプロトコルは、ノイズサンプリングのためのテストラウンドと並行して、標準的な計算ラウンドをインターリーブする。
我々は、時間依存ノイズに対処し、オーバーヘッドを削減するために、textitbasketingと呼ばれるポストセレクション手法を導入する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:43:03 GMT)
Leveraging Creativity as a Problem Solving Tool in Software Engineering [0.8] 認知心理学の分野における創造性研究の結果をソフトウェア工学の分野に移植する。
私たちはクリエイティビティを実践的な問題解決ツールとして活用して、ソフトウェア開発者を支援する方法を探っています。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:35:33 GMT)
Deep Clustering via Probabilistic Ratio-Cut Optimization [0.7] 本稿では,二項代入を確率変数としてモデル化することで,グラフ比カットを最適化する新しい手法を提案する。
オンライン環境における代入変数のパラメータを学習するために、予測比カットの上限と、その勾配の偏りのない推定値を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:47:53 GMT)
The Logical Implication Steering Method for Conditional Interventions on Transformer Generation [0.7] モデルに論理的含意の形式を構築するために'線形表現仮説'を活用する方法を示す。
我々の方法である論理的含意モデルステアリング(LIMS)は、新しい手作業による推論機能を解き放つ。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:09:02 GMT)
Slowing Learning by Erasing Simple Features [0.7] そこで我々は,新しいクローズドフォーム概念消去手法であるQLEACEを考案した。
LEACEは学習を継続的に遅くするが、二次消去はデータセット、モデルアーキテクチャ、消去方法に依存する学習速度に正と負の両方の効果を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 01:42:44 GMT)
Popularity and Innovation in Maven Central [0.7] Maven CentralはJavaコンポーネントの一般的なリポジトリで、過去20年間に進化してきた。
問題は、これらのエリートたちが静的なのか、時間とともに変化しているか、Mavenエコシステムのイノベーションにどのように関係しているのかである。
エリートは動的であり、リポジトリの老朽化とともにイノベーションの速度は減速しているが、健康は保たれている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:38:20 GMT)
Deep clustering using adversarial net based clustering loss [0.7] 我々は、従来の閉形式 KL の発散に対して、対角ネットとして深層クラスタリングを再構成する。
提案手法の性能をいくつかのよく引用されたデータセットで実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:50:18 GMT)
TexLiDAR: Automated Text Understanding for Panoramic LiDAR Data [0.6] LidarCLIPのようなテキストとLiDARデータを接続する努力は、主にCLIPテキストイメージスペースに3Dポイントクラウドを埋め込むことに重点を置いている。
3次元点雲の代わりにOS1センサによって生成された2次元画像を活用することで、LiDARデータをテキストで接続する代替手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:41:06 GMT)
LLaVAC: Fine-tuning LLaVA as a Multimodal Sentiment Classifier [0.6] マルチモーダル感情分析のための分類器構築手法であるLLaVACを提案する。
提案手法では,単モーダルラベルとマルチモーダルラベルの両方を微調整LLaVAに組み込んだ構造化プロンプトを設計する。
MVSA-Singleデータセットの実験により、LLaVACはマルチモーダル感情分析において既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:10:04 GMT)
The Thermodynamic Cost of Ignorance: Thermal State Preparation with One Ancilla Qubit [0.6] 本研究では, 単軸量子ビットがランダムに反応して熱化する熱化モデルについて検討する。
これはギブス状態の自然発生に光を当てるだけでなく、デジタル量子コンピュータ上で任意の熱状態を作成するルーチンも提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:50:37 GMT)
Symmetry-Aware Bayesian Flow Networks for Crystal Generation [0.6] 結晶生成のための新しい対称性対応ベイズフローネットワーク(BFN)であるSymbBFNを紹介する。
SymmBFNは効率を大幅に改善し、安定な構造を生成する。
結晶性物質の発見を加速するための有効なツールとして,BFNが確立されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:14:50 GMT)
Neural Network-based Vehicular Channel Estimation Performance: Effect of Noise in the Training Set [0.6] 車両通信システムは、高モビリティと急速に変化する環境のために重大な課題に直面している。
これらの課題に対処するために、ニューラルネットワーク(NN)に基づくチャネル推定法が提案されている。
本研究では,混合SNRデータセットに対するNNチャネル推定器の訓練効果について検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:29:01 GMT)
Early Stopping in Contextual Bandits and Inferences [0.5] 過剰なサンプリングはコストがかかり、早期停止法と信頼性のある実験後の推論の破壊を動機付ける。
本稿では, サンプリングコストを考慮しつつ, 実験中の後悔を最小限に抑えるために, 事前決定およびオンライン停止ルールを含む, 線形文脈帯域の早期停止法について検討する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:40:10 GMT)
Privacy-Preserving Generative Models: A Comprehensive Survey [0.5] 生成モデルの成功にもかかわらず、プライバシとユーティリティーに関するその意味を研究する必要性はより緊急になる。
既存の調査では、GANとVAEのプライバシーとユーティリティの観点を体系的に分類していない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:24:43 GMT)
Demonstration of system-bath physics on a gate-based quantum computer [0.5] アルゴリズム冷却は、多体量子系の相関状態を見つけるために用いられる。
我々は,非単位演算とアルゴリズム冷却を実装するために,固有量子ビット雑音を用いる手法を開発した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:31:43 GMT)
Diffusion on language model encodings for protein sequence generation [0.5] 本稿では,タンパク質言語モデル表現で動作する潜在拡散フレームワークであるDiMAを提案する。
私たちのフレームワークは、新しい、高品質で多様なタンパク質配列を一貫して生成します。
これは、タンパク質ファミリーの生成、モチーフの足場と埋め込み、折りたたみ特異的な配列設計を含む条件付き生成タスクをサポートする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:26:23 GMT)
Deep Reinforcement Learning-Based Optimization of Second-Life Battery Utilization in Electric Vehicles Charging Stations [0.5] 本稿では,BESSを用いた電気自動車充電ステーションのための深層強化学習(DRL)計画フレームワークについて述べる。
我々は、季節変動を考慮した1年分のデータに基づいてモデルをトレーニングする、高度なソフトアクター・クリティカル(SAC)アプローチを採用する。
調整された報酬関数は効果的なオフライントレーニングを可能にし、不確実性の下でEVCS操作をリアルタイムに最適化することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:50:53 GMT)
Learning with SASQuaTCh: a Novel Variational Quantum Transformer Architecture with Kernel-Based Self-Attention [0.5] 本稿では、SASQuaT(Self-Attention Sequential Quantum Transformer Channel)という変分量子回路アーキテクチャを提案する。
提案手法は、単純なゲート演算と多次元量子フーリエ変換を用いたビジョントランスフォーマーネットワークの予測におけるカーネルベース演算子学習の最近の知見を活用する。
提案手法の有効性を検証するため,9量子ビットと少数のパラメータしか持たず,手書き桁のグレースケール画像を高い精度で同時に埋め込み,分類することが可能な画像分類タスクをシミュレーションおよびハードウェアで検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:56:04 GMT)
Fast Ergodic Search with Kernel Functions [0.4] カーネルベースのエルゴード計量を開発し、ユークリッド空間からリー群へ一般化する。
非線形システムに対するカーネルエルゴード計量の1次最適条件を導出する。
総合的な数値ベンチマークにより、提案手法は最先端のアルゴリズムよりも少なくとも2桁高速であることが示された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:27:32 GMT)
Transition Network Analysis: A Novel Framework for Modeling, Visualizing, and Identifying the Temporal Patterns of Learners and Learning Processes [0.4] 本稿では,新しい学習分析手法であるTransition Network Analysis(TNA)を提案する。
TNAはプロセスマイニングと確率グラフ表現を統合し、学習プロセスデータ内の遷移パターンをモデル化、視覚化、識別する。
今後の方向性には、-inter alia -- 推定方法の拡張、信頼性評価、縦断的なTNAの構築などが含まれる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:15:39 GMT)
Distribution Relationship of Quantum Battery Capacity [0.4] 量子電池の容量単体関係は一般のn量子ビットX状態にまで拡張される。
量子バッテリは、将来的には古典的バッテリを上回る大きな可能性を秘めていると考えられている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:38:58 GMT)
Swarm Characteristic Classification using Robust Neural Networks with Optimized Controllable Inputs [0.4] 本稿では,ディフェンダーによってトレーニングされたNNを最適にデプロイするフレームワークを提案する。
強化されたデータセットでトレーニングされた堅牢なNNは、分類精度が向上し、運用の柔軟性がもたらされることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:10:57 GMT)
Witness based nonlinear detection of quantum entanglement [0.3] 非線形絡み検出戦略が2つのコピーで絡み合う状態の絡みを検知できなかった場合、3つ以上のコピーが成功する可能性があることを示す。
また,両部類系における証人を用いた多部類絡みの検出や,絡み込み濃度の計測にも応用できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:55:06 GMT)
Can Text-to-Image Generative Models Accurately Depict Age? A Comparative Study on Synthetic Portrait Generation and Age Estimation [0.3] テキストから画像への生成モデルは、多種多様でフォトリアリスティックなアウトプットの生成において顕著な進歩を見せている。
本報告では,様々な属性を正確に表現した合成肖像画の作成において,それらの効果を包括的に分析する。
評価では、幅広い212の国籍、10歳から78歳までの30の異なる年齢、男女のバランスの取れた表現を含む詳細なプロファイルを規定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:08:33 GMT)
Underwater Soft Fin Flapping Motion with Deep Neural Network Based Surrogate Model [0.3] 本研究では、深部ニューラルネットワーク(DNN)に基づく代理モデルと強化学習(RL)を組み合わせることにより、フィン作動型水中ロボットの精密力制御のための新しい枠組みを提案する。
水中環境との複雑な相互作用と高い実験コストに対処するため、代理モデルがRLエージェントの効率的な訓練を可能にするシミュレータとして機能する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:57:53 GMT)
Dynamics of monitored SSH Model in Krylov Space: From Complexity to Quantum Fisher Information [0.3] クリャロフ空間における監視SSHモデルの無クリック極限から生じる非エルミートSSHモデルのダイナミクスについて検討する。
クリャロフ部分空間における状態の拡散に伴う複雑性の飽和時間スケールが測定速度によって増加することが判明した。
測定誘起遷移はクリロフ部分空間の一般化測度を用いて検出できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:29:03 GMT)
Beating the natural Grover bound for low-energy estimation and state preparation [0.2] 多体ハミルトニアンの基底状態エネルギーの推定は、量子物理学の多くの分野において中心的な課題である。
量子アルゴリズムは、任意の$k$-body Hamiltonian $H$を与えられた場合、基底状態エネルギーの見積もりを計算する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:37:43 GMT)
Conversation Routines: A Prompt Engineering Framework for Task-Oriented Dialog Systems [0.2] 本研究では,Large Language Models (LLMs) を用いたタスク指向対話システムの開発のための,構造化されたプロンプトエンジニアリングフレームワークである Conversation Routines (CR) を紹介する。
提案したCRフレームワークは,自然言語仕様による会話エージェントシステム(CAS)の開発を可能にする。
このフレームワークの有効性を,Train Booking SystemとInteractive Ticket Copilotという2つの概念実証実装を通じて実証する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:21:05 GMT)
Efficient Lindblad synthesis for noise model construction [0.2] 所望のゲート操作に同時に作用する物理ノイズ過程のリンドブラディアン記述から有効モデルを構築する雑音モデル構築法を提案する。
この理論は,Lindbladノイズとゲート操作との相互作用の洞察を与え,局所的なLindbladノイズがマルチキュービット誤差にどのように効果的に拡散するかを予測する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:59:03 GMT)
Context-Preserving Gradient Modulation for Large Language Models: A Novel Approach to Semantic Consistency in Long-Form Text Generation [0.2] 文脈的関連性に応じてパラメータ更新を動的に調整する新しい変調勾配法が導入された。
提案手法は,計算オーバーヘッドを著しく抑えることなく,モデル生成物語の安定性を向上させる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:13:06 GMT)
Discrete-time Competing-Risks Regression with or without Penalization [0.2] 競合イベントを用いた離散時間生存分析のための新しい推定手法を提案する。
PythonパッケージであるPyDTSは、提案されたメソッドに追加機能を適用するために利用できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:57:11 GMT)
Application of Analytical Hierarchical Process and its Variants on Remote Sensing Datasets [0.2] ガンガ川は地球上で最も重要な川流域の一つである。
大気汚染の重大な問題に直面しており、その脆弱性を効果的かつ標的とした修復努力のために評価することが不可欠である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:25:23 GMT)
A Kolmogorov metric embedding for live cell microscopy signaling patterns [0.2] 5-D $(x,yz, channel,time)$Live Cell Microscopy Filmsにおいて,細胞シグナルのパターンをキャプチャするメカニカル埋め込みを提案する。
この埋め込みは、物体間の情報内容の絶対測度であるコルモゴロフ複雑性理論に基づく正規化情報距離(NID)と呼ばれる距離を用いる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:46:09 GMT)
DILLEMA: Diffusion and Large Language Models for Multi-Modal Augmentation [0.1] 本稿では,大規模言語モデルと制御条件拡散モデルを活用した視覚ニューラルネットワークのテストフレームワークを提案する。
私たちのアプローチは、キャプションモデルを用いて画像から詳細なテキスト記述に変換することから始まります。
これらの記述は、テキストから画像への拡散プロセスを通じて、新しいテスト画像を生成するために使用される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:35:42 GMT)
PoleStack: Robust Pole Estimation of Irregular Objects from Silhouette Stacking [0.1] 複数のカメラポーズから収集したシルエット画像を用いて主軸回転子の回転極を推定するアルゴリズムを提案する。
低分解能画像を用いた極度推定精度を示し、表面のシャドーイングやセントロイドによる画像登録誤差に対して頑健さを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:06:33 GMT)
Prediction of the Most Fire-Sensitive Point in Building Structures with Differentiable Agents for Thermal Simulators [0.1] 火災安全は土木工学と機械工学における重要な研究分野である。
MFSP(Most Fire-Sensitive Point)は、火災が構造安定性に最も大きな影響を与える場所である。
本稿では,ニューラルネットワークを用いたMFSP予測のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:14:20 GMT)
VistaFlow: Photorealistic Volumetric Reconstruction with Dynamic Resolution Management via Q-Learning [0.0] VistaFlowは、2D写真の集合から完全にインタラクティブな3Dボリュームイメージを再構築できるスケーラブルなイメージング技術である。
VistaFlowは統合CPUグラフィックスで動作するため、モバイルやエントリーレベルのデバイスでも動作可能でありながら、高性能なレンダリングを実現することができる。
我々のモデルは、消費者ハードウェア上で毎秒100フレーム以上の解像度で1080pの解像度で、新しいビュー合成による最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:45:00 GMT)
Vibrationally Assisted Exciton Transfer in Open Quantum Systems with Long-Range Interactions [0.0] 本研究では,長距離相互作用量子ビットを持つフレンケル・エクシトンモデルと減衰集合ボソニックモードを結合して振動アシスト移動過程を解析する。
特定非局在励起状態が移動速度を最大化し, 消散移動中に絡み合いが保たれることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:40 GMT)
Variations on the Expectation Due to Changes in the Probability Measure [0.0] 予測に使用される確率測度の変化により、所定の関数の期待の変化に対して閉形式表現が提示される。
彼らはギブスの確率測度、相互情報、そしてラウテン情報との興味深いつながりを明らかにした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:56:28 GMT)
Validity condition for high-fidelity Digitized Quantum Annealing [0.0] 我々は,高忠実度デジタルアディバティックタスクに対する有効条件を開発する。
このようなハイブリッドモデルの性能は、断熱的妥当性に関する基本的な制約によって制限されていることを示す。
提案手法により,最適なディジタル回路のためのスズキ・トロッターブロック数のスケーリングの存在を説明できる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:57:39 GMT)
Using sensitive data to de-bias AI systems: Article 10(5) of the EU AI Act [0.0] 2024年6月、EU AI法が施行された。この法律には、AIシステムの提供に関する義務が含まれている。
AI法第10条には、プロバイダがデータセットのトレーニング、検証、テストが一定の品質基準を満たすかどうかを評価するための新たな義務が含まれている。
この論文は主に欧州連合の法律に関するものであるが、政策立案者はAIシステムの偏見を規制することを目的としているため、世界の他の地域では関係がある可能性がある。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:55:22 GMT)
Ultrafast All-Optical Measurement of Squeezed Vacuum in a Lithium Niobate Nanophotonic Circuit [0.0] 我々は、集積フォトニクスにおける量子状態トモグラフィーを実現し、ナノフォトニクス回路における圧縮真空の生成と全光学ウィグナートモグラフィーを実証する。
我々は分散工学を用いてフェムト秒パルスの歪みのない伝播を可能にし、超広帯域動作帯域を実現する。
室温統合プラットフォームにおける全光学超高速量子情報処理を実現するためのコースを図示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:11:10 GMT)
Type 2 Tobit Sample Selection Models with Bayesian Additive Regression Trees [0.0] 非線形性およびモデル不確実性を考慮したタイプ2Tobitサンプル選択モデルを拡張した。
我々は、シミュレーション研究と、RAND Health Insurance Experimentデータセットへの応用を含む。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:41:40 GMT)
Traversable AdS Wormhole via Non-local Double Trace or Janus Deformation [0.0] 本稿では,一対のCFTのジャヌス変形と非局所二重トレース変形を,可逆性AdSワームホールのCFT双対を構成する2つの方法として検討した。
まず,2つのポアンカーAdS測地とBTZブラックホールを凝集させることにより,トラベル可能なワームホールの単純なモデルを構築した。
本稿では,2つの分離されたCFT間の二重トレース変形が,AdSワームホールの2点関数を再現可能であることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:03 GMT)
Transport coefficients of a low-temperature normal Fermi gas with contact interactions: an exact perturbative expansion [0.0] 短距離相互作用を持つフェルミ気体のせん断粘度, 熱伝導率, スピン拡散率を計算した。
我々は、前方散乱限界を超えた衝突振幅を計算するためにランダウ・サルペター方程式を拡張した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:11:52 GMT)
Transferring Graph Neural Networks for Soft Sensor Modeling using Process Topologies [0.0] 複数の植物にまたがるソフトセンサモデルの伝達学習のためのグラフニューラルネットワークアプローチを提案する。
単位演算はノード,ストリームはエッジ,センサは属性として埋め込まれる。
ソフトセンサーモデルを、異なるトポロジを持つ未確認のプロセスに転送することに成功しました。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:10:22 GMT)
Thetacrypt: A Distributed Service for Threshold Cryptography [0.0] Thetacryptは多くのしきい値スキームをひとつの言語に統合するための汎用ライブラリである。
しきい値暗号を使って分散システムを簡単に構築する方法を提供する。
このライブラリには、暗号、シグネチャ、ランダムネス生成にまたがる6つの暗号スキームが含まれている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:03:59 GMT)
Thermodynamics of free bosons and fermions in the hyperball [0.0] 多くの粒子系は、量子論においてよく知られた計算問題を引き起こす。
球面ポテンシャル箱内の有限個の粒子 N, ボソンあるいはフェルミオンのケースに対処する。
我々は、エネルギー固有値のソートとともに、システムにシェル構造を与える、明確に定義された角運動量を持つ粒子を扱う。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:50:07 GMT)
The anomalously slow dynamics of inhomogeneous quantum annealing [0.0] 我々は、単に熱力学ではなく、IQAの力学を研究し、相図が示唆するよりもかなり遅いことを発見した。
さらに、非平均場モデルでは、一階遷移は非常に一般的であることが示される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:04 GMT)
The Role of Mobile and Social Media Services in Enhancing Freedom of Expression: Opportunities, Challenges, and Prospects for Local Platform Development in Uganda's Digital Ecosystem [0.0] 本研究では、ソーシャルメディアプラットフォームが公共の言論、アクティビズム、市民参加にどのように影響を与えるかを研究するために、混合手法を用いた。
研究はさらに、規制改革、デジタルリテラシーへの投資、持続的かつ文化的に関連のあるプラットフォームを開発するための協力的な取り組みに対する重要な必要性を明らかにした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:19:58 GMT)
The Performance Of The Unadjusted Langevin Algorithm Without Smoothness Assumptions [0.0] 本稿では,Langevinをベースとしたアルゴリズムを提案する。
対象分布へのアルゴリズムの収束に関する漸近的でない保証を導出する。
非漸近距離は、アルゴリズムをバウンダリとして性能するためにも提供される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:55:54 GMT)
The Klein-Gordon equation with relativistic mass: a relativistic Schrödinger equation [0.0] 自由粒子に対するクライン=ゴルドン方程式が非相対論的極限におけるシュリンガー方程式となることを示す。
このクライン=ゴルドン方程式は、ある種の相対論的シュル「オーディンガー方程式」であると主張することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:17:44 GMT)
The Feynman-Kac formula in deformation quantization [0.0] 本稿では,変形量子化プログラムにおけるFeynman-Kac公式を紹介する。
任意の所定の物理系の基底状態エネルギーは、ハミルトン作用素の指数星の位相空間積分の極限から得られる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:18:28 GMT)
The Ensemble Kalman Update is an Empirical Matheron Update [0.0] Ensemble Kalman Filter (EnKF) は高次元システムにおけるデータ同化法として広く用いられている。
本稿では,EnKF のアンサンブル更新ステップが,ガウス過程回帰の研究で人気の Matheron 更新の実証版と等価であることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:20:08 GMT)
The Adoption of Artificial Intelligence in Different Network Security Concepts [0.0] 信頼性の高いネットワークセキュリティのために、自動監査とインテリジェントな報告戦略の必要性が高まっている。
この研究の目的は、最近ネットワークセキュリティの分野で使われている人工知能の最も顕著な手法を提示し、議論することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:32:46 GMT)
TableMaster: A Recipe to Advance Table Understanding with Language Models [0.0] TableMasterはレシピと包括的なフレームワークで、これらの障害を克服するために複数のソリューションを統合する。
WikiTQデータセットでは、GPT-4o-miniを使用して78.13%の精度を達成し、既存のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:39:05 GMT)
Structured Token Retention and Computational Memory Paths in Large Language Models [0.0] 本稿では,文脈的重要性に基づいてトークンの永続化を動的に調整する確率的選択フレームワークを提案する。
階層的なメモリ割り当てによって拡張され、トークン埋め込みの構造化された再配置によって保持効率を向上する。
STRとCMPのオープンソースモデルへの統合は、構造化メモリ保持手法の適応性を示している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:59:22 GMT)
Stabilizer Entropy and entanglement complexity in the Sachdev-Ye-Kitaev model [0.0] 本研究では,SYK4+SYK2モデルの基底状態および高励起状態における安定化器R'enyiエントロピー(SRE)と絡み合いエントロピーの相互作用について検討した。
SYK4 は実際には絡み合いと非安定化資源の両方の複雑なパターンによって特徴づけられるが、SYK2 は非普遍的で複雑ではない。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:32:59 GMT)
Spontaneous Torque on an Inhomogeneous Chiral Body out of Thermal Equilibrium [0.0] 真空中の不均一体は、その環境と熱平衡がなければ自発的な力を受ける。
通常の(相互に)材料で作られた物体に対して2次に力が発生する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:26:21 GMT)
Sovereign Large Language Models: Advantages, Strategy and Regulations [0.0] 本報告では,世界規模のLarge Language Models(LLM)開発に関連する重要なトレンド,課題,リスク,機会について分析する。
LLMの開発における全国的な経験を調査し、この分野への投資の可能性を評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:16:58 GMT)
Solar Panel Mapping via Oriented Object Detection [0.0] 本研究では、個々のソーラーパネルを検出するためのエンドツーエンドのディープラーニングフレームワークを提案する。
本稿は,米国全土から収集した多種多様な太陽光発電プラントについて評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:19:37 GMT)
Simplifying Formal Proof-Generating Models with ChatGPT and Basic Searching Techniques [0.0] 本稿では,ChatGPTと基本探索技術を統合し,形式的証明の簡易化について検討する。
私たちはChatGPTのような大きな言語モデルとLeanのような形式的な言語を組み合わせることで、検証可能なメリットが加わり、形式的な証明生成の効率性とアクセシビリティが向上することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:21:10 GMT)
Shortcuts to adiabaticity in open quantum critical systems [0.0] 我々は, 量子臨界系における反断熱駆動による断熱性(STA)のショートカットについて検討した。
ここで研究した反断熱的プロトコルは、多体オープン量子系におけるSTAを理解する上で、基本的な重要性があると考えている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:11:46 GMT)
Shortcuts to Analog Preparation of Non-Equilibrium Quantum Lakes [0.0] 外部の駆動によって平衡からさらに外れると、量子湖の準備が大幅に加速する。
もともとは陸地を目標に設計されていた反断熱運転技術は、自然に湖を標的にしている。
後者の場合、固定レーザーパワーにおいて、ほぼ一桁のオーダーで準備を加速するシーケンスを構築する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:00 GMT)
Self-testing in prepare-and-measure scenarios and a robust version of Wigner's theorem [0.0] 我々は,ある相手が既知次元の量子状態のD$を信頼できない装置で準備した通信シナリオを,別の相手に送信する。
我々は、基準純量子状態のアンサンブルに対して、そのような準備と測定のシナリオが1つ存在し、観測確率に対して線形汎関数が$W$であることを証明する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:58:08 GMT)
Scientometric Analysis of the German IR Community within TREC & CLEF [0.0] ドイツ情報検索コミュニティが2000年から2022年までの検索キャンペーンであるテキスト検索会議(TREC)と評価フォーラム会議・ワークショップ(CLEF)に与える影響を分析した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:53:42 GMT)
Rule-based Evolving Fuzzy System for Time Series Forecasting: New Perspectives Based on Type-2 Fuzzy Sets Measures Approach [0.0] 実世界のデータは、ランダム性として知られる外部変数と相関できる不確実性や変動を含んでいる。
このタイプのデータを扱う既存の方法の1つは、進化しているファジィシステム(eFS)を使用することである。
ePL-KRLS-FSM+は,ファジィ論理と参加型学習(PL)を組み合わせ,ファジィ集合(FS)へのデータ変換を行うファジィモデリング手法である。
この改善により、データの不確実性をよりよく扱うためのタイプ2ファジィセットの作成と測定が可能になり、より精度の高いカオスデータを予測できるモデルを生成することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:27:20 GMT)
Revealing the Learning Process in Reinforcement Learning Agents Through Attention-Oriented Metrics [0.0] トレーニング中のRLエージェントの注意力の発達を調査するために、注意指向メトリクス(ATOM)を導入する。
ATOMは、各ゲームのバリエーションに基づいて訓練されたエージェントの注意パターンを明確化し、これらの注意パターンの違いはエージェントの行動の違いに変換する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:03:05 GMT)
Reducing Information Overload: Because Even Security Experts Need to Blink [0.0] コンピュータ緊急対応チーム(CERTs)は、セキュリティ関連の情報量の増加を処理しようとする課題に直面している。
この研究は、自動情報統合のための最適なアプローチを特定するために、5つのセキュリティ関連データセットにクラスタリングアルゴリズムと埋め込みモデルを組み合わせた196の組合せを評価する。
クラスタリングにより、セマンティックコヒーレンスを維持しながら、情報処理の要求を90%以上削減できることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:39 GMT)
Randomness, exchangeability, and conformal prediction [0.0] ランダムネス予測や交換可能性予測など、新しい種類の信頼予測を導入している。
主な結果は、両者が共形予測器に近く、ランダムネス予測と共形予測の差を定量化することを意味する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:21:56 GMT)
Randomized measurements for multi-parameter quantum metrology [0.0] 純状態における任意の数のパラメータを推定する際に,ランダム化測定がほぼ最適に動作することを示す。
ほぼ最適性は、3種類の混合状態に対するパラメータの最大数を推定する際にも示される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:04 GMT)
Quantum theory of surface lattice resonances [0.0] 表面格子共鳴(SLR)として知られる面内回折モードは、面内回折モードとして高いQ$を生じる。
SLRがナノ粒子アレイと集合振動モードの結合をいかに促進するかを示す。
我々の研究は、量子エミッタを用いてSLR現象を厳密にモデル化するためのシームレスなフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:47:07 GMT)
Quantum State Preparation via Nested Entanglement [0.0] 我々は、ネストした絡み合いの連続として状態ベクトルをパラメータ化するn-qubitレジスタの表現を開発する。
また、純粋な状態分離性を簡単に扱える。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:03:05 GMT)
Pulse engineering via projection of response functions [0.0] 本稿では,最適忠実度を持つ所望の演算の実装を目的とした,量子システムの反復最適制御法を提案する。
方法の更新ステップは、制御演算子に対する忠実度の線形応答と、対応する演算子のモード関数への投影に基づく。
このアプローチを実証し、2つの量子ビット上の量子ゲートの例のように標準のGRAPEアルゴリズムと比較し、生成したプロトコルの収束性と最適忠実度を明確に向上することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:58:44 GMT)
Probing the nonclassical dynamics of a quantum particle in a gravitational field [0.0] 量子力学において、粒子の時間進化はシュル「オーディンガー方程式」によって与えられる。
干渉計における量子粒子に対する非対称質量配置の影響を計測する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 00:15:01 GMT)
Probing hidden topology with quantum detectors [0.0] 静的Unruh-DeWitt検出器の遷移速度を2$ (2+1)$Dのブラックホール時空で考える。
検出器の遷移速度が2つの時空を区別していることが数値的に示される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:06:04 GMT)
Predicting Future States with Spatial Point Processes in Single Molecule Resolution Spatial Transcriptomics [0.0] 我々はXGboostをベースとしたパイプラインを導入し,胚発生過程におけるショウジョウバエ後部 (AP) および背側-腹側 (DV) 軸における Sog-D 遺伝子 (活性細胞) によって発現される細胞の将来の分布を予測する。
XGboost モデルを用いて, 胚発生の各段階における細胞状態と連動して, リプリーのK-関数を含む空間的点過程を時間的に解決し, 活性細胞分布の予測精度を推定した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:29:46 GMT)
Polarization entanglement and qubit error rate dependance on the exciton-phonon coupling in self-assembled quantum dots [0.0] マイクロピラーキャビティに埋め込まれた量子ドット放射カスケードによって放出される偏光絡み合った光子対について理論的に検討する。
フォノン結合は2つの励起子状態間の交差結合と同様に1光子と2光子の不整合過程を導入することを示す。
フォノンを介する結合とアクスタークシフトと多光子放出は高温での絡み合いを著しく低下させることが示されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:52:43 GMT)
Planning vs Reasoning: Ablations to Test Capabilities of LoRA layers [0.0] 低ランク適応層は効率的なモデル微調整のための有望なアプローチとして現れている。
本稿では,LoRA層が推論・計画能力の向上に有効かどうかを考察する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:01:29 GMT)
Physically consistent predictive reduced-order modeling by enhancing Operator Inference with state constraints [0.0] 本稿では,減階モデル予測に状態制約を埋め込むことにより,演算子推論を高速化する新しい手法を提案する。
シャル燃焼への適用として, 提案手法が安定性と精度に関する他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:33:31 GMT)
Permanent oscillations and solitary wave behavior in flatband Heisenberg quantum spin systems [0.0] 我々は、フラットバンドのハイゼンベルク量子スピン系において、絶え間なく進化する孤立波が出現することを示す。
この現象は、ハバード系と同様に、1次元、2次元、3次元の様々なフラストレーションされたスピン系に対して比較的一般的なものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:32:16 GMT)
Partitioned Neural Network Training via Synthetic Intermediate Labels [0.0] GPUメモリの制約は、そのような巨大なモデルをトレーニングする上で、注目すべきボトルネックになっている。
この研究は、モデルをGPU間で分割し、個々のセグメントをトレーニングするために合成中間ラベルを生成することを提唱する。
このアプローチは、モデル精度を維持しながらデータ通信を最小限に抑える、より効率的なトレーニングプロセスをもたらす。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:27:50 GMT)
Page Curve and Entanglement Dynamics in an Interacting Fermionic Chain [0.0] 我々は、強い相関を持つスピンレスフェルミオンのモデルにおいて、フォン・ノイマンエントロピーのそのようなページ様挙動を考察する。
相互作用の存在下では、スケーリング解析は熱力学限界における非解析性の非ゼロ臨界時間を与える。
本報告では,これらの知見を物理画像で説明する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:22:48 GMT)
PRISM: Perspective Reasoning for Integrated Synthesis and Mediation as a Multi-Perspective Framework for AI Alignment [0.0] Perspective Reasoning for Integrated Synthesis and Mediation (PRISM)は、AIアライメントにおける永続的な課題に対処するフレームワークである。
PRISMは道徳的懸念を7つの「基本世界観」にまとめ、それぞれが人間の道徳的認知の異なる次元を捉えていると仮定している。
現実の展開や形式的検証など,今後の方向性を概説するとともに,マルチパースペクティブな合成とコンフリクトの仲介に重点を置きながら,今後の方向性を概説する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 02:13:57 GMT)
Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions [0.0] ダイアグラムは、ビジネスドキュメント内の複雑な関係やプロセスを視覚的に伝達する上で重要な役割を担います。
近年の視覚言語モデル(VLM)の様々な画像理解タスクの進歩にもかかわらず、図中の構造を正確に識別し抽出することは大きな課題である。
本研究では,VLMの視覚認識能力への依存を回避し,テキスト駆動型アプローチを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:40:26 GMT)
OrderFusion: Encoding Orderbook for Probabilistic Intraday Price Prediction [0.0] OrderFusionと呼ばれる符号化手法を提案し,階層型マルチクエンタリーヘッドを設計する。
ヘッドは中央の量子化をアンカーとして設定し、複数の量子化を階層的に予測し、非負の関数を通して量子化の間の単調性を強化することによって信頼性を確保する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:37:21 GMT)
Optimizing Electric Vehicles Charging using Large Language Models and Graph Neural Networks [0.0] 従来の最適化手法と強化学習アプローチは、しばしばリアルタイムEV充電の高次元性と動的性質に苦しむ。
本研究では,Large Language Models (LLMs) とGraph Neural Networks (GNNs) を組み合わせることで,従来のEVスマート充電法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:00:51 GMT)
Operational simultaneous correlations in complementary bases of bipartite states via one-sided semi-device-independent steering [0.0] 両立状態において, 相互に偏りのない2つのベースにおける同時相関の尺度は, 片側半デバイス非依存のステアリングを示すものとして, 操作的に識別可能であることを示す。
2ビットのベル対角状態の場合、片側半デバイス非依存のステアビリティの定量化は、相互に偏りのない基底における相互相関の情報理論的定量化の操作的定量化を提供する。
本研究では,2量子状態の相補的基底における同時相関の操作的特性を,一方の半デバイス非依存的ステアビリティによって解析し,量子ステアリング楕円体を定式化する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:47:47 GMT)
Observation of slow relaxation due to Hilbert space fragmentation in strongly interacting Bose-Hubbard chains [0.0] 本研究では1次元Bose-Hubbardシステムについて実験的に検討した。
分子動力学では, シンロンとダブルロンの数が保存され, 観察された緩やかな緩和のメカニズムとしてHSFが示唆された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:52:58 GMT)
OPTIC: Optimizing Patient-Provider Triaging & Improving Communications in Clinical Operations using GPT-4 Data Labeling and Model Distillation [0.0] 本研究は, 医師の作業量削減と患者と患者とのコミュニケーション改善を目的とした, メッセージトリアージのための効率的なツールの開発を目的とする。
我々は,データラベリングにGPT-4,モデル蒸留にBERTを利用する強力なメッセージトリアージツールOPTICを開発した。
BERTモデルは、GPT-4ラベルで検証されたテストセットで88.85%の精度を達成し、感度は88.29%、特異性は89.38%、F1スコアは0.8842である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:49:34 GMT)
Non-equilibrium thermodynamics of gravitational objective-collapse models [0.0] 重力関連崩壊機構として最も広く研究されているDi'osi-Penrose(DP)モデルにおけるエントロピー生成について検討した。
以上の結果から,元のDPモデルが熱力学の第二法則と一致する熱力学を誘導することが明らかとなった。
対照的に、散逸性拡張は低散逸強度の状態で物理的に一貫した熱化を達成する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:47:41 GMT)
Mining Unstructured Medical Texts With Conformal Active Learning [0.0] 構造化されていないテキストからデータをマイニングするためのフレキシブルで効率的なフレームワークを提案する。
我々のフレームワークは,200文字のテキストを手作業でラベル付けすることで,高いパフォーマンスを実現している。
本手法は,リアルタイム疫学モニタリングに対する実用的で,スケーラブルで,プライバシを重視したアプローチを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:59:15 GMT)
MedBioLM: Optimizing Medical and Biological QA with Fine-Tuned Large Language Models and Retrieval-Augmented Generation [0.0] 本稿では,ドメイン適応型バイオメディカル質問応答モデルであるMedBioLMを紹介する。
MedBioLMは、微調整および検索拡張生成(RAG)を統合することで、ドメイン固有の知識を動的に組み込む。
微調整はベンチマークデータセットの精度を大幅に向上する一方、RAGは事実整合性を高める。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:58:35 GMT)
Measuring Social Biases in Masked Language Models by Proxy of Prediction Quality [0.0] トランスフォーマーモデルは、様々な自然言語タスクに対して最先端のパフォーマンスを達成したが、望ましくないバイアスを符号化することが示されている。
本研究では,トランスフォーマーモデルの予測の質を評価するために,提案するプロキシ関数を用いて,マスク付き言語モデリングの目的を訓練したトランスフォーマーによって符号化された社会的バイアスを評価する。
我々は,すべてのモデルが社会的偏見をエンコードしているのを見出した。ベンチマークデータセットを用いた他の評価手法による偏見推定と比較する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:10:58 GMT)
Measurement time of weak measurements on large entangled systems [0.0] 純粋に弱い測定によって重要な結果を再現できることが示される。
この結果は、自然に弱い測定が全ての物理測度の基礎にあるという仮説の自己整合性を裏付けるものである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:07:22 GMT)
Luminescence thermometry based on photon emitters in nanophotonic silicon waveguides [0.0] 本研究では, ナノフォトニックシリコン導波路に直接集積されたエルビウムエミッタの発光を測定する方法を提案する。
測定間隔は, 最低温度で0.04(1)Kから, 環境条件で6(1)Kまで, 測定精度が得られた。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:39:54 GMT)
Lowering the Barrier of Machine Learning: Achieving Zero Manual Labeling in Review Classification Using LLMs [0.0] 本稿では,大規模言語モデル(LLM),特にGPT(Generative Pre-trained Transformer)とBERT(Bidirectional Representations from Transformers)を統合したアプローチを提案する。
提案手法は,手動ラベリングやチューニングやデータアノテーションの専門知識,あるいは相当量の計算能力を必要とせず,高い分類精度を維持している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:31:54 GMT)
Learning to Identify Conflicts in RPKI [0.0] 我々は、インターネット規模で良性紛争をホワイトリスト化するための新しいメカニズム、LOVを紹介した。
LOVによるライブBGP更新を半年で測定し,52,846ルートを良質な起点誤差で検索した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:16:44 GMT)
Knowledge Distillation from Large Language Models for Household Energy Modeling [0.0] 本稿では,大規模言語モデルをエネルギーモデルに統合し,現実的で文化的に敏感な行動特化データを生成することを提案する。
「四段階の方法論は、文化的なニュアンスな活動、現実的な天候範囲、異なるエネルギーシグネチャを含む文脈的日常生活データを合成する」
得られたデータセットは、文化的、気候的、行動的要因がどのようにして炭素排出量を形成するかについての洞察を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:43:14 GMT)
Jet evolution in a quantum computer: quark and gluon dynamics [0.0] 量子シミュレーションアルゴリズムを用いて, クォーク・グルーオンプラズマ中のSU(3)粒子の伝播について検討した。
量子シミュレーターを用いて得られた結果は、アルゴリズムがパルトン伝播をうまくシミュレートすることを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:23:25 GMT)
Investigating generalization capabilities of neural networks by means of loss landscapes and Hessian analysis [0.0] 本稿では,新たに改良されたPyTorchライブラリLoss Landscape Analysis(LLA)を用いたニューラルネットワーク(NN)の一般化機能について検討する。
LLAは、NN Hessianの特性とともに、損失景観の可視化と解析を容易にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:24:13 GMT)
Integrating automatic speech recognition into remote healthcare interpreting: A pilot study of its impact on interpreting quality [0.0] 本稿では,遠隔医療における音声認識(ASR)が品質の解釈に与える影響について,パイロット研究の結果について報告する。
4人のインタプリタと中国語と英語の組み合わせを含む。
予備的なデータは、ASR、特に完全なASR転写文字と、ASRに基づくChatGPT生成サマリへのアクセスが有効であることを示し、効果的に解釈品質を改善した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:17:29 GMT)
Impact of time-retarded noise on dynamical decoupling schemes for qubits [0.0] 本稿では,時間的フィードバックを伴って,幅広い現実的なノイズ源について検討する。
DDは、キュービット演算のデコヒーレンスを抑制するための最も単純かつリソース集約的な手法の1つである。
DDスキームについて、ラムゼー列の1つの量子ビットのプルースとハーンエコー(HE)列を含まない動力学についても検討した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:38:52 GMT)
Immersion for AI: Immersive Learning with Artificial Intelligence [0.0] この研究は、人工知能(AI)の観点から、Immersionが意味するところを反映している。
没入型学習理論のレンズを適用して、この新しい視点が認知生態学におけるAIの関与の方法をサポートするかどうかを理解する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:51:02 GMT)
Hanbury Brown and Twiss interference of electrons in free space from independent needle tip sources [0.0] 2本のレーザートリガー針先端を独立電子源とする自由空間における2電子干渉について検討した。
電子のフェルミオンの性質とスピン配置を考慮した量子パス形式における2電子干渉パターンを計算する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:11:57 GMT)
Global Counterfactual Directions [0.0] 拡散オートエンコーダの潜時空間は,大域的方向の形で与えられた分類器の推論過程を符号化することを示す。
ブラックボックス方式で単一の画像のみを用いて2種類の方向を探索するプロキシベースの新しいアプローチを提案する。
我々は,GCDとLatent Integrated Gradientsを自然に組み合わせることで,新たなブラックボックス属性法を実現できることを示した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 07:46:13 GMT)
Genetic Algorithm with Border Trades (GAB) [0.0] 本稿では,境界貿易活動を通じて育種過程に新たな染色体パターンを組み込むことにより,大規模あるいは複雑な問題空間における遺伝的アルゴリズム(GA)の改善手法を提案する。
これらの戦略は染色体の多様性を高め、早期収束を防ぎ、解空間をより効率的に探索するGAの能力を高める。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:02:05 GMT)
Generic Hilbert Space Fragmentation in Kogut--Susskind Lattice Gauge Theories [0.0] 格子ゲージ理論のKogut--Susskind の定式化がヒルベルト空間の断片化を引き起こすことを示す。
我々の研究は、これらのモデルが量子色力学の熱化特性を推測するために忠実に使用できる条件のガイドとなる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:00:04 GMT)
Generalized Radial Uncertainty Product for d-Dimensional Hydrogen Atom [0.0] 本稿では,D次元非相対論的水素原子の位置空間における一般化された放射状不確かさ生成物の包括的解析を行う。
この結果は、量子不確実性関係における次元の役割とその高次元量子系への影響について深い洞察を与える。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:26:34 GMT)
Gain of squeezing via photon subtractions [0.0] 本研究では, 2,4,6 個の光子を減じて, 単モードの減圧真空状態よりも圧縮された減圧真空状態を生成する方法を開発した。
ビームスプリッターでのSMSV状態に加えて単一の光子を使用することで、測定誘起CV状態の実装が可能になる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:49:20 GMT)
Gain compression in Josephson Traveling-Wave Parametric Amplifiers [0.0] 4波混合プロセスに基づくジョセフソン走行波パラメトリック増幅器におけるゲイン圧縮の実験的検討を行った。
以上の結果から, 利得圧縮時にポンプの劣化が生じることが示唆されたが, TWPAの飽和に関与するメカニズムはそれだけではない。
本研究は、多重量子ビット読み出しやブロードバンド光子放出など、高い入力パワーを必要とするアプリケーションに対して、TWPAを最適化するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:25:35 GMT)
Finding Optimal Diverse Feature Sets with Alternative Feature Selection [0.0] 代替機能の選択を導入し、最適化問題として定式化する。
特に,制約によって代替品を定義し,利用者が代替品の数や相違を制御できるようにする。
本研究では,一定要素近似が一定の条件下で存在することを示し,対応する探索法を提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:50:40 GMT)
Estimating Appearance Models for Image Segmentation via Tensor Factorization [0.0] 本稿では,画像からの外観モデルを直接推定する手法を提案する。
本手法は,潜時変モデルに対するテンソル分解に基づく推定器への入力として,画像からの局所的な高次色統計値を用いる。
このアプローチは、マルチリージョン画像のモデルを推定し、事前のユーザインタラクションなしで自動的にリージョン比を出力することができる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:01:10 GMT)
Entropy Adaptive Decoding: Dynamic Model Switching for Efficient Inference [0.0] 本稿では,効率的な言語モデル推論のための新しいアプローチであるEntropy Adaptive Decoding (EAD)を提案する。
EADは予測の不確実性に基づいて、異なるサイズのモデル間で切り替える。
異なるモデルファミリー間で顕著な効率向上を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 22:15:21 GMT)
Enhancing Quantum Key Distribution with Entanglement Distillation and Classical Advantage Distillation [0.0] 本稿では, エンタングルメント蒸留と古典的有利蒸留を組み合わせた2段階蒸留方式を提案する。
提案手法は高雑音状態においても有限鍵レートを達成することを示す。
提案手法は、短期量子鍵分布タスクに適している。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:57:54 GMT)
Enhanced quantum magnetometry with a laser-written integrated photonic diamond chip [0.0] 本稿では,ダイヤモンドに埋設した高品位レーザー導波路を用いた量子磁気計測を行った。
導波管結合型窒素空孔中心は, 原始ダイヤモンド中の窒素空孔中心と同等のスピンコヒーレンス特性を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:57:52 GMT)
Enabling External Scrutiny of AI Systems with Privacy-Enhancing Technologies [0.0] この記事では、非営利のOpenMinedが開発した技術インフラが、センシティブな情報を妥協することなく、AIシステムの外部調査を可能にする方法について説明する。
実際には、外部の研究者は、セキュリティ、プライバシ、知的財産に関するAI企業の正当な懸念のために、AIシステムへのアクセスに苦労している。
OpenMinedが開発したエンドツーエンドの技術インフラは、いくつかのPETをさまざまなセットアップに統合し、AIシステムのプライバシー保護監査を可能にする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:31:11 GMT)
Elucidation of the Concept of Consciousness from the Theory of Non-Human Communication Agents [0.0] 本稿は、非人間コミュニケーションエージェント(ANHC)の関連性および後現象論から意識概念を解明することに焦点を当てる。
非人間的認知エージェントとの相互作用を基盤として、社会工学システムの説明可能性は、現代の哲学と科学の共通感覚に挑戦する。
目的は、ANHCの設計、規制、相互作用における現代の課題に対処するための倫理的かつ実践的なアプローチへの道を開く、新しい理解の枠組みを設計するための必要な議論に貢献することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:58:23 GMT)
Dynamical Landauer principle: Thermodynamic criteria of transmitting classical information [0.0] エネルギーと情報の伝達は自然の2つの重要な側面である。
最近の研究では、両者は密接に関連していることが示唆されているが、それらの間の定量的な等価性はまだ不明である。
我々は、異なるエネルギー伝達タスクによって、様々なワンショット古典的容量を束縛することで、この疑問に肯定的に答える。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:47:07 GMT)
Dynamical Landauer Principle: Quantifying Information Transmission by Thermodynamics [0.0] 古典的な情報の$n$ビットを伝送する量子力学の能力は、熱力学的タスクにおいて$n$のエネルギーを伝達する能力と等価であることを示す。
我々の発見は情報伝達とエネルギーの強い結びつきを明らかにする。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:00:27 GMT)
Driver Assistance System Based on Multimodal Data Hazard Detection [0.0] 本稿では,マルチモーダル運転支援システムを提案する。
道路状況映像、ドライバーの顔映像、音声データを統合して、インシデント認識の精度を高める。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 09:02:39 GMT)
Disentanglement of a bipartite system portrayed in a (3+1)D compact Minkowski manifold; quadridistances and quadrispeeds [0.0] 量子力学では、座標と線形運動量は任意の精度で同時に測定できないため、位相空間の軌跡は厳密には定義されない。
本稿では, 典型的な量子現象の速度と速度の定義と意味, 進化を4次元擬空間時間で表す場合の2部構造系のゆがみについて述べる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:17:34 GMT)
Disentanglement in dephasing channel with machine learning [0.0] 本稿では,2ビットシステムにおける雑音の除去を考慮した機械学習手法を提案する。
状態の分類と絡み合いに適したANNアルゴリズムは、トモグラフィー特徴のサブセットのみを用いて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 19:52:06 GMT)
Dirac fermions with electric dipole moment and position-dependent mass in the presence of a magnetic field generated by magnetic monopoles [0.0] 磁気単極子により生じる放射磁場の存在下で、電気双極子モーメント(EDM)と位置依存質量(PDM)によるディラックフェルミオンの有界解を決定する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:53:26 GMT)
Dichroic mirror pulses for optimized higher-order atomic Bragg diffraction [0.0] 原子干渉法における二色性ミラーパルスの実験的実現について述べる。
提案手法は、検出された干渉計出力に共鳴原子経路を選択的に反映する。
寄生虫の経路は鏡によって効率的に伝達され、関連する干渉計の出力に向けられません。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 16:57:55 GMT)
Detecting Strategic Deception Using Linear Probes [0.0] 我々は,線形プローブがモデルアクティベーションをモニタリングすることで,誤動作を確実に検出できるかどうかを評価する。
我々は,AUROCを0.96から0.999の精度で検出した。
全体として、ホワイトボックスプローブは将来の監視システムに期待できるが、現在の性能は詐欺に対する堅牢な防御として不十分である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:49:40 GMT)
DeepIFSAC: Deep Imputation of Missing Values Using Feature and Sample Attention within Contrastive Framework [0.0] 既存の欠落値計算法は、欠落率が高く、ランダムではない場合に有効ではない。
我々は、行と列の注意を機能間およびサンプル間の注意として用い、欠落した値を再構築する新しい枠組みを開発する。
実世界の電子健康記録を欠落した値で評価した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:29:09 GMT)
Deep Learning Pipeline for Fully Automated Myocardial Infarct Segmentation from Clinical Cardiac MR Scans [0.0] 本研究の目的は,脳梗塞のセグメンテーションを完全自動で行うディープ・ラーニング・ベースの手法を開発し,評価することである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:29:28 GMT)
Data denoising with self consistency, variance maximization, and the Kantorovich dominance [0.0] マルティンゲール最適輸送にインスパイアされたデータデノナイズのための新しいフレームワークを導入する。
このことは、データによって凸秩序に支配される領域内の測度間の分散を最大化することを意味する。
この修正された問題は全凸次数問題といくつかの特徴を共有しているが、安定性の向上、計算効率の向上、そして特定の領域においてより有意義な解を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 06:39:38 GMT)
Contextuality with Pauli observables in cycle scenarios [0.0] 文脈性は量子非古典性の基本的なマーカーである。
私たちは、コンテキストの振る舞いを示すことができる最も単純なシナリオである、サイクル計測シナリオに焦点を合わせます。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:51:32 GMT)
Constructions and decoding procedures for quantum CSS codes [0.0] 本稿では,Calderbank-Shor-Steane(CSS)符号を補正する量子誤りの新しい構成について述べる。
これらの符号は主にスローンの古典的な線形符号の組み合わせによって得られ、自己直交線形符号の場合に適用される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:00:46 GMT)
Constructing a fully homomorphic encryption scheme with the Yoneda Lemma [0.0] この論文は、Yoneda Lemmaの適用を通じて、非対称暗号の同型暗号システムの基盤を再定義する。
これは、ElGamal、RSA、Benaloh、RegevのLWE、NTRUEncryptといった広く採用されているシステムが、Yoneda Lemmaの原理から直接派生していることを示している。
この合成により、全体論的同型暗号化フレームワークである Yoneda Encryption Scheme が作成される。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:25:18 GMT)
Concept Based Explanations and Class Contrasting [0.0] 本稿では,概念に基づく説明手法を導入し,個々のクラスの予測と2つのクラスを対比する手法を提案する。
我々は、ImageNet1Kでトレーニングされたいくつかの分類モデルと、染色組織サンプルの腫瘍を検出する訓練されたセグメンテーションモデルでテストした。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:10:02 GMT)
Comparison of the Cox proportional hazards model and Random Survival Forest algorithm for predicting patient-specific survival probabilities in clinical trial data [0.0] コックス比例ハザードモデルはしばしば、ランダム化制御試験(RCT)における時間-時間結果のモデル開発に使用される。
ランダムサバイバルフォレスト(RSF)は、高い予測性能で知られている機械学習アルゴリズムである。
我々は,実世界とシミュレーションデータにおけるCox回帰とRCFの予測性能を比較するために,包括的中性比較研究を行う。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:26:43 GMT)
Certified Random Number Generation using Quantum Computers [0.0] 本稿では,現在の量子コンピュータが実用化にどのように活用できるかを考察する。
我々は量子力学で証明されたセキュアな乱数を生成する。
このプロトコルを既存の量子コンピュータに適用することにより、セキュアで半デバイスに依存しない乱数生成の実現可能性を示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:19:18 GMT)
Cavity engineering of solid-state materials without external driving [0.0] 光学キャビティ内での電磁界の収束は、キャビティ内に埋め込まれた量子材料と閉じ込められた光子場との間の光-物質結合を強化することができる。
本稿では, 現実的な光学キャビティ内に埋め込まれた固体材料の光-物質相互作用を記述するための理論的枠組み, 特にab initio法について述べる。
キャビティ内の材料特性を調整するための最先端の理論的提案について論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 13:45:59 GMT)
Causal Equal Protection as Algorithmic Fairness [0.0] 我々は、分類と因果的アプローチを組み合わせた、因果的平等保護という新しい原則を擁護する。
do-calculusでは、因果的平等保護は、個人が保護的または社会的に健全な特性のため、分類ミスの不均一なリスクを負わないよう要求する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:33:07 GMT)
Can Large Language Models Predict the Outcome of Judicial Decisions? [0.0] 大規模言語モデル(LLM)は自然言語処理(NLP)において例外的な機能を示す。
LLaMA-3.2-3B や LLaMA-3.1-8B を含む最先端のオープンソース LLM を様々な構成でベンチマークする。
本結果は,タスク固有のコンテキストにおいて,細調整された小型モデルが大規模モデルに匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:17:36 GMT)
Calibrated Unsupervised Anomaly Detection in Multivariate Time-series using Reinforcement Learning [0.0] 本稿では,自己エンコーダの潜伏空間における強化学習(RL)を用いた時系列データにおける教師なし異常検出について検討する。
我々はウェーブレット解析を用いて異常検出を強化し、時系列データを時間領域と周波数領域の両方に分解する。
我々は、合成異常を生成し、モデル内に教師付きフレームワークを埋め込むことで、決定境界を校正する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:02:40 GMT)
Brief analysis of DeepSeek R1 and its implications for Generative AI [0.0] DeepSeekは新しい推論モデル(DeepSeek R1)を2025年1月にリリースした。
本報告では、生成AI分野におけるモデルと、そのリリースの意味について論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:47:30 GMT)
Benchmarking Time Series Forecasting Models: From Statistical Techniques to Foundation Models in Real-World Applications [0.0] 時系列予測は、ホスピタリティ産業における運用インテリジェンスにとって不可欠である。
本研究では,14日間の地平線上での時間売上予測における統計,機械学習(ML),ディープラーニング,基礎モデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:30:31 GMT)
Automatic Prompt Optimization Techniques: Exploring the Potential for Synthetic Data Generation [0.0] 医療などの専門分野において、データ取得はプライバシー規制、倫理的配慮、可用性の制限による重大な制約に直面している。
大規模プロンプトベースモデルの出現は、保護されたデータに直接アクセスすることなく、合成データ生成の新しい機会を示す。
PRISMAガイドラインに従って, 自動プロンプト最適化の最近の展開を概観する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:13:03 GMT)
At the Mahakumbh, Faith Met Tragedy: Computational Analysis of Stampede Patterns Using Machine Learning and NLP [0.0] 本研究は,インドにおける集団宗教集会において,繰り返し発生する致死的切手について,機械学習,歴史的分析,自然言語処理(NLP)を用いて検討した。
プラヤグラージュの2025年の悲劇と1954年以前の悲劇に焦点を当てている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:27:29 GMT)
Applications of Random Matrix Theory in Machine Learning and Brain Mapping [0.0] 興味のある領域は、脳の機能領域間の相関を決定することである。
これは、脳がどのように機能しているかを判断し、疾患、障害、病気を検出するのに使用できる。
本稿では,Random Matrix Theory (RMT) が生成したアルゴリズムを機械学習(ML)のツールとして利用する方法について論じる。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:28:05 GMT)
An Empirical Exploration of ChatGPT's Ability to Support Problem Formulation Tasks for Mission Engineering and a Documentation of its Performance Variability [0.0] 本稿では,大規模言語モデル(LLM)の品質と整合性について考察する。
我々は、関連する参照問題、NASAの宇宙ミッション設計課題を特定し、ChatGPT-3.5のステークホルダ識別タスクの実行能力を文書化する。
LLMは人間の利害関係者の識別には有効であるが, 外部システムや環境要因の認識には不十分であることがわかった。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 17:58:23 GMT)
Advancing Reasoning in Large Language Models: Promising Methods and Approaches [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて著しく成功している。
複雑な推論スパンニング論理推論、数学的問題解決、コモンセンス推論、そして多段階推論を実行する能力は、人間の期待に届かない。
本調査は, LLMにおける推論向上技術に関する総合的なレビューを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 23:31:39 GMT)
AdaPhish: AI-Powered Adaptive Defense and Education Resource Against Deceptive Emails [0.0] AdaPhishはAIを利用してフィッシングメールを自動的に匿名化し分析するフィッシュボウルプラットフォームだ。
フィッシングトレンドの長期追跡を可能にしながら、新しいフィッシング戦術へのリアルタイム検出と適応を実現している。
AdaPhishは、フィッシング検出とサイバーセキュリティ教育のためのスケーラブルでコラボレーティブなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:17:19 GMT)
Achieving Operational Universality through a Turing Complete Chemputer [0.0] 化学のためのロボットプラットフォームに適用されたチューリング完全性の概念を利用する。
我々は,コンピュータによる計算可能性の概念を,自動合成機械による化学化合物の合成可能性に活用する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 04:06:32 GMT)
AI's Impact on Traditional Software Development [0.0] 人工知能(AI)の応用は、従来の戦術ソフトウェア開発に大きな変化をもたらした。
本稿では,従来のソフトウェア開発ライフサイクル方法論にAIを統合する技術的側面について考察する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:58:09 GMT)
A scale of conceptual orality and literacy: Automatic text categorization in the tradition of "Nähe und Distanz" [0.0] 言語的特徴により、概念的オリティーと識字率の尺度でテキストを評価できることが規定されている。
本稿では,PCAをベースとしたスケールを確立し,自動解析と組み合わせる。
このスケールは、コーパスコンパイルでの使用や、より大きなコーパスでの分析ガイドとしての利用についても論じられている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 15:08:37 GMT)
A primary quantum current standard based on the Josephson and the quantum Hall effects [0.0] アンペアの新しい定義では、基本電荷のフローを10〜8ドルという相対的な不確実性で制御できる量子電流標準が要求される。
本稿では,量子回路における量子標準と超伝導低温増幅器を組み合わせた新しいプログラム可能な量子電流発生器を提案する。
完全な量子計測により、生成した電流の精度をマイクロアンペア範囲で量子化値$pm(n/p)ef_mathrmJ$で示し、相対的不確かさは10~8$未満である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 10:35:55 GMT)
A Poisson Process AutoDecoder for X-ray Sources [0.0] Poisson Process AutoDecoder (PPAD) は、固定長遅延特徴を連続したPoissonレート関数にマッピングするニューラルネットワークデコーダである。
再建, 回帰, 分類, 異常検出実験によるPPADの有効性を実証した。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 03:49:39 GMT)
A Novel Zero-Touch, Zero-Trust, AI/ML Enablement Framework for IoT Network Security [0.0] 本稿では,現在のIoTエコシステムにおけるDDoS攻撃の検出,緩和,防止に有効なZero Trust,Zero Touch,AI/MLの統合に基づく,新たなフレームワークを提案する。
すべてのIoTトラフィック、固定およびモバイル5G/6GIoTネットワークトラフィック、データセキュリティのゼロ信頼を確立することで、新たな統合フレームワークに注力する予定である。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 21:03:07 GMT)
A Hybrid Blockchain-IPFS Solution for Secure and Scalable Data Collection and Storage for Smart Water Meters [0.0] 本稿では、ストレージ効率を最適化し、スループットを向上し、ブロック時間を短縮するために設計された、ハイブリッドブロックチェーンとIPFS(InterPlanetary File System)アプローチについて検討する。
スマートウォーターメーター(SWM)データを格納するために、基板ベースのプライベートブロックチェーンが開発された。
その結果、IPFSの統合はオンチェーンストレージの要求を大幅に削減し、ブロックサイズが小さくなり、スループットが向上し、ブロックチェーンのみのストレージと比較してブロック時間が改善された。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 18:16:02 GMT)
A Framework for Measuring the Quality of Infrastructure-as-Code Scripts [0.0] インフラストラクチャ・アズ・コード(IaC)は現代のソフトウェア開発に不可欠なものになっています。
IaCスクリプトの急速な普及は、より良いコード品質評価方法の必要性を強調している。
本稿では,リポジトリを基盤とする新しいIaCコード品質フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 12:36:19 GMT)
A Bootstrap-based Method for Testing Network Similarity [0.0] 本稿では,一致したネットワーク推論問題について検討する。
目的は、共通のノードセットで定義された2つのネットワークが、特定の類似性を示すかどうかを決定することである。
類似性の2つの概念は、 (i) 等価性、すなわち、ネットワークが同じランダムグラフモデルから生じるかどうかをテストすること、 (ii) スケーリング、すなわち、それらの確率が未知のスケーリング定数に対して比例するかどうかをテストすることである。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 14:12:34 GMT)
A Benchmark for the Detection of Metalinguistic Disagreements between LLMs and Knowledge Graphs [0.0] 本稿では,大規模言語モデル (LLM) と知識グラフ (KG) の事実的, メタ言語的相違を検出するためのベンチマークを提案する。
このようなベンチマークの概念の最初の証明はGithubで公開されている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 05:37:26 GMT)
A Bayesian perspective on single-shot laser characterization [0.0] 超高強度レーザーにおける固有時間結合(STC)を測定するためのベイズフレームワークを提案する。
パルス前傾と曲率に関する最初の定量的不確実性境界を提供する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 11:51:38 GMT)
(Neural-Symbolic) Machine Learning for Inconsistency Measurement [0.0] 本稿では、命題論理知識ベースに対する不整合(数値値)の次数を決定するための機械学習ベースのアプローチを提案する。
具体的には、不整合度が$incmi$と$incat$が命題論理知識ベースに割り当てる値を予測することを学習する回帰モデルとニューラルベースモデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 08:00:30 GMT)
(GG) MoE vs. MLP on Tabular Data [0.0] GG MoE は,Gumbel-Softmax ゲーティング関数を組み込んだ実験用混合モデルである。
MoEとGG MoEはいずれも,ニューラルネットワークよりもはるかに少ないパラメータを生かしている。
論文参考訳(メタデータ) (Wed, 05 Feb 2025 20:53:16 GMT)