Humanity's Last Exam [253.5] HumanityのLast Exam(HLE)は、人間の知識の最前線におけるマルチモーダルベンチマークである。
数学、人文科学、自然科学など、数十の科目にわたる2700の質問からなる。
各質問には、曖昧で容易に検証できる既知のソリューションがあるが、インターネット検索ではすぐには答えられない。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:12:25 GMT)
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation [105.5] 3D没入型シーン生成はコンピュータビジョンとグラフィックスにおいて難しいが重要な課題である。
Layerpano3Dは、単一のテキストプロンプトからフルビューで探索可能なパノラマ3Dシーンを生成するための新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:06:37 GMT)
Generalizing From Short to Long: Effective Data Synthesis for Long-Context Instruction Tuning [103.7] 本研究では,長期事前学習モデルの学習後段階の指導データを設計する方法について検討する。
制御された研究では、短い文脈で調整されたモデルが、より長いコンテキストに効果的に一般化できることが判明した。
これらの知見に基づいて,新しいデータ合成フレームワークであるコンテキスト合成を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:02:40 GMT)
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.8] 本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:54:09 GMT)
ESPnet-SpeechLM: An Open Speech Language Model Toolkit [98.5] 音声言語モデル(SpeechLMs)の開発を民主化するオープンツールキットであるESPnet-SpeechLMを提案する。
このツールキットは、音声処理タスクを普遍的な逐次モデリング問題としてフレーミングすることで標準化する。
ESPnet-SpeechLMを使用すると、ユーザーはタスクテンプレートを簡単に定義し、キー設定を設定することができ、シームレスで合理化されたSpeechLM開発が可能になる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:21:58 GMT)
MutaGReP: Execution-Free Repository-Grounded Plan Search for Code-Use [92.3] MutaGRePは、ユーザリクエストを、大規模なコードリポジトリにある自然言語ステップに分解する計画を探すためのアプローチである。
我々の計画では、GPT-4oの128Kコンテキストウィンドウの5%以下しか使用していませんが、GPT-4oのコーディング性能とレポジトリで満たされたコンテキストウィンドウに匹敵します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:58:17 GMT)
PIP-KAG: Mitigating Knowledge Conflicts in Knowledge-Augmented Generation via Parametric Pruning [92.1] Knowledge-Augmented Generation (KAG) は,Large Language Models (LLMs) の内部メモリの更新において,大きな可能性を秘めている。
これらの対立を緩和するための現在のアプローチは、主に外部知識の利用を改善することに焦点を当てている。
本稿では,LLMの内部知識を引き出すParametrIc Pruning-based Knowledge-Augmented Generation (PIP-KAG)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:50:41 GMT)
VaViM and VaVAM: Autonomous Driving through Video Generative Modeling [88.3] 本稿では,オープンソースの自動回帰ビデオモデル(VaM)とそのビデオアクションモデル(VaVAM)を紹介する。
オープンループ運転とクローズドループ運転のシナリオでモデルを評価したところ、ビデオベースの事前学習が自律運転の可能性を秘めていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:56:02 GMT)
TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba [88.3] 本稿では,既存のTransformerモデルの知識を,TransMambaと呼ばれる代替アーキテクチャのMambaに伝達するクロスアーキテクチャトレーニングについて検討する。
提案手法では,新しいマンバモデルの訓練を高速化し,ユニモーダルタスクおよびクロスモーダルタスクにおける有効性を確保するための2段階戦略を採用している。
クロスモーダル学習のために,言語認識をMambaの視覚的特徴に統合し,Mambaアーキテクチャのクロスモーダルインタラクション能力を向上するクロスマンバモジュールを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:22:01 GMT)
NaturalReasoning: Reasoning in the Wild with 2.8M Challenging Questions [86.2] NaturalReasoningは、複数のドメインにまたがる280万の質問からなる包括的なデータセットである。
本研究では,NaturalReasoningが強力な教師モデルから推論能力を効果的に引き出すことができることを示す。
また、外部報酬モデルや自己回帰を用いた教師なしの自己訓練にも有効である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:02:42 GMT)
ELIP: Enhanced Visual-Language Foundation Models for Image Retrieval [83.0] 本稿では,大規模な事前学習型視覚言語モデルの性能向上を目的とした新しいフレームワークを提案する。
このアプローチはELIP(Enhanced Language- Image Pre-training)と呼ばれ、テキストクエリを使って視覚的なプロンプトのセットを予測し、ViT画像エンコーディングを条件付ける。
ELIPは一般的なCLIP/SigLIPや最先端のBLIP-2アーキテクチャにも容易に適用できる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:57 GMT)
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.9] 我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:35:26 GMT)
R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge [78.3] マルチタスク大言語モデル(MTLLM)は、ユーザが複数のタスクを効率的に処理するための特殊なモデルを要求する無線エッジにおける多くのアプリケーションにとって重要である。
タスクベクトルによるモデル融合の概念は、MDLLMを生成するための微調整パラメータを組み合わせるための効率的なアプローチとして登場した。
本稿では,最悪の逆攻撃を前提として,エッジユーザがタスクベクトルを介して協調的にMTLMを作成できる問題について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:44:48 GMT)
Backdoor Attacks against No-Reference Image Quality Assessment Models via a Scalable Trigger [76.4] No-Reference Image Quality Assessment (NR-IQA) はコンピュータビジョンシステムの評価と最適化において重要な役割を果たしている。
近年の研究では、NR-IQAモデルが敵攻撃の影響を受けやすいことが示されている。
NR-IQA(BAIQA)に対する新規中毒性バックドアアタックを報告した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:51:06 GMT)
TETRIS: Optimal Draft Token Selection for Batch Speculative Decoding [76.2] TETRISは、(バッチ内のすべてのリクエストに対して)最も有望なドラフトトークンを積極的に選択する。
我々は,TETRISがベースライン投機的復号法およびドラフトトークンを動的に選択する既存手法より優れていることを理論的かつ実証的に示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:19:24 GMT)
ExpliCa: Evaluating Explicit Causal Reasoning in Large Language Models [75.1] 明示的な因果推論において,LLM(Large Language Models)を評価するための新しいデータセットであるExpliCaを紹介する。
ExpliCa上で7つの商用およびオープンソース LLM をテストしました。
驚くべきことに、モデルは因果関係と時間的関係を関連付ける傾向にあり、そのパフォーマンスはイベントの言語的順序にも強く影響される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:23:14 GMT)
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control [73.7] 最適制御(SOC)に基づく拡散ブリッジ統合フレームワークUniDBを提案する。
UniDBは、SOCベースの最適化を通じて問題を定式化し、最適制御器のための閉形式解を導出する。
Doobの$h$-transformを使った既存の拡散ブリッジが、我々のフレームワークの特別なケースであることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:01:36 GMT)
Protein Large Language Models: A Comprehensive Survey [71.7] タンパク質特異的な大規模言語モデル(Protein LLMs)は、より効率的なタンパク質構造予測、機能アノテーション、設計を可能にすることで、タンパク質科学に革命をもたらしている。
この作業は、アーキテクチャ、データセットのトレーニング、評価メトリクス、さまざまなアプリケーションをカバーする、Protein LLMの最初の包括的な概要を提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:22:10 GMT)
PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [69.7] 本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:57:53 GMT)
HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation [68.4] HealthGPTは医療用大規模視線モデル(Med-LVLM)である
医療的な視覚的理解と生成能力を統合された自己回帰パラダイムに統合する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:39:29 GMT)
A Universal Framework for Compressing Embeddings in CTR Prediction [68.3] 本稿では,事前学習した埋め込みを定量化することにより,埋め込みテーブルを圧縮するモデル非依存型埋め込み圧縮(MEC)フレームワークを提案する。
まず、高頻度特徴と低周波特徴のバランスをとるために、人気重み付け正規化を適用します。
3つのデータセットの実験により,提案手法はメモリ使用量を50倍以上削減し,レコメンデーション性能を維持・改善する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:12:34 GMT)
FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression [67.3] 本稿では、SC画像圧縮における3つの重要な課題として、コンパクトな潜時特徴の学習、量子化ステップのサイズの適応、大規模なSCデータセットの欠如について述べる。
適応量子化モジュールを導入し、各周波数成分のスケールした均一ノイズを学習し、量子化の粒度を柔軟に制御する。
SDU-SCICD10Kは,基本SC画像,コンピュータレンダリング画像,およびPCおよびモバイルプラットフォームからのNSとSCの混合画像にまたがる1万以上の画像を含む,大規模なSC画像圧縮データセットを構築した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:15:16 GMT)
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization [67.3] 量子化は大規模言語モデル(LLM)推論を高速化するための強力なツールであるが、異なるフォーマット間での精度と性能のトレードオフは依然として不明である。
FP8,INT8,INT4の量子化を学術ベンチマークや実世界のタスクで評価し,これまでで最も包括的な実証的研究を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:05:04 GMT)
WorldCraft: Photo-Realistic 3D World Creation and Customization via LLM Agents [67.3] 大規模言語モデル(LLM)エージェントがプロシージャ生成を利用してオブジェクトを集約したシーンを生成するシステムであるWorldCraftを紹介する。
本フレームワークでは,コーディネータエージェントが全体の処理を管理し,シーン作成を完了させるために2つの特殊なLLMエージェントと連携する。
パイプラインには軌道制御エージェントが組み込まれており、ユーザはシーンをアニメーション化し、自然言語による対話を通じてカメラを操作することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:18:30 GMT)
MMAD: A Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detection [66.1] 本稿では,産業異常検出における最初のフルスペクトルMLLMベンチマークであるMMADを提案する。
産業検査におけるMLLMの7つの重要なサブタスクを定義し,MMADデータセットを生成するための新しいパイプラインを設計した。
MMADを用いて,様々な最先端MLLMの包括的,定量的評価を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:50:45 GMT)
Data Formulator 2: Iterative Creation of Data Visualizations, with AI Transforming Data Along the Way [65.5] データフォーミュラ2(英: Data Formulator 2、略称DF2)は、AIを利用した可視化システムである。
DF2はグラフィカルなユーザインタフェースと自然言語入力をブレンドすることで、ユーザがより効果的にインテントを伝達できるようにする。
効率的なイテレーションをサポートするために、DF2はユーザがイテレーション履歴をナビゲートし、以前の設計を再利用する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:50:26 GMT)
Social Genome: Grounded Social Reasoning Abilities of Multimodal Models [61.9] ソーシャルゲノム(Social Genome)は、マルチモーダルモデルのきめ細かいきめ細やかな社会的推論能力を示す最初のベンチマークである。
相互作用の272のビデオと、これらの相互作用に関する推論に関連する1,486人の注釈付き推論トレースを含んでいる。
社会ゲノムはまた、社会的推論における外部知識を研究するための最初のモデリング課題である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:05:40 GMT)
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution [59.9] 画像超解像のための条件数に基づく低ビットポストトレーニング量子化であるCondiQuantを提案する。
CondiQuantは、計算オーバーヘッドを伴わずに、既存の最先端のポストトレーニング量子化手法よりも精度が高いことを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:04:30 GMT)
Refined Risk Bounds for Unbounded Losses via Transductive Priors [59.0] 線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。
我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:21:24 GMT)
Deriving Representative Structure from Music Corpora [58.7] 構造時間グラフ(STG)と呼ばれる音楽構造の統一的階層的メタ表現を提案する。
シングルピースの場合、STGは、より微細な構造的音楽的特徴の階層構造とそれらの間の時間的関係を定義するデータ構造である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:32:29 GMT)
CopyJudge: Automated Copyright Infringement Identification and Mitigation in Text-to-Image Diffusion Models [58.6] 自動著作権侵害識別フレームワークであるCopyJudgeを提案する。
我々は,多LVLM議論を伴う抽象フィルタ比較テストフレームワークを用いて,侵害の可能性を評価する。
これらの判断に基づいて、一般のLVLMに基づく緩和戦略を導入する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:09:07 GMT)
RIDE: Enhancing Large Language Model Alignment through Restyled In-Context Learning Demonstration Exemplars [57.7] 調整調整は、大きな言語モデル(LLM)が倫理的かつ有用な振る舞いを確実にするために不可欠である。
本稿では,LLMアライメントを向上させるために,ICL(In-context Learning)を用いた低コストでチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:14:33 GMT)
How Performance Pressure Influences AI-Assisted Decision Making [57.5] 我々は、プレッシャーと説明可能なAI(XAI)技術がAIアドバイステイク行動とどのように相互作用するかを示す。
我々の結果は、圧力とXAIの異なる組み合わせで複雑な相互作用効果を示し、AIアドバイスの行動を改善するか、悪化させるかのどちらかを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:29:55 GMT)
Hyperspherical Normalization for Scalable Deep Reinforcement Learning [57.0] SimbaV2は最適化を安定させるために設計された新しい強化学習アーキテクチャである。
57の連続制御タスクにおいて、より大きなモデルとより大きな計算で効果的にスケールアップし、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:17:24 GMT)
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation [56.9] 本稿では,多様な入力プロンプトから高品質な3次元形状とテクスチャを生成するための包括的枠組みを提案する。
フレームワークは3次元形状生成とテクスチャ生成で構成されている。
本報告では,フレームワークの改良と拡張に向けたシステムアーキテクチャ,実験結果,今後の方向性について述べる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:09:29 GMT)
Mind the Gap! Static and Interactive Evaluations of Large Audio Models [55.9] 大型オーディオモデル(LAM)は、音声ネイティブな体験をパワーアップするために設計されている。
本研究は,484名の参加者から,LAMを評価し,7,500名のLAMインタラクションを収集する対話的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:29:02 GMT)
Data Complexity Measures for Quantum Circuits Architecture Recommendation [55.7] 量子パラメトリック回路は、量子回路のサイズを減らす代替として構築される。
与えられた問題の最適回路を決定することは 未解決の問題です
本研究では,分類問題に対する量子回路レコメンデーションアーキテクチャを,データベースの複雑性尺度を用いて提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:17:24 GMT)
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2] 誤分類は、偽の盗作行為の告発や、オンラインコンテンツにおけるAIの普及に関する誤解を招く可能性がある。
我々は、AI-Polished-Text Evaluationデータセットを用いて、最先端の11のAIテキスト検出を体系的に評価した。
我々の発見によると、検出器は、最小限に磨き上げられたテキストをAI生成と誤分類し、AIの関与度を区別し、古いモデルと小さなモデルに偏見を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:45:37 GMT)
Network Resource Optimization for ML-Based UAV Condition Monitoring with Vibration Analysis [54.6] 条件監視(CM)は機械学習(ML)モデルを使用して異常および異常な条件を識別する。
本研究では,MLベースのUAV CMフレームワークにおけるネットワークリソースの最適化について検討する。
次元削減技術を活用することで、ネットワークリソース消費の99.9%が削減される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:36:12 GMT)
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces [54.4] 我々は完全なフィードバックの下でオンライン学習のためのトンプソンサンプリングの分析法を開発した。
我々は、後悔の分解を、学習者が先入観を期待したことを後悔させ、また、過度な後悔と呼ぶ先延ばし的な用語を示します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:40:21 GMT)
Generative Video Diffusion for Unseen Novel Semantic Video Moment Retrieval [54.2] ビデオモーメント検索(VMR)は、未トリミングビデオのテキストクエリに対応する最も可能性の高いビデオモーメントを見つけることを目的としている。
既存のメソッドのトレーニングは、多様で汎用的なVMRデータセットの欠如によって制限される。
生成的ビデオ拡散を探索するFVEと呼ばれる細粒度ビデオ編集フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:30:11 GMT)
Strategic priorities for transformative progress in advancing biology with proteomics and artificial intelligence [54.1] データ分析から新たな生物学的洞察に至るまで、AIがイノベーションを推進している重要な領域を強調します。
その中には、データ生成、共有、分析のためのAIフレンドリーなエコシステムの開発も含まれる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:20:33 GMT)
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives [52.9] 相反する研究目的は、過去10年間に敵対的堅牢性研究の進展を妨げてきた。
我々は、対立するアライメントの有意義な進展には、リアライメントの目的が必要であると論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:17:57 GMT)
Private Online Learning via Lazy Algorithms [52.8] 我々は,オンライン学習の問題,特に専門家によるオンライン予測(OPE)とオンライン凸最適化(OCO)について検討する。
遅延オンライン学習アルゴリズムをプライベートアルゴリズムに変換する新しい変換を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:22:52 GMT)
Approximate Differential Privacy of the $\ell_2$ Mechanism [52.6] 我々は、近似微分プライバシーの下で、$d$次元統計量と有界$ell$感度を計算するための$ell$メカニズムについて研究する。
プライバシパラメータの範囲で、$ell$メカニズムはLaplaceやGaussianのメカニズムよりも低いエラーを得る。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:56:34 GMT)
KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents [52.3] 大規模言語モデル(LLM)は複雑な推論タスクにおいて大きな可能性を証明していますが、より高度な課題に取り組むには不十分です。
この不適切さは、主に言語エージェントのアクション知識が組み込まれていないことに起因する。
我々は、明示的な行動知識を取り入れることで、LLMの計画能力を高めるために設計された新しいアプローチであるKnowAgentを紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:04:27 GMT)
LongCaptioning: Unlocking the Power of Long Caption Generation in Large Multimodal Models [52.1] 大規模マルチモーダルモデル(LMM)は,300語以上の出力を連続的に生成することが困難であることを示す。
複数レベルの記述を集約して長い字幕データを合成するフレームワークであるLongCaption-Agentを提案する。
またLongCaption-BenchはLMMが生成する長文キャプションの品質を評価するためのベンチマークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:40:23 GMT)
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.9] そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:52:39 GMT)
Testing the limits of fine-tuning to improve reasoning in vision language models [51.6] 視覚認知タスクにおける視覚刺激と人間の判断を導入し,認知領域間でのパフォーマンスを評価する。
我々は、直感的な物理と因果推論のために、地上の真理データに基づいてモデルを微調整する。
微調整は、他の視覚的特徴を持つデータや、他の認知領域におけるタスクに対する人間のような堅牢な一般化に寄与しない。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:58:30 GMT)
UrbanSAM: Learning Invariance-Inspired Adapters for Segment Anything Models in Urban Construction [51.5] 都市形態は本質的に複雑で、様々な形状と様々なスケールの不規則な物体がある。
Segment Anything Model (SAM) は複雑なシーンのセグメンテーションにおいて大きな可能性を示している。
本研究では,複雑な都市環境の分析に特化して設計されたSAMのカスタマイズ版であるUrbanSAMを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:25:19 GMT)
Multi-Agent Architecture in Distributed Environment Control Systems: vision, challenges, and opportunities [50.4] データセンターにおける空冷式シラーシステムの分散制御のためのマルチエージェントアーキテクチャを提案する。
私たちのビジョンでは、自律エージェントを使用して、ローカルな運用パラメータを監視し、規制し、システム全体の効率を最適化します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:41:03 GMT)
Empowering LLMs with Logical Reasoning: A Comprehensive Survey [49.9] 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な成功を収めた。
近年の研究では、LLMの論理的推論能力にはまだ大きな課題があることがわかった。
本稿では,主な課題を2つの側面にまとめ,分類する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:20:35 GMT)
Stepwise Informativeness Search for Improving LLM Reasoning [49.9] 最近の研究によると、Large Language Models (LLM) は長いコンテキストの途中で焦点を失う傾向にある。
より正確かつ簡潔なステップ・バイ・ステップの合理性を生成するために, LLM を導くことを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:39:27 GMT)
DarwinLM: Evolutionary Structured Pruning of Large Language Models [49.6] 本研究では,シズナ (sysname) を提案する。
sysnameはShearedLlamaを上回り、圧縮後のトレーニング中にトレーニングデータを5ドル以下で提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:41:48 GMT)
Multi-Agent Coordination across Diverse Applications: A Survey [48.8] 多様なマルチエージェントシステム(MAS)のトレンド拡散を可能にする基盤機構に関する研究
本調査は,4つの基本的な調整質問に答える統一的な理解を通じて,アプリケーション全体での協調研究の現状を概説する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:41:44 GMT)
PiCO: Peer Review in LLMs based on the Consistency Optimization [48.5] ピアレビュー機構を用いて,大規模言語モデル(LLM)を自動的に測定する。
制約付き最適化問題として定式化し、各LLMの能力とスコアの一貫性を最大化することを目的としている。
我々はPEN, CIN, LISという3つの指標を提案し, ランク付けのギャップを評価する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:33:26 GMT)
ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms [48.4] 単体テスト生成はLLMの有望かつ重要なユースケースとなっている。
ProjectTestは、Python、Java、JavaScriptをカバーするユニットテスト生成のためのプロジェクトレベルのベンチマークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:55:32 GMT)
Single-pass Detection of Jailbreaking Input in Large Language Models [48.4] 大規模な言語モデル(LLM)をジェイルブレイク攻撃から守ることは、難しい問題です。
我々は、単一のフォワードパスでジェイルブレイク入力を検出することに集中する。
我々の手法はSingle Pass Detection SPDと呼ばれ、ロジットが持つ情報を利用して、出力文が有害かどうかを予測する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:04:13 GMT)
Variational phylogenetic inference with products over bipartitions [48.3] 単一連鎖クラスタリングの合体時間に基づく新しい変分族を示し,木上の分布の閉形式密度を導出する。
我々の手法はすべての木空間に対して推論を行い、マルコフ連鎖モンテカルロ部分ルーチンは不要であり、我々の変分族は微分可能である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:06:57 GMT)
Pastiche Novel Generation Creating: Fan Fiction You Love in Your Favorite Author's Style [48.1] 文芸パスティッシュの中核的な側面を習得する新しい世代システムであるWriterAgentを提案する。
WriterAgentは、低レベルのスタイリスティックな熟達から高レベルの物語コヒーレンスまで、カリキュラム学習パラダイムを通じて訓練されている。
我々は、ハリー・ポッターやドリーム・オブ・ザ・レッドチェンバーといった多言語古典のWriterAgentを評価し、ベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:40:42 GMT)
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs [47.9] MIA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、複雑な命令に厳密に準拠する能力に基づいて評価するために設計されたベンチマークである。
私たちのベンチマークでは、400のイメージプロンプトペアで構成されており、それぞれが階層化された命令に対するモデルのコンプライアンスに挑戦するために作られています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:49:13 GMT)
Generalization Bounds via Meta-Learned Model Representations: PAC-Bayes and Sample Compression Hypernetworks [47.8] PAC-Bayesian と Sample Compress の学習フレームワークをメタ学習方式で使用する。
このアプローチの独創性は、パラメータを復号する前にデータセットをエンコードする調査されたハイパーネットワークアーキテクチャにあります。
後者の定理は、エンコーダ・デコーダ・ジャンクションで流れる重要な情報を利用して、各下流予測器の一般化保証を計算する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:23:17 GMT)
TimeDART: A Diffusion Autoregressive Transformer for Self-Supervised Time Series Representation [47.6] 我々は,新しい自己教師型時系列事前学習フレームワークであるTimeDARTを提案する。
TimeDARTは2つの強力な生成パラダイムを統合し、より伝達可能な表現を学ぶ。
時系列予測と分類のための公開データセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:00:55 GMT)
Self-Taught Agentic Long Context Understanding [47.2] AgenticLUは、ターゲットの自己明確化と文脈的接地を統合するために設計されたフレームワークである。
AgenticLUはNarrativeQAで97.8%の回答リコールを達成し、検索深度は最大3、分岐係数は8である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:29:36 GMT)
Textual-to-Visual Iterative Self-Verification for Slide Generation [47.0] 欠落したプレゼンテーションスライドを生成するタスクを,コンテンツ生成とレイアウト生成という2つの重要なコンポーネントに分解する。
提案手法は,アライメント,論理フロー,視覚的魅力,可読性の観点から,ベースライン手法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:21:09 GMT)
Adaptive Retrieval Without Self-Knowledge? Bringing Uncertainty Back Home [46.7] Retrieval Augmented Generation(RAG)は質問回答(QA)の正しさを改善し、Large Language Models(LLM)における幻覚に対処する
近年の適応的検索手法は,LLMの内在的知識とLLMの自己知識に訴える外部情報とを統合しているが,効率評価や不確実性評価手法との比較は無視されることが多い。
以上の結果から,不確実性推定手法は,QA性能を同等に保ちながら,効率や自己知識の点で複雑なパイプラインよりも優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:41:06 GMT)
Do Multilingual LLMs Think In English? [46.7] 大規模言語モデル(LLM)は多言語機能を持ち、様々な言語でタスクを解くことができる。
入力言語や出力言語に関係なく、現在のLLMが英語に最も近い表現空間において重要な決定を行うことを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:19:23 GMT)
Forecasting Open-Weight AI Model Growth on Hugging Face [46.3] 科学文献における引用力学と平行して構築する手法として,オープンウェイトモデルの影響を定量的に評価する枠組みを提案する。
オープンウェイトモデルの細調整モデルの累積数を追跡するために,Wangらによって導入された3つの重要なパラメータ-即時性,長寿命性,相対的適合性を用いて,科学的引用に適応する。
提案手法は,オープンウェイトモデル導入の多様な軌跡を効果的に捉えることが可能であり,ほとんどのモデルでは,ユニークなパターンや急激な使用感を示すアウトリーチが適している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:52:19 GMT)
Tensorization of neural networks for improved privacy and interpretability [46.1] 関数のテンソルトレイン表現を構築するためのテンソル化アルゴリズムを提案する。
このアプローチは、ニューラルネットワークモデルのプライバシと解釈可能性を高めるために使用できることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:50:46 GMT)
Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport [45.8] 拡散政策は、デモから複雑な振る舞いを学ぶ際に有望であることを示している。
本稿では,環境とのオンラインインタラクションによる拡散型模倣学習モデルの改善について検討する。
最適輸送理論を用いた拡散ポリシをRLと統合する新しい手法OTPRを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:56:09 GMT)
mStyleDistance: Multilingual Style Embeddings and their Evaluation [45.2] 合成データとコントラスト学習を用いて学習したスタイル埋め込みモデルであるMultilingual StyleDistanceを紹介する。
9言語からのデータに基づいてモデルをトレーニングし、多言語STEL-or-Contentベンチマークを作成する。
以上の結果から,mStyleDistanceの埋め込みは,これらの多言語スタイルのベンチマークにおいて既存のモデルよりも優れており,見当たらない機能や言語に対してよく一般化されていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:11:41 GMT)
Adversarial Prompt Evaluation: Systematic Benchmarking of Guardrails Against Prompt Input Attacks on LLMs [44.0] 大規模言語モデル(LLM)は、ジェイルブレイクと呼ばれるプロンプトによって、安全でない振る舞いに操作できる。
すべての守備隊が、それらを整列するために使われる小さなジェイルブレイクのために、新たなアウト・オブ・ディストリビューション攻撃を処理できるわけではない。
評価のために利用可能な現在のデータセットに基づいて、単純なベースラインは、競争力のあるアウト・オブ・ディストリビューション性能を示すことができることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:54:25 GMT)
Revisiting Jailbreaking for Large Language Models: A Representation Engineering Perspective [43.9] 最近のジェイルブレイク攻撃の急増により、悪意のある入力に晒された場合、Large Language Models(LLM)の重大な脆弱性が明らかになった。
LLMの自己保護能力は,その表現空間内の特定の行動パターンと関係があることが示唆された。
これらのパターンは,数対のコントラストクエリで検出可能であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:17:52 GMT)
Virtual Nodes Can Help: Tackling Distribution Shifts in Federated Graph Learning [43.9] Federated Graph Learning (FGL)は、複数のクライアントが強力なグラフ学習モデルを共同でトレーニングすることを可能にする。
実世界では、グラフデータはクライアント間で大きな分散シフトに悩まされる可能性がある。
本稿では,FedVNという新しいFGLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:19:55 GMT)
Optimization by Decoded Quantum Interferometry [43.6] Decoded Quantum Interferometry (DQI) という量子アルゴリズムを導入する。
有限フィールド上のデータに対する最適適合性を近似するために、DQIは我々の知る時間よりも優れた近似比を達成する。
30,000以上の変数を持つインスタンスをベンチマークすることで、これを実証します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:14:20 GMT)
Going Beyond Feature Similarity: Effective Dataset distillation based on Class-aware Conditional Mutual Information [43.4] 本稿では,データセットのクラス認識複雑性を評価するために,条件付き相互情報(CMI)を導入する。
合成データセットのクラス認識複雑性を制約しながら,蒸留損失を最小限に抑える。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:50:09 GMT)
Counterfactual Learning of Stochastic Policies with Continuous Actions [42.9] コンテクストとアクションを融合したカーネルを組み込んだモデリング戦略を導入する。
対実学習の最適化の側面が重要であることを実証的に示す。
実世界のログシステムにおけるオフラインポリシーの評価プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:56:23 GMT)
HiFi-KPI: A Dataset for Hierarchical KPI Extraction from Earnings Filings [42.6] 階層型金融鍵性能指標(HiFi-KPI)データセットを紹介する。
HiFi-KPIは、構造化されていない財務文書から特定の粒度の数値抽出を容易にするように設計されている。
HiFi-KPI Liteは4つの専門家マップ付きラベルで手作業でキュレートされたサブセットです。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:19:08 GMT)
Control Illusion: The Failure of Instruction Hierarchies in Large Language Models [42.3] 大規模言語モデル (LLM) は階層的な命令スキームによって徐々に展開される。
制約優先順位付けに基づく体系的評価フレームワークを導入し,LLMがいかに命令階層を強制するかを評価する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:51:37 GMT)
A Cautionary Tale About "Neutrally" Informative AI Tools Ahead of the 2025 Federal Elections in Germany [42.0] 我々は、客観的な政治的情報の提供において、AIベースのVoting Advice Applications(VAA)と大規模言語モデル(LLM)の信頼性を検討する。
我々の分析は、Wale-O-Matの38の文に対する党の反応との比較に基づいている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:30:53 GMT)
Tailoring transport via disorder and collisions interplay in quantum spin chains [41.9] 異方性XXZスピン鎖の輸送ダイナミクスを形作る際, 障害と時空間異種衝突音の相互作用について検討した。
低速度で発生する空間同質衝突は、その後の高原の形で局在度が設定される領域の成型に有利である。
本研究は,移動および局在のシーケンスを調整可能なストロボスコーププロトコルの設計に応用できる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:11:58 GMT)
BOSS: Benchmark for Observation Space Shift in Long-Horizon Task [41.7] 観測空間シフト(OSS)は、観測空間のシフトを引き起こし、スキルポリシーのパフォーマンスを損なう。
BOSSは、"Single Predicate Shift"、"Accumulated Predicate Shift"、"Skill Chaining"の3つの異なる課題で構成されている。
最も単純な課題であっても、OSSと比較してスキルパフォーマンスを比較すると、平均的なパフォーマンス低下は67%、35%、34%、54%でした。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:58:57 GMT)
One-step Diffusion Models with $f$-Divergence Distribution Matching [41.2] 近年の研究では,多段階拡散モデルを変分点蒸留により単一段階の学生生成器に蒸留している。
これらの手法は、モード探索として知られている分布マッチングにKL(Kulback-Leibler)の逆偏差を用いる。
本稿では,新しい$f$-divergence最小化フレームワークを用いて分布マッチング手法を一般化する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:20 GMT)
Active Learning of Deep Neural Networks via Gradient-Free Cutting Planes [40.7] 本研究では,ReLULUネットワークを任意の深さで学習し,感傷的切断理論を開発した。
提案手法の有効性を実データセット上のデータと分類タスクを用いて実証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:32:57 GMT)
Are Smarter LLMs Safer? Exploring Safety-Reasoning Trade-offs in Prompting and Fine-Tuning [40.6] 大規模言語モデル (LLM) は様々なNLPベンチマークで顕著な成功を収めている。
本研究では,LLMにおける推論と安全性の相互作用について検討する。
推論能力が向上し、これまで見過ごされていた脆弱性に光を当てることによって生じる、潜伏する安全性のリスクを強調します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:12:17 GMT)
On Neural BRDFs: A Thorough Comparison of State-of-the-Art Approaches [40.5] 双方向反射率分布関数(BRDF)は光と物質の複雑な相互作用を捉えるための重要なツールである。
本稿では,定性的,定量的な再現性の評価を含む,いくつかの手法の徹底的な評価を行う。
既存のアプローチに追加可能な2つの拡張を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:05:25 GMT)
ImpScore: A Learnable Metric For Quantifying The Implicitness Level of Sentence [40.4] インプシット言語は, 自然言語処理システムにおいて, 正確なテキスト理解を実現し, ユーザとの自然な対話を促進するために不可欠である。
本稿では,外部参照に頼ることなく,言語の暗黙度を定量化するスカラー計量を開発した。
InmpScoreのユーザによる評価を,アウト・オブ・ディストリビューションデータに基づく人間による評価と比較することで検証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:39:48 GMT)
Investigating the Adaptive Robustness with Knowledge Conflicts in LLM-based Multi-Agent Systems [39.4] マルチエージェントシステム(MAS)のロバスト性を調べるための総合的な4つのメトリクスを設計する。
まず、異種エージェントが導入した穏やかな知識紛争を分析し、システムの堅牢性を損なうことなく、協調的な意思決定を改善することを発見した。
最後に、知識衝突数、エージェント数、相互作用ラウンドに関するアブレーション研究を行い、MASの自己修復能力に固有の限界があることを見出した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:24:43 GMT)
A Novel Riemannian Sparse Representation Learning Network for Polarimetric SAR Image Classification [39.0] 提案するネットワークはSparse Representation (SR) 誘導深層学習モデルであり,共分散行列を直接ネットワーク入力として利用することができる。
実際の3つのPolSARデータセットの実験により,提案手法は最先端技術を超え,正確なエッジの詳細と適切な領域の均一性を保証している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:50:39 GMT)
Mitigating Tail Narrowing in LLM Self-Improvement via Socratic-Guided Sampling [38.8] 自己改善手法により、大規模な言語モデルがソリューション自体を生成できる。
モデルでは、簡単なクエリをオーバーサンプルし、まだマスターしていないクエリをアンダーサンプルする傾向があります。
本稿では,重み付きデータ抽出の効率化を目的とした,ガイド付き自己改善(GSI)について紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:00:10 GMT)
Quantum critical electro-optic and piezo-electric nonlinearities [38.5] 電場を持つ材料の光学特性のチューニングは、量子および古典フォトニクス応用の鍵となる。
量子パラ誘電体ペロブスカイトSrTiO$_3$(STO)を極低温光フォトニック材料として同定した。
酸素同位体置換によるSTOの光臨界へのチューニング 光学および圧電非線形性の2倍以上である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:01:19 GMT)
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents [38.0] DistRLは、モバイルデバイス制御エージェントのオンラインRLファインチューニングの効率を高めるために設計された、新しいフレームワークである。
平均して、DistRLはトレーニング効率を3倍改善し、主要な同期マルチマシンメソッドよりも2.4倍高速なトレーニングデータ収集を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:23:59 GMT)
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering [37.5] ニューラルネットワークや3次元ガウスアンを使わずに,適応的なスパースボクセル上での合成プロセスを組み込んだ効率的な放射場描画アルゴリズムを提案する。
提案手法は,従来の神経フリーなボクセルモデルを4dbPSNR以上と10倍FPS以上のスピードアップにより改善する。
我々のボクセル表現は、ボリュームフュージョンやVoxel Pooling、マーチングキューブといったグリッドベースの3D処理技術とシームレスに互換性がある。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:52 GMT)
Hierarchical Context Transformer for Multi-level Semantic Scene Understanding [37.4] マルチレベルセマンティックシーン理解(MSSU)として設定されたタスクを表現することを提案する。
本研究では,新しい階層型コンテキスト変換器 (HCT) ネットワークを提案する。
我々の白内障データセットと一般に利用可能なPSI-AVAデータセットを用いた実験により,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:36:16 GMT)
Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path? [37.1] 未確認のAI機関は、公共の安全とセキュリティに重大なリスクをもたらす。
これらのリスクが現在のAIトレーニング方法からどのように生じるかについて議論する。
我々は,非エージェント型AIシステムの開発をさらに進めるために,コアビルディングブロックを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:28:36 GMT)
Long Video Understanding with Learnable Retrieval in Video-Language Models [36.8] 本稿では,学習可能な検索ベースビデオ言語モデル(R-VLM)を提案する。
具体的には、質問(クエリ)と長いビデオから、我々のモデルは最も関連性の高いKビデオチャンクを特定し、選択する。
これにより、ビデオトークンの数を効果的に減らし、ノイズ干渉をなくし、システム性能を高めることができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:10:15 GMT)
Chrono: A Simple Blueprint for Representing Time in MLLMs [36.1] ビデオ言語モデルにおける文脈的・時間的理解の課題について,ビデオにおける時間的局所化の課題を探求することによって検討する。
画像テキスト事前学習MLLMに適用可能なユニバーサルシーケンス青写真であるChronoを紹介する。
我々は、最も広く使われているベンチマークであるCharades-STA、QVHighlights、ActivityNet Captions、NeXT-GQA上でのグラウンドドビデオ質問応答において、新しいSOTAを実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:49:07 GMT)
Personalized Help for Optimizing Low-Skilled Users' Strategy [36.0] 我々は、自然言語エージェントであるCICEROを拡張し、プレイヤーの意図に基づいて移動とメッセージのアドバイスを生成する。
初心者や経験豊富なプレイヤーによる12の外交ゲームでは、様々なアドバイス設定があり、生成されたアドバイスのいくつかが有益であることを示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:22:21 GMT)
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse [36.0] KVLinkは、大規模言語モデル(LLM)における効率的なキー値(KV)キャッシュ再利用のためのアプローチである。
KVLinkは、連結後のグローバルな位置と一致するように、KVキャッシュの位置埋め込みを調整すること、トレーニング可能な特別なトークンを使用して自己アテンションを復元すること、混合データ微調整を適用すること、の3つの重要なコンポーネントを導入している。
7つのデータセットにわたる実験によると、KVLinkは最先端の手法よりも平均4%の精度で質問応答を改善する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:34:29 GMT)
Forgotten Polygons: Multimodal Large Language Models are Shape-Blind [35.4] 視覚言語タスクの性能は高いが、Multimodal Large Language Models (MLLM) は数学的な問題解決に苦戦している。
以上の結果から,正多角形同定において,トップモデルが50%未満の精度で達成されるなど,形状認識の根本的な欠点が明らかとなった。
図中の視覚的アノテーションを明示的に参照することにより、多段階の数学的推論を強化する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:04:09 GMT)
Omnidirectional Image Quality Captioning: A Large-scale Database and A New Model [35.2] 我々は,OIQ-10Kと呼ばれる大規模データベースを用いた全方位画像品質評価(OIQA)について,これまでで最大の研究を行っている。
総合的な精神物理学的な研究は、全方位画像ごとに人間の意見を集めるために精巧に研究されている。
我々は,一方向画像の品質キャプションを生成することができるIQCaption360という新しい適応型特徴調整型OIQAモデルを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:54:00 GMT)
Defending Jailbreak Prompts via In-Context Adversarial Game [34.8] In-Context Adversarial Game(ICAG)を導入し、細調整を必要とせずにジェイルブレイクを防御する。
静的データセットに依存する従来の方法とは異なり、ICAGは防御エージェントと攻撃エージェントの両方を強化するために反復的なプロセスを採用している。
ICAGにより保護されたLSMがジェイルブレイクの成功率を大幅に低下させるICAGの有効性を実証した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:53:08 GMT)
Exploring the Impact of Personality Traits on LLM Bias and Toxicity [34.5] 個人性が異なる大規模言語モデル(LLM)の「パーソナライゼーション」が研究の関心を集めている。
本研究では, 異なる性格特性をLSMに割り当てることが, アウトプットの毒性やバイアスに与える影響について検討した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:01:30 GMT)
Towards Robust Probabilistic Modeling on SO(3) via Rotation Laplace Distribution [34.3] 単一のRGB画像から3DoF回転を推定することは難しい問題である。
本稿では,SO(3)上の新しい回転ラプラス分布を提案する。
我々の手法は、異常値の乱れに対して堅牢であり、改善可能な低エラー領域への多くの勾配を強制する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:36:52 GMT)
Scalable registration of single quantum emitters within solid immersion lenses through femtosecond laser writing [34.1] 炭化ケイ素(SiC)の光学活性シリコン空孔中心は量子ビットとして機能し、光子を介してスピンと対向する。
フォトニック構造内にフェムト秒レーザーによる単一(V$_Si$)中心生成を行い,フォトニック構造に登録し,光収集効率を4.5。
この方法はSiCにおけるスピン光子インタフェースを用いた集積量子デバイスの開発にスケーラブルである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:33:26 GMT)
Mitigating Data Scarcity in Time Series Analysis: A Foundation Model with Series-Symbol Data Generation [34.0] 時系列解析の基礎モデル (TSA) が注目されている。
データ不足やデータの不均衡といった課題は、開発を妨げ続けている。
本稿では,2重モードデータ生成機構を導入し,高品質な時系列データの生成を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:43:24 GMT)
Lost in Sequence: Do Large Language Models Understand Sequential Recommendation? [33.9] 大きな言語モデル(LLM)は、高度なテキスト理解能力とコンテキスト認識のおかげで、推奨のための有望なツールとして登場した。
本稿では,事前学習したSRecモデルから抽出したユーザ表現をLLMに蒸留することにより,LLMへのシーケンシャル情報の統合を向上する手法を提案する。
実験の結果, LLM-SRecは, ユーザの項目間相互作用の系列を理解する能力を高め, 最終的にレコメンデーション性能の向上につながることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:12:46 GMT)
Minions: Cost-efficient Collaboration Between On-device and Cloud Language Models [33.8] ローカルデータにアクセス可能な小型オンデバイス言語モデル(LM)が、フロンティアのクラウドホスト型LMと通信する新興環境について検討する。
本分析により,ローカルリモートシステムにおけるコストと性能のトレードオフに影響を与える重要な設計選択がいくつか明らかになった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:54:40 GMT)
Loop unrolling: formal definition and application to testing [33.4] テストプロセスは通常、高いカバレッジを目指しているが、ループは、イテレーションの回数が一般的に予測できないため、カバレッジの野望を著しく制限する。
この記事では、アンローリングの形式的定義と形式的性質の集合を提供する。
この定義を概念的基盤として、既存の自動テストフレームワークにアンロール戦略を適用しました。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:36:21 GMT)
Depth-aware Fusion Method based on Image and 4D Radar Spectrum for 3D Object Detection [33.0] 3Dミリ波レーダーは、対象物に対して範囲、ドップラー、方位情報しか提供できない。
本稿では,これら2つの高相補的で費用効率のよいセンサ,4Dミリ波レーダ,カメラを活用する。
深度センサがない場合のレーダスペクトルから深度画像を生成するために,GANを用いたネットワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:14:30 GMT)
Automatic Self-supervised Learning for Social Recommendations [32.6] 自己監視学習(SSL)は推奨分野において大きな注目を集めている。
本稿では,社会推薦のための適応型自己指導型学習(AdasRec)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:11:41 GMT)
AccessFixer: Enhancing GUI Accessibility for Low Vision Users With R-GCN Model [32.5] グラフィカルユーザインタフェース(GUI)におけるアクセシビリティ問題を修正するための新しいアプローチであるAccessFixerを提案する。
AccessFixerでは、固定されたGUIは、一貫したカラーパレット、一貫した間隔、および関連するコンポーネントの属性の調整によって達成された適切なサイズ変更を持つ。
私たちはAccessFixerを10のオープンソースアプリに適用します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:52:51 GMT)
Score-based Causal Representation Learning: Linear and General Transformations [31.8] 本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は、構造化された合成データと画像データに関する実験によって検証される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:10:59 GMT)
Balanced Representation Learning for Long-tailed Skeleton-based Action Recognition [31.6] 動作認識における長い尾の問題に対処する新しいバランス付き表現学習法を提案する。
我々は、表現空間のバイアスを軽減するために、分離された行動認識学習スケジュールを設計する。
提案手法は4つのスケルトンデータセットで検証される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:13:37 GMT)
A Training-free LLM-based Approach to General Chinese Character Error Correction [31.5] 中国語のスペル訂正(CSC)は,漢字の文字誤りの訂正を目的とした重要な課題である。
本稿では,3種類の文字誤りに着目した汎用漢字誤り訂正(C2EC)の課題を紹介する。
トレーニング不要なプロンプトフリーCSC法をC2ECに拡張し,Levenshtein距離を用いて長さ変化を処理し,新たなプロンプトベース大規模言語モデル(LLM)を活用して性能を向上させる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:48:54 GMT)
Position: Standard Benchmarks Fail -- LLM Agents Present Overlooked Risks for Financial Applications [31.4] 既存のLLMエージェントベンチマークを分析し、安全性のギャップを見つけ、リスク対応評価指標を10つ導入する。
モデルレベル(本質的能力)、ワークフローレベル(多段階プロセス信頼性)、システムレベル(統合ロバスト性)でエージェントを評価する3段階評価フレームワークを基礎とした安全意識評価エージェント(SAEA)を提案する。
本研究は, LLMエージェント評価基準の再定義の必要性を, 原性能から安全性, 堅牢性, 実世界のレジリエンスに焦点を移すことにより強調した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:56:15 GMT)
BP-SGCN: Behavioral Pseudo-Label Informed Sparse Graph Convolution Network for Pedestrian and Heterogeneous Trajectory Prediction [31.4] 軌道予測は、自動運転車や監視の応用におけるより良い意思決定を可能にする。
本研究では、擬似ラベルを学習し、軌道予測器に通知する行動擬似ラベルインフォームドスパースグラフ畳み込みネットワーク(BP-SGCN)を提案する。
実験の結果, 擬似ラベルは, 異なる行動クラスタを効果的にモデル化し, 軌道予測を改善することがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:29:38 GMT)
LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection [31.0] ラテント再構成誤差 (LaRE) は, 画像検出のための遅延空間における最初のリコンストラクションエラーに基づく特徴である。
LaREを利用するために,LaREによって誘導される画像の特徴を洗練し,特徴の識別性を向上するError-Guided Feature Refinement Module (EGRE)を提案する。
我々のEGREはアライメント・then-refine機構を利用しており、空間的・チャネル的な視点から生成画像を検出するために画像特徴を効果的に洗練する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:51:57 GMT)
Neural Augmentation Based Panoramic High Dynamic Range Stitching [30.8] 本稿では, 神経拡張に基づくパノラマHDR縫合法を提案する。
提案アルゴリズムは既存のパノラマ縫合アルゴリズムより優れている。
実験により,提案アルゴリズムは既存のパノラマ縫合アルゴリズムより優れていることが示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:37:55 GMT)
Should I Trust You? Detecting Deception in Negotiations using Counterfactual RL [30.7] 我々は、自然言語通信と戦略的推論の両方を必要とするボードゲームであるTextitDiplomacyにおいて、人間がいかに戦略的にお互いを欺くかを分析した。
提案手法は,大規模言語モデルと比較して高い精度で人間の偽造を検知する。
今後のヒューマン・アブライインタラクションツールは,不審な提案を疑う機会をユーザに与えるために,テキストフリクションをトリガーすることで,偽造検出の手法に基づいて構築することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:52:58 GMT)
DOEI: Dual Optimization of Embedding Information for Attention-Enhanced Class Activation Maps [30.5] 弱教師付きセマンティックセグメンテーション(WSSS)は、典型的には限定的なセマンティックアノテーションを使用して、初期クラスアクティベーションマップ(CAM)を取得する。
クラスアクティベーション応答と高次元空間のセマンティック情報との結合が不十分なため、CAMはオブジェクト共起や不活性化の傾向にある。
本稿では,意味認識重み行列を用いて埋め込み表現を再構成する新しい手法である,埋め込み情報のデュアル最適化であるDOEIを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:06:01 GMT)
Bugfix: a standard language, database schema and repository for research on bugs and automatic program repair [30.5] APR(Automatic Program repair)は、バグを検出するときにプログラムを修正するための提案を提供する、素晴らしいアイデアです。
Bugfixはこのようなフレームワークを提供するための取り組みである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:17:04 GMT)
Improving Value-based Process Verifier via Structural Prior Injection [30.1] 合理的な構造的事前注入は, コストの少ない約1$sim$2ポイントで, 価値に基づくプロセス検証の性能を向上できることを示す。
また, 異なる構造的事前条件下では, 同じ最適解を持つにもかかわらず, 検証器の性能が大きく異なることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:57:59 GMT)
Improving the Scaling Laws of Synthetic Data with Deliberate Practice [30.0] Deliberate Practice for Synthetic Data Generation (DP) は、動的合成データ生成によるサンプリング効率を向上させる新しいフレームワークである。
DPは、トレーニングサンプルやイテレーションをはるかに少なくして、より優れたスケーリングパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:56:15 GMT)
Constructing a Norm for Children's Scientific Drawing: Distribution Features Based on Semantic Similarity of Large Language Models [29.7] 本研究は、1420人の子どもの科学的図面(9つの科学的テーマ/概念)を同定する。
児童の科学的図面の基準を確立しようと試み、後続の児童の図面研究の基準となる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:02:15 GMT)
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers [29.7] RIFLExは、最先端の動画拡散トランスフォーマーで高品質な2ドル(約2万2000円)の無料ランチだ。
画質を向上し、長いビデオなしで最小限の微調整で3ドル(約3,300円)で外挿できる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:28:05 GMT)
Corrections Meet Explanations: A Unified Framework for Explainable Grammatical Error Correction [29.6] 本稿では,説明・修正タスクを生成的に統合した統一的な説明可能なGECフレームワークであるEXGECを紹介する。
様々なNLPモデル(BART、T5、Llama3)の結果、EXGECモデルは両方のタスクにおいてシングルタスクベースラインを超えている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:42:33 GMT)
Interpreting and Steering LLMs with Mutual Information-based Explanations on Sparse Autoencoders [29.4] 大きな言語モデル(LLM)は人間のクエリを扱うのに優れていますが、時に欠陥や予期せぬ応答を生成することができます。
特徴解釈と相互情報に基づく目的設計のための固定語彙集合を提案する。
そこで本研究では,学習した機能アクティベーションを,対応する説明に基づいて調整する2つの実行時ステアリング戦略を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:36:42 GMT)
Mean-Shift Distillation for Diffusion Mode Seeking [29.3] 平均シフト蒸留は拡散出力分布の勾配のプロキシを提供する。
本研究は, モードアライメントが優れ, 合成および実用両方のコンバージェンスが改善されていることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:58:56 GMT)
Orthogonal Calibration for Asynchronous Federated Learning [29.3] 非同期フェデレーション学習は、到着した更新を統合することで、従来の同期アグリゲーションの非効率性を緩和する。
既存の非同期メソッドは、最新のグローバルウェイトをクライアントに分散するだけで、ローカル進捗を上書きし、モデルドリフトを引き起こすことができる。
グローバルな学習とローカルな学習の進歩を分離し、干渉を最小限に抑えるためにグローバルシフトを調整するフレームワークであるOrthoFLを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:09:12 GMT)
Training Turn-by-Turn Verifiers for Dialogue Tutoring Agents: The Curious Case of LLMs as Your Coding Tutors [29.0] 本稿では,学習者の知識状況とターン・バイ・ターン・バイ・ターン・バリデーションを推定し,タスク完了に向けた効果的な指導を確実にする,新しいエージェントワークフローであるTrace-and-Verify(TRAVER)を提案する。
実験では、コーディングチュータリングの課題を明らかにし、TRAVERが成功率を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:25:44 GMT)
Humanoid-VLA: Towards Universal Humanoid Control with Visual Integration [28.8] 本稿では,言語理解,エゴセントリックなシーン認識,モーションコントロールを統合し,普遍的なヒューマノイド制御を実現する新しいフレームワークを提案する。
Humanoid-VLAは、テキスト記述と組み合わせた非エゴセントリックな人間の動きデータセットを使用して、言語運動の事前アライメントから始まる。
そして、パラメータを効率よくビデオコンディショニングすることで、エゴセントリックな視覚コンテキストを取り入れ、コンテキスト認識モーション生成を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:09:14 GMT)
Learning with Limited Shared Information in Multi-agent Multi-armed Bandit [28.8] マルチエージェントマルチアームバンディット(MAMAB)は古典的な協調学習モデルであり,近年注目されている。
本稿では,各エージェントが共有したい情報のみを共有する,制限付き共有情報マルチエージェントマルチアームバンド(LSI-MAMAB)モデルを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:42:09 GMT)
Probe Pruning: Accelerating LLMs through Dynamic Pruning via Model-Probing [28.7] Probe Pruningは、大規模言語モデルのオンライン、動的、構造化されたプルーニングのための新しいフレームワークである。
探索、履歴インフォームドプルーニング、完全な推論の3つの主要なステージから構成される。
追加のニューラルネットワークモジュールや微調整を必要とせずに動作する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:41:21 GMT)
Unveiling Attractor Cycles in Large Language Models: A Dynamical Systems View of Successive Paraphrasing [28.6] 反復変換は、固定点や極限サイクルを含む引き付け子として知られる安定な構成をもたらす。
この視点を入力テキストを出力テキストに反復的にマッピングする大規模言語モデル(LLM)に適用すると、長期的な振る舞いを特徴づけるための原則化されたアプローチが得られる。
代々の言い回しはそのような力学を探求するための説得力のあるテストベッドとして機能し、言い回しは言語的変化を伴う同じ基礎的な意味を再表現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:46:57 GMT)
SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training [28.6] In-the-wild hand image を用いた3次元手ポーズ推定の事前学習のためのフレームワークを提案する。
特徴空間に類似したペアを埋め込む新しいコントラスト学習法を提案する。
実験により,本手法が従来のコントラスト学習手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:02:05 GMT)
RankSHAP: Shapley Value Based Feature Attributions for Learning to Rank [28.4] 我々は、機能属性コミュニティで人気がある軸論的ゲーム理論のアプローチを採用し、全てのランク付けベースの特徴属性メソッドが満足すべき基本公理のセットを特定する。
次にRang-SHAPを導入し、古典的なShapley値をランキングに拡張します。
また、既存の帰属アルゴリズムの公理解析を行い、提案した公理に準拠するかどうかを判断する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:58:39 GMT)
Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs [28.4] 記憶を文脈として活用することで、MLLMはビデオイベントをよりよく理解できるようになる。
このような記憶は、先行する出来事の予測に依存するため、誤報を含ませ、非難や性能低下につながる可能性がある。
本稿では,メモリ強化イベント理解のためのフラグレーションを緩和する,フラグレーション対応メモリ修正手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:31:58 GMT)
From Documents to Dialogue: Building KG-RAG Enhanced AI Assistants [28.1] 我々は、知識グラフ(KG)を利用した検索型拡張生成(RAG)フレームワークを使用して、外部知識ソースから関連情報を検索する。
我々のKG-RAGシステムは、応答を生成するLLMに送信される前に、ユーザのコンテキストに付加された関連する前兆を検索する。
評価の結果,本手法は応答関連性を大幅に向上させ,無関係な回答を50%以上削減し,既存の生産システムと比較して88%以上,完全関連性のある回答を増大させることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:22:12 GMT)
PedDet: Adaptive Spectral Optimization for Multimodal Pedestrian Detection [28.1] PedDetは適応的なスペクトル最適化フレームワークで、特にマルチスペクトル歩行者検出に最適化されている。
PedDetは最先端の性能を実現し、低照度でも検出精度が良く、mAPを6.6%向上させる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:15:39 GMT)
Weakly Supervised Video Scene Graph Generation via Natural Language Supervision [28.0] 既存のビデオシーングラフ生成(VidSGG)研究は、完全に教師された方法で訓練されている。
利用可能なビデオキャプションのみを利用する自然言語ベースのビデオシーングラフ生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:42:04 GMT)
Adaptive Prompt: Unlocking the Power of Visual Prompt Tuning [27.7] Visual Prompt Tuning (VPT)は、トレーニング済みの視覚モデルを下流タスクに適応するための強力な方法として登場した。
入力の適応関数としてプロンプトを再定義する新しい世代のプロンプトであるVisual Adaptive Prompt Tuning (VAPT)を提案する。
我々の理論解析は,VAPTが最適な試料効率を実現することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:05:20 GMT)
GraphFM: Graph Factorization Machines for Feature Interaction Modeling [27.3] 本稿では,グラフ構造の特徴を自然に表現し,グラフ因子化マシン(GraphFM)を提案する。
特に,有用な特徴間相互作用を選択し,特徴間のエッジとして定式化する機構を設計する。
提案モデルでは, FMの相互作用関数をグラフニューラルネットワーク(GNN)の特徴集約戦略に統合する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:17:00 GMT)
Graph Perceiver IO: A General Architecture for Graph Structured Data [27.1] 近年、PerceiverとPerceiver IOは、画像、テキスト、グラフ構造化データセットなど、不均一なモダリティに重点を置いている。
本研究では,グラフ構造化データセットに対するPerceiver IO(GPIO)を提案する。
このクエリは、位置エンコーディングと出力の平滑化を利用して、グラフ構造化データ、テキスト、画像などの多様なデータセットを処理する一般的な方法である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:19:31 GMT)
Text-to-SQL Domain Adaptation via Human-LLM Collaborative Data Annotation [26.8] テキスト-to-sqlモデルは、現実世界のアプリケーションでますます採用されている。
このようなモデルを現実世界にデプロイするには、特定のアプリケーションで使用される高度に専門化されたデータベーススキーマにそれらを適用する必要があることが多い。
既存のtext-to-sqlモデルは、新しいスキーマに適用した場合、大幅なパフォーマンス低下を経験する。
スキーマの進化のための高品質なテキスト間データを継続的に取得することは、現実世界のシナリオでは違法に高価である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:32:35 GMT)
PersonaMath: Boosting Mathematical Reasoning via Persona-Driven Data Augmentation [26.8] 我々は、PersonaMathモデルをトレーニングする、MATHとGSM8Kから派生したデータセットであるPersonaMathQAを紹介する。
私たちのデータセットには、MetaMathQAの32.6%とMathInstructの49.5%の128.9Kのデータポイントしか含まれていません。
我々は、PersonaMathQAデータセット、PersonaMathモデル、およびパブリック利用のためのコードをオープンソース化した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:33:16 GMT)
Learning to Keep a Promise: Scaling Language Model Decoding Parallelism with Learned Asynchronous Decoding [26.6] PASTAは、大規模言語モデルにセマンティックな独立性を識別し、独自の応答で並列デコーディングの機会を表現するための学習ベースのシステムである。
PASTA-Langは、LLMが自身の応答でセマンティックな独立性を表現することができるアノテーション言語である。
本研究は,2.2%から7.1%の品質変化を伴う1.21xから1.93xまでの幾何平均スピードアップを,逐次デコードベースラインに対する長さ制御ウィンドレートで測定した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:14:19 GMT)
On the Robustness of Transformers against Context Hijacking for Linear Classification [26.2] Transformer-based Large Language Models (LLM) は、強力なコンテキスト内学習能力を実証している。
それらは、コンテキストハイジャックとして知られる、事実的に正しいコンテキストによって破壊される。
十分に訓練された深部変圧器は、経験的観測と整合した高い強靭性を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:31:00 GMT)
PPC-GPT: Federated Task-Specific Compression of Large Language Models via Pruning and Chain-of-Thought Distillation [26.1] PPC-GPTは、大規模言語モデルをタスク固有の小言語モデルに圧縮するためのプライバシー保護フレームワークである。
PPC-GPTは競合性能を達成し,データプライバシ保護を優先することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:32:49 GMT)
Do LLMs Make Mistakes Like Students? Exploring Natural Alignment between Language Models and Human Error Patterns [25.9] 大規模言語モデル(LLM)は、様々な教育課題において顕著な能力を示した。
人間の学習パターンとの整合性、特に、学生がマルチチョイス質問(MCQ)で選択する可能性が最も高い選択肢の予測には、未熟なままである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:43:32 GMT)
X-ray Made Simple: Radiology Report Generation and Evaluation with Layman's Terms [25.9] ラジオロジーレポート生成(RRG)は多モード生成モデルの進歩によって大きな進歩を遂げた。
既存の語彙ベースのメトリクス(例えばBLEU)によるRRGのハイパフォーマンスは、単なるミラージュ(mirage)である。
我々は、レイマンの用語ベースのデータセット、評価およびトレーニングフレームワークであるRRGフレームワークを提案することによって、この問題に意図せずにアプローチする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:52:11 GMT)
A large-scale multicenter breast cancer DCE-MRI benchmark dataset with expert segmentations [25.6] 原発性腫瘍および非質量強調領域の鑑別を含む,T1強調ダイナミックコントラスト強調MRI症例1506例のデータセットを報告する。
このデータセットは、The Cancer Imaging Archive(TCIA)の4つのコレクションからの画像データを統合する。
データセットには49の調和した臨床および人口統計変数と、注釈付きデータに基づいてトレーニングされたベースラインnnU-Netモデルのための事前トレーニングされた重みが含まれている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:20:47 GMT)
HumanGif: Single-View Human Diffusion with Generative Prior [25.5] 本稿では, 先行生成に基づく単一ビューヒト拡散モデルであるHumanGifを提案する。
具体的には、単一ビューに基づく3次元人間の新しいビューを定式化し、単一ビュー条件のヒト拡散過程として合成する。
我々は,HumanGifが最高の知覚性能を達成し,新しい視点とポーズ合成の一般化性が向上したことを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:03:54 GMT)
Directional Gradient Projection for Robust Fine-Tuning of Foundation Models [25.0] ディディショナル・グラディエント・プロジェクション(DiGraP)は、グラデーションからブリッジの正規化や多目的最適化に至るまでの方向性情報を階層的に学習可能な手法である。
まず,画像分類による視覚質問回答 (VQA) ベンチマークの分析により,一様・多モードのギャップを埋める。
実験結果から,DiGraPは画像分類やVQAタスクにおいて,識別的,生成的バックボーンで既存のベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:31:55 GMT)
R$^3$Mem: Bridging Memory Retention and Retrieval via Reversible Compression [24.8] 情報保持と検索の両方を最適化するメモリネットワークであるR$3$Memを提案する。
R$3$Memは、仮想メモリトークンを使用して無限に長い履歴を圧縮およびエンコードし、階層的な圧縮戦略によってさらに強化される。
実験により,長文言語モデリングおよび検索強化生成タスクにおいて,メモリ設計が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:39:00 GMT)
Optimizing Product Provenance Verification using Data Valuation Methods [24.6] 安定同位体比分析(SIRA)に適用された機械学習モデルのトレーニングデータの選択と活用を促進するために設計された新しいデータ評価フレームワークを提案する。
我々は,その方法論を広範な実験で検証し,証明の検証を著しく強化し,不正取引を緩和し,グローバルサプライチェーンの規制執行を強化する可能性を実証した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:16:19 GMT)
Optimizing Pre-Training Data Mixtures with Mixtures of Data Expert Models [24.4] 本稿では,各候補混合物に対応するクロスエントロピー損失の効率的な近似により,データ混合の事前学習を最適化する手法を提案する。
我々はこの近似を回帰モデルにおける付加的な特徴の源として用い、少数の混合物に対するモデル損失の観測から訓練した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:27:48 GMT)
Modality-Aware Neuron Pruning for Unlearning in Multimodal Large Language Models [24.3] 大規模なデータセットでトレーニングされたLarge Language Models(LLM)やMultimodal Large Language Models(MLLM)のような生成モデルは、機密情報を記憶し、不注意に明らかにし、倫理的およびプライバシー上の懸念を提起する。
本研究では,MLLM のための新しい学習フレームワークである Modality Aware Neuron Unlearning (MANU) を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:54:46 GMT)
Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions [24.2] 大規模言語モデル(MLLM)における幻覚に対処するMagPrompt(MagPrompt)を提案する。
MagPromptは以下の2つの重要な原則に基づいており、様々な効果的なプロンプトの設計をガイドしている。
GPT-4oやGemini-proといったオープンソースおよびクローズドソースモデルに適用することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:48:58 GMT)
LEDD: Large Language Model-Empowered Data Discovery in Data Lakes [23.8] LEDDは階層的なグローバルカタログを提供し、セマンティックな意味とセマンティックなテーブルでデータレイクを検索する。
LEDDは自然言語仕様に基づいて意味的に関連するテーブルを返すことができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:30:43 GMT)
The Imitation Game for Educational AI [23.7] 本稿では,2相チューリング様試験に基づく新しい評価フレームワークを提案する。
フェーズ1では、学生は質問に対するオープンな回答を提供し、自然な誤解を明らかにします。
フェーズ2では、AIと人間の専門家の両方が、各学生の特定のミスを条件に、新しい関連する質問に気を散らす。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:14:55 GMT)
Eeyore: Realistic Depression Simulation via Supervised and Preference Optimization [23.7] 構造化アライメントフレームワークを用いて,現実的な抑うつシミュレーションに最適化した8Bモデルを提案する。
まず、実世界のうつ病に関連する会話をキュレートし、うつ病の特徴を抽出し、データフィルタリングと心理的プロファイル構築をガイドする。
私たちはドメインの専門家と積極的に協力し、特性抽出を検証するインタラクティブインターフェースを開発しています。
モデルサイズは小さいが、アイユール抑うつシミュレーションはSOTAの推進戦略によりGPT-4oより優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:29:44 GMT)
Auto-Bench: An Automated Benchmark for Scientific Discovery in LLMs [23.6] 自然科学と社会科学の両方において科学的発見のための大規模言語モデル(LLM)を評価するための新しいベンチマークを導入する。
我々のベンチマークは因果グラフ発見の原理に基づいており、隠れ構造を発見し、有効な正当性を生成することを含む最適な決定を行うためのモデルに挑戦する。
我々は,GPT-4,Gemini,Qwen,Claude,Llamaを含む最先端のLCMを評価し,問題を複雑化するにつれて性能低下を観測した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:35:20 GMT)
Visions in Quantum Gravity [23.2] Norditaプログラム「量子重力:重力効果場理論から紫外完全アプローチ」
このコントリビューションは、プログラム中に開催された12のトピックに関する議論をまとめたものだ。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:42:41 GMT)
Model Lakes [23.1] ディープラーニングモデルのセットを考えると、タスクに適したモデルを見つけるのは難しいかもしれません。
データレイクの研究からヒントを得て,モデルレイクの概念を紹介した。
モデル属性、バージョニング、検索、ベンチマークなどの重要なモデルレイクタスクを形式化する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:46:33 GMT)
Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula [23.1] 状態空間モデル(SSM)はトランスフォーマーよりも利点があるが、長期のコンテキスト内検索のようなテキストコピー、連想リコール、質問応答を必要とするタスクに苦労する。
本研究では,SSMのコンテキスト内検索能力を大幅に向上する新たな学習手法であるBirdieを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:13:57 GMT)
Decoding for Punctured Convolutional and Turbo Codes: A Deep Learning Solution for Protocols Compliance [22.9] 本稿では,Long Short-Term Memory(LSTM)をベースとしたデコードアーキテクチャを提案する。
提案手法は、句読解畳み込み符号とターボ符号を統一する。
句読点埋め込み機構は、句読点パターンを直接ネットワークに統合し、様々なコードレートへのシームレスな適応を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:00:14 GMT)
Perm: A Parametric Representation for Multi-Style 3D Hair Modeling [22.8] Permは、さまざまな毛髪関連の応用を促進するために設計された人間の3D毛髪のパラメトリック表現である。
ヘアテクスチャを低周波・高周波ヘア構造に適合・分解するために,我々のストランド表現を活用している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:48:13 GMT)
Don't Confuse! Redrawing GUI Navigation Flow in Mobile Apps for Visually Impaired Users [22.7] 視覚障害のあるユーザーが、アプリ情報をナビゲートしたりアクセスしたりするためにスクリーンリーダーのみに依存しているかどうかは不明だ。
これらの問題を考慮し,RGNF (Re-draw GUI Navigation Flow) という手法を提案する。
グラフィカルユーザインタフェース(GUI)内の各コンポーネントのコンテンツにアクセスしやすさとコヒーレンスを高めることを目的としている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:33:04 GMT)
AttentionEngine: A Versatile Framework for Efficient Attention Mechanisms on Diverse Hardware Platforms [22.4] 我々は、異種ハードウェアバックエンド間のアテンションメカニズムの最適化を効率化するために設計された包括的フレームワークであるAttentionEngineを紹介した。
注意計算をカスタマイズ可能なコンポーネントでモジュール操作に分解することで、AttentionEngineは多様なアルゴリズム要求への柔軟な適応を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:06:41 GMT)
ZeroFlow: Overcoming Catastrophic Forgetting is Easier than You Think [22.3] 我々はZeroFlowの最初のベンチマークを導入し、勾配のない最適化アルゴリズムを評価し、忘れを克服する。
このベンチマークでは、複数のメソッドをまたいだフォワードパスメソッドのスイートを調べ、シナリオやデータセットを忘れる。
フォワードパスだけでは、忘れを乗り越えるには十分です。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:00:02 GMT)
OccProphet: Pushing Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with Observer-Forecaster-Refiner Framework [22.3] そこで本稿では,計算要求をはるかに小さくして占有率予測を効率的に学習する新しいフレームワークOccProphetを提案する。
OccProphetは、Observer、Forecaster、Refinerの3つの軽量コンポーネントで構成されている。
計算コストの58%$sim$78%を2.6$times$ speedupで削減する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:21:48 GMT)
Drift: Decoding-time Personalized Alignments with Implicit User Preferences [22.3] Driftは大きな言語モデル(LLM)を暗黙のユーザー好みでパーソナライズする新しいフレームワークである。
分析の結果,Driftは計算効率が高く,解釈可能であることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:12:59 GMT)
Fréchet Cumulative Covariance Net for Deep Nonlinear Sufficient Dimension Reduction with Random Objects [22.2] Fr'echet Cumulative Covariance (FCCov) と呼ばれる新しい統計依存度尺度を導入し、FCCovに基づく新しい非線形SDRフレームワークを開発する。
我々のアプローチは複雑な非ユークリッドデータに適用できるだけでなく、外れ値に対する堅牢性も示している。
正方形フロベニウスノルム正規化の手法は、$sigma$-fieldレベルで不偏性を達成することを証明している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:55:50 GMT)
Nonconvex Stochastic Optimization under Heavy-Tailed Noises: Optimal Convergence without Gradient Clipping [21.9] 重み付き雑音下での最初の収束を提供するが、切断はしない。
また、テールインデックス$mathfrakp$が事前に不明な場合には、最初の$mathcalO(Tfrac1-mathfrakp3mathfrakp-2)$収束率も設定する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:44:52 GMT)
ChatVLA: Unified Multimodal Understanding and Robot Control with Vision-Language-Action Model [21.8] ChatVLAは、初期制御熟達後のマルチモーダルデータを段階的に統合するフェーズアライメントトレーニングと、タスク干渉を最小限に抑えるMixture-of-Expertsアーキテクチャを特徴とする、新しいフレームワークである。
ChatVLAは、視覚的問合せデータセット上での競合性能を示し、マルチモーダル理解ベンチマークにおける最先端のビジョン言語アクション(VLA)メソッドを大幅に上回っている。
本研究は,ロバストなマルチモーダル理解と効果的なロボット制御を実現するための統合フレームワークの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:28:36 GMT)
Unveiling Scoring Processes: Dissecting the Differences between LLMs and Human Graders in Automatic Scoring [21.8] 大規模言語モデル(LLM)は、構築された応答評価のための自動スコアリングを行う上で、強力な可能性を示している。
人間によってランク付けされた構築された応答は、通常、与えられた格付けされたルーリックに基づいているが、LSMがスコアを割り当てる方法はほとんど不明である。
本稿では,理科の課題に対する学生の書面回答と人間のスコアとの整合性を評価するために,LLMが用いたグレーディングルーブリックを明らかにする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:45:17 GMT)
Self-Updatable Large Language Models by Integrating Context into Model Parameters [21.7] 周囲のオブジェクトとのインタラクションのような小規模なエクスペリエンスは、大規模な言語モデルに頻繁に統合する必要があります。
現在の手法では、連続学習、モデル編集、知識蒸留技術を用いてモデルパラメータに経験を組み込む。
モデルパラメータに直接経験を組み込むSELF-PARAMを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:56:47 GMT)
Investigating the (De)Composition Capabilities of Large Language Models in Natural-to-Formal Language Conversion [21.7] 大規模言語モデル(LLM)は、一般化され堅牢な自然言語変換(N2F)において、分解と構成の強力な能力を持つ必要がある。
我々は,N2F における LLM の分解と合成能力のセットを評価できるサンプルとタスクの構成を行うDEDCフレームワークを提案する。
本研究は,N2F における LLM の分解と合成の基本的な機能について,新たな視点を提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:12:55 GMT)
Understand User Opinions of Large Language Models via LLM-Powered In-the-Moment User Experience Interviews [21.6] 本稿では,LLMを利用したインタビュアーであるCLUEについて述べる。
メインストリームのLDMについて,ユーザからの意見を理解するために,何千人ものユーザを対象に調査を行った。
実験の結果,例えばDeepSeek-R1の表示された推論プロセスに関するバイポーラビューなど,CLUEは興味深いユーザ意見を捉えていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:42:22 GMT)
S-NeRF++: Autonomous Driving Simulation via Neural Reconstruction and Generation [21.5] S-NeRF++は神経再構成に基づく革新的な自律運転シミュレーションシステムである。
S-NeRF++は、nuScenesやradianceなど、広く使われている自動運転データセットでトレーニングされている。
システムは、ノイズとスパースLiDARデータを効果的に利用して、トレーニングを洗練し、奥行きの外れ値に対処する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:11:48 GMT)
Scale-Distribution Decoupling: Enabling Stable and Effective Training of Large Language Models [21.2] 訓練安定性は、大規模言語モデル(LLM)の事前学習における永続的な課題である
完全連結層における重み行列のスケールと分布を明示的に分離し,トレーニングを安定させる手法として,SDD(Scale-Distribution Decoupling)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:49:34 GMT)
Self-Supervised Diffusion MRI Denoising via Iterative and Stable Refinement [20.8] ディフュージョン (Di-Fusion) は、後者の拡散ステップと適応サンプリングプロセスを利用する、完全に自己制御された分極法である。
実データおよびシミュレーションデータを用いた実験により, マイクロ構造モデリング, トラクトグラフィー追跡, その他の下流タスクにおいて, ディフュージョンが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:51:09 GMT)
Chain-of-Rank: Enhancing Large Language Models for Domain-Specific RAG in Edge Device [20.7] ランクのチェーン(CoR)は、入力された外部文書の信頼性の単純なランキングに焦点を移す。
我々は、ベンチマークで最先端のSOTA(State-of-the-art)結果を取得し、その有効性を分析する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:28:12 GMT)
Explaining the Success of Nearest Neighbor Methods in Prediction [20.6] 予測手法は近接探索を利用して過去のトレーニング例をテスト例と最もよく似たものにする。
この本は、理論上も実際においても、これらの手法の成功を説明することを目的としている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:37:57 GMT)
AI and Entrepreneurship: Facial Recognition Technology Detects Entrepreneurs, Outperforming Human Experts [20.6] 我々は,一対の顔画像に基づく対照的な学習手法を用いて,畳み込みニューラルネットワーク(CNN)を訓練する。
我々のAIモデルは79.51%の精度を達成した。
いくつかの試験では、この高いレベルの精度が様々な条件下で維持されていることが示されている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:12:29 GMT)
Iterative Repair with Weak Verifiers for Few-shot Transfer in KBQA with Unanswerability [20.5] KBQAの現実世界のアプリケーションは、ドメイン内のラベル付きトレーニングデータに制限があるため、解決不可能な問題を扱うモデルを必要とする。
そこで本研究では,KBQAに疑問を呈し,性能評価のための2つの新しいデータセットを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:35:19 GMT)
SCALES: Boost Binary Neural Network for Image Super-Resolution with Efficient Scalings [20.3] 本稿では,レイヤワイズスケーリング係数と空間再スケーリング法,チャネルワイズ再スケーリング法からなるSRネットワークのバイナライズ手法を提案する。
ベースライン方式と比較してPSNRを1dB以上の精度で改善し,最初の精度の高いバイナリトランスフォーマーベースSRネットワークを実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:11:50 GMT)
Scaling Sparse and Dense Retrieval in Decoder-Only LLMs [20.2] 大規模言語モデル(LLM)のスケーリングは,検索モデルの性能向上に大きな可能性を示している。
従来の研究は、比較損失(CL)を訓練した高密度な検索に重点を置いてきた。
スパース検索モデルは、インドメイン(MSMARCO, TREC DL)とアウト・オブ・ドメイン(BEIR)ベンチマークの両方において、密集検索を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:28:26 GMT)
Evaluating Social Biases in LLM Reasoning [19.8] 本稿では,DeepSeek-R1 の 8B と 32B の変種を,BBQ データセット上の命令調整版と比較した。
我々の知る限りでは、この実証的研究は、LLM推論におけるバイアス問題を初めて評価するものである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:16:07 GMT)
From Sub-Ability Diagnosis to Human-Aligned Generation: Bridging the Gap for Text Length Control via MARKERGEN [19.7] MarkerGenは、長さ制御可能なテキスト生成を改善する単純なyet効率のプラグアンドプレイアプローチである。
テストの結果、MarkerGenは様々な設定でLCTGを大幅に改善し、優れた有効性と一般化性を示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:23:35 GMT)
BP-GPT: Auditory Neural Decoding Using fMRI-prompted LLM [19.5] 我々は新しい方法であるBrain Prompt GPT(BP-GPT)を導入する。
本手法は,fMRIから抽出した脳の表現をプロンプトとして利用することにより,GPT-2を用いてfMRI信号を刺激テキストに復号することができる。
BP-GPTをオープンソースで評価し,METEORでは4.61,BERTScoreでは2.43に向上した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:13:44 GMT)
MoMa: A Modular Deep Learning Framework for Material Property Prediction [19.3] MoMaはModular framework for Materialsで、まず様々なタスクで特殊なモジュールを訓練し、その後、各下流シナリオに合わせた相乗的モジュールを適応的に構成する。
17のデータセットに対する評価は、最強のベースラインよりも14%の平均的な改善で、MoMaの優位性を示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:12:44 GMT)
CHBench: A Chinese Dataset for Evaluating Health in Large Language Models [19.2] 中国初の包括的安全志向の健康関連ベンチマークであるCHBenchを紹介する。
CHBenchは精神保健に関する6,493項目、身体健康に関する2,999項目で構成されており、幅広いトピックをカバーしている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:29:42 GMT)
Privacy Ripple Effects from Adding or Removing Personal Information in Language Model Training [19.1] PIIの量と容易性は、トレーニングパイプラインを通して進化するモデルの動的特性であることがわかった。
1) 訓練の後に見られる類似のPIIは, 覚醒と呼ばれる早期のシーケンスの記憶を引き出すことができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:14 GMT)
Knowledge Pyramid Construction for Multi-Level Retrieval-Augmented Generation [19.0] 精度とリコールのバランスを改善するために,RAGフレームワーク内の多層知識ピラミッドアプローチを提案する。
我々は,オントロジースキーマとインスタンスの包括的知識カバレッジと動的更新のために,層間拡張技術を採用している。
我々のアプローチであるPolyRAGは、ピラミッドの頂上からスタートし、自信ある答えが得られるまで進行する、検索のためのウォーターフォールモデルに従っています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:00:21 GMT)
FUNCTO: Function-Centric One-Shot Imitation Learning for Tool Manipulation [19.0] FUNCTOは3次元関数キーポイント表現と関数中心の対応を確立するOSIL方式である。
モジュール型OSIL法とエンド・ツー・エンドの動作クローン法に対するFUNCTOの評価を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:54:10 GMT)
DITING: A Static Analyzer for Identifying Bad Partitioning Issues in TEE Applications [18.9] パーティショニングの悪さは、TEEアプリケーションに重大なセキュリティ問題を引き起こす可能性がある。
本研究では,これらのパラメータのデータフローを分析し,セキュリティルール違反を識別するDIINGというツールを開発した。
実験では、DIINGが不良分割問題を識別する際のF1スコア0.90を達成することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:19:01 GMT)
Mitigating over-exploration in latent space optimization using LES [18.7] 潜時空間最適化(LSO)における過度探索を緩和するための潜時探索スコア(LES)を開発した。
LSOは変分オートエンコーダ(VAE)の潜在空間内での連続的な最適化を利用しており、過剰探索の影響を受けやすいことが知られている。
LESは、追加のトレーニングやアーキテクチャの変更、トレーニングデータへのアクセスなしに、任意のVAEデコーダで使用することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:00:06 GMT)
Evolving Hate Speech Online: An Adaptive Framework for Detection and Mitigation [18.5] 本稿では,単語埋め込みを用いて語彙を更新し,新たなスラリーや新しい言語パターンに適応するハイブリッドモデルを開発する適応的手法を提案する。
我々のハイブリッドモデルは、BERTとレキシコンベースの技術を組み合わせて、ほとんどの最先端データセットに対して95%の精度を達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:41:21 GMT)
Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [18.3] 本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットに対する実験により、SCAMは様々なバックボーンモデルの性能を一貫して改善することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:25:30 GMT)
Interleaved Block-based Learned Image Compression with Feature Enhancement and Quantization Error Compensation [18.2] 本稿では,機能抽出モジュール,機能改善モジュール,機能強化モジュールを提案する。
私たちの4つのモジュールは、最先端のlicメソッドに簡単に統合できます。
実験により、我々のモジュールとTiny-LICの組み合わせは、KodakデータセットとCLICデータセットのピーク信号対雑音比(PSNR)とマルチスケール構造類似性(MS-SSIM)の観点から、既存のlicメソッドと画像圧縮標準を上回ります。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:40:27 GMT)
Temporal Misalignment in ANN-SNN Conversion and Its Mitigation via Probabilistic Spiking Neurons [17.7] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)よりもエネルギー効率の良い代替手段を提供する
本研究では,ANN-SNN変換フレームワークにおいて,時間的ミスアライメント(temporal misalignment)と呼ばれる現象を同定する。
生物学的に可塑性二相確率性(TPP)刺激ニューロンを導入し,変換過程をさらに強化した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:05:35 GMT)
Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models [17.6] マルチモーダルおよび検索強化質問応答(QA)のためのチェーン・オブ・アクション・フレームワークを提案する。
文献と比較すると、CoAは現在のQAアプリケーションにおける2つの大きな課題を克服している: (i) リアルタイムやドメインの事実と矛盾しない不誠実な幻覚、(ii) 構成情報よりも弱い推論性能。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:32:54 GMT)
HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States [17.6] 本研究は,LVLMが内的アクティベーションにおける安全性関連信号を本質的にエンコードしているかどうかを考察する。
その結果,LVLMは安全でないプロンプトを処理する際に,異なる活性化パターンを示すことが明らかとなった。
HiddenDetectは、内部モデルのアクティベーションを活用して安全性を高める、新しいチューニング不要のフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:09:12 GMT)
Fed-SB: A Silver Bullet for Extreme Communication Efficiency and Performance in (Private) Federated LoRA Fine-Tuning [17.5] Fed-SB (Federated Silver Bullet) は、LORA-SBを用いたLLMの微調整のための新しい手法である。
Fed-SBは、常識推論、算術推論、言語推論タスクにまたがる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:05:19 GMT)
Exploring and Controlling Diversity in LLM-Agent Conversation [17.4] 本稿では,単一パラメータで多様性を制御できる新しい手法であるAdaptive Prompt Pruning (APP)を提案する。
APPは、広範囲な実験を通して出力の多様性を効果的に制御し、制御トレードオフのバランスをとる方法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:48:44 GMT)
Near Optimal Decision Trees in a SPLIT Second [17.0] 決定木最適化は、解釈可能な機械学習の基本である。
最近のアプローチでは、分岐と動的プログラミングとのバウンドを使って、グローバルな最適化が見つかる。
我々はSPLITと呼ばれるアルゴリズムのファミリーを導入し、この理想的なバランスを達成するために私たちをかなり前進させます。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:57:17 GMT)
LEAP: Enhancing Vision-Based Occupancy Networks with Lightweight Spatio-Temporal Correlation [16.9] 視覚に基づく占有ネットワークは、周囲の環境を再構築するためのエンドツーエンドのソリューションを提供する。
本稿では,既存の占有ネットワークの性能を大幅に向上させる軽量時空間相関法を提案する。
LEAPは、1)最近のベースラインと動きの特徴から共有されたコンパクトな潜在空間に情報をトークン化し、2)三ストリーム融合アーキテクチャを通して完全な相関関係を確立し、3)ベースラインの出力を強化する占有結果を生成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:07:45 GMT)
Have ASkotch: A Neat Solution for Large-scale Kernel Ridge Regression [16.8] ASkotchは、線形収束を確実に得るフルKRRのスケーラブルで加速された反復的手法である。
Askotchは23の大規模KRR回帰および分類タスクのテストベッド上で最先端のKRRソルバより優れている。
我々の研究は、多くの分野にわたる完全なKRRの非想像的応用の可能性を開く。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:38:28 GMT)
Exploring Embodied Multimodal Large Models: Development, Datasets, and Future Directions [16.8] 近年, 複合現実環境における知覚, 認知, 行動のギャップを埋める可能性から, 身体的マルチモーダル大モデル (EMLM) が注目されている。
本稿では,Large Language Models (LLM) やLarge Vision Models (LVM) などのモデルの開発について概説する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:41:27 GMT)
Mantis: Lightweight Calibrated Foundation Model for User-Friendly Time Series Classification [16.7] 我々は、Vision Transformerアーキテクチャに基づく時系列分類のための新しいオープンソース基盤モデルであるMantisを紹介する。
実験の結果,マンティスは背骨凍結時と微調整時の両方で既存の基礎モデルより優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:06:09 GMT)
Schema Augmentation for Zero-Shot Domain Adaptation in Dialogue State Tracking [16.7] ゼロショットドメイン適応のための現在の大規模言語モデルアプローチは、ターゲットドメインに関連する知識の導入を促すことに依存している。
本研究では,言語モデルのゼロショット領域適応を微調整により改善する新しいデータ拡張手法であるAugmentationを考案する。
MultiWOZ と SpokenWOZ の実験により,提案手法はベースラインよりも大幅に改善された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:54:37 GMT)
MMRAG: Multi-Mode Retrieval-Augmented Generation with Large Language Models for Biomedical In-Context Learning [16.6] 本稿では,新しいMulti-mode Search-augmented Generation (MMRAG) フレームワークを提案する。
MMRAGはランダムモード、トップモード、多様性モード、クラスモードの4つの検索戦略を統合している。
本研究は3つの中核生物医学的NLP課題に対するMRAGの評価である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:36:48 GMT)
PairBench: A Systematic Framework for Selecting Reliable Judge VLMs [16.5] PairBenchは、大規模視覚言語モデル(VLM)をカスタマイズ可能な類似性ツールとして体系的に評価するフレームワークである。
PairBenchを通じて、類似度スコアのキーデシラタを表す4つのメトリクスを紹介します。
我々の分析では、クローズドあるいはオープンソースを問わず、どのモデルもすべての指標より優れていることが示されています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:53:11 GMT)
Refined climatologies of future precipitation over High Mountain Asia using probabilistic ensemble learning [16.5] 高山アジアは極域外で最も凍った水が集中しており、19億人以上にとって重要な水源となっている。
気候変動に直面して、降水はこの地域における水文モデリングの最大の不確実性の源となっている。
本研究では,CoRCPの13の地域モデルを組み合わせた確率論的機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:33:00 GMT)
Space-O-RAN: Enabling Intelligent, Open, and Interoperable Non Terrestrial Networks in 6G [16.5] 本稿では,オープンラジオアクセスネットワーク(RAN)の原則を非地球ネットワーク(NTN)に拡張するフレームワークであるSpace-O-RANを紹介する。
階層的なクローズループ制御とSpace RAN Intelligent Controllers (Space-RICs)を使用して、両方のドメインにわたる操作を動的に管理し最適化する。
核となる機能は動的リンクインターフェースマッピングであり、ネットワーク関数が特定のアプリケーション要求に適応できるようにする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:03:37 GMT)
Paradigms of AI Evaluation: Mapping Goals, Methodologies and Culture [16.4] 我々は、AI評価の現場における最近の研究を調査し、6つの主要なパラダイムを特定した。
我々は,現在の評価手法の広さに対する意識を高め,異なるパラダイム間の相互補間を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:44:05 GMT)
SOTOPIA-Ω: Dynamic Strategy Injection Learning and Social Instrucion Following Evaluation for Social Agents [16.3] SOTOPIA-Omegaフレームワークは、言語エージェントの社会的能力を高めることを目的としている。
本稿では,ソーシャルインストラクション・フォロー(S-IF)の概念を導入し,新しい2つのS-IF評価指標を提案する。
高品質コーパスで訓練された複数の7Bモデルが,社会目標達成において専門家エージェント(GPT-4)をはるかに上回るだけでなく,S-IF性能も向上することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:40:37 GMT)
SWEPO: Simultaneous Weighted Preference Optimization for Group Contrastive Alignment [16.2] 我々はSWEPO(Sultaneous Weighted Preference Optimization)を提案する。
SWEPOはクエリ毎に複数のレスポンスを導入し、平均的な報酬から最も逸脱したレスポンスを優先順位付けする。
このような多重参照サンプリングはアライメントバイアスを低くし、真の許容応答分布から期待される偏差を$mathcalO(tfrac1sqrtk)$とすることを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:12:34 GMT)
SWAN: SGD with Normalization and Whitening Enables Stateless LLM Training [16.0] Gradient Descent(SGD)は、トレーニング中に状態変数をトラッキングしないため、ステートレスで拡張性がある。
本研究では,SGDを非定常的に前処理することで,LLMのトレーニングを行うAdamと同じ性能が得られることを示す。
正規化は勾配を安定化させ,損失景観の局所的な曲率に反することを示す。これによってSWAN (SGD with Whitening and Normalization) が成立し,任意の状態を保存する必要がなくなる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:37 GMT)
GNN-Coder: Boosting Semantic Code Retrieval with Combined GNNs and Transformer [16.0] 抽象構文木(AST)を利用するグラフニューラルネットワーク(GNN)に基づく新しいフレームワークであるGNN-Coderを紹介する。
GNN-Coderは、CSNデータセットのMRRが1%-10%改善され、CosQAデータセットのゼロショットパフォーマンスが20%向上するなど、検索パフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:29:53 GMT)
BAN: Neuroanatomical Aligning in Auditory Recognition between Artificial Neural Network and Human Cortex [16.0] 脳のような聴覚ネットワーク(BAN)が導入され、神経解剖学的にマッピングされた4つの領域と繰り返し接続が組み込まれている。
BASは、BANと人間の聴覚認識経路の類似性を評価するベンチマークとして機能する。
以上の結果から,大脳皮質の神経解剖学的類似性とANNの聴覚分類能力は良好であることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:57:01 GMT)
An Audio-Visual Fusion Emotion Generation Model Based on Neuroanatomical Alignment [16.0] 我々は、脳に似た感情学習のためのオーディオ・ビジュアル・フュージョン(AVF-BEL)という新しいフレームワークを紹介する。
従来の脳に触発された感情学習法とは対照的に,本手法は音声・視覚的感情融合と生成モデルを改善する。
実験結果から,音声-視覚融合感情学習モデルとの類似性に大きな改善が認められた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:26:58 GMT)
Exploring Quasi-Global Solutions to Compound Lens Based Computational Imaging Systems [16.0] 本稿では、複合レンズベースの計算画像システムを自動的に設計するQuasi-Global Search Optics (QGSO)を提案する。
QGSOは、優れたグローバル検索能力を実現するための変換エンドツーエンドのレンズ設計パラダイムとして機能する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:05:29 GMT)
PP-MARL: Efficient Privacy-Preserving Multi-Agent Reinforcement Learning for Cooperative Intelligence in Communications [16.0] 多エージェント強化学習(MARL)は,コミュニケーション問題において協調的知能(CI)を実現するための一般的な手法である。
MARLのプライバシー保護を保証することは、情報の共有を通じて相互に学習する異種エージェントが存在するため、難しい課題である。
MARLの効率的なプライバシー保護学習手法であるPP-MARLを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:23:57 GMT)
Do Large Language Models Truly Understand Geometric Structures? [15.9] 我々はGeomRelデータセットを導入し、大規模言語モデルの幾何学的構造に対する理解を評価する。
我々は,LLMの幾何学的関係を識別する能力を高めるGeometry Chain-of-Thought (GeoCoT)法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:50:25 GMT)
Exact Recovery of Sparse Binary Vectors from Generalized Linear Measurements [15.9] 線形推定アルゴリズムを解析し,必要な測定値の数に基づいて情報理論の下限を示す。
雑音のある1ビットの量子化線形測定に対して、$O((k+sigma2)logn)$, $sigma2$はノイズ分散である。
また、ロジスティック回帰のための厳密なサンプル複雑性のキャラクタリゼーションも取得する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:46:24 GMT)
Reasoning based on symbolic and parametric knowledge bases: a survey [15.6] 推論(Reasoning)とは、既存の知識に基づいて新たな結論を導くこと。
本稿ではまず,知識ベースを記号とパラメトリックに分類する。
次に,記号的知識ベース,パラメトリック知識ベース,およびそれらの両方を用いた推論手法の概要について概説する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:53:35 GMT)
Analyzing the Inner Workings of Transformers in Compositional Generalization [15.6] 本稿では,トランスフォーマーモデルの内部動作について,一般化性能に寄与する既存のサブネットワークを見つけることによって検討する。
モデルが正しい解を出力するための構文的特徴に依存していることがわかったが、全体のモデルよりもはるかに優れた一般化性能を持つサブネットワークは非合成アルゴリズムに依存している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:07:53 GMT)
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation [15.5] Mixup Model Mergeは、Mixupデータ拡張技術にインスパイアされた革新的なアプローチである。
M$3$は、マージされたモデルの性能を大幅に向上させる、単純だが効果的なモデルマージ手法である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:01:26 GMT)
Detecting Future-related Contexts of Entity Mentions [15.1] 本稿では,エンティティ中心のテキストにおける暗黙的な未来の参照を検出することに焦点を当てる。
ウィキペディアから派生した人気エンティティを中心に構築された19,540の文からなる新しいデータセットを最初に提示する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:34:34 GMT)
Towards Foundation Models for Mixed Integer Linear Programming [15.1] MILPの最近のディープラーニングアプローチは、特定の問題クラスに焦点を当てており、目に見えないクラスに一般化しない。
多様なMILPクラスを多数生成できる新しい進化的フレームワークであるMILP-Evolveを紹介する。
実験の結果,MILP-Evolveが生成したデータに基づいてトレーニングしたモデルでは,目に見えない問題に対して大幅な改善が得られた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:00:52 GMT)
MHQA: A Diverse, Knowledge Intensive Mental Health Question Answering Challenge for Language Models [15.0] メンタルヘルスは、うつ病や不安など、世界中で難しい問題であり続けている。
メンタルヘルスには質問応答(QA)のための標準ベンチマークデータセットが不足している。
我々の研究は、言語モデル(LM)のベンチマークのための新しいマルチ選択データセット、MHQA(Mental Health Question Answering)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:37:58 GMT)
Aligning the Objective of LLM-based Program Repair [14.9] 本稿では,大規模言語モデル (LLM) をプログラム修復に適用するための新しいアプローチについて検討する。
我々の中核的な洞察は、LLMのAPR能力は、単にトレーニング目標に出力を合わせるだけで大幅に改善できるということです。
この知見に基づいて、我々はAPRの直接的なプロンプトフレームワークであるD4Cを設計した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:06:51 GMT)
Learning Chern Numbers of Topological Insulators with Gauge Equivariant Neural Networks [14.7] 我々は、トポロジカル凝縮物質物理学の理論におけるゲージ-等変ネットワークの新しい応用領域を導入する。
ゲージ同変ネットワークを用いて、多バンドトポロジカル絶縁体のトポロジ的不変量(チャーン数)を予測する。
自明なチャーン数を持つサンプルをトレーニングするが、我々のモデルは非自明なチャーン数を持つサンプルに一般化することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:00:34 GMT)
CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning [14.6] CoverLibは、ライブラリに経験分類器ペアを反復的に追加する。
未発見領域を効果的にカバーする機能に基づいて、次のエクスペリエンスを選択する。
それは、問題領域に対する高速な計画と高い成功率の両方を達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:23:51 GMT)
Generalized Exponentiated Gradient Algorithms Using the Euler Two-Parameter Logarithm [14.6] 本稿では,ミラー・ディフレッシュ (MD) アプローチを用いたGEGアルゴリズムの新たなクラスを提案し,検討する。
一般化エントロピーと関連する変形対数の概念は、新しい勾配降下更新について深い洞察を与える。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:05:04 GMT)
Tokenization is Sensitive to Language Variation [14.6] トケナイザーはテキストを小さな単位に分割し、あまり一般的でない言語形式に対して異なる振る舞いをするかもしれない。
これは2種類のタスクに対して、下流のLLMパフォーマンスに異なる影響を与える可能性がある。
重要なアルゴリズム設計選択が下流モデルの性能に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:58:54 GMT)
SafeInt: Shielding Large Language Models from Jailbreak Attacks via Safety-Aware Representation Intervention [14.5] Jailbreak攻撃は、望ましくない振る舞いを引き起こすために、大きな言語モデル(LLM)の脆弱性を利用する。
以前の防御は、しばしば効果と効率の両方を同時に達成できない。
セーフインベンション(SafeIntervention, セーフインベンション)は, 安全を意識した表現介入を通じて, LLMをジェイルブレイク攻撃から保護する新しい防御手法である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:12:35 GMT)
Efficient Estimation of Shortest-Path Distance Distributions to Samples in Graphs [14.5] 本稿では,最短経路距離の分布を推定するための高精度かつ効率的なフレームワークを提案する。
我々のフレームワークは経験的手法よりも高速で、次数分布の仕様しか必要としない。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:21:21 GMT)
Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture Priors [14.5] 我々は、表現学習型アルゴリズムの一般化誤差に基づいて、予測内およびテール境界を確立する。
本稿では,データ依存型ガウス混合を同時に学習し,それを正規化器として用いるための体系的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:43:31 GMT)
Interactive incremental learning of generalizable skills with local trajectory modulation [14.4] 軌道分布の局所的および大域的変調を同時に活用するインタラクティブな模倣学習フレームワークを提案する。
提案手法では, インクリメンタルかつインタラクティブに, 1) モデル精度の向上, 2) 実行中のタスクに新しいオブジェクトの追加,3) デモが提供されていない領域にスキルを拡大する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:46:59 GMT)
EDA-Q: Electronic Design Automation for Superconducting Quantum Chip [14.3] EDA-Qと呼ばれる量子チップ設計に特化したフルスタックEDAツールを開発した。
EDA-Qは、デバイスマッピングや製造プロセスマッピングといった重要な設計段階を補完しながら、既存の量子EDAツールに存在する機能を組み込んでいる。
統合デザインモードは、異なるチップコンポーネントとのアルゴリズム互換性を保証し、ユーザーに対して単純で適応可能なコマンドインターフェースを提供するために、特別にインタラクティブな処理モードを使用する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:10:24 GMT)
Estimating Control Barriers from Offline Data [14.2] 本稿では、トレーニング前に収集した厳密なラベル付きデータセットを通じて、ニューラルCBFを学習するための新しいフレームワークを提案する。
オフラインデータの量は限られており、動的障害物回避のための最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:55:20 GMT)
Conditional [MASK] Discrete Diffusion Language Model [14.2] Diffusion-EAGSは、条件付きマスキング言語モデルと拡散言語モデルを統合するフレームワークである。
本研究では,Diffusion-EAGSが最高の品質・多様性のトレードオフを実現し,非自己回帰テキスト生成の有効性を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:44:56 GMT)
IllusionCAPTCHA: A CAPTCHA based on Visual Illusion [14.0] 我々は、"Human-Easy but AI-Hard"パラダイムを用いた新しいセキュリティメカニズムであるIllusionCAPTCHAを提案する。
その結果,初回試験では86.95%の参加者がCAPTCHAに合格し,他のCAPTCHAシステムよりも優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:12:06 GMT)
Aligning Task- and Reconstruction-Oriented Communications for Edge Intelligence [13.9] 本稿では,エッジインテリジェンスのための再構築指向とタスク指向のコミュニケーションを連携させる新しいコミュニケーションフレームワークを提案する。
提案フレームワークはエッジベースの自動運転シナリオにおいて特に有効である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:55:41 GMT)
ARS: Automatic Routing Solver with Large Language Models [13.9] 本稿では,自動ルーティング解法の有効性を評価するために,24属性から派生した1000種類のVRPのベンチマークであるRoutBenchを紹介する。
RoutBenchとともに,Large Language Model (LLM) エージェントを用いてバックボーンアルゴリズムフレームワークを強化する自動ルーティングソルバー(ARS)を提案する。
ARSは最先端のLCMベースの手法と一般的に使用されるソルバより優れており、一般的なVRPの91.67%が自動的に解決され、すべてのベンチマークで少なくとも30%の改善が達成されている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:14:55 GMT)
Savaal: Scalable Concept-Driven Question Generation to Enhance Human Learning [13.8] Savaalはスケーラブルな質問生成システムで、3つの目的がある。
概念的推論をテストするための事実的リコール以上の質問を生成する。
多様な知識領域にまたがる質問を自動的に生成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:01:08 GMT)
LightMamba: Efficient Mamba Acceleration on FPGA with Quantization and Hardware Co-design [13.7] Mambaのようなステートスペースモデル(SSM)が最近注目を集めている。
我々は,効率的なマンバ推定のために,量子化アルゴリズムとFPGAアクセラレータアーキテクチャを共設計するLightMambaを提案する。
我々は、Xilinx Versal VCK190FPGA上にLightMambaを実装し、GPUベースラインよりも4.65倍から6.06倍高いエネルギー効率を達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:23:23 GMT)
PAPI: Exploiting Dynamic Parallelism in Large Language Model Decoding with a Processing-In-Memory-Enabled Computing System [13.7] PAPI は PIM 対応のヘテロジニアスアーキテクチャで,計算バウンドカーネルやメモリバウンドカーネルを適切なハードウェアユニットに動的にスケジューリングする。
PAPIは最先端の異種加速器と最先端のPIM専用加速器で1.8$times$と11.1$times$を達成している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:52:31 GMT)
BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models [13.7] この研究は、バイアス継承に対抗するために設計された新しいPEFT法であるBias-Alleviating Low-Rank Adaptation (BA-LoRA)を導入している。
BA-LoRAは、(1)整合正則化器、(2)多様性正則化器、(3)特異値分解正則化器の3つの異なる正則化項を含む。
その結果、BA-LoRAはLoRAとその最先端の変種よりも優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:43:43 GMT)
M2LADS Demo: A System for Generating Multimodal Learning Analytics Dashboards [13.6] 本稿では,M2LADS (System for Generating Multimodal Learning Analytics Dashboards) と呼ばれるWebベースのシステムを提案する。
本システムは,Web ベースのダッシュボード上での生体情報および行動データを多岐にわたって提示し,様々な生理的および活動的指標に関する詳細な知見を提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:22:08 GMT)
Projection Optimization: A General Framework for Multi-Objective and Multi-Group RLHF [13.6] MORLHF(Multi-Objective RLHF)は、目的ごとの嗜好フィードバックを利用し、最適化のための単一の統一目的に集約することで、これらの目標間の最適性を達成することを目的としている。
本稿では,本フレームワークがサブリニアな後悔を実現し,報酬のないアルゴリズムに容易に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:56:52 GMT)
Privacy-Enhanced Training-as-a-Service for On-Device Intelligence: Concept, Architectural Scheme, and Open Problems [13.5] オンデバイスインテリジェンス(ODI)は、AIアプリケーションをエンドデバイス上で動作させ、リモートサーバに頼ることなく、リアルタイムでカスタマイズされたAI推論を提供する。
デバイス上でのデプロイメントのトレーニングモデルは、ユーザのデータの分散化とプライバシに敏感な性質のため、課題に直面します。
エンドデバイス向けにプライバシフレンドリでカスタマイズされたAIモデルトレーニングを提供する新しいサービスコンピューティングパラダイムである、プライバシ強化トレーニング・アズ・ア・サービス(PT)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:07:03 GMT)
CoKV: Optimizing KV Cache Allocation via Cooperative Game [13.4] 大規模言語モデル(LLM)は、人間の生活の様々な側面において顕著な成功を収めた。
これらのモデルをデプロイする際の大きな課題の1つは、キーと値のペアを保存するのに必要なかなりのメモリ消費である。
モデル推論における頭部間の協調を協調ゲームとしてモデル化する新しい手法であるCoKVを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:03:07 GMT)
Quantifying the Capability Boundary of DeepSeek Models: An Application-Driven Performance Analysis [13.4] DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwenシリーズ、およびDeepSeek-R1-Distill-Llamaシリーズをアプリケーション駆動ベンチマークであるA-Eval (A-Eval-2.0)の改良版で評価した。
本結果から, 推理強化モデルでは, 一般には強力ではあるが, 全てのタスクにおいて性能が向上するわけではなく, タスクやモデル間で性能が著しく変化していることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:15:57 GMT)
Instance-Level Difficulty: A Missing Perspective in Machine Unlearning [13.1] 完全インスタンスレベルのアンラーニング性能分析により,機械学習を困難にさせる難易度について検討する。
特に,データポイントの学習を困難にする4つの要因を要約する。
機械学習の研究は、未学習のインスタンスレベルの難しさに注意を払うべきだと我々は主張する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:44:56 GMT)
Accuracy of Wearable ECG Parameter Calculation Method for Long QT and First-Degree A-V Block Detection: A Multi-Center Real-World Study with External Validations Compared to Standard ECG Machines and Cardiologist Assessments [12.8] FeatureDBは、ウェアラブルシングルリード信号からECGパラメータを自動的に計算する新しいアルゴリズムである。
これは、標準ECGマシンによって計算されたキーパラメータ(PR間隔、QRS間隔、QT間隔、QTc)と統計的に有意な相関を示す。
FeatureDBはLong QT症候群(LQT)と房室ブロック間隔異常(AVBI)の検出において堅牢な診断性能を示した
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:11:17 GMT)
Bridging Domain Gaps between Pretrained Multimodal Models and Recommendations [12.8] textbfPTMRecは、事前訓練されたモデルとレコメンデーションシステムの間のドメインギャップを埋める新しいフレームワークである。
このフレームワークは、コストのかかる事前トレーニングの必要性をなくすだけでなく、様々なパラメータ効率のチューニング方法にも柔軟に対応する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:50:14 GMT)
When Compression Meets Model Compression: Memory-Efficient Double Compression for Large Language Models [12.7] 本稿では,量子化後の大規模言語モデル(LLM)を圧縮するフレームワークを提案する。
量子化に先立ってモデルパラメータを再スケーリングすることにより, モデル重量圧縮性を高めるために, 圧縮対応量子化法が最初に提案され, さらにさらに改良するプルーニング法が提案されている。
圧縮されたモデルによる推論は、精度と推論速度の損失を無視して、メモリサイズを40%削減できることを示す実験である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:11:22 GMT)
A Close Look at Decomposition-based XAI-Methods for Transformer Language Models [12.5] XAIアトリビューション手法は近年,トランスフォーマーアーキテクチャのために提案されている。
我々は最近提案された AttnLRP 変種を含むALTI-Logit 法と LRP 法を比較し拡張する。
言語モデルやコードに対する属性を評価するために、慎重に構築されたベンチマークデータセットを公開しています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:09:40 GMT)
HOpenCls: Training Hyperspectral Image Open-Set Classifiers in Their Living Environments [12.5] ハイパースペクトル画像(HSI)のオープンセット分類は,実環境に展開するHSI分類モデルにおいて重要である。
本稿では,未ラベルの野生データを活用するための新しいフレームワークであるHOpenClsを提案する。
実験により、複雑な実世界のシナリオにおいて、ワイルドデータはオープンセットのHSI分類を大幅に向上する可能性が示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:59:18 GMT)
Flow of Reasoning:Training LLMs for Divergent Problem Solving with Minimal Examples [12.5] Flow of Reasoning (FoR)は、最小限のデータで推論の品質と多様性を改善することを目的としている。
FoR は DAG 構造推論グラフ上のマルコフフローとして多段階 LLM 推論を定式化する。
実験によると、限られたトレーニング例で、FoRは多様な創造的で高品質なソリューションの発見を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:17:17 GMT)
Is Free Self-Alignment Possible? [12.4] AlignEZは、自己生成の好みデータと表現編集を活用して、費用対効果と効率的なアライメントを実現する新しいアプローチである。
本実験により, コスト効率の向上により, 各種タスクの性能向上が図られた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:54:05 GMT)
R-LoRA: Random Initialization of Multi-Head LoRA for Multi-Task Learning [12.4] ローランク適応 (LoRA) はパラメータ効率の高い微調整法として最も一般的なものの一つである。
マルチヘッドランダム化を取り入れたR-LoRAを提案する。
実験により、R-LoRAはタスク固有の知識を捉えるのに優れていることが示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:30:21 GMT)
Round Attention: A Novel Round-Level Attention Mechanism to Accelerate LLM Inference [12.3] 会話ラウンドが続くにつれて、大量のKVキャッシュをGPUメモリに格納する必要がある。
我々は,最も関連性の高いラウンドのKVキャッシュをリコールし,計算するラウンドアテンション機構であるラウンドアテンションを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:40:07 GMT)
RGB-Only Gaussian Splatting SLAM for Unbounded Outdoor Scenes [12.2] 3D Gaussian Splatting (3DGS) はSLAMにおいて高忠実性ノベルビューを生成するため、一般的なソリューションとなっている。
従来のGSベースの手法は主に屋内シーンをターゲットにしており、RGB-Dセンサーや事前訓練された深度推定モデルに依存している。
本稿では,RGBのみのガウススプラッティングSLAM法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:02:31 GMT)
Stein Discrepancy for Unsupervised Domain Adaptation [12.1] 教師なしドメイン適応(UDA)は、ラベル付きソースデータセットからの情報を活用し、関連するがラベルなしのターゲットデータセットの精度を改善する。
従来の手法では、ワッサーシュタイン距離や平均誤差の最大値といった距離を用いていた。
本稿では、ソースとターゲットドメイン間の距離を測定するために、スタイン差分を用いた新しいUDA手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:36:42 GMT)
Model Privacy: A Unified Framework to Understand Model Stealing Attacks and Defenses [11.9] この研究は、モデルプライバシ(Model Privacy)と呼ばれるフレームワークを提示し、モデル盗難攻撃と防御を包括的に分析する基盤を提供する。
本稿では,攻撃戦略と防衛戦略の妥当性を定量化する手法を提案し,MLモデルにおけるユーティリティとプライバシの基本的なトレードオフを分析する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:29:11 GMT)
Offload Rethinking by Cloud Assistance for Efficient Environmental Sound Recognition on LPWANs [11.9] 生物研究や都市規模センシングシステムにおける超低消費電力環境モニタリングの重要手法として,学習型環境音声認識が登場している。
オンデバイス音声認識における最近の取り組みは,資源制約による精度の低下に悩まされているが,クラウドオフロード戦略は通信コストの増大によって妨げられている。
低消費電力広帯域ネットワーク(LPWAN)上で動作している電池レスデバイス上での,資源効率の高いクラウド支援環境音声認識システムORCAを紹介する。
以上の結果から,ORCAは省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エ
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:23:32 GMT)
CoT-ICL Lab: A Petri Dish for Studying Chain-of-Thought Learning from In-Context Demonstrations [11.9] CoT-ICL Labは、合成トークン化されたデータセットを生成するためのフレームワークと方法論である。
我々は,言語モデルにおける文脈内学習(ICL)のチェーン・オブ・シント(CoT)を体系的に研究する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:24:54 GMT)
From Text to Trajectory: Exploring Complex Constraint Representation and Decomposition in Safe Reinforcement Learning [11.9] 手作業で設計したコスト関数を置き換えるために,T Trajectory-level Textual Constraints Translator (TTCT)を導入した。
実験の結果,TTCTはテキストの制約や軌道を効果的に理解しており,TTCTが訓練したポリシーは標準コスト関数よりも低い違反率が得られることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:20:29 GMT)
An Exploratory Study on Build Issue Resolution Among Computer Science Students [11.8] コンピュータサイエンス(CS)の学生は、OSSがローカルマシンを構築できないという共通の課題に遭遇することが多い。
CS学生が直面しているビルド問題にも拘わらず、この話題を探求する研究は乏しい。
第1フェーズでは、学生が直面したビルド問題、解決の試み、そしてそれらの試みの有効性を特徴付ける。
第2段階では、学生に重要な情報(例えば、推奨プログラミング言語バージョン)を強調する介入手法が導入された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:02:45 GMT)
LaM-SLidE: Latent Space Modeling of Spatial Dynamical Systems via Linked Entities [11.8] 本稿では、LaM-SLidE(リンクされたエンティティによる空間力学系のラテント空間モデリング)を提案する。
我々のアプローチは、グラフニューラルネットワークの利点、すなわち時間ステップ間でのエンティティのトレーサビリティを組み合わせたものです。
本稿では,LaM-SLidEが速度,精度,一般化性において良好に動作することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:25:23 GMT)
Solving Inverse Problems with Deep Linear Neural Networks: Global Convergence Guarantees for Gradient Descent with Weight Decay [11.6] 重み劣化で訓練された深い線形ネットワークは,データ内の潜在部分空間構造に自動的に適応することを示す。
これは、重量減衰で訓練された深い線形ネットワークが、データの潜在部分空間構造に自動的に適応することを示す最初の結果である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:24:34 GMT)
TurboFuzzLLM: Turbocharging Mutation-based Fuzzing for Effectively Jailbreaking Large Language Models in Practice [11.6] 我々は,有効なジェイルブレイクテンプレートのコレクションを効率よく見つけるために,突然変異ベースのファジリング技術であるTurboFuzzLLMを提案する。
TurboFuzzLLMは、LLMをリードする公開データセットに対して、95%の攻撃成功率で$geqを達成している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:10:12 GMT)
Post-edits Are Preferences Too [11.4] 機械翻訳では、ペアの好みは5点評価のような他の人間のフィードバックよりも信頼性が低い。
機械翻訳では,5点評価など,人間からのフィードバックよりもペアの選好の方が信頼性が低いことを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:53:53 GMT)
AVD2: Accident Video Diffusion for Accident Video Description [11.2] AVD2(Accident Video Diffusion for Accident Video Description)は,事故現場の理解を高める新しいフレームワークである。
このフレームワークは、自然言語の詳細な記述や推論と一致した事故ビデオを生成し、その結果、EMM-AUデータセットが生成される。
EMM-AUデータセットの統合は、自動メトリクスと人的評価の両方で最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:33:06 GMT)
AutoMR: A Universal Time Series Motion Recognition Pipeline [11.2] マルチモーダルデータセット用に設計されたエンドツーエンドの自動モーション認識(AutoMR)パイプラインを提案する。
提案するフレームワークは、データ前処理、モデルトレーニング、ハイパーパラメータチューニング、評価をシームレスに統合し、さまざまなシナリオで堅牢なパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:59:41 GMT)
Local geometry of high-dimensional mixture models: Effective spectral theory and dynamical transitions [11.1] 本研究では,高次元における経験的リスクの局所幾何学を,ヘッセン行列と情報行列のスペクトル理論を用いて研究する。
経験的スペクトル分布と外周固有値の限界について正確な式を証明した。
多クラスロジスティック回帰の場合の有効動力学を解析し,本研究の一般的な結果を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:26:25 GMT)
Deep Parallel Spectral Neural Operators for Solving Partial Differential Equations with Enhanced Low-Frequency Learning Capability [11.1] 低周波情報を学習する能力を高めるために,DPNO(Deep Parallel Spectral Neural Operator)を提案する。
本手法は,並列モジュールによる低周波情報学習能力を向上させる。
この情報を畳み込みマッピングによってスムーズにすることで、高周波エラーを低減する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:53:49 GMT)
IPAD: Inverse Prompt for AI Detection -- A Robust and Explainable LLM-Generated Text Detector [11.1] 大規模言語モデル(LLM)は、人間の書き起こしとLLM生成の区別を複雑にするテキスト生成において、人間レベルの流布を達成している。
既存の検出器は流通外のデータや攻撃されたデータに弱い堅牢性を示しており、これは現実世界のシナリオにとって重要なものである。
本稿では,入力テキストを生成可能な予測プロンプトを識別するPromptと,入力テキストが予測プロンプトとどのように一致しているかを調べるDistinguisherからなる新しいフレームワークであるIPAD(Inverse Prompt for AI Detection)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:41:32 GMT)
Pub-Guard-LLM: Detecting Fraudulent Biomedical Articles with Reliable Explanations [11.1] Pub-Guard-LLMは、バイオメディカルな論文の不正検出に適した、大規模な言語モデルベースのシステムである。
Pub-Guard-LLMは、様々なベースラインのパフォーマンスを一貫して上回る。
科学的不正検出における検出性能と説明可能性の両方を向上させることで、Pub-Guard-LLMは、新しい効果的なオープンソースツールによる研究完全性の保護に寄与する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:54:56 GMT)
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers [11.0] Diffusion Transformerは、テキスト・ツー・イメージとテキスト・ツー・ビデオ生成において重要な役割を果たす。
本稿では,Relevance-Guided Efficient Controllable GenerationフレームワークRelaCtrlを提案する。
本手法は PixArt-delta と比較して, パラメータと計算複雑性の 15% しか得られず, 優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:02:02 GMT)
Computation Tree Logic Guided Program Repair [10.9] 本稿では,CTL特性によって誘導される無限状態プログラムの自動修復機構を提案する。
我々のフレームワークは,プログラムとCTLプロパティをDatalogのファクトとルールにエンコードし,解析ルールをパスするために事実を変更することで修復を行う。
提案手法は,小規模ベンチマークでは56.6%,実世界のベンチマークでは88.5%であり,ベースライン性能は27.7%,76.9%であった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:59:38 GMT)
Disentangling Safe and Unsafe Corruptions via Anisotropy and Locality [10.8] 最先端の機械学習システムは、脅威モデルに従って「小さい」が定義される場合、入力に対する小さな摂動に対して脆弱である。
本稿では,既存の等方的およびグローバルな脅威モデルを超えるロバスト性を研究するために,textttProjected Displacement (PD) と呼ばれる新しい脅威モデルを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:36:48 GMT)
Bridging Bug Localization and Issue Fixing: A Hierarchical Localization Framework Leveraging Large Language Models [10.8] 本稿では、3つのカスタマイズされた大言語モデルを利用した最初の階層型バグローカライズフレームワークであるBugCerberusについて述べる。
まず、BugCerberusはファイル、関数、ステートメントレベルでバグ関連プログラムの中間表現を分析し、その表現からバグ関連コンテキスト情報を抽出する。
次に、BugCerberus氏は、バグレポートとコンテキストを使用して、各レベルで3つのカスタマイズされたLLMを設計し、バグのパターンを学習する。
最後に、BugCerberusは3つのレベルでバグをローカライズするために、よく調整されたモデルを通してバグ関連コード要素を階層的に検索する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:37:02 GMT)
SAMG: Offline-to-Online Reinforcement Learning via State-Action-Conditional Offline Model Guidance [10.8] オフラインからオンラインへの強化学習(O2O)は、オフラインデータの事前トレーニングモデルを作成し、オンラインの微調整を通じてポリシーを洗練する。
SAMG(State-Action-Conditional Offline Model Guidance)を紹介する。
トレーニング済みのオフライン批評家を凍結し、各ステートアクションサンプルに対してコンパクトなオフライン理解を提供する。
D4RLベンチマークでは最先端のO2O RLアルゴリズムを上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:46:46 GMT)
I-MCTS: Enhancing Agentic AutoML via Introspective Monte Carlo Tree Search [10.7] イントロスペクティブモンテカルロ木探索(Introspective Monte Carlo Tree Search, I-MCTS)は、イントロスペクティブプロセスを通じてツリーノードを反復的に拡張する新しいアプローチである。
我々は,各ノードの解の直接評価を容易にするために,LLM(Large Language Model)ベースの値モデルを統合する。
当社のアプローチでは,強力なオープンソースAutoMLエージェントと比較して,パフォーマンスが6%向上している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:19:47 GMT)
Rethinking Open-Vocabulary Segmentation of Radiance Fields in 3D Space [10.5] 問題を再定義し、3次元のボリュームを分割し、以下の方法を提案する。
従来の2Dピクセルの監督を代行する手法とは異なり、言語埋め込みフィールドをトレーニングするための3Dポイントを直接監督する。
学習した言語フィールドを3DGSに転送し、トレーニング時間や精度を犠牲にすることなく、最初のリアルタイムレンダリング速度を達成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:43:11 GMT)
Robust Bias Detection in MLMs and its Application to Human Trait Ratings [10.1] 混合モデルを用いてバイアスを定量化するための統計的手法を提案する。
我々は、$textitpersonality$と$textitcharacter$ traitsという文脈でジェンダーバイアスの新たな問題を探求する。
ALBERTは二分性には偏りがないが、非二分性には最も偏りがあるのに対して、RoBERTa-largeは二分性には最も偏りがあるが、$textitneo$には偏りがない。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:18:02 GMT)
ELMI: Interactive and Intelligent Sign Language Translation of Lyrics for Song Signing [10.0] ELMIは、リアルタイムでシンクされた歌詞とミュージックビデオのスニペットで、ユーザーがグルースを1行ずつ編集することを可能にする。
ユーザーは大きな言語モデル駆動AIとチャットして、意味、光沢、動機付け、タイミングについて議論することもできる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:40:52 GMT)
Large Language Models for Mobility Analysis in Transportation Systems: A Survey on Forecasting Tasks [10.0] 機械学習とディープラーニングの方法は、その柔軟性と正確性に好まれる。
大規模言語モデル (LLMs) の出現に伴い、多くの研究者がこれらのモデルと過去の手法を組み合わせ、将来の交通情報や人間の旅行行動を直接予測するためにLLMを適用した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:14:05 GMT)
"Who Has the Time?": Understanding Receptivity to Health Chatbots among Underserved Women in India [9.8] インドの都市部における被収容者とのインタビューとグループディスカッションを行った。
以上の結果から,デジタルアクセスと現実のギャップが明らかとなり,女性が負担する様々な責任との対立が認識された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:27:38 GMT)
Online Planning of Power Flows for Power Systems Against Bushfires Using Spatial Context [9.7] 2019-20 オーストラリアのブッシュファイアは、多くの経済的損失をもたらし、電力システムの運用に大きな影響を及ぼした。
停電により発電所や送電線が著しく影響を受け、運用コストが増大する。
本研究では,停電を受ける電力系統の最適潮流(OPF)を計画する上で,基本的かつ困難な課題について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:04:25 GMT)
OptMATH: A Scalable Bidirectional Data Synthesis Framework for Optimization Modeling [9.6] 高品質な最適化モデリングデータセットの欠如は、大きな言語モデルを悩ませます。
本稿では,OptMATHという高品質なデータセットを合成するためのスケーラブルなフレームワークを提案する。
我々は,OptMATHでトレーニングした様々なサイズのモデルが,複数のモデリングベンチマークにおいて優れた結果が得られることを実証した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:54:36 GMT)
HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM [9.5] HeRCULESデータセットは、ヘテロジニアスレーダー、FMCW LiDAR、IMU、GPS、カメラを備えた包括的なマルチモーダルデータセットである。
これは、FMCW LiDARと並行して4Dレーダと回転レーダを統合する最初のデータセットであり、非並列なローカライゼーション、マッピング、位置認識機能を提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:56:17 GMT)
ReviewEval: An Evaluation Framework for AI-Generated Reviews [9.4] 本研究は、AI生成レビューのための総合的な評価フレームワークを紹介する。
人間の評価との整合性を測定し、事実の正確性を検証し、分析的な深さを評価し、実行可能な洞察を識別する。
我々のフレームワークは、AIベースのレビューシステムを評価するための標準化されたメトリクスを確立する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:01:22 GMT)
Position: Beyond Assistance -- Reimagining LLMs as Ethical and Adaptive Co-Creators in Mental Health Care [9.3] このポジションペーパーは、大規模言語モデル(LLM)がメンタルヘルスドメインにどのように統合されるか、という変化を論じている。
我々は、単なる補助ツールではなく、共同創造者としての役割を主張する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:41:20 GMT)
Q-PETR: Quant-aware Position Embedding Transformation for Multi-View 3D Object Detection [9.3] PETRベースの手法は3D知覚においてベンチマークを支配しており、現代の自律運転システムにおいて重要なコンポーネントになりつつある。
Q-PETRと呼ばれる多視点3次元物体検出のための量子化対応位置埋め込み変換を提案する。
提案手法は,標準8ビット/テンソル後量子化法において,mAPおよびNDSの低下を1%以内に抑える。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:26:23 GMT)
Beyond Fixed Variables: Expanding-variate Time Series Forecasting via Flat Scheme and Spatio-temporal Focal Learning [9.2] 現実世界のアプリケーションでは、Cyber-Physical Systemsはしばしば新しいセンサーが登場するにつれて拡張され、MTSFの変数が増加する。
本課題は,(1)新しい変数の追加による不整合データ処理,(2)時間的不整合学習に対処する,というユニークな課題を提示する。
これらの課題に対処するため, フレキシブル時間予測フレームワークSTEVを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:43:26 GMT)
A Multi-modal Approach to Dysarthria Detection and Severity Assessment Using Speech and Text Information [9.2] 本研究は、音声とテキストのモダリティを両立させる新しいアプローチを提案する。
本手法は,クロスアテンション機構を用いて,音声とテキスト表現の音響的・言語的類似性を学習する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:49:04 GMT)
Automating Curriculum Learning for Reinforcement Learning using a Skill-Based Bayesian Network [9.1] 本稿では,スキルセットと目標セットの確率的関係をモデル化したSEBN(スキル-環境ベイズネットワーク)を紹介する。
提案手法は,SEBNのエージェント成功の推定値を用いて,期待される改善によって次のタスクを評価するアルゴリズムである。
この結果,SEBNを用いて構築したキュリキュラは,他のベースラインよりも頻繁に優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:38:00 GMT)
Improving Consistency in Large Language Models through Chain of Guidance [9.0] Chain of Guidance (CoG)は、大規模言語モデル(LLM)から高度に一貫した出力を生成する多段階プロンプト技術である。
我々は、一貫した入出力ペアからなる合成データセットを用いて、一貫した正しい出力を生成する。
我々の微調整モデルは、ベースモデルに比べて2倍以上の一貫性があり、微調整プロセスで使用されていないデータセットに対して一貫した出力を生成することにより、強力な一般化能力を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:41:37 GMT)
SentiFormer: Metadata Enhanced Transformer for Image Sentiment Analysis [8.8] 感情分析のためのメタデータ拡張変換器(SentiFormer)を提案する。
各メタデータの適切な重み付けを適応的に学習するために、適応関連学習モジュールを設計する。
我々は,適応的に学習した表現を融合し,最終的な予測を行うクロスモーダル融合モジュールを開発した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:22:23 GMT)
Hard constraint learning approaches with trainable influence functions for evolutionary equations [8.8] 本稿では進化方程式を解くための新しい深層学習手法を開発する。
逐次学習戦略は、大きな時間領域を複数のサブインターバルに分割し、時系列順に1つずつ解決する。
改良されたハード制約戦略は、時間間隔ノードにおけるPINNソリューションの連続性と滑らかさを厳密に保証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:54:01 GMT)
Time Warp: The Gap Between Developers' Ideal vs Actual Workweeks in an AI-Driven Era [8.8] マイクロソフトの484人のソフトウェア開発者を対象にした調査の結果を報告する。
私たちの分析では、開発者の理想的なワークウィークと実際のワークウィークの間に大きな違いが見られます。
ソフトウェアエンジニアリングにおけるAIツールの採用が増えていることを踏まえ、自動化の有力な候補となる特定のタスクや領域を特定します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:29:49 GMT)
Discovery and Deployment of Emergent Robot Swarm Behaviors via Representation Learning and Real2Sim2Real Transfer [8.8] 限られた能力を持つロボットの群れを考えると、我々は起こりうる行動の集合を自動的に発見することを模索する。
本稿では,Real2Sim2Real Behavior Discovery by Self-Supervised Representation Learningを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:04:47 GMT)
AutoToM: Automated Bayesian Inverse Planning and Model Discovery for Open-ended Theory of Mind [8.6] 心の理論 (ToM) は、社会的に知的なエージェントを開発するための鍵である。
大規模言語モデル(LLM)の推進に頼っている心の理論への最近のアプローチ
本稿では,オープンエンドマシン理論を実現するための自動ベイズマインド理論であるAutoToMを紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:57:52 GMT)
AI Governance InternationaL Evaluation Index (AGILE Index) [8.5] 人工知能(AI)技術の急速な進歩は、人間の社会を大きく変えつつある。
2022年以降、生成的AIの広範な展開、特に大きな言語モデルが、AIガバナンスの新たなフェーズとなった。
国際ガバナンスに関するコンセンサスが確立され、活動を続ける中、AIガバナンスのグローバルな評価を行う上での実践的重要性が徐々に明らかになってきている。
AGILE Indexの最初の評価は、AIの開発レベル、AIガバナンス環境、AIガバナンス機器、AIガバナンスの有効性の4つの基本柱の探索から始まった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:16:56 GMT)
Lightweight yet Efficient: An External Attentive Graph Convolutional Network with Positional Prompts for Sequential Recommendation [8.5] 本稿では,逐次的推薦,すなわちEA-GPSのための位置推定プロンプトを備えた外部注意グラフ畳み込みネットワークを提案する。
提案したEA-GPSは最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:34:31 GMT)
Measuring AI agent autonomy: Towards a scalable approach with code inspection [8.3] 我々は、特定のタスクを実行するためにAIエージェントを実行する必要をなくす、自律性に関するコードベースの評価を導入する。
このアプローチをAutoGenフレームワークで実証し、アプリケーションを選択します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:58:40 GMT)
Mildly Accurate Computationally Differentially Private Inner Product Protocols Imply Oblivious Transfer [8.2] 非ブール関数を正確に推定するためには、暗黙の転送が必要であることを示す。
特に内積関数については, 最良な定数付加誤差に対しても, 不可避な移動が必要であるかどうかが従来は分かっていなかった。
以上の結果から, サブポリノミカル精度のプロトコルは, 難読転送と等価であることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:57:04 GMT)
SMTFL: Secure Model Training to Untrusted Participants in Federated Learning [8.2] フェデレートラーニング(Federated Learning)は、分散モデルトレーニングのテクニックである。
勾配反転攻撃と中毒攻撃は、トレーニングデータのプライバシーとモデルの正しさに重大なリスクをもたらす。
我々は,信頼された参加者に頼らずに,フェデレート学習における安全なモデルトレーニングを実現するための,SMTFLと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:55:12 GMT)
DReSD: Dense Retrieval for Speculative Decoding [8.2] 投機的復号 (SD) は、効率的なドラフトモデルを用いて、Large Language Model (LLM) の生成を加速する。
我々は,非パラメトリックデータストアから次のトークンを検索するSDに着目した。
Dretrieval for Speculative Decoding (DRESD) は、近距離の近接探索と文脈化トークンの埋め込みを利用する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:32:28 GMT)
Research advances on fish feeding behavior recognition and intensity quantification methods in aquaculture [8.1] 魚の摂食行動の認識と強度定量化は、魚の健康のモニタリング、バイティング作業の指導、養殖効率の向上に重要な役割を果たしている。
本稿では, コンピュータビジョン, 音響, センサを用いた魚の摂食行動認識と強度定量化手法の研究の進歩を, 単一モードで概観する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:05:29 GMT)
Adapting Large Language Models for Character-based Augmentative and Alternative Communication [8.1] AAC(Augmentative and Alternative Communication)のユーザは、文字言語モデルを使用するインターフェースを通じて、レター・バイ・レターを書くことができる。
本研究では,そのようなモデルを用いて文字予測を高精度かつ効率的に行う方法について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:27:19 GMT)
RAD-Bench: Evaluating Large Language Models Capabilities in Retrieval Augmented Dialogues [8.0] 外的検索機構は、しばしば対話における拡張世代の品質を高めるために使用される。
既存のベンチマークでは、マルチターン対話におけるLLMのチャット能力の評価や、シングルターン設定における拡張応答に対する検索の利用が評価されている。
検索後のマルチターン対話におけるLLMの能力を評価するためのベンチマークであるRAD-Benchを紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:04:28 GMT)
LLMs and Childhood Safety: Identifying Risks and Proposing a Protection Framework for Safe Child-LLM Interaction [8.0] 本研究では,子育て型アプリケーションにおけるLarge Language Models (LLMs) の利用拡大について検討する。
これは、バイアス、有害なコンテンツ、文化的過敏といった安全性と倫理上の懸念を強調している。
本稿では,コンテンツ安全性,行動倫理,文化的感受性の指標を取り入れた安全・LLMインタラクションのための保護フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:30:31 GMT)
Who Speaks Next? Multi-party AI Discussion Leveraging the Systematics of Turn-taking in Murder Mystery Games [7.9] 本研究では,会話分析における隣接対やターンテイクといった会話規範に着目した。
本稿では,AIエージェントの対話制御にこれらの規範を適用した"Murder Mystery Agents"という新しいフレームワークを提案する。
提案フレームワークは、隣接ペアと自己選択機構に基づいて、次の話者選択を統合する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:08:06 GMT)
Jeffrey's update rule as a minimizer of Kullback-Leibler divergence [7.9] 我々は、研究者のバート・ジェイコブス(英語版)によって導かれた元の証明よりも、より簡潔で高いレベルの証明を示す。
予測を生成する内部状態の学習または更新のためのベイズ更新規則の文脈では、ジェフリーの更新規則を適用して内部状態を更新する際に、観測と予測の間の相対エントロピーが減少する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:01:30 GMT)
Poison as Cure: Visual Noise for Mitigating Object Hallucinations in LVMs [7.9] 大型視覚言語モデル(LVM)は、大型言語モデル(LLM)を視覚的知覚能力で拡張する。
信頼性を損なう大きな課題は、LVMが妥当だが事実的に不正確な情報を生成できるというオブジェクト幻覚である。
本稿では,この幻覚を緩和するための新しい視覚的対向摂動(VAP)法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:25:31 GMT)
ZeroPS: High-quality Cross-modal Knowledge Transfer for Zero-Shot 3D Part Segmentation [7.9] 本研究では,2次元事前学習基礎モデルから3次元オブジェクトポイントクラウドへの高品質な知識伝達を実現する新しいパイプラインZeroPSを提案する。
ZeroPSでは,1)コビュー領域とSAMのプロンプト機構を活用することで2Dから3Dへのリフティング,2)2D-3DビュープロジェクションとGLIPのプロンプト機構を活用することで1Dクラスを3D部分に関連付ける,3)マルチビュー観察を活用することで予測性能を向上させる,といった関係が示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:54:39 GMT)
How Do Programming Students Use Generative AI? [7.9] プログラミングの学生がChatGPTのような生成AIツールを実際にどのように使っているかを検討した。
一般的な概念に関する知識を探り,ソリューションを直接生成する,という2つの一般的な利用戦略を観察した。
その結果,ジェネレーティブAIによるプログラマエージェンシーの潜在的な減少と生産性に関する懸念が正当であることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:07:21 GMT)
"Kya family planning after marriage hoti hai?": Integrating Cultural Sensitivity in an LLM Chatbot for Reproductive Health [7.8] 本研究では,インドの都市部における未成年女性との生殖医療のための文化的に適切なチャットボットの開発について検討した。
本研究は,「文化」を構成する地域環境の把握におけるシステムの長所と短所,複雑度を明らかにした。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:08:50 GMT)
The Role of Background Information in Reducing Object Hallucination in Vision-Language Models: Insights from Cutoff API Prompting [7.8] 本研究は,物体幻覚における注意駆動視覚刺激の成功事例と失敗事例を分析した。
背景コンテキストの保存は,物体幻覚の緩和に不可欠であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:26:21 GMT)
MetaDE: Evolving Differential Evolution by Differential Evolution [7.6] 微分進化の内在的ハイパーパラメータとDそのものをメタレベルで利用する戦略を進化させるアプローチであるMetaDEを紹介する。
MetaDEの重要な側面は特別なパラメータ化技術であり、DEのパラメータと戦略を動的に変更する機能を備えている。
CEC2022ベンチマークスイートの大規模な評価は、MetaDEの有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:31:25 GMT)
Automated Discovery of Coupled Mode Setups [7.6] 光学やフォトニクスにおいて、共振器、導波路、任意の結合、パラメトリック相互作用のような少数の構成要素は、様々なデバイスや機能の設計を可能にし、散乱特性によって区別される。
通常、そのようなシステムの設計は経験豊富な科学者によって、最も単純な可能性が実際に見つかったかどうかが定かでない時間を要するプロセスで手作りされる。
本研究では,この課題を自動化する発見アルゴリズムであるAutoScatterを開発した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:57:36 GMT)
A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse [7.4] 生成AI、特に潜在拡散モデル(LDM)の最近の進歩は、画像合成と操作に革命をもたらした。
VAEが訓練中に後部崩壊をきたすという観察に基づくPCA(Posterior Collapse Attack)を提案する。
本手法は,対象モデルのホワイトボックス情報への依存を最小限に抑え,モデル固有の知識への暗黙的な依存を取り除く。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:11:45 GMT)
Non-Linear Flow Matching for Full-Atom Peptide Design [7.3] NLFlowは非線形フローマッチングに基づく新しいマルチフォールドアプローチである。
位置、回転、ねじれ、アミノ酸タイプにまたがる時間的不整合を捉える。
これにより、モデルが生物学的ドッキングプロセスで観察される真のコンフォメーション変化とよりよく整合することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:49:49 GMT)
The Esethu Framework: Reimagining Sustainable Dataset Governance and Curation for Low-Resource Languages [7.3] 本稿では,Esethu Framework and Licenseの下で開発されたオープンソースのコーパスであるVuk'uzenzele isiXhosa Speech dataset (ViXSD)を紹介する。
このデータセットには、人口統計や言語メタデータに富んだ、ネイティブのisiXhosa話者からの読み上げ音声が含まれており、コミュニティ主導のライセンスとキュレーションの原則が、自動音声認識におけるリソースギャップをいかに埋めるかを示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:12:50 GMT)
Sparsity May Be All You Need: Sparse Random Parameter Adaptation [7.3] アライメントとタスク適応のための大規模言語モデルの完全な微調整は、モデルのサイズが大きくなるにつれて、極めて高価になっている。
そこで本研究では,トレーニング対象のモデルパラメータのごく一部をランダムに選択することで,トレーニング可能なパラメータの数を減らすことを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:23:16 GMT)
Vision Foundation Models in Medical Image Analysis: Advances and Challenges [7.2] ビジョンファウンデーションモデル(VFM)は、医療画像解析の分野で大きな進歩をもたらした。
本稿では,VFMの医用画像セグメンテーションへの適応に関する現状研究について概説する。
本稿では,アダプタによる改良,知識蒸留技術,マルチスケール・コンテキスト特徴モデリングの最近の発展について論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:42:34 GMT)
Visual Zero-Shot E-Commerce Product Attribute Value Extraction [7.2] クロスモーダルなゼロショット属性値生成フレームワーク(ViOC-AG)を提案する。
ゼロショット推論の間、製品アスペクトは凍結されたCLIPイメージエンコーダによって生成される。
ViOC-AGは、ゼロショット属性値抽出のための他の微調整された視覚言語モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:31:03 GMT)
Curvature Corrected Nonnegative Manifold Data Factorization [7.1] 本研究では, 多様体値データから解釈可能な因子を抽出する幾何学的手法として, 曲率補正による非負の多様体データ分解(CC-NMDF)を提案する。
我々は,CC-NMDF計算のための効率的な反復アルゴリズムを開発し,実世界の拡散テンソル磁気共鳴画像データについて実証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:00:02 GMT)
Explain Like I'm Five: Using LLMs to Improve PDE Surrogate Models with Text [7.1] 本研究では,事前学習されたLarge Language Models (LLMs) を用いて,PDE学習に様々な既知のシステム情報を統合することを検討する。
文レベルの埋め込み、単語レベルの埋め込み、および2D Heat、Burgers、Navier-Stokes、Shallow-Waterデータセットにわたる標準的なトークン化器を比較した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:42:35 GMT)
Giving AI Personalities Leads to More Human-Like Reasoning [7.1] 我々は,人間集団の多様な推論行動を模倣するAIの可能性について検討する。
自然言語推論(NLI)フォーマットを新たに一般化した推論タスクを設計した。
我々は、人格特性を反映したAI応答を誘発するために、ビッグファイブのパーソナリティモデルにインスパイアされたパーソナリティベースのプロンプトを用いた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:57:14 GMT)
GraphFuzz: Automated Testing of Graph Algorithm Implementations with Differential Fuzzing and Lightweight Feedback [7.1] グラフアルゴリズム実装のための最初の自動フィードバック誘導ファジィフレームワークであるGraphFuzzを紹介する。
私たちの重要なイノベーションは、コードカバレッジフィードバックと組み合わせたり、完全に置き換えたりする、軽量でアルゴリズム固有のフィードバックシグナルを特定することです。
GraphFuzzは、クラッシュトリガバグとロジックバグの両方を検出するために差分テストを適用している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:47:05 GMT)
The Evolving Landscape of LLM- and VLM-Integrated Reinforcement Learning [7.1] 強化学習(RL)は、逐次意思決定タスクにおいて印象的な結果を示した。
大規模言語モデル (LLM) と視覚言語モデル (VLM) が登場し、マルチモーダル理解と推論において印象的な能力を発揮している。
本稿では,これらのLLM/VLM支援RLアプローチをエージェント,プランナー,報酬の3つの役割に分類する分類法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:01:30 GMT)
Image Translation-Based Unsupervised Cross-Modality Domain Adaptation for Medical Image Segmentation [7.1] 監視されたディープラーニングは、通常、自然画像よりも医療画像において多くの課題に直面します。
本稿では,画像翻訳に基づく教師なしクロスモーダリティ領域適応手法を提案する。
翻訳された擬似画像と実画像との微妙な差異は、自己学習法によって克服される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:07:48 GMT)
Soybean pod and seed counting in both outdoor fields and indoor laboratories using unions of deep neural networks [7.1] 野外および屋内実験室でダイズポッドと種子を数えるための効率的な深層学習モデルを開発した。
屋外の畑では、目に見える種子だけでなく、隠された種子にも注釈をつけることで、隠されている大豆の種数を推定することができる。
室内環境では,Swin Transformerモジュール(Mask-RCNN-Swin)を補足したMask-RCNNを用いて,ラベル付きデータの小さな集合から生成された合成訓練画像のみを訓練した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:26:42 GMT)
RLTHF: Targeted Human Feedback for LLM Alignment [7.0] ユーザの好みに合わせて微調整された大きな言語モデルは、高品質なヒューマンアノテーションのコストが高いため、難しい。
LLMをベースとした初期アライメントと選択的人間のアノテーションを組み合わせた人間-AIハイブリッドフレームワークであるRLTHFを提案する。
RLTHFは,ヒトのアノテーション努力の6~7%で全人類のアノテーションレベルのアライメントに達する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:51:18 GMT)
Enhancing PPO with Trajectory-Aware Hybrid Policies [6.9] PPO(Proximal Policy Optimization)は、最先端のオンライン・ポリシー・アルゴリズムの1つである。
高分散と高サンプルの複雑さは、いまだにオン・ポリティクスのアルゴリズムにおいて重要な課題である。
本稿では,トラジェクトリ・リプレイバッファを用いて,近年のポリシーによって生成されるトラジェクトリを効率的に活用するハイブリッド・ポリシー・プロキシ・ポリシー・オプティマイズ(HP3O)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:00:13 GMT)
Accountability in Code Review: The Role of Intrinsic Drivers and the Impact of LLMs [6.8] コード品質に対する説明責任の主要な原動力は、個人的標準、専門的完全性、コード品質の誇り、評価の維持である。
ソフトウェア工学へのAIの導入は、社会的整合性と集団的説明責任メカニズムを維持する必要がある。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:52:29 GMT)
Generalization of the Gibbs algorithm with high probability at low temperatures [6.8] 本稿では、Gibsアルゴリズムの一般化誤差にバウンダリを与え、高温領域における既知のデータ非依存境界を復元する。
高い確率で、ギブスの後部から引き出された1つの仮説の一般化誤差は、同様のまたはより小さな経験的誤りを伴う全ての仮説の総容積とともに減少する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:49:36 GMT)
Blockchain-based Trust Management in Security Credential Management System for Vehicular Network [6.8] 我々は、より分散化とセキュリティを提供するために、vehicular-Based Trust Management (BBTM)を構築します。
BBTMはブロックチェーンを使用して、既存のポリシジェネレータ(PG)を置き換えるとともに、SCMS内の各権限のポリシを管理し、GCCF(Global Certificate Chain File)を集約する。
実験の結果,BBTMは処理の軽量化,証明書チェーンと台帳サイズの効率的な管理,毎秒の複数トランザクションの帯域幅のサポート,検証済みのエンドエンティリティを提供することがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:22:28 GMT)
YOLOv12 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once (YOLO) Series [6.8] 本稿では、YOLOv1から最近発表されたYOLOv12までの、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進歩を体系的に検証する。
この進化は、今後10年間、YOLOとマルチモーダル、コンテキスト認識、人工知能(AGI)システムを統合するための道のりを示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:48:42 GMT)
MONSTER: Monash Scalable Time Series Evaluation Repository [6.7] 時系列分類のための大規模なデータセットの集合を導入する。
これらのベンチマークのデータセットは小さく、それぞれ中央値が217と255のサンプルである。
私たちの希望は、より大きなデータセットを使用してベンチマークを導入することで、フィールドを多様化させることです。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:54:40 GMT)
Exact Risk Curves of signSGD in High-Dimensions: Quantifying Preconditioning and Noise-Compression Effects [6.7] 本稿では,高次元限界における符号SGDの解析について述べる。
我々は,実効学習率,雑音圧縮,対角前処理,勾配,雑音再構成の4つの効果を定量化する。
これらの結果はAdamにどのように拡張されるかという予想で締めくくります。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:38:07 GMT)
PDeepPP:A Deep learning framework with Pretrained Protein language for peptide classification [6.6] ペプチド分類のためのトランスフォーマーとCNNを組み合わせたニューラルネットワークを用いて,事前学習されたタンパク質言語モデルを統合するディープラーニングフレームワークを提案する。
このフレームワークは、PTMサイトと生物活性ペプチド予測を含む複数のタスクに適用され、大規模データセットを使用してモデルの堅牢性を高めた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:31:22 GMT)
A Data-Driven Real-Time Optimal Power Flow Algorithm Using Local Feedback [6.5] 本稿では,データ駆動型リアルタイムアルゴリズムを提案する。
具体的には,局所的なフィードバックをアルゴリズムの入力とする学習可能な関数を設計する。
我々は、ディープニューラルネットワーク(DNN)に基づくOPF問題の変種を解決するために、原始二重更新を開発する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:02:22 GMT)
A Structure-aware Generative Model for Biomedical Event Extraction [6.3] バイオメディカルイベント抽出のためのイベント構造認識生成モデルであるGenBEEを提案する。
我々は,提案したGenBEEモデルを,広く使用されている3つのBEEベンチマークデータセット上で評価した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:45:49 GMT)
Towards Efficient Contrastive PAC Learning [6.2] 我々はPAC学習の枠組みの下で対照的な学習について研究する。
本稿では,線形表現の基本概念の対照的な学習について考察する。
我々は,Rademacherの複雑性に基づいた保証を確立し,それとPACの保証を,ある対照的な大マルジン条件下で接続する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:51:01 GMT)
Efficiently Solving Discounted MDPs with Predictions on Transition Matrices [6.2] 生成モデルに基づくDMDP(Discounted Markov Decision Processs)について検討した。
DMDPの解法において,遷移行列上での予測がサンプル効率をいかに向上させるかを検討するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:59:46 GMT)
Feature Aggregation with Latent Generative Replay for Federated Continual Learning of Socially Appropriate Robot Behaviours [6.2] 並列にデプロイされた複数のロボットが、相互に学習を共有しながら、独立して学習できる、連邦学習(FL)設定を探索することは、ロボットにとって極めて重要である。
本研究は,ロボットが行動の社会的適切さを学ばなければならないシミュレートされたリビングルーム環境を探索することによって,これらの課題に対処することに貢献している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:38:52 GMT)
Cross-Format Retrieval-Augmented Generation in XR with LLMs for Context-Aware Maintenance Assistance [6.2] 本稿では,大規模言語モデル(LLM)を統合した検索拡張生成システムの詳細な評価を行う。
BLEU と METEOR のスコアを用いて,応答速度や精度などの重要な指標を定量化する8つの LLM の性能評価を行った。
その結果、システムがタイムリーかつ正確なレスポンスを提供する能力を評価し、メンテナンス操作を最適化するRAGフレームワークの可能性を強調した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:19:39 GMT)
TS-OOD: Evaluating Time-Series Out-of-Distribution Detection and Prospective Directions for Progress [6.1] アウト・オブ・ディストリビューション(OOD)データは、機械学習モデルのデプロイにおける根本的な課題である。
本研究は,OOD検出アルゴリズムを網羅的に解析することにより,この研究ギャップに対処することを目的とする。
その結果,1) 最先端OOD法の大部分は時系列データに対して限られた性能を示し,2) 深部特徴モデリングに基づくOOD法は時系列OOD検出に有利である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:40:22 GMT)
TituLLMs: A Family of Bangla LLMs with Comprehensive Benchmarking [6.1] 1b と 3b のパラメータサイズで利用可能な,最初の大規模事前訓練型 Bangla LLM である TituLLM を提案する。
TituLLMsをトレーニングするために、約37億トークンの事前トレーニングデータセットを収集しました。
我々はLlama-3.2トークンを言語や文化固有の知識に組み込むように拡張した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:33:37 GMT)
TractoGPT: A GPT architecture for White Matter Segmentation [5.9] TractoGPTは、データセットをまたいで一般化し、ホワイトマターバンドルの形状情報を保持する完全に自動化された方法である。
実験の結果、TractoGPTは平均的なDICE、オーバーラップ、オーバーリーチのスコアで最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:16:21 GMT)
A Knowledge Distillation-Based Approach to Enhance Transparency of Classifier Models [5.9] 医用画像分析では、高い透明性とモデルの解釈可能性によって、臨床医はAIモデルの意思決定プロセスをよりよく理解し、信頼することができる。
医用画像解析におけるAIモデルの透明性を高めることを目的とした知識蒸留(KD)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:43:21 GMT)
Towards Comparable Active Learning [5.9] 近年の文献で報告されているリフトは、他の領域にあまり一般化せず、アクティブラーニング研究の不確定な状況に繋がることを示す。
本稿では,様々なタスクや領域にまたがるアルゴリズムを公平に比較するためのアクティブラーニングフレームワークと,評価のための高速で実行可能なオラクルアルゴリズムを提供することにより,これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:46:19 GMT)
Explanations of Deep Language Models Explain Language Representations in the Brain [5.8] 大規模言語モデル(LLM)は人間のような性能を実現し、脳の言語処理機構と計算原理を共有する。
近年の進歩は、人間のような性能を達成するだけでなく、脳の言語処理機構と計算原理を共有する大きな言語モデル(LLM)を生み出している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:09:09 GMT)
A Comprehensive Survey on the Trustworthiness of Large Language Models in Healthcare [5.8] 医療における大規模言語モデル(LLM)の適用は、臨床意思決定、医学研究、患者医療に革命をもたらす可能性がある。
LLMはますます医療システムに統合されているため、信頼性と倫理的展開を保証するために、いくつかの重要な課題に対処する必要がある。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:43:06 GMT)
VTechAGP: An Academic-to-General-Audience Text Paraphrase Dataset and Benchmark Models [5.7] VTechAGPは、最初の学術から一般のテキストパラフレーズデータセットである。
トレーニングでは,動的プロンプトのキーワードベクトルを学習するために,コントラッシブ・ジェネレーション・ロス関数を利用する。
推論には,意味レベルと構造レベルの両方で,群集サンプリングの復号化戦略を採用する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:23:53 GMT)
Fully automatic extraction of morphological traits from the Web: utopia or reality? [5.7] 本研究では,植物形質に関する情報を非構造的テキスト記述形式で収集・処理する機構を提案する。
その結果, F1スコアは75%以上であった。
この結果から,LLMの情報抽出機能により,構造化された特徴データベースの大規模作成が可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:48:32 GMT)
Large Language Models for Persian $ \leftrightarrow $ English Idiom Translation [5.7] 大規模言語モデル(LLM)は、ニューラルマシン翻訳(NMT)システムと比較して、図形言語を翻訳する優れた能力を示している。
本稿ではペルシャ語$rightarrow$ Englishと英語$rightarrow$Persian翻訳の慣用表現を含む2つのパラレルデータセットを紹介する。
オープンソースとクローズドソースのLLM, NMTモデルおよびそれらの組み合わせを評価した。
クロード3.5-ソネットは、両方の翻訳方向において優れた結果をもたらす。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:45:48 GMT)
Graphon Particle Systems, Part II: Dynamics of Distributed Stochastic Continuum Optimization [5.7] ノード連続体を持つグラフオン上での分散最適化問題について検討する。
グラノン上での勾配降下と勾配追従アルゴリズムを提案する。
時間変化アルゴリズムを適切に選択することにより、すべてのノードの状態が接続されたグラフに対して$mathcalLinfty$-consensusを達成することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:16:56 GMT)
Road Traffic Sign Recognition method using Siamese network Combining Efficient-CNN based Encoder [5.6] 交通標識認識(TSR)は、補助運転とインテリジェント交通システムにおいて重要な役割を担っている。
本稿では,改良されたエンコーダとSiameseネットを備えたIECES-networkを提案する。
提案手法は,2.9Mの軽量スケールで88.1%,86.43%,86.1%の競合性能を再現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:03:05 GMT)
Attention Eclipse: Manipulating Attention to Bypass LLM Safety-Alignment [5.6] 効果的な防御とモデル安全性の正確な評価を導くために、潜在的なジェイルブレイク攻撃の範囲を予測することが重要である。
提案手法は,プロンプトの異なる部分の注意を選択的に強化あるいは弱めるために,モデルの注意を操作できる,効果的なジェイルブレイク攻撃を生成するための新しいアプローチである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:38:00 GMT)
KAD: No More FAD! An Effective and Efficient Evaluation Metric for Audio Generation [5.5] カーネル・オーディオ・ディスタンス(Kernel Audio Distance, KAD)は、最大平均離散性(MMD)に基づく分布自由、非バイアス、計算効率の指標である。
高度な埋め込みと特徴的カーネルを活用することで、KADは実際のオーディオと生成されたオーディオの微妙な違いをキャプチャする。
Kadtkツールキットでオープンソース化されたKADは、生成的オーディオモデルを評価するための効率的で信頼性があり、知覚的に整合したベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:19:15 GMT)
An ocean front detection and tracking algorithm [5.5] 本稿では,ベイズ決定と距離空間に基づく前方検出と追跡の自動アルゴリズムを提案する。
連続性を高めるため、フロントマージ、フィリング、リング削除が推進される。
テクノロジーはエッジ検出やトラッキングといったコンピュータビジョンの他の領域に移行することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:00:09 GMT)
CVE-LLM : Ontology-Assisted Automatic Vulnerability Evaluation Using Large Language Models [5.4] National Database(NVD)は毎月1000以上の新たな脆弱性を公開しており、2024年には25%増加したと予測されている。
本研究では,大規模言語モデル(LLM)を用いて,単一メーカーのポートフォリオにおける医療機器の脆弱性の歴史的評価から脆弱性評価を学習する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:59:15 GMT)
Comparing zero-shot self-explanations with human rationales in text classification [5.3] 我々は,人間に対する妥当性とモデルに対する忠実性に関して,自己説明を評価した。
自己説明は、LRPと比較して人間のアノテーションとより密に一致し、かつ、同等の忠実さを維持していることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:45:51 GMT)
Comparative Analysis of Large Language Models for Context-Aware Code Completion using SAFIM Framework [5.3] 大規模言語モデル(LLM)はコード補完に革命をもたらし、よりインテリジェントでコンテキスト対応な機能へと変貌を遂げた。
本稿では,Gemini 1.5 Flash, Gemini 1.5 Pro, GPT-4o, GPT-4o-mini, GPT-4 Turboなど,チャットベースのLLMの性能を評価する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:32:31 GMT)
A View of the Certainty-Equivalence Method for PAC RL as an Application of the Trajectory Tree Method [5.2] 本稿では,CEMが実際にTTMの応用と見なされるという驚くべき発見に起因した理論的研究を提案する。
我々は,非定常MPPと定常MPPの双方に対して,CEMの試料複雑度上限を(3)改良した。
また, 有限ホライズン MDP に対する標本複雑性の低い値を示し, 非定常 MDP に対する上界の最小値最適性を確立する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:32:16 GMT)
On the Effectiveness of Large Language Models in Writing Alloy Formulas [5.2] 本稿では,大規模言語モデル (LLM) を用いて言語合金に宣言式を記述するための制御実験について述べる。
我々は LLM を用いて、与えられた自然言語記述から完全な合金公式を書く(英語)
また, LLMを用いて, 与えられた合金式に対して, 代替だが等価な合金式を作成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:09:58 GMT)
An approach for API synthesis using large language models [5.2] 本稿では,大規模言語モデル(LLM)をAPI合成に利用する新しいアプローチを提案する。
LLMは開発者の洞察を捉えるための基盤技術を提供し、より効果的なAPI合成を可能にするための理想的なフレームワークを提供する。
135個の実世界のプログラミングタスクを用いて,本手法を実験的に評価し,最先端のAPI合成ツールであるFrAngelと比較した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:42:20 GMT)
Multi-agent Multi-armed Bandits with Minimum Reward Guarantee Fairness [5.1] マルチエージェント・バンディット(MA-MAB)における公平性を確保しつつ,社会福祉を最大化するアルゴリズムを提案する。
提案するアルゴリズムであるRewardFairUCBは、アッパー信頼境界法を利用して、公正性と社会福祉の両面において、サブ線形後悔境界を達成する。
本稿では、RewardFairUCBアルゴリズムが、$tildeO(T1/2)$と$tildeO(T3/4)$のフェアネス後悔上限をインスタンスに依存しない社会福祉後悔保証を実現することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:28:49 GMT)
Towards Efficient and Multifaceted Computer-assisted Pronunciation Training Leveraging Hierarchical Selective State Space Model and Decoupled Cross-entropy Loss [5.1] HMambaは、APAとMDDタスクをシームレスに並列に統合する新しいCAPTアプローチである。
speechocean762ベンチマークデータセットの総合的な実験結果の集合は、我々のAPAに対するアプローチの有効性を示す。
提案手法は,F1スコア63.85%を達成し,強力なベースラインよりもMDD性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:10:54 GMT)
Optimizing DNN Inference on Multi-Accelerator SoCs at Training-time [5.1] 我々は,様々なチップのCUの中から,ディープニューラルネットワーク(DNN)の細粒度マッピングを効率的に探索するハードウェア認識ツールであるODiMOを提案する。
ODiMOはDarkside上で実行されるDNNの遅延を、手動のマッピングに比べて最大8倍の精度で削減することを示す。
エネルギーを目標とする場合、ODiMOはより効率的なマッピングを最大50.8倍に生成し、精度は最小限に抑えた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:45:50 GMT)
A graph neural network-based model with Out-of-Distribution Robustness for enhancing Antiretroviral Therapy Outcome Prediction for HIV-1 [5.0] HIV-1に対する抗レトロウイルス療法(ART)の結果を予測することは、非常に難しい臨床的課題である。
完全連結(FC)ニューラルネットとグラフニューラルネット(GNN)の機能を組み合わせた新しいジョイントフュージョンモデルを提案する。
グラフとして構造化されたこの知識ベースを利用することで、GNNコンポーネントはモデルが不均衡なデータ分布に適応できるようにする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:42:34 GMT)
Dynamic Knowledge Selector and Evaluator for recommendation with Knowledge Graph [5.0] 本稿では,知識グラフ内の情報を抽出するための協調信号によって導かれる動的知識選択評価手法を提案する。
具体的には,各地区のレコメンデーション課題に対する貢献度を評価するために,連鎖経路評価器を用いる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:51:37 GMT)
Multi-Agent Multimodal Models for Multicultural Text to Image Generation [4.9] 多文化画像生成の新しいタスクのためのマルチエージェントインタラクション設定において,Large Language Models (LLMs) の性能を評価する。
5つの国、3つの年齢グループ、2つの性別、25の歴史的ランドマーク、5つの言語にまたがる9000の多文化画像のデータセットを提供する。
マルチエージェントインタラクションは、複数の評価指標で単純な非エージェントモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:19:56 GMT)
Dimension-free bounds in high-dimensional linear regression via error-in-operator approach [4.9] ランダムな設計を伴う高次元線形回帰問題を考える。
我々は,設計共分散を直接見積もるのではなく,経験的リスク最小化に組み込む,エラー・イン・オペレータと呼ばれる新しい手法を提案する。
我々は過剰な予測リスクを拡大し、先行項と残りについて非漸近的次元自由境界を導出する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:07:14 GMT)
Integrating the Expected Future in Load Forecasts with Contextually Enhanced Transformer Models [4.9] 本研究は,予測をシーケンス・ツー・シーケンス予測問題として概念化する。
文脈情報をすべて効果的に活用するために設計した文脈拡張型トランスフォーマーモデルを導入する。
他の最先端手法と比較して、我々のアプローチは既存のモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:45:05 GMT)
Graph-Based Deep Learning on Stereo EEG for Predicting Seizure Freedom in Epilepsy Patients [4.9] 本研究では、ステレオ脳波(SEEG)データから発作自由度を予測するために、深層学習に基づくグラフニューラルネットワーク(GNN)モデルを開発した。
我々は、15名の小児患者から得られた高品質のsEEGデータを用いて、発作の自由度を正確に予測できる深層学習モデルを訓練した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:24:34 GMT)
A First Principles Approach to Trust-Based Recommendation Systems in Social Networks [4.8] 本稿では,項目評価,項目内類似性,信頼グラフなどの情報を活用するレコメンデータシステムについて検討する。
協調フィルタリング手法では,項目分類情報は他の情報型よりも影響が大きいことを示す。
信頼グラフに基づくアプローチは、信頼構造が難しいため、ネットワークの敵攻撃に対してより堅牢であることが判明した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:08:43 GMT)
The Well: a Large-Scale Collection of Diverse Physics Simulations for Machine Learning [4.8] ウェルは様々な物理系の数値シミュレーションの大規模なコレクションである。
これらのデータセットは、個別またはより広範なベンチマークスイートの一部として使用することができる。
モデルをトレーニングし、評価するための統合されたPyTorchインターフェースを提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:24:16 GMT)
CoRe: Coherency Regularization for Hierarchical Time Series [4.8] 本稿では,ニューラルネットワークを用いた階層時系列予測におけるソフトコヒーレンシに対する新しいアプローチを提案する。
本稿では,ニューラルネットワークをトレーニングし,階層間で本質的にコヒーレントな予測を生成するネットワークコヒーレンシ正規化手法を提案する。
その結果,データ不整合の存在下での一般化と予測精度が向上した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:39:41 GMT)
Computational Advantage in Hybrid Quantum Neural Networks: Myth or Reality? [4.6] ハイブリッド量子ニューラルネットワーク(HQNN)は、計算性能を向上させる可能性に注目されている。
量子層は純粋に古典的なモデルよりも計算上の優位性を提供しますか?
本稿では,従来のモデルとハイブリッドモデルがアーキテクチャの複雑さを増す問題にどのように適応するかを考察する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:52:22 GMT)
PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection [4.6] Single-Domain Generalized Object Detection (S-DGOD) は、オブジェクト検出器を利用することで、さまざまな未確認対象領域にわたる堅牢なパフォーマンスのために、単一のソースドメイン上でトレーニングすることを目的としている。
既存のS-DGODアプローチは、検出器の一般化能力を高めるために、視覚変換の合成を含むデータ拡張戦略に依存することが多い。
本稿では,S-DGODタスクの適応性を高めるために,新しい物理モデルに基づく非理想的撮像条件データ拡張法であるPhysAugを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:06:07 GMT)
Human Guided Learning of Transparent Regression Models [4.6] 置換回帰に対するHIL(Human-in-the-loop)アプローチを提案する。
このモデルは、単純な人間に理解可能な制約を組み込んだ勾配強化回帰モデルである。
このアプローチであるHuGuRは、人間がこのような透明な回帰モデルの検索空間を探索することを可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:15:12 GMT)
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning [4.6] 完全に分散化された階層型マルチエージェントシステムを構築するためのフレームワークであるTAME Agent Framework (TAG)を紹介する。
TAGは疎結合を維持しながらレベル間の情報フローを標準化し、多様なエージェントタイプをシームレスに統合する。
この結果から,分散階層型組織は学習速度と最終性能を両立させ,TAGをスケーラブルなマルチエージェントシステムにとって有望な方向と位置づけた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:52:16 GMT)
Utilizing Sequential Information of General Lab-test Results and Diagnoses History for Differential Diagnosis of Dementia [4.6] アルツハイマー病(AD)の早期診断は、複数のデータ関連課題に直面している。
これらの課題はADの進行的な性質によって悪化し、微妙な病態的変化が何十年にもわたって臨床症状に先行することが多い。
本研究は, 日常的に収集された総合的な検査履歴を生かした新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:11:07 GMT)
Chitrarth: Bridging Vision and Language for a Billion People [4.4] 我々は、包括的視覚言語モデル(VLM)であるChitrarth (Chitra: Image; Artha: Meaning)を紹介する。
我々のモデルは、多言語画像テキストデータに基づいて訓練された視覚モジュールと、最先端(SOTA)多言語大言語モデル(LLM)を効果的に統合する。
本モデルでは,低リソース言語を対象としたベンチマークのSOTA結果が得られたが,その効率は英語で維持されている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:38:40 GMT)
C3AI: Crafting and Evaluating Constitutions for Constitutional AI [4.4] 我々はC3AIフレームワークを導入し、微調整の前に効果的な構成を形成するための原則の選択と構成という2つの重要な機能を提供します。
AIと心理学から原則を分析することで、ポジティブなフレーム化された行動に基づく原則が、ネガティブなフレーム化された原則や特性に基づく原則よりも人間の好みとより密接に一致していることがわかりました。
微調整されたCAIモデルは、負の枠付き原理ではうまく機能したが、人間のアライメント結果とは対照的に、正の枠付き原理では苦労した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:26:42 GMT)
Drug-Target Interaction/Affinity Prediction: Deep Learning Models and Advances Review [4.4] 相互作用予測の課題を克服するために、ディープラーニングモデルが提示されている。
薬物-標的相互作用の予測法を180件分析した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:00:43 GMT)
On the (In)Security of Non-resettable Device Identifiers in Custom Android Systems [4.3] 我々は、カスタムAndroid ROM上の脆弱性のあるプロパティと設定を識別するためのスケーラブルで正確なIDRadarを提案する。
非リセット可能な識別子を格納する8,192のシステムプロパティと3,620のセッティングを特定し,3,477のプロパティと1,336のセッティングに十分なアクセス制御が欠けている。
当社の大規模分析では,既存の技術よりも2桁も大きい,多数のセキュリティ問題を特定することが可能です。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:52:46 GMT)
Skill over Scale: The Case for Medium, Domain-Specific Models for SE [4.3] コードラベリングタスクにおいて、控えめな大きさのドメイン固有モデルは、はるかに大きなモデルよりも優れていることを示す。
SOBertBase (125Mパラメータ)とSOBertLarge (762Mパラメータ)の2つのモデルを、それぞれ374ドルと1600ドルでトレーニングしています。
その結果、ドメイン内データを広範囲かつ適切に事前学習することで、クローズドソース汎用モデルを活用するための、強力で安価な代替手段が得られることが示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:19:39 GMT)
Qubit-Efficient Quantum Annealing for Stochastic Unit Commitment [4.2] 再生可能エネルギー源の統合によって引き起こされる不確実性を管理するため、ユニットコミット(SUC)が提案されている。
本稿では,スラック変数を不要にするために,パウエル・ヘステネス・ロッカフェラー拡張ラグランジアン乗算器(PHR-ALM)法を提案する。
さらに量子ADMMを適用して、大規模SUCを小さなブロックに分割し、シーケンシャルな解を可能にする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:15:40 GMT)
LLMs in Mobile Apps: Practices, Challenges, and Opportunities [4.1] AI技術の統合は、ソフトウェア開発でますます人気が高まっている。
大規模言語モデル(LLM)と生成AIの台頭により、開発者は、クローズドソースプロバイダから豊富な高品質のオープンソースモデルとAPIにアクセスできるようになる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:53:43 GMT)
Evaluating Multimodal Generative AI with Korean Educational Standards [3.9] 韓国国立教育試験ベンチマーク(KoNET)は、マルチモーダル生成AIシステムを評価するために設計された新しいベンチマークである。
KoNETは、韓国初等教育開発試験(KoEGED)、中等教育開発試験(KoMGED)、高等教育試験(KoHGED)、高等教育能力試験(College Scholastic Ability Test(KoCSAT)の4つの試験からなる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:46:40 GMT)
Unveiling Reasoning Thresholds in Language Models: Scaling, Fine-Tuning, and Interpretability through Attention Maps [3.9] 本研究では,異なるモデルサイズと訓練データを持つデコーダのみの変換言語モデルのコンテキスト内学習能力について検討する。
我々は,複数の質問応答におけるコモンセンス推論や帰納的推論といったタスクにおいて,推論性能が著しく向上する重要なパラメータしきい値(160億)を同定する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:48:32 GMT)
OmniQuery: Contextually Augmenting Captured Multimodal Memory to Enable Personal Question Answering [3.8] 複雑な個人記憶に関する質問に答えられる新しいシステムであるOmniQueryを紹介する。
質問に対して、OmniQueryは関連する拡張メモリを取得し、大きな言語モデル(LLM)を使用して参照による回答を生成する。
人間の評価では,71.5%の精度でOmniQueryの有効性を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:46:25 GMT)
DAM-Seg: Anatomically accurate cardiac segmentation using Dense Associative Networks [3.8] 本稿では,心的入力に固有のパターンを学習し,保持するために高密度な連想ネットワークを利用するトランスフォーマーアーキテクチャを提案する。
提案手法は,ネットワークを限られたパターンの集合に制限する。前方伝播において,これらのパターンの重み付け和を用いて,出力の解剖学的正しさを強制する。
実験結果から,本モデルがすべての指標のベースラインアプローチを一貫して上回っていることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:15:10 GMT)
DualDynamics: Synergizing Implicit and Explicit Methods for Robust Irregular Time Series Analysis [3.7] NDE法とニューラルフロー法を組み合わせた新しいフレームワークである「DualDynamics」を紹介する。
このアプローチは計算要求のバランスを保ちながら表現力を高め、既存の手法の限界に対処する。
以上の結果から,DualDynamicsが不規則時系列解析を飛躍的に進める可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:04:28 GMT)
Do we really need the Rademacher complexities? [3.7] 凸クラスにおける2乗損失に関する学習の基本的な問題について検討する。
一般的な信念とは対照的に、最小限の仮定の下では、サンプルの複雑さはラデマッハ複雑性によって支配されないことが証明される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:40:22 GMT)
Feature maps for the Laplacian kernel and its generalizations [3.7] ガウス核とは異なり、ラプラシア核は分離できない。
ラプラシア核とその2つの一般化に対してランダムな特徴を与える。
実データセット上でこれらのランダムな特徴写像の有効性を実証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:36:20 GMT)
From Priest to Doctor: Domain Adaptation for Low-Resource Neural Machine Translation [3.7] 多くの言語は、高性能汎用ニューラルネットワーク翻訳(NMT)モデルを訓練するのに不十分なデータを持っている。
世界中の言語の多くは、高性能汎用ニューラルマシン翻訳(NMT)モデルをトレーニングするのに不十分なデータを持っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:42:44 GMT)
Med-gte-hybrid: A contextual embedding transformer model for extracting actionable information from clinical texts [3.6] 本稿では,gte-large文変換器から得られた文脈埋め込みモデルmed-gte-hybridを提案する。
メド・グテ・ヒブリッドのモデルチューニング戦略は、コントラスト学習とデノナイジングオートエンコーダを組み合わせたものである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:17:31 GMT)
Synthetic vs. Gold: The Role of LLM-Generated Labels and Data in Cyberbullying Detection [3.5] 我々は, 有害検出のための分類器を訓練する基礎として, 合成サイバー膨大化データが存在することを見出した。
結果は、サイバーバブル検出におけるスケーラブルで倫理的に実行可能な代替手段として、合成データの生存可能性を強調している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:17:29 GMT)
Are Neuromorphic Architectures Inherently Privacy-preserving? An Exploratory Study [3.5] 人工ニューラルネットワーク(ANN)の代替手段としてスパイキングニューラルネットワーク(SNN)が登場
本稿では,SNNが本質的により優れたプライバシを提供するかどうかを検討する。
学習アルゴリズム(勾配と進化の代理)、フレームワーク(snnTorch, TENNLab, LAVA)、およびパラメータがSNNプライバシに与える影響を分析する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:55:39 GMT)
Automated Query-Product Relevance Labeling using Large Language Models for E-commerce Search [3.4] クエリとプロダクトのペアをアノテートするための従来のアプローチは、人間ベースのラベリングサービスに依存している。
本研究では,Large Language Models (LLMs) が,人間ラベル作成者に必要な時間とコストのごく一部で,このタスクにおける人間レベルの精度にアプローチ可能であることを示す。
この拡張性のある人間のアノテーションの代替は、情報検索領域に重大な影響を及ぼす。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:59:36 GMT)
Robust Information Selection for Hypothesis Testing with Misclassification Penalties [3.3] ベイズ仮説テスト/分類課題におけるロバストな情報選択の問題について検討する。
目的は、選択された情報ソースからの観測に基づいて、有限の仮説から世界の真の状態を特定することである。
異なる誤分類事象を一様に扱える新しい誤分類罰枠組みを導入する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:09:21 GMT)
Digitized Counter-Diabatic Quantum Optimization for Bin Packing Problem [3.3] ディジタル化された反断熱量子アルゴリズム (DC-QAOA) を用いた1次元ビンパッキング問題 (1dBPP) に対処する。
DC-QAOAは、ソリューションの品質を維持しながら、QAOAのような従来の手法よりも優れています。
これらの知見は、DC-QAOAを、短期量子デバイスにおける最適化問題を解くための強力なフレームワークとして確立している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:56:35 GMT)
A Survey on LLM-based News Recommender Systems [3.3] ニュースレコメンデータシステムは、情報過負荷問題を緩和する上で重要な役割を果たす。
大規模言語モデル技術の応用が成功したため、研究者はニュースレコメンデータシステムの性能向上のため、DLLM(Driminative Large Language Models)またはGLLM(Generative Large Language Models)を利用している。
近年のいくつかの調査では、ディープラーニングベースのニュースレコメンデータシステムに関する重要な課題がレビューされているが、Large Language Model(LLM)ベースのニュースレコメンデータシステムに関する体系的な調査が欠如している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:24:23 GMT)
Confidence-Based Annotation Of Brain Tumours In Ultrasound [3.2] 超音波検査における脳腫瘍の個別分節診断の課題の検討
この辺縁関係の不確実性を組み込んだセグメンテーションプロトコルと手法を提案する。
スパース信頼度に基づくアノテーションの提案と評価を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:16:06 GMT)
Shared Control with Black Box Agents using Oracle Queries [3.2] 共有制御問題を、協調エージェントに直接問い合わせる機能を含むように拡張する。
クエリに対する2つの潜在的な応答、すなわちオラクルと有界知識について検討する。
これらはシステム全体の学習コストを削減することを目的としている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:19:38 GMT)
A Defensive Framework Against Adversarial Attacks on Machine Learning-Based Network Intrusion Detection Systems [3.2] 従来のシグネチャベースのネットワーク侵入検知システム(NIDS)はゼロデイ攻撃に対して不十分である。
従来のシグネチャベースのNIDSは、バイパス検出のためにネットワークトラフィックを微妙に操作する敵の回避攻撃に対して脆弱である。
本稿では,ML ベースの NIDS の堅牢性を高める新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:22:11 GMT)
Concentration Inequalities for Statistical Inference [3.1] 本稿では, 数学統計学の非漸近解析に広く用いられている濃度不等式について概説する。
我々は、既知の定数で濃度不等式を説明し、より鋭い定数で既存の境界を改善することを目的としている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:17:27 GMT)
Reverb: Open-Source ASR and Diarization from Rev [3.1] Revは、これらのリリースが音声技術の研究とイノベーションを加速させることを期待している。
今日リリースされた音声認識モデルは、様々な長文の音声認識領域で、既存のすべてのオープンソースの音声認識モデルを上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:15:12 GMT)
Practical Principles for AI Cost and Compute Accounting [3.1] 政策立案者は、開発コストと計算をAIモデル能力とリスクのプロキシとしてますます活用している。
本稿では,実用的なAIコストと計算会計基準を設計するための7つの原則を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:59:47 GMT)
Evaluate with the Inverse: Efficient Approximation of Latent Explanation Quality Distribution [3.1] こうした説明の質を測る手段としては、XAIの実践者が頼りにしている。
伝統的に、説明の質はランダムに生成されたものと比較することで評価されてきた。
本稿では,QGE(Quality Gap Estimate)という代替手法を紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:04:01 GMT)
Continual Person Identification using Footstep-Induced Floor Vibrations on Heterogeneous Floor Structures [3.1] 個人識別は、健康モニタリング、活動追跡、人事管理といったパーソナライズされたサービスを提供するスマートな建物にとって重要である。
既存の研究では、この目標を達成するためにカメラを使用しているが、直接視線を必要とする。
ウェアラブルや圧力マットなどの他のモダリティは、デバイスキャリーや密集配置の要件によって制限される。
正確なオンライン人物識別のための足音による構造振動データの変動特性を特徴付ける。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:00:40 GMT)
Straight to Zero: Why Linearly Decaying the Learning Rate to Zero Works Best for LLMs [3.0] 計算-最適データセットサイズでのトレーニングにおいて、単純な線形減衰-ゼロ(D2Z)スケジュールが、他のスケジュールよりも一貫して優れていることを示す。
D2Zは、さまざまなモデルサイズ、バッチサイズ、データセット、語彙に優れています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:08:24 GMT)
Fixed-point quantum continuous search algorithm with optimal query complexity [3.0] 連続探索問題(CSP)は、最適化、物理、工学などの分野で頻繁に発生する。
離散探索問題とは異なり、CSPは数えきれないほど無限の空間をナビゲートする必要がある。
本稿では,これらの課題に対処するために連続変数を活用する固定点量子探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:13:54 GMT)
Large Language Models for Interpretable Mental Health Diagnosis [2.9] 大規模言語モデル(LLM)と制約論理プログラミング(CLP)の強みを組み合わせた精神保健診断のための臨床意思決定支援システム(CDSS)を提案する。
我々のCDSSは、LCMを用いて診断マニュアルを論理プログラムに翻訳し、既製のCLPエンジンを用いて患者の診断を問い合わせるソフトウェアツールである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:32:46 GMT)
Tensor Product Neural Networks for Functional ANOVA Model [2.7] 機械学習モデルの複雑化に伴い、機械学習モデルの解釈可能性の重要性が増している。
本稿では,ANOVAのユニークな分解を保証し,各コンポーネントを安定して推定できる新しい解釈可能なモデルを提案する。
実験により、ANOVA-NODEは各コンポーネントのより安定した評価を提供し、トレーニングデータとモデルパラメータの初期値が変化するとき、より安定した解釈を提供することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:15:38 GMT)
Bridging Structural Dynamics and Biomechanics: Human Motion Estimation through Footstep-Induced Floor Vibrations [2.7] 既存のアプローチには、カメラ、ウェアラブル、圧力マットなどの監視デバイスが含まれる。
歩行誘発床振動を利用して下肢関節運動を推定する。
本モデルでは,身体と床間の情報共有を可能とし,不確実性を低減するために物理的制約を課す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:10:15 GMT)
SALSA-RL: Stability Analysis in the Latent Space of Actions for Reinforcement Learning [2.7] 本研究では,SALSA-RL(Stability Analysis in the Latent Space of Actions)を提案する。
事前訓練されたエンコーダデコーダと状態依存線形システムを用いることで,安定性解析と解釈可能性の両方を実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:09:39 GMT)
Comprehensive Analysis of Transparency and Accessibility of ChatGPT, DeepSeek, And other SoTA Large Language Models [2.7] オープンソース人工知能(AI)に関する議論が増えているが、既存の研究は、最先端(SoTA)大規模言語モデル(LLM)の透明性とアクセシビリティに関する議論を欠いている。
この研究は、ChatGPT、DeepSeek、LLaMAなどを含む過去5年間のSoTA LLMを批判的に分析し、透明性標準への準拠と部分的開放性の影響を評価する。
我々の研究結果によると、いくつかのモデルはオープンソースとしてラベル付けされているが、必ずしも完全にオープンソースであるとは限らない。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:53:13 GMT)
Less is More: Pre-Training Cross-Lingual Small-Scale Language Models with Cognitively-Plausible Curriculum Learning Strategies [2.7] よりきめ細かいカリキュラム学習戦略を特定するために言語習得理論を利用できるかを評価する。
我々は、SSLMと取得インスパイアされたキュリキュラを言語横断的に実装するために、4つの言語家族のための年齢順コーパスを作成した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:11:37 GMT)
A fast convergence algorithm based on binary integer programming for expert load balancing in MoE LLMs [2.6] 2進整数プログラミング(BIP)に基づく負荷分散アルゴリズムであるBIPに基づくバランシングを提案する。
本アルゴリズムは,シミュレーションの観点で,専門家の負荷バランスと事前学習効率のほぼ完全なトレードオフを実現する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:25:00 GMT)
On the Design of Safe Continual RL Methods for Control of Nonlinear Systems [2.5] 強化学習アルゴリズムは、無人航空機やロボット工学に関連するタスクの制御に成功している。
近年,閉ループにおけるRLアルゴリズムの安全な実行を可能にするために,安全なRLが提案されている。
システムの安全性に対する継続的な適応は、未検討の問題である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:34:40 GMT)
Is Q-learning an Ill-posed Problem? [2.4] 本稿では,連続環境におけるQ-ラーニングの不安定性について検討する。
比較的単純なベンチマークでも、Q-ラーニングの基本課題は本質的に悪用され、失敗しがちであることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:11:33 GMT)
Beyond Translation: LLM-Based Data Generation for Multilingual Fact-Checking [2.3] MultiSynFactは、2.2Mのクレームソースペアを含む最初の大規模多言語ファクトチェックデータセットである。
我々のデータセット生成パイプラインはLarge Language Models (LLMs)を活用し、ウィキペディアの外部知識を統合する。
ユーザフレンドリーなフレームワークをオープンソースとして公開し、マルチリンガルなファクトチェックとデータセット生成のさらなる研究を支援します。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:38:26 GMT)
Optimizing Estimators of Squared Calibration Errors in Classification [2.3] 本稿では,2乗キャリブレーション誤差の推定器の比較と最適化を可能にする平均二乗誤差に基づくリスクを提案する。
キャリブレーション誤差を推定する際のトレーニングバリデーションテストパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:34:11 GMT)
Training Neural ODEs Using Fully Discretized Simultaneous Optimization [2.3] ニューラルネットワークの正規微分方程式(Neural ODEs)の学習には、各エポックにおける微分方程式の解法が必要であるため、計算コストが高い。
特に、コロケーションに基づく完全に離散化された定式化を採用し、大規模な非線形最適化にIPOPT-aソルバを用いる。
この結果から,(コロケーションをベースとした)同時ニューラルODE訓練パイプラインの可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:10:26 GMT)
Steering into New Embedding Spaces: Analyzing Cross-Lingual Alignment Induced by Model Interventions in Multilingual Language Models [2.2] 言語間のアライメント表現は、多言語大言語モデル(mLLM)において望ましい特性である
我々は,mLLMのアクティベーションを変更することで,言語間アライメントが強化されるような埋め込み空間が変化することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:09:54 GMT)
Benchmarking machine learning for bowel sound pattern classification from tabular features to pretrained models [2.2] このデータセットは、ボーエル音のパターンを検出し/または分類するための機械学習モデルの性能を評価するために使用される。
結果は、特にサンプルが少ないクラスの検出において、事前訓練されたモデルの明らかな優位性を強調した。
これらの結果から,全身的な腸音の理解が向上し,今後の消化器検査への機械学習による診断応用が期待できる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:22:48 GMT)
ComposeOn Academy: Transforming Melodic Ideas into Complete Compositions Integrating Music Learning [2.1] ComposeOnは音楽理論に基づくツールで、限られた音楽知識を持つユーザー向けに設計されている。
音楽理論を統合することで、初心者、中間、高度なレベルでの音楽創造を説明する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:18:19 GMT)
Efficient and Provable Algorithms for Covariate Shift [2.0] 我々は、未知かつ有界な関数に対して平均$mathbbE_tildemathbfxsim p_mathrmtestmathbff(tildemathbfx)$を推定することに集中する。
証明可能なサンプル複雑性と計算保証を備えた,いくつかの効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:47:46 GMT)
MOVE: A Mixture-of-Vision-Encoders Approach for Domain-Focused Vision-Language Processing [2.0] マルチモーダル言語モデル(MLM)は、視覚エンコーダと大きな言語モデルとを特定のアダプタを介して結合することにより、視覚情報とテキスト情報を統合する。
我々は、複数の事前学習されたエンコーダを特殊タスクに活用するMOVE(Mixture of Visions)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:05:30 GMT)
Towards Understanding Gradient Flow Dynamics of Homogeneous Neural Networks Beyond the Origin [2.0] 近年の研究では、トレーニングの初期段階では、重量は小さく、起源に近いが、方向は収束していることが確認されている。
本稿では,リプシッツ勾配を持つ同質ニューラルネットワークの起点から逃れた後の勾配流れのダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:32:31 GMT)
Solving quadratic binary optimization problems using quantum SDP methods: Non-asymptotic running time analysis [1.9] 量子コンピュータは、最先端の古典的手法よりも優れたスケールのリソースを用いて、半定値プログラム(SDP)を解くことができる。
本稿では,量子SDPソルバの非漸近的リソース要求の解析を行う。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:54:05 GMT)
A Permutation-equivariant Deep Learning Model for Quantum State Characterization [1.9] 量子状態のキャラクタリゼーションは、量子技術のあらゆる応用の基本的なステップである。
置換等価なディープラーニングモデルとtQSTプロトコルを組み合わせる方法について述べる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:56:53 GMT)
BERTtime Stories: Investigating the Role of Synthetic Story Data in Language Pre-training [1.9] TinyStories を用いた言語事前学習における合成物語データの効果について検討した。
TinyStoriesのサブセット上でGPT-Neoモデルをトレーニングします。
1億語未満の単語にアクセスしても、モデルは与えられたストーリーに対して高品質でオリジナルな補完を生成することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:33:03 GMT)
Quantum Markov Decision Processes: Dynamic and Semi-Definite Programs for Optimal Solutions [1.9] オープンループおよび古典的状態保存型クローズループポリシーの最適ポリシと値関数に対する半定値プログラミング手法を開発した。
線形プログラムとして,ほぼ最適な値関数と最適定常開ループポリシーの定式化を求める方法を確立する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:12:07 GMT)
Connecting the geometry and dynamics of many-body complex systems with message passing neural operators [1.8] 我々は,多体複雑なシステムのマルチスケール進化演算子を学習するためのスケーラブルなAIフレームワークであるROMAを紹介する。
注意機構は局所部分グラフの幾何学的表現と動的演算子の接続によるマルチスケール相互作用のモデル化に使用される。
我々はROMAフレームワークが予測タスクと効果的な動的タスク間のスケーラビリティとポジティブな転送を改善することを実証した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:04:09 GMT)
Chats-Grid: An Iterative Retrieval Q&A Optimization Scheme Leveraging Large Model and Retrieval Enhancement Generation in smart grid [1.8] 本稿では,スマートグリッド環境向けに最適化された,反復検索に基づくQ&AフレームワークChats-Gridを提案する。
検索中,Best Matching 25(BM25)スパース検索とBAAI General Embedding(BGE)高密度検索を組み合わせて,膨大な異種データセットを効果的に処理する。
検索後、微調整された大きな言語モデルでは、関連性を評価し、無関係の結果をフィルタリングし、文脈精度に基づいて文書を並べ替える。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:47:01 GMT)
VIC: Evasive Video Game Cheating via Virtual Machine Introspection [1.7] ビデオゲームの不正行為は、一部のプレイヤーに不公平なアドバンテージを与えるためにビデオゲームの振る舞いを変更します。
これはオンラインゲーム体験を破壊し、ゲーム開発者にとって経済的損失をもたらす可能性がある。
我々は、仮想マシンを利用してステルスゲームチートを実行する新しいタイプのゲームチート、Virtual Machine Introspection Cheat(VIC)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:45:23 GMT)
SpikeRL: A Scalable and Energy-efficient Framework for Deep Spiking Reinforcement Learning [1.7] SpikeRLは、DeepRLベースのSNNのためのスケーラブルでエネルギー効率のよいフレームワークである。
新しいSpikeRLの実装は、最先端のDeepRL-SNN法よりも4.26倍高速で、2.25倍エネルギー効率が高い。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:28:42 GMT)
CurricuVLM: Towards Safe Autonomous Driving via Personalized Safety-Critical Curriculum Learning with Vision-Language Models [1.7] CurricuVLMは、自律運転エージェントのためのパーソナライズされたカリキュラム学習を可能にする新しいフレームワークである。
我々のアプローチでは、エージェントの動作を分析し、パフォーマンスの弱点を特定し、動的に調整されたトレーニングシナリオを生成するために、視覚言語モデル(VLM)を利用する。
CurricuVLMは、通常のシナリオと安全クリティカルなシナリオの両方において、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:42:40 GMT)
Deep Learning-based Dual Watermarking for Image Copyright Protection and Authentication [1.6] 本稿では,インターネット上に送信された画像のソース認証,コンテンツ認証,デジタルコンテンツ著作権保護を行うための,Deep Learningベースの2種類の透かし方式を提案する。
また、画像の暗号ハッシュや画像の主要な特徴を透かしとして使用するため、透かしを模倣または上書きすることは不可能である。
訓練されたモデルでは,高い透かし抽出精度が得られており,その知識を最大限活用するために,本論文で提案される深層学習に基づく二重透かし技術である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:58:39 GMT)
Large Language Models and Mathematical Reasoning Failures [1.6] 本稿では,50の高校レベルの単語問題を用いた大規模言語モデル(LLM)の数学的推論能力について検討する。
最終回答と解決手順の両方を厳格に分析して、推論の失敗を特定します。
より新しいモデル(例えば、o3-mini、deepseek-r1)はより精度が高いが、全てのモデルは空間的推論、戦略的計画、算術における誤りを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:04:07 GMT)
Towards a Reward-Free Reinforcement Learning Framework for Vehicle Control [1.6] 強化学習は、最適な制御戦略を学ぶためのエージェントを導くことによって、車両制御において重要な役割を担っている。
車両制御アプリケーションでは、通常、報酬は複数の暗黙的要因を考慮して手動で設計する必要がある。
本稿では,これらの問題に対処するためのRFRLF(Regend-free Regressed Learning framework)を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:43:24 GMT)
Bridging vision language model (VLM) evaluation gaps with a framework for scalable and cost-effective benchmark generation [1.6] 本稿では,ドメイン固有のVLMベンチマークの資源効率向上のためのフレームワークを提案する。
また、同じ均質なプロトコルに基づいて作成した7つのドメインに対する新しいVLMベンチマークもリリースしている。
合計37,171タスクにおける22の最先端VLMの広範なベンチマークにより、ドメインとタスク間のパフォーマンスのばらつきが明らかになった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:24:10 GMT)
Tuning the Frequencies: Robust Training for Sinusoidal Neural Networks [1.5] 正弦波ネットワークの容量特性を説明する理論的枠組みを導入する。
入力周波数の整数結合として表される多数の新しい周波数を,その層組成によってどのように生成するかを示す。
提案手法はTUNERと呼ばれ, 正弦波INRトレーニングの安定性と収束性を大幅に改善し, より詳細な再建を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:05:11 GMT)
Enhancing Vehicle Make and Model Recognition with 3D Attention Modules [1.5] 自動車製造・モデル認識(VMMR)は、インテリジェントトランスポートシステムの重要なコンポーネントである。
本研究では,クラス間の類似性とクラス内変動に対処するアテンションモジュールを実装した。
提案モデルでは,アテンションモジュールを,畳み込みモデルの中間部分にある2つの異なる場所に統合する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:52:56 GMT)
Reproducing NevIR: Negation in Neural Information Retrieval [1.5] 否定は人間のコミュニケーションの基本的な側面であるが、情報検索(IR)における言語モデル(LM)の課題である。
NevIRは、ほとんどのIRモデルは、否定を扱う際にランダムランキングのレベル以下で機能することを示すベンチマーク研究である。
以上の結果から,最近登場したリストワイド・Large Language Model (LLM) のリランカーは,他のモデルよりも優れているが,人間のパフォーマンスは劣っていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:18:26 GMT)
The Relationship Between Reasoning and Performance in Large Language Models -- o3 (mini) Thinks Harder, Not Longer [1.5] 我々はOmni-MATHベンチマークでo1-miniおよびo3-miniのチェーン長を解析した。
o3-mini (m) は, o1-mini よりも長い推論鎖を必要とすることなく, 精度が高いことがわかった。
この精度低下は、より熟練したモデルでは著しく小さく、新しい世代の推論モデルがテスト時間計算をより効果的に使用することを示唆している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:59:13 GMT)
I2CKD : Intra- and Inter-Class Knowledge Distillation for Semantic Segmentation [1.4] 本稿では,イメージセマンティックセグメンテーションに適した新しい知識蒸留法を提案する。
本手法の焦点は,教師(面倒なモデル)と生徒(コンパクトモデル)の中間層間の知識の獲得と伝達である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:22:15 GMT)
Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks [1.4] サッカーは2つのデータソースに依存している。
本稿では,学習したエンドツーエンドと最先端の3D CNNによる視覚的・ゲーム的状態分析を組み合わせた時間的行動検出手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:41:38 GMT)
Optimal and Provable Calibration in High-Dimensional Binary Classification: Angular Calibration and Platt Scaling [1.3] テキスト重みは、推定器$hatw$と真の線形重み$w_star$との角度$hatw, w_star$に依存する。
我々の研究は、高次元でのキャリブレーションと最適性の両方を満たすキャリブレーション戦略を初めて提供するものである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:24:27 GMT)
Atoms, Worldlines, and the Failure of the Scalar Approximation [1.2] 本研究では, 揺らぎによる影響の理論的枠組みについて検討し, ワールドラインパス積分法の限界を解析する。
ワールドライン法におけるTE/TM分解はグリーンテンソル形式と異なることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:18:51 GMT)
Real-Time Moving Flock Detection in Pedestrian Trajectories Using Sequential Deep Learning Models [1.2] 本稿では,マルチペデストリアントラジェクトリにおけるリアルタイムフロック検出に,リカレントニューラルネットワーク(RNN)を含む逐次的深層学習モデルを用いることを検討した。
本手法は実世界のグループ移動データセットを用いて検証し、その頑健さを様々なシーケンスの長さと多様な動きパターンで実証する。
我々は,護送船団や群れなどの集団行動の他の形態を特定するためのアプローチを拡張し,より包括的なマルチエージェント行動分析の道を開く。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:04:34 GMT)
Token Adaptation via Side Graph Convolution for Efficient Fine-tuning of 3D Point Cloud Transformers [1.2] 本稿では,近接グラフ(STAG)上でのサイドトークン適応(Side Token Adaptation)と呼ばれる新しいPEFTアルゴリズムを提案する。
STAGは、下流タスクにトークンを適用するために、凍結バックボーントランスフォーマーと並行して動作するグラフ畳み込みサイドネットワークを使用している。
また、さまざまな公開3Dポイントクラウドデータセットからなる新しいベンチマークであるPoint Cloud Classification 13 (PCC13)も紹介する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:56:49 GMT)
Comparative Analysis of Black Hole Mass Estimation in Type-2 AGNs: Classical vs. Quantum Machine Learning and Deep Learning Approaches [1.1] この研究は、ブラックホール質量推定のための古典的および量子機械学習(QML)のアルゴリズムを比較した。
その結果、古典的アルゴリズムは量子モデルよりもR2, MAE, MSE, RMSEの結果が優れていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:43:50 GMT)
Human Motion Prediction, Reconstruction, and Generation [1.1] 本報告では,ヒトの運動予測・再建・生成の最近の進歩を概観する。
人間の動き予測は、過去のデータから将来のポーズや動きを予測することに焦点を当てている。
レコンストラクションは、視覚入力から正確な3D人体の動きを復元することを目的としている。
動作生成は、アクションラベル、テキスト記述、環境制約から現実的で多様な動きを合成する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:38:09 GMT)
A toolbox of spin-adapted generalized Pauli constraints [1.0] 少電子量子系におけるスピン適応一般化パウリ制約(GPC)について検討・適用する。
我々は、GPCの重要性を強調するスーパーセレクションルールを立証する。
少数電子系への応用は、以前に観測された準正準化は主にスピン対称性に由来することを示唆している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:42:14 GMT)
The Observational Partial Order of Causal Structures with Latent Variables [0.9] 潜在変数を持つ因果構造の同値類の部分順序を決定する問題を考える。
可視変数の数が増えると、非自明な不等式制約を満たす同値類がユビキタスになる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:50:24 GMT)
Explainable AI and the Scientific Method: Interpretability-Guided Knowledge Discovery [0.9] 我々は、人類の科学的発見のための複雑な推論が、少なくとも人工知能の出現以前には重要な存在であると主張している。
意思決定に使用されるAIシステムの原則を知ることは、ドメインの専門家や科学者と接触するポイントになり得る。
我々は、この分野を、予測AIシステムの解釈可能性に基づいて、領域の専門家が科学的仮説と説明を定式化する、説明可能な科学用AIと定義する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:49:25 GMT)
Verification and Validation for Trustworthy Scientific Machine Learning [0.9] 本研究の目的は,予測型SciMLにおけるコンセンサスに基づくグッドプラクティスの確立に関する議論を開始することである。
検証プロトコルや検証プロトコルなど,既存の計算科学・工学ガイドラインを適用する上で重要な課題を明らかにする。
予測アプリケーションを中心にして16の推奨事項は、研究者を支援することを目的としています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:41:28 GMT)
AutoTandemML: Active Learning Enhanced Tandem Neural Networks for Inverse Design Problems [0.9] 逆設計は、望ましいパフォーマンス結果を達成する最適設計パラメータを決定することを含む。
本稿では,タンデムニューラルネットワークとアクティブラーニングを組み合わせたハイブリッド手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:10:56 GMT)
Compression Barriers for Autoregressive Transformers [0.8] 自己回帰変換器の鍵となる制限は、以前のキー値の埋め込みをキャッシュするために必要な大きなメモリである。
任意のアルゴリズムが$Omega(dcdot ed)$空間を必要としていることを示し、ザンディー、ハン、ミロクニ、カルバシによって提案された SubGen の被覆数に対する厳密な境界を用いて証明する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:37:52 GMT)
Graph Attention Convolutional U-NET: A Semantic Segmentation Model for Identifying Flooded Areas [0.7] 本稿では,浸水領域の自動識別のための革新的なアプローチとして,グラフ注意畳み込み型U-NET(GAC-UNET)モデルを提案する。
このモデルはグラフアテンション機構とChebyshevレイヤをU-Netアーキテクチャに組み込んでいる。
実験の結果,提案したGAC-UNETモデルは,91% mAP,94% dice score,89% IoUの他のアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:50:13 GMT)
Forecasting Frontier Language Model Agent Capabilities [0.7] 言語モデル(LM)の下流能力を予測する6つの予測手法を評価する。
計算やモデルリリース日などの入力メトリクスからベンチマークスコアを直接予測する"ワンステップ"アプローチや、クロスベンチマークパフォーマンス(PC-1)や人間による競争力のあるElo評価といった中間メトリックを最初に予測する"ツーステップ"アプローチを採用しています。
当社の予測では,2026年初めまでに,能力の低い非特殊化LMエージェントがSWE-Bench Verifiedで54%,最先端LMエージェントが87%の成功率に達すると予測されている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:34:17 GMT)
Enhancing Domain-Specific Retrieval-Augmented Generation: Synthetic Data Generation and Evaluation using Reasoning Models [0.7] Retrieval-Augmented Generation (RAG) システムは、技術的領域に適用した場合、大きなパフォーマンスギャップに直面します。
ドメイン固有のRAG性能を最適化するために、粒度評価指標と合成データ生成を組み合わせたフレームワークを提案する。
10トークン未満の小さなチャンクは、精度を31-42%向上させます。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:38:57 GMT)
Doctor-in-the-Loop: An Explainable, Multi-View Deep Learning Framework for Predicting Pathological Response in Non-Small Cell Lung Cancer [0.7] 非小細胞肺癌(NSCLC)はいまだに世界的な健康上の課題である。
専門家主導のドメイン知識と説明可能な人工知能技術を統合する新しいフレームワークであるDoctor-in-the-Loopを提案する。
アプローチでは段階的なマルチビュー戦略を採用し,より広いコンテキスト特徴からより微細で病変特異的な詳細まで,モデルの焦点を段階的に洗練する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:35:30 GMT)
A General Pseudonymization Framework for Cloud-Based LLMs: Replacing Privacy Information in Controlled Text Generation [0.7] ChatGPTサービスはクラウドベースの大規模言語モデル(LLM)を活用する
プライバシの懸念は、モデルプロバイダによってプロンプトが送信され、処理されるときに生じる。
クラウドベースのLCMに適用可能な一般的な擬似化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:15:53 GMT)
TexLiDAR: Automated Text Understanding for Panoramic LiDAR Data [0.6] LidarCLIPのようなテキストとLiDARデータを接続する努力は、主にCLIPテキストイメージスペースに3Dポイントクラウドを埋め込むことに重点を置いている。
3次元点雲の代わりにOS1センサによって生成された2次元画像を活用することで、LiDARデータをテキストで接続する代替手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:39:21 GMT)
Non-Gaussian state teleportation with a nonlinear feedforward [0.6] 連続変数クラスタ状態による測定誘起量子計算は、非ガウス測度とフィードフォワード制御を伴うクラスタを通して状態を伝播するテレポーテーションを利用する。
量子非ガウス状態のそのような伝播を、小さなクラスター状態を通して非線形にスクイーズすることで解析し、非線形フィードフォワードがテレポーテーションプロトコルに関与している場合、高い非線形スキューズが転送可能であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:33:49 GMT)
Topological Computation by non-Abelian Braiding in Classical Metamaterials [0.6] 古典的機械的メタマテリアルにおける一次元計算型北エフ超伝導体の実現を提案する。
本研究では,MZM(Major Zero Modes)と呼ばれるシステムの中間ギャップ振動モードが,量子理論によって予測される統計を正確に再現することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:44:10 GMT)
UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction [0.6] 本稿では,骨ラベルの自動生成による残響超音波データセットの収集手法を提案する。
提案するラベルは、追跡された骨CTモデルを追跡された超音波画像に正確に重ね合わせることで得られる。
骨分割のためのニューラルネットワークは、収集されたデータセットに基づいてトレーニングされ、その予測は専門家の手動ラベルと比較される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:03:17 GMT)
Methods and Trends in Detecting Generated Images: A Comprehensive Review [0.6] GAN(Generative Adversarial Networks)、拡散モデル(Diffusion Models)、変分オートエンコーダ(VAEs)は、高品質なマルチメディアデータの合成を可能にしている。
これらの進歩は、敵の攻撃、非倫理的使用、社会的な危害に関する重大な懸念を引き起こした。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:16:18 GMT)
Securing Healthcare with Deep Learning: A CNN-Based Model for medical IoT Threat Detection [0.4] インターネット・オブ・メディカル・モノ(IoMT)の医療システムへの統合は、患者のケアを大幅に強化した。
本稿では、IoMT環境におけるサイバー攻撃を検出するために、畳み込みニューラルネットワーク(CNN)に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:42:34 GMT)
PROSKILL: A formal skill language for acting in robotics [0.4] 自律ロボットにとって行動は重要な決定機能である。
演技スキルをプログラムする新しい言語を提案する。
この言語は、オフラインでプロパティをチェックしたり、スキルを実行するのに使える形式モデルに自由にマッピングします。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:30:29 GMT)
Sheaf theory: from deep geometry to deep learning [0.4] 本稿では,深層学習,データサイエンス,計算機科学におけるせん断理論の適用について概説する。
理論研究者と実践者の両方が共有する層理論の直観と動機について述べる。
そこで本研究では,任意の有限集合上でのせん断コホモロジーを計算するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:00:25 GMT)
CSTRL: Context-Driven Sequential Transfer Learning for Abstractive Radiology Report Summarization [0.4] 放射線学報告は、診断の発見と印象を含むいくつかのセクションから構成される。
共通の抽象的な要約問題に優れた事前学習モデルは、専門の医療領域に適用した場合に困難に直面する。
キーコンテンツ抽出とコヒーレント要約を保証するシーケンシャルトランスファー学習を導入する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:32:11 GMT)
AutoMedPrompt: A New Framework for Optimizing LLM Medical Prompts Using Textual Gradients [0.4] 大規模言語モデル(LLM)は、医学やその他の知識分野において、ますます高度なパフォーマンスを示している。
近年の急進的な工学は微調整ではなく、一般的な基礎モデルの性能を高める可能性を示している。
本稿では,医学的関連推論のためのテキスト勾配の活用を探求するAutoMedPromptを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:17:37 GMT)
How does a Language-Specific Tokenizer affect LLMs? [0.4] 言語固有のトークン化器の必要性は、効果的な自然言語処理にとって直感的に重要である。
本研究では、言語固有のトークン化剤が、主に英語のテキストデータを用いて訓練された大規模言語モデルの振る舞いにどのように影響するかを考察する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:41:19 GMT)
Genuine Multipartite Entanglement in Quantum Optimization [0.3] マルチパーティの絡み合いは、正確な解で瞬時状態の重なり合いに上限を与えることを示す。
私たちの結果は、量子最適化のリソースとして、量子相関がいかに複雑なものになったかを明らかにするのに役立ちます。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:14:32 GMT)
Three Mechanisms of Feature Learning in a Linear Network [0.3] 有限幅の1次元データを用いた一層線形ネットワークの学習力学の正確な解を提案する。
特徴学習システムに特有の3つの新しいプロトタイプメカニズムを同定する。
実世界のタスクを扱うディープ非線形ネットワークにおいても,これらのメカニズムが現れることを示す実証的な証拠が得られた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:50:09 GMT)
FormalSpecCpp: A Dataset of C++ Formal Specifications created using LLMs [0.3] FormalSpecCppは、C++プログラムの正式な仕様を検証するための標準ベンチマークのギャップを埋めるために設計されたデータセットである。
仕様推論ツールの評価と、生成された仕様の正確性をテストするための構造化ベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:20:04 GMT)
Extreme Speech Classification in the Era of LLMs: Exploring Open-Source and Proprietary Models [0.3] ChatGPTはLarge Language Models (LLMs)の潜在的な応用に世界的な注目を集めている。
我々は、Maronikolakis et al. (2022) の極端な音声データセットのインドのサブセットを活用し、LLMを用いた効果的な分類フレームワークを開発する。
我々は,オープンソースLlamaモデルをオープンソースOpenAIモデルと比較し,事前学習したLLMは適度な有効性を示すが,ドメイン固有データによる微調整は性能を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:31:05 GMT)
Range Retrieval with Graph-Based Indices [0.3] 高次元ベクトル空間における近接点の検索は,情報検索における重要なステップである。
本稿では,グラフに基づくベクトル指標を用いた範囲探索アルゴリズムを提案する。
単純なベースラインアプローチよりも,クエリスループットが最大100倍,平均で5~10倍,パフォーマンスが最大1億データポイントまで向上しています。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:20:30 GMT)
MVIP -- A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition [0.3] MVIPはマルチモーダルおよびマルチビューアプリケーション指向の産業部品認識のための新しいデータセットである。
MVIPの主な目的は、下流タスクにおける様々な最先端メソッドの転送可能性の研究とプッシュである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:22:29 GMT)
Scaling the Variational Quantum Eigensolver for Dynamic Portfolio Optimization [0.2] 本研究は,100kbitのユーティリティフロンティアを超える動的ポートフォリオ最適化問題の解法における変分量子固有解法の可能性について検討する。
我々は、アンサッツと実際の量子処理ユニットの異なる組み合わせをテストすることによって、この戦略を6から112キュービットまで、複雑さとサイズでスケールする方法を分析する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:37:11 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2] Vibravox corpusには45時間の音声サンプルと188人の参加者が異なる音環境下で記録した生理的音が含まれている。
音声認識, 音声強調, 話者検証など, 様々な音声関連課題について, 一連の実験を行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:42:56 GMT)
EHands: Quantum Protocol for Polynomial Computation on Real-Valued Encoded States [0.2] EHandsプロトコルは、量子プロセッサ上の多変数変換のための普遍的な量子演算セットを定義する。
我々は,IBMのヘロン級量子プロセッサと理想Qiskitシミュレータを用いた$P_(x)$の詳細な実装を提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:52:16 GMT)
Multi-Objective Optimization of Water Resource Allocation for Groundwater Recharge and Surface Runoff Management in Watershed Systems [0.2] 土地の劣化と大気汚染は、主に土壌の塩分化と砂漠化によって引き起こされる。
本研究は,ウルミア湖の水位を維持するために,水面流出の総量を決定する最適化問題を提示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:34:27 GMT)
Zweistein: A Dynamic Programming Evaluation Function for Einstein Würfelt Nicht! [0.2] Zweistein は Einstein W "urfelt Nicht!
評価関数を構築するために人間の知識に頼る代わりに、Zweistein氏はデータ中心のアプローチを使用している。
ツヴァイシュタインはTCGA 2023で優勝した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:54:21 GMT)
Generative AI Training and Copyright Law [0.1] 生成AIモデルのトレーニングには大量のデータが必要である。
一般的な慣行は、ウェブスクレイピングを通じてそのようなデータを収集することである。しかしながら、収集されたものの多くは著作権で保護されている。
米国では、AI開発者は"フェアユース"に依存しており、ヨーロッパでは、"テキストとデータマイニング"(TDM)の例外が適用されるという見解が一般的である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:45:14 GMT)
Fast quantum simulation of electronic structure by spectrum amplification [0.0] 我々は2つの主要なクーロン積分因数分解スキーム間のトレードオフを提供する新しい因数分解を開発する。
電子構造ハミルトニアンの2乗の和表現は効率的に計算可能であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:01:12 GMT)
iPEPS failure to represent corner-dependent entanglement in conformal systems [0.0] 両分節の鋭い角から生じる下降性絡み合いの寄与について検討した。
ギャップ付き系では、コーナー依存項は連続体理論によって特定の開角依存性を持つと予測される。
整合性(クリティカルな)システムでは、予測コーナー項はシステムサイズと対数的にスケールする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:47:11 GMT)
Transition from non-ergodic to ergodic dynamics in an autonomous discrete time crystal [0.0] 多モード共振器と相互作用する2つの結合単一モード共振器の自律システムを考える。
単一モードキャビティ間の小さな結合強度のために、Loschmidtエコーは周期的に周期的に振動する。
遷移点において、光子の数の時間平均分散が最大に達し、遷移のシグネチャとして機能することを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:32:45 GMT)
Topological phases in two-dimensional Rydberg lattices [0.0] 本稿では,Rydberg原子の2つのオフセット平方部分格子からなる,単純かつ実験的に実現可能な2次元格子モデルを提案する。
このモデルは位相位相の多元性を明らかにし、全て格子幾何学の変動を通して連結される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:51:59 GMT)
The Born rule -- 100 years ago and today [0.0] 100年前のボルン・ルールの初期の歴史、約50年前のPOVMへの一般化、量子検出器の概念の直観的な定義からの現代的な導出を辿っている。
A. Neumaier の最近の著書 "Coherent Quantum Physics" と A. Neumaier と D. Westra の著書 "Algebraic Quantum Physics, Vol. 1" (2024) のほとんど知られていない結果に基づいている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:40:35 GMT)
Tailored Design of Audio-Visual Speech Recognition Models using Branchformers [0.0] 本稿では,パラメータ効率の高い音声認識システムの設計のための新しいフレームワークを提案する。
より正確に言うと、提案するフレームワークは、まず、音声のみのシステムとビデオのみのシステムを推定し、次に、カスタマイズされたオーディオ視覚統合エンコーダを設計する。
我々のモデルは、英語で約2.5%の競争力のある単語誤り率(WER)を達成し、スペイン語で既存のアプローチを上回ります。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:52:07 GMT)
Superspin Renormalization and Slow Relaxation in Random Spin Systems [0.0] 我々は、ランダムに相互作用するスピン-$frac12$系における保存密度のダイナミクスを記述するために、励起状態実空間再正規化群(RSRG-X)を開発した。
我々の定式化は$textrmU(1)$および$mathbbZ$対称性を持つ系に適しており、双極子$XX+YY$相互作用を持つランダムに位置付けられたスピンの連鎖に適用する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:39:04 GMT)
Super-Resolution for Interferometric Imaging: Model Comparisons and Performance Analysis [0.0] この研究は、超解像モデルRCANとReal-ESRGANの2つを評価し、マイクロ粒子ベースのデータセットから高分解能インターフェログラムを再構成する効果について評価した。
その結果、RCANは優れた数値精度を実現し、高精度な位相マップ再構成を必要とするアプリケーションに最適であることが示された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:50:57 GMT)
Steganographic Embeddings as an Effective Data Augmentation [0.0] Least Significant Bit (LSB) Steganographyは、秘密情報を画像に埋め込む暗号技術である。
LSBステガノグラフィーは、画像の k 個の最小のビットを秘密画像の k 個の最も重要なビットに置き換えることでこれを実現している。
CIFAR-10において,LSBステガノグラフィーが深層ニューラルネットワークのトレーニング効率を大幅に向上できることを示す実験結果を示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 06:38:03 GMT)
State Transfer and Readout Times for Trees of Diameter 4 [0.0] 連続時間量子ウォークの直径4の木上における状態伝達特性について考察する。
それぞれのタイプに対して、状態転移がかなり良いような直径 4 本の木々の無限の族を構築する。
残余型の強いスペクトル頂点について、木列と明示的な読み出し時間を特定する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:18:06 GMT)
Spatiotemporal Forecasting in Climate Data Using EOFs and Machine Learning Models: A Case Study in Chile [0.0] 本研究は、時系列予測のための機械学習(ML)手法と確立された統計的手法を統合する、革新的で効率的なハイブリッド手法を用いる。
この手法はチリの領域をカバーする気候データグリッドに適用される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:34:38 GMT)
Sparks of cognitive flexibility: self-guided context inference for flexible stimulus-response mapping by attentional routing [0.0] 実世界のタスクを高速かつスローで学習するウィスコンシンニューラルネットワーク(WiNN)を提案する。
WiNNは、事前にトレーニングされた畳み込みニューラルネットワークを視覚に使用し、関連する機能に注意を向ける調整可能な"コンテキスト状態"と組み合わせている。
我々はウィスコンシンカードソーティングタスクのイメージベース拡張を用いてWiNNを評価し,認知的柔軟性の指標をいくつか明らかにした。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:03:44 GMT)
Simulating Noncausality with Quantum Control of Causal Orders [0.0] 量子入力のシナリオにおいて、ShiFT測定は量子スイッチを用いて実装可能であることを示す。
このことは、ルガノ過程の構造が量子スイッチによってシミュレートできることを示し、ShiFTの識別に成功したことは、非因果性よりも因果非分離性を証明していることを示している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:39:55 GMT)
SVDq: 1.25-bit and 410x Key Cache Compression for LLM Attention [0.0] KVキャッシュ圧縮技術の主な3つのタイプ、すなわちスパシティ、チャネル圧縮、量子化が同定された。
本研究は,Kキャッシュの混合精度定量化法であるSVDqを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:55:21 GMT)
Rounding near-optimal quantum strategies for nonlocal games to strategies using maximally entangled states [0.0] 制約系(BCS)ゲームに対するほぼ完全な量子戦略は、対応するBCS代数の近似表現であることを示す。
XOR非局所ゲームのクラスに対して、準最適量子戦略は対応する$*$-代数の近似表現であることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:43:32 GMT)
Rotational decoherence dynamics in ultracold molecules induced by a tunable spin environment: The Central Rotor Model [0.0] 分子の量子回転ウェーブパレットダイナミクスは,新しいシステム環境モデルによって記述できることを示す。
核スピンバス誘起KRb分子の回転デコヒーレンスダイナミクスの数値シミュレーションを行った。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:30:23 GMT)
Robust and Indestructible Macroscopic Entanglement [0.0] 本研究では,デコヒーレンス,粒子損失,限られた精度の測定などの現実的な要因を考慮し,マクロな絡み合いを観察する可能性を検討する。
そこで我々は,よりレジリエントなマクロ的絡み合いの概念を提案し,当事者が共有システムの一部をランダムに選択できるようにする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:44:20 GMT)
Revealing Symmetry-Broken Superconducting Configurations by Density Functional Theory [0.0] 現在、従来の超伝導体と非伝統的な超伝導体の超伝導に関するコヒーレントな理論は欠落している。
ここでは, 通常の導電構成の原子摂動による対称性破壊型超伝導構造の形成から超伝導が生じることを示す。
本研究は, 従来の超伝導体ではSODTはバルク材料に埋め込まれており, フォノン振動で容易に破壊できることを示す。
YBa2Cu3O7 (YBCO7)のような非伝統的な超伝導体では、SODTはバルク材料に非常に弱い結合を持つ層状ポントン構造によって保護される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:19:04 GMT)
Residual Random Neural Networks [0.0] ランダムな重みを持つ単層フィードフォワードニューラルネットワークは、ニューラルネットワークの文献の中で繰り返されるモチーフである。
隠れたニューロンの数がデータサンプルの次元と等しくない場合でも,優れた分類結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:07:58 GMT)
Realizing a mechanical dynamical Casimir effect with a low-frequency oscillator [0.0] 本稿では,ハイブリッド光学系における機械力学カシミール効果(MDCE)を実現することを提案する。
これは超伝導回路のようなパラメトリックDCEの量子シミュレーションではない。
メカニカル周波数は、DCE光子の顕著なフラックスを生じる場合、キャビティモードよりも約2桁小さいことが判明した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:03:05 GMT)
Randomized benchmarking with non-Markovian noise and realistic finite-time gates [0.0] 単量子ランダム化ベンチマーク実験における非マルコフ古典雑音の影響を解析する。
本フレームワークは,各ゲート列のランダムな性質を利用して,完全生存確率減衰曲線の式を導出する。
これらの効果がランダム化ベンチマーキング実験の解釈をいかに複雑にするかを論じるとともに、非マルコビアン性の調査にどのように活用するかについても論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:11:00 GMT)
Question-to-Question Retrieval for Hallucination-Free Knowledge Access: An Approach for Wikipedia and Wikidata Question Answering [0.0] 本稿では,ウィキペディアやウィキデータといった知識ベースに対する質問応答のアプローチを紹介する。
命令調整 LLM を用いて,各論理コンテンツ単位に対する包括的質問セットを生成する。
ウィキデータからの構造化事実検索によるマルチメディアコンテンツを含むウィキペディアおよびウィキデータ上での有効性を実証する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:58:38 GMT)
Quench Spectroscopy for Dissipative and (Non)-Hermitian Quantum Lattice Models [0.0] 我々は、クエンチ分光法を散逸的かつ孤立的な非エルミート量子格子モデルに拡張する。
まず, 急激な大域クエンチによって誘導される超流動相に閉じ込められた開ボース・ハッバード鎖の動力学を理論的に検討した。
次に、常磁性相に閉じ込められた非エルミート逆場イジング鎖へのクエンチ分光の適用性について論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:21:08 GMT)
Quantum autoencoders for image classification [0.0] 量子オートエンコーダ(QAE)は、パラメータチューニングのみに古典的な最適化を利用する。
QAEはより少ないパラメータで効率的な分類モデルとして機能し、完全なエンドツーエンド学習に量子回路を利用する可能性を強調することができる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:13:38 GMT)
Promoting Gender Equality in Competitive Programming: Strategies and Impacts of Affirmative Actions in Programming Marathons in Brazil [0.0] 本研究は,ブラジルのプログラミングマラソンにおける女性参加を改善するための戦略を提案することを目的とする。
先進的な研究は、ドキュメンタリー、応用、探索であり、女性参加の成果を生み出す行動である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:15:42 GMT)
Programmers Aren't Obsolete Yet: A Syllabus for Teaching CS Students to Responsibly Use Large Language Models for Code Generation [0.0] 大規模言語モデル(LLM)はコード生成を自動化する強力なツールとして登場し、プログラマの生産性を高める大きな可能性を秘めている。
彼らの非決定論的性質とユーザ入力への依存は、責任と効果的な使用を保証するために、プログラミングの基本をしっかりと理解する必要がある。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:36:36 GMT)
Predicting gene essentiality and drug response from perturbation screens in preclinical cancer models with LEAP: Layered Ensemble of Autoencoders and Predictors [0.0] 本稿では,ロバスト性と一般化を向上する新しいアンサンブルフレームワークであるLEAP(Layered Ensemble of Autoencoders and Predictors)を紹介する。
LEAPは、未確認の細胞株、組織、および疾患モデルにおいて、遺伝子本質または薬物応答を予測する最先端のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:12:36 GMT)
Phase space geometry of collective spin systems: Scaling and Fractality [0.0] 3つのスピン系のエネルギーベースにおけるスピンコヒーレント状態の逆参加比のスケーリングについて検討する。
量子キックトトップでは、コヒーレント状態のフラクタル次元(明確に定義されたとき)は3つの一般的な挙動を示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:11:52 GMT)
Packet Inspection Transformer: A Self-Supervised Journey to Unseen Malware Detection with Few Samples [0.0] 従来のセキュリティ対策は、現代のサイバー攻撃の高度化に対して不十分である。
Deep Packet Inspection (DPI)は、ネットワークセキュリティの強化において重要な役割を担っている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:53:06 GMT)
Optimized Pap Smear Image Enhancement: Hybrid PMD Filter-CLAHE Using Spider Monkey Optimization [0.0] そこで本研究では,パップスミア画像の品質向上に最適化されたハイブリッド手法を提案する。
クモ猿最適化(SMO PMD-CLAHE)を用いたハイブリッド手法の最適化
提案手法は,5.45のEME,60.45のRMS,0.995のMC,6.80のエントロピーを平均的に評価した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:34:57 GMT)
Optimization of path-integral tensor-multiplication schemes in open quantum systems [0.0] パス積分技術はオープン量子系において非マルコフ力学の正確な解を提供するために用いられる。
ここでは,行列表現と特異値分解を用いて,テンソルサイズを効果的に削減する最適化手法を提案する。
このアプローチは、従来のテンソル乗算方式の計算時間とメモリ使用量を劇的に削減する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:32:31 GMT)
Ontological models cannot adequately represent state update for sequential measurement of incompatible observables [0.0] 不整合性は、オントロジモデルがシナリオを適切に表現できなくなるのを止めるのに十分である、と我々は主張する。
これは、私たちが論じているように、量子状態更新規則は、条件付き確率に従って状態を更新するためにオントロジモデルを必要とするためである。
これに基づいて、古典波動理論はオントロジモデルと等しく相容れないと論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:38:23 GMT)
Nonlinear Dynamical Systems for Automatic Face Annotation in Head Tracking and Pose Estimation [0.0] 拡張カルマンフィルタ(EKF)とアンカルマンフィルタ(UKF)の3次元顔の動き追跡における性能について考察する。
UKFは高次非線形性を捕捉できるため、平均二乗誤差(MSE)を低くする。
EKFは、UKFと比較して平均二乗誤差(MSE)が低い。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:20:10 GMT)
News Sentiment as a Predictor for American Domestic Migration [0.0] 本稿は、米国新聞紙が米国間移民の傾向に与える影響について詳しく述べる。
平均的な感情スコアが算出され、ニューラルネットワークにデータを入力できるようになった。
状態間移動を予測するためにロジスティック回帰モデルが用いられた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:19:11 GMT)
Making Sense of AI Limitations: How Individual Perceptions Shape Organizational Readiness for AI Adoption [0.0] 本研究では,人工知能(AI)の限界に対する個人の認識が,AI導入の組織的準備にどのように影響するかを検討する。
この研究は、個々のセンスメイキング、社会学習、フォーマルな統合プロセスの間の動的相互作用を通じて、組織的準備が生まれることを明らかにしている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:31:08 GMT)
Machine-generated text detection prevents language model collapse [0.0] 大規模言語モデル(LLM)は、Webでますます普及しています。
Webデータが事前トレーニングの主要なリソースであるため、将来のモデルは、未知の合成データに基づいてトレーニングされる。
これはモデル崩壊を招き、モデルが自身のエラーを補強し、モデルパフォーマンスの低下を経験する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:22:36 GMT)
Machine Learning for Everyone: Simplifying Healthcare Analytics with BigQuery ML [0.0] 機械学習(ML)は、予測分析、パーソナライズされた治療、そして患者の結果を改善することで、医療を変革する。
従来のMLは専門的なスキル、インフラ、リソースを必要とし、多くの医療専門家のアクセシビリティを制限する。
本稿では、医療研究者やデータアナリストが、高度なML知識を必要とせずに、sqlを使用してモデルを構築し、デプロイするのに役立つBigQuery MLクラウドサービスについて説明する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:02:55 GMT)
ML-Driven Approaches to Combat Medicare Fraud: Advances in Class Imbalance Solutions, Feature Engineering, Adaptive Learning, and Business Impact [0.0] 本研究は,メディケア不正検出における機械学習の利用について検討する。
データはRandom Forest、KNN、LDA、Decision Tree、AdaBoostの5つのMLモデルのトレーニングと評価に使用された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:34:12 GMT)
Logit Disagreement: OoD Detection with Bayesian Neural Networks [0.0] この研究は、ベイジアンNNの疫学的不確実性の推定として、プリソフトマックス量の補正版、またはロジットの間の不一致を測定することを提案する。
提案した3つの不確実性スコアは、OOD実験における相互情報よりも顕著に改善され、それ以外は同等の性能を示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:15:11 GMT)
Lectures in Quantum Gravity [0.0] この講義ノート集は、ノルディタのPh.D.スクール「量子重力」で6つのミニコースで取り上げられたトピックの選考を含んでいる。
その範囲は、その基礎から最前線の研究まで、異なる領域間のつながりを強調する、一貫性のある図を提供することであった。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:42:41 GMT)
LUMINA-Net: Low-light Upgrade through Multi-stage Illumination and Noise Adaptation Network for Image Enhancement [0.0] 低照度画像強調(LLIE)は、低照度条件下で撮影された画像の視覚的忠実度を高めることを目的としたコンピュータビジョンにおける重要な課題である。
LUMINA-Netは,多段照明モジュールと反射率モジュールを統合した高度なディープラーニングフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:37:58 GMT)
Key Body Posture Characteristics of Short-distance Speed Skaters at the Start Based on Artificial Intelligence [0.0] 身体姿勢の特徴と開始運動性能への影響を解析した。
トランク角度は開始速度と高い負の相関を示した。
安定性後の角度と左膝の角度が大きくなるほど、起動速度が速くなる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 03:36:17 GMT)
Inverse Surrogate Model of a Soft X-Ray Spectrometer using Domain Adaptation [0.0] 本研究では,軟X線分光計のための頑健な逆代理モデルを作成する方法を提案する。
限られた実験データのため、そのようなモデルはシミュレーションデータで訓練されることが多い。
我々は,データ拡張と対向領域適応技術の適用を実証し,分光計の自動アライメントのための絶対座標を予測できることを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:42:50 GMT)
Interpretation of the Klein-Gordon Probability Density [0.0] クライン=ゴルドン方程式によって与えられる確率密度の式は負の値を取ることができる。
この表現を粒子オントロジーと整合させることは、測定結果と測定間の粒子の位置とを慎重に区別すれば、かなり可能である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 01:08:00 GMT)
Interplay between dressed and strong-axial-field states in Nitrogen-Vacancy centers for quantum sensing and computation [0.0] ダイヤモンド中の窒素-原子核(NV)中心は、量子ラジオメトリー、センシング、計算に応用された興味深い電子スピンシステムである。
本報告では,NV中心アンサンブルにおいて,ひずみと弱磁場の存在下で自由誘導減衰(FID)の測定を行った。
単一FID測定における着衣状態と強軸磁場状態の非平衡重ね合わせの同時検出について述べる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:15:10 GMT)
Integrating Generative AI in Cybersecurity Education: Case Study Insights on Pedagogical Strategies, Critical Thinking, and Responsible AI Use [0.0] 本研究では,GenAIツールをサイバーセキュリティ教育に統合するための構造的枠組みを提案する。
実装戦略は2段階のアプローチに従い、チュートリアル演習とアセスメントタスクにGenAIを組み込んだ。
調査の結果,AI支援学習は,セキュリティポリシーの評価,リスク評価の精査,理論的知識の実践的応用へのブリッジといった,学生の能力を大幅に向上させた。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:14:07 GMT)
Impulse measurements enhanced with squeezed readout light [0.0] 機械検出器を用いたインパルス測定において、量子測定ノイズを標準量子限界以下のレベルまで低減する方法を定量化する。
本研究では, インパルス感度の最適スケーリングをスクイーズ強度で計算し, 光検出損失による劣化の定量化を行う。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:32:49 GMT)
Improved Partial Differential Equation and Fast Approximation Algorithm for Hazy/Underwater/Dust Storm Image Enhancement [0.0] 本稿では、改良された偏微分方程式(PDE)に基づくデハージングアルゴリズムを提案する。
提案アルゴリズムは,画像領域の強調に加えて,画像の暗化やエッジのオーバーエンハンス化といった問題を解く。
提案アルゴリズムは, 改良されたグローバルコントラスト強調アルゴリズムを取り入れた水中および塵嵐画像強調に利用した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 22:44:12 GMT)
Identifying Features that Shape Perceived Consciousness in Large Language Model-based AI: A Quantitative Study of Human Responses [0.0] 本研究では,大規模言語モデル(LLM)に基づくAIシステムにおいて,AI生成したテキストの特徴が人間に主観意識を知覚させるかどうかを定量的に検討する。
回帰分析とクラスタリング分析を用いて,これらの特徴がAI意識に対する参加者の認識にどのように影響するかを検討した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:27:28 GMT)
Identification and estimation for matrix time series CP-factor models [0.0] 本稿では,行列時系列のCP因子モデルを同定し,推定する手法を提案する。
収束速度が小さな固有ギャップに悩まされるような一般化された固有解析に基づくChange et al.(2023)とは異なり、提案手法はより高速な収束速度を享受する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:20:25 GMT)
Highly engaging events reveal semantic and temporal compression in online community discourse [0.0] Redditの会話データを利用して、コミュニティベースの構造を利用して、オフラインイベントがオンラインユーザーインタラクションや行動にどのように影響するかを明らかにする。
オンライン会話は、より限定的な語彙で反復的になり、より速いペースで発展し、感情が高められる。
ユーザはよりアクティブになり、よりリッチな語彙や反復的なメッセージを使うにもかかわらず、より多くのオーディエンスと情報を交換する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 09:15:39 GMT)
High-Harmonic Generation in a Crystal Driven by Quantum Light [0.0] 量子光駆動結晶中のバンド内高調波発生(HHG)について検討した。
駆動場の量子光学特性が高調波スペクトルに及ぼす影響について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:18:19 GMT)
Harnessing omnipresent oscillator networks as computational resource [0.0] 本稿では,オシレータネットワークを計算資源として活用するための普遍的なフレームワークを提案する。
そこで我々は,倉本モデルに非線形目標系を強制し,目標系を訓練されたフィードバックループで置換した後,対象系をエミュレートする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:15:21 GMT)
Gröbner Basis Cryptanalysis of Ciminion and Hydra [0.0] システム問題解決ベースの攻撃は、CiminionやHydraのような対称鍵プリミティブに対して深刻な脅威となる。
SageMathのような計算機代数プログラムの助けを借りて、反復モデルに対するDRL Gr"オブナー基底を構築する。
Hydraの提案では、$r_mathcalH = 31$のラウンドは、Gr"オブナーベースアタックに対して128$のセキュリティを提供するのに十分であると主張した。
しかし、我々のHydra Gr"obnerベースを介して、Lexicographic (LEX) Gr"obnerベースへの標準項順序変換は、単に必要である。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 11:40:49 GMT)
Generative AI Framework for 3D Object Generation in Augmented Reality [0.0] この論文は、最先端の生成AIモデルを統合し、拡張現実(AR)環境で3Dオブジェクトをリアルタイムに作成する。
このフレームワークは、ゲーム、教育、小売、インテリアデザインといった業界にまたがる応用を実証している。
重要な貢献は、3Dモデル作成の民主化であり、高度なAIツールを幅広い聴衆に利用できるようにする。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:01:48 GMT)
FlipConcept: Tuning-Free Multi-Concept Personalization for Text-to-Image Generation [0.0] 複数のパーソナライズされた概念を単一のイメージに統合する手法は、テキスト・ツー・イメージ(T2I)生成の分野で大きな注目を集めている。
既存の手法では、非個人化領域の歪みにより、複数のオブジェクトを持つ複雑なシーンのパフォーマンス劣化を経験する。
FlipConceptは、複数のパーソナライズされた概念を、追加のチューニングを必要とせず、シームレスに単一のイメージに統合する新しいアプローチである。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 04:37:18 GMT)
Extraction multi-étiquettes de relations en utilisant des couches de Transformer [0.0] 本稿では,BTransformer18モデルを提案する。
提案手法は,事前学習した言語モデルの文脈表現能力とTransformerエンコーダのパワーを組み合わせる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:42:51 GMT)
Exposing a Fatal Flaw in Sample-based Quantum Diagonalization Methods [0.0] 我々はQSCI法が化学における実用性を著しく阻害する基本的な限界に直面していることを示す。
QSCIは原則として、高品質なCI拡張を実現することができるが、新しい決定因子を見つけるのに非効率に苦しむことを実証する。
このことは、QSCIがより効率的な古典的応用に遅れるにつれて、量子化学応用における実用性を妨げている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 08:32:41 GMT)
Excited-state quantum phase transitions in constrained systems [0.0] 我々は、励起状態量子相転移(ESQPTs)の標準半古典理論を拡張する。
我々はラグランジュ乗算法の手法を採用し、運動の任意の数の積分によって制約されたハミルトニアンからすべての定常点とそれらの性質を直接見つける。
また、保存された励起数で制約されたボゾン系の1次自由度を除去するために使われるホルシュタイン・プリマコフ写像を詳しく述べる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:32:29 GMT)
Everyday Speech in the Indian Subcontinent [0.0] インドには1369の言語があり、22が公式である。これらの言語を表現するために約13の異なるスクリプトが使用されている。
共通ラベルセット(Common Label Set)は、多言語合成のためのEnd-to-Endフレームワークで必要とされる大きな語彙単位の問題に対処するために音声学に基づいて開発された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:00:16 GMT)
Estimating Vehicle Speed on Roadways Using RNNs and Transformers: A Video-based Approach [0.0] 本研究は,高度な機械学習モデル,特にLong Short-Term Memory(LSTM),Gated Recurrent Units(GRU),Transformersの,ビデオデータを用いた車両速度推定タスクへの適用について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:51:49 GMT)
Enhancing RWKV-based Language Models for Long-Sequence Text Generation [0.0] テキスト生成における長距離依存をよりよく捉えるために,適応的なトークンシフトとゲーティング機構を提案する。
実験結果から,特にBLEUおよびROUGEスコアにおいて,改良モデルにより生成品質が著しく向上することが示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:18:18 GMT)
Dynamic User Competition and Miner Behavior in the Bitcoin Market [0.0] 我々はビットコイン市場のダイナミックモデルを開発し、ユーザーは手数料を自分で設定し、採掘者はその手数料に基づいて誰が運用するか、誰が検証するかを決定する。
分析の結果,短期的混雑に対応するため,利用者の入札を均衡的に調整する方法が明らかとなった。
ブロック報酬(ブロック生産時に鉱山労働者に支払われる固定報酬)がこれらの非効率性を軽減できることを示す。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:02:02 GMT)
Dissecting Human Body Representations in Deep Networks Trained for Person Identification [0.0] 我々は、4,788のアイデンティティと9つのデータベースにわたる190万の画像でトレーニングされた4つのボディ識別ネットワークから、ボディイメージの埋め込みを分析する。
顔は身体識別アルゴリズムの精度に寄与し、これらのアルゴリズムは顔の特定をある程度行うことができる。
我々は,学習した埋め込み空間上で直接的かつ選択的に操作することで,追加の訓練を伴わずに識別精度を向上できることを実証した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:03:05 GMT)
Deep Reinforcement Learning for Advanced Longitudinal Control and Collision Avoidance in High-Risk Driving Scenarios [0.0] 本研究では, 縦方向制御と衝突回避のための深部強化学習に基づく新しいアルゴリズムを提案する。
シミュレーションされた高リスクシナリオにおけるその実装は、従来のシステムが通常失敗する密集した交通で緊急ブレーキを伴い、衝突の可能性のある衝突を防ぐアルゴリズム能力を実証している。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 19:43:27 GMT)
Data-Constrained Synthesis of Training Data for De-Identification [0.0] 臨床領域に適応する大言語モデル(LLM)について検討した。
我々は,個人識別可能な情報にタグを付加した人工的な臨床テキストを生成する。
合成コーパスは合成NERモデルの訓練に使用される。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 16:58:44 GMT)
Critical Unstable Qubits: an Application to $B^0\bar{B}^0$-Meson System [0.0] 我々は、最近特定した不安定な量子ビットのクラスに関するこれまでの研究を拡張し、これらをクリティカル不安定量子(CUQ)と呼ぶ。
CUQ の特徴は、エネルギーレベルと減衰幅のベクトル $bf E$ と $bf Gamma$ が互いに有意であり、キーパラメータ $r = |bf Gamma|/|2bf E|$ が 1 未満であることである。
我々は、CUの非正弦波振動の度合いを定量化する非調和性観測値を定義する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 17:53:38 GMT)
Construction and Evaluation of LLM-based agents for Semi-Autonomous penetration testing [0.0] 高性能大規模言語モデル (LLM) は様々な領域にまたがって進歩している。
サイバーセキュリティのような高度な専門分野において、完全な自律性は依然として課題である。
本稿では,複数のLLMモジュールを用いて,複雑なサイバーセキュリティを半自律的に実行するシステムを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:02:39 GMT)
Constructing Fermionic Hamiltonians with Non-Gaussianic low-energy states [0.0] 量子PCP予想は、量子複雑性理論において最も影響力のある開問題の一つである。
我々は、サンプル可能なフェルミオン状態のサブクラスであるガウス状態のエネルギーが定数で下界するフェルミオンハミルトニアンのクラスを構築する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:34:07 GMT)
Confidence-Weighted Boundary-Aware Learning for Semi-Supervised Semantic Segmentation [0.0] 半教師付きセマンティックセマンティックセグメンテーション(SSSS)は、ラベル付きデータと限定ラベル付きサンプルを併用することで、パフォーマンスを向上させることを目的としている。
既存のSSSSメソッドは、初期ラベル付きデータへの過度な依存が、最適以下の学習につながるような、カップリングのような課題に直面することが多い。
本稿では,SSSSの新しいフレームワークであるCW-BASSを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 02:24:10 GMT)
Commutator Estimates and Quantitative Local Weyl's Law for Schrödinger Operators with Non-Smooth Potentials [0.0] 我々は、クラス C1,1/2$ のポテンシャルを持つシュリンガー作用素を解析し、シャッテンノルムにおける関連する射影作用素の可換推定を確立する。
非相互作用粒子系と相互作用粒子系の両方を研究する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 20:08:55 GMT)
Coherent optical two-photon resonance tomographic imaging in three dimensions [0.0] 2光子ラマン転移によるスピン共鳴を探索する光学的手法を提案し,実証する。
本手法は, 複素3次元コヒーレンスプロファイルの再構成を可能にするため, 時間と空間を解決したヘテロダイン測定に頼っている。
この技術は、共鳴構造を持つ透明な媒体を探査することができ、原子ベースの量子情報プロトコルの堅牢な診断ツールを提供する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:50:25 GMT)
Clustering theorem in 1D long-range interacting systems at arbitrary temperatures [0.0] 本稿では, 1次元(1次元)系における熱相転移の欠如について, 量子統計力学の基本的側面を考察する。
任意の温度での幅広い相互作用崩壊に適用可能なクラスタリング定理の導出に成功した。
超ポリノミカル崩壊相互作用を持つ1次元系における相転移の欠如が示唆された。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 18:21:14 GMT)
Characterization of P-divisibility in two-level open quantum systems [0.0] 2レベル開量子系におけるP差の異なる性質について検討する。
文献に存在するいくつかのP差分特性の同値性は明らかに証明されている。
このような特徴付けの応用として、ボソニックモードと相互作用する量子ビットの開力学について検討する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 14:45:59 GMT)
BARTSIMP: flexible spatial covariate modeling and prediction using Bayesian additive regression trees [0.0] 本稿では,ガウス過程空間モデルとベイズ加法回帰木(BART)モデルの組み合わせについて検討する。
マルコフ連鎖モンテカルロとIntegrated Nested Laplace Approximation (INLA)技術を組み合わせることにより、アプローチの計算負担を低減させる。
次に、このモデルを用いてケニアの人文的反応を予測し、複雑なサンプリング設計を用いてデータを収集する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:12:49 GMT)
Assessing a Single Student's Concentration on Learning Platforms: A Machine Learning-Enhanced EEG-Based Framework [0.0] 本研究は、オンライン学習セッションにおいて、個々の学生の集中状態を分類するために設計された特殊なパイプラインを紹介する。
脳波信号は5つの電極を備えたミューズヘッドバンドを用いて学生から取得された。
コンピュータベースの学習環境では97.6%、仮想現実環境では98%の精度で、優れた分類性能を実現した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:02:28 GMT)
Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI [0.0] 神経線維腫1型は神経線維腫(NF)の発生を特徴とする遺伝疾患である
本研究では,WB-MRIにおけるNFセグメンテーションのための完全自動パイプラインを提示し,解析する。
実験の結果,Scan Dice similarity Coefficient (DSC) は68%, DSCは21%, F1スコアは2倍に改善した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 12:49:35 GMT)
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO [0.0] 大きな言語モデル(LLM)は、言語処理において印象的な能力を示してきたが、視覚的な空間的推論を必要とするタスクにしばしば苦労している。
迷路ナビゲーションのための視覚的推論能力を備えた標準LLMの2段階学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 10:27:10 GMT)
Adiabatic Gauge Potential as a Tool for Detecting Chaos in Classical Systems [0.0] 量子状態の変形をハミルトニアンの断熱変化下で記述する物体である断熱ゲージポテンシャル(AGP)について検討する。
軌道上のAGPの時間的分散は、一般的な可観測物の長時間の相関を探索する。
強いカオス状態と弱いカオス状態は,それぞれ正常な拡散と異常な拡散に対応することを示した。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 00:37:02 GMT)
Activation Steering in Neural Theorem Provers [0.0] 大規模言語モデル(LLM)は、Leanのような証明アシスタントを使って形式的な定理を証明することを約束している。
LLMは正しい戦術を予測できるが、候補戦術の範囲内で適切にランク付けする上での課題に直面している。
我々は、アクティベーションステアリングを用いてLSMの応答を誘導し、推論時の世代を改善する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 15:04:48 GMT)
Absence of censoring inequalities in random quantum circuits [0.0] 我々は、あるゲートが削除されたときに、およそ2ドルの設計深度が減少するようなアーキテクチャのファミリを構築する。
また、この構成に関する直観を述べるとともに、この結果が1Dブリックワークのおよそ$t$-designの深さとの関係について論じる。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 23:17:26 GMT)
A graph-based approach to entanglement entropy of quantum error correcting codes [0.0] 本研究では,Calderbank-Shor-Steane量子符号の絡み合いエントロピーをグラフベースで研究する手法を開発した。
トーリック符号のサブシステムのフォン・ノイマンエントロピーを計算し、量子的低密度パリティチェック符号の特殊な型について説明する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 13:05:40 GMT)
A closed quantum system giving ergodicity [0.0] 閉じた量子力学系は、必ずしもマイクロカノニカル分布に応じて時間平均を与えるとは限らない。
このような系に有限であるが非常に小さな摂動を適用することで、量子統計力学の結果が実際に回復できることが示されている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 21:21:57 GMT)
A Critical Assessment of Modern Generative Models' Ability to Replicate Artistic Styles [0.0] 本稿では,現代生成モデルのスタイル再現能力を批判的に評価する。
これらのモデルは,構造的整合性と構成的バランスを維持しつつ,従来の芸術様式をいかに効果的に再現するかを検討する。
この分析は、過去の芸術スタイルを模倣したAI生成作品の大規模なデータセットに基づいている。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 07:00:06 GMT)
A BERT Based Hybrid Recommendation System For Academic Collaboration [0.0] 大学は学術的なコラボレーションのハブとして機能し、学生や教員の間で様々なアイデアや視点の交換を促進する。
この課題に対処するため,大学内における同志の利害関係者を結びつけるために,学術別プロファイル推薦システムを提案する。
本研究では、TF-IDF(Term Frequency-Inverse Document Frequency)、BERT(Bidirectional Representations from Transformers)、および効果的なレコメンデーションを生成するためのハイブリッドアプローチの3つの手法を評価する。
論文参考訳(メタデータ) (Fri, 21 Feb 2025 05:35:08 GMT)