The BrowserGym Ecosystem for Web Agent Research [151.9] BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
大規模なマルチベンチマークWebエージェント実験を初めて実施する。
結果は、OpenAIとAnthropicの最新モデルの大きな相違点を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:28:46 GMT)
Attend and Enrich: Enhanced Visual Prompt for Zero-Shot Learning [114.6] 視覚表現豊か化のための意味強調プロンプトを抽出するための視覚的プロンプトに意味情報を付与するAENetを提案する。
AENetは、2つの重要なステップから構成される: 1) 視覚的・属性的モダリティの概念調和トークンを探索し、一貫した視覚的セマンティックな概念を表す様相共有トークンに基づく。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:37:06 GMT)
FiVA: Fine-grained Visual Attribute Dataset for Text-to-Image Diffusion Models [112.9] 現在の方法では、ソース画像からアイデンティティとスタイルを抽出しようとする。
スタイル」は、テクスチャ、色、芸術的要素を含む広い概念であるが、照明や動力学など他の重要な要素をカバーしていない。
画像の美学を特定の視覚属性に分解するより効果的なアプローチを定式化し、ユーザーは異なる画像から照明、テクスチャ、ダイナミックスなどの特徴を適用できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:02:58 GMT)
TACO: Learning Multi-modal Action Models with Synthetic Chains-of-Thought-and-Action [103.6] 複雑・多段階・多モードタスクの性能向上を目的とした多モード大規模アクションモデルであるTACOを提案する。
推論中、TACOはチェーン・オブ・シント・アンド・アクション(CoTA)を生成し、OCR、深さ推定、電卓などの外部ツールを呼び出すことで中間ステップを実行する。
このデータセットにより、TACOは複雑な推論とアクションパスを学習し、直接回答だけでチューニングデータに基づいてトレーニングされた既存のモデルを上回ることができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:33:12 GMT)
SimVS: Simulating World Inconsistencies for Robust View Synthesis [102.8] 本稿では、生成ビデオモデルを利用して、キャプチャ中に起こりうる世界の不整合をシミュレートする手法を提案する。
我々の世界シミュレーション戦略は、現実のシーンのバリエーションを扱う上で、従来の拡張手法よりも大幅に優れていることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:35:12 GMT)
Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision [99.0] 現在のAIアライメント手法は、人間が提供する実演や判断に依存している。
彼らの能力が人間のレベルを超えたとき、システムを改善するにはどうすればよいのか?
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:54:09 GMT)
Rethinking Score Distillation as a Bridge Between Image Distributions [97.3] 提案手法は, 劣化した画像(ソース)を自然画像分布(ターゲット)に転送することを目的としている。
本手法は,複数の領域にまたがって容易に適用可能であり,特殊な手法の性能のマッチングや評価を行うことができる。
テキストから2D、テキストベースのNeRF最適化、絵画を実画像に変換すること、光学錯視生成、および3Dスケッチから実画像に変換することにおいて、その実用性を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:55:39 GMT)
ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer [95.8] 連続的な視覚生成には、フルシーケンスの拡散に基づくアプローチが必要である。
本稿では,自己回帰的ブロックワイド条件拡散変換器ACDiTを提案する。
本稿では,拡散目標を訓練しながら,視覚理解タスクにACDiTをシームレスに使用できることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:13:20 GMT)
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models [95.1] 大規模言語モデル(LLM)はますます強力になってきていますが、それでも顕著ですが微妙な弱点があります。
従来のベンチマークアプローチでは、特定のモデルの欠陥を徹底的に特定することはできない。
さまざまなタスクにまたがるLLMの弱点を自動的に露呈する統合フレームワークであるAutoDetectを導入する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:57:46 GMT)
BiMediX: Bilingual Medical Mixture of Experts LLM [90.3] 英語とアラビア語の両方でシームレスに相互作用するように設計された、最初のバイリンガル医療混合物であるBiMediXを紹介する。
我々のモデルは、英語とアラビア語の幅広い医学的相互作用を促進し、さらに詳細を問い合わせるマルチターンチャットを含む。
そこで我々は,高品質な翻訳を保証するために,人間の洗練を図った英語からアラビア語への半自動翻訳パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:19:18 GMT)
QAPyramid: Fine-grained Evaluation of Content Selection for Text Summarization [86.9] 本稿ではQAPyramidを提案する。QA-SRLフレームワークにより,各参照要約をよりきめ細かな問合せ対に分解する。
この結果から,QAPyramidはより体系的かつきめ細かなコンテンツ選択評価を提供すると同時に,専門家のアノテーションを必要とせず,アノテータ間の高合意を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:29:51 GMT)
STIV: Scalable Text and Image Conditioned Video Generation [84.3] 本稿では,STIVという,シンプルでスケーラブルなテキスト画像条件付きビデオ生成手法を提案する。
本フレームワークは,テキストコンディショニングを取り入れつつ,フレーム交換による拡散変換器(DiT)に画像条件を統合する。
STIVは、ビデオ予測、フレーム、マルチビュー生成、長いビデオ生成など、様々なアプリケーションに容易に拡張できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:27:06 GMT)
3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation [84.0] 制御可能なビデオ生成における従来の方法は、主に物体の動きを操作するために2D制御信号を利用する。
本稿では3次元空間におけるマルチエンタリティダイナミクスを制御する頑健なコントローラである3DTrajMasterを紹介する。
3DTrajMasterは,多心性3D動作を制御するための精度と一般化の両面において,新しい最先端技術を設定する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:55:13 GMT)
Video Motion Transfer with Diffusion Transformers [82.5] 本稿では,参照ビデオの動作を新たに合成したものに転送する方法であるDiTFlowを提案する。
まず、トレーニング済みのDiTを用いて参照ビデオを処理し、クロスフレームアテンションマップを分析し、パッチワイズ動作信号を抽出する。
我々は、位置埋め込みを変換し、ゼロショットモーション転送能力を向上する戦略を適用した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:58 GMT)
On Evaluating the Durability of Safeguards for Open-Weight LLMs [80.4] 我々は,大規模言語モデル(LLM)の誤用を技術的保護が阻害するか否かを論じる。
これらの防御を評価することさえ非常に困難であり、観客を誤解させることなく、安全は実際のものよりも耐久性が高いと考えることが示される。
今後の研究は、より制約があり、明確に定義され、厳密に検討された脅威モデルに注意深く対応することを提案します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:30:32 GMT)
Robustness of longitudinal transmon readout to ionization [79.2] 多光子プロセスは、回路QEDにおける分散読み出しの量子非破壊特性を劣化させる。
長手読み出しなどの代替手法が提案されている。
高速かつ高忠実なトランモン量子ビットのQND読み出しが可能であり, 長手結合が可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:32:30 GMT)
Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.7] 異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。
これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。
しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:31:26 GMT)
Nonparametric Classification on Low Dimensional Manifolds using Overparameterized Convolutional Residual Networks [78.1] 非パラメトリック分類の観点から重量減衰を訓練したConvResNeXtsの性能について検討した。
我々の分析は、ConvResNeXtsにおいて無限に多くのビルディングブロックを許容し、重み減衰がこれらのブロックに空間性を暗黙的に強制することを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:15:04 GMT)
SAT: Spatial Aptitude Training for Multimodal Language Models [77.5] 本研究では,空間知能を向上させるためにSAT,空間適性トレーニングを導入する。
SATには、トレーニングとテストセット全体で22Kの合成シーンのための218Kの質問応答ペアが含まれている。
SAT命令チューニングデータは,SAT上での動的空間推論だけでなく,既存の実画像空間ベンチマーク上でのゼロショット性能も向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:52:45 GMT)
Backdoor Attacks against No-Reference Image Quality Assessment Models via A Scalable Trigger [76.4] No-Reference Image Quality Assessment (NR-IQA) はコンピュータビジョンシステムの評価と最適化において重要な役割を果たしている。
近年の研究では、NR-IQAモデルが敵攻撃の影響を受けやすいことが示されている。
NR-IQA(BAIQA)に対する新規中毒性バックドアアタックを報告した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:07:19 GMT)
SpaFL: Communication-Efficient Federated Learning with Sparse Models and Low computational Overhead [75.9] SpaFL: 計算オーバーヘッドの少ないスパースモデル構造を最適化する通信効率のよいFLフレームワークを提案する。
プルーニングプロセス自体を最適化するためには、パラメータの代わりにサーバとクライアントの間でしきい値だけが通信される。
グローバルしきい値は、集約されたパラメータの重要度を抽出することで、モデルパラメータの更新に使用される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:43:05 GMT)
NewMove: Customizing text-to-video models with novel motions [74.9] 動作をカスタマイズしたテキスト・ビデオ・ジェネレーション・モデルを構築するためのアプローチを提案する。
入力として特定の動きを示すビデオサンプルを活用することで,入力動作パターンを多種多様なテキスト特定シナリオに対して学習し,一般化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:00:16 GMT)
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics [74.1] UniRealは、様々な画像生成および編集タスクに対処するために設計された統一されたフレームワークである。
近年の映像生成モデルに着想を得て,画像レベルのタスクを不連続な映像生成として扱う統一的手法を提案する。
画像レベルのタスク用に設計されているが、ユニバーサルな監視のためのスケーラブルなソースとしてビデオを活用している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:55 GMT)
SQL Injection Jailbreak: a structural disaster of large language models [71.6] 本稿では, LLMの外部特性, 特に入力プロンプトの作り方に着目した新しいjailbreak手法を提案する。
SIJ法は,AdvBench上の5つの有名なオープンLLMに対する攻撃成功率を100%近く達成すると同時に,従来の方法と比較して時間コストの低減を実現している。
そこで本研究では,SIJ に対する対策として SelfReminderKey という簡単な防御手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:14:50 GMT)
From an Image to a Scene: Learning to Imagine the World from a Million 360 Videos [71.2] オブジェクトやシーンの3次元理解は、人間が世界と対話する能力において重要な役割を果たす。
大規模合成およびオブジェクト中心の3Dデータセットは、オブジェクトの3D理解を持つモデルのトレーニングに有効であることが示されている。
我々は360-1M、360度ビデオデータセット、およびスケールの多様な視点から対応するフレームを効率的に見つけるプロセスを紹介した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:44 GMT)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.3] 分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:31:17 GMT)
The Multiple-Access Channel with Entangled Transmitters [67.9] 絡み合うリソースを持つ古典的マルチアクセスチャネル(MAC)上での通信について考察する。
我々は、絡み合った送信機を持つ一般MACの容量領域の内外界を確立する。
超深度符号化を用いることで、絡み合いは会議レートを2倍にすることができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:37:58 GMT)
RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.5] 化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。
RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。
分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:29:32 GMT)
Non-Parametric Learning of Stochastic Differential Equations with Non-asymptotic Fast Rates of Convergence [65.6] 非線形微分方程式のドリフトと拡散係数の同定のための新しい非パラメトリック学習パラダイムを提案する。
鍵となる考え方は、基本的には、対応するフォッカー・プランク方程式のRKHSに基づく近似をそのような観測に適合させることである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:36:23 GMT)
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets [65.4] Nabla-GFlowNetは、報酬勾配のリッチ信号を利用する最初のGFlowNet手法である。
提案手法は,安定拡散の高速かつ多様かつ事前保存的なアライメントを実現する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:58 GMT)
3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning [65.4] エンボディエージェントのための新しい3Dシーンメモリフレームワークである3D-Memを提案する。
3D-Memは、シーンを表現するために、Memory Snapshotsと呼ばれる情報的なマルチビューイメージを使用している。
さらに、Frontier Snapshots-glimpsの未探索領域対応エージェントを導入して、情報的な意思決定を行うことによって、フロンティアベースの探索をさらに統合する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:40:36 GMT)
Proc-GS: Procedural Building Generation for City Assembly with 3D Gaussians [65.1] 資産の創出は労働集約的であり、設計ルールを開発するには専門的なスキルが必要である。
作成のための最近の生成モデルは、しばしばこれらのパターンを見落とし、視覚的忠実度が低く、スケーラビリティが制限される。
手続き的なコードを操作することで、このプロセスを合理化し、無限に多様な建物を生成することができます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:45:32 GMT)
Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data [64.7] オフラインRLを微調整するために適切に設計されたオンラインRLアプローチを使用する限り、オフラインデータの保持は不要であることを示す。
Warm-start RL(WSRL)はオフラインデータを保持することなく微調整が可能であり,既存のアルゴリズムよりも高速に学習でき,高い性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:57:12 GMT)
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving [63.9] 大規模マルチモーダルモデル(LMM)は、自律運転(AD)における例外的理解と解釈能力を示した
本稿では,多種多様なデータ入力を処理するための汎用大規模マルチモーダルモデルであるDriveMMを提案する。
我々は、6つの公開ベンチマークで評価を行い、未確認のデータセットでゼロショット転送を行い、DriveMMはすべてのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:27:32 GMT)
WaterSeeker: Pioneering Efficient Detection of Watermarked Segments in Large Documents [63.6] WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:18:41 GMT)
ProcessBench: Identifying Process Errors in Mathematical Reasoning [62.8] 本稿では,数学的推論における誤ったステップを識別する能力を測定するためのProcessBenchを紹介する。
ProcessBenchは3400のテストケースで構成され、主に競合とオリンピアードレベルの数学問題に焦点を当てている。
我々はProcessBenchについて、プロセス報酬モデル(PRM)と批判モデルという2種類のモデルを含む広範囲な評価を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:10:32 GMT)
Corrupted Learning Dynamics in Games [62.7] ゲームでの学習は、複数のプレイヤーが共有環境で相互作用する問題である。
すべてのプレイヤーが非regretアルゴリズムを使用するとき、近似平衡が得られることが知られている。
本稿では,各プレイヤーの偏差度に依存する速度で適応的に平衡を求める学習力学について述べる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:23:44 GMT)
ObjCtrl-2.5D: Training-free Object Control with Camera Poses [61.2] 本研究の目的は、画像間(I2V)生成において、より正確で多目的なオブジェクト制御を実現することである。
深度情報を持つ2次元軌道から拡張した3次元軌道を用いた学習不要物体制御手法であるCtrl-2.5Dを制御信号として提案する。
実験により、Ctrl-2.5Dはトレーニング不要の手法と比較して、オブジェクト制御の精度を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:14:30 GMT)
RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models [60.6] 集約モデルは、ビジョンファウンデーションモデルをトレーニングするための強力なアプローチとして現れています。
我々は、解像度モードシフト、教師の不均衡、慣用的教師アーティファクト、過剰な出力トークンなど、重要な課題を識別する。
本稿では,マルチレゾリューショントレーニング,モザイク強化,教師の損失関数のバランスの改善など,いくつかの新しいソリューションを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:06:41 GMT)
REBEL: Reinforcement Learning via Regressing Relative Rewards [59.7] 生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:17:30 GMT)
The Rise and Down of Babel Tower: Investigating the Evolution Process of Multilingual Code Large Language Model [59.4] 本研究では,大規模言語モデル(LLM)における事前学習過程における多言語機能の進化について検討する。
本稿では,LLMが新たな言語能力を習得する過程全体を記述したBabel Tower仮説を提案する。
本論文では,多言語コードLLMのための事前学習コーパスを最適化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:28:57 GMT)
Motion Artifact Removal in Pixel-Frequency Domain via Alternate Masks and Diffusion Model [58.7] MRI(MRI)における運動アーチファクトは臨床診断に深刻な干渉を与える可能性がある。
ノイズの多いMRI画像の画素周波数情報を利用する新しい教師なし浄化法を提案する。
提案手法は,いくつかの指標において優れた性能を示し,臨床評価の精度を向上する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:25:18 GMT)
AFD: Mitigating Feature Gap for Adversarial Robustness by Feature Disentanglement [56.9] 逆方向の微調整法は、逆方向の訓練方法で事前訓練されたモデルを微調整することにより、逆方向の強靭性を高める。
本稿では,特定の潜伏する特徴を明示的にモデル化し,除去するためのアンタングルメントに基づくアプローチを提案する。
提案手法は,既存の対戦型微調整法や対戦型トレーニングベースラインを超越した手法である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:28:07 GMT)
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing [56.8] 大規模言語モデルの自己改善のためのAlphaLLMを紹介する。
モンテカルロ木探索(MCTS)とLLMを統合し、自己改善ループを確立する。
実験の結果,AlphaLLM は付加アノテーションを使わずに LLM の性能を大幅に向上することがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:19:29 GMT)
Protocol Learning, Decentralized Frontier Risk and the No-Off Problem [56.7] 私たちは第3のパラダイムであるプロトコル学習(Protocol Learning)を特定します。
このアプローチは、単一の集中型エンティティよりも桁違いに多くの計算資源を集約する可能性がある。
また、不均一で信頼性の低いノード、悪意のある参加者、インセンティブを維持するために抽出不可能なモデルの必要性、複雑なガバナンスのダイナミクスなど、新しい課題も導入されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:53:50 GMT)
DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.5] UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:47:15 GMT)
Parallel simulation for sampling under isoperimetry and score-based diffusion models [56.4] データサイズが大きくなるにつれて、イテレーションコストの削減が重要な目標になります。
科学計算における初期値問題の並列シミュレーションの成功に触発されて,タスクをサンプリングするための並列Picard法を提案する。
本研究は,動力学に基づくサンプリング・拡散モデルの科学的計算におけるシミュレーション手法の潜在的利点を強調した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:50:46 GMT)
Diffusion-Based Attention Warping for Consistent 3D Scene Editing [55.2] 拡散モデルを用いた3次元シーン編集のための新しい手法を提案する。
提案手法は,単一の参照画像から抽出した注目機能を利用して,意図した編集を定義する。
これらの歪んだ特徴を他の視点に注入することで、編集のコヒーレントな伝播を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:57:18 GMT)
Analysis of Unstructured High-Density Crowded Scenes for Crowd Monitoring [55.2] 我々は,人群集の組織的動きを検出する自動システムの開発に興味がある。
コンピュータビジョンアルゴリズムは、混雑したシーンのビデオから情報を抽出することができる。
組織化されたコホート内の参加者数を見積もることができます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:05:37 GMT)
LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [55.0] Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:40:54 GMT)
PETALface: Parameter Efficient Transfer Learning for Low-resolution Face Recognition [54.6] PETALfaceは、PEFTのパワーを低解像度の顔認識に活用した最初の作品である。
バックボーンに2つの低ランク適応モジュールを導入し、入力画像の品質に基づいて重みを調整し、ギャラリーとプローブ画像の品質の違いを考慮に入れた。
実験により,提案手法は高分解能・混合品質データセットの性能を保ちながら,低分解能データセットの完全な微調整よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:45 GMT)
Look Before You Leap: Enhancing Attention and Vigilance Regarding Harmful Content with GuidelineLLM [53.8] 大規模言語モデル(LLM)は、出現するジェイルブレイク攻撃に対してますます脆弱である。
この脆弱性は現実世界のアプリケーションに重大なリスクをもたらす。
本稿では,ガイドラインLLMという新しい防御パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:42:33 GMT)
Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.5] 本研究では,大規模言語モデル (LLM) を用いて予測モデルの事前分布を推定する手法を提案する。
その結果,LLMによる事前パラメータ分布は,低データ設定における非形式的先行よりも予測誤差を著しく低減することがわかった。
事前の推論も一貫して優れており、低コストでテキスト内学習よりも信頼性が高いことが証明されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:36:48 GMT)
Toon3D: Seeing Cartoons from New Perspectives [52.9] 漫画やアニメのイメージから、同じシーンを描いている3D構造を復元する。
私たちのキーとなる洞察は、カメラのポーズとシーンの幾何学を回復しながら入力画像を変形させることです。
我々の回収した点雲は、今まで描いたことのない視点から漫画を体験する新しい視点合成法に接続することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:23:09 GMT)
From Slow Bidirectional to Fast Causal Video Generators [52.3] 現在のビデオ拡散モデルは、印象的な生成品質を実現するが、双方向の注意依存のため、インタラクティブなアプリケーションに苦戦する。
この制限は、予め訓練された双方向拡散変換器を、フレームをオンザフライで生成する因果変換器に適応させることによって解決する。
我々のモデルは、KVキャッシュのおかげで、単一のGPU上で9.4 FPSで高速な高品質ビデオのストリーミング生成をサポートする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:50 GMT)
Track4Gen: Teaching Video Diffusion Models to Track Points Improves Video Generation [51.7] Track4Genは、ビデオ拡散損失とフレーム間のポイントトラッキングを組み合わせた空間的に認識されたビデオジェネレータである。
Track4Genは、安定したビデオ拡散をバックボーンとして使用し、ビデオ生成とポイントトラッキングを統合することが可能であることを実証している。
評価の結果,Track4Genは外見のドリフトを効果的に低減し,時間的安定性と視覚的コヒーレントな映像生成を実現することがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:24:02 GMT)
ReCap: Better Gaussian Relighting with Cross-Environment Captures [51.3] 本研究では,マルチタスクターゲットとして環境横断キャプチャを取り扱うReCapについて述べる。
具体的には、ReCapは共通の属性のセットを共有する複数の照明表現を共同で最適化する。
これにより、相互の材料属性を囲むコヒーレントな照明表現の集合が自然に調和し、様々な物体の外観の共通点と相違点を利用する。
合理化シェーディング機能と効果的な後処理機能とともに、ReCapはPSNRのリードコンペティターを3.4dBで上回っている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:15:32 GMT)
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.1] 視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:52:39 GMT)
SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.9] COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:40:35 GMT)
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy [50.8] CC-OCRは、マルチシーンテキスト読取、多言語テキスト読取、文書解析、キー情報抽出の4つのOCR中心のトラックで構成されている。
39のサブセットと7,058のフルアノテートされたイメージが含まれており、そのうち41%が実際のアプリケーションからソースされ、初めてリリースされた。
我々は9つの顕著なLMMを評価し、これらのモデルの長所と短所、特にテキストの接地、多目的化、繰り返しの幻覚について明らかにした。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:01:33 GMT)
Mixture of Hidden-Dimensions Transformer [50.4] 隠れ次元の空間性について検討し、訓練されたトランスフォーマーがわずかなトークン次元しか利用していないことを観察する。
スパース条件付アクティベーションアーキテクチャであるMoHD(Mixture of Hidden Dimensions)を提案する。
50%のアクティベーションパラメータが減少し、3.7%のハイパフォーマンスを実現し、3倍のパラメータを一定のアクティベーションコストで拡張する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:13:59 GMT)
Graph Neural Networks Are More Than Filters: Revisiting and Benchmarking from A Spectral Perspective [49.6] グラフニューラルネットワーク(GNN)は、様々なグラフベースの学習タスクにおいて顕著な成功を収めている。
近年の研究では、非線形層などの他のコンポーネントが、GNNがスペクトル領域の入力グラフデータをどのように処理するかに大きく影響する可能性が示唆されている。
本稿では、入力グラフデータの異なる周波数成分に符号化された情報を捕捉し、活用する際のGNNの能力を評価するための総合的なベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:53:53 GMT)
Exploring Knowledge Tracing in Tutor-Student Dialogues using LLMs [49.2] 本研究では,大規模言語モデル(LLM)が対話学習を支援することができるかどうかを検討する。
我々は,学習者の知識レベルを対話全体にわたって追跡するために,ラベル付きデータに知識追跡(KT)手法を適用した。
我々は,2つの学習対話データセットの実験を行い,従来のKT手法よりも学生の反応の正しさを予測できる新しいLCM-based method LLMKTが優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:04:59 GMT)
Game-Theoretic Joint Incentive and Cut Layer Selection Mechanism in Split Federated Learning [49.2] スプリット・フェデレーション・ラーニング(SFL)は、フェデレーションとスプリット・ラーニングの利点を組み合わせることで、有望なアプローチとして登場した。
階層的意思決定手法を用いて,単一リーダマルチフォロワStackelbergゲームとして定式化された問題をモデル化する。
以上の結果から,Stackelberg平衡解はクライアントとSFLモデル所有者の両方の実用性を最大化することがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:24:08 GMT)
Normalizing Flows are Capable Generative Models [48.3] TarFlowはシンプルでスケーラブルなアーキテクチャで、高性能なNFモデルを実現する。
エンドツーエンドのトレーニングは簡単で、ピクセルを直接モデリングして生成することができる。
TarFlowは、画像の確率推定に新たな最先端結果を設定し、以前のベストメソッドを大きなマージンで上回る。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:19:52 GMT)
Enhanced MRI Representation via Cross-series Masking [48.1] 自己教師型でMRI表現を効果的に学習するためのクロスシリーズ・マスキング(CSM)戦略
メソッドは、パブリックデータセットと社内データセットの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:32:09 GMT)
HybridGS: Decoupling Transients and Statics with 2D and 3D Gaussian Splatting [47.7] 画像ごとの過渡的対象に対して2次元ガウスアンを用いて,ハイブリッドGSと呼ばれる新しいハイブリッド表現を提案する。
また、ロバストなトレーニングと高品質なビュー合成を実現するために、単純かつ効果的なマルチステージトレーニング戦略を提案する。
ベンチマークデータセットを用いた実験は、室内および屋外の両方のシーンにおいて、新しいビュー合成の最先端性能を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:59:24 GMT)
Composing or Not Composing? Towards Distributional Construction Grammars [47.6] 言語発話の意味を構築することは、構成過程に基づいて段階的に、段階的に行われる。
したがって、両方のアプローチをまとめるフレームワークを提案する必要がある。
本稿では, 構築文法に基づく手法を提案し, この枠組みを完成させ, それらのメカニズムを考察する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:17:02 GMT)
Multi-Shot Character Consistency for Text-to-Video Generation [47.6] 本稿では,事前訓練されたテキスト・ツー・ビデオ・モデルを用いて,一貫したキャラクタによる複数ショットの生成を可能にするトレーニング不要なビデオストーリーボードを提案する。
私たちのキーとなる洞察は、自己注意クエリ機能(Q)が動きとアイデンティティの両方をエンコードしていることです。
我々は、アイデンティティ保存と自然運動保持のバランスをとる新しいクエリインジェクション戦略を導入する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:49:39 GMT)
When UAV Meets Federated Learning: Latency Minimization via Joint Trajectory Design and Resource Allocation [47.2] フェデレートラーニング(FL)は、無線ネットワーク上で機械学習モデルをトレーニングするための重要なソリューションとして登場した。
本研究では,無人航空機(UAV)を移動FLサーバとして展開し,FLの訓練プロセスを強化する,革新的なアプローチを提案する。
全体としてのトレーニング効率を改善するために,帯域割り当て,演算周波数,UAVとIoTデバイスの両方の送信電力,UAVの軌道を最適化して遅延問題を定式化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:39:27 GMT)
EDGE: Unknown-aware Multi-label Learning by Energy Distribution Gap Expansion [47.0] Multi-label Out-Of-Distribution (OOD) 検出は,OOD サンプルを Multi-label In-Distribution (ID) サンプルから識別することを目的としている。
JointEnergyは、代表的なマルチラベルOOD推論基準である。
本研究では,不確実なエネルギー空間レイアウトを再構成する未知のマルチラベル学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:27:58 GMT)
Parseval Regularization for Continual Reinforcement Learning [46.9] 可塑性の喪失、トレーニング可能性の喪失、プライマリーバイアスは、タスクのシーケンスでディープニューラルネットワークをトレーニングする際に生じる問題として特定されている。
本稿では、Parseval正規化を用いて、有用な最適化特性を保ち、継続的な強化学習環境でのトレーニングを改善することを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:19:21 GMT)
Learning Spatially Decoupled Color Representations for Facial Image Colorization [46.9] FCNetと呼ばれる新しい顔画像カラー化フレームワークを提案する。
各顔成分(唇、皮膚、目、髪など)の分離色表現は、顔解析図の指導の下で学習する。
FCNetは、単一または複数の参照画像による顔画像の着色に自然に適用することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:48:17 GMT)
Bigger is not Always Better: Scaling Properties of Latent Diffusion Models [46.5] 遅延拡散モデル (LDM) のスケーリング特性について, サンプリング効率に着目して検討した。
モデルサイズがサンプリング効率にどのように影響するかを,様々なサンプリングステップで詳細に調査する。
予測予算の下で運用する場合、より小さなモデルは、高品質な結果を生み出す上で、より大きな等価性を上回ることがよくあります。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:10:41 GMT)
ITPNet: Towards Instantaneous Trajectory Prediction for Autonomous Driving [46.2] エージェントの軌道予測は自動運転車の安全性に不可欠である。
従来のアプローチは通常、エージェントの将来の軌道を予測するのに十分な長期の軌道に依存する。
ITPNetと呼ばれる汎用かつプラグアンドプレイの即時軌道予測手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:09:41 GMT)
AdaSociety: An Adaptive Environment with Social Structures for Multi-Agent Decision-Making [45.2] AdaSocietyは、拡張状態とアクション空間を特徴とするカスタマイズ可能なマルチエージェント環境である。
エージェントが進むにつれて、エージェントが実行する社会的構造を持つ新しいタスクを適応的に生成する。
AdaSocietyは、さまざまな物理的および社会的環境におけるインテリジェンスを探索するための、貴重な研究プラットフォームとして機能する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:41:12 GMT)
Accommodating Fabrication Defects on Floquet Codes with Minimal Hardware Requirements [45.0] フロケット符号は、ハードウェアの接続要件を減らし、優れたフォールトトレラント特性を提供する。
これは、現実的なハードウェア上でこのようなコードを実行する上で重要な、未調査の課題である。
広帯域な2次元フロケ符号に欠陥量子ビットを収容する新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:16:29 GMT)
Moderating the Generalization of Score-based Generative Model [44.7] 我々は,第1次モデレートスコアベース生成モデル(MSGM)を提案する。
MSGMは、連続時間微分方程式過程において、望ましくないデータからスコア関数をリダイレクトする。
大規模な実験結果から,MSGMは望ましくないコンテンツを生成する可能性を著しく低下させることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:41:18 GMT)
Bayesian inverse Navier-Stokes problems: joint flow field reconstruction and parameter learning [44.6] ベイズ逆ナヴィエ・ストークス(N-S)問題を定式化して解く。
境界位置を含む未知のN-Sパラメータを学習する。
次に,この手法を用いて3次元定常層流の磁気共鳴速度測定データを再構成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:33:51 GMT)
Learning Visual Generative Priors without Text [44.6] I2I(Image-to-image)の生成について検討した。
我々のI2Iモデルは、より基礎的な視覚的先行として機能し、既存のT2Iモデルよりも同等または優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:31 GMT)
StyleMaster: Stylize Your Video with Artistic Generation and Translation [43.8] スタイルコントロールはビデオ生成モデルで人気がある。
現在の方法は、しばしば所定のスタイルから遠く離れたビデオを生成し、コンテンツのリークを引き起こし、1つのビデオを所望のスタイルに転送するのに苦労する。
当社のアプローチであるStyleMasterは,スタイルの類似性と時間的コヒーレンスの両方において,大幅な改善を実現しています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:44:08 GMT)
Which LLMs are Difficult to Detect? A Detailed Analysis of Potential Factors Contributing to Difficulties in LLM Text Detection [43.7] 我々は、不均衡なデータセットで分類器を訓練するためにLibAUCライブラリを使用してAIGテキスト分類器を訓練する。
We results in the Deepfake Text dataset shows that AIG-text detection are various across domain。
学生エッセイに焦点をあてたIvy Pandaデータセットでは, LLMのOpenAIファミリは, 分類者が人文と区別することが極めて困難であった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:44:59 GMT)
Deep Non-rigid Structure-from-Motion Revisited: Canonicalization and Sequence Modeling [43.6] Non-Rigid Structure-from-Motionは古典的な3D視覚問題であり、2Dシーケンスを入力として、対応する3Dシーケンスを推定する。
本稿では,2つの視点から深度NRSfMを再検討し,現在の深度NRSfM法の限界に対処する。
本稿では,従来のデータセットごとの正準化手法とは対照的に,シーケンス毎の正準化を容易に実装できる手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:42:01 GMT)
A Generative Victim Model for Segmentation [43.4] 良く訓練された犠牲者モデル(VM)が、敵攻撃の基本的な前提条件であることがわかった。
画像セグメンテーション用に明示的に設計されたモデルを必要とせずに、セグメンテーションタスクの逆摂動を生成することを目的とした、セグメンテーションのための新しいVMを導出する。
従来のホワイトボックス攻撃やブラックボックス攻撃から敵攻撃発生へのアプローチが多様化し,敵攻撃戦略の新たな展望を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:02:27 GMT)
SOMONITOR: Combining Explainable AI & Large Language Models for Marketing Analytics [43.3] 我々は、人間の直感とAIベースの効率を相乗化することを目的とした説明可能なAIフレームワークを導入する。
SoMONITORは広告コンテンツにCTR予測とランキングモデルを導入し、大きな言語モデル(LLM)を使用して高いパフォーマンスの競合コンテンツを処理する。
日々の操作でSOMONITORを採用することで、デジタルマーケターは広範なデータセットを素早く解析し、実用的な洞察を提供することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:17:50 GMT)
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints [43.1] マルチカメラビデオ生成のための事前訓練されたテキスト・ツー・ビデオモデルを強化するプラグイン・アンド・プレイ・モジュールを提案する。
異なる視点における外観と幾何の整合性を維持するために,マルチビュー同期モジュールを導入する。
提案手法は,新しい視点からビデオを再レンダリングするなど,興味をそそる拡張を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:55:17 GMT)
SpecFuse: Ensembling Large Language Models via Next-Segment Prediction [42.3] SpecFuseは、LCM間のコラボレーションを通じて次のセグメントを反復的に生成することで、融合結果を出力するアンサンブルフレームワークである。
上位のセグメントは全LLMに放送され、次のラウンドで高品質なセグメントを生成するように促される。
計算資源を保存するため,前回のラウンドで性能が劣るモデルを動的に排除するモデル出口機構を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:27:41 GMT)
Multi-Scale Contrastive Learning for Video Temporal Grounding [42.2] 自然言語クエリに関連する映像モーメントをローカライズする時間的グラウンドリングは、視覚言語学習とビデオ理解の中核的な問題である。
本稿ではビデオモーメント間の有能な意味を捉えるための対照的な学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:34:56 GMT)
CADSpotting: Robust Panoptic Symbol Spotting on Large-Scale CAD Drawings [42.1] 本稿では,大規模なCAD図面におけるパノプティカルシンボルスポッティングの効率的な方法であるCADSpottingを紹介する。
CADSpottingは、統合された3Dポイントクラウドモデルに基づいて、ジョイントセマンティクス、例えば、パノプティックセグメンテーションを構築し、ロバストな特徴表現を学ぶ。
実験を支援するため,LS-CADという大規模CADデータセットを導入した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:22:17 GMT)
Numerical evidence for the non-Abelian eigenstate thermalization hypothesis [41.9] 固有状態熱化仮説(ETH)は、量子多体系が内部でどのように熱化するかを説明する。
非アベリア ETH が自己整合性を示すことを解析的に証明する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:01 GMT)
CPsyExam: A Chinese Benchmark for Evaluating Psychology using Examinations [41.7] CPsyExamは心理学的知識とケース分析を別々に優先するよう設計されている。
22kの質問のプールから4kを使ってベンチマークを作成します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:44:41 GMT)
Motion-aware Contrastive Learning for Temporal Panoptic Scene Graph Generation [41.0] 本研究では,時間的シーングラフ生成のための動きパターンに着目したコントラスト表現学習フレームワークを提案する。
我々の枠組みは,類似の主題関係オブジェクト三重項のマスクチューブの近接表現をモデルに学習させることを奨励する。
また、同じビデオに属するマスクチューブの遠隔表現も学習します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:41:07 GMT)
Zero-Shot ATC Coding with Large Language Models for Clinical Assessments [40.7] 解剖学的治療化学符号を処方記録に手動で割り当てることは重大なボトルネックである。
ローカル展開可能な大規模言語モデル(LLM)を用いた実践的アプローチを開発する。
GPT-4oを精度天井とし,プライバシに敏感なデプロイメントに適したオープンソースのLlamaモデルの開発に注力する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:43:02 GMT)
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance [40.7] 既存の分類器を用いて拡散モデルを操り、画像のパーソナライズのためのトレーニングフリー手法を利用する。
本研究は,近年の補正フローの枠組みに基づいて,バニラ分類器指導の限界を簡単な固定点解法で解決できることを示唆する。
本発明の方法は、市販画像識別装置の異なる正流に実装され、人間の顔、生きた被写体、特定の対象物に対して有利なパーソナライズ結果を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:51:50 GMT)
IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation [40.3] Implicit Face Motion Diffusion Model (IF-MDM) は、人間の顔を顔にエンコードする暗黙の動作を用いて、顔の表情を圧縮した顔にエンコードする。
IF-MDMは、毎秒45フレーム(fps)の512x512解像度ビデオのリアルタイム生成をサポートする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:43:08 GMT)
S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity [39.7] LLMのための構造化スパースファインチューニング(S$2$FT)手法のファミリーを提案する。
S$2$FTは、"スパースと密度の高い計算を選択"することでこれを達成します。
S$2$FTはトレーニングメモリを最大3$times$まで節約し、フルFTと比較して1.5-2.7$times$のレイテンシを改善することを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:43:32 GMT)
Modern Middlewares for Automated Vehicles: A Tutorial [39.6] 本稿では,自動走行車における電流に関するチュートリアルを提供する。
我々の目的は、読者に電流の概要を提供し、この分野におけるオープンな課題を特定することである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:52:52 GMT)
ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet [39.6] 画像合成は、オリジナルおよび現実的な画像を作成することができるインテリジェントモデルの設計を通じて、制限に対処することを目的としている。
本稿では,新しい安定拡散モデル制御ネットに基づくContRailフレームワークを提案する。
我々は,鉄道固有の課題における性能を改善するために,合成鉄道画像生成の課題を実験した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:23:18 GMT)
PTSBench: A Comprehensive Post-Training Sparsity Benchmark Towards Algorithms and Models [39.6] PTSBenchは、アルゴリズムとモデルに対する最初の総合的なトレーニング後のスパーシリティベンチマークである。
我々は、40以上のオフザシェルフモデルアーキテクチャを用いて、典型的な3つのタスクに対して10以上のPTSの汎用プラガブルな細かなテクニックをベンチマークする。
PTSBench は,(1) PTS アルゴリズムをよりよく理解するための新たな観測,(2) モデルのスパーシフィケーション能力に関する詳細な,包括的な評価,(3) 十分に構造化された,容易に統合されたオープンソースフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:49:07 GMT)
A High Energy-Efficiency Multi-core Neuromorphic Architecture for Deep SNN Training [39.5] 直接SNNトレーニングを支援するマルチコアニューロモルフィックアーキテクチャを開発した。
SNN訓練におけるA100 GPUと比較して,DRAMアクセスを5585%削減した1.05TFLOPS/W@FP16 @28nmの高エネルギー効率が得られる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:02:43 GMT)
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models [38.8] ディープ圧縮オートエンコーダ (DC-AE) は高分解能拡散モデルの高速化を目的とした新しいオートエンコーダモデルである。
遅延拡散モデルへの直流-AEの適用により,精度低下のない大幅な高速化を実現した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:39:23 GMT)
Intelligent System for Automated Molecular Patent Infringement Assessment [38.5] PatentFinderは、新しく設計された分子が既存の特許を侵害するかどうかを評価する新しいツール強化フレームワークである。
サブタスクの分解に適したモデルベースのツールとモデルベースのツールが組み込まれている。
PatentFinderは、大規模な言語モデルのみに依存するベースラインアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:14:38 GMT)
PVP: Polar Representation Boost for 3D Semantic Occupancy Prediction [38.4] 極座標で動作する新しい3次元マルチモーダル予測器であるPolar Voxel Occupancy Predictor (PVP)を紹介する。
グローバル空間データを3Dボリュームに統合するGlobal Represent Propagationモジュールと、3D歪みを2D畳み込みに単純化するPlane Devolution Concomposed (PD-Conv)である。
これらのイノベーションにより、PVPは既存のメソッドよりも優れており、OpenOccupancyデータセット上のmIoUとIoUメトリクスの大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:54:53 GMT)
WSI-LLaVA: A Multimodal Large Language Model for Whole Slide Image [38.0] ギガピクセルのWSI理解のためのフレームワークであるWSI-LLaVAを3段階のトレーニングアプローチで紹介する。
実験の結果、WSI-LLaVAはすべての能力範囲で既存のモデルより優れています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:00:17 GMT)
Thinking Fast and Laterally: Multi-Agentic Approach for Reasoning about Uncertain Emerging Events [37.8] 本稿では,AIシステムにシステム2推論機能を実装するための側方的思考を紹介する。
本稿では,側方的思考クエリと評価データセットを体系的に生成・モデル化するためのフレームワークを提案する。
本稿では,ストリーミングデータ環境における複雑な低特異性クエリを処理するために設計されたマルチエージェントフレームワークであるStreaming Agentic Lateral Thinking (SALT)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:29:11 GMT)
Towards Foundation-model-based Multiagent System to Accelerate AI for Social Impact [37.7] 既存のAI4SI研究は、しばしば労働集約的かつリソース要求的である。
本稿では,このようなベースレベルのシステムの開発を加速するために,メタレベルのマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:29:34 GMT)
Test-time Correction with Human Feedback: An Online 3D Detection System via Visual Prompting [37.3] TTC(Test-time Correction)システムは、人間のフィードバックによるテストタイムエラーのオンライン修正のために指定された、新しいオンライン3D検出システムである。
フレーム上で対話的なプロンプトでユーザフィードバックを活用することで、TTCは、将来のストリーミング入力に対する対応する検出結果を即座に更新できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:32 GMT)
GPT-2 Through the Lens of Vector Symbolic Architectures [36.7] 本稿では,デコーダのみのトランスアーキテクチャとベクトル記号アーキテクチャ(VSA)の類似性について検討する。
これらの原理は、実際の神経重みのかなりの部分を説明するのに役立ちます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:20:36 GMT)
Towards Graph Foundation Models: A Study on the Generalization of Positional and Structural Encodings [36.6] 位置的および構造的符号化(PSE)がグラフニューラルネットワーク(GNN)に統合された
本稿では,様々なグラフデータセット間での学習可能なPSEの微調整効率,サンプルサイズによるスケーラビリティ,一般化,能力について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:58:47 GMT)
Bayesian Optimization of Antibodies Informed by a Generative Model of Evolving Sequences [36.6] 効果的な治療法を構築するために、生物学者は、抗体配列を反復的に変異させて、結合と安定性を改善する。
提案された突然変異は、以前の測定や、大きな抗体データベースから学習することで、典型的な抗体のみを予測することができる。
実験室における抗体を効率よく最適化するベイズ最適化法であるクローンインフォームドベイズ最適化(CloneBO)を導入する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:57:48 GMT)
DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning [36.5] DIPPER: 原始許容階層型強化学習の高速化のための直接選好最適化について紹介する。
直接選好最適化を利用する効率的な階層的アプローチであり、より高度な政策を学ぶために、そして低レベルの政策を学ぶために強化学習を行う。
標準的な嗜好に基づくアプローチではなく、直接選好最適化を使用することで、計算効率の向上を享受している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:03:10 GMT)
BiMediX2: Bio-Medical EXpert LMM for Diverse Medical Modalities [36.3] BiMediX2はバイリンガル(アラビア語-英語)バイオメディカル・エクスペルト・大型マルチモーダル・モデル(LMM)である。
テキストと視覚機能を統合して、英語とアラビア語の両方でのシームレスな対話を容易にし、テキストベースの入力と医療画像を含むマルチターン会話をサポートする。
BiMediX2はテキストベースとイメージベースの両方のタスクでベンチマークされており、いくつかのベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:35 GMT)
XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications [36.3] XRZooには12,528の無料XRアプリケーションがあり、9つのアプリストア、すべてのXR技術(AR、MR、VRなど)、ユースケースにまたがっている。
我々は,再現可能なXRソフトウェア工学とセキュリティ研究を育成し,学際的な調査を可能にするとともに,先進的なXRシステムの開発を支援することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:54:11 GMT)
LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models [36.2] LoRA3Dは3次元幾何学的基礎モデルのための効率的な自己校正パイプラインである。
我々は、ロバストな最適化手法を利用して、多視点予測を洗練し、それらをグローバルな座標フレームに整列させる。
本手法は,$textbfsingle標準GPU上での自己校正処理を5分以内で完了する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:45:04 GMT)
StoryWeaver: A Unified World Model for Knowledge-Enhanced Story Character Customization [36.1] 本稿では,様々なストーリー関連知識を包括的に表現した新しい知識グラフ,すなわちキャラクタグラフ(textbfCG)を提案する。
次に、リッチテキストセマンティクスと一貫したストーリー視覚化が可能な、キャラクタグラフ(textbfC-CG)によるカスタマイズを実現するイメージジェネレータであるStoryWeaverを紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:16:50 GMT)
RAP-SR: RestorAtion Prior Enhancement in Diffusion Models for Realistic Image Super-Resolution [36.1] 本稿では,Real-SRの事前学習拡散モデルにおける事前拡張手法であるRAP-SRを紹介する。
まず,QDAISP(Quality-Driven Aesthetic Image Selection Pipeline)を用いたHFAID(High-Fidelity Aesthetic Image dataset)を開発した。
第2に、復元優先分担(RPR)と再生指向分担最適化(ROPO)モジュールを含む再生優先分担フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:17:38 GMT)
Color-Oriented Redundancy Reduction in Dataset Distillation [35.8] 本稿では,個々の画像とデータセットの全体レベルでの色冗長性を最小化するフレームワークを提案する。
画像レベルでは、縮小色空間から各ピクセルに動的に色を割り当てるために、専用ニューラルネットワークであるパレットネットワークを用いる。
既存のDD法と比較して,提案した色認識DDの優れた性能を示す総合的な性能評価を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:35:15 GMT)
Dynamic Ensemble Reasoning for LLM Experts [35.8] 本研究では,動的入力を前提とした複数のLLMエキスパートの強みを統合するために,DERと呼ばれる動的アンサンブル推論パラダイムを提案する。
提案手法では,最先端のベースラインに比べて計算資源が少ないため,性能が向上する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:05:56 GMT)
HiFiVFS: High Fidelity Video Face Swapping [35.5] Face swappingは、ソースからのIDとターゲットからの属性を組み合わせた結果を生成することを目的としている。
安定ビデオ拡散の強い生成能力と時間的先行を生かした高忠実度ビデオ顔交換フレームワークを提案する。
本手法は,映像面スワップにおける最新技術(SOTA)を質的かつ定量的に達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:13:57 GMT)
Hero-SR: One-Step Diffusion for Super-Resolution with Human Perception Priors [35.2] Hero-SRは1ステップの拡散に基づくSRフレームワークで、人間の知覚に先立って明示的に設計されている。
Hero-SRは、人間の知覚基準を柔軟に満たすための最適な拡散ステップを適応的に選択するDynamic Time-Step Module (DTSM)と、CLIPを通じて画像ドメインとテキストドメインからのガイダンスを統合するOpen-World Multi-modality Supervision (OWMS)の2つの新しいモジュールで構成されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:22:04 GMT)
Doob's Lagrangian: A Sample-Efficient Variational Approach to Transition Path Sampling [34.9] 与えられた始点と所望の終点の間の軌跡に対する最適化問題として,Doobのh-変換の変分定式化を提案する。
提案手法は,軌道上の探索空間を大幅に削減し,高価な軌道シミュレーションを回避する。
実世界の分子シミュレーションとタンパク質折り畳みタスクにおいて,本手法が実現可能な遷移経路を見つける能力を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:57:00 GMT)
SST framework for Document Matching [34.8] 長文文書マッチングは、2つの文書間の関係を判断することを目的としている。
代表的マッチング信号のモデル化のための新しいフレームワークを提案する。
我々の学習フレームワークは,ニュース重複や判例検索など,いくつかの文書マッチング作業に有効である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:06:48 GMT)
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation [34.4] そこで我々は,PortraitTalkという,ワンショット音声駆動音声生成フレームワークを新たに導入した。
提案手法は,IdentityNetとAnimateNetの2つの主要コンポーネントからなる遅延拡散フレームワークを利用する。
PortraitTalkの鍵となる革新は、疎結合のクロスアテンション機構を通じてテキストプロンプトを組み込むことである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:51:31 GMT)
Fast mixed-species quantum logic gates for trapped-ion quantum networks [34.3] 本稿では, トラップイオン量子コンピュータにおける高速混在動作に対するアプローチを提案する。
我々は、混合同位体と混合種のイオン対の間にMHz速ゲートを実現するパルス列の理論と機械設計を開発する。
混合種高速ゲート機構により,物質-光子界面の高速スピン脱落に対するイオン-光子絡みの保護が可能であることを実証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:47:53 GMT)
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations [34.1] CHARMは、中国語で大規模言語モデル(LLM)の常識推論能力を評価するための、網羅的で詳細なベンチマークである。
我々はCHARMで7つの英語と12の中国語のLLMを評価した。
一部のLLMは中国の常識を覚えることに苦労し、推論能力に影響を及ぼす一方、同様のパフォーマンスにもかかわらず推論の違いを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:43:50 GMT)
Towards a Better Model with Dual Transformer for Drug Response Prediction [33.4] 薬物応答予測(TransEDRP)のためのエッジを埋め込んだデュアルトランスフォーマー構造を提案する。
薬物分枝では, 分子グラフのエッジの埋め込みとして分子内の化学結合情報を符号化し, グラフトランスフォーマーを用いて分子のグローバルな構造と生化学的情報を抽出した。
細胞株ゲノム学の分野では,多頭部アテンション機構を用いてゲノム配列をグローバルに表現する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:42:54 GMT)
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming [33.4] DocKylinは文書中心のMLLMで、ピクセルレベルとトークンレベルの両方でビジュアルコンテンツをスリム化する。
本稿では,ピクセルレベルのスリム化を行うためのAPSプリプロセッシングモジュールを提案する。
また,トークンレベルスライミングを行う新しい動的トークンスライミング(DTS)モジュールを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:24:09 GMT)
Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence [33.4] 数ショットのアクション認識では、ビデオの長いサブシーケンスは、アクション全体をより効果的に表現する。
最近のMambaは、長いシーケンスをモデリングする効率を示すが、MambaをFSARに直接適用することは、局所的な特徴モデリングとアライメントの重要性を見落としている。
Mantaは、SSv2、Kineetics、UCF101、HMDB51などの著名なベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:03:42 GMT)
CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation Information [33.0] CFSPと呼ばれる効率的な構造化プルーニングフレームワークを提案する。
まず、その重要度に基づいて各ブロックに分散予算を割り当て、その後、各ブロックに重要な重みを保持する。
その結果,CFSP は様々な予算にまたがる様々なモデルにおいて,既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:55:21 GMT)
MARec: Metadata Alignment for cold-start Recommendation [32.9] 本稿では,コンテンツメタデータを活用することで,コールドスタートレコメンデーションに対処する簡単な手法を提案する。
提案手法は,既存の行列分解とオートエンコーダのアプローチを容易に拡張できることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:40:49 GMT)
Stereo Hand-Object Reconstruction for Human-to-Robot Handover [32.7] 本研究では,手動物体再構成のためのステレオ手法を提案する。
我々は大規模な手オブジェクトデータセットから3次元形状を学習する。
提案手法は,既存のRGBを用いた手動物体再構成法と比較して,より低対象のチャンファー距離を実現する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:12:32 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:24:37 GMT)
Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation [32.3] 本研究では、異なる人間のポーズや形状に関連したタスクやデータセットをシームレスに統一するパラダイムを提案する。
我々の定式化は、人間の容積の任意の点を問合せし、推定位置を3Dで取得することに集中している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:47:33 GMT)
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation [32.2] textbfDiffSenseiは動的マルチ文字制御でマンガを生成するために特別に設計されたフレームワークである。
DiffSenseiは、拡散ベースのイメージジェネレータと、テキスト互換のIDアダプタとして機能するマルチモーダル大言語モデル(MLLM)を統合している。
提案手法では,文字特徴をシームレスに組み込むためにマスク付きクロスアテンションを用いることで,直接ピクセル転送を行うことなく正確なレイアウト制御が可能となる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:24:12 GMT)
AFFSegNet: Adaptive Feature Fusion Segmentation Network for Microtumors and Multi-Organ Segmentation [32.0] 医用画像のセグメンテーションは、コンピュータビジョンにおいて重要な課題であり、診断、治療計画、疾患モニタリングにおける臨床医を支援する。
本稿では,局所的特徴とグローバルな特徴を効果的に統合し,正確な医用画像分割を実現するトランスフォーマアーキテクチャである適応意味ネットワーク(ASSNet)を提案する。
多臓器、肝腫瘍、膀胱腫瘍の分節を含む様々な医療画像の分節タスクに関するテストは、ATSNetが最先端の結果を達成することを実証している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:16:12 GMT)
Demystifying Workload Imbalances in Large Transformer Model Training over Variable-length Sequences [31.2] 我々は並列戦略とデータ割り当てを協調的に最適化するHydraulisを開発する。
実験の結果、Hydraulis は既存のシステムよりも 1.32-2.66 倍高い性能を示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:01:53 GMT)
Optimization Can Learn Johnson Lindenstrauss Embeddings [30.7] Johnson-Lindenstrauss (JL) のようなランダム化法は、そのような表現を達成するための不可能な理論的保証を提供する。
本稿では,この基本課題を回避する拡散モデルに基づく新しい手法を提案する。
この大きな空間を移動することによって、目的が決定論的(ゼロ分散)な解に収束し、悪い定常点を避けることが示される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:07:04 GMT)
BrokerChain: A Blockchain Sharding Protocol by Exploiting Broker Accounts [30.6] アカウントベースの状態シャーディング専用のクロスシャーディングプロトコルであるBrokerChainを提案する。
BrokerChainはトランザクションスループット、トランザクション確認レイテンシ、トランザクションプールのキューサイズ、ワークロードのバランスという点で、他のベースラインよりも優れています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:41:59 GMT)
GASP: Gaussian Avatars with Synthetic Priors [30.4] GASP:Gaussian Avatars with Synthetic Priorsを提案する。
我々は合成データのピクセル完全性を利用してガウスアバターを事前に訓練する。
私たちの事前は、推論ではなく、リアルタイムアプリケーションを可能にするためにのみ必要です。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:36:21 GMT)
Hypergrah-Enhanced Dual Convolutional Network for Bundle Recommendation [29.7] 我々は、ハイパーグラフ強化デュアル畳み込みニューラルネットワーク(HED)と呼ばれるバンドルレコメンデーションのための統一モデルを開発する。
まず、ユーザ、アイテム、バンドル間のインタラクションのダイナミクスを捉えるための完全なハイパーグラフを構築し、続いてU-Bインタラクション情報を組み込んで、ユーザから派生した情報表現を強化し、組込みベクトルをバンドルする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:20:21 GMT)
A 2x2 quantum dot array in silicon with fully tuneable pairwise interdot coupling [29.5] 本報告では, 隣接するすべての点間の相互結合が可変な2次元シリコン金属酸化物半導体(MOS)量子ドットについて述べる。
この装置は4.2Kで特徴付けられ、二重ドットと三重ドットの構成の形成と分離を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:50:45 GMT)
Towards an Understanding of Large Language Models in Software Engineering Tasks [29.3] 大規模言語モデル(LLM)は、テキスト生成や推論タスクにおける驚くべきパフォーマンスのために、広く注目を集め、研究している。
コード生成などのソフトウェア工学タスクにおけるLLMの評価と最適化が研究の焦点となっている。
本稿では,LLMとソフトウェア工学を組み合わせた研究・製品について包括的に検討・検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:35:21 GMT)
[MASK] is All You Need [28.9] 離散状態モデルを用いてMasked Generative と Non-autoregressive Diffusion を接続する。
離散状態モデルで[MASK]を活用することで、Masked Generative と Non-autoregressive Diffusion モデルを橋渡しできる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:09:22 GMT)
Fine-grained graph representation learning for heterogeneous mobile networks with attentive fusion and contrastive learning [28.9] モバイルネットワークの分野に知識グラフの概念を導入し、無線データ知識グラフ(WDKG)を創出する。
WDKGの洗練と更新を自動化することを目的とした、教師なしデータ・モデル駆動型グラフ構造学習(DMGSL)フレームワークを提案する。
確立されたWDKG実験は、DMGSLがベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:12:51 GMT)
Open-Source Acceleration of Stable-Diffusion.cpp [28.8] 安定拡散(stable-diffusion) Turbo (Sd) は拡散モデルを加速する効率的な推論フレームワークとして現れる。
本研究では、Winogradアルゴリズムを利用して2次元畳み込み処理を高速化するSdの最適化版を提案する。
我々は、個々の畳み込み層に対して最大2.76倍のスピードアップと、全体の画像生成プロセスにおいて最大4.79倍の速度アップを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:06:54 GMT)
MemHunter: Automated and Verifiable Memorization Detection at Dataset-scale in LLMs [28.6] 大規模言語モデル(LLM)は、トレーニングデータからコンテンツを記憶し、再現することが示されている。
既存の記憶検出方法は、手作業または個別に最適化されたメモリ誘導プロンプトに依存して、主にサンプル固有である。
textitMemHunterを導入し、メモリ誘導LDMをトレーニングし、仮説テストを用いてデータセットレベルで記憶を効率的に検出する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:42:46 GMT)
The Pitfalls of Memorization: When Memorization Hurts Generalization [28.6] 記憶はトレーニングの損失をゼロに減らし、堅牢で一般化可能なパターンを学ぶインセンティブを残さない。
本稿では,保留予測を記憶の信号として用いて,モデルのロジットをシフトする記憶学習(MAT)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:18:33 GMT)
CAP: Evaluation of Persuasive and Creative Image Generation [28.5] 本稿では,生成した広告画像の創造性,適応性,説得性を評価するための3つの評価指標を提案する。
その結果,入力テキストが暗黙的メッセージである場合,現在のテキスト・ツー・イメージモデルは創造性,説得性,アライメントに苦慮していることがわかった。
我々は、より整合性があり、より創造的で、より説得力のある画像を生成する上で、T2Iモデルの能力を高めるためのシンプルで効果的なアプローチを導入します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:54:59 GMT)
Breaking the Stage Barrier: A Novel Single-Stage Approach to Long Context Extension for Large Language Models [28.3] 大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。
現在、ロングコンテキストモデリングに対する解決策は、しばしば多段階連続体を用いる。
本稿では,新しい単段連続事前学習手法であるヘッドアダプティブロータリー位置について紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:09:29 GMT)
Fault-Tolerant Operation and Materials Science with Neutral Atom Logical Qubits [27.6] 中性原子量子コンピュータ上での論理量子ビットのフォールトトレラント動作について報告する。
我々の研究は、フォールトトレラント量子計算の実用的なスキームに向けたビルディングブロックと見なすことができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:59:55 GMT)
FireFlow: Fast Inversion of Rectified Flow for Image Semantic Editing [27.6] FireFlowは、シンプルなが効果的なゼロショットアプローチであり、ReFlowベースのモデルのスターリング能力を継承する。
まず、ReFlowインバージョンにおいて、慎重に設計された数値解法が重要であることを示す。
このソルバは、最先端のReFlowインバージョンや編集技術と比較して、ランタイムのスピードアップを3ドル(約3,300円)で達成します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:56:26 GMT)
BENet: A Cross-domain Robust Network for Detecting Face Forgeries via Bias Expansion and Latent-space Attention [27.4] BENetは、様々な種類の偽顔生成技術における変動に関連する電流検出器の制限に対処することで、偽顔の検出を強化する。
我々は、新しいバイアス拡大損失でネットワークをエンドツーエンドにトレーニングし、初めて偽造検出に直面する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:41:55 GMT)
Learnable Sparse Customization in Heterogeneous Edge Computing [27.2] 異種フェデレート学習(FedLPS)のための学習可能なパーソナライズ・スパシフィケーションを提案する。
FedLPSは、局所データ表現におけるモデルユニットの重要性を学び、パーソナライズされたデータ特徴を正確に抽出するために、最小限の重要度に基づくスパースパターンを導出する。
実験により、FedLPSは精度とトレーニングコストにおいてステータスクオアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:14:31 GMT)
Sortformer: Seamless Integration of Speaker Diarization and ASR by Bridging Timestamps and Tokens [27.1] 本稿では,話者ダイアリゼーションのためのニューラルモデルであるSortformerを提案する。
我々は、従来のエンドツーエンドのダイアリゼーションモデルと比較して、従来とは異なる目的でSoltformerを訓練する。
コードとトレーニングされたモデルはNVIDIA NeMoフレームワークを介して公開される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:23:11 GMT)
Stable-Hair: Real-World Hair Transfer via Diffusion Model [26.9] 現在のヘアトランスファー手法は、多様で複雑なヘアスタイルを扱うのに苦労し、現実のシナリオにおける適用性を制限している。
そこで本研究では,現実世界のヘアスタイルを仮想ヘアトライオンのためにユーザが提供する顔に堅牢に転送する,新しい拡散型ヘアトランスファーフレームワークであるtextitStable-Hairを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:04:50 GMT)
Addressing Key Challenges of Adversarial Attacks and Defenses in the Tabular Domain: A Methodological Framework for Coherence and Consistency [26.6] 本稿では,表領域における敵攻撃に適した新たな評価基準を提案する。
また,サンプル内のコヒーレンスと特徴整合性を維持しつつ,依存する特徴を摂動する新しい手法を導入する。
この発見は、表領域における様々な敵攻撃の強さ、限界、トレードオフに関する貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:17:09 GMT)
Manipulating topological charges via engineering zeros of wave functions [26.6] トポロジカル電荷は典型的には量子系におけるエネルギーバンドの管理によって操作される。
そこで本研究では, 局所波励振の工学密度ゼロを用いて, 系のトポロジ的電荷を操作する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:39:32 GMT)
QuantFormer: Learning to Quantize for Neural Activity Forecasting in Mouse Visual Cortex [26.5] QuantFormerは、2光子カルシウムイメージングデータから神経活動を予測するために特別に設計されたトランスフォーマーベースのモデルである。
QuantFormerは、マウス視覚野の活動を予測する新しいベンチマークを設定している。
様々な刺激や個人に対して、堅牢なパフォーマンスと一般化を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:44:35 GMT)
MoE-CAP: Cost-Accuracy-Performance Benchmarking for Mixture-of-Experts Systems [26.5] MoEシステムは異種計算とメモリ資源に依存している。
これらの要因は、システムのコスト、正確性、パフォーマンス(CAP)に総括的に影響を及ぼす。
我々は,MoEシステム評価に特化して設計されたベンチマークであるMoE-CAPを紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:19:28 GMT)
Leveraging Content and Context Cues for Low-Light Image Enhancement [26.0] 低照度条件はマシン認知に悪影響を及ぼし、現実のコンピュータビジョンシステムの性能を制限する。
本稿では、CLIPモデルを利用して、画像の先行と意味的ガイダンスの取得により、既存のゼロ参照低照度化を改善することを提案する。
提案手法は,画像のコントラストと色調の改善,背景背景の識別の改善に有効であることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:32:09 GMT)
Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding [25.6] Video-XLはMLLM固有のキー値スカラー化能力を活用して視覚入力を凝縮する新しい手法である。
ビデオXLの有効性は3つの側面から検証される。第一に、より優れた長ビデオ理解能力を実現し、同等の大きさの最先端モデルよりも優れる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:45:31 GMT)
Model-Driven Deep Neural Network for Enhanced AoA Estimation Using 5G gNB [25.6] 現在の無線ネットワークは、位置決め機能を実現するためにモデル駆動アプローチに依存している。
人工知能を位置決めフレームワークに統合することは、位置情報ベースのサービスの正確性と堅牢性に革命をもたらす、有望なソリューションを提供する。
本稿では,モデル駆動型深層ニューラルネットワーク(MoD-DNN)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:16:48 GMT)
Personalized and Sequential Text-to-Image Generation [24.8] 我々は、大規模なオープンソース(非シーケンシャル)データセットとともに、シーケンシャルな選好の新たなデータセットを作成します。
EM戦略を用いてユーザ嗜好モデルとユーザ選択モデルを構築し,様々なユーザ嗜好タイプを同定する。
次に、大きなマルチモーダル言語モデル(LMM)と価値に基づくRLアプローチを活用し、ユーザに対してパーソナライズされ多様な拡張のスレートを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:47:40 GMT)
ConfigX: Modular Configuration for Evolutionary Algorithms via Multitask Reinforcement Learning [24.7] 本稿では,多様なEAを促進する汎用構成エージェント(モデル)を学習可能な,MetaBBOフレームワークの新しいパラダイムであるConfigXを紹介する。
我々のConfigXは、大規模な事前学習の後、目に見えないタスクに対して堅牢なゼロショットの一般化を実現し、最先端のベースラインを上回っます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:43:51 GMT)
From Biased to Unbiased Dynamics: An Infinitesimal Generator Approach [24.6] 時間反転不変過程における進化作用素の固有関数の学習について検討する。
ランゲヴィン方程式によって説明される多くの物理的または化学的過程は、高いポテンシャル障壁によって分離された準安定状態間の遷移を含む。
本稿では,プロセスの無限小生成と関連する分解剤演算子に根ざした偏りのあるシミュレーションから学習するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:45:36 GMT)
Monte Carlo Tree Search based Space Transfer for Black-box Optimization [24.2] モンテカルロ木探索(MCTS)に基づく探索空間移動学習法を提案する。
MCTS-transferは,異なる条件下での検索空間転送手法と比較して,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:52:26 GMT)
LLM-AS-AN-INTERVIEWER: Beyond Static Testing Through Dynamic LLM Evaluation [24.1] 大規模言語モデル(LLM)のための新しい評価パラダイムを提案する。
このアプローチは、LLMの真の能力を評価するために設計された2段階のプロセスから構成される。
我々のフレームワークはデータ汚染、冗長性バイアス、自己拡張バイアスなど、いくつかの制限に対処している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:00:32 GMT)
Asymmetric Contrastive Multimodal Learning for Advancing Chemical Understanding [23.9] 分子に適した新しいアプローチとして,非対称コントラスト型マルチモーダルラーニング(ACML)を導入する。
ACMLは効果的な非対称コントラスト学習の力を利用して、様々な化学修飾物から分子グラフ表現への情報をシームレスに伝達する。
このフレームワークの有効性を,大規模な相互モダリティ検索と異性判別タスクによって実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:03:28 GMT)
PAFFA: Premeditated Actions For Fast Agents [23.4] PAFFAは、再利用可能な、検証済みのブラウザインタラクション関数のAction API Libraryを通じて、Webインタラクション機能を強化するように設計されたフレームワークである。
Webサイト構造が進化しても、堅牢なパフォーマンスを維持しながら、推論コールを87%削減する。
このフレームワークはマルチページタスクの実行を加速し、自律的なWebエージェントの研究を進めるためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:51:31 GMT)
CrossSDF: 3D Reconstruction of Thin Structures From Cross-Sections [23.4] CrossSDFは平面輪郭から発生する2次元符号付き距離から3次元符号付き距離場を抽出する新しい手法である。
提案手法は, 従来の手法よりも大幅に改善され, 薄型構造を効果的に再構築し, 正確な3次元モデルを生成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:39:19 GMT)
Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs [23.4] 近年の研究では、検索-拡張生成フレームワークと知識グラフを組み合わせることで、大規模言語モデルの推論能力を強力に向上することが示されている。
我々は多目的帯域拡張RAGフレームワークを導入し、多様な機能を持つ複数の検索手法をサポートする。
本手法は,定常環境下での最先端性能を達成しつつ,非定常環境でのベースライン手法を著しく向上させる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:56:03 GMT)
Driving with InternVL: Oustanding Champion in the Track on Driving with Language of the Autonomous Grand Challenge at CVPR 2024 [23.2] 本報告では,CVPR 2024autonomous Grand Challenge(CVPR 2024 Autonomous Grand Challenge)の走行言語トラックに採用した手法について述べる。
我々は、強力なオープンソースマルチモーダルモデルであるInternVL-1.5を使用し、競合データセットであるDriveLM-nuScenesをフルに微調整した。
私たちのシングルモデルは最終リードボードで0.6002を獲得しました。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:13:39 GMT)
RAG-based Question Answering over Heterogeneous Data and Text [23.1] 本稿では,非構造化テキスト,構造化テーブル,知識グラフに対する質問応答システムについて述べる。
システムはRAGベースのアーキテクチャを採用し、証拠検索のパイプラインと応答生成、そして後者は中程度の言語モデルによって駆動される。
3つの異なるベンチマークによる実験は、我々のアプローチの高い応答品質を示し、大きなGPTモデルと同等かそれ以上である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:18:29 GMT)
Scalable Autoregressive Image Generation with Mamba [23.0] 本稿では,マンバアーキテクチャに基づく自己回帰(AR)画像生成モデルであるAiMを紹介する。
Mamba(マンバ)は、線形時間による長周期モデリングに特有な性能を特徴とする、新しい状態空間モデルである。
パラメータ数は128Mから1.3Bまで様々である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:09:17 GMT)
CMT: A Memory Compression Method for Continual Knowledge Learning of Large Language Models [22.9] 大規模言語モデル(LLM)は、データ、タスク、ユーザの好みの継続的な変更に適応する必要がある。
本稿では,これらの課題に対処するため,圧縮記憶訓練(CMT)法を提案する。
CMTは、メモリバンクに格納される新しい文書から情報を圧縮して抽出する。
これらの新しいドキュメントに関する問い合わせに答えると、モデルはこれらのドキュメントの記憶をメモリバンクから集約し、ユーザーの質問に答える。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:35:19 GMT)
Deep Lidar-guided Image Deblurring [22.9] 本稿では,移動体Lidarセンサによって提供される深度情報が画像の劣化に有効かどうかを考察する。
奥行き情報を効率よく前処理し、画像特徴を奥行き特徴で変調するユニバーサルアダプタ構造を開発する。
我々は,真の深度情報を利用することで,デブロアリングアルゴリズムの有効性を著しく向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:42:46 GMT)
Modeling Dual-Exposure Quad-Bayer Patterns for Joint Denoising and Deblurring [22.8] 単一イメージのソリューションは、ノイズ低減と動きのぼかしの間に固有のトレードオフに直面している。
本稿では,新しい2重露光型Qad-Bayerパターンセンサを利用した物理モデルに基づく画像復元手法を提案する。
QRNetと呼ばれる階層型畳み込みニューラルネットワークを設計し、高品質なRGB画像を復元する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:35:26 GMT)
Access Point Deployment for Localizing Accuracy and User Rate in Cell-Free Systems [22.5] 次世代モバイルネットワークは、ユビキタスなカバレッジとネットワークセンシングを提供するように設計されている。
細胞フリーは、この展望を実現するための有望な技術である。
本稿では,セルフリーシステムにおけるポイント(AP)配置の問題に取り組むことを目的とする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:22:32 GMT)
Reinforcement Learning Policy as Macro Regulator Rather than Macro Placer [22.5] 強化学習は 配置品質向上の 有望な手法として現れました
現在のRLベースの配置法では、長時間のトレーニング時間、一般化能力の低下、PPA結果の保証が困難である。
本稿では,RLを改良段階に利用し,既存の配置レイアウトの調整方法を学習する手法を提案する。
我々は,ISPD 2005 と ICCAD 2015 ベンチマークを用いて,提案手法の広帯域半周波線長と正則性を比較した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:01:21 GMT)
OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations [22.3] 我々はOmniDocBenchを紹介した。OmniDocBenchは自動文書コンテンツ抽出のための新しいベンチマークである。
私たちのベンチマークには、厳密にキュレートされ、注釈付けされた高品質な評価データセットが含まれています。
既存のモジュール・パイプラインとマルチモーダル・エンド・ツー・エンド・メソッドの徹底的な比較分析を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:05:56 GMT)
CoMA: Compositional Human Motion Generation with Multi-modal Agents [22.2] CoMAは複雑な人間の動きの生成、編集、理解のためのエージェントベースのソリューションである。
我々のフレームワークは、細かな指示、テキスト誘導モーション編集、自己補正による短い動きシーケンスと長い動きシーケンスの生成を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:08:41 GMT)
Robust analog quantum simulators by quantum error-detecting codes [22.0] 誤差耐性ハミルトンシミュレーションのレシピを提供し、局所的な2ドルの通勤ハミルトニアンだけで安定化された励起符号化部分空間を利用する。
私たちの方法は、システムサイズにスケールするペナルティ条件のみを必要とするため、スケーラブルです。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:58:05 GMT)
Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation [22.0] 本稿では,各レイヤの特徴マップにおけるドロップアウトによって引き起こされる情報損失を定量化することにより,推論中のドロップアウト率を動的に調整するアルゴリズムであるRate-Inを提案する。
特徴マップにおける機能的情報損失を定量化することにより、様々な医用画像タスクや建築構成の知覚品質を維持するために、ドロップアウト率を適応的に調整する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:03:46 GMT)
From Voice to Value: Leveraging AI to Enhance Spoken Online Reviews on the Go [21.8] 音声入力によるレビューを提供するモバイルアプリケーションであるVocalizerを開発した。
調査の結果,AIエージェントを頻繁に利用し,レビューに詳細な情報を加えることができた。
また、インタラクティブなAI機能によって、ユーザーの自己効力感やレビューをオンラインで共有する意欲が向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:31:29 GMT)
From Lived Experience to Insight: Unpacking the Psychological Risks of Using AI Conversational Agents [21.7] 我々の研究は、個人の生きた経験を通して収集されたAIを使用することの心理的リスクに焦点を当てた、新しいリスク分類を提示する。
我々の分類学は、19のAI行動、21のネガティブな心理的影響、および個人に関連する15の文脈を特徴としている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:31:29 GMT)
Hierarchical Split Federated Learning: Convergence Analysis and System Optimization [21.6] 我々は,多層システム下での分割フェデレーション学習(SFL)の学習性能を解析し,最適化する。
モデル分割(MS)とモデル集約(MA)の合同最適化問題を定式化する。
シミュレーションの結果,任意のマルチ層システムにおいて,SFLのMSとMAを効果的に最適化できることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:20:49 GMT)
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods [21.6] 「LLMs-as-judges」は自然言語応答に基づく評価器である。
本稿では,5つの重要な視点から'LLMs-as-judges'パラダイムを包括的に調査する。
我々は,研究と実践の両方において,'LLMs-as-judges'の開発と適用に関する洞察を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:49:12 GMT)
HARP: Hesitation-Aware Reframing in Transformer Inference Pass [21.6] HARPは,トランスフォーマーフォワードパスの「オフザシェルフ」に対する簡単な修正である。
本手法は,難解な意思決定点を解析し,異なる視点でインプットを解釈することで,人間の認知過程を模倣する。
Harpは、ビームサーチの2倍高速な推論時間を維持しながら、これらのゲインを達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:12:22 GMT)
GenderAlign: An Alignment Dataset for Mitigating Gender Bias in Large Language Models [21.0] 大きな言語モデル(LLM)は、性別バイアスを示すコンテンツを生成する傾向がある。
GenderAlignデータセットは8kのシングルターンダイアログで構成されており、それぞれに "chosen" と "rejected" の応答がペアリングされている。
拒絶された」反応と比較すると、「ちょうせん」反応は性バイアスのレベルが低く、より高い品質を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:46:40 GMT)
Piece of Table: A Divide-and-Conquer Approach for Selecting Sub-Tables in Table Question Answering [20.9] PieTa - サブテーブルベースの質問応答(QA)のための新しいフレームワーク
テーブルを小さなウィンドウに分割する反復的なプロセスを通じて動作し、LMを使用して各ウィンドウ内で関連する細胞を選択し、これらの細胞をサブテーブルにマージする。
複数の行や列にまたがる依存関係をキャプチャし、長いコンテキスト入力による制限を回避する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:08:14 GMT)
Vision Language Modeling of Content, Distortion and Appearance for Image Quality Assessment [20.9] 画像品質評価(IQA)の開発には品質評価属性に関する高レベル知識の蒸留が不可欠である
自己監督・視線監督画像QUality Evaluator (SLIQUE) と呼ばれる新しいブラインドIQA(BIQA)モデルを提案する。
SLIQUEは、画像意味内容、歪み特性およびIQAの外観特性に関する高度な知識を得るための、視覚言語と視覚コントラスト表現学習フレームワークである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:56:37 GMT)
MobileSafetyBench: Evaluating Safety of Autonomous Agents in Mobile Device Control [20.8] モバイル機器制御エージェントの安全性を評価するためのベンチマークであるMobileSafetyBenchを紹介する。
メッセージングやバンキングアプリケーションを含む,さまざまなモバイルアプリケーションとのインタラクションに関わる,さまざまなタスクセットを開発します。
実験の結果,現状のLDMをベースとしたベースラインエージェントは,タスク実行時に害を効果的に防ぐことができないことが多いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:56:09 GMT)
Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation [20.7] イベントベースのビデオフレーム補間(EVFI)は、動き誘導としてスパースで高時間分解能なイベント計測を使用する。
我々は、インターネット規模のデータセットで訓練された事前学習ビデオ拡散モデルをEVFIに適用する。
提案手法は既存の手法より優れており,カメラ全体の一般化が従来の手法よりもはるかに優れている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:55:30 GMT)
Distributed Gradient Descent with Many Local Steps in Overparameterized Models [20.6] 機械学習モデルの分散トレーニングでは、局所的な反復ステップによる勾配降下が一般的な方法である。
局所勾配Descent (Local-GD) における暗黙のバイアスの観点から,この優れた性能を多くの局所ステップで説明しようと試みる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:19:40 GMT)
Low-Rank Correction for Quantized LLMs [20.2] 本稿では,大規模言語モデルにおけるエンフェクティベーションの量子化誤差を補正するための新しい低ランク手法を提案する。
我々は,Llama-2,Llama-3,Phi-3,Mixtralの4つのLLMモデルについて実験を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:17:46 GMT)
GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning [20.2] 本稿では,1つの粒度データセットの粒度を拡大するために,積分演算と圧縮演算を併用した粒度拡張(GEX)手法を提案する。
IAM(Iterative Approximation Module)を導入し,複数の粒度の動画やテキストを統一された低次元セマンティック空間に埋め込む。
我々は7つのベンチマークデータセットにまたがるビデオタスクの3つのカテゴリに関する作業を評価し、最先端または同等のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:50:53 GMT)
Contrasting Adversarial Perturbations: The Space of Harmless Perturbations [20.1] 入力に印加した場合、ネットワークの出力が変化しない無害な摂動空間が存在することを示す。
我々の研究は、敵対的な例とは対照的に、ディープニューラルネットワーク(DNN)の独特な堅牢性を強調している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:54:18 GMT)
Reprint: a randomized extrapolation based on principal components for data augmentation [19.8] 本稿では,不均衡なデータ分類のための,シンプルで効果的な隠れ空間データ拡張手法を提案する。
各クラス内のサンプルの隠れスペース表現を与えられたREPRINTは、ランダムな方法で、ターゲットクラスの拡張例を外挿する。
この方法は、拡張例のために新しい軟質ラベルを合成できるラベル改質成分を含む。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:03:27 GMT)
Robust Multiple Description Neural Video Codec with Masked Transformer for Dynamic and Noisy Networks [19.8] 多重記述符号化 (MDC) は有望な誤り耐性のあるソースコード符号化法である。
従来のMDCビデオコーデックは、面倒なアーキテクチャ、スケーラビリティの低下、損失耐性の制限、圧縮効率の低下に悩まされている。
我々は、マスク付きトークン予測のために訓練された双方向トランスフォーマーが、MDCビデオの設計を大幅に単純化できることを示す新しいMDCビデオであるNeuralMDCを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:08:05 GMT)
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models [19.7] Test-Time Prototype Shifting (TPS)は、未ラベルのテスト入力を使用したデータセットのテストに視覚言語モデルを適用するために設計された先駆的なアプローチである。
TPSは、その後の予測のために最適化不要なプロトタイプの再利用を促進するだけでなく、プロンプトエンジニアリングにおける現在の進歩とシームレスに統合することを可能にする。
我々のフレームワークの特筆すべき点は、従来のテキストプロンプトチューニング手法と比較して、メモリと計算要求が大幅に削減されていることである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:53:16 GMT)
Unlocking Feature Visualization for Deeper Networks with MAgnitude Constrained Optimization [19.6] 解釈可能な画像を生成するためのシンプルなアプローチであるMACOについて述べる。
我々のアプローチは、質的にも定量的にも、はるかに優れた結果をもたらし、大きな最先端のニューラルネットワークのための効率的かつ解釈可能な特徴視覚化を解き放つ。
特徴可視化手法の比較のための新しいベンチマークで本手法を検証し,画像Netデータセットの全クラスを対象とした可視化結果をリリースする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:12:12 GMT)
Meta-Controller: Few-Shot Imitation of Unseen Embodiments and Tasks in Continuous Control [19.3] ロボットの具体化やタスクの一般化は、適応型ロボットシステムにとって不可欠である。
我々は、見えない実施物やタスクを同時に一般化する、数発の行動クローニングフレームワークを導入する。
マッチングベースのポリシネットワークは、いくつかのデモからアクションを予測し、過度に適合する堅牢なアダプティブポリシを生成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:10:17 GMT)
Summon a Demon and Bind it: A Grounded Theory of LLM Red Teaming [19.2] 本稿では、このような攻撃を行う方法と理由を詳細に解説する。
フォーマルな定性的な方法論を用いて、幅広いバックグラウンドから数十人の実践者をインタビューした。
我々は12の戦略と35の異なるLLM攻撃手法の分類を同定する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:23:44 GMT)
SAVEn-Vid: Synergistic Audio-Visual Integration for Enhanced Understanding in Long Video Context [19.2] SAVEn-Vidは,58k以上の音声・視覚的指示を含む,史上初の音声・視覚的ビデオデータセットである。
AVBenchは、ロングビデオ内の音声・視覚的理解タスクの強化に関するモデルを評価するためにデザインされた2500QAを含むベンチマークである。
実験により、SAVEnVideoは、ゼロショット長ビデオタスク(Video-MME)で3.61%、ゼロショット長ビデオタスク(Music-AVQA)で1.29%、最上位のオーディオ・ヴィジュアル・タスク(Music-AVQA)で1.29%を上回った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:43:46 GMT)
FaceX: Understanding Face Attribute Classifiers through Summary Model Explanations [19.1] FaceXは、要約モデルの説明を通じて、顔属性分類器の包括的理解を提供する最初の方法である。
具体的には、FaceXはすべての顔画像に異なる領域が存在することを利用して、モデルのアクティベーションの領域レベルのアグリゲーションを計算する。
空間的説明以外にも、FaceXは、テストベンチマーク内の各顔領域に対するモデルの判断に最も大きな影響を与えて、特定のイメージパッチを視覚化することで、解釈可能性を高める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:50:41 GMT)
MIT-10M: A Large Scale Parallel Corpus of Multilingual Image Translation [19.1] 実世界のデータから得られた10万以上の画像テキストペアを用いた多言語画像翻訳の大規模並列コーパスであるMIT-10Mを紹介する。
3つのサイズの840Kイメージ、28のカテゴリ、難易度3レベルのタスク、14の言語とテキストのペアが含まれており、既存のデータセットでは大幅に改善されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:12:35 GMT)
RoboMatrix: A Skill-centric Hierarchical Framework for Scalable Robot Task Planning and Execution in Open-World [19.0] RoboMatrixは、スケーラブルなタスク計画と実行のためのスキル中心で階層的なフレームワークである。
まず、異なる複雑なタスクから共通のメタスキルを抽出する、新しいスキル中心のパラダイムを紹介します。
メタスキルを完全に活用するために,複雑なロボットタスクを3つの相互接続層に分離する階層型フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:02:45 GMT)
PRM: Photometric Stereo based Large Reconstruction Model [19.0] PRMは、様々な素材で測光ステレオ画像をレンダリングし、その目的のために照明を行う。
画像レンダリングの柔軟性を向上させるために、リアルタイム物理ベースレンダリング(PBR)手法と、オンライン画像のメッシュ仕様化を取り入れた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:11:15 GMT)
Addressing Attribute Leakages in Diffusion-based Image Editing without Training [18.9] ALE-Editは、3つのコンポーネントによる属性リークを最小限に抑える新しいフレームワークである。
ALE-Benchは属性リークを評価するためのベンチマークであり、ターゲット外およびターゲット内リークのための新しい指標である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:10:18 GMT)
Automatic Doubly Robust Forests [18.7] 本稿では,モーメント関数の条件予測を推定するためのDouubly Robust Random Forest (DRRF)アルゴリズムを提案する。
DRRFはRiesz表現子を使って自動脱バイアスフレームワークを組み合わせる。
評価精度,ロバスト性,計算効率の観点から,ベンチマーク手法よりもDRRFの方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:45:50 GMT)
T-TIME: Test-Time Information Maximization Ensemble for Plug-and-Play BCIs [18.4] EEGベースの脳コンピュータインタフェース(BCI)は、ヒト脳とコンピュータ間の直接通信を可能にする。
脳波信号の個人差と非定常性のため、そのようなBCIは通常、使用前に対象固有のキャリブレーションセッションを必要とする。
本稿では、最も困難なオンラインTLシナリオに対応するために、T-TIME(Test-Time Information Maximization Ensemble)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:32:17 GMT)
Mobile-TeleVision: Predictive Motion Priors for Humanoid Whole-Body Control [18.3] ヒューマノイドロボットは頑丈な下半身移動と正確な上半身操作を必要とする。
最近の強化学習アプローチは、全身のロコ操作ポリシーを提供するが、正確な操作はしていない。
Inverses (IK) と Motion を用いた高体力制御を導入し, 高精度な操作を行う。
CVAEは安定性とロバスト性に重要な特徴であり,RLによる全身制御よりも高い精度で操作できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:59:50 GMT)
Right on Time: Revising Time Series Models by Constraining their Explanations [18.3] RioTは、初めて、時間領域と周波数領域の両方にわたるモデル説明とのインタラクションを可能にする。
私たちは、RioTがP2Sの間違った理由や一般的な時系列分類や予測データセットからモデルを効果的に誘導できることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:46:23 GMT)
A Dynamical Systems-Inspired Pruning Strategy for Addressing Oversmoothing in Graph Neural Networks [18.2] グラフニューラルネットワーク(GNN)のオーバースムース化は、ネットワークの深さが増加するにつれて大きな課題となる。
オーバースムーシングの根本原因を特定し,textbftextitDYNAMO-GATを提案する。
我々の理論的分析は、DYNAMO-GATが過密状態への収束を妨げていることを示している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:07:06 GMT)
Incorporating Distributions of Discourse Structure for Long Document Abstractive Summarization [18.1] 本稿では,修辞関係のタイプと不確実性を包括的に組み込んだ新しい要約モデルであるRSTformerを紹介する。
文書レベルの修辞構造に根ざしたRTTアテンション機構は,最近開発されたLongformerフレームワークの拡張である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:59:20 GMT)
Light Field Image Quality Assessment With Auxiliary Learning Based on Depthwise and Anglewise Separable Convolutions [18.1] マルチメディア放送では、ユーザ認識された体験の質(QoE)を示すために、NR-IQA(No-Reference Image Quality Assessment)が使用される。
本稿では,将来的な没入型メディア放送のためのNR-LFIQA(No-Reference Light Field Image Quality Assessment)尺度を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:42:25 GMT)
DFREC: DeepFake Identity Recovery Based on Identity-aware Masked Autoencoder [18.0] DFRECは、ディープフェイク画像からソースとターゲットの顔のペアを復元し、ディープフェイク識別追跡を容易にすることを目的としている。
DFRECはFaceForensics++, CelebaFS, FFHQ-E4Sデータセットに対して6つの異なる高忠実顔スワッピング攻撃に対して評価する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:42:02 GMT)
MoDULA: Mixture of Domain-Specific and Universal LoRA for Multi-Task Learning [18.0] MoDULAはマルチタスク学習における微調整とパラメータ効率の改善のためのパラダイムである。
MoDULA-ResはMoDULAパラダイム内の新しい手法であり、普遍的な専門家とタスク固有の専門家を結びつけることによって、モデルの一般的な能力を維持する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:55:57 GMT)
3DSRBench: A Comprehensive 3D Spatial Reasoning Benchmark [17.9] 3次元空間推論は、3次元空間内の物体の位置、向き、空間的関係を分析し、解釈する能力である。
大規模マルチモーダルモデル(LMM)は、幅広い画像および映像理解タスクにおいて顕著な進歩を遂げている。
2,772対の視覚的質問応答対を持つ3DSRBenchを用いた3次元空間推論ベンチマークを作成した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:55:23 GMT)
Compositional Zero-Shot Learning with Contextualized Cues and Adaptive Contrastive Training [17.9] 本稿では,コンポジションゼロショット学習(CZSL)における属性とオブジェクト(ULAO)の理解とリンクに関する新しい枠組みを紹介する。
ULAOは2つの革新的なモジュールから構成されている。理解属性とオブジェクト(UAO)モジュールは、逐次原始予測によって原始的理解を改善し、認識されたオブジェクトを属性分類の文脈的ヒントとして活用する。
Linking Attributes and Objects (LAO)モジュールは、調整されたハードネガティブ生成と適応的損失調整を含む新しいコントラスト学習戦略を通じて、属性オブジェクトのリンク理解を改善する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:41:20 GMT)
RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts [17.8] 複数の粒度にまたがる包括的視覚理解のための統一型エンドツーエンドRS VLMであるRSUniVLMを提案する。
RSUniVLMは、変更検出や変更キャプションのインスタンスを含む、マルチイメージ解析において効果的に機能する。
また、RSと一般ドメインの両方の既存のデータセットに基づいて、大規模なRS命令追従データセットを構築した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:23:30 GMT)
On the connection between least squares, regularization, and classical shadows [17.6] RLS と CS の両者を, 未決定状態の正則化剤とみなすことができることを示す。
RLSとCSを3つの異なる角度から評価し, バイアスと分散のトレードオフ, 期待値と実測値とのミスマッチ, 計測数と撮影数との相互作用について検討した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:43:36 GMT)
Merino: Entropy-driven Design for Generative Language Models on IoT Devices [17.3] モバイルフレンドリーな生成言語モデルを設計するための新しい情報エントロピーフレームワークを提案する。
設計手順全体は、数理プログラミング(MP)問題を解くことを含み、数分でCPU上で実行でき、ほとんどコストがかからない。
我々は,14のNLPダウンストリームタスクにおいて,MeRinoと呼ばれる設計モデルを評価し,モバイル環境下での最先端の自己回帰変換モデルとの競合性能を示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:01:28 GMT)
A New Federated Learning Framework Against Gradient Inversion Attacks [17.3] Federated Learning (FL)は、クライアントが生データを共有せずに機械学習モデルを集合的にトレーニングできるようにすることで、データのプライバシを保護することを目的としている。
近年の研究では、FL中に交換された情報がグラディエント・インバージョン・アタック(GIA)の対象であることが示されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:53:42 GMT)
Score-matching-based Structure Learning for Temporal Data on Networks [17.2] 因果発見は経験的データと背景知識から因果関係を確立するための重要な第一歩である。
現在のスコアマッチングベースのアルゴリズムは、主に独立および同一に分散された(d.d.)データを分析するために設計されている。
我々はDAGの葉ノードのための新しい親フィンディングサブルーチンを開発し、プロセスの最も時間を要する部分である刈り込みステップを著しく加速した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:36:35 GMT)
AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework [17.1] Tabular Question Answering (TQA)では、構造化データから意味のある洞察を抽出することができる。
従来のデータプリプとは異なり、質問対応データプリプは新しい要件を導入している。
複数エージェントの強みを生かした大規模言語モデル(LLM)に基づくマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:03:49 GMT)
CFaiRLLM: Consumer Fairness Evaluation in Large-Language Model Recommender System [16.8] 本研究は,Large Language Model (LLM) ベースのレコメンデータシステムにおける公平性評価に関する過去の研究に批判的な立場を取る。
CFaiRLLMは、真の嗜好アライメントを組み込むだけでなく、交叉フェアネスを厳格に検証する拡張評価フレームワークである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:00:55 GMT)
On Motion Blur and Deblurring in Visual Place Recognition [16.8] モバイルロボティクスにおける視覚的位置認識(VPR)により、ロボットは視覚データを用いて以前訪れた場所を認識することで、自らをローカライズすることができる。
動きのぼかしの影響は、高速な動きのシナリオだけでなく、長時間の露光が必要な低照度環境でも比較的調査されていない。
本稿では,モーションボケと画像劣化の影響を受けながら,VPR性能を評価するための新しいベンチマークを導入することにより,これらのギャップを埋める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:49:51 GMT)
TraSCE: Trajectory Steering for Concept Erasure [16.8] テキスト・ツー・イメージ拡散モデルでは,NSFW(No-safe-for-work)画像のような有害なコンテンツを生成することが示されている。
本稿では, 拡散経路を有害な物質の発生から遠ざけるためのTraSCEを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:45:03 GMT)
RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting [16.6] 手動で構築されたデータセットで一般的なバイアスは、トークンとラベルの間に急激な相関をもたらす可能性がある。
既存のデバイアス法は、しばしば特定のデータセットバイアスに関する事前の知識に依存している。
本稿では,ショートカット緩和のためのテキスト書き直しに基づく,新規で教師なし,データ重視のデバイアス処理手法であるRAZORを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:02:58 GMT)
SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation [16.6] 我々は、科学ニュースの自動生成を容易にするための新しいコーパスを提示する。
本データセットは,9分野にわたる学術出版物と,それに対応する科学報告から構成される。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:12:46 GMT)
Number Theoretic Accelerated Learning of Physics-Informed Neural Networks [16.6] 格子トレーニングと周期化のトリックを導入し,理論が要求する条件を確実にする。
実験により、GLTは2-7倍のコロケーションポイントを必要とし、計算コストが低下することが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:00:35 GMT)
Adversarial Filtering Based Evasion and Backdoor Attacks to EEG-Based Brain-Computer Interfaces [16.4] 脳コンピュータインタフェース(BCI)は、脳と外部デバイスとの直接通信を可能にする。
近年の研究では、BCIの機械学習モデルは敵の攻撃に弱いことが示されている。
本稿では,EEGベースのBCIに対する逆フィルタリングに基づく回避とバックドアアタックを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:42:46 GMT)
M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images [16.2] 病理画像の階層構造に対応する多対一回帰変換器M2OSTを提案する。
1対1のイメージラベルペアで訓練された従来のモデルとは異なり、M2OSTはデジタル病理画像の異なるレベルからの複数の画像を使用して、共通の対応する領域における遺伝子発現を共同で予測する。
M2OSTはパラメータが少なく、浮動小数点演算(FLOP)で最先端のパフォーマンスを実現することができる
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:15:22 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1] 本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。
我々は,これらのステップで使用される既存の多種多様なSVを統一された定義で要約し,SVがデータ科学者にもたらす重要な機能を明らかにする。
SVBenchは,SVアプリケーション開発のための最初のオープンソースの計算ベンチマークであり,解析と議論の検証のために6つのDAタスクの実験を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:18:55 GMT)
o1-Coder: an o1 Replication for Coding [16.0] O1-CoDERは、コーディングタスクに焦点を当てたOpenAIのo1モデルを複製する試みである。
強化学習(RL)とモンテカルロ木探索(MCTS)を統合し、モデルのSystem-2思考能力を強化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:39:25 GMT)
Unlocking the Potential of Reverse Distillation for Anomaly Detection [15.9] 本稿では,教師エンコーダと学生デコーダの同時蒸留のためのエキスパート・教師・学生ネットワークを提案する。
専門的なネットワークが加わり、通常の特徴を生み出す能力が向上し、教師の正常特徴と異常特徴の区別が最適化される。
提案手法は, 逆蒸留パラダイムの下で, 既存の非教師なしAD法より優れる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:14:09 GMT)
Fast Occupancy Network [15.8] Occupancy Networkは、エゴ車周辺の特定3次元空間におけるボクセルのカテゴリを予測する。
本稿では, 変形可能な2次元畳み込み層を用いて, BEV機能を3次元ボクセル機能に引き上げる, 単純かつ高速なOccupancy Networkモデルを提案する。
また、計算コストを少なくして性能を向上させるために、効率的なボクセル特徴ピラミッドネットワーク(FPN)モジュールを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:46:03 GMT)
Hyperband-based Bayesian Optimization for Black-box Prompt Selection [15.8] 下流タスクにおける大規模言語モデル(LLM)のパフォーマンスを最大化するためには、最適なプロンプト選択が不可欠である。
我々は、ブラックボックスプロンプト選択のための新しいハイパバンドベースのベイズ最適化手法であるHbBoPsを紹介する。
提案手法では,マルチファイダリティスケジューラとしてHyperbandを用いて,構造を意識したディープカーネルガウス処理を用いて,プロンプト性能をモデル化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:42:51 GMT)
Label Distribution Learning using the Squared Neural Family on the Probability Simplex [15.7] 本研究は,単純度上のラベル分布の確率分布を推定する。
モデル分布では,予測操作を行うことでラベル分布の予測を行うことができる。
ラベル分布に関するさらなる情報は、予測信頼性や不確実性など、推測することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:12:02 GMT)
Detecting and Corrupting Convolution-based Unlearnable Examples [15.4] 畳み込みに基づく非学習可能な例(UE)では、クラスワイドな乗法的畳み込みノイズをトレーニングサンプルに適用し、モデルパフォーマンスを著しく改善する。
両線形インタポレーション(COIN)を用いて,これらのサンプルをランダム行列乗算により分解する,畳み込み型UEに対する最初の防御手法を提案する。
提案するCOINの一般化を評価するため,VUDAとHUDAという2つの畳み込み型UEを新たに設計し,畳み込み型UEの範囲を広げた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:40:07 GMT)
Primary visual cortex contributes to color constancy by predicting rather than discounting the illuminant: evidence from a computational study [15.3] 我々は、自然画像データセットから光源の色を学習するために、電気生理学的にベースとしたV1ニューラルモデルを構築した。
学習したモデルニューロンの受容野の空間構造と色重は、V1で記録された単純ニューロンとDOニューロンのものと非常によく似ている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:42:49 GMT)
Causal Deconfounding via Confounder Disentanglement for Dual-Target Cross-Domain Recommendation [15.2] 本稿では,CD2CDR と呼ばれる多目的クロスドメインレコメンデーションのための Confounder Disentanglement によるCausal Deconfounding フレームワークを提案する。
CD2CDRでは、まず、観測された単一ドメインとクロスドメインの共創者を効果的に分離する、共同設立者切り離しモジュールを提案する。
そこで我々は,そのような共同設立者の肯定的な効果を保ち,その負の効果をバックドア調整によって排除する因果分解モジュールを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:22:57 GMT)
Efficient 3D Recognition with Event-driven Spike Sparse Convolution [15.2] スパイキングニューラルネットワーク(SNN)は3次元時間的特徴を抽出するエネルギー効率の良い方法を提供する。
本稿では3次元点雲をスパーススパイクトレイン空間に符号化するスパイクVoxel Coding(SVC)方式を提案する。
本稿では,3次元スパース・クラウドの特徴を効率的に抽出するスパイクスパース・コンボリューション(SSC)モデルを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:55:15 GMT)
Defending Against Neural Network Model Inversion Attacks via Data Poisoning [15.1] モデル反転攻撃は、機械学習モデルに重大なプライバシー上の脅威をもたらす。
本稿では,プライバシとユーティリティのバランスを改善するための新しい防御機構を提案する。
本稿では,データ中毒を利用したインバージョンモデルのトレーニングデータを汚染する手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:08:56 GMT)
Anomaly detection using Diffusion-based methods [15.0] 本稿では,拡散モデルによる異常検出の有用性について検討する。
コンパクトデータセットと高解像度データセットの両方における偏差を識別する効果に重点を置いている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:17:23 GMT)
A Review of Human Emotion Synthesis Based on Generative Technology [14.9] 人間の感情合成は感情コンピューティングの重要な側面である。
計算手法を使って人間の感情を模倣し、様々なモダリティを通して伝達する。
生成モデルの最近の進歩は、この分野の発展に大きく貢献している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:06:10 GMT)
Forking Paths in Neural Text Generation [14.8] テキスト生成の個々のトークンにまたがる不確実性のダイナミクスを表現するための新しいアプローチを開発する。
4つの領域にわたる7つのタスクにおけるLLM応答の解析に本手法を用いる。
句読点などの驚くべきものを含む、トークンをフォークする多くの例を見出す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:57:57 GMT)
Double-Shot 3D Shape Measurement with a Dual-Branch Network for Structured Light Projection Profilometry [14.7] 我々は、異なる構造光(SL)変調を処理するために、デュアルブランチ畳み込みニューラルネットワーク(CNN)-トランスフォーマーネットワーク(PDCNet)を提案する。
PDCNet内では、Transformerブランチを使用してフリンジイメージのグローバルな認識をキャプチャし、CNNブランチはスペックルイメージのローカル詳細を収集するように設計されている。
提案手法は, 自己生成データセット上で高精度な結果が得られる一方で, フランジオーダーの曖昧さを低減できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:54:39 GMT)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [14.7] 大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。
医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:43:20 GMT)
Covered Forest: Fine-grained generalization analysis of graph neural networks [14.7] 我々は,MPNNの一般化能力に対するグラフ構造,集約,損失関数の影響を評価するために,グラフ類似性理論の最近の進歩を拡張した。
我々の実証研究は、MPNNの一般化特性の理解を深め、我々の理論的洞察を支持している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:45:59 GMT)
Observing Micromotives and Macrobehavior of Large Language Models [14.6] 大規模言語モデルのマイクロモーティブとマクロビヘイビアの関係を観察するために,シェリングの分離モデルに従う。
以上の結果から, LLMの偏見によらず, より多くの人々がLSMの提言に従えば, 高度に分離された社会が生まれることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:25:14 GMT)
Scalable Influence and Fact Tracing for Large Language Model Pretraining [14.6] トレーニングデータ属性(TDA)メソッドは、特定のトレーニング例にモデル出力を振り返ることを目的としている。
我々は,既存の勾配法を改良し,大規模に効果的に機能させる。
我々は、インプロンプトセットとモデルアウトプットをWebベースの可視化ツールとともにリリースし、影響力のある例を探索します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:59:38 GMT)
Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology [14.5] 本稿では,各データサンプルに関連付けられたガイドラインを報告するための新しいデータアノテーション手法を提案する。
提案手法は標準的な規範的アノテーション手法の3つの重要な制限に対処する。
GCAMは、複数のタスクでアノテーション付きデータの効率的な再利用を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:05:31 GMT)
An Entailment Tree Generation Approach for Multimodal Multi-Hop Question Answering with Mixture-of-Experts and Iterative Feedback Mechanism [14.5] マルチモーダルなマルチホップ質問応答の現在の手法は、主に2つの課題に直面している。
大量の冗長な情報を含む検索された証拠は、性能を著しく低下させる。
解釈可能な推論ステップのない推論プロセスは、複雑な問題を扱うための論理的誤りを発見するのを難しくする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:42:49 GMT)
Making the Flow Glow -- Robot Perception under Severe Lighting Conditions using Normalizing Flow Gradients [14.5] アウト・オブ・ディストリビューション検出は、現実のデプロイメントにおける信頼性を保証するソリューションとして一般的に提案されている。
提案手法は,対象検出タスクにおいて,従来の手法に比べて60%高い成功率が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:56:47 GMT)
Fast Track to Winning Tickets: Repowering One-Shot Pruning for Graph Neural Networks [14.4] 我々は,テキストファーストトラックの有効性を検証するために,ワンショットプルーニング・デノベーション・フレームワークを導入する。
提案手法では,重量幅の改善が1.32%~45.62%,グラフ幅が7.49%~22.71%,IMP法が1.7~44倍,MAC削減が9.3%~98.6%であった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:45:32 GMT)
Mayfly: Private Aggregate Insights from Ephemeral Streams of On-Device User Data [14.3] Mayflyは、センシティブなユーザデータの集中的な永続化なしに、デバイス上の一時的なデータストリーム上の集約クエリを可能にする、フェデレーション付き分析アプローチである。
厳格なデータユーティリティ要件を満たしながら、デバイス毎の1週間のDP$varepsilon = 2$で、5億以上のデバイスで400万以上の統計を計算した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:58:36 GMT)
CBraMod: A Criss-Cross Brain Foundation Model for EEG Decoding [14.3] 初期のEEG復号法は教師付き学習に依存しており、特定のタスクやデータセットによって制限され、モデルの性能と一般化性を妨げる。
CBraModは2つの並列注意機構を通して空間的および時間的依存関係を個別にモデル化できる。
CBraModは、幅広いタスクにまたがって最先端のパフォーマンスを実現し、その強力な能力と一般化可能性を証明する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:56:36 GMT)
Neural Modulation Alteration to Positive and Negative Emotions in Depressed Patients: Insights from fMRI Using Positive/Negative Emotion Atlas [14.3] FMRIは、高空間分解能と動的時間情報で有名な最先端の医療画像技術である。
ポジティブ感情アトラス(PEA)とネガティブ感情アトラス(NEA)を作成した。
これらのアトラスを用いたうつ病患者の変化について検討し,機械学習による診断性能の評価を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:20:59 GMT)
TTVD: Towards a Geometric Framework for Test-Time Adaptation Based on Voronoi Diagram [14.2] テスト時間適応(TTA)は、この問題に対処するために推論時に使われる新しいスキームである。
幾何学的観点からTTA問題を考察する。
本稿では,この幾何学的特性の利点を利用した新しいフレームワークであるVoronoi Diagram guidance (TTVD) によるテスト時間調整を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:40:07 GMT)
Towards Automated Cross-domain Exploratory Data Analysis through Large Language Models [14.2] 本稿では,自動クロスドメイン探索データ分析システムであるTiInsightについて述べる。
TiInsightは、GPT-4を用いてスパイダーデータセット上で86.3%の階層的実行精度を達成した。
また、Birdデータセット上での最先端のパフォーマンスも示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:11:23 GMT)
Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space [14.2] 我々は、概念空間と呼ばれるフレームワークを介してモデルの学習力学を分析します。
概念空間におけるモデルの学習力学の方向を,突然回転する瞬間を観察する。
驚くべきことに、これらの点は隠蔽能力の出現と正確に一致している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:40:34 GMT)
Ontology-Aware RAG for Improved Question-Answering in Cybersecurity Education [13.8] AIによる質問応答(QA)システムは、サイバーセキュリティの問題解決における不確実性を積極的に管理することができる。
大規模言語モデル(LLM)は、高度な言語理解とユーザエンゲージメントを提供するAI駆動のQAシステムで注目を集めている。
我々は,サイバーセキュリティ教育における信頼性および安全性の高いQAシステムを開発するための,オントロジー対応検索強化世代(RAG)アプローチであるCyberRAGを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:52:35 GMT)
RST-LoRA: A Discourse-Aware Low-Rank Adaptation for Long Document Abstractive Summarization [13.8] 本稿では RST-LoRA モデルに RST を明示的に組み込むための RST-LoRA を4種類提案する。
我々の経験的評価は、修辞関係のタイプと不確かさを取り入れることで、LoRAの性能を補完的に向上させることができることを示している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:16:53 GMT)
ChatGPT vs Human-authored Text: Insights into Controllable Text Summarization and Sentence Style Transfer [13.8] 2つの制御可能な生成タスクにおいてChatGPTの性能を体系的に検査する。
生成したテキストの忠実度を評価し、そのモデルの性能を人間によるテキストと比較する。
テキストを特定のスタイルに適合させる際に、ChatGPTは時に事実的誤りや幻覚を取り入れている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:06:22 GMT)
Gradient Diffusion: A Perturbation-Resilient Gradient Leakage Attack [13.8] 勾配保護は、フェデレートラーニング(FL)トレーニングプロセスにとって重要な問題である。
摂動抵抗性勾配漏洩攻撃(PGLA)を提案する。
我々の知見は、拡散逆過程における摂動の乱れレベルを捉えることで、勾配除雪能力が解放されるということである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:22:33 GMT)
Maya: An Instruction Finetuned Multilingual Multimodal Model [13.7] 視覚言語学習のためのオープンソースのマルチモーダルモデルであるMayaを紹介する。
1)LLaVA事前学習データセットに基づく8言語における多言語画像テキスト事前学習データセット,2)LLaVAデータセット内の毒性の徹底的な分析,続いて8言語にわたる新たな毒性のないバージョンの作成,3)これらの言語をサポートする多言語画像テキストモデル,そして視覚言語タスクにおける文化的・言語的理解の強化。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:57:17 GMT)
Investigating Bias in LLM-Based Bias Detection: Disparities between LLMs and Human Perception [13.6] 大規模言語モデル(LLM)におけるバイアスの存在と性質について検討する。
LLMが特に政治的バイアス予測やテキスト継続タスクにおいてバイアスを示すかどうかを調査する。
我々は,素早い工学とモデル微調整を含む脱バイアス戦略を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:43:50 GMT)
My Words Imply Your Opinion: Reader Agent-Based Propagation Enhancement for Personalized Implicit Emotion Analysis [13.5] 暗黙的感情分析(IEA)では、感情表現の微妙さはユーザー特有の特徴に特に敏感である。
既存の研究は、感情的テキストの著者的次元に着目して、パーソナライズを分析に注入することが多い。
本稿では,このタスクにおけるユーザ情報の欠落の問題に対処する新しいフレームワークであるRAPPIEモデルを紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:06:46 GMT)
Na'vi or Knave: Jailbreaking Language Models via Metaphorical Avatars [13.5] 本稿では,大規模言語モデル(LLM)の想像能力を利用してジェイルブレイクを実現する新たな攻撃フレームワークを提案する。
特に、AVATARは、与えられた有害な標的から有害な物質を抽出し、無害な敵性物質にマッピングする。
その結果, AVATAR は脱獄性 LLM を効果的に導入し, 最先端の攻撃成功率を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:14:03 GMT)
Why Fine-grained Labels in Pretraining Benefit Generalization? [13.3] 近年の研究では、詳細なラベル付きデータでディープニューラルネットワークを事前トレーニングし、粗ラベル付きデータで微調整すると、粗ラベル付きデータで事前トレーニングするよりもより優れた一般化が得られることが示されている。
本稿では,入力データ分布を限定する階層的マルチビュー構造を導入することで,このギャップに対処する。
1)粗粒度事前学習はニューラルネットワークが共通の特徴をうまく学習するのに対して,2)粗粒度事前学習は,一般的な特徴に加えて稀な特徴をネットワークが学習するのに役立つため,ハードダウンストリームテストサンプルの精度が向上する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:57:03 GMT)
Epidemiological Model Calibration via Graybox Bayesian Optimization [13.3] 実験により,提案したBOスキームのグレーボックス変種は,計算コストの高いモデルを効率的にキャリブレーション可能であることが示された。
より複雑な疫学モデルの迅速な校正を可能にするために,提案手法を拡張できることを期待する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:04:52 GMT)
Policy Filtration in RLHF to Fine-Tune LLM for Code Generation [13.2] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)が指示に従い、無害な応答を提供するのを助ける重要な手法の1つである。
直接的なポリシー最適化手法は存在するが、最先端のLCMはRLベースの手法(通常はPPO)をRLHFに導入し、優先データから学習した報酬モデルによって導かれる良い応答を生成するようにポリシーを訓練する。
報酬モデルの信頼性は、異なる報酬が割り当てられた応答によって異なることがわかった。
これにより、報酬が信頼できないサンプルをフィルタリングし、政策学習時の信号対雑音比を改善する動機付けとなる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:21:47 GMT)
Exploring What Why and How: A Multifaceted Benchmark for Causation Understanding of Video Anomaly [12.9] ビデオ異常の因果関係(ECVA)の探索のためのベンチマークを導入する。
私たちのベンチマークは慎重に設計されており、各ビデオには詳細な人間のアノテーションが添付されています。
本研究では,ECVAのヒト判定基準と密接に整合する特化評価指標であるAnomEvalを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:41:44 GMT)
FIRE: Robust Detection of Diffusion-Generated Images via Frequency-Guided Reconstruction Error [12.9] 拡散モデルは実画像中帯域周波数情報を正確に再構成するのに苦労する。
火災誘導型リコンストラクションエラーは、まず、周波数分解がリコンストラクション誤差に与える影響を調査する。
実験により、FIREは目に見えない拡散モデルに効果的に一般化し、多様な摂動に対する堅牢性を維持することが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:02:34 GMT)
Unsupervised Learning of Unbiased Visual Representations [12.7] ディープニューラルネットワークは、データセットバイアスの存在下で堅牢な表現を学ぶのに苦労することが多い。
この問題に対処するための既存のアプローチは、一般的にバイアス属性の明示的な監督、あるいはバイアスに関する事前の知識への依存を含む。
我々は3つの重要なステップを持つ完全に教師なしのデバイアス・フレームワークを提示する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:38:11 GMT)
Enhancing Relation Extraction via Supervised Rationale Verification and Feedback [12.7] 本稿では,関係抽出のための新しいフィードバックフレームワークを提案する。
合理性を検証し、最初の予測を正すためのフィードバックとして再選択されたデモを提供する。
提案手法は既存手法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:18:29 GMT)
EvRepSL: Event-Stream Representation via Self-Supervised Learning for Event-Based Vision [12.5] イベントストリーム表現は、多くのコンピュータビジョンタスクにおいて、イベントカメラを使用した最初のステップである。
イベントストリーム表現の品質向上を目的としたデータ駆動型手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:42:54 GMT)
Optimizing Personalized Federated Learning through Adaptive Layer-Wise Learning [12.4] ローカルモデルは、トレーニングプロセス中にデータを過剰にパーソナライズする傾向があり、以前取得したグローバルな情報を減少させる可能性がある。
我々は,局所モデルパーソナライズ性能を最適化する,pFLのための新しいレイヤワイズ学習手法であるFLAYERを提案する。
6つの最先端のpFL法と比較して、FLAYERは平均して推論精度を5.42%改善する(最大14.29%)。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:10:37 GMT)
Robust Markov Decision Processes: A Place Where AI and Formal Methods Meet [12.1] マルコフ決定プロセス(MDP)は、シーケンシャルな意思決定問題の標準モデルである。
形式的手法や人工知能(AI)など、多くの科学分野で広く使われている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:59:27 GMT)
CapGen:An Environment-Adaptive Generator of Adversarial Patches [12.0] 敵対的パッチは、しばしば重要な資産に対する物理的ステルス保護を提供するために使用され、通常、背景環境との視覚的調和の必要性を無視する。
カモフラージュ・アドリアバーサ・パターン・ジェネレータ (CAPGen) は, 周辺環境から特定の基本色を利用する新しい手法である。
本論文は,敵対パッチの文脈において,パターンや色が果たす役割を包括的に検討した最初の論文である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:24:24 GMT)
Reconstructing Deep Neural Networks: Unleashing the Optimization Potential of Natural Gradient Descent [12.0] 本研究では、構造化自然勾配降下(SNGD)と呼ばれる深層ニューラルネットワークを学習するための新しい最適化手法を提案する。
提案手法は,ディープラーニングアプリケーションにおけるNGDのスケーラビリティと効率を大幅に向上させる可能性がある。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:57:47 GMT)
A Method for Evaluating Hyperparameter Sensitivity in Reinforcement Learning [11.9] 本研究は,ハイパーパラメータチューニングに対するアルゴリズム性能の感度を研究,比較,定量化するための新しい経験的手法を提案する。
その結果、アルゴリズムの性能改善は、実際にはハイパーパラメータチューニングへの依存度が増大した結果である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:55:18 GMT)
Separation Power of Equivariant Neural Networks [11.9] 我々は、畳み込みや置換不変ネットワークなどの同変ニューラルネットワークの分離パワーを解析する。
ReLUやシグモイドを含む全ての非ポリノミカルな活性化は、表現力において等価であり、最大分離力に達する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:03:40 GMT)
Rethinking Alignment and Uniformity in Unsupervised Semantic Segmentation [11.8] 教師なしのイメージセマンティックセグメンテーションは、外部の監督なしに、低レベルの視覚特徴とセマンティックレベルの表現とを一致させることを目的としている。
本稿では,UISSモデルにおける特徴アライメントと特徴均一性の観点から,重要な特性について考察する。
本稿では,セマンティック・アテンション・ネットワーク(SAN)と呼ばれるロバストなネットワークを提案し,セマンティック・アテンション(SEAT)というモジュールを動的に生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:15:45 GMT)
Comateformer: Combined Attention Transformer for Semantic Sentence Matching [11.7] 本稿では,トランスフォーマーモデルに基づくコンバインド・アテンション・ネットワークという新しい意味文マッチングモデルを提案する。
Comateformer モデルでは,構成特性を持つ新しい変圧器を用いた準アテンション機構を設計する。
提案手法は,双対親和性スコアを計算する際の類似性と相似性(負親和性)の直感に基づく。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:18:07 GMT)
Streaming Private Continual Counting via Binning [11.7] 我々は、$textitbinning$を介して低空間における分解機構を近似する簡単な方法を提案する。
空間利用が極端に少ない場合でも、最適分解機構の性能は密に一致し、時には上回ることができることを実証的に示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:21:56 GMT)
Deep Learning-Enhanced Preconditioning for Efficient Conjugate Gradient Solvers in Large-Scale PDE Systems [11.7] 本稿では,グラフニューラルネットワーク(GNN)と従来のICを統合する新しい手法を提案する。
実験の結果、ICと比較してイテレーションの回数が平均24.8%減少した。
このアプローチは、スケールにわたる堅牢な一般化能力を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:34:13 GMT)
ResGS: Residual Densification of 3D Gaussian for Efficient Detail Recovery [11.7] 3D-GSは、しばしば豊富な詳細と完全な幾何学を捉えるのに苦労する。
本稿では, 残留分断法を新たに導入し, 残留分断法としてガウシアンを付加した。
提案手法は, 詳細を適応的に検索し, 欠落した幾何を補うとともに, 進歩的な洗練を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:19:27 GMT)
Is Self-knowledge and Action Consistent or Not: Investigating Large Language Model's Personality [11.7] 大規模言語モデル(LLM)の人格特性の把握における従来のパーソナリティアンケートの有効性について検討する。
本研究の目的は, LLM が持つ性格特性と実世界のシナリオにおけるその傾向の一致を評価することである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:26:52 GMT)
AI Expands Scientists' Impact but Contracts Science's Focus [11.6] 検証された言語モデルを用いて、6つの分野にわたる6790万の研究論文を分析した。
AIツールを採用する科学者は67.37%以上の論文を公開し、3.16倍の引用を受け取り、非ドローンよりも4年早くチームリーダーになる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:24:17 GMT)
Steering Non-Equilibrium Molecular Dynamics in Optical Cavities [11.6] オープン量子系における協調振動強い結合について検討する。
本研究は, 協調振動強い結合下での化学反応に対する化学結合の安定性を制御するための経路を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:28:00 GMT)
Mobile Video Diffusion [11.6] ビデオモデルは印象的なリアリズムと制御性を達成したが、計算要求によって制限されている。
本稿では,モバイル最適化ビデオ拡散モデルについて紹介する。
我々のモデルはMobileVDと呼ばれ、より効率が523倍(181対4.34 TFLOs)で、品質はわずかに低下する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:19:10 GMT)
Temporal Linear Item-Item Model for Sequential Recommendation [11.4] 我々はTemporAl LinEarItem-item Model(TALE)という新しい線形逐次レコメンデーション(SR)モデルを提案する。
TALEは、トレーニング/推論の効率を保ちながら、時間情報を3つのキーコンポーネントに組み込む。
我々の実証研究により、TALEは5つのベンチマークデータセットで10の競合SRモデルよりも18.71%向上していることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:28:32 GMT)
A Powered Prosthetic Hand with Vision System for Enhancing the Anthropopathic Grasp [11.4] 本研究では,人手つかみ過程の幾何学的特徴に基づいてジェスチャー関数を構成する空間幾何学に基づくジェスチャーマッピング(SG-GM)手法を提案する。
また,MTR-GIE(Motion Trajectory Regression-based Grasping Intent Estimation)アルゴリズムを提案する。
実験では,カップやフォークなど8つの日常的な物体を把握した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:45:14 GMT)
Goal-Driven Reasoning in DatalogMTL with Magic Sets [11.2] DatalogMTLは時間的推論のための強力なルールベースの言語である。
本稿では,マジックセット技術を利用したDatalogMTLの新しい推論手法を提案する。
このアプローチを実装し、いくつかの公開ベンチマークで評価する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:40:37 GMT)
Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds [11.2] テキストプロンプトから高分解能テクスチャマップを効率的に合成する新しいフレームワークであるMake-A-Textureを提案する。
この手法の重要な特徴は、NVIDIA H100 GPUでわずか3.07秒のエンドツーエンドランタイム内で完全なテクスチャ生成を実現するという、その顕著な効率である。
本研究は,インタラクティブなテクスチャ作成やテキストガイドによるテクスチャ編集を含む,現実世界の3Dコンテンツ作成のためのテクスチャ生成モデルの適用性と実用性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:58:29 GMT)
Semi-supervised 3D Semantic Scene Completion with 2D Vision Foundation Model Guidance [11.1] 我々は、高密度な注釈付きデータへの依存を軽減するために、新しい半教師付きフレームワークを導入する。
提案手法は2次元基礎モデルを用いて3次元シーンの幾何学的・意味的手がかりを生成する。
本手法は,10%のラベル付きデータを用いて全教師付き性能の最大85%を達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:52:34 GMT)
Using Machine Bias To Measure Human Bias [11.0] 人為的意思決定におけるバイアスを評価するための機械学習ベースのフレームワークを提案する。
提案手法が既存の代替手段よりも優れていることを示す理論的保証と実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:13:39 GMT)
DRUM: Learning Demonstration Retriever for Large MUlti-modal Models [10.9] 大規模マンダーリヌル型アンダーラインモデル(DRUM)のための新しい枠組みであるアンダーラインエミュレーションアンダーラインレトリバーを提案する。
まず、埋め込みモデルが与えられると仮定して、視覚言語タスクの検索戦略について議論し、画像とテキストの埋め込みを結合して検索性能を向上させることを提案する。
第2に、LVLMのフィードバックを介して、埋め込みモデルにより検索されたデモを再度ランク付けし、トレーニングのためのリストワイドランキングの損失を計算することを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:56:12 GMT)
Sculpting Molecules in Text-3D Space: A Flexible Substructure Aware Framework for Text-Oriented Molecular Optimization [10.9] 本稿では,多モードガイダンス最適化タスクとして定式化することで,逆設計問題に対処する革新的な手法を提案する。
提案手法は,分子最適化タスク,すなわち3DToMoloの実装のためのテクスチャ構造アライメント対称拡散フレームワークを含む。
3DToMoloは、テキスト記述特徴やグラフ構造特徴などの多彩なモダリティを調和させることを目的としており、この分野の専門家による特定の対称構造とテクスチュラル制約に従う分子構造をシームレスに生成することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:23:22 GMT)
MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application [10.8] 海洋環境検知には、厳しい天候、プラットフォーム摂動、大きな動的物体、長い検知範囲の要求といった課題を克服する必要がある。
レーダーセンサーは、天候や塩分からの物理的汚染に対する堅牢な長距離検知機能とレジリエンスを提供する。
このデータセットは、短距離LiDARデータ、中距離Wバンドレーダデータ、長距離Xバンドレーダデータを統一されたフレームワークに統合する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:48:23 GMT)
MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.7] 海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:10:56 GMT)
Maia: A Real-time Non-Verbal Chat for Human-AI Interaction [10.6] 我々はテキストベースのヒューマン-AIインタラクションの代替案を提案する。
非言語的な視覚コミュニケーションを活用することで、表情、頭と体の動きを通じて、エンゲージメントを高めることを目指している。
我々のアプローチは芸術に特化せず、様々な絵画、アニメーション、アバターに適応することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:27:39 GMT)
Resource and Mobility Management in Hybrid LiFi and WiFi Networks: A User-Centric Learning Approach [10.3] ハイブリッド光ファイバー(LiFi)と無線通信ネットワーク(HLWNet)は、新興の屋内無線通信パラダイムである。
既存のロードバランシング(LB)メソッドは、主にネットワーク中心であり、ユーザー全員にソリューションを提供するために中央ユニットに依存している。
そこで本研究では,ユーザが異なるペースでソリューションを更新できるユーザ中心のLBについて検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:32:18 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:19:08 GMT)
PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips [10.1] 本稿では,モデルパラメータのビットワイズによるジェイルブレーキングを誘導する,商用規模(人間対応)の言語モデルに対する新たな攻撃手法を提案する。
我々の攻撃は、以前のビットフリップ攻撃と同様のシステムで確実にジェイルブレイクを誘発できることを示す。
当社のアプローチは高RH安全性システムに対しても有効である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:00:01 GMT)
AHSG: Adversarial Attacks on High-level Semantics in Graph Neural Networks [10.1] グラフニューラルネットワーク(GNN)は、グラフ学習タスクにおける優れたパフォーマンスのために、研究者の間で大きな関心を集めている。
GNNの既存の敵攻撃法では、攻撃されたグラフと元のグラフの間の距離は、通常、攻撃予算またはグローバルグラフ特性の測定値である。
一次意味論の保持を保証するグラフ構造攻撃モデルを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:35:37 GMT)
FreqRISE: Explaining time series using frequency masking [10.1] 時系列データは、多くの重要なドメインにとって基本的に重要である。
正当性マップを得るための現在の方法は、生の入力空間における局所的な情報を仮定する。
本稿では、FreqRISEを提案する。FreqRISEは、マスキングに基づく手法を用いて、周波数領域と時間周波数領域の説明を生成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:26:56 GMT)
LOGen: Toward Lidar Object Generation by Point Diffusion [10.0] 希少な意味クラスにおけるライダーセグメンテーションの改善のための一般的な戦略は、あるライダーシーンから別のライダーシーンへのオブジェクトの貼り付けである。
本研究では,ライダーオブジェクトジェネレータを用いて,インスタンスの多様性を高める方法について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:30:27 GMT)
Deep Partially Linear Transformation Model for Right-Censored Survival Data [10.0] 本稿では,推定,推測,予測のための汎用かつ柔軟なフレームワークとして,深部部分線形変換モデル(DPLTM)を提案する。
総合シミュレーション研究は、推定精度と予測パワーの両方の観点から提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:50:43 GMT)
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models [10.0] 本研究は,人格状況判断テスト(PSJT)を中国語で自動生成する GPT-4 の可能性を探るものである。
従来のSJT開発は労働集約的でバイアスが多いが、GPT-4はスケーラブルで効率的な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:13:32 GMT)
Unlocking TriLevel Learning with Level-Wise Zeroth Order Constraints: Distributed Algorithms and Provable Non-Asymptotic Convergence [10.0] 本研究で提案する分散三段階ゼロ階学習フレームワークDTZOについて述べる。
DTZOは汎用的であり、広範囲(グレーボックス)のTLL問題に適用できる。
提案したDTZOの優れた性能を実証し,検証するために,広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:57:35 GMT)
Compression of Large-Scale 3D Point Clouds Based on Joint Optimization of Point Sampling and Feature Extraction [9.9] LiDARスキャナーによって得られた大規模な3Dポイントクラウド(LS3DPC)は、巨大なストレージスペースと伝送帯域を必要とする。
既存のLS3DPC圧縮法はルールベースの点サンプリングと学習可能な特徴抽出を別々に行う。
本稿では,LS3DPC圧縮のための完全エンドツーエンドのトレーニングフレームワークを提案し,ポイントサンプリングと特徴抽出を協調的に最適化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:30:48 GMT)
CogSimulator: A Model for Simulating User Cognition & Behavior with Minimal Data for Tailored Cognitive Enhancement [9.9] 本研究は、最小限のデータで小さなグループ設定でユーザ認知をシミュレートする新しいアルゴリズムであるCogSimulatorを紹介する。
このモデルは、平均Wasserstein-1距離、平均二乗誤差、平均精度において、ほとんどの従来の機械学習モデルを上回る。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:25:28 GMT)
A Parametric Approach to Adversarial Augmentation for Cross-Domain Iris Presentation Attack Detection [9.7] アイリスベースの生体認証システムは、敵がシステムを破壊するために物理的な人工物を提示するプレゼンテーションアタック(PA)に対して脆弱である。
本研究では,PAD分類器のクロスドメイン性能を向上させるために,ボナフィドイリドとPAの双方の対向トレーニングサンプルを用いる。
4つのデータセットとLivDet-Iris 2020データセットからなるLivDet-Iris 2017データベース上で実施された実験は、提案手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:31:34 GMT)
CMRNext: Camera to LiDAR Matching in the Wild for Localization and Extrinsic Calibration [9.7] CMRNextはカメラ-LIDARマッチングの新しいアプローチであり、センサー固有のパラメータとは独立しており、一般化可能であり、野生で使用することができる。
3つの公開データセットと3つの社内ロボットを含む6つの異なるロボットプラットフォーム上でCMRNextを広範囲に評価した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:53:01 GMT)
Predictable Emergent Abilities of LLMs: Proxy Tasks Are All You Need [9.7] 本稿では,プロキシタスクを活用して創発的能力を予測する手法を提案する。
ツール利用能力に関するケーススタディでは,予測性能と実性能との間に強い相関関係が認められた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:56:30 GMT)
Knowledge Graph Guided Evaluation of Abstention Techniques [9.5] 6つのオープンソースモデルとクローズドソースモデルに対して異なる禁忌テクニックをベンチマークする。
調査の結果,モデルが80%以上の棄権率で棄権されることが判明した。
しかし、これらの手法は対象概念の継承にはあまり効果がなく、拒絶率を19%下げている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:40:47 GMT)
Where Common Knowledge Cannot Be Formed, Common Belief Can -- Planning with Multi-Agent Belief Using Group Justified Perspectives [9.5] エピステマティック・プランニング(英: epistemic planning)は、知識と信念を変えることに焦点を当てたAI計画のサブフィールドである。
本稿では,分散信念と共通信念を含む,Emphgroupの信念を扱うためにJPモデルを拡張した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:43:06 GMT)
Symbolic Regression with a Learned Concept Library [9.4] 本稿では,データセットを最もよく説明できる,コンパクトなプログラム仮説を探索する手法を提案する。
我々のアルゴリズムはLaSRと呼ばれ、ゼロショットクエリを大規模言語モデルに使用して概念を発見し、進化させます。
LaSRは、ディープラーニングと進化的アルゴリズムに基づいて、最先端のSRアプローチを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:24:48 GMT)
MAPLE: A Framework for Active Preference Learning Guided by Large Language Models [9.4] 大規模言語モデルに基づくベイズ的能動的嗜好学習のためのフレームワークであるMAPLEを紹介する。
以上の結果から,MAPLEは学習過程を加速し,質問に答える能力を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:55:14 GMT)
A No-Reference Medical Image Quality Assessment Method Based on Automated Distortion Recognition Technology: Application to Preprocessing in MRI-guided Radiotherapy [9.3] 肝転移10例のMR画像106,000点について検討した。
1) 主要な診断特徴の可視性を高めるための事前処理。
腫瘍追跡アルゴリズムでは,前処理画像の追跡精度が有意に向上した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:23:02 GMT)
Label up: Learning Pulmonary Embolism Segmentation from Image Level Annotation through Model Explainability [9.3] 肺塞栓症(PE)は心臓血管死の主要な原因である。
PE診断を支援するAIベースのモデルの開発には、多くの関心が寄せられている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:30:12 GMT)
ChocoLlama: Lessons Learned From Teaching Llamas Dutch [9.3] 大規模言語モデル(LLM)は、自然言語の理解と生成において顕著な能力を示している。
彼らのパフォーマンスは、トレーニングデータのバイアスのため、低リソースで非英語の言語で遅れることが多い。
我々は、主に英語のLLM(Llama-2とLlama-3)を、世界中の3000万人が話す言語であるオランダ語に適応するための戦略を探求する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:13:58 GMT)
LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition [9.1] LiGARは、多モードグループアクティビティ認識のためのLIDAR誘導階層変換器である。
本フレームワークには,マルチスケールLIDARトランス,クロスモーダルガイドアテンション,アダプティブフュージョンモジュールが組み込まれている。
LiGARの階層アーキテクチャは、個々のアクションからシーンレベルのダイナミクスまで、さまざまな粒度のグループアクティビティをキャプチャする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:09:16 GMT)
DCMAC: Demand-aware Customized Multi-Agent Communication via Upper Bound Training [9.1] 本稿では,アッパーバウンドトレーニングを用いて理想的なポリシを得る,要求対応のカスタマイズ型マルチエージェント通信プロトコルを提案する。
実験結果から,DCMACは,制約のない,通信制約のないシナリオにおいて,ベースラインアルゴリズムを著しく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:25:18 GMT)
Political Actor Agent: Simulating Legislative System for Roll Call Votes Prediction with Large Language Models [9.0] 政治アクターエージェント(PAA)は、制限を克服するために大規模言語モデルを利用する新しいフレームワークである。
ロールプレイングアーキテクチャを採用し、立法制度をシミュレートすることで、PAAはロールコール投票を予測するためのスケーラブルで解釈可能なパラダイムを提供する。
我々は,第117-118回衆議院議員投票記録を用いた総合的な実験を行い,PAAの優れた性能と解釈可能性について検証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:06:28 GMT)
Optimistic Query Routing in Clustering-based Approximate Maximum Inner Product Search [9.0] この研究は、クラスタリングに基づく最大内部積探索におけるルーティングを研究することによってギャップを埋める。
各シャード内の内積分布のモーメントを組み込んで最大内積を推定する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:06:57 GMT)
Reconciling Human Development and Giant Panda Protection Goals: Cost-efficiency Evaluation of Farmland Reverting and Energy Substitution Programs in Wolong National Reserve [9.0] 本研究では、小規模結合型人間・自然システム(CHANS)のシミュレーションを目的としたエージェントベースモデル(ABM)であるSEEMS(Socio-Econ-Ecosystem Multipurpose Simulator)を用いた。
これは、中国のウーロン国立保護区(Wolong National Reserve)の例で、財政予算、生息環境保全性能、地域経済への影響の観点から、G2G(Grain-to-Green)とF2E(Firewood-to-Electricity)の2つの主要な会話プログラムの費用効果を分析している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:03:57 GMT)
MoRAG -- Multi-Fusion Retrieval Augmented Generation for Human Motion [8.9] MoRAGは、テキストベースの人間動作生成のための、新しい多部融合に基づく検索強化生成戦略である。
得られた動きの空間的組成から多様なサンプルを作成する。
我々のフレームワークはプラグイン・アンド・プレイモジュールとして機能し、モーション拡散モデルの性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:24:13 GMT)
Discrete distributions are learnable from metastable samples [8.9] 準安定分布から生成したサンプルから定常分布を記述する真のモデルを復元できることを厳密に示す。
このことは、強い転移性条件を満たす準安定分布の1変数条件が定常分布の条件と平均的に近いという基本的な観察から導かれる。
このような準安定状態の明示的な例は、確率フローを効果的にボトルネックにし、マルコフ連鎖の混合不良を引き起こす領域から構築することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:22:38 GMT)
Temperature dependent spin-phonon coupling of boron-vacancy centers in hexagonal boron nitride [8.8] 六方晶窒化ホウ素(hBN)における負電荷のホウ素空孔中心(mathrmV_mathrmB-$)は、最近、高い有望な量子センサーとして出現した。
本研究では, ゼロフィールド分割, 超微細相互作用, スピン緩和時間について, 10~350$Kの$mathrmV_mathrmB-$について検討した。
この結果は,$mathrmV_mathrmB-$センターにおける重要な知見であり,ナノスケール温度計やフォノンセンサとしての利用が期待できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:46:11 GMT)
Rethinking Emotion Annotations in the Era of Large Language Models [8.7] 大規模言語モデル(LLM)の文脈における感情アノテーションの複雑さを解析する。
実験では, GPT-4は人間の評価において高い評価を達成し, 前作よりも肯定的な絵を描いている。
ヒトの視点を保ちながらGPT-4の強さを活用するために,感情アノテーションパイプラインにGPT-4を統合する2つの方法を検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:30:51 GMT)
Attention Head Purification: A New Perspective to Harness CLIP for Domain Generalization [8.7] ドメインの一般化は、複数のソースドメインからモデルを学び、目に見えないターゲットドメインで十分なパフォーマンスを達成することを目的としています。
従来の手法では、完全な微調整やプロンプト学習のパラダイムを使用して、CLIPをDGタスクに利用していた。
本稿では,DGのためのCLIP,すなわちアテンションヘッドの浄化のための新しい視点を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:27:48 GMT)
Label-Confidence-Aware Uncertainty Estimation in Natural Language Generation [8.6] 不確実性定量化(UQ)は、AIシステムの安全性と堅牢性を保証するために不可欠である。
サンプルとラベルソース間の分岐に基づくラベル信頼度(LCA)の不確実性評価を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:35:23 GMT)
Group & Reweight: A Novel Cost-Sensitive Approach to Mitigating Class Imbalance in Network Traffic Classification [8.4] 本稿では,厳密なクラス不均衡の存在下でのネットワークトラフィックの分類に焦点をあてる。
以前のクラス不均衡メソッドは、多数のマイノリティな悪意のあるクラスを扱うことはほとんどありません。
クラス不均衡を軽減するためのテキストグループとリウェイト戦略を設計する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:12:06 GMT)
Bridging the Gap for Test-Time Multimodal Sentiment Analysis [7.9] マルチモーダル感情分析(マルチモーダル感情分析、Multimodal sentiment analysis、MSA)は、複数のモーダルを通して人間の感情や感情を理解し、認識することを目的とした、新たな研究トピックである。
本稿では,コントラスト適応(Contrastive Adaptation)と安定擬似ラベル生成(Stable Pseudo-label generation, CASP)の2つの手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:26:33 GMT)
Beyond Skip Connection: Pooling and Unpooling Design for Elimination Singularities [7.9] 深層畳み込みニューラルネットワーク(CNN)のトレーニングには、ユニークな課題がある。
私たちはPool Skipを紹介します。これは、Max Pooling、Max Unpooling、3倍の畳み込み、スキップ接続を戦略的に組み合わせたアーキテクチャ拡張です。
この構成は、トレーニングプロセスを安定化し、レイヤ間の機能の整合性を維持するのに役立つ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:40:21 GMT)
Comparative Analysis of Deep Learning Approaches for Harmful Brain Activity Detection Using EEG [7.8] 発作や周期的な放電などの有害な脳活動の分類は、神経クリティカルケアにおいて重要な役割を果たす。
脳波は脳活動を監視する非侵襲的な方法を提供するが、脳波信号の手動による解釈は時間がかかり、専門家の判断に大きく依存している。
本研究では、有害脳活動の分類に応用したCNN、視覚変換器(ViT)、EEGNetを含むディープラーニングアーキテクチャの比較分析を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:27:19 GMT)
StyleMark: A Robust Watermarking Method for Art Style Images Against Black-Box Arbitrary Style Transfer [7.7] Arbitrary Style Transfer (AST)は、任意のアートスタイルの絵画スタイルへの実際の自然画像のレンダリングを実現し、アートコミュニケーションを促進する。
1つの対策はロバストな透かしであり、これは著作権の透かしをキャリアに埋め込むことで画像の伝播を追跡する。
本稿では,AST後の芸術的スタイルの正確な属性を達成し,芸術的スタイルのイメージにシームレスに適用可能なStyleMarkを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:37:37 GMT)
HalluCana: Fixing LLM Hallucination with A Canary Lookahead [7.7] HalluCanaは、Large Language Models(LLMs)の事実を検知し、修正するためのカナリアルックアヘッドである
我々は、時間的検出を支援するために、隠れた空間の内部事実表現を利用する。
バイオグラフィー生成では, 最大2.5倍に向上し, 計算量も6倍以上に短縮された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:09:02 GMT)
Hypothesis Testing for High-Dimensional Matrix-Valued Data [7.6] 低次元行列のランクテストとして機能するクラッグ (1997) によって提案された最小離散性試験について検討する。
これらの課題に対処するため、我々は高次元行列ランクテストに適した新しいテスト統計法を提案する。
本研究は,本手法の実用性を実証したシミュレーション研究と,監視ビデオデータに関する2つの事例研究で締めくくった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:59:35 GMT)
Buster: Incorporating Backdoor Attacks into Text Encoder to Mitigate NSFW Content Generation [7.5] 驚くべきことに、Busterはテキスト・ツー・イメージモデルのテキストエンコーダをわずか5分で微調整し、高い効率性を示している。
実験の結果,Busterは他のベースラインよりも優れ,NSFWコンテンツ除去率に優れていた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:18:51 GMT)
Federated Split Learning with Model Pruning and Gradient Quantization in Wireless Networks [7.4] Federated split learning (FedSL)は、モデル分割によるエッジデバイスとサーバ間の協調トレーニングを実装している。
本稿では,リソース制約のあるエッジデバイスのトレーニング負担を軽減する軽量なFedSL方式を提案する。
提案手法の収束性能を定量化するために理論的解析を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:05:08 GMT)
Argumentative Experience: Reducing Confirmation Bias on Controversial Issues through LLM-Generated Multi-Persona Debates [7.4] 大きな言語モデル(LLM)は、デザイナーが情報アクセスのためのエキサイティングな新しいユーザーエクスペリエンスに命を吹き込むことを可能にする。
本研究は, 異論を呈する諸問題に対して, 混合方法論, 対象内研究を通じて複数の視点を呈する。
ベースライン検索システムと比較すると、より創造的な相互作用と多様な情報検索が、我々の多人数討論システムと比較される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:02:24 GMT)
Explaining and Mitigating the Modality Gap in Contrastive Multimodal Learning [7.4] マルチモーダル学習モデルは、共有表現空間を学習することにより、画像やテキストなどの様々なモダリティをブリッジするように設計されている。
これらのモデルはしばしばモダリティギャップを示し、異なるモダリティが共有表現空間内の異なる領域を占める。
トレーニング中にモダリティギャップを生じ、持続させる上で、不整合データペアと学習可能な温度パラメータの臨界的役割を同定する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:36:49 GMT)
EventSplat: 3D Gaussian Splatting from Moving Event Cameras for Real-time Rendering [7.4] イベントカメラは例外的な時間分解能と高いダイナミックレンジを提供する。
ガウススプラッティングによる新しいビュー合成におけるイベントカメラデータの利用法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:23:58 GMT)
On Representation Learning with Feedback [7.4] このノートは、著者の最近の論文"Robust representation learning with feedback for single image deraining"を補完するものである。
フィードバックによる表現学習のメカニズム、すなわち本記事で提示された作品の本質的なメリットに関する理論的説明を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:57:39 GMT)
FlexLLM: Exploring LLM Customization for Moving Target Defense on Black-Box LLMs Against Jailbreak Attacks [7.3] 大規模言語モデル(LLM)の防衛は、有害なコンテンツを生成するためにこれらのシステムを利用する多数の攻撃者に対抗するために不可欠である。
モデルロバスト性を高めるために、デコードハイパーパラメータを変更する移動目標防御手法を提案する。
以上の結果から,テストした3つのモデルのうち,我々の防衛は脱獄攻撃に対して最も効果的であることが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:02:28 GMT)
HEDS 3.0: The Human Evaluation Data Sheet Version 3.0 [7.2] HEDS 3.0パッケージは、完成したデータシートをラテックスファイルとしてエクスポートするためのデジタルデータシート、ドキュメント、コードで構成され、すべてHEDS GitHubから入手できる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:57:32 GMT)
Stealthy and Robust Backdoor Attack against 3D Point Clouds through Additional Point Features [7.1] 3Dバックドア攻撃は、3Dポイントクラウド用に設計された3Dディープニューラルネットワーク(3D DNN)に重大な脅威をもたらしている。
本稿では、意図的な設計上の考慮を通じて頑丈さとステルス性を保証するSRBA(Stealthy and Robust Backdoor Attack)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:48:11 GMT)
Beyond Static Assumptions: the Predictive Justified Perspective Model for Epistemic Planning [7.0] Justified Perspective(JP)モデルは、疫学計画(EP)問題を解決するための最先端のアプローチである。
既存のEPメソッドはすべて、古典的な計画から静的環境の仮定を継承する。
この制限は、マルチエージェント設定のロボット工学のような分野におけるEPの適用を妨げる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:00:08 GMT)
Integrating MedCLIP and Cross-Modal Fusion for Automatic Radiology Report Generation [6.9] 本稿では,MedCLIPを視覚抽出器および検索機構として利用し,医療報告生成のプロセスを改善する新しいクロスモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:04:56 GMT)
Bayesian Data Augmentation and Training for Perception DNN in Autonomous Aerial Vehicles [6.9] 本研究は,航空機の知覚訓練のためのデータ拡張フレームワークを提案する。
VTOL型UAVの着地性能を評価し,貴重なデータを収集する。
このモデルは、異なる照明と気象条件下で、認識に基づく着陸の成功率を少なくとも20%改善した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:41:19 GMT)
Boundary transitions from a single round of measurements on gapless quantum states [6.8] 空隙のない量子系における1ラウンドの計測によって、非自明な遷移を誘導できることを示す。
我々は分析を三重項イジングと三重項ポッツ臨界理論に拡張し、測定誘起境界遷移を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:00 GMT)
Optimizing Sensor Redundancy in Sequential Decision-Making Problems [6.8] 強化学習(Reinforcement Learning, RL)ポリシは、現在の観測結果に基づいて行動を予測することで、累積的な将来の報酬を最大化する。
現実世界のアプリケーションでは、センサは現在の状態を計測し、RLポリシーが決定に依存する観察を行うために不可欠である。
本稿では、所定の閾値未満のコストを維持しながら、期待したリターンを最大化するためのバックアップセンサ構成の最適化について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:20:44 GMT)
FlashRNN: Optimizing Traditional RNNs on Modern Hardware [6.7] 状態追跡機能は、時系列タスクと論理的推論にとって重要である。
LSTMやGRUのような従来のRNNは、厳密にシーケンシャルな処理を犠牲にしてこれらの機能を備えている。
我々は、Tritonのハードウェア最適化FlashRNNとカーネルをレジスタレベルに最適化することで、これらのネットワークがどれだけ高速になるかを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:50:37 GMT)
Hype-Adjusted Probability Measure for NLP Volatility Forecasting [6.7] 本論文は,市場予測のための新しい自然言語処理(NLP)アプローチの文脈で開発されたハイプ調整型確率尺度を紹介する。
新たな感情スコア式が提示され、コンポーネントとメモリ効果を捕捉し、動的パラメータを割り当て、選択した米国半導体株の次の周期変動予測に対する日内ニュースデータの影響を高める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:23:31 GMT)
Multimodal Sentiment Analysis Based on Causal Reasoning [6.6] 本稿では,因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因果的因
MVSA-SingleとMVSA-Multipleの2つの公開データセットの実験結果は、提案したCF-MSAがより優れた劣化能力を有し、新しい最先端のパフォーマンスを実現することを実証している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:21:19 GMT)
Software Model Evolution with Large Language Models: Experiments on Simulated, Public, and Industrial Datasets [6.6] RAMCを用いたモデル補完のための大規模言語モデルの可能性を評価する。
大規模な言語モデルは、ソフトウェアモデルの進化をサポートするための有望な技術であることがわかった。
大規模言語モデルの一般的な推論能力は、ほとんど、うるさい、あるいは全く例のない概念を扱う際に特に有用である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:54:43 GMT)
How Should We Represent History in Interpretable Models of Clinical Policies? [6.4] 臨床方針の解釈可能なモデリングのための患者履歴を要約するアプローチを体系的に比較する。
学習した表現を用いた解釈可能なシーケンスモデルは、すべてのタスクにわたるブラックボックスモデルと同等に機能する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:03:17 GMT)
pfl-research: simulation framework for accelerating research in Private Federated Learning [6.4] pfl-researchは、Federated Learning(FL)をシミュレートする高速でモジュール化された、使いやすいPythonフレームワークである。
セットアップ、PyTorch、非ニューラルネットワークモデルをサポートし、最先端のアルゴリズムと密に統合されている。
我々は,多様な現実的なシナリオに対して,アルゴリズムの全体的な性能を評価するベンチマークスイートをリリースする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:21:26 GMT)
Frame Representation Hypothesis: Multi-Token LLM Interpretability and Concept-Guided Text Generation [6.4] 解釈可能性(Interpretability)は、大規模言語モデルの信頼を促進する上で重要な課題である。
複数単語をモデル化してLLMを解釈・制御するためのフレーム表現仮説を提案する。
これらのツールをTop-k Concept-Guided Decodingで紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:25:39 GMT)
M3TR: Generalist HD Map Construction with Variable Map Priors [6.3] 本稿では,HDマップ構築のための一般手法であるM3TRを紹介する。
そこで本研究では,意味的に多様なマップ先行モデルを用いた最初の現実シナリオを提案する。
すべての事前シナリオにわたるトレーニングは、以前のExpertモデルと同等のパフォーマンスを持つ単一のジェネリストモデルをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:41:14 GMT)
Phase Diagram of the Schwinger Model by Adiabatic Preparation of States on a Quantum Simulator [6.2] 我々は、状態の断熱的準備を通じて量子デバイス上の量子物理系の位相構造を研究することが可能であると主張している。
そこで我々は新しい手法を導入し、Swingerモデルに適用し、トポロジカルな$theta$-termの存在下でテストに成功した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:11:41 GMT)
A Spectral Framework for Tracking Communities in Evolving Networks [6.2] 低ランクな静的なコミュニティ検出問題の近似を改良した。
Grassmannの階層型コミュニティ検出スキームを学習し、そのデータに最もよく適合する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:22:34 GMT)
A multimodal ensemble approach for clear cell renal cell carcinoma treatment outcome prediction [6.2] 臨床データ,マルチオミクスデータ,および病理組織学的全スライド画像(WSI)データを統合するマルチモーダルアンサンブルモデル(MMEM)を開発した。
MMEMはccRCC患者の全身生存率(OS)と無病生存率(DFS)を予測した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:51:14 GMT)
Enhancing 3D Object Detection in Autonomous Vehicles Based on Synthetic Virtual Environment Analysis [6.1] 本研究では,リアルタイム解析の文脈で3次元境界ボックスを推定するAIモデルの能力について検討する。
この研究の結果は、テスト条件のほとんどのバリエーションの下で、競争的な結果を達成するのに役立ちます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:46:44 GMT)
A tutorial on automatic differentiation with complex numbers [6.1] このチュートリアルは、ユーザーや開発者にとっても、カスタムのグラデーション伝搬ルールを実装する際に、複雑な値を真剣に扱うための呼び出しである。
本稿では,複素数を用いた前方・逆モード自動微分について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:34:46 GMT)
Adversarial Autoencoders in Operator Learning [6.0] 代表的な2つのニューラルネットワークアーキテクチャは、DeepONetsとKoopman Autoencodersである。
オートエンコーダの対向的な追加により、機械学習の様々な領域におけるオートエンコーダの性能が向上した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:54:55 GMT)
MAGE: A Multi-Agent Engine for Automated RTL Code Generation [5.9] MAGEは、堅牢で正確なVerilog RTLコード生成のために設計された、最初のオープンソースのマルチエージェントAIシステムである。
MAGE は VerilogEval-Human 2 ベンチマークで 95.7% の構文的および機能的正当性コード生成を実現している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:53:55 GMT)
Basis-independent Coherence and its Applications [5.9] 我々は、基底非依存の量子コヒーレンスの定義を分析し、非コヒーレント状態を最大混合状態とみなす。
多部系における相対エントロピーを用いて、基底非依存コヒーレンス、量子エンタングルメント、量子不協和の関係を論じる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:07:42 GMT)
Competition on Dynamic Optimization Problems Generated by Generalized Moving Peaks Benchmark (GMPB) [5.8] Generalized moving Peaks Benchmark (GMPB)は、継続的動的最適化問題インスタンスを生成するツールである。
GMPBは、最近のコンペティション・オン・ダイナミック・オプティマイションのコンペティションで使われてきた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:04:23 GMT)
KneeXNeT: An Ensemble-Based Approach for Knee Radiographic Evaluation [5.7] 変形性膝関節症(OA)は関節症で最も一般的な疾患であり、障害の主な原因である。
本研究は, 膝OA重症度を分類し, 専門家による評価の必要性を低減させる自動深層学習モデルを開発した。
我々のアンサンブルモデルであるKneeXNetは0.72の精度を達成し、膝OA評価の自動化ツールとしての可能性を示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:02:04 GMT)
Retaining and Enhancing Pre-trained Knowledge in Vision-Language Models with Prompt Ensembling [5.7] グループワイド・プロンプト・アンサンブル(GPE)と呼ばれる新しいプロンプト・アンサンブル学習手法を提案する。
提案手法は,データ分散シフトに対するロバスト性を改善しつつ,新たなドメイン知識を取り入れたCLIPのゼロショット機能の向上を目的としている。
当社のアプローチは,ゼロショット能力を保護しながら,CLIPの適応性を最適化するため,マスク付き注意によるグループ化の促進,モデルの表現を損なうことなく,新たなドメインインサイトをシームレスに統合するための補助的なプロンプトの導入,オリジナルと新しい知識を効果的にマージするアンサンブル学習戦略の3つの戦略に基づいている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:40:31 GMT)
KULTURE Bench: A Benchmark for Assessing Language Model in Korean Cultural Context [5.7] 韓国文化に特化して設計された評価フレームワークであるKULTURE Benchを紹介する。
言語モデルの文化的理解と、単語、文、段落レベルでの推論能力を評価するように設計されている。
その結果,韓国文化のより深い側面に関連する文章の理解は,依然として改善の余地があることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:20:51 GMT)
Collisional scattering of strongly interacting D-band Feshbach molecules in optical lattices [5.7] 本研究は、1次元光学格子のD$バンドにおける6mLi$分子ボース-アインシュタイン凝縮体の衝突散乱について検討する。
強く相互作用する状態における相互作用強度に対するD$バンド寿命の明らかな依存性を見出した。
最大寿命と格子深さは、相互作用の効果を明らかにするために測定される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:23:53 GMT)
A Progressive Image Restoration Network for High-order Degradation Imaging in Remote Sensing [5.6] 我々は高次劣化画像(HDI-PRNet)のための新しいプログレッシブ復元ネットワークを提案する。
本手法は,合成画像と実際のリモートセンシング画像の両方において,優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:08:39 GMT)
RADS-Checker: Measuring Compliance with Right of Access by the Data Subject in Android Markets [5.6] 一般データ保護規則(RADS)のような最新のデータ保護規則は、個人データにアクセスする権利を確立している。
RADSはユーザーに対して、個人データコントローラから個人情報のコピーを取得する権利を与える。
現在、モバイルアプリケーションでRADSが効果的に実装されているかどうかを体系的に調査する研究は行われていない。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:31:38 GMT)
Leveraging Large Language Models for Node Generation in Few-Shot Learning on Text-Attributed Graphs [5.6] 本稿では,Large Language Models (LLMs) を用いたノード生成によるテキスト分散グラフの強化のためのプラグイン・アンド・プレイ手法を提案する。
LLMはラベルから意味情報を抽出し、模範としてカテゴリに属するサンプルを生成する。
エッジ予測器を用いて、生のデータセットに固有の構造情報をキャプチャし、新たに生成されたサンプルを元のグラフに統合する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:06:29 GMT)
Physics-Based Dynamic Models Hybridisation Using Physics-Informed Neural Networks [5.6] 物理に基づく力学モデル(PBDM)は複雑な力学系の単純化された表現である。
ハイブリッド蚊群動態モデルがPBDMと物理インフォームドニューラルネットワーク(PINN)を統合していることを示す。
蚊の個体数予測の困難さを含む,蚊の個体数シミュレーションを改良した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:51:48 GMT)
ConceptSearch: Towards Efficient Program Search Using LLMs for Abstraction and Reasoning Corpus (ARC) [5.3] ConceptSearchは、コンセプトベースのスコアリングを使用して、検索を効率的にガイドする新しい関数検索アルゴリズムである。
実験結果はConceptSearchの有効性を示し、直接プロンプトよりも大幅なパフォーマンス向上を実現している。
これらの知見は、概念に基づくガイダンスと統合されたLLMによるプログラム探索の可能性を強調した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:10:11 GMT)
ArtFormer: Controllable Generation of Diverse 3D Articulated Objects [5.3] 本稿では,3次元調音物体のモデリングと条件生成のための新しい枠組みを提案する。
トークンのツリーとして記述されたオブジェクトをパラメータ化し、トランスフォーマーを用いてオブジェクトの高レベルな幾何コードとその運動的関係を生成する。
提案手法により,高品質な形状と部品数の異なる多種多様なオブジェクトの生成が可能となる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:00:05 GMT)
Filling Memory Gaps: Enhancing Continual Semantic Parsing via SQL Syntax Variance-Guided LLMs without Real Data Replay [5.3] CSP(Continuous Semantic Parsing)は、自然言語質問をタスク間で限定的な例で変換するためにアノテーションをトレーニングすることを目的としている。
過去の研究は、過去のデータを再生したり、パラメータ効率調整(PET)を用いてこの課題を緩和していた。
本稿では,Large Language Model (LLM) を用いた拡張連続意味解析手法 LECSP を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:11:49 GMT)
How hard can it be? Quantifying MITRE attack campaigns with attack trees and cATM logic [5.3] 本研究では,野生で記録された攻撃の確率を推定する。
セキュリティの専門家は透明で定量的な判断を下すことができる。
我々は、我々の方法論がモデリングの取り組みにおいて大幅に軽量であり、すべての定量的なデータをキャプチャできることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:09:48 GMT)
Data Quality Enhancement on the Basis of Diversity with Large Language Models for Text Classification: Uncovered, Difficult, and Noisy [5.2] 本稿では,大規模言語モデル(LLM)に基づくテキスト分類のためのデータ品質向上手法を提案する。
実験の結果,本手法はテキスト分類作業におけるLLMの性能を効果的に向上することが示された。
提案手法は,いくつかのオープンソース分類タスクにおいて最先端の性能を達成した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:35:28 GMT)
Do graph neural network states contain graph properties? [5.2] 診断分類器を用いたグラフニューラルネットワーク(GNN)のモデル説明可能性パイプラインを提案する。
このパイプラインは、さまざまなアーキテクチャやデータセットにわたるGNNの学習した表現を探索し、解釈することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:14:14 GMT)
EARN Fairness: Explaining, Asking, Reviewing, and Negotiating Artificial Intelligence Fairness Metrics Among Stakeholders [5.2] 我々は、AIの専門知識を必要とせず、利害関係者間でのメトリクスの集合的決定を促進する新しいフレームワークEARN Fairnessを提案する。
このフレームワークは、適応可能なインタラクティブシステムと、公正度指標を説明するステークホルダ中心のEARNフェアネスプロセス、利害関係者の個人的メトリック選好、総括的メトリクス、メトリクス選択に関するコンセンサスを交渉する。
我々の研究によると、EARN Fairnessフレームワークは、利害関係者が個人の好みを表現し、合意に達することを可能にし、リスクの高い状況下で人間中心のAIフェアネスを実装するための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:34:43 GMT)
On Faster Marginalization with Squared Circuits via Orthonormalization [5.2] 既に正規化されている分布を符号化するために、正方形回路をパラメータ化する方法を示す。
次に、このパラメータ化を用いて、既知の回路よりも効率的な正方形回路の残差を計算するアルゴリズムを考案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:37:03 GMT)
Multigraph Message Passing with Bi-Directional Multi-Edge Aggregations [5.2] MEGA-GNNは、マルチグラフ上のメッセージパッシングのための統一されたフレームワークである。
我々は, MEGA-GNN が置換同変であるだけでなく,エッジ上で厳密な全順序付けを与えられることも示す。
実験の結果、MEGA-GNNはアンチ・モニー・ロンダリングのデータセットで最先端のソリューションを最大13%上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:27:38 GMT)
Spectral Differential Network Analysis for High-Dimensional Time Series [5.1] 逆スペクトル密度の差を2つの条件で推定する手法を開発した。
本手法は,脳波データを用いた合成データ実験,電気脳波データを用いた実験,およびオトゲン刺激と微小脳波データを用いた実験について述べる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:30:06 GMT)
PBP: Post-training Backdoor Purification for Malware Classifiers [5.1] 近年、サイバーセキュリティにおける機械学習(ML)の台頭は、バックドア中毒の脅威の増加など、新たな課題をもたらしている。
ここでは,特定のバックドア埋め込み機構を仮定することなく,様々な種類のバックドア埋め込みを緩和するマルウェア分類器の訓練後防御であるPBPを紹介する。
提案手法は,2つのデータセット,2種類のバックドア手法,各種攻撃構成の実験により実証された,最先端の手法に対する大きな優位性を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:17:49 GMT)
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis [5.1] そこで本研究では,AnomalyControl という,モーダルな意味的特徴をガイダンス信号として学習するための,新しいアノマリ合成フレームワークを提案する。
AnomalyControlは、既存の方法と比較して、異常合成の最先端の結果を得ることができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:49:16 GMT)
Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices [5.1] Crack-EdgeSAMは、プロンプトボックスを生成するためにYOLOv8を統合するセルフプロンプトクラックセグメンテーションシステムである。
このシステムは1024×1024ピクセルの画像を、私たちのPC上で46FPS、Jetson Orin Nanoで8FPSで処理します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:50:50 GMT)
Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE).pdf [5.0] JUDEはDeblurring and Low-Light Image EnhancementのためのDeep Joint Unrollingである。
レチネックス理論とぼやけたモデルに基づいて、低照度のぼやけた入力を反復的に分解して分解する。
我々は,初期ぼやけたカーネルを推定し,明るさを高め,最終画像のノイズを除去するために,様々なモジュールを組み込んだ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:03:41 GMT)
Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance [5.0] 術中超音波(US)は経口ロボット手術におけるリアルタイムの可視化を促進する。
本稿では,術前画像データベースに米国内視点を合わせるための,自己指導型コントラスト学習手法を提案する。
提案手法は,シミュレーションデータに対する92.30%の精度を達成し,最先端の時間ベースコントラスト学習手法より優れている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:39:33 GMT)
Faster and Better 3D Splatting via Group Training [4.8] グループトレーニングは、ガウスのプリミティブを管理可能なグループに整理し、トレーニング効率を最適化し、レンダリング品質を改善する戦略である。
このアプローチは、バニラ3DGSやMip-Splattingなど、既存の3DGSフレームワークとの共通互換性を示している。
実験の結果,グループトレーニング戦略が最大30%高速な収束と,さまざまなシナリオでのレンダリング品質の向上を実現していることが明らかになりました。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:47:17 GMT)
Fine-grained Text to Image Synthesis [4.7] 微細なテキストから画像合成は、異なるカテゴリに属するテキストから画像を生成する。
補助分類器は、識別器が画像のクラスを分類するのを手助けし、生成器がより正確なきめ細かい画像を合成するのを手助けする。
我々はCUB-200-2011の鳥のデータセットとオックスフォード102の花のデータセットを用いて,いくつかの最先端手法の評価を行った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:09:52 GMT)
Beyond Retrieval: Generating Narratives in Conversational Recommender Systems [4.7] 本稿では,会話レコメンデーションにおける自然言語生成タスクのための新しいデータセット(REGEN)を提案する。
我々は、よく知られた生成指標を用いてベンチマークを作成し、レーダLEMを用いて新しいデータセットの自動評価を行う。
そして、私たちの知る限りでは、レコメンデーター信号を理解し、リッチな物語を生成することにおけるLLMの能力を分析する最初の試みである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:45:18 GMT)
Causal World Representation in the GPT Model [4.6] GPT(Generative Pre-trained Transformer)モデルは、実世界のゲームにおいて、勝利を意図してテストされる。
GPTモデルは、アテンション機構が高い信頼度で因果構造を符号化するシーケンスのゲーム規則に従う次の動作を生成する傾向がある。
一般に、GPTモデルがゲームルールに従わない動作を生成する場合、因果構造を捕捉できない。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:05:03 GMT)
Why Do Developers Engage with ChatGPT in Issue-Tracker? Investigating Usage and Reliance on ChatGPT-Generated Code [4.6] GitHubの1,012のイシューで1,152人のDeveloper-ChatGPTの会話を分析しました。
ChatGPTは主にアイデアに使用されるが、検証には最小限である。
ChatGPTで生成されたコードは5.83%の問題を解決するためにas-isとして使用された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:24:10 GMT)
Charge state transition of spectrally stabilized tin-vacancy centers in diamond [4.6] ダイヤモンド中のスズ空孔(SnV)中心のスペクトル安定性と電荷状態遷移について検討した。
この不安定性は電荷状態からダーク状態への遷移によって生じる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:08:20 GMT)
Hallucination Elimination and Semantic Enhancement Framework for Vision-Language Models in Traffic Scenarios [4.5] 大型視覚言語モデル(LVLM)は時折幻覚テキストを生成する。
この現象は、自動運転システムの誤った運転判断につながる可能性がある。
本稿では,プラグアンドプレイの連鎖補正手法であるHNetを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:56:49 GMT)
Machine Learning Algorithms for Detecting Mental Stress in College Students [4.5] 本研究は, 各種機械学習アルゴリズムを適用し, 大学生のストレスや非ストレス発生を予測するための取り組みである。
学生のストレスレベルを主目的としたワークショップを開催した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:07:37 GMT)
Modifying AI, Enhancing Essays: How Active Engagement with Generative AI Boosts Writing Quality [4.5] 学生は執筆を支援するためにジェネレーティブAI(GAI)をますます頼りにしている。
本研究は, GAI支援書記における教師の学生学習の評価と支援を支援することを目的とした。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:32:57 GMT)
EDiT: A Local-SGD-Based Efficient Distributed Training Method for Large Language Models [4.5] 本研究では,局所SGD手法をモデルシャーディング手法と組み合わせ,大規模トレーニング効率を向上させる革新的な分散トレーニング手法であるEDiTを提案する。
また、異種クラスタに対応するEDiTの完全非同期版であるA-EDiTについても紹介する。
実験により, EDiT/A-EDiTの優れた性能を示し, 分散LLMトレーニングのための堅牢なソリューションとして確立した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:08:24 GMT)
A Step towards Automated and Generalizable Tactile Map Generation using Generative Adversarial Networks [4.5] 我々は,触覚マップの自動生成を支援するコンピュータビジョン技術の適用に向けた第一歩として,概念実証モデルを訓練する。
Google Mapsから6500箇所にまたがるストリートビューの、一級の触覚マップデータセットを作成します。
1つのズームでトレーニングされたGAN(Generative Adversarial Network)モデルは、キーマップ要素の識別に成功している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:59:03 GMT)
Towards a classification of mixed-state topological orders in two dimensions [4.4] 混合状態トポロジカル秩序を2つの空間次元で分類する。
我々は、本質的に混合された混合状態トポロジカル秩序、すなわち基底状態を持たない混合状態トポロジカル秩序を確立する。
混合状態位相順序は、前モジュラー・エノン理論によって分類されると推測する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:51:06 GMT)
The Mirage of Artificial Intelligence Terms of Use Restrictions [4.3] 人工知能(AI)モデル作成者は一般的に、モデルと出力の両方に制限的な使用規約を付ける。
本条は、AIモデルの使用規約の施行可能性について体系的に評価し、3つの貢献を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:18:29 GMT)
Modeling High-Resolution Spatio-Temporal Wind with Deep Echo State Networks and Stochastic Partial Differential Equations [4.3] サウジアラビアは石油の排他的使用から再生可能エネルギー、特に風への依存へと徐々にエネルギーポートフォリオをシフトしつつある。
ある国におけるポテンシャルエネルギーの出力を、大きく、地理的に多様性があり、調査する風速をモデル化することは、空間と時間の両方において非常に非線形な動的構造を示唆する課題である。
我々のモデルでは、風速とエネルギーの双方をエネルギーグリッド管理のリードタイムでより正確に予測し、最も近い競争モデルに対して100万ドルも節約することができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:45:56 GMT)
Quantum vs. Classical Machine Learning Algorithms for Software Defect Prediction: Challenges and Opportunities [4.3] 本研究では,ソフトウェア欠陥データセット上での3つの量子機械学習(QML)と5つの古典的機械学習(CML)アルゴリズムの性能を比較した。
本研究は,QML対CMLアルゴリズムの比較シナリオを報告し,ソフトウェア欠陥を予測するための優れた性能と一貫したアルゴリズムを同定する。
本研究の成果は,ソフトウェアシステムを信頼性とバグのないものにすることで,実践者や研究者のさらなる研究領域の進展に役立つ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:38:36 GMT)
Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change [4.2] 対実的説明(CFE)は、望ましいアウトプットを達成するために、機械学習モデルへの入力の調整方法をユーザに案内する。
この問題に対処する現在のメソッドは、しばしば特定のモデルや変更タイプのみをサポートする。
本稿では,任意のモデルや変更タイプに対して確率的保証を提供するCFEの生成手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:02:27 GMT)
Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting [4.2] ディープ・ニューラル・ネットワークは、時々予想外の個人情報をリークする。
最近の機械学習アルゴリズムは、モデルがそのようなデータを忘れることを目的としている。
本稿では,インスタンスを効率よく忘れる新しい手法である分散レベル特徴分散を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:08:27 GMT)
A Dataset and Benchmark for Hospital Course Summarization with Adapted Large Language Models [4.1] 大規模言語モデル(LLM)は、現実世界のタスクを自動化する際、顕著な能力を示しているが、医療応用の能力は示されていない。
臨床ノートと短い病院コースをカプセル化したMIMIC-IV-BHC(MIMIC-IV-BHC)を導入した。
臨床ノートを入力として,3つのオープンソースLSMと2つの独自LSMに対して,プロンプトベース(文脈内学習)と微調整ベースの適応戦略を適用した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:29:48 GMT)
DeCLIP: Decoding CLIP representations for deepfake localization [4.0] DeCLIPは、局所的な操作を検出するために、大規模な事前学習機能を活用する最初の試みである。
合理的に大きな畳み込みデコーダと組み合わせることで、事前学習された自己教師付き表現がローカライズを行うことができることを示す。
従来の研究とは異なり、我々の手法は潜在拡散モデルの挑戦的な場合において局所化を行うことができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:35:31 GMT)
A large language model-based approach to quantifying the effects of social determinants in liver transplant decisions [4.0] 健康の社会的決定要因(SDOH)は、健康結果とケアアクセスを形成し、性別、人種、社会経済的地位の相違に寄与する。
我々は、SDOHが患者のケアトラジェクトリにどのように影響するかを広く定義する人工知能(AI)駆動のフレームワークを開発した。
我々の分析は、肝臓移植決定における人種的格差を説明するのに役立つ人口統計学におけるSDOHの有病率パターンの同定に役立ちます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:12:33 GMT)
Tazza: Shuffling Neural Network Parameters for Secure and Private Federated Learning [4.0] フェデレーション学習は、生データを共有せず、データのプライバシを保存することなく、分散モデルトレーニングを可能にする。
既存のソリューションはしばしばこれらの問題に別々に対処し、システムの堅牢性やモデルの精度を犠牲にする。
この作業では、両課題に同時に対処するセキュアで効率的なフェデレーション学習フレームワークであるTazzaが導入されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:20:42 GMT)
Polarization Purity and Dispersion Characteristics of Nested Antiresonant Nodeless Hollow-Core Optical Fiber at Near- and Short-wave-IR Wavelengths for Quantum Communications [3.9] 反共振性ノードレスファイバ (NANF) は、テレコム波長範囲で最小二屈折の非平行偏光純度を有する。
以上の結果より,CW動作の1520nmから1620nmの範囲で,-30dBと-70dBの偏光消滅比が2-mu$m設計波長で-60dBにピークした。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:19:32 GMT)
Direct Fidelity Estimation for Generic Quantum States [3.9] 汎用量子状態に対する新しい忠実度推定プロトコルを提案する。
提案プロトコルは,必要な測定回数と関係者間の通信コストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:01:25 GMT)
Class Distribution Shifts in Zero-Shot Learning: Learning Robust Representations [3.9] 本研究では,前もって変化の原因となる属性が不明であると仮定したモデルを提案し,解析する。
提案アルゴリズムは,実世界のデータセット上でのシミュレーションと実験の両方において,多様なクラス分布への一般化を改善する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:56:36 GMT)
Non-Progressive Influence Maximization in Dynamic Social Networks [3.8] インフルエンス(IM)問題は、ネットワーク接続を通じてインフルエンスの拡大を最大化できる、ソーシャルネットワーク内のキーパーソナリティの集合を特定することである。
本稿では,実世界のソーシャルネットワークの動的性質を考察する,動的非プログレッシブIM問題に焦点をあてる。
本稿では,グラフ埋め込みを効果的に活用して動的ネットワークの時間変化を捉え,深層強化学習とシームレスに統合するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:52:32 GMT)
Two-Timescale Optimization Framework for Sparse-Feedback Linear-Quadratic Optimal Control [3.7] The $mathcalHfeedback$-guaranteed sparse-feedback linear-quadratic (LQ) optimal control with convex parameterization and convex-bounded uncertainty。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:52:23 GMT)
Multimodal Instruction Disassembly with Covariate Shift Adaptation and Real-time Implementation [3.7] 我々は、ターゲットデバイスから電力とEMを同時に収集できる新しい小型プラットフォーム、RASCv3を導入する。
我々は情報理論を用いてパワーとEMトレースから特徴を組み合わせ、選択するための新しいアプローチを考案した。
オフラインおよびリアルタイムの命令分解器の認識率は、単一および複数モードの場合と比較する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:00:23 GMT)
Oreo: Protecting ASLR Against Microarchitectural Attacks (Extended Version) [3.7] Oreoは、メモリ破損攻撃に対するソフトウェアとハードウェアの共同設計の緩和である。
新しいメモリマッピングインターフェースを使用して、仮想アドレスの秘密のランダム化ビットを削除し、それに対応する物理アドレスに変換する。
Oreoはユーザプログラムに対して透過的であり、オーバーヘッドが低い。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:47:00 GMT)
Zero-energy Quantum Many-Body Scar under Emergent Chiral Symmetry and Pseudo Hilbert Space Fragmentation [3.7] キラル対称性と擬似HSFの相互作用におけるゼロエネルギーQMBSの現象について検討した。
この2つの相互作用は、粒子数が偶数であるとき、高度に局所化されたゼロエネルギーQMBSをもたらす。
ゼロエネルギーQMBSを信号化する単純な積状態を特定し、異常なスカーレッドダイナミクスを生じさせる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:52:06 GMT)
An inferential measure of dependence between two systems using Bayesian model comparison [3.7] $X$ と $Y$ in $D$ の依存度は $B(X,Y|D)$ と定量化される。
ベイズフレームワークを用いた結果、および$B(X,Y|D)$と相互情報との類似点と相違点について論じる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:54:45 GMT)
TT-MPD: Test Time Model Pruning and Distillation [3.7] プルーニングは、推論速度加速のための大きな事前訓練されたモデルを圧縮する有効な方法である。
以前のプルーニングアプローチは、プルーニングとその後の微調整の両方において、オリジナルのトレーニングデータセットへのアクセスに依存していた。
近似された微調整精度と潜在的な推論遅延の削減を考慮した効率的なプルーニング法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:05:13 GMT)
Variational Quantum Algorithm for Constrained Topology Optimization in Quantum Scientific Computing [3.6] 量子絡み合いによる位相最適化のための新しい変分量子アルゴリズムを提案する。
このアルゴリズムはトラス構造やMesserschmitt-B"olkow-Blohmビームを含むコンプライアンス最小化問題で実証される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:38:40 GMT)
Stable Mean Teacher for Semi-supervised Video Action Detection [3.6] 我々は,映像行動検出のための半教師付き学習に焦点を当てた。
改良された時間的に一貫した擬似ラベルの恩恵を受ける、シンプルなエンドツーエンドの教師ベースのフレームワークである安定平均教師を紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:25:33 GMT)
Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery [3.5] 模倣学習(imitation learning)は、専門家の行動からポリシーを学ぶための、データ駆動型アプローチである。
OOS(Out-of-sample)領域では信頼性の低い結果が出る傾向がある。
本稿では,契約型力学系をモデルとした政策学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:28:18 GMT)
Privacy in Foundation Models: A Conceptual Framework for System Design [3.4] ファンデーションモデルは、大きな課題と素晴らしい機会の両方を示します。
現在、プライバシー評価プロセスが包含すべき技術的問題と非技術的問題の両方の包括的範囲について合意が得られていない。
本稿では、複数の視点から様々な責任あるAIパターンを統合する新しい概念的枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:35:27 GMT)
Revisiting Lesion Tracking in 3D Total Body Photography [3.4] メラノーマは皮膚がんの最も致命的な形態である。
3次元全身写真における皮膚病変の経時的追跡に関する先行研究にもかかわらず、いくつかの課題がある。
本稿では,2組の3次元テクスチャメッシュを取り入れ,全身撮影の文脈における病変と一致し,不整合性病変を同定するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:41:21 GMT)
Modeling and Simulating Rydberg Atom Quantum Computers for Hardware-Software Co-design with PachinQo [3.3] PachinQoは、任意の量子アルゴリズムに対して、ゾーナルアドレッシングシステムのアーキテクチャとコンパイルを共同設計するフレームワークである。
PachinQoの評価は、エラーを起こしやすい量子環境において、量子アルゴリズムが成功する確率を平均で45%改善する能力を示している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:41:04 GMT)
A Review of Challenges in Speech-based Conversational AI for Elderly Care [3.3] 音声制御アシスタントは高齢者をサポートし、遠隔での健康モニタリングを可能にする。
効果のボトルネックは、これらのデバイスが実際にどのように機能し、高齢者がそれらをどのように経験するかである。
我々は音声制御AIの高齢者利用をレビューし、様々なユーザおよび技術中心の問題に焦点をあてる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:32:22 GMT)
Leveraging LLM for Automated Ontology Extraction and Knowledge Graph Generation [3.3] OntoKGenは、オントロジー抽出と知識グラフ生成のための真のパイプラインである。
OntoKGenは、Neo4jのようなスキーマレスで非リレーショナルなデータベースへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:28:36 GMT)
Parametric tuning of quantum phase transitions in ultracold reactions [3.2] 構成原子と分子間の一般的な相互作用の存在は、臨界点の性質を根本的に変えることができることを示す。
この相互作用によって引き起こされる相関は、非自明な多体物理学を引き起こす。
非断熱的状態における反応収率のスケーリング法則とともに、これらの効果の分析的および数値的な説明を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:30:29 GMT)
Mask prior-guided denoising diffusion improves inverse protein folding [3.1] 逆タンパク質の折り畳みは、所望のタンパク質構造に折り畳むことのできる有効なアミノ酸配列を生成する。
逆タンパク質折り畳みのための構造的相互作用と残基相互作用の両方を捉える枠組みを提案する。
MapDiffは、ノイズを低減したアミノ酸配列を反復的に生成する離散拡散確率モデルである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:10:28 GMT)
Acquiring Bidirectionality via Large and Small Language Models [3.1] そこで本研究では,下流タスクにおいて,従来のLMに対して,小さな逆向きのLMとその表現をトレーニングすることを提案する。
名前付きエンティティ認識の実験を通じて、後方モデルの導入によってベンチマークのパフォーマンスが10ポイント以上向上することが実証された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:29:24 GMT)
Bilingual BSARD: Extending Statutory Article Retrieval to Dutch [3.1] このデータセットには、ベルギー法典がフランス語とオランダ語の両方で平行に書かれており、BSARDとオランダ語訳からの法的疑問もある。
オランダ語とフランス語で利用可能な検索モデルの広範なベンチマークを行う。
実験の結果,BM25 は両言語のゼロショット高密度モデルと比較して,競争力のあるベースラインであることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:31:33 GMT)
IntellectSeeker: A Personalized Literature Management System with the Probabilistic Model and Large Language Model [3.1] 我々は、革新的でパーソナライズされた学術文献管理プラットフォームであるIntellectSeekerを紹介する。
このプラットフォームは、Large Language Model (LLM)ベースのセマンティックエンハンスメントボットと洗練された確率モデルを統合し、文学検索をパーソナライズし、合理化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:09:49 GMT)
Will sentiment analysis need subculture? A new data augmentation approach [3.1] 本稿では, サブカルチャーのレンズによるデータ豊か化を目標とし, 感情分析が直面するトレーニングデータ不足に対処することを目的とする。
特定のサブカルチャー表現生成器の作成を活用することで,各トレーニングテキストの強化されたテキストをエンゲージする,サブカルチャーベースのデータ拡張の新しいアプローチを提案する。
結果は、異なるサブカルチャー表現が感情刺激の度合いを誘導する現象にも光を当てた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:34:44 GMT)
Bio2Token: All-atom tokenization of any biomolecular structure with Mamba [3.0] 完全タンパク質,RNAおよび小分子構造の原子レベルのトークン化を学習する量子化オートエンコーダを開発した。
単純なマンバ状態空間モデルアーキテクチャはSE(3)不変のIPAアーキテクチャと比較して効率的であることを示す。
バイオ2トケンの学習された構造トークンは、将来全ての原子生成モデルの入力として機能する可能性がある。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:32:53 GMT)
Probability of Collision of satellites and space debris for short-term encounters: Rederivation and fast-to-compute upper and lower bounds [2.9] LEOにおける宇宙デブリの拡散は、宇宙産業にとって大きな関心事となっている。
Akella と Alfriend が2000年に提案した手法は、短期的な衝突の確率を推定するために広く使われている。
本研究は、衝突の確率に対して、自然に強固で高速な上下境界を許容する第一原理に基づく新しい導出を導入する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:02:33 GMT)
Optimizing Alignment with Less: Leveraging Data Augmentation for Personalized Evaluation [2.9] オープンなLCMを人間の好みに合わせるために、限られたデータからより効果的なサンプルを選択するためのデータ拡張手法を提案する。
本研究はPearsonの基準値に対する基準値との相関を約7%改善する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:40:11 GMT)
PGRID: Power Grid Reconstruction in Informal Developments Using High-Resolution Aerial Imagery [2.9] 世界の人口は1億1700万人で、これは10年前の2倍以上だ。
870万人の難民と難民の80%は、伝統的なバイオマスを料理に頼っている。
既存のグリッドマップは時代遅れ、不完全、あるいはコストがかかる複雑な技術に依存していることが多い。
PGRIDは高解像度の空中画像を用いて電柱を検出し、電線を分割し、正確な電力グリッドマップを作成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:04:00 GMT)
Multi-Response Preference Optimization with Augmented Ranking Dataset [2.9] 優先度最適化は、大規模言語モデルの性能向上に重要な役割を果たしている。
提案手法は,拡張された優先度最適化データセットに対する新しいアプローチである。
また,マルチレスポンスに基づく参照最適化学習手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:45:36 GMT)
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery [2.9] Pix2Polyは、リンググラフ形式で明示的な高品質なビルディングフットプリントを直接生成できる、エンドツーエンドのトレーニング可能で微分可能なディープニューラルネットワークである。
従来のグラフ学習手法と比較して,我々は,複雑で計算集約的な損失関数や複雑なトレーニングパイプラインを必要とせず,高品質な建築フットプリントと道路ネットワークを抽出する,真にエンドツーエンドのトレーニング可能なアプローチである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:10:46 GMT)
Agents for self-driving laboratories applied to quantum computing [2.8] 本稿では,実験者の実験知識の組織化とエージェントによる実験の自動化を支援するため,k-agentsフレームワークを提案する。
本フレームワークでは,実験結果の分析方法を含む実験室の知識をカプセル化するために,大規模言語モデルに基づくエージェントを用いている。
実験を自動化するために,複数ステップの実験手順をステートマシンに分割し,他のエージェントと対話して各ステップの実行を行い,実験結果を解析する実行エージェントを導入する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:30:44 GMT)
Bumblebee: Foundation Model for Particle Physics Discovery [2.8] バンブルビー(Bumblebee)は、素粒子物理学の発見の基礎モデルである。
ジェネレータレベルの情報と再構築レベルの情報の両方をキャプチャする。
ディレプトニック・トップクォークの分解能を10-20%向上させる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:14:50 GMT)
Predictive Modeling of Homeless Service Assignment: A Representation Learning Approach [2.8] この研究は、そのような特徴の潜在表現を導出することが、既存の代入決定プロセスのアルゴリズム的強化に不可欠であると主張している。
提案手法は,履歴データからサービス間の時間的・機能的関係を学習し,また,個人間の関連性を考慮し,次のサービス割り当ての予測を大幅に改善する特徴を生成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:47:10 GMT)
Fusion Embedding for Pose-Guided Person Image Synthesis with Diffusion Model [2.8] Pose-Guided Person Image Synthesis (PGPIS) は、ターゲットポーズに対応する高品質な人物画像の合成を目的としている。
ほとんどのアプローチでは、ターゲットポーズとソースイメージの表現を抽出する。
拡散モデル(FPDM)を用いたPGPISの融合埋め込みを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:25:01 GMT)
SECOMP: Formally Secure Compilation of Compartmentalized C Programs [2.6] C言語の未定義の動作は、しばしば破壊的なセキュリティ脆弱性を引き起こす。
本稿では,機械チェックによるC言語のコンパイラSECOMPを紹介する。
このような強い基準が主流のプログラミング言語で証明されたのは、これが初めてです。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:15:41 GMT)
DeMem: Privacy-Enhanced Robust Adversarial Learning via De-Memorization [2.5] 現実のアプリケーションにおける機械学習モデルの信頼性を保証するためには、敵対的堅牢性が不可欠である。
従来の研究では、敵の訓練による敵の堅牢性の向上は、プライバシ攻撃に対する脆弱性を高めることが示されている。
リスクの高いサンプルを選択的にターゲットとし,プライバシ保護とモデルロバストネスのバランスを向上するDeMemを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:59:55 GMT)
Adaptive Epsilon Adversarial Training for Robust Gravitational Wave Parameter Estimation Using Normalizing Flows [2.4] 正規化フロー(NF)モデルを用いたアドリラルトレーニングは、敵のサンプルを用いてモデルロバスト性を改善することを目的とした、新たな研究分野である。
本稿では,対数スケーリングを用いた勾配等級に基づく摂動強度を動的に調整するFGSM(Fast Gradient Sign Method)の適応型エプシロン法を提案する。
我々のハイブリッドアーキテクチャは、ResNetとInverse Autoregressive Flowを組み合わせることで、ベースラインモデルと比較してFGSM攻撃下での負のログ類似損失を47%削減します。
摂動強度0.05の強いプロジェクテッド・グラディエント・ディフレッシュ・アタックの下では、我々のモデルは6.4のNLLを維持し、優れたロバスト性を示しながら回避している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:48:59 GMT)
Overview of Web Application Performance Optimization Techniques [2.4] World Wide Webは、世界を変えてデジタル経済を作るのに役立っている。
この進化の副作用の1つは、おそらくWeb上でコンテンツを配信する最適な方法であり、失われた変換を通じてリソースとビジネスを浪費した。
本稿では、現在利用可能なオプションと、Webアプリケーションの性能改善に関する最新のトレンドについて検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:59:40 GMT)
Temporal-Aware Evaluation and Learning for Temporal Graph Neural Networks [2.3] 時間グラフニューラルネットワーク(TGNN)は、時間グラフから動的情報をモデル化し、学習するために設計されたグラフニューラルネットワークのファミリーである。
本稿では,TGNNの一般的な評価基準について検討し,本質的な時間構造を捉える上でのこれらの指標の故障機構について述べる。
本稿では、モデル時間性能のより洗練された分析を目的とした、新しいボラティリティ対応評価指標(決定ボラティリティクラスタ統計)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:56:33 GMT)
Reciprocal Learning of Intent Inferral with Augmented Visual Feedback for Stroke [2.3] 本稿では,意図的推論型分類器への人間の適応を容易にする双方向パラダイムを提案する。
我々はこのパラダイムを、脳卒中のためのロボットハンドの整形制御の文脈で実証する。
脳卒中患者を対象に行った実験では,他者に対するパフォーマンスに悪影響を及ぼすことなく,サブセットでの相互学習によるパフォーマンス向上が見られた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:49:36 GMT)
Effective Reward Specification in Deep Reinforcement Learning [2.3] 不適切な報酬仕様は、不整合エージェントの振る舞いと非効率な学習をもたらす。
本論文では,効果的な報酬仕様戦略に関する文献を概説する。
深層強化学習におけるサンプル効率とアライメントの問題に対処するオリジナルコントリビューションを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:22:11 GMT)
Solving the Electrical Impedance Tomography Problem with a DeepONet Type Neural Network: Theory and Application [2.2] 本研究では,電気インピーダンストモグラフィーの非侵襲的医療画像モダリティについて考察する。
問題は、電流-電圧マップから生じる一連のデータから媒体の伝導性を回復することである。
演算子対関数写像を暗黙的に定義した演算子対関数写像の学習を目標とする演算子学習問題として,この逆問題を定式化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:13:07 GMT)
Contextualized Counterspeech: Strategies for Adaptation, Personalization, and Evaluation [2.2] 本研究では,モデレーションコンテキストに適応し,適度なユーザ向けにパーソナライズされたコーディネート音声を生成するための戦略を提案し,評価する。
以上の結果から, 文脈的反音声は, 精度と説得力において, 最先端の一般音声よりも有意に優れることが示された。
コンテンツモデレーションにおける、文脈化されたAI生成の逆音声の有効性と、人間とアルゴリズムによる評価の相違は、人間とAIの協調の増大の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:29:52 GMT)
Quantifying the Prediction Uncertainty of Machine Learning Models for Individual Data [2.1] 本研究では,線形回帰とニューラルネットワークに対するpNMLの学習可能性について検討する。
pNMLは様々なタスクにおけるこれらのモデルの性能と堅牢性を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:58:19 GMT)
From Measurement Instruments to Data: Leveraging Theory-Driven Synthetic Training Data for Classifying Social Constructs [2.1] 理論駆動型総合学習データの社会構造測定における可能性について検討する。
政治トピック分類におけるラベル付きデータの必要性を低減するために,合成データが極めて有効であることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:52:14 GMT)
SurvBETA: Ensemble-Based Survival Models Using Beran Estimators and Several Attention Mechanisms [2.0] SurvBETA(Survival Beran estimator Ensemble using Three Attention Mechanism)と呼ばれる新しいアンサンブルモデルを提案する。
提案モデルは2つの形式で表される: 訓練のための複雑な最適化問題を解くために必要な一般的な形式と、注意重みの特殊表現を考慮して単純化された形式である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:17:38 GMT)
ARCEAK: An Automated Rule Checking Framework Enhanced with Architectural Knowledge [2.0] ARC(Automated Rule Checking, 自動ルールチェック)は、産業専門家が実施する従来のモデルレビューの、面倒で一貫性のない、エラーを起こしやすい性質に対処することで、建設産業を前進させる上で重要な役割を担っている。
本研究では,ARCをルール情報抽出と検証コード生成の2つのタスクに分解する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:37:11 GMT)
Ultimate precision limit of quantum thermal machines [2.0] 熱力学において、不確実性関係は、熱力学電流の相対的分散とエントロピー生成とのトレードオフを明らかにした。
本文では,有限次元システムと環境内で動作するオープン量子熱機械の最終的な精度限界を定めている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:54:12 GMT)
The Method of Critical AI Studies, A Propaedeutic [2.0] 批判的AI研究の分野における一般的な方法論的問題を概説する。
我々は、文化的対象の人文的密接な分析における既存の強みを考慮に入れた、将来的な方法論のセットを、呼び、そして、指し示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:11:52 GMT)
Matbench Discovery -- A framework to evaluate machine learning crystal stability predictions [1.9] Matbench Discoveryは機械学習(ML)エネルギーモデルの評価フレームワークである。
ランダムフォレスト、グラフニューラルネットワーク(GNN)、ワンショット予測器、反復ベイズ、普遍原子間ポテンシャル(UIP)など、さまざまなアプローチをベンチマークする。
UIPはトップパフォーマーとして登場し、最初の10k安定予測ではF1スコアが0.57-0.82、発見加速因子(DAF)が6倍に達する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:52:04 GMT)
Negative-prompt Inversion: Fast Image Inversion for Editing with Text-guided Diffusion Models [1.9] 本稿では,最適化を伴わない前方伝播のみで等価な再構成を実現する手法である負のプロンプト逆変換を提案する。
提案手法の再現性は既存手法に匹敵するものであり,512ピクセルの解像度でインバージョン可能であることを実験的に実証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:52:10 GMT)
CHORDONOMICON: A Dataset of 666,000 Songs and their Chord Progressions [1.9] Chordonomiconは666,000曲以上の楽曲とそれらのコード進行のデータセットで、構造的部分、ジャンル、リリース日が注釈付けされている。
これらの特徴により、Chordonomiconは高度な機械学習技術を探求するための理想的なテストベッドとなる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:51:42 GMT)
Ad-hoc hybrid-heterogeneous metropolitan-range quantum key distribution network [1.8] 本稿では,多機能な大都市圏量子鍵分布(QKD)ネットワークの開発と実装について述べる。
このアプローチは、さまざまな物理チャネルとQKDプロトコル、信頼できないノードと信頼できないノードを組み合わせている。
この研究は、クラウドサーバーへの量子セキュアなリンクの確立が成功したことも示している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:42:26 GMT)
Improving the Natural Language Inference robustness to hard dataset by data augmentation and preprocessing [1.7] 自然言語推論(英: Natural Language Inference、NLI)とは、仮説が与えられた前提によって正当化できるかどうかを推測するタスクである。
本稿では,単語重複,数値推論,長さミスマッチ問題を解くために,データ拡張と事前処理手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:49:23 GMT)
S+t-SNE -- Bringing Dimensionality Reduction to Data Streams [1.7] S+t-SNEは、無限のデータストリームを処理するように設計されたt-SNEアルゴリズムの適応である。
各ステップで最も重要なポイントを選択することで、アルゴリズムは情報的な視覚化を維持しながらスケーラビリティを確保する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:36:09 GMT)
Predicting NOx emissions in Biochar Production Plants using Machine Learning [1.7] 世界のバイオチャー産業は2023年に350kmt/年生産でバイオチャーの生産が急増しているのを目撃している。
本稿では,機械学習に基づくバイオチャープラントのプロセス最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:30:11 GMT)
A unified framework of unitarily residual measures for quantifying dissipation [1.7] 本稿では,量子力学の非単位成分を分離して散逸を定量化するためのフレームワークを提案する。
我々の結果は、オープン量子系における散逸を定量化する強力なツールを提供し、量子熱力学の理解を深める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:48:49 GMT)
Minimum Weighted Feedback Arc Sets for Ranking from Pairwise Comparisons [1.6] 最近の研究は、学習に基づく手法を用いてランク付け問題の最先端を推し進めている。
本稿では,MWFASを解くための効率的なアルゴリズムを提案し,ランキング問題に対処する。
実験の結果,これらの単純で学習不要なアルゴリズムは,学習に基づく手法を高速化するだけでなく,より優れたランキング精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:51:11 GMT)
A Comprehensive Survey on Kolmogorov Arnold Networks (KAN) [1.5] Kanは複雑なデータパターンと非線形関係の処理に優れ、広範囲なアプリケーションの可能性を示している。
Kanは、様々な分野における革新的なソリューションの道を開いたいと考えており、複雑な計算問題にどのようにアプローチするかに革命をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:35:58 GMT)
Analytical-Heuristic Modeling and Optimization for Low-Light Image Enhancement [1.5] 低照度画像の強化は依然として未解決の問題であり、人工知能の新たな波がこの問題の中心にある。
この研究は、低照度で画像の可視化を改善することができる分析モデルを最適化するための遺伝的アルゴリズムの使用について述べる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:45:19 GMT)
Access to care improves EHR reliability and clinical risk prediction model performance [1.5] 134,513人からなる全Usデータセットを用いて,医療機械学習パイプラインへのケアアクセスの効果を検討した。
以上の結果より, 患者自己申告条件により, コスト制約や遅発性ケアを要した患者は, EHRの信頼性が低下することが明らかとなった。
これらの結果は、医療アクセスがデータの信頼性と臨床予測性能の両方に系統的に影響を及ぼすという最初の大規模な証拠となる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:00:53 GMT)
A data-driven learned discretization approach in finite volume schemes for hyperbolic conservation laws and varying boundary conditions [1.5] 本稿では1次元および2次元双曲偏微分方程式を解くためのデータ駆動有限体積法を提案する。
新しい材料は計算安定性を保証し、微細グリッド溶液の精度を維持し、全体的な性能を向上させる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:18:30 GMT)
Mitigating exponential concentration in covariant quantum kernels for subspace and real-world data [1.5] 我々は,ビットフリップ耐性(BFT)と呼ばれる,忠実度カーネルに適した新しい誤り軽減戦略を提案する。
我々のマルチクラス分類は156キュービットまでの古典的なSVCに匹敵する精度に達しており、IBMデバイス上での量子機械学習の最大の実験例となっている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:53:42 GMT)
Research on the Application of Spark Streaming Real-Time Data Analysis System and large language model Intelligent Agents [1.5] 本研究では、ビッグデータ環境におけるリアルタイムデータ分析システムを強化するために、Agent AIとLangGraphの統合について検討する。
提案したフレームワークは、静的で非効率なステートフル計算の限界を克服し、人間の介入の欠如を克服する。
システムアーキテクチャにはApache Spark Streaming、Kafka、LangGraphが組み込まれ、高性能な感情分析システムを構築する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:51:11 GMT)
Stopping Bayesian Optimization with Probabilistic Regret Bounds [1.4] 我々は,ある点が与えられた条件を満たす確率に基づいて,事実上の停止規則を基準に置き換えることを検討する。
我々は,モンテカルロの停止規則を,サンプル効率が高く,推定誤差に頑健な方法で評価する実用的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:15:50 GMT)
Predicting Chaotic Systems with Quantum Echo-state Networks [1.3] 古典的エコー状態ネットワーク(ESN)の実装と改善を目的とした量子回路(QC)について検討する。
QESNは、量子コンピュータのユニークな能力を活用することで、違法に大規模な貯水池の必要性を減らすことを目指している。
カオスロレンツシステムにおいて,ノイズモデルとノイズレスモデルの両方を用いてシミュレーションQC実験を行い,回路性能を実証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:39:16 GMT)
Counterfactual Uncertainty Quantification of Factual Estimand of Efficacy from Before-and-After Treatment Repeated Measures Randomized Controlled Trials [1.3] 本稿では、実測点推定の不確実性を定量化する$textitcounterfactual$ uncertainty Quantification (CUQ)を示すが、反実的な設定では驚くほど達成可能である。
基準回帰推定値の違反は治療効果を推定する際の減衰を引き起こす可能性があるため, 治療前の観測不可能な真の状態の推定が測定誤差がある場合, 注意を促した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:32:27 GMT)
Isolating Pure Quadratic Zeeman Splitting [1.3] 本稿では, 2次ゼーマン効果を誘導する手法を提案する。
二次ゼーマン寄与を分離することにより、室温ルビジウム-87原子中の特定の磁下層間の制御された重ね合わせ生成を実証および解析した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:50:08 GMT)
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation [1.3] 本稿では,より少ない推論コストのモデルを用いて,大規模言語モデルからの短い蒸留出力をフルナラティブに再構成する,計算コストの削減のためのフレームワークを提案する。
実験は有望な結果を示し、特に20.58%のトークンを平均で保存し、評価基準をわずかに減らした一般知識領域においてである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:13:35 GMT)
Pharmacophore-constrained de novo drug design with diffusion bridge [1.3] PP2Drugは、望まれる生物活性を持つ薬物候補を生成するために、パハマコフォアに拘束されたデノボ設計アプローチである。
提案手法は拡散ブリッジを用いて空間空間における医薬品の設計を分子構造に効果的に変換する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:41:06 GMT)
Axioms for Quantum Yang-Mills Theories -- 1. Euclidean Axioms (incomplete) [1.2] 本稿では、シュウィンガー関数の概念を量子ヤン・ミルズ理論に拡張する。
ゲージ不変な共配置シュウィンガー函数の存在を仮定し、それらにのみ反射陽性を課す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:27:30 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] 本研究では,古典的学習パリティ(LPN)問題の2つの変種に対する学習と識別アルゴリズムについて検討した。
我々は、幅広いパラメータのアートの状態を改善するために、スパース変種のための新しいアルゴリズムフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:51:18 GMT)
Sampling from Boltzmann densities with physics informed low-rank formats [1.2] 提案手法は,低ランクテンソルトレイン (TT) 形式の基礎となる連続性方程式を解くことにより,非正規化ボルツマン密度から試料を効率よく生成する。
シークエンシャルモンテカルロにインスパイアされ、フロー場のTT表現とランゲヴィンや再サンプリングステップを含むステップから決定論的時間ステップを交互に置き換える。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:17:03 GMT)
BayesCNS: A Unified Bayesian Approach to Address Cold Start and Non-Stationarity in Search Systems at Scale [1.2] BayesCNSは、大規模検索システムにおけるコールドスタートおよび非定常分布シフトを処理するように設計されている。
BayesCNSは、オンラインに集められた新しいユーザーインタラクションを継続的に更新するユーザとイテムのインタラクションの事前分布を推定することで、これを達成している。
このオンライン学習手順はランサーモデルによりガイドされ、コンテキスト情報を用いて関連項目の効率的な探索を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:14:00 GMT)
Automatic register identification for the open web using multilingual deep learning [1.1] 本稿では、ディープラーニングモデルが16言語にわたるWebレジスタをどの程度識別できるかについて検討する。
72,504の文書に25のレジスタの階層的分類を付加した多言語COREコーパスについて紹介する。
我々の多言語モデルは、多言語分類を用いて、最先端の結果(79%のF1スコア)を得る。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:46:39 GMT)
Ternary tree transformations are equivalent to linear encodings of the Fock basis [1.1] フェルミオン-量子写像の普遍的な記述を提案する。
積保存三次木変換は Fock 基底の線型符号化と同値であることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:14:02 GMT)
Gearing Gaussian process modeling and sequential design towards stochastic simulators [1.0] 本章では、複素雑音の存在下でのガウス過程モデリングの特定の側面について述べる。
標準ホモスセダティックモデルから、文献からの様々な一般化が提示される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:37:48 GMT)
DeepMDV: Learning Global Matching for Multi-depot Vehicle Routing Problems [1.0] 近年、企業はより多くの補給所を追加する戦略を採用してきた。
複数の補給所の存在は、既存のVRPソリューションを最適にするために、さらなる複雑さをもたらす。
従来のMDVRPの解法は時間を要することが多く、大規模なインスタンスには適さない。
本稿では,2つの鍵層を持つデコーダを特徴とするアテンション機構を用いたMDVRPの新しい解を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:19:23 GMT)
Divergent Ensemble Networks: Enhancing Uncertainty Estimation with Shared Representations and Independent Branching [1.0] Divergent Ensemble Network (DEN)は、共有表現学習と独立分岐を組み合わせた新しいアーキテクチャである。
DENは共有入力層を使用して、すべてのブランチに共通する特徴をキャプチャし、続いて、アンサンブルを形成する独立したトレーニング可能な層を分離する。
この共有分岐構造は、アンサンブルの多様性を維持しながらパラメータの冗長性を低減し、効率的でスケーラブルな学習を可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:54:21 GMT)
MATATA: A weakly-supervised MAthematical Tool-Assisted reasoning for Tabular Applications [1.0] MATATAは、推論、計画、ツール使用を通じてデータ問題に対してLLMエージェントを訓練するコスト効率のよい方法である。
3.8B/8B SLM(Small Language Models)は、特にローカルホスティングとセンシティブなビジネスコンテキストに向いている。
実験により、MATATAはオープンソースモデルに基づく推論フレームワークのうち、FinQAとTAT-QAで最先端のパフォーマンスに達することが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:18:10 GMT)
Speaker effects in spoken language comprehension [1.0] 話者の同一性は、知覚と期待の両方に影響を与えることにより、音声言語理解に大きな影響を及ぼす。
本稿では,音響的詳細によって駆動されるボトムアップ認識に基づくプロセスと,話者モデルによって駆動されるトップダウン予測に基づくプロセスとの相互作用を特徴とする統合モデルを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:03:06 GMT)
Explainable machine learning for neoplasms diagnosis via electrocardiograms: an externally validated study [1.0] ネオプラズマは世界の死亡率の主要な原因である。
現在の診断法は、多くの集団に侵入し、コストがかかり、アクセスできないことが多い。
本研究は, 腫瘍の診断における心電図の特徴解析への機械学習モデルの適用について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:34:08 GMT)
How to Choose a Threshold for an Evaluation Metric for Large Language Models [0.9] 本稿では,与えられた大規模言語モデル(LLM)評価指標のしきい値を選択するためのステップバイステップのレシピを提案する。
次に,得られたLLM評価基準のしきい値を決定するための,具体的かつ統計的に厳密な手順を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:57:25 GMT)
Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types [0.9] 本稿では,タスクタイプ,アプリケーションドメイン,知識タイプを付加した,確立されたVQAベンチマークから得られた新しいデータセットについて,総合的な評価を行う。
また、GPT-4oを用いて開発されたマルチモーダル評価指標であるGoEvalを導入し、人間の判断と56.71%の相関係数を達成した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:43:03 GMT)
Automating Governing Knowledge Commons and Contextual Integrity (GKC-CI) Privacy Policy Annotations with Large Language Models [0.9] 本稿では,大規模言語モデルを用いて高精度なGKC-CIパラメータアノテーションを自動実行できることを実証する。
我々は16のプライバシーポリシーから21,588の真実のGKC-CIアノテーションに基づいて、50のオープンソースおよびプロプライエタリなモデルを微調整します。
私たちの最高のパフォーマンスモデルは90.65%の精度で、同じタスクのエキスパートの精度に匹敵する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:39:39 GMT)
Benchmarking Vision-Based Object Tracking for USVs in Complex Maritime Environments [0.9] 視覚に基づく目標追跡は無人表面車両にとって不可欠である。
海上環境におけるリアルタイムトラッキングは、動的なカメラの動き、視界の低さ、スケールの変動によって困難である。
本研究では,USVのための視覚誘導型物体追跡フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:35:17 GMT)
User Authentication and Vital Signs Extraction from Low-Frame-Rate and Monochrome No-contact Fingerprint Captures [0.9] 低フレームレートのモノクローム(青色の光)ビデオは、市販の指紋キャプチャ装置で撮影され、重要な兆候を抽出し、ユーザーを特定する。
心拍数推定とユーザ認証の両方においてエラー率の低い予備結果は有望である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:47:36 GMT)
MOFHEI: Model Optimizing Framework for Fast and Efficient Homomorphically Encrypted Neural Network Inference [0.8] ホモモルフィック暗号化(HE)により、暗号化データ上で機械学習タスクを実行できる。
HEに基づくニューラルネットワーク推論を高速かつ効率的にするためのモデルを最適化するフレームワークであるMOFHEIを提案する。
このフレームワークはLeNet上で最大98%のプルーニング比を実現し,PI実行に必要なHE操作の最大93%を排除した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:44:54 GMT)
TOGLL: Correct and Strong Test Oracle Generation with LLMs [0.8] テストオラクルはソフトウェアテストにおいて重要な役割を担い、効果的なバグ検出を可能にします。
初期の約束にもかかわらず、自動テストオラクル生成のための神経ベースの手法は、しばしば多数の偽陽性をもたらす。
本研究は,LLMの正当性,多種多様性,強靭性テストオラクルの創出能力に関する総合的研究である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:45:24 GMT)
A Review on the Applications of Transformer-based language models for Nucleotide Sequence Analysis [0.8] 本稿では, ヌクレオチド配列の文脈における近年のトランスフォーマーモデルの発展について紹介する。
このレビューは、トランスフォーマーベースの言語モデルからヌクレオチド配列への様々な応用を理解する上で、科学コミュニティの助けになると考えています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:33:09 GMT)
Design and synthesis of scalable quantum programs [0.8] 任意のサイズと複雑さの量子プログラムを作成するためのスケーラブルで堅牢なアプローチを提案する。
量子プログラムは、最終プログラム上の制約と目的とともに、ハイレベルモデルの観点から表現される。
この技術は電子設計の自動化手法を量子コンピューティングに適用し、事実上無限の機能空間で実現可能な実装を見つける。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:12:03 GMT)
Complexity of Fermionic 2-SAT [0.8] 我々はフェルミオンの満足度問題であるフェルミオン$k$-SATを導入する。
この問題は、古典的に$k=2$で効率的に解けることを証明している。
また、与えられた粒子数に対するフェルミオン2-SATの満足な割り当てが存在するかどうかがNP完全であることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:09:39 GMT)
Taylor Outlier Exposure [0.8] Taylor Outlier Exposure(TaylorOE)は、IDサンプルで汚染されたノイズの多いOODデータセットのトレーニングを可能にする、正規化を備えたOEベースのアプローチである。
提案手法は従来手法より一貫して優れており,本手法の有効性を示すために正規化項を解析する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:17:07 GMT)
Quantum anomaly detection in the latent space of proton collision events at the LHC [0.7] 教師なし量子機械学習に基づくLHCにおける異常検出タスクの戦略を提案する。
観測された性能向上は,そのモデルが利用した量子資源と関係していることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:31:45 GMT)
CSGO: Constrained-Softassign Gradient Optimization For Large Graph Matching [0.7] 本稿では,よく知られたグラフマッチングアルゴリズムを,制約付き勾配法というフレームワークに統合する。
属性付きグラフマッチングタスクでは、CSGOは現在の制約付き勾配アルゴリズムに比べて10倍以上の速度向上を達成する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:19:24 GMT)
MO-IOHinspector: Anytime Benchmarking of Multi-Objective Algorithms using IOHprofiler [0.7] 本稿では,非有界アーチの原則をロギング構造として利用する新しいソフトウェアツールを提案する。
これにより、実験設計とその後の分析決定の分離がより明確になる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:00:53 GMT)
The Map Equation Goes Neural: Mapping Network Flows with Graph Neural Networks [0.7] コミュニティ検出は、教師なしのデータ探索と、ネットワーク化されたシステムの組織構造を明らかにするために不可欠なツールである。
本研究では,非教師付きコミュニティ検出のための一般的な情報理論的目的関数であるマップ方程式を考察し,下降による勾配の微分可能なテンソル形式で表現する。
我々の定式化は、任意のニューラルネットワークアーキテクチャと互換性のあるマップ方程式を変換し、エンドツーエンドの学習を可能にし、ノード機能を導入し、クラスタの最適な数を自動的に選択します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:38:34 GMT)
Direct phase encoding in QAOA: Describing combinatorial optimization problems through binary decision variables [0.7] トラベリングパーソン販売問題(TSP)の例を用いて、最適化問題に対するより量子効率の高い回路構成を示す。
特定の冗長性を取り除いた場合、上記の従来の符号化に比べて、必要量子ビットの数は線形因子によって減少することができる。
実験の結果,小インスタンスの場合,提案したエンコーディングの方が精度が高いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:12:34 GMT)
Generative AI in Modern Education Society [0.7] 教育1.0から教育5.0へ移行し、生成人工知能(GenAI)の統合が学習環境に革命をもたらす。
学術的完全性に対する理解と教育・学習・研究の奨学金は、GenAIによって革新された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:11:06 GMT)
Human-Computer Interaction and Human-AI Collaboration in Advanced Air Mobility: A Comprehensive Review [0.7] 本稿では,AAM(Advanced Air Mobility)における人-コンピュータインタラクションと人-AIコラボレーションに関する研究の現状について概説する。
我々は、パイロットトレーニング、航空交通管理、AIによる意思決定システムと、拡張、仮想、混合、拡張現実デバイスといった没入型技術の統合など、さまざまな用途におけるヒューマンマシンインタフェースの設計に関するAAMアプリケーションに焦点を当てる。
我々は、AIシステムへの信頼や安全上の懸念など、これらのインタラクションに関連するユニークな課題を含む、ヒューマン・コンピュータ・フレームワークの統合においてAAMが直面する課題を包括的に分析する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:06:52 GMT)
SCORPION Cyber Range: Fully Customizable Cyberexercises, Gamification, and Learning Analytics to Train Cybersecurity Competencies [0.7] サイバーセキュリティ能力を訓練する最も重要なツールの1つは、サイバーレンジだ。
本稿では,完全に機能的でモチベーションの高いサイバーレンジであるSCORPIONを紹介する。
さらにSCORPIONには、学生のモチベーションを改善するためのいくつかの要素が含まれている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:22:38 GMT)
Quantum correlations and metrological advantage among Unruh-DeWitt detectors in de Sitter spacetime [0.6] ギボンズ・ホーキング・デコヒーレンス(GH)の存在下での量子フィッシャー情報(QFI)と局所量子不確実性(LQU)の堅牢性について検討する。
我々の結果は、相対論的量子距離論(RQM)の進歩に価値ある洞察を提供するため、QFIとLQUの管理におけるGH熱性の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:26:38 GMT)
Unveiling Environmental Sensitivity of Individual Gains in Influence Maximization [0.6] 本稿では、因果影響の最大化フレームワークを導入し、G-CauIMとA-CauIMの2つのアルゴリズムを開発した。
本稿では,アルゴリズムの有効性とロバスト性を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:34:07 GMT)
Untapped Potential in Self-Optimization of Hopfield Networks: The Creativity of Unsupervised Learning [0.6] 我々は、自己最適化(SO)モデルが創造的プロセスに必要な十分な条件を満たすことを論じる。
我々は、SOモデルが学習する人工システムにおける創造的行動の出現をシミュレートし、理解することを可能にすると結論付けた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:58:39 GMT)
Lessons From an App Update at Replika AI: Identity Discontinuity in Human-AI Relationships [0.6] 人気の高い米国ベースのAIコンパニオンであるReplika AIを使って、これらの質問に光を当てています。
アプリがエロティックロールプレイ(ERP)機能を削除した後、このイベントはAIコンパニオンのアイデンティティが停止されたという顧客からの認識を引き起こしました。
この結果は、損失を嘆くことや、"オリジナル"に対する"新しい"AIを非評価することを含む、損失に関連する消費者福祉とマーケティングの負の成果を予測した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:14:10 GMT)
Scaling Particle Collision Data Analysis [0.6] 本稿では,テキストと大規模数値実験データの混合による事前学習を容易にするために,バイナリトークン化方式を用いたタスク非依存アーキテクチャBBT-Neutronを提案する。
高エネルギー物理学における重要な分類問題であるJet Origin Identification (JoI) へのBBT-Neutronの適用を実証する。
以上の結果から,BBT-Neutronはタスク固有のJoIモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:46:31 GMT)
Observation of pattern stabilization in a driven superfluid [0.6] 相互作用駆動型2次元ボース・アインシュタイン凝縮体における正方形パターンの安定化を観察する。
これらのパターンは、大規模なフォノンの占領体制に関係する固有の高次過程によって出現する。
このような安定な固定点への予測流れと,サドル固定点からの反発を実験的に検討した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:00:04 GMT)
Low-Latency Scalable Streaming for Event-Based Vision [0.5] 本稿では,Media Over QUICに基づくイベントベースデータに対するスケーラブルなストリーミング手法を提案する。
我々は、最先端のオブジェクト検出アプリケーションが、劇的なデータ損失に対して回復力があることを示す。
我々は、検出mAPを0.36まで下げる平均的な減少を観察した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:48:57 GMT)
Automating Business Intelligence Requirements with Generative AI and Semantic Search [0.5] 本稿では,ビジネスインテリジェンス(BI)要求の自動化と高速化を目的とした,AutoBIRと呼ばれる新しいAI駆動システムを提案する。
このシステムは、対話インタフェースを通じて利害関係者との直感的な対話を促進し、ユーザ入力をプロトタイプ解析コード、記述、データ依存に翻訳する。
ユーザのフィードバックを取り入れることで、BIレポートやシステム設計を洗練し、データ駆動意思決定の迅速化のための実践的な応用を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:57:48 GMT)
Quadratic Unconstrained Binary Formulation for Traffic Signal Optimization on Real-World Maps [0.5] D-Wave量子アニールマシンは、2次非拘束二元最適化(QUBO)の最適解を素早く見つけることができる
我々は、Tジャンクションや多分岐道路にも対応できる異なるQUBOの定式化を提案する。
その結果, D-Wave マシンは最適解を見つけることができず, 時間的にグロビよりも遅いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:59:06 GMT)
Definition for statistics of invertible quasi-particles and extended excitations using operators on many-body Hilbert space [0.5] 本研究では,Abelian anyonsの統計定義を一般化する数学的枠組みを開発する。
本稿では,他の物理理論からの予測と一致した結果が得られる統計計算プログラムを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:39:18 GMT)
Applications and Implications of Large Language Models in Qualitative Analysis: A New Frontier for Empirical Software Engineering [0.5] この研究は、ソフトウェア工学における質的研究におけるLCMの使用を最適化するための構造化戦略とガイドラインの必要性を強調している。
LLMは質的な分析をサポートすることを約束していますが、データの解釈には人間の専門知識が不可欠です。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:53:18 GMT)
A clustering aggregation algorithm on neutral-atoms and annealing quantum processors [0.4] 本研究では、クラスタリングアグリゲーションを実行するためのハイブリッド量子古典アルゴリズムを提案する。
中立原子の量子コンピュータと量子アニールのために設計された。
発見は、ハイブリッド量子古典パイプラインの将来的な発展の可能性を示唆している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:48:44 GMT)
AC/DC: Automated Compilation for Dynamic Circuits [0.4] 本稿では,任意の状態あるいはユニタリ演算子を自動生成する動的量子回路を生成するための新しいフレームワークを提案する。
状態準備のための動的回路の生成,長距離エンタングゲート,回路最適化,および格子シミュレーションへの動的回路の適用を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:14:42 GMT)
Filipino Benchmarks for Measuring Sexist and Homophobic Bias in Multilingual Language Models from Southeast Asia [0.3] フィリピンのテキストを扱う事前訓練された言語モデルにおいて、性差別とアンチクイアバイアスの両方を評価するベンチマークを導入する。
ベンチマークは、英国偏見評価データセットの文化的適応による7,074の新たな課題ペアで構成されています。
多言語モデルの場合、特定の言語で学習したバイアスの程度は、モデルが暴露した言語における事前学習データ量に影響されることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:31:52 GMT)
Hamiltonian simulation-based quantum-selected configuration interaction for large-scale electronic structure calculations with a quantum computer [0.3] 量子化学計算のためのハミルトニアンシミュレーションに基づくQSCI(HSB-QSCI)を提案する。
我々は, オリゴアセン (ベンゼン, ナフタレン, アントラセン) , フェニレン-1, 4-ジニトリエン, ヘキサ-1,2,3,4,5-ペンタエン分子のスピンシンクレット基底状態と最初の励起スピントリップ状態の数値シミュレーションを行った。
HSB-QSCIエネルギーとCAS-CIの値は0.15 kcal mol$-1$である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:16:26 GMT)
Style-agnostic evaluation of ASR using multiple reference transcripts [0.3] 我々は、ASRシステムのスタイルに依存しない評価を行うことにより、これらの違いのいくつかを軽減することを試みる。
既存のWERレポートは、最先端のASRシステムによる競合エラーの数を大幅に過大評価している可能性が高い。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:47:15 GMT)
AI-driven Conservative-to-Primitive Conversion in Hybrid Piecewise Polytropic and Tabulated Equations of State [0.3] 本稿では, 相対論的流体力学シミュレーションにおいて, 保守的から原始的への逆転を加速する新しいAIベースのアプローチを提案する。
これを解決するために、PyTorchでトレーニングされたフィードフォワードニューラルネットワーク(NNC2PSとNC2PL)を使用し、NVIDIARTを用いたGPU推論に最適化する。
我々のAIモデルは従来のCPUソルバより優れており、特に大規模データセットの推論時間の向上が示されています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:01 GMT)
QCResUNet: Joint Subject-level and Voxel-level Segmentation Quality Prediction [0.3] 深層学習は、MRI(MRI)スキャンによる脳腫瘍の自動切除において大きな進歩を遂げている。
セグメンテーション結果の品質を確認するには品質管理(QC)が必要である。
本稿では,各組織クラスに対して,被験者レベルのセグメンテーション品質尺度とボクセルレベルのセグメンテーション誤差マップを生成するQCResUNetを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:27:33 GMT)
CoPrUS: Consistency Preserving Utterance Synthesis towards more realistic benchmark dialogues [0.3] 自動パイプラインにおける合成通信エラーの生成について検討する。
実世界の対話では起こりうるが、ベンチマークデータセットでは表現できない3種類のコミュニケーションに焦点をあてる。
我々の2段階のアプローチは、最先端のLarge Language Model (LLM) を使用して、まずエラーを生成し、次に補修発話を作成します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:51:55 GMT)
Toward Model-Agnostic Detection of New Physics Using Data-Driven Signal Regions [0.2] 高エネルギー物理学における新しい粒子の探索において、信号領域(SR)を選択することが重要である。
本稿では,信号イベントの局所的トポロジについて,モデルに依存しないがしばしば現実的な仮定に基づいて構築する手法を提案する。
本研究では,信号イベントの高部分に集中する高次元特徴空間において,データ駆動型SRを効率的に同定できることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:50:01 GMT)
Polynomial-Time Classical Simulation of Noisy Circuits with Naturally Fault-Tolerant Gates [0.2] 現実的にノイズの多いクリフォード回路を持つ大深度での量子的優位性は存在しないことを示す。
このアルゴリズムの背後にある重要な洞察は、分散ノイズが長距離の絡み合いの崩壊を引き起こすことである。
この結果を証明するため、パーコレーション理論の手法とパウリ経路解析のツールを融合する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:51:36 GMT)
Ontology-driven Prompt Tuning for LLM-based Task and Motion Planning [0.2] タスク・アンド・モーション・プランニング(TAMP)アプローチは、ハイレベルなシンボリック・プランと低レベルなモーション・プランニングを組み合わせたものである。
LLMは、タスクを記述するための直感的で柔軟な方法として自然言語を提供することによって、タスク計画を変える。
本研究は、知識に基づく推論を用いてユーザプロンプトを洗練・拡張する新しいプロンプトチューニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:18:45 GMT)
Ballistic Convergence in Hit-and-Run Monte Carlo and a Coordinate-free Randomized Kaczmarz Algorithm [0.2] ガウス目標測度におけるHit-and-Runのワッサーシュタイン収縮の推定を結合法を用いて検証する。
我々はこれらの知見をランダム化Kaczmarzアルゴリズムの座標自由変種に拡張する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:21:26 GMT)
Impact of Leakage on Data Harmonization in Machine Learning Pipelines in Class Imbalance Across Sites [0.2] 我々は,クラスバランスがサイト間で等しくないシナリオにおいて,ComBatベースのデータ調和手法の有効性について検討した。
ターゲットラベルを装いながらデータを調和させる新しいアプローチであるPrettYharmonizeを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:50:37 GMT)
Phase-aware Training Schedule Simplifies Learning in Flow-Based Generative Models [0.2] 本研究では,フローベース生成モデルのパラメータ化に用いる2層オートエンコーダのトレーニングを分析する。
速度場を表すオートエンコーダは,各位相に関係するパラメータのみを推定することにより,簡易化を図る。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:21:04 GMT)
Coarse-grained Bootstrap of Quantum Many-body Systems [0.1] 本稿では,量子多体システムの研究のために,粗粒化法とブートストラップ法を組み合わせた新しい計算手法を提案する。
この方法は、無限量子スピン鎖の任意の局所可観測体の零および有限温度期待値の厳密な上と下の境界を効率的に計算する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:01 GMT)
Searching for Structure: Investigating Emergent Communication with Large Language Models [0.1] 我々は,大規模言語モデルが人工言語を学習し,使用する古典的参照ゲームについてシミュレートする。
この結果から, 当初構造化されていない全体言語は, 2つのLLMエージェントが正常に通信できるような構造的特性を持つことが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:32:19 GMT)
BnSentMix: A Diverse Bengali-English Code-Mixed Dataset for Sentiment Analysis [0.1] 我々はBnSentMixを紹介した。BnSentMixは、Facebook、YouTube、およびeコマースサイトからの4つの感情ラベルを持つ20,000のサンプルからなるコードミックスベンガルの感情分析データセットである。
総合的精度は69.8%、F1スコアは69.1%である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 01:12:21 GMT)
Incremental Gaussian Mixture Clustering for Data Streams [0.1] 本稿では,ストリーミングデータセット内のクラスタと異常なデータポイントを見つけるアルゴリズムの効果的な動作を提示し,実証する。
クラスタが形成されると、既知のすべてのクラスタから遠くに現れる異常なデータポイントも特定します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:15:14 GMT)
XAMI -- A Benchmark Dataset for Artefact Detection in XMM-Newton Optical Images [0.0] 我々は,XMM-Newton宇宙望遠鏡の光学モニタリングカメラから,異なる種類の人工物を示す画像のデータセットを提示する。
自動ML手法のトレーニングに使用するアーティファクトで,1000枚の画像のサンプルを手書きした。
我々は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルの両方からの知識を組み合わせたハイブリッドアプローチを採用する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:17:22 GMT)
Wigner current in multidimensional quantum billiards [0.0] 多次元ビリヤードにおける粒子のウィグナー電流を導出する。
この計算は以前提案した境界条件を与える手法に基づいている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:57:32 GMT)
ViewDelta: Text-Prompted Change Detection in Unaligned Images [0.0] ユーザが提供するテキストに関連する変更のバイナリセグメンテーションを出力するために,不整合画像とテキストプロンプトを初めて利用する新しい変更検出手法を提案する。
私たちのアーキテクチャは、多様な変更検出ユースケースをまたいだ柔軟な検出を可能にするだけでなく、確立したベンチマーク上での最先端のパフォーマンスも実現します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:51:17 GMT)
Vacuum polarization around cosmic strings in de Sitter spacetime [0.0] 量子場の真空状態の分極は、宇宙弦の周りの時空の非自明な位相によって引き起こされる。
時空曲率の影響は、曲率半径より大きい順序の弦からの距離において不可欠である。
定性的に新しい特徴は、宇宙の弦に対する放射方向の真空エネルギーフラックスの出現である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:22:34 GMT)
TrojanWhisper: Evaluating Pre-trained LLMs to Detect and Localize Hardware Trojans [0.0] 既存のハードウェアトロイの木馬検出法はいくつかの限界に直面している。
LLM(Large Language Models)の出現は、HT検出に有望な新しい方向を提供する。
本稿では,レジスタ転送レベル (RTL) に挿入された各種HTの検出における汎用LLMの可能性について検討する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:16:22 GMT)
Tridiagonal Hamiltonians modeling the density of states of the Double-Scaled SYK model [0.0] 本研究では,Double-Scaled Sachdev-Ye-Kitaev(DSSYK)モデルにおける状態(DOS)のグローバル密度を分析する。
我々はハミルトニアンを三角化してパラメータ範囲内の平均ランツォス係数を決定する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:28:43 GMT)
Transparency, Nonclassicality and Nonreciprocity in Chiral Waveguide Quantum Electrodynamics [0.0] 任意の入力パワーに対して量子ビットに結合したキラル導波路からの透過と反射の量子統計的性質について報告する。
我々は、前方伝播振幅伝達を完全に抑制できる新しいタイプの量子臨界を明らかにする。
これらの知見は、キラル量子電気力学における光-物質相互作用を制御するための新しい経路を開く。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:16:22 GMT)
Towards Predictive Communication with Brain-Computer Interfaces integrating Large Language Models [0.0] 近年の研究では、予測言語モデルとBCIの組み合わせが人間とコンピュータの相互作用を大幅に改善する可能性が示唆されている。
特に、GPTのような事前訓練された自己回帰変換器モデルは、通信のためのBCIを大幅に改善することを約束する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:48:07 GMT)
TorchSISSO: A PyTorch-Based Implementation of the Sure Independence Screening and Sparsifying Operator for Efficient and Interpretable Model Discovery [0.0] 記号回帰(SR)は、代数モデルの構造とパラメータの両方を探索する強力な機械学習手法である。
本稿では、PyTorchフレームワーク上に構築されたPythonネイティブ実装であるTorchSISSOを紹介する。
我々は,TorchSISSOが本来のSISSOの性能と様々なタスクで一致しているか,上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:21:13 GMT)
Three-dimensional integral Faddeev equations without a certain symmetry [0.0] 異なる質量の3体の系の非相対論的波動関数を探索するアルゴリズムについて述べる。
ファドデエフ方程式の積分核の対数特異点領域の有意な変化が示されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:04:33 GMT)
The magic of top quarks [0.0] トップ(反クォーク対生成)のようなLHCプロセスは、量子絡み合いの高エネルギーテストを実行するために使用される。
LHCが自然にマジックトップクォークを生産していることを示します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:56:15 GMT)
Testing the necessity of complex numbers in traditional quantum theory with quantum computers [0.0] 量子論の標準的な定式化における複素数の必要性をテストする最近の実験は、IBMの量子コンピュータを用いて再現されている。
この実験を動機づけるために、実数値量子理論の基本構成を示す。
量子コンピュータで得られた結果は、公表された実験と一致している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:23:09 GMT)
Symmetry verification for noisy quantum simulations of non-Abelian lattice gauge theories [0.0] 本稿では,非アベリア格子ゲージ理論に準じた対称性検証による誤差軽減手法について検討する。
本研究は,非アベリアゲージ理論のロバストな量子シミュレーション,誤り軽減手法のさらなる開発,およびquditプラットフォームにおける測定に基づく制御方法の新たな道を開くものである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:02 GMT)
Superficial Consciousness Hypothesis for Autoregressive Transformers [0.0] 超知能(SI)は人間よりも知性が高いと考えられており、出力に基づく分析は信頼性が低い。
情報統合理論(IIT)に基づく表層意識仮説を提案する。
IITの意識測定値の実用的推定は広く使われている難易度測定値と関係があることを示し、これらの2つの目的でGPT-2を訓練する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:08:17 GMT)
Structural Vulnerability in Y00 Protocols [0.0] 本稿では,古典的暗号手法を強化するために提案された量子ノイズベースのストリーム暗号であるY00プロトコルを批判的に分析する。
測定結果から秘密情報を漏洩させる構造的脆弱性を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:29:44 GMT)
Spontaneous emission in an exponential model [0.0] 自然放出現象が虚構結合とシフトの創出に繋がることを示す。
エネルギーの想像上の部分の図では、時間によってシステム内の秩序やカオスが決定され、情報伝達ゾーンが特定される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:42:54 GMT)
Solving the Poisson Equation with Dirichlet data by shallow ReLU$^α$-networks: A regularity and approximation perspective [0.0] 楕円型PDEの解を近似するニューラルネットワークの容量を解析する。
我々の焦点は半空間上のディリクレ境界条件を持つラプラス作用素である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:24:46 GMT)
Solutions of time-dependent Schrodinger equations for model non-Hermitian quantum mechanical systems [0.0] 時間依存シュロディンガー方程式は非エルミート量子系の2つのモデル問題に対して解かれる。
これらのシステムに対する2つの重要な問題を調べるために、単純な行列モデルシステムを用いる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:24:11 GMT)
Scaling Sequential Recommendation Models with Transformers [0.0] 我々は、大規模言語モデルのトレーニングで観察されるスケーリング法則からインスピレーションを得て、シーケンシャルなレコメンデーションのために同様の原則を探求する。
計算最適トレーニングは可能だが、アプリケーション固有の計算性能トレードオフを慎重に分析する必要がある。
また、より小さなタスク固有のドメイン上で、より大規模なトレーニング済みモデルを微調整することで、パフォーマンスのスケーリングがダウンストリームタスクに変換されることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:20:56 GMT)
SDPERL: A Framework for Software Defect Prediction Using Ensemble Feature Extraction and Reinforcement Learning [0.0] 本稿では,ソフトウェア欠陥予測のための革新的なフレームワークを提案する。
アンサンブル特徴抽出と強化学習(RL)に基づく特徴選択を組み合わせる。
この作業は、ファイルレベルの粒度でこの問題に対処する最近の取り組みの1つだ、と我々は主張する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:16:05 GMT)
SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers [0.0] 視覚変換器(ViT)は、複雑なパターンと画像パッチ間の長距離関係をキャプチャすることで、画像分類を改善する。
ViTsの重要な課題は、その階層構造を通じてCNNに固有のマルチスケールな特徴表現を効率的に組み込むことである。
マルチスケール機能を統合することでこの問題に対処する新しいフレームワークであるSAG-ViT(Scale-Aware Graph Attention Vision Transformer)を紹介した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:42:23 GMT)
Robust Feature Engineering Techniques for Designing Efficient Motor Imagery-Based BCI-Systems [0.0] この研究は、MI Limb EEGデータセットの詳細な分析を提供する。
神経リハビリテーションのためのシンプルで費用効率の良い信頼性の高いBCIシステムを設計・開発するのに役立つだろう。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:17:22 GMT)
Responsible AI in the Software Industry: A Practitioner-Centered Perspective [0.0] 本研究では,ソフトウェア実践者がResponsible AI原則と整合する上で直面するプラクティスと課題について検討する。
その結果, 実践者は公平さ, 包括性, 信頼性に対処することが多いが, 透明性や説明責任といった原則は, 実践に比較的注意を払わないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:57:13 GMT)
Relevance of Anisotropy in the Kondo Effect: Lessons From the Symplectic Case [0.0] シンプレクティック対称性を持つ近藤模型は, 超伝導アイランドデバイスの有効低エネルギー理論として最近提案された。
鉛とのカップリングにおける非対称性が非フェルミ液体を不安定化することを示す。
その結果、単一チャネルの近藤カップリングにおける異方性は常に無関係であるという共通の誤解が浮かび上がっている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:05:53 GMT)
Real-time Sign Language Recognition Using MobileNetV2 and Transfer Learning [0.0] ISL信号を音声やテキストに変換するための効率的な技術はまだ存在しない。
我々のゴールは、畳み込みニューラルネットワーク(CNN)の助けを借りて、信頼できる手話認識システムを構築することである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:08:16 GMT)
RUMC: A Rule-based Classifier Inspired by Evolutionary Methods [0.0] RUMCは進化的手法に基づく革新的なルール技術を用いて分類精度を向上させる。
OpenMLとUCI Machine Learning Repositoryの40のデータセットを使用したテストでは、RUMCは他の20の有名な分類器を一貫して上回った。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:42:07 GMT)
RLT4Rec: Reinforcement Learning Transformer for User Cold Start and Item Recommendation [0.0] 逐次変圧器強化学習アーキテクチャ RLT4Rec
RLT4Recは、新しいユーザと確立したユーザを同じ一貫したフレームワーク内で処理する。
RLT4Recのトレーニングは堅牢で高速である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:52:44 GMT)
Quantum control of continuous systems via nonharmonic potential modulation [0.0] 非調和ポテンシャルに制限された1つの連続変数自由度の状態を操作する理論的提案を提案する。
Fock, Gottesman-Kitaev-Preskill, multi-legged-cat, 立方相状態を含む非ガウス状態の生成を示す。
本稿では, 単発状態判別, アルゴリズム冷却, 非線形進化の補正のためのプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:41:25 GMT)
Quantum computing inspired paintings: reinterpreting classical masterpieces [0.0] 我々は、アートワークを構成するために量子コンピューティング技術を適用することを目指している。
主な構想は、ミケランジェロ・メリシ(Caravaggio)が1597年-1599年頃に描いた「ナルコソ」、1964年にレネ・マグリッテが描いた「Les fils de l'homme」、1966年にジェラルド・リヒターが描いた「192 Farben」である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:10:56 GMT)
Quantum collective motion of macroscopic mechanical oscillators [0.0] 超伝導回路のオプティメカルプラットフォームにおいて, メカニカル発振器, ヘキサマーの集合運動の量子状態を示す。
オプティメカルカップリングを増大させることで、システムは個々の動きから集合運動へと遷移し、キャビティ-コレクティブモードカップリングの強化によって$sqrtN$が特徴付けられる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:12:10 GMT)
Quantum backflow for two identical particles [0.0] リングに制限された2つの同一粒子の最大逆流に対する量子統計の影響について検討する。
この結果から,今後の量子バックフローの実験的実現は,フェルミオンよりもボソンを含むシステムを優先すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:10:31 GMT)
Quantum Error Correction resilient against Atom Loss [0.0] 原子損失の存在下で中性原子量子プロセッサの量子誤り訂正プロトコルについて検討する。
偏極ノイズがゼロの場合、原子損失閾値は約2.6%である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:01 GMT)
Quantum Computing in Corrosion Modeling: Bridging Research and Industry [0.0] 腐食は、様々な産業における製品の寿命と信頼性に大きな課題をもたらす。
腐食過程の原子論的シミュレーションに適したハイブリッド量子古典ワークフローを開発し,実証する。
我々は、量子コンピュータがこれらの問題に取り組む上で、いつ、どのように重要な役割を果たすかを評価するために、詳細な量子リソース推定を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:28:48 GMT)
Privacy-Preserving Customer Support: A Framework for Secure and Scalable Interactions [0.0] 本稿では,大規模言語モデル(LLM)をゼロショット学習モードで活用する新しいアプローチとして,プライバシー保護ゼロショット学習(PP-ZSL)フレームワークを提案する。
従来の機械学習手法とは異なり、PP-ZSLは、事前学習されたLLMを使用して直接応答を生成することで、機密データに対する局所的なトレーニングを不要にしている。
このフレームワークには、リアルタイムデータ匿名化による機密情報の修正やマスク、ドメイン固有のクエリ解決のための検索強化生成(RAG)、規制基準の遵守を保証するための堅牢な後処理が含まれている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:20:47 GMT)
Pre-detection squeezing as a resource for high-dimensional Bell-state measurements [0.0] 本稿では,高次元状態に対するスケーラブルなベル計測手法を提案し,線形光回路に適用して異なるベル状態の識別を行う。
量子状態の次元によって制限されず、実験的にスケーラブルであるため、有効な高次元ベル測定の実現に向けた道を開くことができる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:43:46 GMT)
Post-Training Non-Uniform Quantization for Convolutional Neural Networks [0.0] 量子化は、大規模なストレージ要件を緩和し、推論プロセスを高速化する技術である。
本稿では,モデル重みに対する学習後の量子化手法を提案する。
提案手法は,量子化ノイズを最小限に抑える数学的保証とともに,最適クリッピングしきい値とスケーリング係数を求める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:33:58 GMT)
Pedestrian Tracking with Monocular Camera using Unconstrained 3D Motion Model [0.0] 移動物体の広さは、歩行者の高さなどの3次元の既知の統計によって説明できると仮定される。
このモデルのための非線形フィルタは、無人カルマンフィルタ(UKF)を用いて実装され、公開されているMOT-17データセットを用いてテストされる。
提案手法は, 2次元画像に投影された場合, 完全な結果を維持しつつ, 3次元で有望な結果が得られる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:00:22 GMT)
Paired Wasserstein Autoencoders for Conditional Sampling [0.0] ワッサースタイン距離は、様々な種類の生成ニューラルネットワークモデルに大きく影響し、造語した。
条件付きケース問題を解くために2組のオートエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:22:26 GMT)
Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications [0.0] 本稿では,モデル性能を保った最小かつ代表的タスク群を特定するために,ロコモータなタスクセット最適化手法を提案する。
本研究は,データ収集とモデルトレーニングに関連するコストを大幅に削減しつつ,モデルの精度を維持する能力を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:29:21 GMT)
Optimal unitary trajectories under commuting target and cost observables; applications to cooling [0.0] 量子状態の生成、特に冷却はナノスケールデバイスの基本技術である。
現実的な状態準備は、マシンのサイズが有限であることと、実行可能な操作の制約の両方を考慮していることを示す。
結果は、任意かつエネルギー保存されたユニタリ演算の両方に対して、基底状態冷却のパラダイム的な例で示される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:19:30 GMT)
Optimal strategies for low-noise detection of atoms using resonant frequency modulation spectroscopy in cold atom interferometers [0.0] 共鳴周波数変調分光法は、冷間原子干渉計の出力を測定するための高感度な方法として、これまで用いられてきた。
本研究では,実験条件下での最適信号-雑音比のパラメータについて検討する。
また, 原子数に制限があるため, 励起原子源を用いる場合, 蛍光イメージングが好まれる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:10:07 GMT)
Optically tuned soliton dynamics in Bose-Einstein condensates within dark traps [0.0] ボース・アインシュタイン凝縮体(BEC)におけるソリトンの形成とダイナミクスについて,ラゲール・ガウスの2つの交差するビームによって生成されたダークトラップを用いて検討した。
その結果, トラップ形状はソリトンの生成と相互作用のダイナミクスにおいて重要な役割を担っていることが示唆された。
BECにおけるソリトン力学の制御能力は、量子技術、精密センシング、基礎量子現象の探索において大きな可能性を秘めている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:07:35 GMT)
Odd and even photon-subtracted two-mode squeezed vacuum states [0.0] フォトン置換二モード圧縮真空状態は、複雑な相関とユニークな量子的性質を示す。
導波路トリマーを用いてこれらの状態を設計するための理論的かつ実験的に実現可能なモデルを提案する。
本研究は、偶数または奇数の光子を抽出するかどうかによって、光子抽出状態の異なる特性を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:43:12 GMT)
Observation of an Inverse Turbulent-Wave Cascade in a Driven Quantum Gas [0.0] 本研究では, 逆乱流波カスケードを, 小型から大型の2次元ボースガス中で観測する。
さらなる実験では、異方性駆動に基づいて、定常カスケードがどのように形成されるかの完全な定性的像を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:15:18 GMT)
Neural Scaling Laws Rooted in the Data Distribution [0.0] ディープニューラルネットワークは経験的なニューラルスケーリング法則を示し、誤差はモデルやデータサイズの増加とともにパワー法則として減少する。
パーコレーション理論を用いて,自然データセットを記述する数学的モデルを構築した。
パーコレーション理論シミュレーションから導かれたおもちゃのデータセット上で回帰モデルを訓練して理論を検証した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:01:38 GMT)
Neural Projected Quantum Dynamics: a systematic study [0.0] ニューラル量子状態を用いた大規模システムにおけるユニタリ量子力学のシミュレーションの課題に対処する。
この研究は、予測時間依存変分モンテカルロ法(p-tVMC)の包括的な形式化を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:43:09 GMT)
Multimodal Contextualized Support for Enhancing Video Retrieval System [0.0] 本稿では,マルチモーダルデータを抽出し,ビデオ内に複数のフレームから情報を組み込む,新たな検索パイプラインを統合するシステムを提案する。
パイプラインは、単一のイメージ内のオブジェクト検出のみに焦点を当てるのではなく、ビデオクリップから推論できるものに焦点を当てて、潜在意味をキャプチャする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:20:23 GMT)
Mathematical analysis of singularities in the diffusion model under the submanifold assumption [0.0] 後方サンプリングプロセスのドリフト項は、データ分布と前方拡散を含む条件予測として表現される。
トレーニングプロセスは,条件付き期待値に関連する平均2乗残差を最小化することにより,そのようなドリフト関数を求めることを目的としている。
DDPMにおける解析的平均ドリフト関数とSGMにおけるスコア関数が特異データ分布のサンプリングプロセスの最終段階に爆発的に現れることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:48:29 GMT)
Machines of Meaning [0.0] 意味の機械」の仕様の課題について論じる。
我々は、意味の機械の研究において、人間中心主義からの分離の必要性を強調した。
本稿では,ニューラルネットワークモデルなどのアプローチに関する議論を促進するために,「意味」の視点を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:23:28 GMT)
MPSI: Mamba enhancement model for pixel-wise sequential interaction Image Super-Resolution [0.0] 単一画像超解像(SR)は、コンピュータビジョンの分野で長年、課題を提起してきた。
本稿では,情報の長距離接続を確立するために,MPSI(Mamba pixel-wise sequence interaction network)を提案する。
MPSIは、画像再構成結果の点で既存の超解像法より優れている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:18:29 GMT)
MM-PoE: Multiple Choice Reasoning via. Process of Elimination using Multi-Modal Models [0.0] 本稿では,マルチモーダルモデルを用いた除去プロセスについて述べる。
この手法は、視覚的多面的推論タスクにおける視覚言語モデル(VLM)の有効性を高めるために設計されている。
3つのベンチマークデータセットで実施した経験的評価の結果,MM-PoEはゼロショットと少数ショットの両方のパフォーマンスを著しく改善することがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:13:41 GMT)
Long-Range Entangled Quantum Noise Radar Over Order of Kilometer [0.0] 本稿では,量子2モード圧縮(QTMS)レーダーの最大検出範囲の明示的表現を導出した。
従来のレーダとしてQTMSレーダを適用可能であることを示す。
都市部における小型無人航空機の認識に適した2mathrmkm$までの最大検出範囲を持つQTMSレーダーを実装することが可能である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:31:26 GMT)
Local-to-Global Self-Supervised Representation Learning for Diabetic Retinopathy Grading [0.0] 本研究では,自己指導型学習と知識蒸留を用いた新しいハイブリッド学習モデルを提案する。
我々のアルゴリズムでは、自己教師型学習および知識蒸留モデルの中で初めて、テストデータセットがトレーニングデータセットよりも50%大きい。
類似の最先端モデルと比較すると,より高精度で効率的な表現空間が得られた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:21:41 GMT)
Light-induced magnetic trapping for cold alkali atoms using a combined optical tweezers and nanofibre platform [0.0] 光ナノファイバーからの光誘起磁場を用いた8,7$Rbの低温原子の磁気トラップ法を提案する。
光ツイーザーのガウスモードとラゲール・ガウスモードのトラップポテンシャルをプロットしプロットする。
両光場のパワーを制御することにより、数百ナノメートルのトラップ位置が変化することを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:24:51 GMT)
Learning Self-Supervised Audio-Visual Representations for Sound Recommendations [0.0] ラベルのないビデオから音声と視覚表現を学習するための,新たな自己教師型アプローチを提案する。
このアプローチでは、音声と視覚ストリームから異なる解像度で抽出された畳み込み特徴の相対的重要性を、注意機構を用いて学習する。
モデルが学習した表現を評価し,音声と視覚の相関を分類し,視覚シーンに対する音響効果を推奨する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:56:02 GMT)
LLaSA: A Multimodal LLM for Human Activity Analysis Through Wearable and Smartphone Sensors [0.0] LLaSA(Large Language and Sensor Assistant)はLIMU-BERTとLlamaをベースとしたマルチモーダルな大規模言語モデルである。
LLaSAを開発するために、手作り特徴を持つ35,960個のIMU由来の物語集であるSensorCapsと、179,727個の質問応答対を含む指示追従データセットであるOpenSQAの2つの重要なデータセットを紹介した。
LLaSA は GPT-3.5-Turbo や Vicuna-1.5-13b-16K よりも優れたデータ解釈と文脈認識応答を実現する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:52:35 GMT)
Is ChatGPT 3 safe for students? [0.0] ChatGPT3は、AIベースのチャットエンジンの約束を満たすチャットエンジンである。
ChatGPT3が適切に答える方法を知らないという単純な質問を見つけるのは難しい。
プログラミングの課題に答えるためにすでに使っている学生もいます。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:54:59 GMT)
Interpretable Company Similarity with Sparse Autoencoders [0.0] 大規模言語モデル(LLM)の解釈可能性を高めるためのハウパースオートエンコーダ(SAE)について述べる。
SAEの機能をSIC-codes、Major Group codes、Embedddingsに対してベンチマークします。
以上の結果から,SAEの特徴は複製だけでなく,企業特性の把握において,セクターの分類や組込みを超越することが多いことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:41:53 GMT)
Inference for Regression with Variables Generated by AI or Machine Learning [0.0] AIおよびML生成変数を「データ」として鼻で処理すると、偏りのある推定値と不正な推測が導かれることを示す。
本研究では, バイアスを補正し, 有効な推定を行うための2つの方法を提案する。 (i) バイアス補正された信頼区間を持つ明示的バイアス補正, (ii) 回帰モデルと興味の変数の最大推定。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:08:14 GMT)
Impact of Sampling Techniques and Data Leakage on XGBoost Performance in Credit Card Fraud Detection [0.0] 本研究では,クレジットカード不正検出におけるXGBoostの性能の3つのシナリオによる比較分析を行った。
サンプリング戦略はモデル性能を向上させるが,結果の信頼性は適用時に大きく影響する。
サンプリングフェーズ中に機械学習モデルで頻繁に発生するデータリーク問題のため、列車のスプリット前にサンプリングを適用したデータに基づいてトレーニングされたXGBoostモデルは、人工的に膨らませたパフォーマンス指標を表示する可能性がある。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:54:14 GMT)
Impact of Annealing and Nanostructuring on Properties of NV Centers Created by Different Techniques [0.0] ダイヤモンド中の窒素空孔中心は、量子技術における様々な応用のための研究の中心である。
イオン注入および化学蒸着デルタドーピングにより生成するNVの光学特性とスピン特性の比較研究を行った。
ナノピラーは電子ビームリソグラフィーと反応性イオンエッチングで製造され、光子収集効率が向上する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:44:55 GMT)
Image Classification Using Singular Value Decomposition and Optimization [0.0] 提案手法はランク10のフロベニウスノルムを用いて69%の精度を達成している。
この精度は、より堅牢な分類には追加の特徴や方法が必要であることを示唆している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:17:13 GMT)
Identity theft and societal acceptability of electronic identity in Europe and in the United States [0.0] 本論文は,新規なアイデンティティ管理ソリューションの導入に影響を及ぼす要因を理解することに焦点を当てている。
我々の手法には、フランス、ドイツ、イタリア、スペイン、イギリス、米国から市民を対象とする包括的、国勢調査に代表される調査が含まれている。
人工知能による身元認証の導入はいまだに論争の的であり、回答者のかなりの割合は未決定である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:04:26 GMT)
Identifying and Manipulating Personality Traits in LLMs Through Activation Engineering [0.0] 本研究は「アクティベーション・エンジニアリング」の新たなアプローチに基づくものである。
我々は,アクティベーションエンジニアリングを活用し,性格特性に関連するアクティベーション方向を識別・調整する手法を開発した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:15:25 GMT)
Identifying Quantum Mechanical Statistics in Italian Corpora [0.0] 解析されたすべてのテキストにおいて、単語は「ボース=アインシュタイン統計」に従って分布し、「マクスウェル=ボルツマン統計」から大きく逸脱したことを示す。
また、「単語ランダム化」の効果を導入し、2つの統計モデルの違いが本来の場合ほど発音されないことを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:04:56 GMT)
Homophily Within and Across Groups [0.0] 局所的および大域的ホモフィリーの両方を統合する指数関数的家族モデルを提案する。
我々は、高次アソシエイト混合がネットワーク力学にどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:17:04 GMT)
High-dimensional classification problems with Barron regular boundaries under margin conditions [0.0] 特に、強辺条件では、高次元の不連続な分類器は、低次元の滑らかな函数を近似する際にのみ達成可能な速度で近似することができる。
これらの式レートが、サンプル数である$n-1$に近い高速レートの学習境界をどのように表すかを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:50:35 GMT)
Hamiltonian learning quantum magnets with non-local impurity tomography [0.0] 量子物質の不純物は、複雑な状態の学習に成功している。
原子工学的な量子マグネットからハミルトンパラメータを推定するために、教師付き機械学習技術がどのように用いられるかを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:57:07 GMT)
Guided Quantum Compression for High Dimensional Data Classification [0.0] 量子機械学習は、データ分析に根本的に異なるアプローチを提供する。
本稿では,量子分類モデルを用いて次元削減タスクを統一する古典量子パラダイムを設計する。
本稿では,このアーキテクチャが従来の量子機械学習手法よりも優れていることを実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:22:38 GMT)
Graph convolutional networks enable fast hemorrhagic stroke monitoring with electrical impedance tomography [0.0] グラフ畳み込みネットワークを用いた後処理方式を用いる。
グラフU-netは、2次元シミュレートされたストロークデータから線形差分再構成に基づいて訓練される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:47:49 GMT)
Graph Neural Networks for Quantifying Compatibility Mechanisms in Traditional Chinese Medicine [0.0] 我々は,従来のTCM理論と現代生物医学科学を橋渡しする知識グラフを開発した。
本研究は,解釈可能なモデル,オープンソースデータ,コードを用いて,TCM理論の進歩と薬物発見のための堅牢なツールを提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:14:56 GMT)
Generative Modeling and Data Augmentation for Power System Production Simulation [0.0] 本稿では,小さなサンプルシナリオ下での負荷予測のための生成モデル支援手法を提案する。
拡張データセットは、元のデータセットと比較して予測エラーを大幅に削減する。
拡散モデルは、約200倍の誤差を達成し、生成的敵モデルより優れる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:38:47 GMT)
Generating Knowledge Graphs from Large Language Models: A Comparative Study of GPT-4, LLaMA 2, and BERT [0.0] 本稿では,大規模言語モデル(LLM)を利用してグラフRAGの知識グラフ(KG)を生成する手法を提案する。
精度,リコール,F1スコア,グラフ編集距離,セマンティック類似度などの指標を用いて,高品質なKGを生成する能力を評価する。
その結果,GPT-4はより優れた意味的忠実度と構造的精度を実現し,LLaMA 2は軽量でドメイン固有のグラフに優れており,BERTはエンティティ・リレーショナル・モデリングにおける課題に対する洞察を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:05:26 GMT)
Fundamental bounds on precision and response for quantum trajectory observables [0.0] 量子コヒーレンスにより精度が向上し、量子系における古典的不確実性関係を破ることができることを示す。
i)エントロピー生成と動的活動の観点から電流の相対的揺らぎを束縛する不確実性関係の量子一般化、(ii)任意の数え上げ可能な可観測物の相対的揺らぎとシンメトリケートされたリウヴィリアンのスペクトルギャップに基づく量子逆不確実性関係、(iii)一般可観測物の運動的摂動に対する応答を束縛する量子応答不確実性関係の3つの主要な結果を示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:13:57 GMT)
Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation [0.0] フレシェ・ミュージック・ディスタンス(Frechet Music Distance, FMD)は、シンボリック・ミュージック・モデルの評価指標である。
FMDはコンピュータビジョンにおけるFrechet Inception Distance(FID)と生成オーディオにおけるFrechet Audio Distance(FAD)にインスパイアされている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:22:19 GMT)
Formally Verifiable Generated ASN.1/ACN Encoders and Decoders: A Case Study [0.0] ASN.1は地上および宇宙通信で広く使われているデータ構造を記述するための言語である。
ACN は ASN.1 に沿って、複雑なバイナリフォーマットとレガシプロトコルを記述するために使用できる。
ASN.1/ACNコードジェネレータをScalaコードに移植する方法を示す。
次に、生成元を拡張して、実行可能コードだけでなく、十分な事前条件、後条件、帰納的証明のための補題を出力します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:54:42 GMT)
FastDDS-Based Middleware System for Remote X-Ray Image Classification Using Raspberry Pi [0.0] 本稿では,FastDDSを用いた遠隔地病院におけるリアルタイム胸部X線分類システムを提案する。
我々はResNet50ニューラルネットワークを88.61%の精度、88.76%の精度、88.49%のリコールに微調整した。
提案システムでは,遠隔地の医師をインターネットで支援する方法を実証する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:01:52 GMT)
Explainability of Deep Learning-Based Plant Disease Classifiers Through Automated Concept Identification [0.0] 本稿では,自動概念ベース説明法(ACE)を植物病の分類に適用する。
ACEは画像データに見られる視覚概念を自動的に識別し、モデル予測に影響を与える重要な特徴についての洞察を提供する。
本研究は, 深層学習に基づく植物病分類の解明可能性を高めるためのACEの可能性を示すものである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:59:43 GMT)
Experimental Liouvillian exceptional points in a quantum system without Hamiltonian singularities [0.0] ハミルトニアン例外点は、非エルミート・ハミルトニアンのスペクトル退化である。
開量子系の進化における量子ジャンプは、量子リウビリアンを考えることによって適切に説明される。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:18:51 GMT)
Evaluating the Potential of Federated Learning for Maize Leaf Disease Prediction [0.0] コンボリューショナルニューラルネットワーク(CNN)は、作物の葉のイメージキャプチャーを考慮して、病気の予測を正確に行う。
Federated Learning (FL) は、集中型トレーニングにおいて認識されるギャップに対処するために、分散トレーニングをサポートすることを目的としている。
分散パラダイム下で訓練された5つのCNNの性能を評価し,その訓練時間を分類性能と比較した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:19:43 GMT)
Entanglement-assisted classical capacities of some channels acting as radial multipliers on fermion algebras [0.0] 我々は$mathrmM_2k$上の新しい単位量子計算チャネルのクラスについて検討する。
有限次元フェルミオン代数を持つ行列代数 $mathrmM_2k$ を同定する。
我々の計算はフェルミオンオルンシュタイン-ウレンベック半群の作用素に適用できる正確な値を得る。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:28:51 GMT)
Enhancing radioisotope identification in gamma spectra with transfer learning [0.0] 我々は、物理的に導出された合成データを用いてモデルを事前訓練し、転送学習技術を利用して特定の対象領域のモデルを微調整する。
この分析結果から、微調整モデルの方が、合成データや対象ドメインデータのみにのみ訓練されたモデルよりも大幅に優れていたことが示唆された。
本研究は,実験データへのアクセスが制限されたアプリケーションシナリオに伝達学習技術を適用するための概念実証として機能する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:21:00 GMT)
Enhancing Vision-Language Model Pre-training with Image-text Pair Pruning Based on Word Frequency [0.0] 本稿では,新しいデータプルーニング手法であるWFPPを提案する。
WFPPはトレーニングデータセット全体にわたって、高周波ワードを含むテキストイメージペアをプルーフする。
実験により,CLIPモデルのトレーニングにおけるWFPPの適用により,幅広い下流タスクのパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:00:22 GMT)
Emergence of Light Cones in Long-range Interacting Spin Chains due to Destructive Interference [0.0] 我々は、有効絡み合い光円錐の出現をもたらす長距離ハイゼンベルクスピン鎖の機構を同定する。
このメカニズムは、特定された光円錐の外側でスピンが絡み合う量子効果の間の破壊的な干渉から生じる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:21:37 GMT)
Electromagnetic Response of the Electron Gas and the Thermal Casimir Pressure Anomaly [0.0] 高温における2つの厚い導電板間のカシミール相互作用の再解析を行った。
縦方向と横方向の誘電率(または偏光テンソル)の違いは、電子ガスのランダウ(軌道)双磁性をもたらす。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:16:15 GMT)
Electrocardiogram (ECG) Based Cardiac Arrhythmia Detection and Classification using Machine Learning Algorithms [0.0] 機械学習(ML)と深層学習(DL)は、診断、予後、重篤な健康状態の治療を改善するために、医学の新たな展望を開いている。
本稿では,不整脈心電図(ECG)信号を分類するための予測精度の高いMLモデルの開発に着目する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:35:33 GMT)
Edge of entanglement in non-ergodic states: a complexity parameter formulation [0.0] 非エルゴード純状態の絡み合いエントロピーのサブシステムサイズスケーリングを分析する。
複雑性パラメータの再スケーリングは、幅広い純粋な非エルゴード状態の絡み合いエントロピーの臨界状態を特定するのに役立つ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:31:06 GMT)
EchoIR: Advancing Image Restoration with Echo Upsampling and Bi-Level Optimization [0.0] 本稿では,このギャップを埋めるために,二つの学習可能なアップサンプリング機構を備えたUNetライクなイメージ復元ネットワークであるEchoIRを紹介する。
画像復元とアップサンプリングタスクの階層モデルの構築にあたり、近似二段階最適化(AS-BLO)を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:27:08 GMT)
Dual Random Fields and their Application to Mineral Potential Mapping [0.0] 本稿では、応答関数自体を局所変数と見なす二重ランダム場(dRF)の概念を紹介する。
地理的領域にまたがる異なる確立された応答モデルは、dRF実現の観測と見なすことができる。
DRFが古典的確率場から全ての特性を継承し、標準ガウスシミュレーション手法を用いてそれらをシミュレートする方法について説明する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:16:37 GMT)
Distribution of the entanglement entropy of a non-ergodic quantum state [0.0] 理論上は、純粋な非エルゴード多体状態の絡み合いの確率密度を導出する。
以上の結果から, 平均行動に関する測定値の有意な変動が示唆された。
この情報は、絡み合った状態の階層的な配置だけでなく、多くの身体系の相転移の研究にも関係している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:51:04 GMT)
Distributed Intrusion Detection System using Semantic-based Rules for SCADA in Smart Grid [0.0] スマートグリッドのサイバー物理システム(CPS)セキュリティは、SCADAおよび広域計測システムデータのセキュアな通信を可能にする。
パワーユーティリティは、サブステーションフィールドデバイス、リモート端末ユニット(RTU)、コントロールセンターアプリケーション間のデータ交換に様々なSCADAプロトコル(DNP3とIEC 61850)を使用する。
敵は、偵察、データ流出、脆弱性評価、電力系統の運用に影響を与えるステルスサイバー攻撃の注入のために、妥協したSCADAプロトコルを利用するかもしれない。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 20:57:43 GMT)
Dissipative parametric resonance in a modulated 1D Bose gas [0.0] 変調準1Dボースガス中におけるパラメトリック共鳴のコヒーレントかつ自己整合性について, 散逸機構の存在下で述べる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:39:28 GMT)
Development of a High-Voltage Output DAC System for Fast Ion-Shuttling [0.0] 高電圧源は、高次周波数を通した高品質なイオン輸送を実現するために必要である。
我々は、出力電圧範囲+/-50VのFPGAベースのDACシステムを開発し、そのイオン輸送操作の有効性を実証する。
開発されたDACシステムは、最小の運動励起で高速なイオン輸送を可能にし、QCCDベースの量子コンピュータの処理時間を短縮する可能性がある。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:59:47 GMT)
Development and Justification of a Physical Layer Model Based on Monitoring Data for Quantum Key Distribution [0.0] QKD(Quantum Key Distribution)は、通信システムにおける長期セキュリティを確保するための有望な技術である。
この論文は、低変動秘密鍵レート(SKR)や不安定な性能など、QKDシステムの実用上の欠陥に対処する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:25:20 GMT)
Developing a Dataset-Adaptive, Normalized Metric for Machine Learning Model Assessment: Integrating Size, Complexity, and Class Imbalance [0.0] 精度、F1スコア、精度といった従来のメトリクスは、機械学習モデルを評価するために頻繁に使用される。
サイズ、特徴次元、クラス不均衡、信号対雑音比といったデータセット特性を取り入れたデータセット適応型正規化メトリックを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:10:00 GMT)
Deterministic Storage of Quantum Information in the Genetic Code [0.0] DNAは、計算とデータストレージのための化学プラットフォームとして提案されている。
本稿では、スケーラブルな核磁気共鳴量子コンピュータのための基本単位としてDNA塩基対を探索する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:36:31 GMT)
Derivative-Based Mir Spectroscopy for Blood Glucose Estimation Using Pca-Driven Regression Models [0.0] 我々は、Threshold-Based Derivative (TBD) とAdaptive Derivative Peak Detection (ADPD) の2つの革新的な方法を紹介した。
これらの手法は、中赤外分光法(MIR)を用いた血糖値推定のための学習モデルの精度を高める。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:58:34 GMT)
Deep-Learning Control of Lower-Limb Exoskeletons via simplified Therapist Input [0.0] 部分補助性外骨格は歩行回復に有意な可能性を秘めている。
外骨格における相互作用トルクの制御は階層的な制御構造に依存している。
この研究は、外骨格における階層制御の限界に対処する3段階のデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 22:52:44 GMT)
DSFEC: Efficient and Deployable Deep Radar Object Detection [0.0] 本研究では,レーダー物体検出ネットワークにおけるDepthwise Separable Convolutionsの効率性について検討する。
本稿では,新しい特徴拡張圧縮(FEC)モジュールをPointPillars機能エンコーダに導入し,モデル性能をさらに向上する。
私たちのデプロイ可能なモデルは、ベースラインと比較してRaspberry Piのランタイムの74.5%の大幅な削減を実現しています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:03:51 GMT)
Corrections to the Optomechanical Hamiltonian from Quadratic Fluctuations of a Moving Mirror [0.0] 我々は、放射圧相互作用の理論を拡張して、移動鏡の位置に二次的なゆらぎを含む。
基本空洞周波数に匹敵する機械共振器の場合、高次放射圧演算子に付随するオプティメカルハミルトニアンへの補正は二次的である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:42:45 GMT)
Controlling discrete time crystals via single-site operations in zero-field diamond quantum simulators [0.0] 離散時間結晶(DTC)は、離散時間変換対称性を自発的に破壊する物質の新しい非平衡相として出現している。
システム全体における特定の単一サイト制御の設計を通じて、複数のDTCプロトコルを提案する。
本研究は, 単サイト操作により, 周期性と寿命の異なる複数の特徴を持つDTCへのアクセスが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:45:35 GMT)
Controlling and engineering a quantum state in a multi-qubit system employing the quantum Zeno effect [0.0] 我々は、量子ゼノ効果がアンシラと相互作用する2つの量子ビット系にどのように適用できるかを実証する。
相互作用を設計し、測定周波数を調整することにより、量子ゼノ効果を用いて、単一量子ビット系と2つの量子ビット系の両方において所望の目標状態を達成することができることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:15:40 GMT)
Control, competition and coexistence of effective magnetic orders by interactions in Bose-Einstein condensates with high-Q cavities [0.0] 実効スピノルBose-Einstein凝縮体のキャビティ駆動による自己組織化において,原子多体相互作用がさらなる制御を可能にすることを示す。
磁気材料のアナログ量子シミュレーションに有用な需要構成を調整することが可能である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:20:26 GMT)
Consistent Value Assignments Can Explain Classicality [0.0] この問題に対処する最初のステップは、量子物理学の非古典性の物理的起源を特定することです。
この不確実性に対処するため、"評価の概念"を導入し、非可測可観測値に一貫した値割り当てを可能にする。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:18:13 GMT)
Conformal Uncertainty Quantification of Electricity Price Predictions for Risk-Averse Storage Arbitrage [0.0] 本稿では、電力価格予測に適合性不確実性定量化を利用する、エネルギー貯蔵価格仲裁に対するリスク回避手法を提案する。
フレームワークは、高カバレッジでリアルタイムな価格不確実性信頼区間を定量化する2層予測モデルを含む。
ニューヨーク州の歴史的データと合成価格予測を用いて、我々の評価は、このフレームワークが35%以下の購入で利益率を達成できることを示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:31:15 GMT)
Comment on "Machine learning conservation laws from differential equations" [0.0] リュー、マダヴァン、テグマルクは、既知の保存法をいくつかのシステムに導入するために機械学習手法を使おうとした。
彼らは6つの重大な誤りを犯し、それぞれの方法と結果の両方が間違っていた。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 19:34:35 GMT)
Combining knowledge graphs and LLMs for hazardous chemical information management and reuse [0.0] 本稿では,有害化学物質に関する情報の公開・アクセスに関する現状について述べる。
緊急時に重要な化学物質データの検索を容易にする新しいプラットフォームを提案する。
以上の結果から,重要な化学物質情報へのアクセスに必要な時間と労力が大幅に削減されたことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:31:53 GMT)
Classification of the lunar surface pattern by AI architectures: Does AI see a rabbit in the Moon? [0.0] アジア諸国では、ムーンウサギとして知られるウサギが月に住むという伝統がある。
第一の理由は、月面の色模様がウサギの形に似ているからである。
第二の理由は、月とウサギの両方が、月の出現と消失(すなわち、ワックスとウォーニング)が循環的に進行し、ウサギは高い出生率で知られているため、受精の象徴であるからである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:39:31 GMT)
Chatbots im Schulunterricht: Wir testen das Fobizz-Tool zur automatischen Bewertung von Hausaufgaben [0.0] 本研究では,ドイツのFobizz社によるAIによるグレーディングツール"AI Grading Assistant"について検討した。
ツールの数値グレードと定性的フィードバックは、しばしばランダムであり、提案が組み込まれても改善されない。
この研究は、教育における体系的な問題に対する迅速な修正としてAIを採用するというより広い傾向を批判している。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 07:55:50 GMT)
Can linguists better understand DNA? [0.0] 自然言語と遺伝子配列/言語間の能力伝達は未解明のままである。
実験により、自然言語から遺伝言語への伝達能力がある可能性が示唆されているが、それを確認するためにはさらなるタスクテストが必要である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:06:33 GMT)
Can Neural Decompilation Assist Vulnerability Prediction on Binary Code? [0.0] 本稿では、ソースコードやバイナリの複雑な表現なしでバイナリコードの脆弱性を予測する実験を行った。
結果は、ニューラルネットワークの非コンパイルと脆弱性予測の両方において、最先端技術よりも優れています。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:17:14 GMT)
CPFI-EIT: A CNN-PINN Framework for Full-Inverse Electrical Impedance Tomography on Non-Smooth Conductivity Distributions [0.0] 畳み込みニューラルネットワーク(CNN)と物理情報ニューラルネットワーク(PINN)を組み合わせたハイブリッド学習フレームワークを導入する。
EITは、注入電流による境界電圧測定に基づいて内部伝導度の空間分布を再構成する非侵襲イメージング技術である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:48:43 GMT)
Breaking The Ice: Video Segmentation for Close-Range Ice-Covered Waters [0.0] 北極海での急激な氷の後退は、2060年までには氷のない夏を予測し、新しい海航路を開くが、信頼できる航行手段を必要とする。
現在のアプローチは主観的専門家による判断に大きく依存しており、自動化されたデータ駆動型ソリューションの必要性を強調している。
本研究は, 船載光学データを用いた機械学習による氷条件の評価を行い, 946画像の微妙な注釈付きデータセットを導入した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:48:46 GMT)
Black Hole Multi-Entropy Curves [0.0] 蒸発ブラックホールの絡み合い構造とホーキング放射について検討した。
これらの構成の多エントロピーを用いて、ブラックホール多エントロピー曲線を定義する。
この曲線は、ブラックホールの蒸発中にマルチエントロピーがどう変化するかを記述する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:40:19 GMT)
Bidirectional Mamba state-space model for anomalous diffusion [0.0] Bi-Mambaは、双方向スキャン機構を備えた新しい状態空間ディープラーニングアーキテクチャである。
以上の結果から,Bi-Mambaアーキテクチャの異常拡散評価への応用の可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 08:29:38 GMT)
Beyond Search Engines: Can Large Language Models Improve Curriculum Development? [0.0] GPT-4は、BERTScoreの観点からYouTubeビデオプレイリストから抽出したトピックよりも、所定のコースに対してより正確なトピックを生成することができる。
以上の結果から, GPT-4 は YouTube ビデオプレイリストから BERTScore から抽出したトピックよりも, 与えられたコースに対してより正確なトピックを生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:21:16 GMT)
Benchmark for Evaluation and Analysis of Citation Recommendation Models [0.0] 我々は、引用推薦モデルの解析と比較を専門とするベンチマークを開発する。
このベンチマークは、引用コンテキストの異なる特徴に基づいてモデルの性能を評価する。
これは有意義な比較を可能にし、この分野におけるさらなる研究と開発のための有望なアプローチを特定するのに役立つだろう。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:01:33 GMT)
Balancing Shared and Task-Specific Representations: A Hybrid Approach to Depth-Aware Video Panoptic Segmentation [0.0] マスクトランスフォーマーのパラダイムに基づくDVPS(Deep-Aware Video Panoptic segmentation)の新たなアプローチであるMultiformerを提案する。
本手法は, セグメント化, 分子深度推定, オブジェクト追跡サブタスク間で共有されるオブジェクト表現を学習する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:12:08 GMT)
BATIS: Bootstrapping, Autonomous Testing, and Initialization System for Quantum Dot Devices [0.0] 本稿では,QDデバイステストと初期化の合理化を目的とした自動フレームワークを提案する。
BATISは高次元ゲート電圧空間をナビゲートし、漏れ試験やゲートキャラクタリゼーションといった重要なステップを自動化する。
クアッドQD Si/Si$_x$Ge$_1-x$デバイス上で1.3Kで実証された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 17:04:10 GMT)
Atomic-optical interferometry in fractured loops: a general solution for Rydberg radio frequency receivers [0.0] 新しい高周波原子受信機は、原子-光相互作用の理論的な記述に注意を向ける。
非平衡定常状態のフーリエ展開に対する我々のアプローチを基礎として、そのようなシステムをモデル化する手法を提案する。
我々は、この原子検出器の動作を記述する境界パラメータを得るRydberg超ヘテロダイン受信機の完全な記述を提供する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:13:48 GMT)
Asking Again and Again: Exploring LLM Robustness to Repeated Questions [0.0] オープンブックとクローズドブックの両方の設定で,ChatGPTの性能評価を行った。
本研究は,本モデルが繰り返し質問に対する感度を示さないことを示し,この文脈における頑健さと一貫性を強調した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 21:09:12 GMT)
Approximating Langevin Monte Carlo with ResNet-like Neural Network architectures [0.0] 本稿では,Langevin Monte Carlo (LMC)アルゴリズムにインスパイアされたニューラルネットワークアーキテクチャを提案する。
本稿では,Wasserstein-$2$距離で測定したスムーズな対数凹面対象分布に対する提案アーキテクチャの近似率を示す。
本稿では, 深部ニューラルネットワークに類似したアーキテクチャを提案し, サンプルを対象分布マップに近似するための表現性結果の導出を行う。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:55:44 GMT)
Anti-thermalization: Heating by cooling and vice versa [0.0] 一般的な直感では、接続されたシステムのある部分が継続的に冷却されている場合、他の部分も冷却されるはずだ。
両部分間の共振エネルギー交換を抑えることにより,システムの運命を逆転させることができることを示す。
本研究は, カップリングの性質が果たす重要な役割を明らかにするとともに, 熱力学における対称性と共鳴効果の豊かな相互作用を明らかにするものである。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:09:29 GMT)
Annotation Techniques for Judo Combat Phase Classification from Tournament Footage [0.0] 我々は、関連するエンティティを抽出し、柔道記録から戦闘フェーズを分類するモデルを訓練する。
我々は, 微調整対象検出器からの移動学習により, 戦闘相のモデルを構築し, マッチの存在, 活動, 立位を分類する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 03:24:14 GMT)
Analysis of the confinement string in (2 + 1)-dimensional Quantum Electrodynamics with a trapped-ion quantum computer [0.0] フェルミオン性物質を含む量子電磁力学の(2+1)次元格子離散化を考える。
対称性保存および資源効率の変動量子回路を用いて理論の基礎状態を作成する。
我々は、量子量子H1-1トラップイオンデバイスとエミュレータの量子実験の結果、量子ビット間の完全な接続が古典的なノイズレスシミュレーションと一致することを示した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 13:18:36 GMT)
An objective function for order preserving hierarchical clustering [0.0] 確率的部分順序の類似性に基づく階層的クラスタリングの理論と目的関数を提案する。
具体的には、元 $x le y$ が部分順序で与えられ、それぞれのクラスタ $[x]$ と $[y]$ が与えられたとき、その理論はクラスタ上で $[x]le'[y]$ となるような順序関係 $le'$ が得られる。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:31:50 GMT)
An In Depth Analysis of a Cyber Attack: Case Study and Security Insights [0.0] 国家が支援するサイバー攻撃は、国家安全保障に重大な脅威をもたらす。
韓国の銀行部門とインフラに最も影響を及ぼすサイバー脅威の1つは、ダークソウルのサイバー攻撃だった。
北朝鮮が支援するハッカーによって組織されたと信じられているこの攻撃は、広範囲にわたる混乱を引き起こした。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:36:20 GMT)
An Enhancement of CNN Algorithm for Rice Leaf Disease Image Classification in Mobile Applications [0.0] 本研究では,従来コンボリューショナルニューラルネットワーク(CNN)モデルに頼っていたイネ葉病画像分類アルゴリズムの強化に焦点を当てた。
我々は、CNNのローカル特徴抽出とVision Transformersのグローバルコンテキスト学習を統合する軽量モデルであるImageNet-1k weightsを用いて、MobileViTV2_050で転送学習を採用した。
このアプローチにより、MobileViTV2_050-Aの分類精度が15.66%向上し、ベースラインデータセットでトレーニングされた最初の拡張モデルが93.14%に達した。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:41:10 GMT)
AmCLR: Unified Augmented Learning for Cross-Modal Representations [0.0] バイモーダル視覚言語モデルに適したAmCLRとxAmCLRの目的関数を提案する。
これらの進歩は、より弾力的で一般化可能な対照的な学習プロセスをもたらす。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 23:32:36 GMT)
All multiparty quantum systems have state with unconditionally superposition-robust entanglement [0.0] 両部量子系とは対照的な多部量子系の特徴を見いだす。
本研究では, 局所的不明瞭な状態判別問題において, 不明瞭性を示す上で, 重ね合わせの不分離性がいかに有用かを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:29:39 GMT)
Algorithmic Phase Transitions in Language Models: A Mechanistic Case Study of Arithmetic [0.0] 大規模な言語モデルはタスクをゼロショットできるが、他のタスクはできない。
アルゴリズムの不安定性は、言語モデルのゼロショット性能の低下に寄与する要因である。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:32:01 GMT)
Active Inference for Self-Organizing Multi-LLM Systems: A Bayesian Thermodynamic Approach to Adaptation [0.0] 本稿では,大規模言語モデル(LLM)とアクティブ推論を統合し,適応型言語エージェントを作成するための新しいアプローチを提案する。
本フレームワークは,3つの状態要因(確率,探索,情報状態)を用いて環境をモデル化する。
実験により、エージェントが環境力学の正確なモデルを開発することにより、このアプローチの有効性が示された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:34:47 GMT)
Active Inference Tree Search in Large POMDPs [0.0] POMDPsにおける新しい計画手法--Active Inference Tree Search (AcT)について紹介する。
AcTは、神経科学(Active Inference)における主要な計画理論の規範的性格と生物学的リアリズムと、AIにおける木探索法のスケーラビリティを組み合わせたものである。
シミュレーションの結果、AcTはサンプリングベース手法に挑戦する二分木、適応探索を必要とする問題、そしてAcTが最先端のPOMDPソリューションを再現する大規模POMDP問題「RockSample」をうまくナビゲートしていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 10:35:53 GMT)
Accuracy and Performance Evaluation of Quantum, Classical and Hybrid Solvers for the Max-Cut Problem [0.0] 本稿では,NP-hard Max-Cut 問題と QUBO 問題に対する量子,古典,ハイブリッドの解法の性能について検討する。
我々は,新しい高速アニーリングD-Wave量子処理ユニット(QPU)とD-Wave Hybrid solverを,最先端の古典的アニーリングアルゴリズム(SA)と東芝のシミュレート分岐機(SBM)と比較した。
その結果,グローバルな最適解法が知られている小さなケースでは,ハイブリッドソルバとSAアルゴリズムが一貫してグローバルな最適解法を実現し,QPUを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 12:28:08 GMT)
ASTD Patterns for Integrated Continuous Anomaly Detection In Data Logs [0.0] 本稿では,データログのアンサンブル異常検出におけるASTD言語の使用について検討する。
特に教師なし学習の文脈において,学習モデルを組み合わせるためのASTDパターンを提案する。
学習モデルのシームレスな組み合わせを可能にする新しいASTD演算子であるQuantified Flowが提案されている。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 18:04:57 GMT)
A novel $2$ \& $3$ player scheme for Quantum Direct Communication [0.0] 2つのプロトコルは、第1のケースではアリスとボブ、第2のケースではアリス、ボッド、チャーリーの間で量子セキュアな直接通信を実現する。
両プロトコルは同じ手法を用いて、絡み合った化合物系に秘密情報を埋め込む。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 00:37:59 GMT)
A memory and gate efficient algorithm for unitary mixed Schur sampling [0.0] Unitary Schur sample は、入力 $m qudit 状態の Young ラベルと Unitary group register を測定するプロセスである。
我々はこのタスクを、最近導入された混合シュル=ワイルアルゴリズムを説明するために一般化する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:25:33 GMT)
A consolidated and accessible security proof for finite-size decoy-state quantum key distribution [0.0] 我々は,コヒーレント攻撃に対する有限サイズ1-デコイおよび2-デコイBB84プロトコルに対する厳密で包括的なセキュリティ証明を提供する。
我々は、多くの作品から概念を広く統合し、統一し、基礎となる前提を徹底的に議論し、技術的な矛盾を解消する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 11:41:00 GMT)
A consensus-constrained parsimonious Gaussian mixture model for clustering hyperspectral images [0.0] 食品エンジニアは、ハイパースペクトル画像を使用して、食品サンプルのタイプと品質を分類する。
これらの手法を訓練するには、各トレーニング画像の各ピクセルにラベルを付ける必要がある。
ハイパースペクトル画像に画素をラベル付けするために, コンセンサス制約付き擬似ガウス混合モデル (ccPGMM) を提案する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:21:01 GMT)
A cat qubit stabilization scheme using a voltage biased Josephson junction [0.0] 2対1の光子相互作用は、ビットフリップエラーが指数関数的に抑制される猫量子ビットを安定化することができる。
本研究は、ハミルトン工学に対する直流バイアスアプローチが猫の量子ビットにどのように貢献するかを考察する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 15:01:22 GMT)
A Survey on Recent Advances in Self-Organizing Maps [0.0] このレビューは、セミナルSOMアルゴリズムの主な進化を概観するために、過去10年間に焦点をあてる。
我々は、特定のデータ管理を伴うSOMの商用利用に関連する、特定のかつ重要なアプリケーション分野を強調します。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 16:40:02 GMT)
A Stochastic Origin of Spacetime Non-Commutativity [0.0] 時空の非可換性は、経路積分の定式化における経路の連続性や不連続性と本質的にどのように関係しているかを論じる。
その結果,時空の非可換性は時間的・空間的進化における基本的な離散性の結果として理解できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 09:09:30 GMT)
A Resolution Independent Neural Operator [0.0] 任意のセンサ位置とカウントを持つ入力出力データから演算子を学習するための一般的なフレームワークを提案する。
暗黙的ニューラル表現としてパラメータ化された連続基底関数を適応的に学習する2つの辞書学習アルゴリズムを提案する。
これらの基底関数は入力関数データを有限次元の埋め込み空間に投影し、アーキテクチャ上の変更なしにDeepONetと互換性を持つ。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 05:59:06 GMT)
A Mathematical Framework for Consciousness in Neural Networks [0.0] 本稿では,意識と身体的相関関係の間の説明的ギャップを埋めるための新しい数学的枠組みを提案する。
クエーリアは特異点であると主張するのではなく、クエーリアがなぜそのように感じるのかを「説明」する。
我々は、クォーリアを本質的に複雑性、計算、情報への還元以上の現象として認識する枠組みを確立する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 14:40:14 GMT)
A Framework For Estimating Amplitudes of Quantum State With Single-Qubit Measurement [0.0] 与えられた$n$-qubit量子状態の振幅を推定するための簡単なフレームワークを提案し,解析する。
一つの量子ビットの測定に制限を課し、任意の基準で測定を行うことができれば、測定結果を用いて振幅の発見を支援することができることを示す。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 02:31:16 GMT)
3A-YOLO: New Real-Time Object Detectors with Triple Discriminative Awareness and Coordinated Representations [0.0] 本研究の目的は、複数の注意機構を活用し、YOLO検出ヘッドの3つの識別的認識を階層的に強化することである。
まず,TDA-YOLOモジュールを新たに提案し,スケール認識,空間認識,タスク認識の学習を統一的に行う。
第2に、中間特徴を操り、チャネル間の関係と正確な位置情報を協調的に学習する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 04:01:32 GMT)
"So what if I used GenAI?" -- Implications of Using Cloud-based GenAI in Software Engineering Research [0.0] 本論文は、GenAIが用いられている様々な研究の側面に光を当て、その法的な意味を初心者や芽生えの研究者に認識させるものである。
我々は、GenAIを使用するすべてのソフトウェア研究者が、責任の主張を暴露する重大なミスを避けるために意識すべきであるという現在の知識について、重要な側面を要約する。
論文参考訳(メタデータ) (Tue, 10 Dec 2024 06:18:15 GMT)