Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs [112.9] MLLM(Multimodal large language model)は、画像、ビデオ、オーディオなどのモダリティにおいて顕著な成功を収めている。
現在のMLLMは、Webページのスクリーンショットを理解し、対応するHTMLコードを生成するのに驚くほど貧弱です。
命令チューニングのための大規模Webページ・ツー・コードデータセットを新たに構築したベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:11:00 GMT)
Learn from Downstream and Be Yourself in Multimodal Large Language Model Fine-Tuning [104.3] 微調整MLLMは、特定の下流タスクのパフォーマンスを改善するための一般的なプラクティスとなっている。
一般化と特殊化のトレードオフのバランスをとるために,事前学習と微調整の両方におけるパラメータの重要度を測定することを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:16:37 GMT)
PickScan: Object discovery and reconstruction from handheld interactions [100.0] シーンの3次元表現を再構成する対話誘導型クラス依存型手法を開発した。
我々の主な貢献は、操作対象のインタラクションを検出し、操作対象のマスクを抽出する新しいアプローチである。
相互作用ベースとクラス非依存のベースラインであるCo-Fusionと比較すると、これはシャムファー距離の73%の減少に相当する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:09:08 GMT)
A Comprehensive Study of Knowledge Editing for Large Language Models [82.7] 大規模言語モデル(LLM)は、人間のコミュニケーションを忠実に反映したテキストの理解と生成の素晴らしい能力を示している。
本稿では,知識編集の問題を定義し,最先端アプローチの包括的レビューを行う。
我々は,代表的知識編集アプローチの総合的評価のための新しいベンチマークであるKnowEditを紹介した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 06:50:44 GMT)
MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization [81.8] マルチ言語設定では、非ラテン語スクリプトと低リソース言語は通常、言語モデルの実用性、効率、コストの点で不利である。
適応的勾配に基づくサブワードトークン化による過分割を低減するために,多言語適応型勾配ベーストークン化を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:41:01 GMT)
Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.4] 我々は,GenAIシステムの能力,影響,機会,リスクに関連する概念を測定するための枠組みを提案する。
このフレームワークは、背景概念、体系化された概念、測定器、インスタンスレベルの測定そのものの4つのレベルを区別する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:35:30 GMT)
MMRel: A Relation Understanding Benchmark in the MLLM Era [73.0] MMRel(Multi-Modal Relation Understanding)は、オブジェクト間の関係に関する大規模で高品質で多様なデータを特徴付けるベンチマークである。
MMRelは、関係理解に基づくMLLMの評価や、関係理解能力を高めるための微調整MLLMに最適である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:16:19 GMT)
UQE: A Query Engine for Unstructured Databases [71.5] 構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:22:36 GMT)
NeuPAN: Direct Point Robot Navigation with End-to-End Model-based Learning [67.5] 本稿では,リアルタイム,高精度,ロボットに依存しない,環境に適応しないロボットナビゲーションソリューションであるNeuPANについて述べる。
NeuPANは密結合の知覚移動フレームワークを活用し、既存のアプローチと比較して2つの重要なイノベーションを持っている。
我々は,車載ロボット,車輪脚ロボット,乗用車において,実環境と実環境の両方でNeuPANを評価した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:07:21 GMT)
Multi-Modal Self-Supervised Learning for Surgical Feedback Effectiveness Assessment [66.6] そこで本研究では,音声による音声入力とそれに対応する手術映像からの情報を統合して,フィードバックの有効性を予測する手法を提案する。
以上の結果から,手書きフィードバックと手術映像の両方が,訓練者の行動変化を個別に予測できることがわかった。
本研究は,手術フィードバックの自動評価を推進するためのマルチモーダル学習の可能性を示すものである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:13:00 GMT)
HAT: Hybrid Attention Transformer for Image Restoration [61.7] トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:28:22 GMT)
Breaking the Low-Rank Dilemma of Linear Attention [61.6] 線形注意(linear attention)は、複雑性を線形レベルに還元することで、はるかに効率的なソリューションを提供する。
実験により, この性能低下は, 線形アテンションの特徴マップの低ランク性に起因することが示唆された。
我々は,線形複雑性と高効率を維持しつつ,Softmaxの注目性能に匹敵するランク拡張線形注意(RALA)を導入する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:56:16 GMT)
Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.9] 実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。
本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:45:37 GMT)
SoK: Unifying Cybersecurity and Cybersafety of Multimodal Foundation Models with an Information Theory Approach [58.9] MFM(Multimodal foundation model)は、人工知能の大幅な進歩を表す。
本稿では,マルチモーダル学習におけるサイバーセーフティとサイバーセキュリティを概念化する。
我々は、これらの概念をMFMに統一し、重要な脅威を特定するための総合的知識体系化(SoK)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:06:20 GMT)
Stimulating Diffusion Model for Image Denoising via Adaptive Embedding and Ensembling [56.5] DMID(Diffusion Model for Image Denoising)と呼ばれる新しい手法を提案する。
我々の戦略は、雑音のある画像を事前訓練された非条件拡散モデルに埋め込む適応的な埋め込み法を含む。
我々のDMID戦略は、歪みベースと知覚ベースの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:27:58 GMT)
Stealing Training Graphs from Graph Neural Networks [54.5] グラフニューラルネットワーク(GNN)は、様々なタスクにおけるグラフのモデリングにおいて有望な結果を示している。
ニューラルネットワークがトレーニングサンプルを記憶できるため、GNNのモデルパラメータはプライベートトレーニングデータをリークするリスクが高い。
訓練されたGNNからグラフを盗むという新しい問題について検討する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:15:36 GMT)
Fine-tuning Multimodal Large Language Models for Product Bundling [53.0] Bundle-MLLMは,大規模言語モデル(LLM)をハイブリットアイテムトークン化アプローチにより微調整する新しいフレームワークである。
具体的には、テキスト、メディア、およびリレーショナルデータを統一トークン化に統合し、テキストトークンと非テキストトークンを区別するソフトな分離トークンを導入する。
1)バンドルパターンを学習し,2)製品バンドル固有のマルチモーダルセマンティック理解の強化を行う。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:48:55 GMT)
TS-LLaVA: Constructing Visual Tokens through Thumbnail-and-Sampling for Training-Free Video Large Language Models [52.6] 近年の多モーダル言語モデル(LLM)の進歩は,多モーダルな内容を理解する上で大きな成功を収めている。
ビデオ理解タスクでは、高品質でキュレートされたビデオテキストペアリングデータの不足により、トレーニングベースのビデオLLMの構築が困難である。
本研究では,トレーニングフリーのビデオ LLM 構築における既存の圧縮戦略の限界について検討する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:08:29 GMT)
SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization [49.9] 本稿では,SymDPO(SymDPO)を提案する。
具体的には、SymDPOは、ランダムシンボルを使用してインスタンス内のテキスト回答を置き換えることで、マルチモーダルなデモンストレーションを構築するという従来のパラダイムを破ることを目的としている。
提案手法の有効性を複数のベンチマークで検証し,SymDPOを用いて,実例内のマルチモーダルコンテキストをより効果的に理解し,この知識をよりよい解答に活用できることを実証した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:29:14 GMT)
Smooth Non-Stationary Bandits [49.2] 本研究では、各アームの平均報酬シーケンスを$beta$-H"older関数に埋め込むことができる非定常包帯問題について検討する。
スムース(つまり$betage 2$)と非スムース(つまり$beta=1$)との最初の分離は、$tilde O(k4/5 T3/5)$ regret on any $k$-armed, $2-H"older instanceでポリシーを提示することで示します。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:03:40 GMT)
V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception [45.0] V2X-Radarは、4Dレーダを特徴とする世界初の大規模実世界のマルチモーダルデータセットである。
データセットは20KのLiDARフレーム、40Kのカメライメージ、20Kの4Dレーダデータで構成され、5つのカテゴリに350Kの注釈付きバウンディングボックスがある。
多様な研究領域を容易にするために、協調的な知覚のためのV2X-Radar-C、道路側知覚のためのV2X-Radar-I、単車車知覚のためのV2X-Radar-Vを確立する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:59:00 GMT)
Audio Deepfake Attribution: An Initial Dataset and Investigation [41.6] 我々は、Audio Deepfake Attribution (ADA)と呼ばれるオーディオ生成ツールの属性に対する最初のディープフェイクオーディオデータセットを設計する。
オープンセットオーディオディープフェイク属性(OSADA)のためのクラス・マルチセンター学習(CRML)手法を提案する。
実験の結果,CRML法は実世界のシナリオにおけるオープンセットリスクに効果的に対処できることが示された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:12:11 GMT)
Scaling Properties of Diffusion Models for Perceptual Tasks [39.9] 拡散モデルが知覚タスクのスケールトレーニングとテスト時間計算の利点を示す。
我々のモデルは、データと計算量を大幅に減らし、最先端の手法と競合する性能を実現する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:45:07 GMT)
A Millimeter-Wave Superconducting Qubit [39.8] 超伝導量子ビットはミリ波範囲(100GHz付近)までスケールアップされる
これは、希少な3ドルHeの冷蔵庫への依存を取り除き、低温システムを簡単にし、冷却電力を桁違いに高めることによる多くの利点がある。
このミリ波量子エミッタのデモンストレーションは、高周波光子検出における感度閾値を高めるためのエキサイティングな展望を提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:38:17 GMT)
Multilingual Large Language Models: A Systematic Survey [39.0] 本稿では,多言語大言語モデル(MLLM)の最新研究を包括的に調査する。
まず,MLLMのアーキテクチャと事前学習の目的について論じ,多言語機能に寄与する重要なコンポーネントや方法論を強調した。
本稿では,MLLMの言語間知識,推論,人的価値との整合性,安全性,解釈可能性,専門的応用に関する詳細な分類とロードマップを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:21:26 GMT)
Early Adoption of Generative Artificial Intelligence in Computing Education: Emergent Student Use Cases and Perspectives in 2023 [38.8] コンピュータ学生のGenAI利用と認識に関する先行研究は限られている。
私たちは、小さなエンジニアリングに焦点を当てたR1大学で、すべてのコンピュータサイエンス専攻を調査しました。
我々は,GenAIと教育に関する新たな議論に対する知見の影響について論じる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:17:47 GMT)
AnyECG: Foundational Models for Electrocardiogram Analysis [36.5] 心電図(ECG)は急性心臓発作の検出に非常に敏感である。
本稿では,実世界のECGデータからロバストな表現を抽出するための基礎モデルであるAnyECGを紹介する。
異常検出,不整脈検出,不良鉛生成,超長期心電図信号解析などの実験結果から,AnyECGがデータから共通心電図の知識を学習し,各タスクにおける最先端手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:32:58 GMT)
FusionMamba: Efficient Remote Sensing Image Fusion with State Space Model [35.6] 現在のディープラーニング(DL)手法は、典型的には、特徴抽出と情報統合のために畳み込みニューラルネットワーク(CNN)またはトランスフォーマーを使用する。
本研究では,効率的なリモートセンシング画像融合法であるFusionMambaを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:51:28 GMT)
VidComposition: Can MLLMs Analyze Compositions in Compiled Videos? [35.1] VidCompositionは、マルチモーダル大言語モデル(MLLM)の映像合成理解能力を評価するためのベンチマークである。
これには、カメラの動き、アングル、ショットサイズ、物語構造、キャラクターの動作、感情など、様々な構成的な側面をカバーしている。
33個のオープンソースおよびプロプライエタリなMLLMを総合的に評価した結果,人的・モデル的能力の差は顕著であった。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 06:23:46 GMT)
Joint Learning for Scattered Point Cloud Understanding with Hierarchical Self-Distillation [34.3] そこで本研究では,部分点雲を高速に補正し,同定するエンド・ツー・エンドアーキテクチャを提案する。
階層型自己蒸留(HSD)は任意の階層ベースの点雲法に適用できる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:12:06 GMT)
Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection [32.8] アクション検出は、ビデオの中で空間的および時間的に人間の行動を検出し(認識し、局所化する)ことを目的としている。
既存のアプローチでは、アクション検知器を訓練し、一定のアクションカテゴリのビデオでテストするクローズドセットの設定に重点を置いている。
本稿では,大規模視覚言語モデルの固有意味とローカライズ性を利用したOpenMixerを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:39:59 GMT)
Towards Explainable Evaluation Metrics for Machine Translation [32.7] 説明可能な機械翻訳メトリクスの重要な目的だけでなく、重要な特性も識別する。
本稿では,ChatGPT や GPT4 などの生成モデルに基づく説明可能なメトリクスに対する最新の最先端手法について論じる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:17:08 GMT)
4+3 Phases of Compute-Optimal Neural Scaling Laws [31.7] データ複雑性、ターゲット複雑性、モデルパラメータの3つのパラメータを持つ、解決可能なニューラルネットワークモデルを考察する。
このモデルを用いて、無限データスケーリング法則に関する新しい予測を導出する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:57:32 GMT)
Privacy and Copyright Protection in Generative AI: A Lifecycle Perspective [29.0] データライフサイクルにおけるプライバシーと著作権保護の多面的課題について論じる。
我々は、技術的革新と倫理的展望を組み合わせた統合的なアプローチを提唱する。
この作業は、より広範な議論のきっかけとなり、ジェネレーティブAIにおけるデータのプライバシと著作権の整合性に対する継続的な取り組みを促進することを目的としている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:09:49 GMT)
AMAGO-2: Breaking the Multi-Task Barrier in Meta-Reinforcement Learning with Transformers [28.9] 我々はTransformerベースの(コンテキスト内での)メタRLの最近の進歩の上に構築する。
エージェントのアクターと批評家の目的の両方を分類項に変換する、単純でスケーラブルなソリューションを評価する。
この設計は、明示的なタスクラベルを使わずに、オンラインマルチタスク適応とメモリ問題に大きな進歩をもたらす。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:25:40 GMT)
PEneo: Unifying Line Extraction, Line Grouping, and Entity Linking for End-to-end Document Pair Extraction [28.2] ドキュメントペア抽出は、キーエンティティとバリューエンティティの識別と、視覚的に豊富なドキュメントからの関連性の実現を目的としている。
既存のほとんどのメソッドは、セマンティックエンティティ認識(SER)と関係抽出(RE)の2つのタスクに分割している。
本稿では,統一パイプラインで文書ペア抽出を行う新しいフレームワークであるPEneoを紹介する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:22:47 GMT)
Direct and Explicit 3D Generation from a Single Image [25.2] マルチビュー2次元深度画像とRGB画像を用いて表面形状とテクスチャを直接生成する新しいフレームワークを提案する。
画素レベルの多視点整合性を実現するために,エピポーラの注意を潜時から画素間デコーダに組み込む。
生成した深度画素を3次元空間にバックプロジェクションすることにより、構造化された3次元表現を生成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:14:50 GMT)
BackdoorMBTI: A Backdoor Learning Multimodal Benchmark Tool Kit for Backdoor Defense Evaluation [25.1] マルチモーダル評価のためのバックドア学習ツールキットおよびベンチマークであるBackdoorMBTIを紹介する。
BackdoorMBTIは、データ処理、データ中毒、バックドアトレーニング、評価を含む、体系的なバックドア学習パイプラインを提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:01:55 GMT)
Debiasing Watermarks for Large Language Models via Maximal Coupling [24.9] 本稿では,グリーントークンの生成確率を微妙に増大させる新しいグリーン/レッドリスト透かし手法を提案する。
実験結果から,高い検出性を維持しつつテキスト品質を保ちつつ,従来技術よりも優れていたことが示唆された。
本研究は,テキスト品質への影響を最小限に抑えつつ,効果的な検出のバランスを保ちながら,言語モデルに有望な透かしソリューションを提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:36:37 GMT)
Schrödingerization based Quantum Circuits for Maxwell's Equation with time-dependent source terms [24.9] 本稿では, 完全導体(PEC)境界条件を持つマクスウェル方程式の量子回路を明示的に構築する。
量子アルゴリズムは、古典的有限差分時間領域(FDTD)フォーマットと比較して計算複雑性が向上していることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:15:37 GMT)
Towards Accurate and Efficient Sub-8-Bit Integer Training [24.9] 量子化は、ニューラルネットワークトレーニングにおける低ビット幅フォーマットを可能にする。
最近の手法では、量子化器上での新しいデータフォーマットと追加の事前処理操作が開発されている。
高い精度と効率を同時に達成することは、依然として非常に難しい。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:32:36 GMT)
Efficient Large Multi-modal Models via Visual Context Compression [24.0] 本稿では,視覚トークンに関する冗長性の解析と,大規模言語モデルにおける効率的な訓練について述べる。
最初の実験では、単に平均プーリングによってテスト段階で最大70%の視覚トークンを除去することは、視覚的質問応答精度の最小3%の低下にしか至らないことが示された。
GQAベンチマークにビジュアルコンテキストを導入し、視覚トークンの数を減らし、性能を犠牲にすることなくトレーニングと推論効率を向上させる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:05:03 GMT)
MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.8] 両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:00:09 GMT)
Dialectal Toxicity Detection: Evaluating LLM-as-a-Judge Consistency Across Language Varieties [23.8] 現代のLSMによる毒性の検出に方言の違いがどう影響するかについては、体系的な研究はほとんど行われていない。
10の言語クラスタと60の変種をカバーする合成変換と人間による翻訳により、多言語データセットを作成する。
次に,多言語,方言,LLM-ヒト間の毒性を評価できる3つのLSMを評価した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:53:24 GMT)
The Promises and Pitfalls of LLM Annotations in Dataset Labeling: a Case Study on Media Bias Detection [23.4] 大きな言語モデル(LLM)は、アノテーションプロセスの自動化に使用することができる。
本研究では,メディアバイアス検出の複雑なタスクにLDMが適用可能であるかを検討する。
メディアバイアス分類のための,最初の大規模データセットであるAnnolexicalを作成します。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:14:36 GMT)
Mixture of Experts Meets Prompt-Based Continual Learning [23.4] 本稿では、連続学習におけるそのような利点をいかにもたらすかを明らかにするための理論的分析を行う。
我々は,新しいタスク固有の専門家の追加として,プレフィックスチューニングに関する新しい視点を提供し,新しいゲーティング機構の設計を刺激する。
NoRGaの有効性は、様々なベンチマークや事前学習パラダイムで理論的にも経験的にも裏付けられている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:36:09 GMT)
PrExMe! Large Scale Prompt Exploration of Open Source LLMs for Machine Translation and Summarization Evaluation [22.7] 大規模言語モデル(LLM)はNLP研究に革命をもたらした。
インコンテキスト学習は、自然言語生成の評価指標としての使用を可能にする。
我々は,機械翻訳(MT)と要約データセットに基づいて,オープンソースのLCMベースのメトリクスに対して,720以上のプロンプトテンプレートを評価した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:09:54 GMT)
BianCang: A Traditional Chinese Medicine Large Language Model [22.6] BianCangはTCM固有の大規模言語モデル(LLM)で、まずドメイン固有の知識を注入し、目標とする刺激によって調整する。
実際の病院記録に基づく事前学習コーパス,ChP-TCMデータセット,および中華人民共和国の薬局類由来のChP-TCMデータセットを構築した。
我々は,TCMの理解を深めるための包括的なデータセットを構築し,連続的な事前学習と微調整のための広範囲なTCMと医療コーパスを収集した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:17:01 GMT)
SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration [22.6] SageAttention2を提案する。これは精度向上とともに,より高速な4ビット行列乗算(Matmul)を実現する。
時間ステップと層間の量子化精度を解析し、エンドツーエンドのメトリクスを保証するための適応量子化手法を提案する。
実験により、我々のアプローチは様々なモデルにまたがって無視できるエンドツーエンドのメトリクス損失を引き起こすことを確認した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:35:49 GMT)
Sketchy Moment Matching: Toward Fast and Provable Data Selection for Finetuning [22.3] 2段階のスケーラブルなデータ選択方式であるSketchy Moment Matching (SkMM)を紹介する。
第一に、バイアスは、情報的低次元部分空間に対する微調整パラメータ空間を探索する勾配スケッチを用いて制御される。
合成実験により分散バイアスバランスを向上し、実視タスクの微調整におけるSkMMの有効性を実証する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:02:19 GMT)
JailbreakLens: Interpreting Jailbreak Mechanism in the Lens of Representation and Circuit [21.4] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対して脆弱である。
脱獄攻撃は多いが、根底にあるメカニズムの理解は依然として限られている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:08:34 GMT)
EfQAT: An Efficient Framework for Quantization-Aware Training [20.5] 量子化対応トレーニング(QAT)スキームは、ほぼ完全な精度を実現することが示されている。
ポストトレーニング量子化(PTQ)スキームはトレーニングを伴わないため、計算的に安価である。
本稿では、量子化モデルのパラメータのサブセットのみを最適化することにより、両方のスキームを一般化するEfQATを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:06:36 GMT)
Evaluating Representations with Readout Model Switching [19.9] 本稿では,最小記述長(MDL)の原理を用いて評価指標を考案する。
我々は、読み出しモデルのためのハイブリッド離散および連続値モデル空間を設計し、それらの予測を組み合わせるために切替戦略を用いる。
提案手法はオンライン手法で効率的に計算でき,様々なアーキテクチャの事前学習された視覚エンコーダに対する結果を示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:26:11 GMT)
Adapting Amidst Degradation: Cross Domain Li-ion Battery Health Estimation via Physics-Guided Test-Time Training [19.6] リチウムイオン電池(LIB)の健康モデリングは、安全で効率的なエネルギー管理に不可欠であり、社会経済的に重要な意味を持つ。
本稿では,劣化中の各対象データ(UTD)を連続的に使用してモデルを適応させる,実践的なテストタイムトレーニングフレームワークであるBatteryTTTを紹介する。
それぞれのUTDを完全に活用するために、BatteryTTTはPhyscics-Guided Test-Time Trainingと呼ばれる、現代のLIB固有の物理法則を自己教師付き学習に統合する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:03:26 GMT)
Understanding Multimodal LLMs: the Mechanistic Interpretability of Llava in Visual Question Answering [19.5] 我々は,ユーザと研究者が最終予測のための重要な視覚的位置を特定するのに役立つ解釈可能性ツールを開発した。
提案手法は,既存の解釈可能性アプローチと比較して,より高速かつ効果的な結果を示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:32:50 GMT)
Graph Neural Networks for Financial Fraud Detection: A Review [19.3] 本稿では、金融不正問題に対処する上でのグラフニューラルネットワーク(GNN)の役割について概説する。
GNNは金融ネットワーク内の複雑な関係パターンやダイナミクスを捉えるのに非常に適しています。
本稿では,100以上の研究の構造化レビューを通じて,財務不正検出におけるGNN適用の理解に寄与する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:01:05 GMT)
CLMIA: Membership Inference Attacks via Unsupervised Contrastive Learning [19.2] メンバーシップ推論攻撃(MIA)は、機械学習モデルのトレーニングにデータサンプルが使用されているかどうかを決定するために機能を利用する。
本稿では、教師なしのコントラスト学習を用いて攻撃モデルを訓練するCLMIAと呼ばれる新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:25:01 GMT)
Training a Label-Noise-Resistant GNN with Reduced Complexity [19.0] グラフニューラルネットワーク(GNN)は、グラフ上の半教師付きノード分類タスクに広く利用されている。
GNNの性能はラベルノイズに大きく影響され、誤ラベル付きノードの数が少なければ、モデルトレーニングを著しく間違える可能性がある。
本稿では,ラベルノイズに対する堅牢なGNN学習のための低次複雑化手法であるラベルアンサンブルグラフニューラルネットワーク(LEGNN)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:52:20 GMT)
FedUHB: Accelerating Federated Unlearning via Polyak Heavy Ball Method [17.7] モデルから特定のデータの影響を効果的に除去するために、フェデレート・アンラーニング(FU)が開発された。
我々は,Polyakヘビーボール最適化技術を活用した,新しい非学習手法であるFedUHBを提案する。
実験の結果,FedUHBは学習効率を向上するだけでなく,学習後の頑健なモデル性能も維持できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:08:49 GMT)
Retinal Vessel Segmentation via Neuron Programming [17.6] 本稿では,神経レベルでのネットワークの表現能力を高めるため,ニューラルネット設計における新しいアプローチであるニューラルネットプログラミングについて紹介する。
総合的な実験により、ニューロンプログラミングは網膜の血液分画において競合的な性能を発揮することが検証された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:03:30 GMT)
AIGS: Generating Science from AI-Powered Automated Falsification [17.5] 本稿では,重要な研究プロセスを代表する役割を担ったマルチエージェントシステムである,フルプロセスAIGSシステムのベビーステップとして,Baby-AIGSを提案する。
3つのタスクの実験では、Baby-AIGSは経験豊富な人間の研究者と同等ではないが、有意義な科学的発見を産み出すことができた。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:40:35 GMT)
Exploring the Adversarial Frontier: Quantifying Robustness via Adversarial Hypervolume [17.2] 本稿では,様々な摂動強度に対して総合的に深層学習モデルの頑健性を評価するための,対向超体積と呼ばれる新しい計量法を提案する。
我々は,様々な摂動強度の対向的堅牢性を均一に向上する新しいトレーニングアルゴリズムを採用する。
本研究はロバスト性の新しい尺度に寄与し、敵の脅威に対するベンチマーク評価と、現在および将来の防御モデルのレジリエンスの基準を確立する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:42:51 GMT)
On-Board Vision-Language Models for Personalized Autonomous Vehicle Motion Control: System Design and Real-World Validation [17.1] VLM(Vision-Language Models)は、パーソナライズドライビングのための有望なソリューションを提供する。
本稿では,低レイテンシなパーソナライズドライビング性能を実現する軽量で効果的なVLMフレームワークを提案する。
我々のシステムは、様々なシナリオで安全で快適でパーソナライズされた運転体験を提供する能力を示した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:20:37 GMT)
Improving Tool Retrieval by Leveraging Large Language Models for Query Generation [16.8] コンテキスト内学習は、プロンプトで関連するツールの短いリストを提供することができる。
本稿では,Large Language Models (LLM) を用いて検索クエリを生成することを提案する。
生成されたクエリは埋め込みされ、最も近い隣の検索を通じて最も関連性の高いツールを見つけるために使用される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:02:09 GMT)
When Your AIs Deceive You: Challenges of Partial Observability in Reinforcement Learning from Human Feedback [16.5] 人間のフィードバックが部分的な観察にのみ基づく場合、それは誤認的なインフレーションと過度な調整をもたらす可能性があることを示す。
人間のフィードバックは加法定数まで一意的に戻り関数を決定することがあるが、他の現実的な場合、あいまいさは不可避である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:18:45 GMT)
Person Segmentation and Action Classification for Multi-Channel Hemisphere Field of View LiDAR Sensors [16.1] 本稿では,LiDARセンサの視界の3次元スキャンを対象とし,人物のセグメンテーションと行動分類を行う手法を提案する。
本研究では,MaskDINOモデルを用いて人を検出し,その動作を球面投影型マルチチャネル表現から認識する手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:53:20 GMT)
Efficient Federated Unlearning with Adaptive Differential Privacy Preservation [15.8] フェデレーション・アンラーニング(FU)は、フェデレーション・ラーニング(FL)における、特定のクライアントのデータがグローバルモデルに与える影響を消し去るための有望なソリューションを提供する。
現在の最先端のFUメソッドは、保存された履歴更新を活用することで、従来のFLフレームワークを拡張している。
FUにおける効率性とプライバシ保護の両立を図ったFedADPを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:45:15 GMT)
AddrLLM: Address Rewriting via Large Language Model on Nationwide Logistics Data [15.6] 本稿では,検索拡張大言語モデル上に構築されたアドレス書き換えのための革新的なフレームワークであるAddrLLMを紹介する。
これは、厳密に設計されたSupervised Fine-Tuningモジュール、アドレス中心のRetrieval Augmented Generationモジュール、バイアスフリーのObjective Alignmentモジュールによって、上記の制限を克服する。
パーセルの再ローティングの速度を約43%削減し、現実の応用では例外的な効果を誇示している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:32:46 GMT)
EROAM: Event-based Camera Rotational Odometry and Mapping in Real-time [15.0] EROAMは、リアルタイムで正確なカメラ推定を実現する、イベントベースの回転計測とマッピングシステムである。
EROAMは, 精度, 堅牢性, 計算効率において, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:50:47 GMT)
SRA-MCTS: Self-driven Reasoning Aurmentation with Monte Carlo Tree Search for Enhanced Code Generation [14.8] 大規模な言語モデルは、単純なコード生成タスクでは例外的なパフォーマンスを示しますが、複雑な問題に対処する上での課題に直面します。
本稿では,高品質な中間推論経路を自律的に生成するモデルであるSRA-MCTSを提案する。
我々の手法は、追加の監督を必要とせず、モデル自体を通して完全に機能する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:31:04 GMT)
Challenges and Opportunities in Quantum Optimization [14.8] 量子コンピュータの最近の進歩は、ブラトフォース古典シミュレーションを超えるスケールで問題を解決する能力を示している。
計算機科学や物理学全般において、主要な最適化問題に対するアプローチは様々である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:01:04 GMT)
Unveiling the Hidden: Online Vectorized HD Map Construction with Clip-Level Token Interaction and Propagation [14.5] MapUnveilerは、クリップレベルのベクトル化HDマップ構築の新しいパラダイムである。
これは、高密度の画像表現と効率的なクリップトークンを関連付けることで、クリップ入力内の隠蔽マップ要素を公開する。
MapUnveilerはクリップトークンの伝搬を通じてクリップ間の情報を関連付け、長期の時間マップ情報を有効に活用する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:38:18 GMT)
Memory-Augmented Multimodal LLMs for Surgical VQA via Self-Contained Inquiry [14.5] 自己完結型問合せによる外科的コンテキスト理解を改善するためのメモリ拡張フレームワークであるSCANを提案する。
SCANは、コンテキスト拡張のための2種類のメモリを生成する。DM(Direct Memory)は、最終回答に複数の候補(またはヒント)を提供する。
3つの公開可能な手術用VQAデータセットの実験では、SCANが最先端のパフォーマンスを実現し、さまざまな手術シナリオにおける精度と堅牢性を向上させることが示されている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:23:45 GMT)
BVI-CR: A Multi-View Human Dataset for Volumetric Video Compression [14.1] BVI-CRは18のマルチビューRGB-Dキャプチャとそれに対応するテクスチャ化された多角形メッシュを含んでいる。
各ビデオシーケンスは、30FPSで10~15秒間の1080p解像度で10ビューを含む。
その結果、ボリュームビデオ圧縮におけるニューラル表現に基づく手法の大きな可能性を示した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:22:48 GMT)
Private Federated Learning Without a Trusted Server: Optimal Algorithms for Convex Losses [14.0] シリコン間記録レベル差分プライバシー(ISRL-DP)
シリコン間記録レベル差分プライバシー(ISRL-DP)
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:55:34 GMT)
Enabling Explainable Recommendation in E-commerce with LLM-powered Product Knowledge Graph [13.8] LLMの知識を製品知識グラフ(PKG)に抽出する効率的なアプローチであるLLM-PKGを提案する。
我々は、KGの信頼性と可用性を確保するため、厳密な評価とプルーニング手法を採用している。
電子商取引サイト上で実施したA/Bテストを通じて、ユーザエンゲージメントとトランザクションを著しく促進するLLM-PKGの有効性を実証した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:57:31 GMT)
Image Forgery Localization via Guided Noise and Multi-Scale Feature Aggregation [13.6] IFLのためのガイド付きマルチスケール機能集約ネットワークを提案する。
異なる種類の偽音下でのノイズ特徴を学習するために,有効なノイズ抽出モジュールを開発する。
そして、動的畳み込みを用いて複数のスケールでRGBと雑音機能を適応的に集約する特徴集約モジュール(FAM)を設計する。
最後に,Atrous Residual Pyramid Module (ARPM)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:50:09 GMT)
MPLite: Multi-Aspect Pretraining for Mining Clinical Health Records [13.4] 本稿では,医療概念の表現性を高めるために,軽量ニューラルネットワークを用いたマルチアスペクトプレトレーニングとラボの結果を利用する新しいフレームワークMPLiteを提案する。
我々は、実験結果に基づいて医療コードを予測し、特徴の複数の側面を融合させることで堅牢な予測を保証する事前学習モジュールを設計する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:43:10 GMT)
Combining Induction and Transduction for Abstract Reasoning [13.4] 我々は、誘導(潜伏関数の推論)と伝達(与えられたテスト入力に対するテスト出力を直接予測)のためにニューラルネットワークを訓練する。
我々のモデルは、LLMに推論される関数を指定するPythonコードを生成するように促すことで生成された合成データと、その関数への入力を生成するサブルーチンに基づいて訓練されている。
インダクティブモデルとトランスダクティブモデルは、同じ問題をトレーニングしているにもかかわらず、同じニューラルアーキテクチャを共有しているにもかかわらず、非常に異なる問題を解決する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:55:35 GMT)
Feature learning as alignment: a structural property of gradient descent in non-linear neural networks [13.0] トレーニング中にNFA (Neural Feature Ansatz) が相関することが明らかとなった。
このアライメントは,SGDによって誘導される重量変化と,前活性化機能との相互作用によって引き起こされることが確認された。
我々は、微分アライメントが特定の高次元設定でほぼ確実に起こることを証明した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:18:40 GMT)
Masked Pre-training Enables Universal Zero-shot Denoiser [12.8] 我々は,新しいゼロショットデノベーションパラダイム,すなわち Masked Pre-train then Iterative fill (MPI) を提案する。
MPIはまずマスキングによりモデルを訓練し、その後1つのノイズ画像に基づいて高品質のゼロショット画像を生成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:21:57 GMT)
SEFD: Semantic-Enhanced Framework for Detecting LLM-Generated Text [12.6] 大規模言語モデル(LLM)生成テキスト(SEFD)を検出するための新しい意味強化フレームワークを提案する。
本フレームワークは,検索技術と従来の検出手法を体系的に統合することにより,既存の検出方法を改善する。
本稿では,オンラインフォーラムやQ&Aプラットフォームなど,現実のアプリケーションに共通するシーケンシャルテキストシナリオにおけるアプローチの有効性を示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:13:30 GMT)
Mitigating Relative Over-Generalization in Multi-Agent Reinforcement Learning [12.0] 我々は,潜在的次の状態のサンプリングと評価を反復的に行うMaxMax Q-Learning (MMQ)を紹介した。
このアプローチは理想的な状態遷移の近似を洗練させ、協調エージェントの最適結合ポリシーとより密接に一致させる。
以上の結果から,MMQは既存のベースラインよりも優れており,コンバージェンスと試料効率が向上していることが明らかとなった。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:00:39 GMT)
OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents [11.9] Open Omniはオープンソースのエンドツーエンドパイプラインベンチマークツールである。
音声テキスト、感情検出、検索拡張生成、大規模言語モデルなどの高度な技術を統合している。
ローカルとクラウドのデプロイメントをサポートし、データのプライバシを確保し、レイテンシと精度のベンチマークをサポートする。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:53:34 GMT)
STOP: Spatiotemporal Orthogonal Propagation for Weight-Threshold-Leakage Synergistic Training of Deep Spiking Neural Networks [11.9] 疎疎なバイナリアクティベーションに基づくディープニューラルネットワーク(SNN)モデルは、効率的で高精度なSNNディープラーニングアルゴリズムを欠いている。
我々のアルゴリズムは、シナプス重みを発射する完全相乗的学習アルゴリズムと、ニューロンのしきい値とスパイク因子を併用することにより、SNNの精度を向上させる。
統合された時間的フォワードトレースベースのフレームワークの下では、前方パスにすべての時間ステップのニューラルステートを格納するための巨大なメモリ要件を緩和する。
本手法は,資源に制限があるが高精度なインサイト学習が望まれるエッジインテリジェントシナリオに対して,より有効な方法である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:15:54 GMT)
Taming the Long Tail in Human Mobility Prediction [11.8] 移動予測のためのLong-Tail Adjusted Next POI Prediction (LoTNext) フレームワークを提案する。
2つの実世界の軌道データセットによる実験により、LoTNextが既存の最先端の作業を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:09:12 GMT)
ReasoningRank: Teaching Student Models to Rank through Reasoning-Based Knowledge Distillation [11.8] 本稿では、透明性を高める新しいオープンソースリグレードアプローチであるReason-to-Rank(R2R)を提案する。
R2Rは2つのタイプの推論を生成する: 直接関連推論(direct relevance reasoning) - ドキュメントがクエリにどのように対処するかを説明する。
学生モデルは、有意義な推論と文書の書き直しを訓練し、複数のデータセットにまたがる競争性能を達成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:26:23 GMT)
Super-bunching light with giant high-order correlations and extreme multi-photon events [11.6] フォトニック結晶ファイバにおいて、g2(0)が5.86*104、g5(0)が2.72*108までの超広帯域光源の発生を報告した。
巨大g2(0)値の下では、超広帯域光源はアップターンテール光子分布とユビキタス超多光子事象を呈する。
本研究は,超高次相関や極端多光子現象を伴って,古典的でない光源を実現する能力を示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:07:12 GMT)
Constrained Diffusion with Trust Sampling [11.4] 我々は、最適化の観点から、トレーニングなし損失誘導拡散を再考する。
トラストサンプリングは、無条件拡散モデルに従って効果的にバランスをとり、損失誘導に固執する。
複雑なタスクや画像の領域や3Dモーション生成の領域で広範囲にわたる実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:34:57 GMT)
StableV2V: Stablizing Shape Consistency in Video-to-Video Editing [11.1] 本稿では,形状に一貫性のあるビデオ編集手法であるStableV2Vについて述べる。
提案手法は,編集パイプライン全体を複数のシーケンシャルな手順に分解し,最初のビデオフレームを編集し,配信された動作とユーザプロンプトのアライメントを確立し,最終的にそのアライメントに基づいて編集内容を他のすべてのフレームに伝達する。
実験結果と解析結果から,既存の最先端研究と比較して,提案手法の性能,視覚的整合性,推論効率が向上していることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:48:01 GMT)
Operator algebra and algorithmic construction of boundaries and defects in (2+1)D topological Pauli stabilizer codes [10.9] 位相一般化されたパウリ安定化符号のすべての境界と欠陥を2次元で構成する計算アルゴリズムを提案する。
このアルゴリズムを適用し、Z$トーリック符号の2つの境界と6つの欠陥、Z_4$トーリック符号の3つの境界と22の欠陥、カラー符号の6つの境界と270の欠陥、異常な3つのフェミオン符号の6つの欠陥を明示的に示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 05:48:33 GMT)
Countering Backdoor Attacks in Image Recognition: A Survey and Evaluation of Mitigation Strategies [10.8] 本稿では,画像認識におけるバックドア攻撃に対する既存の緩和策について概説する。
我々は、8つの異なるバックドア攻撃に対して、16の最先端アプローチの広範なベンチマークを行う。
この結果は122,236個の個別実験から得られたものであり、多くのアプローチがある程度の保護を提供する一方で、その性能はかなり異なる可能性があることを示唆している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:30:01 GMT)
SWT-Bench: Testing and Validating Real-World Bug-Fixes with Code Agents [10.7] ユーザ問題をテストケースに形式化するLLMベースのコードエージェントについて検討する。
我々は人気のあるGitHubリポジトリに基づいた新しいベンチマークを提案し、現実世界の問題、地味なバグフィックス、ゴールデンテストを含む。
コード修復用に設計されたコードエージェントは,テスト生成用に設計されたシステムの性能を上回っている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:40:36 GMT)
Asymmetrical estimator for training encapsulated deep photonic neural networks [10.7] フォトニックニューラルネットワーク(PNN)は高速なインプロパゲーションと高帯域幅のパラダイムである。
デバイス・ツー・デバイスとシステム・ツー・システムの違いは、PNNの完全な知識を生み出す。
DPNNのカプセル化に適した非対称訓練法(AT法)を導入する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:33:25 GMT)
FG-PRM: Fine-grained Hallucination Detection and Mitigation in Language Model Mathematical Reasoning [10.7] 既存のアプローチは、主に幻覚の存在を検知するが、それらのタイプや表現の微妙な理解は欠如している。
数学的推論タスクにおける一般的な幻覚を6つのタイプに分類する包括的分類法を導入する。
次に,FG-PRM(FG-PRM)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:22:18 GMT)
Decoding Visual Experience and Mapping Semantics through Whole-Brain Analysis Using fMRI Foundation Models [10.6] 我々は脳全体の活性化マップを組み込むことで視覚過程の理解を高めるアルゴリズムを開発した。
まず,視覚処理を復号化するための最先端手法と比較し,予測意味精度を43%向上させた。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 05:15:38 GMT)
Model-Based Reinforcement Learning with Multinomial Logistic Function Approximation [10.2] マルコフ決定過程(MDP)におけるモデルベース強化学習(RL)について検討する。
我々は,多項ロジスティックモデルにより状態遷移が与えられるMPPに対して,証明可能な効率のよいRLアルゴリズムを確立する。
我々の知る限りでは、証明可能な保証付き多項ロジスティック関数近似を用いたモデルベースRLアルゴリズムとしてはこれが初めてである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:17:02 GMT)
4H-SiC microring opto-mechanical oscillator with a self-injection locked pump [10.1] 分散フィードバック(DFB)ダイオードレーザーの多モード炭化ケイ素(4H-SiC)マイクロリング共振器への自己注入ロック
ストークス光は、隣接する基本横磁気共鳴モードで発生した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:51:49 GMT)
Diffusion-Inspired Quantum Noise Mitigation in Parameterized Quantum Circuits [10.1] 量子ノイズと拡散モデルの関係について検討する。
本稿では,PQCにおける量子ノイズを軽減するために,拡散に着想を得た新しい学習手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:10:15 GMT)
D-Cube: Exploiting Hyper-Features of Diffusion Model for Robust Medical Classification [9.2] 本稿では拡散型診断(D-Cube)について紹介する。これは拡散モデルから高機能と対照的な学習を併用して癌診断を改善する新しいアプローチである。
D-Cubeは拡散モデルの堅牢な表現能力を利用する高度な特徴選択技術を採用している。
D-CubeはCT,MRI,X線など,複数の医用画像モダリティに対して有効であることが実験的に検証された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:30:50 GMT)
Different Horses for Different Courses: Comparing Bias Mitigation Algorithms in ML [9.0] いくつかのアルゴリズムが達成した公正度に有意なばらつきを示し、学習パイプラインが公正度スコアに与える影響を明らかにした。
ほとんどのバイアス軽減技術は同等のパフォーマンスを実現することができると強調する。
私たちの研究は、アルゴリズムの開発ライフサイクルにおける様々な選択が公正性にどのように影響するか、将来の研究を促進することを願っています。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:17:08 GMT)
IMPaCT GNN: Imposing invariance with Message Passing in Chronological split Temporal Graphs [8.9] 本稿では,時系列分割によるグラフデータのドメイン適応問題に対処する。
本稿では,時間グラフ構造から導出した現実的な仮定に基づいて不変性を付与するIMPaCTを提案する。
ogbn-mag グラフデータセット上での現在の SOTA 法と比較して,IMPaCT は3.8% の性能向上を実現していることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:23:25 GMT)
Map-Free Trajectory Prediction with Map Distillation and Hierarchical Encoding [8.9] MFTPはMap-Free Trajectory Prediction法であり、いくつかの利点がある。
まず、推論中のHDマップの必要性を排除し、知識蒸留によるトレーニング中のマップ事前の恩恵を享受する。
第二に、空間的時間的エージェントの特徴を効果的に抽出し、それらを複数のトラジェクトリクエリに集約する新しい階層エンコーダを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:50:44 GMT)
TeG: Temporal-Granularity Method for Anomaly Detection with Attention in Smart City Surveillance [8.8] ビデオ監視における異常検出は、最近、研究コミュニティから関心を集めている。
本稿では,リアルタイム監視における異常検出モデル(TeG)の時間-粒度法を提案する。
TeGモデルは、都市監視システムにデプロイされ、検証され、産業環境でのリアルタイムな結果を達成する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:44:31 GMT)
From Optimization to Sampling via Lyapunov Potentials [8.7] 本稿では,Langevin Dynamics を用いた高次元分布からのサンプリング問題について検討する。
非対数凹凸密度の新しいクラスから効率的にサンプルを採取できることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:31:40 GMT)
F$^3$OCUS -- Federated Finetuning of Vision-Language Foundation Models with Optimal Client Layer Updating Strategy via Multi-objective Meta-Heuristics [8.6] 微調整において最も重要なVLM層を選択するクライアント固有の層重み付けスコアであるtextitviz. が与える影響について述べる。
本稿では,F$3$OCUSと呼ばれる新しいレイヤ更新戦略を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:54:57 GMT)
Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process [8.2] 提案手法は,2つの数学的および2つの材料科学ケーススタディを用いて実証および解析を行った。
シングルソースおよびソースを意識しない機械学習モデルと比較して、提案したマルチソースデータ融合フレームワークはスパースデータ問題に対してより良い予測を提供することができる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:59:54 GMT)
RPN 2: On Interdependence Function Learning Towards Unifying and Advancing CNN, RNN, GNN, and Transformer [8.2] 本稿は、Reconciled Polynomial Network(RPN)に関するこれまでの研究に基づいています。
データと構造的相互依存関数を組み込むことで、RPN 2はアーキテクチャ内の新しいコンポーネント機能を介してデータ相互依存を明示的にモデル化する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:45:26 GMT)
REACCEPT: Automated Co-evolution of Production and Test Code Based on Dynamic Validation and Large Language Models [7.9] PT自動共進化のための既存の方法は、事前に定義されたルールを利用するか、機械学習技術のシンプルな応用に依存する。
大規模言語モデルと動的検証を利用してPT共進化を完全に自動化する新しい手法であるREACCEPTを提案する。
ReACCEPTの更新精度は60.16%に達し、最先端の技術であるCEPROTを90%上回った。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:26:25 GMT)
DeepSPV: An Interpretable Deep Learning Pipeline for 3D Spleen Volume Estimation from 2D Ultrasound Images [7.7] 脾腫は、疾患細胞病(SCD)などの様々な関連疾患に対する重要な臨床指標である
本研究では,1次元または2次元の超音波画像からスプレエン体積を正確に推定する深層学習パイプラインであるDeepSPVを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:43:07 GMT)
TSFormer: A Robust Framework for Efficient UHD Image Restoration [7.5] TSFormerは、textbfTrusted LearningとtextbfSparsificationを統合するオールインワンフレームワークである。
我々のモデルは3.38Mパラメータを持つ4K画像をリアルタイムで(40fps)実行することができる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:34:27 GMT)
Simulation of Entanglement-Enabled Connectivity in QLANs using SeQUeNCe [7.5] 量子局所ネットワーク(QLAN)は、大規模量子ネットワークのための有望なビルディングブロックである。
本稿では,量子ネットワークの離散イベントシミュレータであるSeQUeNCeにおけるQLANモデルの実装について論じる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:20:25 GMT)
Bloch Oscillation and Landau-Zener Tunneling of a Periodically Kicked Dirac Particle [7.4] 一次元の周期的蹴りディラック方程式によって支配される相対論的スピン-1/2粒子の力学について検討する。
運動量空間の異なる振動挙動とゼロ運動量近傍の量子トンネルを観察する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 03:42:18 GMT)
Learning the Sherrington-Kirkpatrick Model Even at Low Temperature [7.3] 非指向型グラフィカルモデルやマルコフランダム場(MRF)のパラメータを学習する根本的な問題を考える。
Isingモデルの場合、Klivans と Meka による乗法的加重更新は、任意の温度 $beta leq sqrtlog n$ に間に合うようにパラメータを学習する。
これにより、She-Kirkpatrick(SK)モデルを学ぶアルゴリズムが、高温の1ドルを超えるとすぐに得られる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:02:12 GMT)
A Study of Malware Prevention in Linux Distributions [7.2] オープンソースソフトウェアパッケージに対する悪意ある攻撃は、ますます懸念される。
本研究は,Linuxディストリビューションリポジトリにおけるマルウェアの防止と検出の課題について考察する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:42:08 GMT)
Entanglement cost of discriminating quantum states under locality constraints [7.1] 1つのベル状態の助けを借りて、純粋な状態が他の状態と最適に区別できることが示される。
この研究は、量子状態の識別における絡み合いによって引き起こされる中心的な役割について理解を深め、局所的に制約された測定値に対して量子データを隠蔽する重要な要素として機能する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:00:37 GMT)
Patching FPGAs: The Security Implications of Bitstream Modifications [7.0] FPGAは、製造後の回路変更を可能にする再プログラム性で知られている。
悪意のある操作は、秘密データの漏洩とハードウェアトロイの木馬の実装につながる可能性がある。
最小のリバースエンジニアリングでビットストリームを操作するためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:47:05 GMT)
Electrostatic Force Regularization for Neural Structured Pruning [6.7] 本稿では,DCNNのトレーニングプロセスに電荷と静電力の概念を取り入れた新しい手法を提案する。
この静電気的力は畳み込みフィルタに作用し、逆電荷のフィルタを非零重みに誘引するか、あるいは0重みに向かって電荷のようなフィルタを撃退する。
従来の手法とは異なり,本手法は実装が容易で,アーキテクチャの変更は一切必要とせず,重み付けとフィルタの重要度を同時に最適化する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:55:35 GMT)
Narrative-of-Thought: Improving Temporal Reasoning of Large Language Models via Recounted Narratives [6.6] 時間的推論において重要な課題である時間的グラフ生成について検討する。
この課題は,最も強力な言語モデルにおいても大きな課題となる。
本稿では,時間的推論,Narrative-of-Thoughtに適した新しいプロンプト手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:00:11 GMT)
MDA: An Interpretable and Scalable Multi-Modal Fusion under Missing Modalities and Intrinsic Noise Conditions [6.6] 本稿では,マルチモーダル学習の課題に対処するために,モーダル・ドメイン・アテンション(MDA)モデルを提案する。
MDAは、異なるモーダルに対して動的注意を適応的に割り当てる能力により、連続的な注意を通してモーダル間の線形関係を構築する。
以上の結果から,MDAと診断基準が一致していることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:08:23 GMT)
Modularity aided consistent attributed graph clustering via coarsening [6.5] グラフクラスタリングは、属性付きグラフを分割し、コミュニティを検出するための重要な教師なし学習手法である。
本稿では,ブロックの最大化最小化手法を用いて,対数行列,滑らか性,モジュラリティを組み込んだ損失関数を提案する。
我々のアルゴリズムはグラフニューラルネットワーク(GNN)と変分グラフオートエンコーダ(VGAE)をシームレスに統合し、拡張ノードの特徴を学習し、例外的なクラスタリング性能を実現する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:05:17 GMT)
Infinite Width Limits of Self Supervised Neural Networks [6.2] NTKと自己教師型学習のギャップを埋め、Barlow Twinsの損失下で訓練された2層ニューラルネットワークに焦点を当てる。
ネットワークの幅が無限大に近づくと、バーロウ・ツインズのNTKは確かに一定となる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:13:57 GMT)
TabDeco: A Comprehensive Contrastive Framework for Decoupled Representations in Tabular Data [6.0] 本研究では,行と列をまたいだアテンションベースの符号化手法であるTabDecoを紹介する。
革新的な機能の分離によって、TabDecoは既存のディープラーニングメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:42:46 GMT)
Iterative Camera-LiDAR Extrinsic Optimization via Surrogate Diffusion [5.9] カメラ-LiDARデータ融合は、スタンドアローンセンサーの欠陥を補うが、正確な外部キャリブレーションに依存している。
多くの学習に基づくキャリブレーション手法は,1ステップで外部パラメータを予測する。
本研究では,個々のキャリブレーション手法のキャパシティを大幅に向上させるため,サロゲート拡散に基づく単一モデル反復手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:21:37 GMT)
An Investigation of Offline Reinforcement Learning in Factorisable Action Spaces [5.9] RLのオフライン転送の成功に対するPivotalは、データから欠落した状態-動作ペアの値推定における過大評価バイアスを軽減する。
分解された離散的な行動空間は、自然に分解可能な行動を持つ多くの実世界の問題にもかかわらず、比較的ほとんど注目されていない。
本稿では, 因数化手法の事例を提示し, 因数化条件に適応したいくつかのオフライン手法の広範な実証評価を行う。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:31:14 GMT)
Improving User Experience in Preference-Based Optimization of Reward Functions for Assistive Robots [5.5] CMA-ES-IGは、ユーザの嗜好学習プロセスの経験を優先することを示す。
我々は,本アルゴリズムが,身体的,社会的なロボット作業にまたがる従来のアプローチよりも直感的であることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:52:58 GMT)
ConvMixFormer- A Resource-efficient Convolution Mixer for Transformer-based Dynamic Hand Gesture Recognition [5.3] 動的ハンドジェスチャのための新しいConvMixFormerアーキテクチャを探索し,考案する。
提案手法は,NVidia Dynamic Hand Gesture と Briareo のデータセットを用いて評価する。
我々のモデルは、単一およびマルチモーダル入力に対して最先端の結果を得た。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:58:41 GMT)
Elucidating the theoretical underpinnings of surrogate gradient learning in spiking neural networks [5.3] 脳内の情報処理を研究するには、スパイクニューラルネットワークのトレーニングが不可欠である。
スパイクのバイナリの性質は、直接勾配に基づくトレーニングの課題となっている。
ここでは、代理勾配と理論的に確立された2つのアプローチとの関係について検討する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:42:05 GMT)
DBF-Net: A Dual-Branch Network with Feature Fusion for Ultrasound Image Segmentation [5.1] 両枝深部ニューラルネットワークであるUBBS-Netを導入し, ボディーとバウンダリの関係を学習してセグメンテーションを改善する。
また,身体情報と境界情報を統合する機能融合モジュールを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:14:00 GMT)
Pseudo Replay-based Class Continual Learning for Online New Category Anomaly Detection in Advanced Manufacturing [5.0] 本稿では,新しい擬似リプレイ型連続学習フレームワークを開発する。
クラスインクリメンタル学習とオーバーサンプリングベースのデータ生成を統合している。
提案手法の有効性を3つのケーススタディで検証した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:22:02 GMT)
From Primes to Paths: Enabling Fast Multi-Relational Graph Analysis [5.0] マルチリレーショナルネットワークは、データの複雑な関係を捉え、バイオメディカル、ファイナンシャル、社会科学などの分野にまたがる多様な応用を持つ。
この研究は、ネットワーク内の異なる関係をユニークに表現するために素数を使用するプライム・アジャケーシ・マトリクス・フレームワークを拡張している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:43:01 GMT)
BCTR: Bidirectional Conditioning Transformer for Scene Graph Generation [5.0] シーングラフ生成(SGG)のためのセマンティックアライメント空間における新しい双方向コンディショニング因数分解法を提案する。
本稿では,双方向コンディショニングトランス (BCTR) を用いたエンド・ツー・エンドシーングラフ生成モデルを提案する。
BCTRは2つの重要なモジュールから構成されている。まず、双方向条件生成装置(BCG)は、エンティティと述語の間で多段階の対話的特徴拡張を行い、これらの予測間の相互強化を可能にする。
第二に、Random Feature Alignment(RFA)は、事前訓練されたモデルからマルチモーダルな知識を蒸留することによって特徴空間を正規化するために存在する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:30:27 GMT)
OOD-SEG: Out-Of-Distribution detection for image SEGmentation with sparse multi-class positive-only annotations [5.0] 医療・外科画像におけるディープニューラルネットワークはいくつかの課題に直面しており、そのうちの2つはこの問題に対処することを目指している。
まず、医用画像のための完全なピクセルレベルのセグメンテーションラベルを取得するのに時間がかかり、ドメインの専門知識を必要とする。
第二に、典型的なセグメンテーションパイプラインは、配布外ピクセルを検出できず、デプロイ中に急激なアウトプットが発生する傾向がある。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:53:09 GMT)
Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network [4.9] 本研究では、自己エンコーダに基づくデータ拡張技術と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
提案手法は,ランダムフォレスト,SVM,ロジスティック回帰をそれぞれ19%,21%,27%以上,98.56%の分類精度を達成している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:19:54 GMT)
Risks of Practicing Large Language Models in Smart Grid: Threat Modeling and Validation [4.9] 大規模言語モデル(LLM)は人工知能の重要なブレークスルーである。
以前の文献で示されているように、AI技術は様々なタイプの攻撃に影響を受けやすい。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:17:34 GMT)
Knowledge-enhanced Transformer for Multivariate Long Sequence Time-series Forecasting [4.6] 本研究では,変数間の概念的関係をよく定義された知識グラフ内にカプセル化する新しい手法を提案する。
PatchTST, Autoformer, Informer, Vanilla Transformer などのセマンティックアーキテクチャへの統合の影響について検討する。
この拡張により、変数間の固有の構造的関係に対処するトランスフォーマーベースのアーキテクチャが強化される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:53:54 GMT)
Forecasting the risk of software choices: A model to foretell security vulnerabilities from library dependencies and source code evolution [4.5] 図書館レベルでの脆弱性予測が可能なモデルを提案する。
我々のモデルは、将来の時間帯でソフトウェアプロジェクトがCVEの開示に直面する確率を推定することができる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:36:27 GMT)
Framework for developing and evaluating ethical collaboration between expert and machine [4.3] 精密医療は、アクセス可能な疾患診断とパーソナライズされた介入計画のための有望なアプローチである。
人工知能(AI)を活用することで、精密医療は個々の患者に対する診断と治療ソリューションを調整する。
しかし、医療応用におけるAIの採用は重大な課題に直面している。
本稿では,専門家誘導型マルチモーダルAIの開発と倫理的評価を行う枠組みを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 06:49:38 GMT)
Learned Scalable Video Coding For Humans and Machines [4.1] ベース層にエンド・ツー・エンドの学習可能なビデオタスクを導入し,その拡張層はベース層とともに人間の視聴のための入力再構成をサポートする。
我々のフレームワークは、その基盤層において、最先端の学習と従来のビデオコーデックの両方を上回り、その拡張層では、人間の視覚タスクに匹敵する性能を維持している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:51:14 GMT)
Spectral Subspace Clustering for Attributed Graphs [4.0] 部分空間クラスタリングは、n 個のデータポイントの集合を k (kn) グループに分割する部分空間を同定しようとする。
本稿では,SCAG計算に有効な2つのアルゴリズム,S2CAGとM-S2CAGを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:22:15 GMT)
Leveraging AI and NLP for Bank Marketing: A Systematic Review and Gap Analysis [3.8] 本研究では,既存の文献を体系的にレビューし,銀行マーケティングにおけるAIとNLPの現状を評価する。
戦略的ギャップ分析は、NLPがマーケティング戦略をさらに強化できる重要な領域を特定する。
この発見は、NLP駆動型成長と革新フレームワークを開発する上で、実用的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:44:12 GMT)
Video Diffusion Models: A Survey [3.8] 拡散生成モデルは近年、高品質でコヒーレントなビデオコンテンツを作成し、修正するための強力な技術となっている。
本調査では,映像生成における拡散モデルの重要な構成要素について概説する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:40:09 GMT)
LLäMmlein: Compact and Competitive German-Only Language Models from Scratch [3.7] 我々は、2つのドイツ専用デコーダモデル、LL"aMmlein 120Mと1Bを作成し、それらをスクラッチから透過的に公開し、トレーニングデータとともに、ドイツのNLP研究コミュニティが使用できるようにしました。
モデルトレーニングには、広範なデータ前処理、カスタムなドイツのトークン化器の作成、トレーニング自体、および様々なベンチマークの最終モデルの評価など、いくつかの重要なステップが含まれていた。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:44:34 GMT)
Anomaly Detection for People with Visual Impairments Using an Egocentric 360-Degree Camera [3.3] 視覚障害者の異常な状況を検出するための第一歩として,360度カメラを用いて周囲を観察する手法を提案する。
我々は、視覚障害者が遭遇する可能性のある異常な活動を含む、新しいエゴセントリックな360度ビデオデータセットVIEW360を紹介した。
本稿では,異常事象のフレームレベルの予測と方向の同定を容易にするFDPNというアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:52:34 GMT)
Area under the ROC Curve has the Most Consistent Evaluation for Binary Classification [3.2] 本研究は, 有病率の異なるデータ間でのモデル評価において, 測定値の整合性について検討する。
有病率の影響を受けない評価指標は、個々のモデルの一貫性のある評価と、モデルの集合の一貫性のあるランキングを提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:33:56 GMT)
Improved AutoEncoder with LSTM module and KL divergence [3.1] 本稿では,LSTMモジュールとKullback-Leibler divergence(IAE-LSTM-KL)モデルを用いた改良オートエンコーダを提案する。
IAE-LSTM-KLモデルの有効性は、合成データセットと実世界のデータセットの両方で実験によって検証される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:41:12 GMT)
Safely Learning with Private Data: A Federated Learning Framework for Large Language Model [3.1] フェデレートラーニング(FL)は、分散プライベートデータを用いたモデルのトレーニングに理想的なソリューションである。
FedAvgのような従来のフレームワークは、大きな言語モデル(LLM)には適さない
本稿では,サーバサイド攻撃とピアクライアント攻撃の両方によるデータ漏洩を防止するFL-GLMを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:45:44 GMT)
Enhancing Cross-Modal Contextual Congruence for Crowdfunding Success using Knowledge-infused Learning [3.1] この研究は、知識グラフからの外部コモンセンス知識を取り入れ、コンパクトなビジュアル言語モデル(VLM)を用いたマルチモーダルデータの表現を強化する。
以上の結果から,外部知識がテキストと画像モダリティのセマンティックギャップを橋渡しし,知識を注入した表現により,ベースライン上でのキャンペーン成功の予測性能が向上することが示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:40:50 GMT)
Distributed solar generation forecasting using attention-based deep neural networks for cloud movement prediction [3.0] 雲の動きを予測するための注意に基づく畳み込み長短期記憶ネットワークを提案し,雲の動きを予測するために既存の自己注意に基づく手法を適用した。
高い高度での雲の場合、注意に基づく手法を用いて得られた雲の予測は、非注意に基づく手法と比較して、太陽の予測スキルスコアが5.86%以上改善されることが判明した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:37:35 GMT)
A Monocular SLAM-based Multi-User Positioning System with Image Occlusion in Augmented Reality [2.8] 単眼RGB画像を用いたORB-SLAM2に基づくマルチユーザローカライゼーションシステムを提案する。
このシステムはユーザのローカライゼーションを行うだけでなく、共通の仮想オブジェクトを平面上に配置し、各ユーザがオブジェクトの適切な視点ビューを保持する。
位置情報は、特定のユーザの空間における他のユーザの相対的な位置と動きを提示する中央サーバを介して、ユーザのARデバイス間で渡される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:39:30 GMT)
Program Evaluation with Remotely Sensed Outcomes [2.7] 最近の経験的作業は、地中実測値ではなく、リモートセンシング変数(RSV)、携帯電話活動や衛星画像を用いた治療効果を推定している。
一般的な実践は、ラベル付きRSVの補助サンプルを用いてRSVの経済効果を予測し、実験の結果としてそのような予測を使用する。
提案手法は,RSVがポストアウトカム変数である場合に,治療効果の偏りが生じることを実証する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:43:04 GMT)
Beyond Human-Like Processing: Large Language Models Perform Equivalently on Forward and Backward Scientific Text [2.6] 大規模言語モデル (LLM) は, 前方および後方の両方において, 人間の専門家のパフォーマンスを上回りうることを示す。
この結果は,気象予測やタンパク質設計など,さまざまな領域にわたるトランスフォーマーの成功と一致している。
言語課題におけるLLMの成功を人為的なメカニズムの証拠として解釈する上での注意が必要である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:48:24 GMT)
Skeleton-Guided Spatial-Temporal Feature Learning for Video-Based Visible-Infrared Person Re-Identification [2.6] 映像に基づく視覚的赤外線再識別(VVI-ReID)は,特徴的相違により困難である。
VVI-ReIDのための新しいスケルトン誘導時空間フェースリーニング(STAR)法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:18:05 GMT)
Data-efficient and Interpretable Inverse Materials Design using a Disentangled Variational Autoencoder [2.6] 逆材料設計は、新しい物質発見の加速に成功している。
多くの逆材料設計法では、教材表現のコンパクトな記述を提供するために潜在空間を学習する教師なし学習を用いる。
本稿では,不整合変分オートエンコーダをベースとした半教師付き学習手法を提案し,特徴,潜伏変数,対象特性の確率的関係を学習する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:11:44 GMT)
Gaze-Assisted Medical Image Segmentation [2.5] 医用画像(MedSAM)におけるSegment Anything Modelの微調整のプロンプトとして,腹部画像の読影データを用いた。
視線支援MedSAMの結果は,最先端のセグメンテーションモデルよりも優れていた。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:41:36 GMT)
Hyperspectral Imaging-Based Grain Quality Assessment With Limited Labelled Data [2.5] ハイパースペクトルイメージング(HSI)と少数ショット学習技術を用いた粒質評価の新しい手法を提案する。
HSIは、空間情報とスペクトル情報の両方をキャプチャすることで、非侵襲的でリアルタイムな代替手段を提供する。
まず,訓練中に見られた粒型の分類と,第2に目に見えない粒型への一般化の2つのシナリオにおいて,少数ショット分類器の性能を評価した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:02:18 GMT)
Blockchain for Large Language Model Security and Safety: A Holistic Survey [2.4] 大規模な言語モデルのセキュリティと安全性を高めるためにブロックチェーン技術を活用する方法を評価することを目的としています。
本稿では,大規模言語モデル(BC4LLM)のためのブロックチェーンの新しい分類法を提案する。
私たちの分析には、BC4LLMのコンテキストにおけるセキュリティと安全性を規定する新しいフレームワークと定義が含まれています。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:23:45 GMT)
Leveraging Large Language Models for Generating Labeled Mineral Site Record Linkage Data [2.4] Record Linkageは、同一エンティティを参照するレコードを識別することによって、さまざまなデータソースを統合する。
ミネラル・サイト・レコード・リンクは、空間的レコード・リンク・カテゴリに該当する。
従来のPLM法に比べてF1スコアは45%以上向上した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:26:56 GMT)
LLM-assisted Physical Invariant Extraction for Cyber-Physical Systems Anomaly Detection [2.3] サイバー物理システム(CPS)は、破滅的な影響のあるサイバー攻撃に対して脆弱である。
CPS設計文書は、しばしば意味的にリッチな物理手順の記述を含んでいる。
異常検出のためのCPSテストベッドから物理不変量を抽出する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:09:04 GMT)
From Crime to Hypercrime: Evolving Threats and Law Enforcement's New Mandate in the AI Age [2.2] 本稿では,犯罪の軌跡を考察し,従来の形態からサイバー犯罪におけるデジタル表現への進化をたどる。
この研究は、AI駆動のハイパークライムがもたらす課題に対応するために、法執行戦略のパラダイムシフトを求めている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:58:19 GMT)
Validating GWAS Findings through Reverse Engineering of Contingency Tables [2.1] 本稿では,データセット共有を必要とせずに意図しない誤りを検出するGWAS検証手法を提案する。
提案手法は, GWAS結果から得られるp値を利用して, 単一ヌクレオチド多型(SNP)の一致度を推定する。
信頼性の高いしきい値に該当する結果を検証し、しきい値を超える結果を警告し、さらなる検査を行う。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:35:05 GMT)
Reinforcement Learning for Financial Index Tracking [2.0] 本稿では、回帰ベースのトラッキングエラーと値ベースのトラッキングエラーの両方の下で、金融指標追跡問題の最初の離散時間無限水平動的定式化を提案する。
提案手法は, 追跡精度でベンチマーク手法を上回り, キャッシュ引き出し戦略により余剰利益を得る可能性がある。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:53:03 GMT)
Back-filling Missing Data When Predicting Domestic Electricity Consumption From Smart Meter Data [2.0] 本研究は、国内電力スマートメーターのデータを用いて、年間電力料金を1年間見積もる。
我々は,1年未満のスマートメーターデータを持つユーザに対して,最大6ヶ月間,データスマートメーターをバックフィルする手法を開発した。
我々は,昼,夜,ピーク利用パターンに基づいて,家庭の電力消費ユーザプロファイルを5つ同定した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 15:03:59 GMT)
A Comprehensive Survey on Visual Question Answering Datasets and Algorithms [1.9] 我々は、VQAデータセットとモデルの現状を慎重に分析し、それらを異なるカテゴリにきれいに分割し、各カテゴリの方法論と特徴を要約する。
VQAモデルの6つの主要なパラダイムを探求する。融合、注意、あるモードからの情報を用いて、別のモードからの情報をフィルタリングする技法、外部知識ベース、構成または推論、グラフモデルである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:52:06 GMT)
Model-Agnostic Covariate-Assisted Inference on Partially Identified Causal Effects [1.9] 多くの因果推定値は、潜在的な結果間の観測不能な関節分布に依存するため、部分的にしか識別できない。
本研究では,部分的同定された推定値の広いクラスに対して,統一的かつモデルに依存しない推論手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 05:39:29 GMT)
Analyzing Pokémon and Mario Streamers' Twitch Chat with LLM-based User Embeddings [1.8] Twitchの各ストリーマー(SmallAnt、DougDoug、PointCrow)によって、ひとつのストリームのチャットを分析します。
以上の結果から,各ストリーマーにはそれぞれ独自のタイプのおしゃべり機能があることが示唆された。ただし,支持的な視聴者と絵文字,反応送信者という,すべてのストリーマーに2つのカテゴリが出現する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:08:03 GMT)
Teaching Program Decomposition in CS1: A Conceptual Framework for Improved Code Quality [1.8] 私たちは、確立されたコードスタイルの原則に基づく概念的なフレームワークを提示することで、これらの質問に答えることを目指しています。
この体系的なアプローチは自動化可能であり、ビジュアライザ、自動フィードバックジェネレータ、デジタルチューターを実装するためにさらに使用できる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:40:10 GMT)
Improving LLM Classification of Logical Errors by Integrating Error Relationship into Prompts [1.7] プログラミング教育の重要な側面は、エラーメッセージの理解と処理である。
プログラムがプログラマの意図に反して動作している「論理エラー」は、コンパイラからエラーメッセージを受け取らない。
そこで本研究では,LLMを用いた論理的誤り検出手法を提案し,この手法を用いて,Chain-of-ThoughtとTree-of-Thoughtのプロンプトのエラータイプ間の関係を推定する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:49:58 GMT)
Evolution of SAE Features Across Layers in LLMs [1.6] 隣接層における特徴間の統計的関係を解析し, 前方通過による特徴の進化を理解する。
私たちは、機能とその最もよく似た隣人のためのグラフ視覚化インターフェイスを提供し、レイヤ間で関連する機能のコミュニティを構築します。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:45:45 GMT)
Careless Whisper: Exploiting Stealthy End-to-End Leakage in Mobile Instant Messengers [1.5] メッセージが十分に暗号化されている場合でも、ユーザとそのデバイスに関する個人情報は敵によって抽出可能であることを示す。
攻撃者が、ユーザデバイス数、オペレーティングシステム数、オンラインおよびアクティビティステータスなどのプライベート情報を抽出する方法を実証する。
脆弱なメッセンジャー(WhatsAppとSignal)が広く採用されていることから、20億人以上の顧客が電話番号を知るだけでターゲットにできることを示している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:58:28 GMT)
Continual Learning with Hebbian Plasticity in Sparse and Predictive Coding Networks: A Survey and Perspective [1.4] ニューロモルフィック連続学習システムの新たなクラスは、ハエの新たな情報を統合することを学ばなければならない。
このサーベイは、最先端スパースと予測符号化技術に基づくニューロモルフィック連続学習の分野における最近の多くの研究をカバーしている。
この調査は神経形連続学習の分野での今後の研究に貢献することが期待されている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:13:40 GMT)
Generating medical screening questionnaires through analysis of social media data [1.4] ソーシャルメディア投稿から,所定の医療状況に対するスクリーニングアンケート作成の可能性について,予備調査を行った。
我々はRedditの数百人のユーザーのデータを用いて,3つの条件に対するアンケートを作成する。
以上の結果から,少なくとも部分的には,アンケート生成のプロセスが自動化可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:57:18 GMT)
ERATTA: Extreme RAG for Table To Answers with Large Language Models [1.3] 検索拡張現実(RAG)を備えた大規模言語モデル(LLM)は、スケーラブルな生成AIソリューションに最適な選択肢である。
本研究では,データ認証,ユーザクエリルーティング,データ検索,エンタープライズデータテーブルからの質問応答機能へのカスタムプロンプトを実現するために,複数のLLMを起動可能なLLMベースのユニークなシステムを提案する。
提案するシステムと評価基準は,持続可能性,財務状況,ソーシャルメディア領域において,数百のユーザクエリに対して,90%以上の信頼性スコアを達成している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:23:40 GMT)
Inter-linguistic Phonetic Composition (IPC): A Theoretical and Computational Approach to Enhance Second Language Pronunciation [1.3] 第二言語(L2)の学習者は、しばしば意識不明なL2音素を母語(L1)から類似の音素で置き換える
この音素置換は、L2の標準的な音韻学的パターンから逸脱する。
誤り音素移動を最小限に抑える新しい計算法として,言語間音声合成法(IPC)を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 01:15:58 GMT)
More nonlocality with less incompatibility in higher dimensions: Bell vs prepare-measure scenarios [1.2] Collins-Gisin-Linden-Massar-Popescu不等式(CGLMP)の不等式は不整合の量に非単調に反応することを示す。
CHSHの場合とは異なり、高次元における最大違反状態は測定の不整合性の量に依存する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 18:55:54 GMT)
Flood Risk Assessment of the National Harbor at Maryland, United States [1.0] 海岸沿いの住宅地の増加や気候変動により、都市部では洪水が増している。
研究エリアには、国立ハーバー、MD、およびワシントン砦の周辺地域が含まれる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:33:15 GMT)
Freqformer: Frequency-Domain Transformer for 3-D Visualization and Quantification of Human Retinal Circulation [0.9] Freqformerはトランスフォーマーベースのアーキテクチャで、単一のスキャンから人間の網膜循環を3Dで高解像度で可視化するように設計されている。
提案手法は,最先端の畳み込みニューラルネットワーク(CNN)およびトランスフォーマーモデルより優れる。
Freqformerは網膜循環の理解と特性を著しく改善し、潜在的な臨床応用を提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:38:39 GMT)
Mixing Neural Networks and Exponential Moving Averages for Predicting Wireless Links Behavior [0.9] 密集した屋内環境におけるWi-Fiリンク品質予測のための2つのニューラルネットワークモデルについて検討した。
実験結果から, 指数移動平均に基づく従来の手法よりも精度が優れていた。
これは、困難な運用環境でのスペクトルの振る舞いを予測するニューラルネットワークの可能性を強調している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:13:07 GMT)
FastDraft: How to Train Your Draft [0.7] 我々はFastDraftを紹介します。FastDraftは、ドラフトモデルを任意の大きな言語モデルに事前トレーニングし、調整するための、新しく効率的なアプローチです。
我々は、人気のあるPhi-3-miniとLlama-3.1-8Bモデルの2つの高パラメータ効率ドラフトをトレーニングすることで、FastDraftを実証する。
FastDraftを使って、Intel$circledR$Gaudi$circledR$2アクセラレータを24時間以内に1つのサーバに約100億のトークンでドラフトを作成することができました。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:32:44 GMT)
Towards a framework on tabular synthetic data generation: a minimalist approach: theory, use cases, and limitations [0.7] このフレームワークは、実生活の金融アプリケーションと平行する高次元のクレジットスコアリングデータに適用される。
提案手法は単純であり,解釈可能性を保証するとともに,追加のチューニングを必要とせず,独特なメリットを提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 06:37:54 GMT)
Machine learning-based probabilistic forecasting of solar irradiance in Chile [0.7] 本研究はチリの第三地域及び第四地域における太陽放射の確率論的予測について検討する。
ニューラルネットワークを用いた後処理手法を提案し、8員のアンサンブル予測を改善した。
全ての予測は30か所の観測結果に対して評価され、後処理の予測技術は生のWRFアンサンブルと比較される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:22:05 GMT)
A Topic-aware Comparable Corpus of Chinese Variations [0.7] Dcard for Taiwanese Mandarin と Sina Weibo for Mainland Chinese を使って、定期的に更新し、ソーシャルメディア上でのモダンな言語使用を反映した、同等のコーパスを作成します。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 04:06:12 GMT)
Dynamics of Resource Allocation in O-RANs: An In-depth Exploration of On-Policy and Off-Policy Deep Reinforcement Learning for Real-Time Applications [0.7] 本稿では、オープン無線アクセスネットワーク(O-RAN)の資源配分分野における2つのDRLモデル(オン・ポリティシーとオフ・ポリティシー)の適用について検討する。
Nessrine Hammami と Kim Khoa Nguyen の原著に触発されたこの研究は、この発見を検証し証明するための複製である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:46:40 GMT)
Controlling Recurrent Neural Networks by Conceptors [0.5] 本稿では, 非線形力学と概念抽象と論理の基本原理を結合した, 概念論という, 神経力学の機構を提案する。
単一のニューラルネットワーク内の多数の動的パターンを学習、保存、抽象化、フォーカス、モーフィック、一般化、デノイズ化、認識することが可能になります。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:20:18 GMT)
DocNet: Semantic Structure in Inductive Bias Detection Models [0.5] 本稿では,文書におけるバイアス検出の見過ごされがちな側面として,ニュース記事の意味的構造について考察する。
本稿では,新しい,インダクティブで低リソースなドキュメント埋め込みとバイアス検出モデルであるDocNetを提案する。
また、文書レベルのグラフ埋め込みに代表される、対立するパルチザン側からのニュース記事のセマンティック構造が顕著に類似していることも示している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:30:24 GMT)
Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4] 汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:39:50 GMT)
VeGaS: Video Gaussian Splatting [0.4] 本稿では,映像データの現実的な修正を可能にするVeGaS(VeGaS)モデルを提案する。
VeGaSはフレーム再構築タスクにおいて最先端のソリューションよりも優れています。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:02:36 GMT)
FiSTECH: Financial Style Transfer to Enhance Creativity without Hallucinations in LLMs [0.4] 我々は,大規模言語モデル(LLM)の自己修正的自己回帰特性を探求し,最小限のプロンプトで書き方で創造性を学習する。
本稿では,2段階のファインチューニング(FT)戦略を提案し,第1段階のパブリックドメインファイナンシャルレポートを用いて書体スタイルのトレーニングを行い,LLMの幻覚を許容する。
提案する2段階ファインチューニングは,幻覚を50%以上減らしながら,2段階の金融質問の精度を向上する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:22:31 GMT)
Reinforcing Competitive Multi-Agents for Playing So Long Sucker [0.4] 本稿では,戦略ゲームSo Long Suckerにおける古典的深層学習(DRL)アルゴリズム,DQN,DDQN,Dueling DQNの使用について検討する。
研究の第一の目的は、古典的なDRL手法を用いて、ゲームのルールと戦略を自律エージェントに教えることである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:38:13 GMT)
Privacy Guarantees for Personal Mobility Data in Humanitarian Response [0.4] 集約されたモビリティトレースでさえ、個人の動きに関する情報を悪意のあるアクターに公開することができる。
本稿では,個人の移動データを公開するためのアプローチを開発し,検証し,基礎となる被験者のプライバシーに関する公式な保証を提供する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:42:41 GMT)
Variational Bayesian Bow tie Neural Networks with Shrinkage [0.3] 我々は、標準フィードフォワード修正ニューラルネットワークの緩和版を構築した。
我々は、条件付き線形およびガウス的モデルをレンダリングするために、Polya-Gammaデータ拡張トリックを用いる。
層間における分布仮定や独立性を回避する変分推論アルゴリズムを導出する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:36:30 GMT)
AppSign: Multi-level Approximate Computing for Real-Time Traffic Sign Recognition in Autonomous Vehicles [0.3] AppSignは、CNNの畳み込み操作を近似することにより、CNNベースのトラフィックサイン認識ユニットに適用される。
実時間信号認識におけるAppSignの有効性を,いくつかの実験により評価した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:12:02 GMT)
Capturing Sparks of Abstraction for the ARC Challenge [0.1] 商用のLarge Language Models(LLM)でさえ、多くの問題を"理解"するのに苦労しています。
LLM出力から'Sparks of Abstraction'を抽出できることを実証する。
arc-dsl-llm DSLフレームワークとGemini LLM生成データの両方がオープンソースになっている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 23:40:00 GMT)
You can remove GPT2's LayerNorm by fine-tuning [0.0] GPT型トランスモデルにおけるLayerNorm(LN)層は、長年にわたり機械的解釈可能性の障害となっている。
LNは、大規模な言語モデルのトレーニングを安定させるために必要な重要なコンポーネントである。
トレーニングデータの分数(500Mトークン)を微調整することにより,事前学習したGPT2小モデルからLN層を除去できることを示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 22:32:53 GMT)
Vortex information in multiphoton scalar pair production [0.0] 多光子系において, 円偏光場におけるスカラー対生成の渦情報について検討した。
渦配向は生成粒子の固有軌道角運動量と関連していることがわかった。
軌道角運動量、すなわち位相電荷の大きさは吸収光子の個数によって決定される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 13:09:46 GMT)
Tunneling dynamics of the relativistic Schrodinger/Salpeter equation [0.0] サルペター方程式に従って進化する粒子波束の電位散乱とトンネル力学について検討した。
サルペーター方程式のトンネル特性は標準相対論的波動方程式と異なる。
これらの溶液は、クライントンネルの欠如と、光円錐の外側を伝播する送信波束の分画に対する電位の影響によって特徴づけられる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:34:19 GMT)
Trapped-ion laser cooling in structured light fields [0.0] 本研究は,Nulledキャリアドライブによる選択的サイドバンド励起を実現する構造光プロファイルのレーザ冷却について考察する。
電磁誘導透過(EIT)を用いたLmb-Dicke系(LDR)を超えるドップラー冷却と基底状態(GS)冷却の性能を定量化する。
以上の結果から,レーザー冷却におけるボトルネックを軽減するための簡単な構造光プロファイルと,トラップイオンシステムの基本的な動作品質を向上させるためのスケーラブルフォトニックデバイスの可能性が示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 16:09:58 GMT)
Supervised machine learning for microbiomics: bridging the gap between current and best practices [0.0] 機械学習(ML)は、臨床微生物学の革新を推進しようとしている。
本研究の目的は、微生物学における現在のML実践の改善に必要な重要な領域を特定することである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:46:23 GMT)
Sketch 'n Solve: An Efficient Python Package for Large-Scale Least Squares Using Randomized Numerical Linear Algebra [0.0] 我々は、効率的なランダム化数値線形代数手法を実装したオープンソースのPythonパッケージであるSketch 'n Solveを提案する。
本研究では, 従来のLSQRよりも最大50倍の高速化を実現し, 精度も高いことを示す。
このパッケージは、機械学習の最適化、信号処理、科学計算の応用に特に有望であることを示している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:51:30 GMT)
Robust Defense Against Extreme Grid Events Using Dual-Policy Reinforcement Learning Agents [0.0] 強化学習(RL)エージェントは電力グリッドを管理する強力なツールである。
大量のデータを使ってアクションを通知し、フィードバックとして報酬を受け取り、システムに対して好意的な反応を学習する。
この能力は、RL剤の需要が増加している電力ネットワークの脱炭に特に有用である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:30:48 GMT)
Optimizing Entanglement in Nanomechanical Resonators through Quantum Squeezing and Parametric Amplification [0.0] 本研究では, ナノメカニカル共振器の絡み合いを, 放射圧を補助する圧縮磁場の量子状態伝達により最適化する手法を提案する。
システムは、機械共振器の同時冷却を可能にする、赤みがかったレーザー磁場によって駆動される。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:16:20 GMT)
Non-classicality induces recombination in high-harmonic generation with circularly polarized fields [0.0] 高調波発生(英: high-harmonic generation、HHG)は、強い駆動場が物質と相互作用する過程であり、それによってドライバーの高次高調波への周波数アップコンバージョンが生じる。
我々は、古典的でない構造光を用いることで、古典的な運転者にとって、この非古典的な構成でHHGが実現可能であることを実証する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:19:44 GMT)
Modulating Reservoir Dynamics via Reinforcement Learning for Efficient Robot Skill Synthesis [0.0] 貯水池と呼ばれるランダムなリカレントニューラルネットワークは、コンテキスト入力で条件付けられたロボットの動きを学習するために使用することができる。
本稿では,新しいRCベースのLearning from Demonstration(LfD)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:25:54 GMT)
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer's Detection [0.0] アルツハイマー病(英: Alzheimer's disease、AD)は、何百万人もの患者で毎年診断される、最も一般的な神経変性疾患である。
従来のCNNは画像中の大量の低レベル情報を抽出できるが、高レベルの極小粒子を抽出することができない。
本稿では,異なるスケールでの情報抽出と効率的な情報フローを組み合わせた新しいグラニュラー特徴統合手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:55:19 GMT)
Instruct-Tuning Pretrained Causal Language Models for Ancient Greek Papyrology and Epigraphy [0.0] 本稿は、古代ギリシアの碑文やドキュメンタリーパピルスの欠落した文字を復元するために、事前訓練された因果関係言語モデルを微調整する実験について述べる。
最新技術モデル (Ithaca) と比較すると、テキスト復元に優れた命令調整モデルである。
以上の結果から,修正および予想のための命令テンプレートを用いた事前学習型因果言語モデルの微調整が有望であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:28:01 GMT)
Improving Math Problem Solving in Large Language Models Through Categorization and Strategy Tailoring [0.0] 問題分類のための機械学習モデルを開発し、よく設計されたトレーニングデータセットを作成することにより、その精度を著しく向上させることができることを示す。
LLMの幻覚を減らし、高度な数学的問題に対処する可能性を解き放つための重要なステップである。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 00:59:42 GMT)
Improved YOLOv5 Based on Attention Mechanism and FasterNet for Foreign Object Detection on Railway and Airway tracks [0.0] 本稿では,FasterNetを取り入れたYOLOv5アーキテクチャの改良と,鉄道や空港の滑走路における異物検出の促進を目的としたアテンション機構を提案する。
このデータセットは、外部オブジェクトターゲットの認識能力を改善することを目的としている。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 10:58:50 GMT)
ForPKG-1.0: A Framework for Constructing Forestry Policy Knowledge Graph and Application Analysis [0.0] ポリシー知識グラフは、プロジェクトコンプライアンス、ポリシー分析、インテリジェントな質問応答といったタスクの意思決定支援を提供することができる。
本稿では、林業分野に着目し、完全な政策知識グラフ構築フレームワークを設計する。
知識グラフリソースはオープンソースプラットフォーム上でリリースされ、森林政策関連の知的システムの基本的な知識基盤として機能する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:45:52 GMT)
Federated Learning for UAV-Based Spectrum Sensing: Enhancing Accuracy Through SNR-Weighted Model Aggregation [0.0] 無人航空機(UAV)ネットワークは、3D空間、その課題、そして機会に関して異なる視点を必要とする。
本稿では,その分散特性と計算能力の制限を考慮した,UAVネットワークにおけるスペクトルセンシングのためのFLに基づく手法を提案する。
我々はまた、UAVが観測した信号と雑音の比率を考慮し、グローバルモデルを得るフェデレーションアグリゲーション手法、すなわちFedSNRを開発した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 19:24:49 GMT)
Exact WKB in all sectors I: Potentials with degenerate saddles [0.0] エネルギーパラメータ $u$ に対して,ボレル和可能性に使用される(半古典的)拡張パラメータの共通複素化とは異なる,新しい複素化手法を導入する。
潜在的な障壁のトップの上の$A$サイクルを再定義することにより、量子化条件が真であることを保証する。
本稿では,Weber-type exact-WKB法について論じる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 12:13:31 GMT)
Error filtration for quantum sensing via interferometry [0.0] Dephasingは、量子情報を必要とする主要なノイズメカニズムである。
本稿では,デフォーカスの効果を軽減するため,ハードウェアによる誤りフィルタリング方式について論じる。
この手法をコヒーレント状態の保存と星間干渉の位相安定化に応用する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:22:55 GMT)
Enhanced Anime Image Generation Using USE-CMHSA-GAN [0.0] 本稿では,高品質なアニメキャラクタ画像を生成するために,新しいジェネレーティブ・アドバイサル・ネットワークモデルUSE-CMHSA-GANを提案する。
アニメ対面データセットを用いて実験を行い, USE-CMHSA-GANが他のベンチマークモデルより優れていることを示した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:25:24 GMT)
Efficient quantum algorithm for weighted partial sums and numerical integration [0.0] 本稿では,量子状態振幅の部分和と特定の重み付き部分和を効率よく計算する量子アルゴリズムを提案する。
提案した量子アルゴリズムは、ゲートの複雑さと回路深さで所望の部分和を達成するために、独自のユニタリ構成を用いる。
また、偶数または奇数成分の部分和と、より複雑な重み付け和を所定の間隔で評価するためにアルゴリズムを拡張した。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 07:03:32 GMT)
Dispersion Pre-compensation in Asymmetric Measurement Device Independent Quantum Key Distribution for Improved Secret Key Generation [0.0] 測定デバイス非依存量子鍵分布(MDI-QKD)では、非対称チャネルの分散によりキーレートが著しく低下する。
本研究は、分散補償のための強度と位相変調器を利用してこの問題に対処し、分散補償ファイバ(DCF)の付加損失を回避する。
このアプローチはキーレートを高め、通信距離を長くする。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:56:06 GMT)
Demonstration of logical qubits and repeated error correction with better-than-physical error rates [0.0] 我々は,フォールトトレラント符号化と誤り訂正を用いて,物理誤差率以下のレベルまで論理誤差率を抑えることができる,トラップイオンQCCDプロセッサの実験を行った。
結果は、ノイズの多い中間量子コンピューティングから信頼性のある量子コンピューティングへの移行を示し、大規模フォールトトレラント量子コンピューティングへの高度な能力を示す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 20:10:48 GMT)
DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring [0.0] 冠状動脈カルシウム(CAC)スコアは、冠動脈疾患を予防するためのリスクアセスメントの鍵となる。
本研究では、DINOの自己教師型学習(SSL)技術(ラベルなし自己蒸留)を取り入れることで、このアプローチを拡張した。
DINOモデルは、重要な特徴を効果的に捉え、強調する機能を生成することを目的として、ラベルを使用することで、石灰化領域に特に焦点を合わせるように訓練されている。
ラベル誘導DINO(DINO-LG)は,石灰化を含むCTスライスと石灰化しないスライスを区別し,標準DINOモデルよりも57%の精度で分類を向上する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 02:51:16 GMT)
Connection between gravity and quantum mechanics: an algebraic approach to cosmological issues [0.0] ブラックホールは、量子論と一般相対性理論の間の橋渡しとして機能する。
この研究は、ブラックホール物理学を理解することが、主要な宇宙物理学と天体物理学のパラドックスの解決に不可欠であると仮定している。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 11:55:16 GMT)
Confronting Project Conflicts into Success: a Complex Systems Design Approach to Resolving Stalemates [0.0] 今日の複雑なプロジェクト開発では、ステークホルダーがしばしば遅すぎる。
純粋に連想的かつアプリオリなデザイン支援アプローチは、システムの現実とステークホルダーの利益の両方を統合する。
最先端のPreferendusは、最適な汎用ソリューションを共同で生成するためにデプロイされる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:47:42 GMT)
Characterization of coherent errors in gate layers with robustness to Pauli noise [0.0] 最先端のキャラクタリゼーションプロトコルは、しばしばコヒーレントノイズに焦点を当て、パウリやクリフォード・トワイリング技術を使用する際のコヒーレントエラーを取り除く。
我々は,不整合局所パウリ雑音モデルの拡張をコヒーレントエラーに動機付け,任意のゲート層に対する実用的な特徴付けプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 21:38:44 GMT)
CCi-YOLOv8n: Enhanced Fire Detection with CARAFE and Context-Guided Modules [0.0] 都市部や森林地帯での火災は深刻な脅威となる。
小型火災や煙の検知を目標とした改良型YOLOv8モデルであるCCi-YOLOv8nを提案する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:31:04 GMT)
Beyond Normal: Learning Spatial Density Models of Node Mobility [0.0] 本稿では,ディスク上の移動ノード密度を記述するために,既成混合密度ネットワークモデルの適用性の問題に対処する。
我々は、対称空間関係を維持するためにM"obius分布を用いることを提案するが、一方が円盤を放射的に横切ると変化を捉えるのに十分柔軟である。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 08:10:39 GMT)
Artificial Intelligence in Cybersecurity: Building Resilient Cyber Diplomacy Frameworks [0.0] 本稿では、自動化と人工知能(AI)が米国のサイバー外交をいかに変えつつあるかを考察する。
これらの技術を活用することで、米国はサイバー外交の複雑さと緊急性を管理することができる。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 17:57:17 GMT)
Activation Functions for "A Feedforward Unitary Equivariant Neural Network" [0.0] 前報では,フィードフォワード一元同変ニューラルネットワークについて紹介した。
このネットワークに適した3つのアクティベーション関数を提案した。
本稿では,これらの活性化関数を単一機能形式に一般化する。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 09:46:52 GMT)
A Complete Graphical Language for Linear Optical Circuits with Finite-Photon-Number Sources and Detectors [0.0] 無限次元ボソニックフォック空間を推論するグラフィカル言語であるtextbfLO_fi$-calculusを導入する。
2つの $textbfLO_fi$-circuits は同じ量子過程を表す。
論文参考訳(メタデータ) (Sun, 17 Nov 2024 14:46:19 GMT)