ForgerySleuth: Empowering Multimodal Large Language Models for Image Manipulation Detection [107.9] 我々はForgerySleuthを提案し、包括的ヒント融合を行い、改ざんされた領域を示すセグメンテーション出力を生成する。
ForgeryAnalysisの有効性を実証し,ForgerySleuthが既存手法の堅牢性,一般化性,説明可能性において著しく優れていたことを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:35:18 GMT)
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs [102.7] そこで我々は,T2Vidと呼ばれるビデオライクなサンプルを合成し,学習コーパスの多様性を高める手法を開発した。
提案手法は,長いビデオサンプルをトレーニングすることなく,長いビデオ理解の性能を向上させることができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:54 GMT)
Deepfake Media Generation and Detection in the Generative AI Era: A Survey and Outlook [101.3] 本研究は,近年の現場開発を含むディープフェイク発生・検出技術について調査する。
偽コンテンツの変更や生成に使用する手順に従って,様々な種類のディープフェイクを識別する。
我々は,分布外コンテンツに基づくディープフェイク検出のための新しいマルチモーダル・ベンチマークを開発した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:29:25 GMT)
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation [100.3] VLA(Vision-Language-Action)モデルは、言語誘導されたタスクの実行と、目に見えないシナリオへの一般化の観点から、ロボット操作を改善した。
VLM(Vision-Language-Models)に基づく新しい高度なVLAアーキテクチャを提案する。
我々のモデルはタスクパフォーマンスにおいて既存のVLAをはるかに上回るだけでなく、新しいロボットへの顕著な適応と、見えないオブジェクトや背景への一般化も示している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:06:03 GMT)
Reverse Thinking Makes LLMs Stronger Reasoners [90.4] RevThinkは、データ拡張と学習目的からなるフレームワークである。
12のデータセットに対する実験では、学生モデルのゼロショットのパフォーマンスよりも平均13.53%改善されている。
RevThinkはまた、アウト・オブ・ディストリビューション・ホールドアウトデータセットへの強力な一般化を示している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:27:05 GMT)
AnyEdit: Mastering Unified High-Quality Image Editing for Any Idea [88.8] 我々は、総合的なマルチモーダル命令編集データセットであるAnyEditを提示する。
我々は,AnyEditコレクションの多様性と品質を,初期データ多様性,適応編集プロセス,自動編集結果の選択という3つの側面を通じて保証する。
3つのベンチマークデータセットの実験によると、AnyEditは拡散ベースの編集モデルのパフォーマンスを一貫して向上させる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:34:34 GMT)
STEP: Enhancing Video-LLMs' Compositional Reasoning by Spatio-Temporal Graph-guided Self-Training [87.6] Video Large Language Models (Video-LLMs) は近年,ビデオ理解タスクに強い派生性を示している。
ビデオLLMは、多段階の明示的時間的推論を必要とする構成的推論と、オブジェクトの関係、相互作用、イベントに苦労する。
本稿では,ビデオLLMが生ビデオから推論に富んだ微調整データを生成し,自己改善を実現するための,グラフ誘導型自己学習手法STEPを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:54:55 GMT)
Robust Stochastically-Descending Unrolled Networks [85.7] Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:23:44 GMT)
T-3DGS: Removing Transient Objects for 3D Scene Reconstruction [83.1] ガウススプラッティングを用いた3次元シーン再構成のための入力ビデオから一貫したオブジェクトを除去する新しいフレームワークを提案する。
以上の結果から,既存の疎捕捉データセットにおける技術の現状と,新たに提案した高密度キャプチャ(ビデオ)データセットの大幅な改善が示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:45:24 GMT)
GausSurf: Geometry-Guided 3D Gaussian Splatting for Surface Reconstruction [79.4] GausSurfは、テクスチャリッチな領域におけるマルチビュー一貫性と、シーンのテクスチャレスな領域における通常の事前の幾何学的ガイダンスを採用している。
本手法は,再現性や計算時間の観点から,最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:54:54 GMT)
Truth or Mirage? Towards End-to-End Factuality Evaluation with LLM-OASIS [78.1] LLM-Oasisは、エンド・ツー・エンドの事実性評価をトレーニングするための最大のリソースである。
ウィキペディアからクレームを抽出し、これらのクレームのサブセットを偽造し、事実と非事実のテキストのペアを生成することで構築される。
次に、データセットの品質を検証し、事実性評価システムのための金の標準テストセットを作成するために、人間のアノテータに依存します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:21:15 GMT)
ROSE: Revolutionizing Open-Set Dense Segmentation with Patch-Wise Perceptual Large Multimodal Model [75.8] 本稿では,高密度マスク予測とオープンカテゴリ生成が可能な,革命的オープンセット高密度セグメンテーションLMMであるROSEを提案する。
本手法は,各画像パッチを関心領域の独立領域として扱い,密集マスクとスパースマスクを同時に予測する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:00:18 GMT)
On Domain-Specific Post-Training for Multimodal Large Language Models [72.7] ドメイン固有の画像キャプチャーペアから多様な視覚的命令タスクを生成する視覚的命令合成器を開発した。
ドメイン固有のポストトレーニングにおけるタスクの多様性を高めるために、単段階トレーニングパイプラインを適用します。
バイオメディシンと食品の2つの領域で、異なるソースとスケールのMLLMの訓練後実験を行う。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:42:28 GMT)
A Survey on Multimodal Large Language Models [71.6] GPT-4Vで表されるマルチモーダル大言語モデル(MLLM)は、新たな研究ホットスポットとなっている。
本稿では,MLLMの最近の進歩を追跡・要約することを目的とする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:51:23 GMT)
GuardSplat: Robust and Efficient Watermarking for 3D Gaussian Splatting [70.8] 3D Gaussian Splatting (3DGS)は、最近、様々なアプリケーションのための印象的な資産を作成した。
既存の透かし方式は、セキュリティ、キャパシティ、可視性を考慮して3DGSには適していない。
本稿では、3DGS資産の著作権を効果的に保護する革新的で効率的なフレームワークであるGuardSplatを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:59:03 GMT)
Risk-Averse Certification of Bayesian Neural Networks [70.4] 本稿では,RAC-BNNと呼ばれるベイズニューラルネットワークに対するリスク・アバース認証フレームワークを提案する。
提案手法はサンプリングと最適化を利用して,BNNの出力集合の音響近似を計算する。
我々は,RAC-BNNを回帰および分類ベンチマークで検証し,その性能を最先端の手法と比較した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:22:51 GMT)
A Simple and Provable Scaling Law for the Test-Time Compute of Large Language Models [70.1] 大規模言語モデル(LLM)のテスト時間計算において、証明可能なスケーリング法則を享受する一般二段階アルゴリズムを提案する。
入力問題を前提として,提案アルゴリズムはまず$N$の候補解を生成し,その後,複数ラウンドのノックアウトトーナメントによって最適な解を選択する。
理論的には、提案アルゴリズムの失敗確率は、$N$と$K$に対して指数関数的に崩壊する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:29:47 GMT)
Aggregating Nearest Sharp Features via Hybrid Transformers for Video Deblurring [70.1] 本稿では,隣接するフレームと既存のシャープフレームの両方を特徴集約のためにハイブリッドトランスフォーマーを用いて活用するビデオデブロアリング手法を提案する。
検出されたシャープフレームから最も近いシャープ特徴を集約するために,マルチスケールマッチング機能を備えたグローバルトランスを利用する。
提案手法は,定量的な計測値と視覚的品質の観点から,最先端のビデオデブロアリング法,およびイベント駆動ビデオデブロアリング法より優れる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:59:20 GMT)
Accelerating Multimodal Large Language Models via Dynamic Visual-Token Exit and the Empirical Findings [69.4] 既存のMultimoal Large Language Models (MLLM) における視覚トークンの過剰使用は、しばしば明らかな冗長性を示し、非常に高価な計算をもたらす。
DyVTE(Dynamic visual-token exit)と呼ばれるMLLMの効率を改善するための簡易かつ効果的な手法を提案する。
DyVTEは軽量なハイパーネットワークを使用して、テキストトークンの状態を認識し、特定のレイヤの後にすべてのビジュアルトークンを削除する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:24:23 GMT)
A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses [68.7] 軌道予測は、自動運転車における計画の安全性と効率に不可欠である。
現在のモデルでは、複雑な交通規則と潜在的な車両の動きを完全に捉えることができないことが多い。
本研究は, オフロード損失, 方向整合誤差, ダイバーシティ損失の3つの新しい損失関数を紹介する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:47:08 GMT)
Uniform Attention Maps: Boosting Image Fidelity in Reconstruction and Editing [66.5] 構造的視点から再構築を解析し、従来の横断的注意を一様注意マップに置き換える新しいアプローチを提案する。
本手法は,ノイズ予測時のテキスト条件の変化による歪みを効果的に抑制する。
実験結果から,本手法は高忠実度画像再構成に優れるだけでなく,実際の画像合成や編集のシナリオにも頑健に機能することが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:11:28 GMT)
OneBit: Towards Extremely Low-bit Large Language Models [66.3] 本稿では, LLMの重量行列を1ビットに大胆に定量化し, LLMの極低ビット幅展開への道を開く。
実験によると、OneBitは(LLaMAモデルの非量子化性能の少なくとも81%)優れたパフォーマンスを、堅牢なトレーニングプロセスで達成している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:47:55 GMT)
Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark [64.2] 我々は、IEEE/CVF European Conference on Computer Vision (ECCV) 2024と共に半日間のワークショップとして、第2知覚テストチャレンジを組織した。
目標は、最先端のビデオモデルをベンチマークし、昨年からPerception Testベンチマークを使用して進捗を計測することだった。
今年は7つのトラックがあり、低レベルかつ高レベルなタスクをカバーし、ビデオ、オーディオ、テキストのモダリティをカバーした言語と非言語インターフェースを備えていた。
追加のトラックは1時間にわたるビデオ理解をカバーし、新しいビデオQAベンチマーク1h-walk VQAを導入した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:57:25 GMT)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.6] Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。
SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。
本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:08:20 GMT)
LoCo: Low-Bit Communication Adaptor for Large-scale Model Training [63.0] 低ビット通信は、しばしば圧縮情報損失によってトレーニング品質が低下する。
本稿では,ローカルGPUノードを補償するLoCo(Lo-bit Communication Adaptor)を提案する。
実験結果から,Megatron-LMやPyTorchs FSDPといった大規模トレーニングモデルフレームワークの移動により,LoCoは圧縮通信効率を大幅に向上することがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:38:55 GMT)
HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning [62.3] 既存の水中画像強調法は主に視覚的品質の向上に重点を置いており、実際的な意味を見落としている。
視覚的品質を高め,他の下流タスクに対処する柔軟性を示す,水中知覚向上のための可逆的ネットワークHを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:26:46 GMT)
JetFormer: An Autoregressive Generative Model of Raw Images and Text [62.3] 本稿では,生データの可能性を直接最大化するために,自動回帰デコーダのみの変換器であるJetFormerを提案する。
我々は正規化フローモデルを利用して,自己回帰型マルチモーダル変換器で共同で訓練したソフトトーン画像表現を得る。
JetFormerは、最近のVQ-VAEおよびVAEベースのベースラインと競合するテキスト・画像生成品質を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:14:59 GMT)
Dual Risk Minimization: Towards Next-Level Robustness in Fine-tuning Zero-Shot Models [60.4] 本稿では、下流タスクのコア機能をよりよく保存するための二重リスク最小化(DRM)を提案する。
DRMは期待されるパフォーマンスと最悪のパフォーマンスのバランスをとり、さまざまな実世界のベンチマークで新たな最先端技術を確立します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:01:25 GMT)
Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification [60.0] リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:12:11 GMT)
Bootstraping Clustering of Gaussians for View-consistent 3D Scene Understanding [59.5] FreeGSは、教師なしセマンティック組み込み3DGSフレームワークで、2Dラベルを必要とせずに、ビュー一貫性のある3Dシーン理解を実現する。
我々は、FreeGSが複雑なデータ前処理作業の負荷を回避しつつ、最先端のメソッドと互換性があることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:52:32 GMT)
Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment [58.0] 我々は、報酬モデルとポリシーをトレーニングするために、AIHF(Alignment with Integrated Human Feedback)と呼ばれる単一ステージアプローチを開発する。
提案した手法は、一般的なアライメントアルゴリズムに容易に還元し、活用できる、効率的なアルゴリズムの集合を認めている。
本研究では,LLMにおけるアライメント問題と,MuJoCoにおけるロボット制御問題を含む広範な実験により,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:41:57 GMT)
A Spectrum Evaluation Benchmark for Medical Multi-Modal Large Language Models [57.9] Asclepiusは、Med-MLLMの異なる医学的特長と診断能力で評価する、新しいMed-MLLMベンチマークである。
3つの基本原則に基づいて、アスクレピウスは15の医療専門分野を包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、3人の専門家と比較した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:50:45 GMT)
V2SFlow: Video-to-Speech Generation with Speech Decomposition and Rectified Flow [57.5] 本稿では,V2SFlowについて紹介する。V2SFlowは,サイレント・トーキング・フェイス・ビデオから直接自然で分かりやすい音声を生成するために設計された,新しいビデオ音声合成(V2S)フレームワークである。
これらの課題に対処するため、音声信号を管理可能な部分空間に分解し、それぞれ異なる音声属性を表現し、視覚入力から直接予測する。
これらの予測属性からコヒーレントでリアルな音声を生成するために,Transformerアーキテクチャ上に構築された正流整合デコーダを用いる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:55:20 GMT)
Exploring Concept Depth: How Large Language Models Acquire Knowledge at Different Layers? [57.0] 大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。
しかし、これらのモデルが様々な複雑さのタスクを符号化するメカニズムは、いまだに理解されていない。
概念深さ」の概念を導入し、より複雑な概念が一般的により深い層で得られることを示唆する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:50:16 GMT)
Semantic Entropy Can Simultaneously Benefit Transmission Efficiency and Channel Security of Wireless Semantic Communications [55.5] 本稿では,適応トランスミッションと物理層暗号化の両方のためのセマンティクスを探索するためにSemEntropyを提案する。
セムエントロピーは意味論的精度を95%保ち、透過率を60%低減できることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:26:10 GMT)
Supersymmetric Klein-Gordon and Dirac oscillators [55.2] 相対論的発振器の超対称バージョンの共変位相空間は、空間 $Z_6$ の奇接束であることを示す。
重み関数の異なる$Z_6$ 上のベルグマン空間から正則で反正則関数であるスピノル場の成分を得る。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:50:24 GMT)
GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding [53.4] Open-Vocabulary 3D object affordance groundingは、任意の命令で3Dオブジェクト上のアクション可能性の領域を予測することを目的としている。
GREAT (GeometRy-intEntion collAboraTive Inference) を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:23:15 GMT)
EvaSurf: Efficient View-Aware Implicit Textured Surface Reconstruction [53.3] 3次元再構成法はリアルタイムに3次元整合性のある高忠実度結果を生成する。
提案手法は,合成と実世界の両方のデータセット上で,高品質な外観と正確なメッシュを再構築することができる。
我々の方法は1つのGPUを使ってたった1~2時間でトレーニングでき、40FPS(Frames per second)以上のモバイルデバイス上で実行することができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:36:33 GMT)
Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.0] 高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。
本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。
我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:20:58 GMT)
Look Every Frame All at Once: Video-Ma$^2$mba for Efficient Long-form Video Understanding with Multi-Axis Gradient Checkpointing [52.1] Video-Ma$2$mbaは、Mamba-2フレームワークにステートスペースモデル(SSM)を組み込んだ新しいアーキテクチャである。
本手法は,標準勾配チェックポイントに比べてメモリフットプリントを大幅に削減する。
時間的ダイナミクスの詳細なキャプチャーを維持することで、長いビデオ理解タスクにおける応答の精度と関連性を改善することができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:12:13 GMT)
Art-Free Generative Models: Art Creation Without Graphic Art Knowledge [50.6] 美術関連コンテンツへのアクセスなしに訓練されたテキスト・画像生成モデルを提案する。
そこで我々は,選択した芸術スタイルのごく一部の例を用いて,シンプルな,かつ効果的なアートアダプタの学習方法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:01 GMT)
Gradient projection method for constrained quantum control [50.2] 我々は、量子制御の問題にGPM(Gradient Projection Method)を採用する。
この方法の主な利点は、境界を正確に満たすことができることである。
GPMを1および2キュービットゲートと2キュービットベルおよびワーナー状態の生成を含むいくつかの例に適用する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:56:55 GMT)
Global restrictions under local state discrimination [49.2] 局所的な識別性は、二粒子状態のグローバルな性質を制限することができる。
グローバルな行動を制限する強力なツールとなり得ることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:14:23 GMT)
TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting [49.0] 本稿では, 八面体配向型3次元ガウス平板を用いた高速PBR材料生成のためのTexGaussianを提案する。
本手法は,PBR素材をより視覚的に合成し,非条件シナリオとテキスト条件シナリオの両方において,従来の方法よりも高速に動作させる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:19:39 GMT)
Generative AI Literacy: Twelve Defining Competencies [48.9] 本稿では、生成AIと対話するために必要なスキルと知識領域を網羅した、生成人工知能(AI)リテラシーの能力に基づくモデルを提案する。
能力は、基礎的なAIリテラシーから、倫理的および法的考慮を含むエンジニアリングとプログラミングのスキルの促進まで様々である。
これらの12の能力は、個人、政策立案者、政府高官、教育者が責任を持って生成AIの可能性をナビゲートし活用しようとするための枠組みを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:55:15 GMT)
AerialGo: Walking-through City View Generation from Aerial Perspectives [48.5] AerialGoは、空中画像からリアルな街並みを生成するフレームワークである。
AerialGoは、アクセス可能な航空データに地上視合成を条件付けすることで、地上レベルの画像に固有のプライバシーリスクを回避できる。
実験により、AerialGoは地上レベルのリアリズムと構造的コヒーレンスを著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:14:07 GMT)
ContextGNN: Beyond Two-Tower Recommendation Systems [47.5] 本稿では,リコメンデーションシステムにおけるリンク予測のためのコンテキストベースグラフニューラルネットワーク(ContextGNN)を提案する。
本手法は,ユーザのローカルサブグラフ内に位置する親しみやすい項目に対して,ペアワイズ表現手法を用いる。
最終的なネットワークは、ペアワイズとツーツーワーのレコメンデーションの両方を、アイテムの単一のランキングに融合する方法を予測する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:11:42 GMT)
Origin-Destination Demand Prediction: An Urban Radiation and Attraction Perspective [47.5] 本稿では,2種類のキャパシティ間の関係を捉える新しいモデルを提案する。
具体的には、まず、両側分岐ネットワークを用いて、地域放射線とアトラクション容量をモデル化する。
次に,ハイパーグラフを用いたパラメータ生成手法を用いて,同一領域の異なる容量の変換関係を記述する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:35:17 GMT)
Integrating Social Determinants of Health into Knowledge Graphs: Evaluating Prediction Bias and Fairness in Healthcare [47.2] 健康の社会的決定因子(SDoH)は、患者の健康結果において重要な役割を担っているが、そのバイオメディカル知識グラフへの統合は未解明のままである。
本研究では,MIMIC-IIIデータセットとPrimeKGを用いて,SDoHに富んだ知識グラフを構築することにより,このギャップを解消する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:35:01 GMT)
SuperMat: Physically Consistent PBR Material Estimation at Interactive Rates [46.2] SuperMatは1ステップの推論で高品質な材料分解を実現する1ステップのフレームワークである。
我々は、UVリファインメントネットワークを通じて、我々のフレームワークを3Dオブジェクトに拡張し、視点をまたいだ一貫した物質推定を可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:44:13 GMT)
VideoDirector: Precise Video Editing via Text-to-Video Models [45.5] 現在のビデオ編集法は、時間的コヒーレンス生成能力を欠くテキスト・ツー・ビデオ(T2V)モデルに依存している。
本稿では、より正確なピボットインバージョンを実現するために、時空間デカップリングガイダンス(STDG)と複数フレームのヌルテキスト最適化戦略を提案する。
実験結果から,本手法はT2Vモデルの強力な時間生成能力を効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:27:03 GMT)
Motion Modes: What Could Happen Next? [45.2] 現在のビデオ生成モデルは、しばしばカメラの動きや他のシーンの変化とオブジェクトの動きを絡ませる。
我々は、事前訓練された画像間ジェネレータの潜伏分布を探索する、トレーニング不要なアプローチであるMotion Modesを紹介する。
我々は、物体とカメラの動きを歪ませるように設計されたエネルギー関数で導かれたフロージェネレータを用いてこれを実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 01:51:08 GMT)
Scaling of Stochastic Normalizing Flows in $\mathrm{SU}(3)$ lattice gauge theory [45.0] 非平衡マルコフ連鎖モンテカルロシミュレーションは、ターゲット確率分布からのサンプルに対するジャージンスキーの等式に基づくよく理解されたフレームワークを提供する。
平衡外進化はフローベースアプローチの同じ枠組みを共有しており、自然に正規化フロー(SNF)と呼ばれる新しいアーキテクチャに結合することができる。
4次元における$mathrmSU(3)$の格子ゲージ理論に対するSNFの最初の実装は、非平衡モンテカルロ更新の間にゲージ同変層を導入することで定義される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:01:05 GMT)
PACMANN: Point Adaptive Collocation Method for Artificial Neural Networks [45.0] PINNは、一組のコロケーションポイントに対して決定されたPDE残差を含む損失関数を最小化する。
これまでの研究では、これらのコロケーションポイントの数と分布がPINNソリューションの精度に大きな影響を与えることが示されている。
ニューラルネットワーク(PACMANN)のための点適応コロケーション法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:31:11 GMT)
Freeze-Omni: A Smart and Low Latency Speech-to-speech Dialogue Model with Frozen LLM [44.6] 本稿では, Freeze-Omni という, 音声文によるマルチモーダルLLMアーキテクチャを提案する。
我々の主な貢献は、音声入力と出力のモダリティがテキストLLMに容易に接続できることである。
さらに,マルチタスク学習による二重対話能力を実現する手法も設計した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:49:55 GMT)
Combining inherent knowledge of vision-language models with unsupervised domain adaptation through strong-weak guidance [44.2] 教師なしドメイン適応(UDA)は、ラベル付きソースデータセットを活用することで、データのラベル付けの面倒な作業を克服しようとする。
現在の視覚言語モデルは、顕著なゼロショット予測能力を示す。
我々は、ゼロショット予測を用いて、ソースとターゲットデータセットの整列を支援する、強弱誘導学習スキームを導入する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:24:02 GMT)
Gradient Routing: Masking Gradients to Localize Computation in Neural Networks [43.1] ニューラルネットワークの特定の部分領域に機能を分離する訓練手法である勾配ルーティングを導入する。
解析可能な方法で分割された表現を学習するために、勾配ルーティングが利用できることを示す。
私たちは、高品質なデータが不足している、挑戦的な現実世界のアプリケーションに対して、このアプローチが約束されていると結論付けます。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:52:41 GMT)
Amplifying human performance in combinatorial competitive programming [41.6] 私たちは競争力のあるプログラミングに重点を置いています。そこでは、難解な問題に対する、可能な限り優れた解決策を見つけることを目的としています。
私たちは、GoogleのNPハードなソフトウェアエンジニアリング問題に触発されたグローバルなチームプログラミングコンペであるHash Codeの以前のイテレーションにアプローチをデプロイしています。
私たちのソリューションは、ベースラインから得られたスコアを大幅に改善し、以前のHash Codeオンライン資格ラウンドのトップパーセンタイルに到達しました。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:40:36 GMT)
RAGDiffusion: Faithful Cloth Generation via External Knowledge Assimilation [41.3] 本稿では、構造決定性と幻覚を高めるために、RAGDiffusionと呼ばれる新しいRAG(Retrieval-Augmented Generation)フレームワークを提案する。
RaGDiffusionは、構造的にも細部的にも忠実な衣服の資産を合成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:57:32 GMT)
QUOTA: Quantifying Objects with Text-to-Image Models for Any Domain [40.7] 生成テキスト・画像モデルを用いてオブジェクトの数を定量化する問題に取り組む。
新しい画像領域ごとにそのようなモデルをトレーニングするのではなく、ドメインに依存しない視点からこの問題を最初に検討する。
テキスト・ツー・イメージ・モデルの最適化フレームワークであるQUOTAを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:20:12 GMT)
VLSBench: Unveiling Visual Leakage in Multimodal Safety [39.3] これまでの研究では、MLLMの整列にテキストアンラーニングを用いることで、画像とテキストのペアで訓練されたMLLMと同等の安全性を実現することが示されている。
このような直感的現象を説明するため、既存のマルチモーダル安全ベンチマークにおいて、視覚的安全情報漏洩(VSIL)問題を発見した。
マルチモーダル画像リークレス安全性ベンチマーク (VLSBench) を構築し,2.4k画像テキストペアによる画像からテキストへの視覚的安全性リークを防止する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:56:37 GMT)
SOLAMI: Social Vision-Language-Action Modeling for Immersive Interaction with 3D Autonomous Characters [38.9] SOLAMIは,3次元自律型キャラクタとの没入型インタラクションのための,初のエンドツーエンドのソーシャルビジョン・ランゲージ・アクション(VLA)モデリングフレームワークである。
本稿では,ユーザのマルチモーダル入力をベースとしたマルチモーダル応答(音声と動き)を生成するソーシャルVLAフレームワークを提案する。
既存の動作データセットのみを用いて自動パイプラインによって生成された合成マルチモーダルなソーシャルインタラクションデータセットであるSynMSIを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:53:40 GMT)
Proto Successor Measure: Representing the Space of All Possible Solutions of Reinforcement Learning [37.6] 汎用強化学習アルゴリズムでは「ゼロショット学習」が有効である。
emphProto Successor Measure: Reinforcement Learningの可能なすべてのソリューションの基盤セットを提示する。
環境からのインタラクションデータのみを用いて,これらの基礎関数を学習する実用的なアルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:09:39 GMT)
Powerformer: A Section-adaptive Transformer for Power Flow Adjustment [37.2] 本稿では,ロバストな電力系統状態表現の学習に適したトランスフォーマーアーキテクチャを提案する。
具体的には,従来の変圧器の自己注意から分離する専用セクション適応型アテンション機構を開発する。
この機構は、電力系統状態と送信部情報とを効果的に統合し、ロバストな状態表現の開発を容易にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:23:56 GMT)
A Comprehensive Framework for Automated Segmentation of Perivascular Spaces in Brain MRI with the nnU-Net [37.2] 神経変性疾患では、PVS(perivascular space)の増大が一般的である。
現在不足している信頼性の高いPVS検出方法が必要である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:19:57 GMT)
IndicLLMSuite: A Blueprint for Creating Pre-training and Fine-Tuning Datasets for Indian Languages [36.8] 本研究は、Indic LLMの開発に特化して設計された、拡張性のあるリソーススイートを紹介する。
このアプローチでは、高度にキュレートされた手作業による検証データ、検証されていないが価値のあるデータ、合成データを組み合わせています。
命令ファインチューニングでは、既存のIndicデータセットをアマルガメートし、英語データセットをインド語に翻訳・翻訳し、LLaMa2とMixtralモデルを利用する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:50:35 GMT)
INCLUDE: Evaluating Multilingual Language Understanding with Regional Knowledge [36.2] 機能的大規模言語モデル(LLM)の開発は、英語以外の言語における高品質な評価資源の欠如によってボトルネックとなっている。
本研究では,各地域における多言語LLMの能力を評価するため,現地試験資料から197,243対のQAペアの評価スイートを構築した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:03:14 GMT)
AlphaTablets: A Generic Plane Representation for 3D Planar Reconstruction from Monocular Videos [36.1] 3次元平面の新規で汎用的な表現であるAlphaTabletsを紹介する。
アルファチャネルと同様に3D平面を表現することで、AlphaTabletsは現在の2D平面と3D平面の利点を組み合わせている。
画像に3次元平面を効率よくレンダリングするために、AlphaTablets上で微分可能な幾何化を導出する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:52 GMT)
Reanimating Images using Neural Representations of Dynamic Stimuli [36.0] 動画拡散モデルは、静止画像表現とモーション生成を分離するために使用される。
ブレインデコードされたモーション信号は、ビデオの初期フレームのみに基づいて、リアルなビデオ再アニメーションを可能にする。
この枠組みは、動的視覚シーンにおける脳が空間的・時間的情報をどのように表現するかの理解を深める。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:44 GMT)
CAdam: Confidence-Based Optimization for Online Learning [35.8] 本稿では,更新を決定する前に,各パラメータ次元の運動量と勾配との整合性を評価する信頼度に基づく最適化手法であるCAdamを紹介する。
合成と実世界の両方のデータセットによる実験は、CAdamが他のよく知られたシステムを上回っていることを示している。
ライブレコメンデーションシステムにおける大規模A/Bテストでは、CAdamはAdamと比較してモデル性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:00:27 GMT)
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos [35.8] リアルワールドビデオは、密集したストーリーラインを形成する一連のイベントを含む、オムニ・モーダル情報(ビジョン、オーディオ、スピーチ)を含んでいる。
微粒なイベントアノテーションによるマルチモーダルビデオデータの欠如と、手動ラベリングの高コストは、全方位ビデオ知覚において大きな障害となる。
正確な時間境界を持つ105Kのオムニモーダルイベントからなる視覚・聴覚・言語イベント理解ベンチマークであるLongVALEを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:18:06 GMT)
Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection [35.1] ここでは,CLIPを有効かつ一般化可能な顔偽造検知器に変換するためのアダプタネットワークについて述べる。
トレーニング可能なパラメータはたったの$bm5.7M($bm5.7M)である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:02:11 GMT)
Calibration Attacks: A Comprehensive Study of Adversarial Attacks on Model Confidence [34.8] キャリブレーション・アタックは 予測されたラベルを変更することなく 被害者のモデルを 非常に誤解させる
キャリブレーション攻撃の典型的な4つの形態として、不信、過信、最大誤校正、無作為不信攻撃を提案する。
この攻撃は、畳み込みモデルと注目モデルの両方において非常に効果的であることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:52:29 GMT)
DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthiness [34.2] 本稿では,文書VQAの応答ローカライゼーション機能を備えたMLLMを改良する新しい手法であるDLaVAを紹介する。
我々はOCRに依存しないアーキテクチャとOCRに依存しないアーキテクチャの両方を提示する。
我々の貢献は、空間的アノテートされた視覚コンテンツに応答を接地することで、解釈可能性と信頼性を高めることである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:17:11 GMT)
Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models [33.5] インストラクションチューニングは、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
自然言語処理(NLP)とディープラーニングの分野において,データアセスメントと選択手法が提案されている。
本稿では,データアセスメントと選択に関する既存の文献を総合的にレビューし,特にLLMの命令チューニングについて述べる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:10:43 GMT)
SIMS: Simulating Human-Scene Interactions with Real World Script Planning [33.3] 本稿では,長期的物理的プラプティブルなヒューマン・シーンインタラクションの計画と制御のための新しい枠組みを提案する。
大規模言語モデル(LLM)は論理的なストーリーラインを理解し、生成することができる。
これを活用することで、言語理解とシーン理解の両方を実現する二重認識ポリシーを利用する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:36:15 GMT)
Quantum computing architecture with Rydberg gates in trapped ions [32.1] 線形結晶中の任意のイオン対に対するエンタングルスキームを提案する。
小結晶中の任意の量子ビット対内の操作時間$mu s$の順序を明らかにする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:17:43 GMT)
LokiTalk: Learning Fine-Grained and Generalizable Correspondences to Enhance NeRF-based Talking Head Synthesis [32.1] ライフライクな顔のダイナミックスでNeRFをベースとした発話ヘッドを強化するフレームワークであるLokiTalkを提案する。
領域特異的変形場は、全体の肖像画の動きを唇の動き、点滅、頭部ポーズ、胴体の動きに分解する。
また,マルチアイデンティティビデオから動的および静的な対応を一般化するプラグイン・アンド・プレイモジュールであるID-Aware Knowledge Transferを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:49:44 GMT)
The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning [31.8] 学習力学モデルの改善に伴い,一般的なアルゴリズムがどのように機能するかを検討する。
エッジ・オブ・リーチ問題に直接対処する単純で堅牢な手法であるReach-Aware Learning (RAVL)を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:52:18 GMT)
Auto-RAG: Autonomous Retrieval-Augmented Generation for Large Language Models [31.8] Auto-RAGは大規模言語モデル(LLM)の推論機能を中心とした自律的反復検索モデルである
本研究では,反復検索における推論に基づく意思決定命令を自律的に合成する手法を開発した。
Auto-RAGは自然言語で反復的な検索プロセスを表現し、解釈可能性を高める。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:01:05 GMT)
LaVIDE: A Language-Vision Discriminator for Detecting Changes in Satellite Image with Map References [31.4] 変更検出は、単一のイメージしか利用できない場合、大幅に妨げられる。
衛星画像の変化を地図参照で検出するtextbfLanguage-textbfVIsion textbfDiscriminatorを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:04:40 GMT)
Recent Advances of Foundation Language Models-based Continual Learning: A Survey [31.2] 基礎言語モデル (LM) は自然言語処理 (NLP) とコンピュータビジョン (CV) の分野において重要な成果を上げている。
しかし、破滅的な忘れ物のため、人間のような継続的学習をエミュレートすることはできない。
従来の知識を忘れずに新しいタスクに適応できるように、様々な連続学習(CL)ベースの方法論が開発されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:19:01 GMT)
SignLLM: Sign Language Production Large Language Models [31.0] 我々は多言語手話生成(SLP)大言語モデルであるSignLLMを提案する。
MLSFとPrompt2LangGlossという2つの新しい多言語SLPモードがあり、手話のジェスチャーを生成することができる。
SignLLMのトレーニングには、包括的な多言語手話データセットであるPrompt2Signを導入する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:01:20 GMT)
ReconDreamer: Crafting World Models for Driving Scene Reconstruction via Online Restoration [30.8] ReconDreamerは、世界モデル知識の漸進的な統合を通じて、ドライブシーンの再構築を強化する。
私たちの知る限りでは、ReconDreamerは大規模な操作で効果的にレンダリングする最初の方法です。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:47:46 GMT)
MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks [30.3] 動作とテキストの限界,条件,共同分布を同時に学習することで,多様なタスクを処理できる統合マルチモーダルモデルであるtextbfMoTe を提示する。
MoTeは3つのコンポーネントで構成されている: Motion-Decoder (MED)、Text-Decoder (TED)、Moti-on-Text Diffusion Model (MTDM)。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:48:24 GMT)
Learning Local Control Barrier Functions for Hybrid Systems [29.8] 安全はハイブリッドロボットシステムにとって主要な関心事である。
既存のハイブリッドシステムに対する安全クリティカルな制御アプローチは、計算的に非効率であり、システム性能に有害であるか、小規模システムに限定されている。
本研究では,局所制御バリア関数 (CBF) を構築するための学習可能なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:46:37 GMT)
Noro: A Noise-Robust One-shot Voice Conversion System with Hidden Speaker Representation Capabilities [29.7] ワンショット音声変換(VC)は、音源話者からの発声の音色を変化させ、ターゲット話者の音色と一致させることを目的としている。
ワンショットVCの進歩にもかかわらず、その効果は、インターネットからしばしば引き起こされる参照スピーチが背景ノイズのような様々な障害を含む現実のシナリオにおいて減少する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:18:01 GMT)
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding [29.6] DisCoRDは離散的な動きトークンを整流によって連続的な動きにデコードする。
DisCoRDは最先端のパフォーマンスを実現し、HumanML3Dでは0.032、KIT-MLでは0.169である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:54:56 GMT)
ChineseWebText 2.0: Large-Scale High-quality Chinese Web Text with Multi-dimensional and fine-grained information [29.6] 大規模かつ高品質な中国語データセットを多次元かつきめ細かい情報で構築するための新しいツールチェーン MDFG-tool を提案する。
我々は,3.8TBの漢文テキスト2.0を公開し,各テキストは品質スコア,ドメインラベル,毒性ラベル,毒性スコアに関連付けられている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:48:49 GMT)
Towards Evaluating Generalist Agents: An Automated Benchmark in Open World [28.4] Minecraft Universe (MCU) は,オープンワールドゲームMinecraft内の完全に自動化されたベンチマークフレームワークである。
MCUは、様々なタスクを動的に生成し、評価し、3つのコアコンポーネントを提供する。
現状のモデルは特定のタスクでうまく機能するが、タスクの多様性と難易度の増加に悩まされることが多い。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:39:26 GMT)
Nonparametric Instrumental Regression via Kernel Methods is Minimax Optimal [28.4] 本研究では citetsingh 2019 のカーネルインストゥルメンタル変数アルゴリズムについて検討した。
核NPIV推定器は最小ノルムのIV解に収束することを示す。
また、第1段階回帰において一般的なスペクトル正則化を採用することにより、元のカーネルNPIVアルゴリズムを改善した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:18:01 GMT)
VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [28.3] 本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:32:17 GMT)
MoSca: Dynamic Gaussian Fusion from Casual Videos via 4D Motion Scaffolds [27.8] 野生でカジュアルに撮影されたモノクロビデオから動的シーンの新たなビューを再構築し、合成するために設計された、モダンな4D再構成システムである4D Motion Scaffolds (MoSca)を紹介した。
動的レンダリングベンチマークにおける最先端のパフォーマンスと実動画での有効性について実験を行った。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:53:12 GMT)
Diorama: Unleashing Zero-shot Single-view 3D Scene Modeling [27.6] ダイオラマ(Diorama)は、単視点のRGB観測から3Dシーンをモデル化する世界初のゼロショットオープンワールドシステムである。
この問題をサブタスクに分解し、それぞれに堅牢で一般化可能な解を導入することで、我々のアプローチの実現可能性を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:19:04 GMT)
Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis [27.4] 本稿では,リアルタイム音声ヘッド合成が可能な拡散型フレームワークであるDittoを紹介する。
私たちの重要なイノベーションは、明示的なアイデンティティに依存しないモーション空間を通じて、ブリッジングモーション生成とフォトリアリスティックなニューラルレンダリングです。
この設計は、合成音声ヘッドの正確な制御を可能にしながら、拡散学習の複雑さを著しく低減する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:01:31 GMT)
When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs [26.3] 個人データを含むサイバー攻撃における大規模言語モデル(LLM)の誤用に関連するリスクについて検討する。
具体的には,サイバーアタックの実施を指示されたLLMエージェントがいかに強力かを理解することを目的としている。
本稿では,PII(Personally Identible Information)の収集,偽造投稿の生成,スピアフィッシングメールの作成の3つの攻撃シナリオについて検討する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:30:49 GMT)
Slot State Space Models [26.2] 本稿では,情報分離の保存・促進を目的として,独立したメカニズムをSSMに組み込む新しいフレームワークであるSlotSSMを紹介する。
実験では,対象中心学習,3次元視覚推論,長文ビデオ理解タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:23:51 GMT)
A Deep Learning Approach to Language-independent Gender Prediction on Twitter [25.2] 本研究は,ユーザのつぶやきのテキストから抽出した言語に依存しない特徴に基づいて,Twitter利用者の性別を予測するための実験である。
実験は、ポルトガル語、フランス語、オランダ語、英語、ドイツ語、イタリア語の6カ国語で書かれたツイートを含むTwiStyデータセットのバージョンで実施された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:26:34 GMT)
TEAM: Topological Evolution-aware Framework for Traffic Forecasting--Extended Version [24.5] 交通予測のためのトポロジカル進化認識フレームワーク(TEAM)には、畳み込みと注意が組み込まれている。
TEAMは、予測精度を損なうことなく、既存の方法よりもはるかに低い再訓練コストを削減できる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:39:36 GMT)
FaVoR: Features via Voxel Rendering for Camera Relocalization [23.8] カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:48:27 GMT)
Speech Translation with Speech Foundation Models and Large Language Models: What is There and What is Missing? [23.8] これまでに提示されたアーキテクチャソリューションとトレーニング戦略の統一的なビューを提案し、それらの類似点と相違点を強調した。
また、多種多様な設定と評価アプローチが、各ビルディングブロックとトレーニング選択において、最も優れたソリューションの特定を妨げていることも示します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:46:22 GMT)
RePD: Defending Jailbreak Attack through a Retrieval-based Prompt Decomposition Process [23.7] 我々は,大規模言語モデル(LLM)に対するジェイルブレイク攻撃のリスクを軽減するために設計された,革新的な攻撃フレームワークであるPDを導入する。
RePDはワンショットの学習モデルで動作し、Jailbreakプロンプトテンプレートのデータベースにアクセスして、ユーザプロンプトに埋め込まれた有害な問い合わせを特定して分解する。
我々は,典型的なユーザ要求に応答する際の性能を損なうことなく,LDMのジェイルブレイク攻撃に対するレジリエンスを高めるためのRePDの有効性を実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:35:47 GMT)
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation [23.0] 本稿では,バッチ・ツー・グロバルマッチングにおける画像の多様性を高めるため,多様性駆動型早期学習(DELT)方式を提案する。
我々のアプローチは概念的には単純だが有効であり、事前に定義されたIPCサンプルを小さなサブタスクに分割し、局所的な最適化を用いる。
我々のアプローチは、異なるデータセットとIPC(クラスごとのイメージ)で平均2$sim$5%の先行技術よりも優れています。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:46 GMT)
An Upper Bound for the Distribution Overlap Index and Its Applications [22.9] 本稿では,2つの確率分布間の重なり関数に対する計算容易な上限を提案する。
提案した境界は、一級分類と領域シフト解析においてその値を示す。
私たちの研究は、重複ベースのメトリクスの応用を拡大する大きな可能性を示しています。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:21:45 GMT)
SAM Decoding: Speculative Decoding via Suffix Automaton [22.3] 大規模言語モデル(LLM)は、タスクをテキスト生成に統一することで自然言語処理に革命をもたらしたが、その大きなパラメータサイズと自己回帰的自然制限推論速度は変化している。
SAM-Decodingは、サフィックスオートマトンを用いて効率よく正確なドラフト生成を行う新しい検索ベースの投機的復号法を導入することで、この問題に対処する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:16:29 GMT)
Quantized Delta Weight Is Safety Keeper [22.1] 微調整言語モデルは、さまざまなドメインにまたがるカスタマイズされたアプリケーションを可能にする。
微調整は、アライメント問題、バックドア攻撃、幻覚などのセキュリティ脆弱性を導入することができる。
本稿では, 部分圧縮により, 実用性を損なう微調整型攻撃に対するモデルセキュリティが向上することを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:05:50 GMT)
Core Placement Optimization of Many-core Brain-Inspired Near-Storage Systems for Spiking Neural Network Training [21.8] オフポリティクス決定論的アクター批判に基づくSNNトレーニング多コアデプロイメント最適化手法を提案する。
我々は,マルチコアニアメモリコンピューティングアーキテクチャにおけるSNNモデルの配置最適化を実現するために,ニアエンドポリシー最適化を通じてポリシネットワークのパラメータを更新する。
本手法は,コア間の不均一な計算やストレージ負荷,ローカル通信ホットスポットの形成といった問題を克服する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 01:46:30 GMT)
Efficient Text-driven Motion Generation via Latent Consistency Training [21.3] 非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:03:59 GMT)
Lifelong Learning of Video Diffusion Models From a Single Video Stream [21.2] 本研究は,単一の連続ビデオストリームから自己回帰的ビデオ拡散モデルのトレーニングが可能であることを実証する。
また、生涯にわたるビデオモデル学習を評価するのに適した3つの新しい単一ビデオ生成モデルデータセットをコントリビュートする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:20:47 GMT)
Real-to-Sim via End-to-End Differentiable Simulation and Rendering [20.9] 本稿では,特徴の同時識別を可能にする,新しい微分可能な点ベースオブジェクト表現を提案する。
本手法では, グリッドベース外見場と組み合わせた, 新たな微分可能な点ベースオブジェクト表現を用いる。
本手法は, シミュレーションとレンダリング可能な世界モデルの両方を, ごく一部の部分的な観測から学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:02:02 GMT)
SAT-HMR: Real-Time Multi-Person 3D Mesh Estimation via Scale-Adaptive Tokens [20.7] 一つのRGB画像からリアルタイムなマルチパーソン3次元メッシュ推定を行うための一段階フレームワークを提案する。
画像中の個々の相対スケールに基づいて動的に調整されるスケール適応トークンを導入する。
実験の結果,提案手法は計算コストを大幅に削減しつつ,高分解能処理の精度を保っていることがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:34:46 GMT)
C2HLSC: Leveraging Large Language Models to Bridge the Software-to-Hardware Design Gap [20.5] 本稿では,HLS互換フォーマットに自動的にCコードを生成するための大規模言語モデルについて検討する。
本稿では,NIST 800-22テストのランダム性,QuickSortアルゴリズム,およびAES-128をHLS合成可能なCに書き換えるためにLLMを用いたケーススタディを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:22:52 GMT)
Free-form Generation Enhances Challenging Clothed Human Modeling [20.3] 衣服をモデルとした新しいハイブリッドフレームワークを提案する。
私たちの中核となる考え方は、身体に近いか遠いかによって、異なる領域をモデル化するための専用の戦略を使うことです。
提案手法は,特に難解な場合において,視覚的忠実度とリアリズムに優れる最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:58:17 GMT)
Differentiable Causal Discovery For Latent Hierarchical Causal Models [19.4] 非線形潜在階層因果モデルの同定可能性に関する新しい理論的結果を示す。
我々は,そのようなモデルの構造を効率的に推定する,新しい微分可能な因果探索アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:08:20 GMT)
Training Agents with Weakly Supervised Feedback from Large Language Models [19.2] 本稿では,批判的LSMからの弱教師付き信号を用いたLSMエージェントの新しいトレーニング手法を提案する。
エージェントは反復的に訓練され、まず環境相互作用を通じて軌道を生成する。
API-bankデータセットのテストでは、エージェントの能力とGPT-4に匹敵するパフォーマンスが一貫して改善されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:47:04 GMT)
InstantGeoAvatar: Effective Geometry and Appearance Modeling of Animatable Avatars from Monocular Video [19.1] InstantGeoAvatarは、詳細な3次元幾何学の単眼ビデオから効率的かつ効果的な学習方法である。
本稿では,ボリュームレンダリングパイプラインにシームレスに適合する幾何対応 SDF 正規化方式を提案する。
幾何再構成と新しいビュー合成の競争力は5分以内のトレーニング時間で得られる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:45:51 GMT)
CLIPArTT: Adaptation of CLIP to New Domains at Test Time [19.0] CLIP Adaptation duRing Test-Time(CLIPArTT)を導入する。これは、事前学習された視覚言語モデル(VLM)に対する完全なテスト時間適応(TTA)アプローチである。
提案手法では,複数の予測クラスを1つの新しいテキストプロンプトに集約し,入力を再分類するためにemphpseudoラベルとして使用する,ユニークで最小限の侵襲的なテキストプロンプトチューニング処理を採用している。
以上の結果から,新たなトランスフォーメーションやトレーニング可能なモジュールを必要とせずに,CLIPArTTは非破損データセット間で動的にパフォーマンスを向上することがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:27:46 GMT)
RoboMatrix: A Skill-centric Hierarchical Framework for Scalable Robot Task Planning and Execution in Open-World [19.0] RoboMatrixは、スケーラブルなタスク計画と実行のためのスキル中心で階層的なフレームワークである。
まず、異なる複雑なタスクから共通のメタスキルを抽出する、新しいスキル中心のパラダイムを紹介します。
メタスキルを完全に活用するために,複雑なロボットタスクを3つの相互接続層に分離する階層型フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:36:03 GMT)
Driving with Prior Maps: Unified Vector Prior Encoding for Autonomous Vehicle Mapping [19.0] 高精細マップ(HDマップ)は、自動運転車の正確なナビゲーションと意思決定に不可欠である。
オンボードセンサーを用いたHDマップのオンライン構築が有望なソリューションとして浮上した。
本稿では,事前マップのパワーを活用して,これらの制約に対処するPresidedDriveフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:10:34 GMT)
DeSplat: Decomposed Gaussian Splatting for Distractor-Free Rendering [18.7] DeSplatは、ガウスプリミティブのボリュームレンダリングに基づいて、気晴らしと静的なシーン要素を純粋に分離する新しい方法である。
本稿では,3つのベンチマークデータセットに対してDeSplatの有効性を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:00:38 GMT)
Know Your RAG: Dataset Taxonomy and Generation Strategies for Evaluating RAG Systems [18.6] 検索性能を評価するために公開質問と回答(Q&A)データセットを使用することで、最適でないシステム設計につながることを示す。
本稿ではラベルとラベルをターゲットとしたデータ生成によるRAGデータセットの特徴付けに基づくソリューションを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:57:07 GMT)
GalLoP: Learning Global and Local Prompts for Vision-Language Models [18.6] 我々は,グローバル・ローカル・プロンプト(GalLoP)という,グローバル・ローカル・プロンプトとローカル・ビジュアル・特徴の両面を活用した多様なプロンプトを学習する新しいプロンプト学習手法を紹介した。
GalLoPは、ドメインの一般化とOOD検出の両方において強い堅牢性を示し、専用のOOD検出方法よりも優れている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:46:28 GMT)
A Riemannian Framework for Learning Reduced-order Lagrangian Dynamics [18.2] 本稿では,物理的に整合した低次動的パラメータを学習するための新しい幾何学的ネットワークアーキテクチャを提案する。
本手法は,剛性および変形性システムの高次元力学の高精度な長期予測を可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:02:31 GMT)
Privacy-Preserving Orthogonal Aggregation for Guaranteeing Gender Fairness in Federated Recommendation [18.1] 我々は、厳密なプライバシー制約の下で、連合推薦システムがグループフェアネスを達成できるかどうかを検討する。
セキュアアグリゲーション方式と量子化手法を用いたプライバシ保存直交アグリゲーション(PPOA)を提案する。
実験の結果、PPOAは女性と男性両方の推奨効果を最大8.25%、男性では6.36%向上させることが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:12:11 GMT)
In-Context Learning with Noisy Labels [17.9] インコンテキスト学習(In-context learning)とは、大規模言語モデル(LLM)が、追加のトレーニングなしでターゲットタスクを実行する能力の出現を指す。
近年の研究では、より有用な実演を選択することで、文脈内学習性能の向上をめざしている。
提案手法は,実環境における課題実証におけるラベルの破損を解消することを目的とした,雑音のあるラベル付きコンテキスト内学習を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:54:08 GMT)
Protecting Multiple Types of Privacy Simultaneously in EEG-based Brain-Computer Interfaces [17.2] 脳コンピュータインタフェース(BCI)は、脳と外部デバイスとの直接通信を可能にする。
脳波は、その利便性と低コストのため、非侵襲的BCIにおいて好ましい入力信号である。
脳波信号は本質的に豊かな個人情報を持ち、プライバシー保護を必要とする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:33:31 GMT)
Robust Bayesian Scene Reconstruction by Leveraging Retrieval-Augmented Priors [17.1] 単一のRGBD画像から多目的シーンを再構成する問題に焦点をあてる。
この問題に対する現在のディープラーニングアプローチは、現実の観測に難航する可能性がある。
既存のメッシュデータセットを活用可能な再構成手法BRRPを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:14:17 GMT)
FLARE: Towards Universal Dataset Purification against Backdoor Attacks [17.0] ディープニューラルネットワーク(DNN)は、バックドア攻撃の影響を受けやすい。
隠れたバックドアを埋め込むために、敵に特定されたトリガーを持つ敵の毒のデータセット。
各種バックドア攻撃に対する汎用的浄化法であるFLAREを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:34:21 GMT)
Environment Invariant Linear Least Squares [16.8] 本稿では,複数の実験環境からのデータを収集する多環境線形回帰モデルについて考察する。
線形最小二乗回帰のマルチ環境バージョンである、新しい環境不変線形最小二乗関数(EILLS)を構築する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:57:11 GMT)
Beyond Surface Structure: A Causal Assessment of LLMs' Comprehension Ability [16.8] 大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示している。
議論は、それらが真に深い構造(すなわち、コアセマンティクス)を理解しているか、単に表面構造に依存しているのかについて継続する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:57:26 GMT)
Steering Away from Harm: An Adaptive Approach to Defending Vision Language Model Against Jailbreaks [16.5] 視覚言語モデル(VLM)は、敵の攻撃にさらされると意図しない有害なコンテンツを生成できる。
既存の防御(例えば、入力前処理、敵の訓練、応答評価に基づく手法)は、実世界の展開には実用的ではないことが多い。
本稿では,VLM攻撃に対する対向的特徴方向からモデルを誘導し,効果的かつ効果的な防御法であるASTRAを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:17:02 GMT)
Graph-Enhanced EEG Foundation Model [16.3] 本稿では,時間情報とチャネル間情報を統合した新しい脳波基盤モデルを提案する。
我々のアーキテクチャはグラフニューラルネットワーク(GNN)とマスク付きオートエンコーダを組み合わせることで,効率的な事前学習を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:57:50 GMT)
Knowledge-Data Fusion Based Source-Free Semi-Supervised Domain Adaptation for Seizure Subtype Classification [16.1] ソースフリー半教師付きドメイン適応(SF-SSDA)は、プライバシ保存型発作サブタイプ分類に使用することができる。
脳波を用いた発作サブタイプ分類のための知識データフュージョンに基づくSF-SSDAアプローチKDF-MutualSHOTを提案する。
パブリックなTUSZデータセットとCHSZデータセットの実験では、KDF-MutualSHOTが他の教師付きおよびソースフリーなドメイン適応アプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:40:45 GMT)
o1-Coder: an o1 Replication for Coding [16.0] O1-CoDERは、コーディングタスクに焦点を当てたOpenAIのo1モデルを複製する試みである。
強化学習(RL)とモンテカルロ木探索(MCTS)を統合し、モデルのSystem-2思考能力を強化する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:19:56 GMT)
An Operator Splitting View of Federated Learning [16.0] 過去数年間、学習(texttFL$)コミュニティは、新しい$texttFL$アルゴリズムの急増を目撃してきた。
我々は、異なるアルゴリズムを簡単に比較し、以前の収束結果と比較し、新しいアルゴリズムの変種を明らかにする。
統一アルゴリズムは、オーバーヘッドを伴わずに$texttFL$アルゴリズムを加速する方法も導き出す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:54:31 GMT)
Layered Rendering Diffusion Model for Controllable Zero-Shot Image Synthesis [15.8] 本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
まず、摂動分布の基本的な空間的キューとして視覚誘導を導入する。
本稿では,複数のレイヤからなる画像レンダリングプロセスを構築する汎用フレームワークであるLayered Rendering Diffusion (LRDiff)を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:23:28 GMT)
Zero-Indexing Internet Search Augmented Generation for Large Language Models [15.7] 大規模言語モデルの性能向上に有効な手法として,検索用拡張生成が登場している。
このアプローチは通常、静的な前処理コーパスを管理するために様々なインデックス機構を使用する内部検索モジュールに依存します。
本稿では,標準検索エンジンAPIを活用して最新のオンライン情報を動的に統合する代替手法について検討する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:31:04 GMT)
Scaling Transformers for Low-Bitrate High-Quality Speech Coding [15.6] 最先端の音声品質を極端に低ビットレートで400ドルまたは700ドル/秒で達成可能であることを示す。
トレーニングされたモデルは、客観的テストと主観的テストの両方において、既存のベースラインを強く上回ります。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:58:02 GMT)
Responsible AI Governance: A Response to UN Interim Report on Governing AI for Humanity [15.4] このレポートは、持続可能な開発目標を達成するためのAIの変革の可能性を強調している。
それは、関連するリスクを軽減するための堅牢なガバナンスの必要性を認めている。
報告書は、責任あるAIガバナンスを促進するための実行可能な原則で締めくくっている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:57:24 GMT)
Finite-difference-informed graph network for solving steady-state incompressible flows on block-structured grids [15.4] blueTextA graph convolution-based FD method (GC-FDM) は、ラベルのない物理制約でグラフネットワークを訓練するために提案されている。
様々な境界条件下でのCFDソルバと比較した場合,提案手法は速度場予測における相対誤差を10~3ドルの順序で達成する。
提案手法は,物理インフォームドニューラルネットワークと比較してトレーニングコストを約20%削減する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:07:08 GMT)
Sensitive Content Classification in Social Media: A Holistic Resource and Evaluation [15.4] 6つのカテゴリにまたがるソーシャルメディアコンテンツモデレーションに適した統合データセットを提案しました。
これには、矛盾する言語、暴言、性的明示的な材料、薬物関連コンテンツ、自傷行為、スパムが含まれる。
この新たなデータセットを微調整した大規模言語モデルでは,市販のモデルに比べて検出性能が大幅に向上した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:44:02 GMT)
Towards Class-wise Robustness Analysis [15.4] 弱い堅牢なクラスを爆発させることは、攻撃者が画像認識モデルを騙す潜在的な方法である。
本研究では、対角的に訓練された頑健な分類モデルにおけるクラス間バイアスについて検討する。
特定の対象クラスとしてのクラス偽陽性の数は、攻撃に対する脆弱性に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:09:59 GMT)
Deep Learning-based Code Reviews: A Paradigm Shift or a Double-Edged Sword? [15.0] 私たちは、自動生成されたコードレビューのサポートなしで、異なるプログラムをレビューする29人の専門家による制御された実験を実行しました。
本研究は,LLMが自動認識する問題の大部分をレビュアが有効とみなし,自動化されたレビューを出発点として利用できることが,彼らの行動に強く影響していることを示す。
しかし、自動化されたレビューから始まったレビュアーは、完全な手作業のプロセスと比較して、より高重度な問題を特定できない一方で、より多くの低重度な問題を特定した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:48:33 GMT)
PerLA: Perceptive 3D Language Assistant [15.0] PerLAは3D言語アシスタントであり、詳細とコンテキストの両方をより知覚しやすいように設計されている。
ヒルベルト曲線を通して点雲の局所性を保存する新しいアルゴリズムを提案する。
また、トレーニングの安定性を促進するために、局所的な表現コンセンサスに対する新たな損失も導入する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:20:29 GMT)
Autocorrelation Matters: Understanding the Role of Initialization Schemes for State Space Models [14.9] 状態空間モデル(SSM)パラメータを初期化する現在の手法は、HiPPOフレームワークに依存している。
入力シーケンスの自己相関を考慮し、SSMスキームの役割を更に検討する。
SSM状態行列の固有値の虚部がSSM最適化問題の条件付けを決定することを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:55:19 GMT)
SDR-GNN: Spectral Domain Reconstruction Graph Neural Network for Incomplete Multimodal Learning in Conversational Emotion Recognition [14.6] 会話におけるマルチモーダル感情認識(MERC)は、テキスト、聴覚、視覚的モーダル特徴を用いて発話感情を分類することを目的としている。
既存のMERC手法の多くは、それぞれの発話が完全なモーダル性を持っていると仮定し、現実世界のシナリオにおける不完全モーダル性の一般的な問題を見越している。
会話感情認識における不完全なマルチモーダル学習のためのスペクトル領域再構成グラフニューラルネットワーク(SDR-GNN)を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:31:50 GMT)
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models [14.5] チェリーパラメータの小さなサブセットは、モデル性能に非常に大きな影響を与えていることがわかった。
混合精度パラメータの最適化を統一する新しい量子化法であるCherryQを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:49:20 GMT)
SkelMamba: A State Space Model for Efficient Skeleton Action Recognition of Neurological Disorders [14.3] 骨格に基づく人間行動認識のための新しい状態空間モデル(SSM)を提案する。
本モデルでは,複数部位にわたる局所的な関節相互作用と大域的な運動パターンを捉える。
この歩行認識分解は、診断において重要な微妙な動きパターンを識別する能力を高める。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:43:52 GMT)
Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning [13.8] 低ランクアダプタは,大規模言語モデル(LLM)を効率よく微調整するための標準的アプローチとなっている
低ランク部分空間内での完全な微調整を近似するLoRA Silver BulletあるいはLoRA-SBを提案する。
その結果,低ランク部分空間における完全微調整をシミュレートすることが可能であり,性能を損なうことなく大幅な効率向上が達成できることが判明した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:10:30 GMT)
FairDD: Fair Dataset Distillation via Synchronized Matching [13.6] 本稿では,FairDDという新しいフェアデータセット蒸留(FDD)フレームワークを提案する。
FairDDの鍵となるイノベーションは、同期的に合成データセットを元のデータセットのPAワイドグループにマッチングすることにある。
分類精度を犠牲にすることなく,FairDDはバニラDD法に比べて公平性を著しく向上することを示した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:22:20 GMT)
Fast post-process Bayesian inference with Variational Sparse Bayesian Quadrature [13.4] 本稿では,既存の目標密度評価から高速な後続近似を得る手段として,プロセス後ベイズ推定の枠組みを提案する。
この枠組みでは,ブラックボックスと潜在的ノイズの可能性のあるモデルに対して,プロセス後近似推定法である変分スパースベイズ近似(VSBQ)を導入する。
本手法は,計算神経科学による難解な合成シナリオと実世界の応用について検証する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:49:04 GMT)
SceneMotion: From Agent-Centric Embeddings to Scene-Wide Forecasts [13.2] 自動運転車は、環境と対話し安全な操作を計画するために、マルチモーダルな動き予測に頼っている。
我々は、複数の交通機関のシーンワイド・モーション・モードを予測するアテンションベースモデルであるSceneMotionを紹介する。
このモジュールは複数のエージェント中心の埋め込みからシーン全体の潜在空間を学習し、共同予測と相互作用モデリングを可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:35:16 GMT)
On the consistency of hyper-parameter selection in value-based deep reinforcement learning [13.1] 本稿では,値に基づく深層強化学習エージェントのハイパーパラメータ選択の信頼性に着目した実証的研究を行う。
我々の研究は、どのハイパーパラメーターがチューニングに最も重要かを確立するのに役立ち、どのチューニングが異なるトレーニング体制間で一貫性を持ち続けるかを明らかにするのに役立ちます。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:51:22 GMT)
PDDLFuse: A Tool for Generating Diverse Planning Domains [13.0] PDDLFuseは、新しいプランナーの検証や基礎的な計画モデルのテストに使用できる、新しい多様なプランニングドメインを生成するように設計されている。
我々は,生成するドメインの難易度を調整するために,ドメインジェネレータパラメータを調整する手法を開発した。
最初のテストでは、PDDLFuseは複雑で多様なドメインを効率的に生成し、従来のドメイン生成方法よりも大幅に進歩したことを示している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:52:39 GMT)
EarthMarker: A Visual Prompting Multi-modal Large Language Model for Remote Sensing [13.0] 平易な言語命令だけで複雑なリモートセンシング(RS)シナリオで情報を提供するのは難しい。
EarthMarkerは、視覚的なプロンプトを上昇させることで、画像、領域、点レベルのRS画像を解釈することができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:18:58 GMT)
Tortho-Gaussian: Splatting True Digital Orthophoto Maps [12.8] 真のデジタルオルソフォトマップ(TDOM)は、デジタル双生児と地理情報システム(GIS)にとって不可欠な製品である
伝統的に、TDOM生成は、様々な課題のために悪化する可能性のある、伝統的なフォトグラムプロセスの複雑なセットを含む。
Tortho-Gaussianは3次元ガウススティング(3DGS)にインスパイアされた新しい手法で、最適化された異方性ガウスカーネルのスティングによってDOMを生成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:22:38 GMT)
Adaptive Interactive Segmentation for Multimodal Medical Imaging via Selection Engine [12.6] 本稿では,様々な医用画像モダリティのセグメンテーション性能を向上させる戦略駆動型インタラクティブモデル(SISeg)を提案する。
本研究では,医療知識を必要とせずに最適なプロンプトフレームを動的に選択する適応フレーム選択エンジン(AFSE)を開発した。
我々は, SISegモデルの頑健な適応性とマルチモーダルタスクの一般化を実証し, 7つの医用画像モダリティをカバーする10のデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:08:28 GMT)
Bias-inducing geometries: an exactly solvable data model with fairness implications [12.5] 我々は、正確に解決可能なデータ不均衡の高次元モデルを導入する。
この合成フレームワークで訓練された学習モデルの典型的特性を解析的に解き放つ。
フェアネス評価によく用いられる観測対象の正確な予測値を得る。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:12:44 GMT)
Blurred LiDAR for Sharper 3D: Robust Handheld 3D Scanning with Diffuse LiDAR and RGB [12.4] 3D表面の再構成は、仮想現実、ロボット工学、モバイルスキャンの応用において不可欠である。
RGBベースの再構築は、低テクスチャ、低照度、低アルベドシーンでしばしば失敗する。
我々は、拡散フラッシュを出力する代替のLiDARクラスを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:01:23 GMT)
Exploiting ChatGPT for Diagnosing Autism-Associated Language Disorders and Identifying Distinct Features [12.0] 本研究は、ChatGPT自然言語処理機能を利用して、診断プロセスを簡素化し改善する。
自閉症関連言語障害の10つの重要な特徴をシナリオ間で同定した。
我々の研究は、ChatGPTのような高度なAIツールを臨床環境に適用し、発達障害を評価し診断することを提唱している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:15:20 GMT)
METEOR: Evolutionary Journey of Large Language Models from Guidance to Self-Growth [11.8] 本稿では,弱いデータ蒸留,反復訓練,自己進化戦略の3段階を含むMeteor法を提案する。
実験により,本手法はドメイン固有タスクにおける精度,完全性,妥当性,一貫性,信頼性を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:07:41 GMT)
Gradient Inversion Attack on Graph Neural Networks [11.7] 悪意のある攻撃者は、フェデレート学習中にニューラルネットワークの勾配を交換することで、プライベートイメージデータを盗むことができる。
広く使われている2つのGNNフレームワーク、すなわちGCNとGraphSAGEが分析されている。
グラフデータの一部が勾配から漏れることが示されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:42:17 GMT)
Uni-SLAM: Uncertainty-Aware Neural Implicit SLAM for Real-Time Dense Indoor Scene Reconstruction [11.7] 屋内再構成のためのハッシュグリッドに基づく3次元空間表現であるUni-SLAMを提案する。
合成および実世界のデータセットの実験により、我々のシステムは最先端の追跡とマッピングの精度を達成できることを示した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:16:58 GMT)
FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation [11.7] 異常セグメンテーション(英: Anomaly segmentation)は、予期せぬ事象を認識する必要がある安全クリティカルなアプリケーションにとって貴重なコンピュータビジョンタスクである。
現在の最先端の異常セグメンテーションアプローチは、トレーニング中に様々な不適切なクラスラベルに依存しており、ラベルなしおよび事前訓練された視覚エンコーダを活用する能力を制限する。
視覚基盤モデルを用いてリッチな特徴を抽出し,密度分布の学習に正規化フローネットワークを利用する,新たな自己教師型フレームワークであるFlowCLASを紹介する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:53:41 GMT)
GradAlign for Training-free Model Performance Inference [11.6] トレーニングフリーなニューラルアーキテクチャサーチ(NAS)は、広範なトレーニングを必要とせずに理想的なアーキテクチャを発見することを目的としている。
GradAlignは、トレーニングを必要とせずにモデルパフォーマンスを推論するために設計された、シンプルで効果的な方法である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:27:55 GMT)
Automated Speaking Assessment of Conversation Tests with Novel Graph-based Modeling on Spoken Response Coherence [11.2] ASACは、1つ以上の候補者と対話する環境でL2話者の全体的な発話能力を評価することを目的としている。
本稿では,広い応答間相互作用とニュアンス付き意味情報の両方を適切に組み込んだ階層グラフモデルを提案する。
NICT-JLEベンチマークデータセットの大規模な実験結果から,提案手法が予測精度を大幅に向上する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:37:06 GMT)
Scalable Out-of-distribution Robustness in the Presence of Unobserved Confounders [11.1] 我々は、配当シフトが観測されていない共同設立者(Z$)による、配当外配当(OOD)一般化の課題を考える。
我々の研究は、予測を著しく単純化し、結果としてエレガントな単純さが既存のアプローチより優れているという、識別可能性の仮定を調査する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:38:17 GMT)
Relative Representations of Latent Spaces enable Efficient Semantic Channel Equalization [11.1] 本稿では,新たな意味等化アルゴリズムを提案する。
提案手法の有効性を数値計算により明らかにした。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:08:48 GMT)
Reverse-type Data Processing Inequality [11.0] 量子データ処理の不等式(quantum data processing inequality)は、2つの量子状態がノイズチャネルを適用すると識別しにくくなることを示す。
逆量子データ処理の不等式は、ノイズチャネルの適用後に一対の状態が識別可能であるかどうかを特徴付ける。
量子チャネルの多くは非ゼロ展開係数を持たないため、逆データ処理の不等式は認められない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:56:36 GMT)
Random Feature Models with Learnable Activation Functions [10.9] 学習可能活性化関数(RFLAF)を用いたランダム特徴モデルを提案する。
RFLAFは従来のランダム特徴(RF)モデルの表現性と解釈可能性を大幅に向上させる。
我々のモデルは、ランダムな特徴モデル内でより表現力のある、解釈可能なフレームワークを開発するための道を開く。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:38:12 GMT)
Realistic Corner Case Generation for Autonomous Vehicles with Multimodal Large Language Model [10.7] AutoScenarioは、現実的なコーナーケース生成のためのフレームワークである。
複数の情報源からの安全クリティカルな現実世界データをテキスト表現に変換する。
シミュレーション・オブ・アーバンモビリティ(SUMO)とCARLAシミュレータのツールを統合している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:23:28 GMT)
RECOVER: Toward the Automatic Requirements Generation from Stakeholders' Conversations [10.7] 本稿では,NLPとファンデーションモデルを利用して,利害関係者のインタラクションからシステム要求を自動的に抽出する新しい要求工学手法であるRECOVERを紹介する。
この手法は, 統計的性能解析と要求技術者を含むユーザスタディを組み合わせた, 混合手法の研究設計を用いて評価される。
評価結果から,RECOVERの性能に関する有望な結果が得られた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:52:40 GMT)
Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions [10.6] 私たちは、12の参照と360の歪んだビデオからなるフルHD解像度ステレオスコープ(S3D)ビデオデータセットを作成します。
生成したビデオデータセットを24人の視聴者で主観分析する。
S3Dビデオに対して,オピニオン・ウナウェア(OU)とディストーション・ウナウェア(DU)のビデオ品質評価モデルを開発した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:40:58 GMT)
Reinforcement Learning Enhancing Entanglement for Two-Photon-Driven Rabi Model [10.6] ラビモデルにおける2光子駆動振幅を変調することにより絡み合いを高める制御方式を提案する。
絡み合いの挙動は相転移を反映し、強化学習剤を用いて制御パルスの時間的シーケンスを生成する。
この研究は、非平衡系の量子資源を正に増強する方法を舗装する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:02:12 GMT)
Multiview Equivariance Improves 3D Correspondence Understanding with Minimal Feature Finetuning [10.5] 我々は、VTベースのモデルの3次元認識を評価し、強化する。
本稿では,3次元対応に基づく簡易かつ効果的なファインタニング戦略を提案する。
すべてのコードとリソースが公開され、3D対応ビジョンモデルのさらなる進歩をサポートする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:02:11 GMT)
Parameter-efficient Fine-tuning in Hyperspherical Space for Open-vocabulary Semantic Segmentation [10.5] オープンボキャブラリセマンティックセグメンテーションは、画像中の各ピクセルに任意のテキスト記述をラベル付けしようとする。
視覚言語基盤モデル、特にCLIPは、オープン語彙能力を取得するための強力なツールとして登場した。
H-CLIPは、CLIPの総パラメータの約4%を更新するだけで、新しいSOTAオープン語彙セマンティックセマンティックセマンティクス結果を達成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:54:29 GMT)
Gaussian multi-target filtering with target dynamics driven by a stochastic differential equation [10.3] 本稿では,連続時間に目標ダイナミクスを付与し,離散時間で測定を行うマルチターゲットフィルタリングアルゴリズムを提案する。
本研究では,新しいターゲットの集合の分布を導出し,その誕生時の各ターゲットの最適な適合平均と共分散のクローズドフォーム表現を算出する。
これらの連続離散多ターゲットフィルタは、非線形微分方程式によって駆動される標的力学にも拡張される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:20:36 GMT)
Diffusion Model Guided Sampling with Pixel-Wise Aleatoric Uncertainty Estimation [10.3] 本稿では,拡散モデルのサンプリングフェーズにおける画素単位のアレタリック不確かさを推定する。
この不確実性は、拡散モデルに特化して設計された摂動スキームによるデノナイジングスコアのばらつきとして計算される。
FIDスコアの点から,本手法がより優れたサンプル生成に繋がることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:02:08 GMT)
KV Shifting Attention Enhances Language Modeling [10.3] 現在の大規模言語モデルは、主に、文脈内学習能力の優れたデコードのみの構造変換器に基づいている。
モデル誘導の能力をより効率的に実装するために、KVシフト注意を提案する。
実験結果から,KVシフト注意が学習誘導ヘッドや言語モデリングに有用であることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:42:38 GMT)
SoK: Detection and Repair of Accessibility Issues [10.1] 我々は,55種類のアクセシビリティ問題(知覚可能性,操作性,理解可能性,ロバスト性)を分類する包括的分類法を開発した。
既存の検出・修復ツールの詳細な分析を行い、対応するデータセットの状態を解析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:19:19 GMT)
Universal non-Hermitian transport in disordered systems [9.8] 混乱したエルミート系では、エネルギー固有状態の局在は波動伝播を禁止している。
非エルミート系では、ハミルトニアンの固有状態が指数関数的に局所化しても波動伝播が可能である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:09:40 GMT)
InputSnatch: Stealing Input in LLM Services via Timing Side-Channel Attacks [9.7] 大規模言語モデル (LLM) には広範な知識と質問応答能力がある。
キャッシュ共有メソッドは、キャッシュされた状態や、同じまたは同様の推論要求に対するレスポンスを再利用することで、効率を高めるために一般的に使用される。
LLMの推論において入力盗難を実行するための新しいタイミングベースのサイドチャネル攻撃を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:33:49 GMT)
On the Performance Analysis of Momentum Method: A Frequency Domain Perspective [9.6] 本稿では,モーメント法を動的勾配の時間変化フィルタとして解釈する周波数領域解析フレームワークを提案する。
我々の実験はこの視点を支持し、関連するメカニズムをより深く理解する。
本稿では,運動量フィルタリングをニューラルネットワークのトレーニングに効果的に行うための一般化として,周波数勾配Descent (FS)を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:56:43 GMT)
Dynamic Universal Approximation Theory: The Basic Theory for Deep Learning-Based Computer Vision Models [9.5] コンピュータビジョン(CV)は人工知能において最も重要な分野の一つである。
近年,畳み込みニューラルネットワーク(CNN)とトランスフォーマーに基づくさまざまなディープラーニングモデルが,CVの多様な問題に対処するために設計されている。
これらのアルゴリズムはロボット工学や顔認識などの分野で実用化されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:15:05 GMT)
Dynamic Universal Approximation Theory: The Basic Theory for Transformer-based Large Language Models [9.5] 大規模トランスフォーマーネットワークは、自然言語処理アルゴリズムの進歩において、急速に主要なアプローチとなっている。
本稿では,大規模言語モデル(LLM)の理論的基礎について考察する。
理論的な背景を提供し、これらの進歩を支えるメカニズムに光を当てている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:50:09 GMT)
Dynamic Universal Approximation Theory: Foundations for Parallelism in Neural Networks [9.5] 現在のディープラーニングモデルは、主にシリアルであり、ネットワーク層の数が増えるにつれて、トレーニングと推論時間も増加する。
本稿では,Universal Approximation Theorem(UAT)に基づくディープラーニング並列化戦略を提案する。
従来のシリアルモデルとは異なり、Para-Formerの推論時間はレイヤ数で増加せず、多層ネットワークの推論速度が著しく向上する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:16:25 GMT)
Multimodal Whole Slide Foundation Model for Pathology [9.5] 我々は,視覚的自己教師型学習と,病理報告と視覚言語アライメントを用いて事前学習したスライド基礎モデルであるTITANを提案する。
TITANは、汎用的なスライド表現を抽出し、リソース限定の臨床シナリオに一般化する病理報告を生成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:39:57 GMT)
Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections [9.0] 本研究では,動的高次制御バリア関数(DHOCBF)と拡散モデル(DSC-Diffuser)を統合する安全クリティカルプランニング手法を提案する。
提案手法は目標指向のタスク誘導拡散モデルを導入し,実世界のデータから複数のタスクを同時に学習することを可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:57:00 GMT)
Enhancing Security in Third-Party Library Reuse -- Comprehensive Detection of 1-day Vulnerability through Code Patch Analysis [8.9] サードパーティライブラリ(TPL)は、TPLのメンテナンスが低いため、脆弱性(1日脆弱性と呼ばれる)を導入することができる。
VULTUREは、脆弱なTPLの再利用から生じる1日間の脆弱性を特定することを目的としている。
VULTUREは178個のTPLから175個の脆弱性を特定した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:02:28 GMT)
RoadGen: Generating Road Scenarios for Autonomous Vehicle Testing [8.9] 道路のシナリオ(例えば、道路のトポロジーと幾何学)は文献からはほとんど注目されていない。
そこで我々は,多様な道路シナリオを体系的に生成するRoadGenを提案する。
鍵となるアイデアは、8種類のパラメータ化された道路コンポーネントを接続して、トポロジと幾何学の多様性の高い道路シナリオを構築することである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:47:42 GMT)
Emotion-aware Personalized Music Recommendation with a Heterogeneity-aware Deep Bayesian Network [8.8] 我々はこれらの仮定をモデル化するヘテロジニティ対応ディープベイズネットワーク(HDBN)を提案する。
HDBNは、4つのコンポーネントで音楽を選択するというユーザの決定過程を模倣している。
提案手法は,HR,Precision,NDCG,MRRの指標に対するベースラインアプローチよりも有意に優れている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:43:59 GMT)
Hadamard Representations: Augmenting Hyperbolic Tangents in RL [8.6] 活性化関数は、ディープニューラルネットワークの重要なコンポーネントの1つである。
強化学習では、連続的な微分可能なアクティベーションの性能は、分数次線形関数と比較して低下することが多い。
我々は、より高速な学習、死んだ神経細胞の減少、深いQ-ネットワークによる効果的なランクの向上を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:24:58 GMT)
Conversational Complexity for Assessing Risk in Large Language Models [8.6] 大規模言語モデル(LLM)は、有害な可能性を秘めつつ、有益なアプリケーションを可能にする。
2023年、ジャーナリストのケビン・ルース(Kevin Roose)がLLMの検索エンジンであるBingと対話した。
LLMから有害な情報を引き出すには、どの程度の会話努力が必要か?
本稿では,会話長(CL)と会話複雑度(CC)の2つの尺度を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 01:47:20 GMT)
TQA-Bench: Evaluating LLMs for Multi-Table Question Answering with Scalable Context and Symbolic Extension [8.5] TQA-Benchは,大規模言語モデル(LLM)の複雑なQAタスクをリレーショナルデータ上で処理する能力を評価するために設計された,新しいマルチテーブルQAベンチマークである。
我々のベンチマークでは、現実世界のパブリックデータセットから得られた多様なリレーショナルデータベースインスタンスを組み込んでいます。
我々は、70億から700億のパラメータにまたがる、オープンソースとクローズドソースの両方のLLMを体系的に評価する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:48:13 GMT)
APT: Architectural Planning and Text-to-Blueprint Construction Using Large Language Models for Open-World Agents [8.5] 本稿では,自律型エージェントによるMinecraftの複雑な構造構築を可能にする,LLM(Large Language Model)駆動のフレームワークを提案する。
連鎖分解とマルチモーダル入力を用いることで、このフレームワークは詳細なアーキテクチャレイアウトと青写真を生成する。
本エージェントは, メモリとリフレクションモジュールの両方を組み込んで, 生涯学習, 適応的洗練, エラー訂正を容易にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:23:36 GMT)
Transientangelo: Few-Viewpoint Surface Reconstruction Using Single-Photon Lidar [8.5] ライダーは、ターゲットに光のパルスを放出し、反射光の光速遅延を記録することで、3Dシーンの幾何学を捉えている。
従来のライダーシステムは、後方散乱光の生で捕獲された波形を出力しない。
我々は,光子ノイズに対するロバスト性を向上させる新しい正則化戦略を開発し,画素あたり10光子程度で正確な表面再構成を可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:40:14 GMT)
Block majorization-minimization with diminishing radius for constrained nonsmooth nonconvex optimization [8.4] BMM(Block Majorization-minimativeization)は、制約付き非負のサロゲートに対する単純な反復アルゴリズムである。
BMMは,様々なアルゴリズムに対して,新しい一階最適度尺度を生成する。
また, BMM の収束率を向上させるために, 減衰半径の付加的利用が有効であることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:04:47 GMT)
You Don't Need Domain-Specific Data Augmentations When Scaling Self-Supervised Learning [8.4] JEA(Joint-Embedding Architectures)とSSL(Self-Supervised Learning)は、優れたパフォーマンスを実現している。
生成的再構成モデルではマスキング以外のデータ拡張を使わずに高い性能を示した。
トレーニングデータの大きさが十分大きい場合, 画像の強い表現はJEAで得られ, 刈り取りだけはサイズを変えずに得られることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:39:02 GMT)
What Is Fairness? On the Role of Protected Attributes and Fictitious Worlds [8.2] フェアネス対応機械学習(fairML)における文献の増大は、自動意思決定(ADM)における機械学習(ML)に関連する不公平性を緩和することを目的としている。
しかしながら、フェアネスの概念の根底にある概念は、何世紀にもわたって哲学的な議論と、MLコミュニティにおけるこの概念の最近の採用との間に大きなギャップを残している、ほとんど議論されない。
公平性という一貫した概念を定式化し、哲学的考察をADMシステムにおけるMLモデルのトレーニングと評価のための形式的枠組みに変換することにより、このギャップを埋めようとしている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:01:31 GMT)
Mixed-state quantum anomaly and multipartite entanglement [8.1] 混合状態絡み合いと't Hooft anomaly'との間に驚くべき関連性を示す。
非自明な長距離多部交絡を伴う混合状態の単純な例を生成する。
また,強い対称性と弱い対称性の両方を含む混合異常を解析した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:45:44 GMT)
Mind the Prompt: A Novel Benchmark for Prompt-based Class-Agnostic Counting [8.0] クラスに依存しないカウント(CAC)は、モデルトレーニング中に見たことのない任意のオブジェクトクラスのインスタンスをカウントする。
本稿では,Prompt-Aware Countingベンチマークを導入し,プロンプトベースのCACモデルの堅牢性と信頼性を評価する。
我々は最先端の手法を評価し、標準クラス固有の計数基準で印象的な結果を得たものの、入力プロンプトの理解に重大な欠陥があることを実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:42:14 GMT)
Convergence Analysis for Deep Sparse Coding via Convolutional Neural Networks [8.0] スパースコーディングとディープラーニングの交差点を探索し,特徴抽出能力の理解を深める。
我々は、畳み込みニューラルネットワーク(CNN)のスパース特徴抽出能力の収束率を導出する。
スパースコーディングとCNNの強いつながりにインスパイアされた私たちは、ニューラルネットワークがよりスパースな機能を学ぶように促すトレーニング戦略を探求する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:29:20 GMT)
SEDMamba: Enhancing Selective State Space Modelling with Bottleneck Mechanism and Fine-to-Coarse Temporal Fusion for Efficient Error Detection in Robot-Assisted Surgery [7.9] 選択的状態空間モデル(SSM)を外科的誤り検出に組み込んだSEDMambaという新しい階層モデルを提案する。
SEDMambaは、長期ビデオにおける外科的エラーの検出と時間的局所化のために、ボトルネック機構と微細から粗い時間的融合(FCTF)を備えた選択的SSMを強化する。
我々の研究は、実際の手術症例におけるエラー検出を支援するために、第一種、フレームレベル、生存中の外科的エラーデータセットにも貢献する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:34:28 GMT)
COLD: Causal reasOning in cLosed Daily activities [7.8] 我々はCOLD(Causal reasOning in cLosed Daily activities)フレームワークを提案する。
出来事の因果性を理解するために、日々の現実的な活動に対する人間の理解に基づいて構築されている。
提案手法は,膨大な因果クエリ作成を容易にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:37:13 GMT)
Wafer2Spike: Spiking Neural Network for Wafer Map Pattern Classification [7.7] We developed Wafer2Spike, a architecture for wafer map pattern classification using a spiking Neural Network (SNN)。
Wafer2Spikeは平均分類精度98%をWM-811kウェハベンチマークデータセットで達成している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:31:01 GMT)
The Streetscape Application Services Stack (SASS): Towards a Distributed Sensing Architecture for Urban Applications [7.7] ストリートスケープアプリケーションは、多様なセンサーとリアルタイムな意思決定を統合するアプリケーションを通じて、安全、移動性、生活の質を改善することを目的としている。
Street Application Services Stack (SASS)は、これらの課題に、マルチモーダルデータ同期、時間的データ融合、分散エッジコンピューティングの3つのコアサービスで対処する。
私たちは、リアルタイムでスケーラブルな都市アプリケーションをサポートするために、SASSがいかに抽象化とパフォーマンスを提供するかを示します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:02:00 GMT)
Towards Understanding Retrieval Accuracy and Prompt Quality in RAG Systems [7.5] 我々は、RAGシステムのメカニズムをよりよく理解するために、初期の探索的研究を行う。
本稿では,検索用文書の種類,検索用リコール,文書選択,プロンプト技術という4つの設計要素に着目した。
本研究は,各因子がシステム正当性と信頼にどのように影響するかを明らかにし,正確で信頼性の高いRAGシステムの開発に有用な知見を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:25:31 GMT)
Aggregated Attributions for Explanatory Analysis of 3D Segmentation Models [7.4] 本稿では,3次元セグメンテーションモデルの微細なボクセル属性を集約する手法であるAgg2Expを紹介する。
実験により,勾配に基づくボクセル属性は摂動に基づく説明よりもモデルの予測に忠実であることが示された。
Agg2Expは、予測性能以上の大きなセグメンテーションモデルの説明分析を容易にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:15:43 GMT)
Build An Influential Bot In Social Media Simulations With Large Language Models [7.2] 本研究では,エージェントベースモデリング(ABM)とLarge Language Models(LLM)を組み合わせた新しいシミュレーション環境を提案する。
本稿では,Reinforcement Learning (RL) の革新的応用として,世論指導者形成の過程を再現する手法を提案する。
以上の結果から,行動空間の制限と自己観察の導入が,世論指導層形成の安定に寄与する重要な要因であることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:37:12 GMT)
Curriculum Fine-tuning of Vision Foundation Model for Medical Image Classification Under Label Noise [7.2] ノイズラベルは医療データセットにおいて重要な問題であり、モデルパフォーマンスを著しく低下させる可能性がある。
従来のクリーンサンプル選択法では,視覚基礎モデルの事前学習した特徴は利用されていない。
ラベルノイズ下での医用画像分類のためのVFMのカリキュラム微調整パラダイムであるCUFITを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:18:52 GMT)
Pretrained Reversible Generation as Unsupervised Visual Representation Learning [7.1] 本研究では,事前学習した連続流れモデルの生成過程を逆転させて教師なし表現を抽出するPRGを提案する。
PRGは教師なし生成モデルを効果的に再利用し、その高い能力を利用して下流タスクの堅牢で一般化可能な特徴抽出器として機能する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:24:49 GMT)
Anatomical Foundation Models for Brain MRIs [7.0] 我々は脳MRIの解剖学的基礎モデルであるAnatCLを提案する。
異なる条件の診断のための12の下流タスクについて検討する。
予備訓練中に解剖情報を組み込むことで,より堅牢で汎用的な表現が可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:04:17 GMT)
CantorNet: A Sandbox for Testing Topological and Geometrical Measures [6.8] カントール集合の3進構成にインスパイアされたemphCantorNetを導入する。
CantorNetはReLUニューラルネットワークのファミリーであり、コルモゴロフ複雑性の可能な全スペクトルにまたがる。
我々の研究は、幾何学的に無知なデータ拡張技術と敵攻撃の潜在的な落とし穴を示すのに役立つかもしれない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:01:34 GMT)
Attribute-Enhanced Similarity Ranking for Sparse Link Prediction [6.8] グラフニューラルネットワーク(GNN)がリンク予測の主要なフレームワークとなっている。
本稿では,リンク予測におけるGNNの性能が,より現実的な不均衡設定に反映されないことを示す。
実験により,類似性に基づくリンク予測手法であるGelatoが,既存のGNNベースの代替よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:22:35 GMT)
Software Model Evolution with Large Language Models: Experiments on Simulated, Public, and Industrial Datasets [6.6] RAMCを用いたモデル補完のための大規模言語モデルの可能性を評価する。
大規模な言語モデルは、ソフトウェアモデルの進化をサポートするための有望な技術であることがわかった。
大規模言語モデルの一般的な推論能力は、ほとんど、うるさい、あるいは全く例のない概念を扱う際に特に有用である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:33:53 GMT)
AdvFuzz: Finding More Violations Caused by the EGO Vehicle in Simulation Testing by Adversarial NPC Vehicles [6.3] AdvFuzzは、メインレーン上の敵シナリオを生成するための新しいシミュレーションテスト手法である。
NPC車両の挙動を規制し、EGO車両による違反シナリオをより迅速に発見する。
我々の実験は、AdvFuzzが他の4つのアプローチと比較して12時間で198.34%の違反シナリオを発生できることを示した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:28:17 GMT)
Gaussian Splashing: Direct Volumetric Rendering Underwater [6.2] 本稿では,新しい水中シーンを140FPSでレンダリングし,再現に数分しかかからない新しい手法を提案する。
本手法は3DGSの強度と速度を画像形成モデルと統合し,散乱を捕捉する。
他の方法よりもはるかに明確で、再構成された画像や描画された画像が劇的に改善されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:04:38 GMT)
Modelling Networked Dynamical System by Temporal Graph Neural ODE with Irregularly Partial Observed Time-series Data [6.2] 本稿では,グラフニューラルODEを信頼性と時間認識機構で埋め込んで動的に再構築する手法を提案する。
提案手法は,異なるネットワーク型力学系の実験において検証された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:10:16 GMT)
Multi-task CNN Behavioral Embedding Model For Transaction Fraud Detection [6.2] 深層学習法は不正検出に行動系列データを埋め込むのに欠かせないものとなっている。
本稿では,トランザクション不正検出のためのマルチタスクCNN行動埋め込みモデルを提案する。
1)拡張性とドメイン中心の帰納バイアスの観点からLSTMおよびTransformerモデルより優れたマルチレンジカーネルを特徴とするシングルレイヤCNN設計を導入する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:58:11 GMT)
Multiscale spatiotemporal heterogeneity analysis of bike-sharing system's self-loop phenomenon: Evidence from Shanghai [6.1] 本研究では,空間的自己回帰モデルと二重機械学習フレームワークを用いたマルチスケール解析を行う。
その結果,自転車シェアリングの自己ループ強度は道路規模で空間ラグ効果が顕著であることがわかった。
自転車シェアリングの連携を強化するため,地下鉄の利用率が高く,バスの運行率も低い地域での自転車利用率の向上を提唱する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:53:50 GMT)
Robust Testing for Deep Learning using Human Label Noise [6.0] ディープラーニング(DL)システムでは、トレーニングデータセットのラベルノイズはしばしばモデルパフォーマンスを劣化させる。
伝統的に、これらの手法は合成ラベルノイズを用いてテストされ、そこでは基底の真理ラベルをランダムに反転させる。
本稿では,人間のようなラベルノイズをシミュレートする特徴依存ノイズを生成するクラスタベースノイズ(CBN)を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:31:57 GMT)
Rethinking the initialization of Momentum in Federated Learning with Heterogeneous Data [5.9] 本研究では,局所初期化に使用する推定運動量を計算する新しい手法を提案する。
提案手法はReversed Momentum Federated Learning (RMFL) と命名される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:00:52 GMT)
ARN-LSTM: A Multi-Stream Fusion Model for Skeleton-based Action Recognition [5.9] ARN-LSTMアーキテクチャは、アクションシーケンスにおける空間運動と時間ダイナミクスを同時にキャプチャする課題に対処するために設計されている。
提案モデルでは, 複数ストリーム融合アーキテクチャを用いて, 関節, 動き, 時間情報を統合する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:42:26 GMT)
Evaluating the Data Model Robustness of Text-to-SQL Systems Based on Real User Queries [5.8] 本論文は,テキスト・ツー・システムのデータモデルロバスト性について,実際に評価した最初の事例である。
サッカーDBはFIFAワールドカップ2022の文脈で9ヶ月にわたって展開されたシステムである。
データはすべて、システムにライブで質問された実際のユーザ質問に基づいています。これらの質問のサブセットを手動でラベル付けし、3つの異なるデータモデルに翻訳しました。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:44:27 GMT)
AI-driven inverse design of materials: Past, present and future [5.8] 人間は長い間、多数の実験を通じて新しい物質を探索し、新しい物質の性質と構造を予測するための対応する理論システムを提案してきた。
計算能力の向上により、研究者は徐々に様々な電子構造計算手法を開発してきた。
近年,計算機科学分野における人工知能技術の急速な発展により,材料特性と構造との暗黙的関連が効果的に評価されるようになった。
生成的および識別的モデルに基づく素材の逆設計において顕著な進歩が見られ、研究者から広く注目を集めている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:10:56 GMT)
Sourcerer: Sample-based Maximum Entropy Source Distribution Estimation [5.7] 本稿では,最大エントロピー分布,すなわち可能な限り不確実性を維持することを優先する手法を提案する。
提案手法は,Sliced-Wasserstein距離を利用して,データセットとシミュレーションの差分を測定する。
提案手法の有用性を実証するために,何千もの単一ニューロン計測を用いた実験データセットから,Hodgkin-Huxleyモデルのパラメータのソース分布を推定する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:50:25 GMT)
ThermoNeRF: Joint RGB and Thermal Novel View Synthesis for Building Facades using Multimodal Neural Radiance Fields [5.7] 熱環境の再構築は、建築エネルギー消費の分析や非破壊的なインフラ試験の実行など、様々な用途において大きな可能性を秘めている。
既存の手法は通常、密集したシーン計測を必要とし、しばしばRGBの画像を3次元の幾何学的再構成に頼り、再建後の熱情報を投影する。
本研究では,新しいRGBとシーンの熱像を共同で描画するニューラルラジアンス場に基づく新しいアプローチであるThermoNeRFと,建築ファサードの8つのシーンと日常の8つのシーンからなる2つのRGB+熱画像のデータセットであるThermoScenesを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:23:20 GMT)
LDA-AQU: Adaptive Query-guided Upsampling via Local Deformable Attention [5.7] 機能アップサンプリングは、ディープ畳み込みニューラルネットワークを構築する上で不可欠な操作である。
本稿では,局所的な自己意識は自然に特徴指導能力を持ち,その計算パラダイムは機能アップサンプリングの本質と密接に一致していることを示す。
アップサンプラー点とその近傍点間の潜在的な意味的ギャップを考慮し、局所的な自己注意に基づくアップサンプラーに変形機構を導入する。
LDA-AQUは、従来の最先端のアップサンプラーを一貫して上回り、1.7 AP、1.5 AP、2.0 PQ、2.5 mIoUのパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:59:47 GMT)
Pytorch-Wildlife: A Collaborative Deep Learning Framework for Conservation [5.6] Pytorch-Wildlifeは、PyTorch上に開発されたオープンソースのディープラーニングプラットフォームである。
強力なAIモデルの作成、修正、共有のために設計されている。
アマゾン・レインフォレストにおける動物分類モデルの訓練や、ガラパゴス諸島における侵入性オポッサムの認識に利用されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:13:20 GMT)
P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.6] 既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:30:21 GMT)
Approximate information maximization for bandit games [5.5] 本稿では,システム内のキー変数の情報ゲインに対する近似を最大化する新しい帯域幅アルゴリズムを提案する。
経験的成功により,ガウス報酬を用いた二本腕バンディット問題に対する最適性を証明する。
このアプローチはより複雑なバンディット設定に効率よく適応することができ、マルチアームバンディット問題に対する情報アプローチのさらなる調査を求めることができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:16:06 GMT)
Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification [5.5] 我々は,新しい合成ビデオ評価指標であるNeuS-Vを紹介する。
NeuS-Vは、ニューロシンボリック形式検証技術を用いて、テキストとビデオのアライメントを厳格に評価する。
既存の指標と比較すると,NeuS-Vは5倍以上の相関性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:46:12 GMT)
SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection [5.4] 本稿では,マルチビュー画像セマンティクスとレーダとカメラポイント機能を統合した3次元認識のための新しいスパース融合変換器であるSpaRCを提案する。
nuScenes と TruckScenes のベンチマークに関する実証的な評価は、SpaRC が既存の密度の高い BEV ベースおよびスパースクエリベースの検出器より著しく優れていることを示している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:17:38 GMT)
Diffeomorphic Latent Neural Operators for Data-Efficient Learning of Solutions to Partial Differential Equations [5.3] 計算された解演算子から偏微分方程式系(PDE)への近似は、科学や工学の様々な分野において必要である。
十分なデータのサンプル化を必要とせず,複数の領域にまたがって一般化可能なPDEソリューション演算子を学習するために,少数の真理解場に潜伏したニューラル演算子を訓練することができることを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:57:12 GMT)
Multigraph Message Passing with Bi-Directional Multi-Edge Aggregations [5.2] MEGA-GNNは、マルチグラフ上のメッセージパッシングのための統一されたフレームワークである。
我々は,MEGA-GNNが変分同値および不変性をサポートすることを示す。
また,MEGA-GNNはエッジに厳密な全順序が与えられた場合,普遍的であることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:15:18 GMT)
Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models [5.2] Low-Rank Adaptation (LoRA) は基礎モデルの効率的な微調整技術として人気がある。
凍結重量行列に残留誤差項を付加するFederated Exact LoRA(FedExLoRA)を提案する。
提案手法は,LoRAの効率を保ちながら,計算と通信のオーバーヘッドを最小限に抑えた正確な更新を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:47:03 GMT)
It's Quick to be Square: Fast Quadratisation for Quantum Toolchains [5.0] 本研究では,2次非制約二元最適化問題に対する新しい自動変換機構を開発する。
本稿では,高次表現の特定のクラス(多項式非バイアス二元最適化問題)について考察する。
また、トランスフォーメーションプロセスにおいて、低レベルの詳細の影響要因を抽象化し、どの詳細を高レベルの抽象化で利用できなければならないかを特定する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:50:16 GMT)
Mitigating Spurious Correlations via Disagreement Probability [4.9] 経験的リスク最小化(ERM)で訓練されたモデルは、ターゲットラベルとバイアス属性の急激な相関に偏りがちである。
すべてのデータサンプルのモデル性能を堅牢に向上する訓練目標を導入する。
次に, バイアスラベルを必要としない脱バイアス法DPR(Disagreement Probability based Resampling for Debiasing)を導出する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:13:23 GMT)
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification [4.5] 本稿では,適切な大きさの多言語ニュース分類モデルを開発するための教師学習フレームワークを提案する。
このフレームワークは、IPTCメディアトピックトレーニングデータセットを開発するための教師モデルとして、ジェネレーティブ事前学習トランスフォーマー(GPT)モデルを使用している。
生徒モデルは教師モデルに匹敵する高いパフォーマンスを達成する。
我々は,IPTCメディアトピックスキーマの上位カテゴリで多言語分類が可能な,最高のニューストピックを公表する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:42:58 GMT)
OpenQDC: Open Quantum Data Commons [4.3] 我々は、37のQMデータセットを単一のアクセス可能なリソースに統合するopenQDCパッケージを紹介します。
これらのデータセットは慎重に前処理され、MLIPトレーニングのために標準化され、有機化学に関連する幅広い化学的要素と相互作用をカバーしている。
OpenQDCには正規化と統合のためのツールが含まれている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:25:51 GMT)
On the Adversarial Robustness of Instruction-Tuned Large Language Models for Code [4.3] 厳密なメトリクスと確立されたベンチマークを用いて、多様な入力課題が生成されたコードの機能と正確性に与える影響を評価する。
オープンソースモデルは入力摂動に対する感受性が増大し、機能的正しさは12%から34%にまで低下した。
対照的に、商用モデルは比較的高いレジリエンスを示し、性能劣化は3%から24%である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:00:47 GMT)
A Catalog of Micro Frontends Anti-patterns [4.3] 本報告では12種類のMFEアンチパターンのカタログについて述べる。
業界関係者と調査を行い、アンチパターンを洗練させるために貴重なフィードバックを集めました。
収集されたフィードバックは、アンチパターンカタログの改良版の開発につながった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 04:59:40 GMT)
A Local Information Aggregation based Multi-Agent Reinforcement Learning for Robot Swarm Dynamic Task Allocation [4.1] 分散化された部分観測可能なマルコフ決定プロセス(Dec_POMDP)を用いた新しいフレームワークを提案する。
我々の方法論の核心は、局所情報集約多元決定政策勾配(LIA_MADDPG)アルゴリズムである。
実験により,LIAモジュールは様々なCTDEベースのMARL法にシームレスに統合可能であることが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:53:05 GMT)
Skeleton-based Group Activity Recognition via Spatial-Temporal Panoramic Graph [4.1] グループアクティビティ認識は、ビデオから集合的なアクティビティを理解することを目的としている。
既存のソリューションはRGBのモダリティに依存しており、背景の変化のような課題に直面している。
パノラマグラフを設計し、複数の人物の骨格や物体を包含してグループ活動をカプセル化する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:29:53 GMT)
Non-linear Equalization in 112 Gb/s PONs Using Kolmogorov-Arnold Networks [4.1] 我々は112Gb/s PAM4パッシブ光ネットワーク(PON)の非線形等化のためのコルモゴロフ・アルノルドネットワーク(KAN)について検討する。
線形等化器や畳み込みニューラルネットワークよりも計算量が少ない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:30:02 GMT)
Multi-label Sequential Sentence Classification via Large Language Model [4.0] 本稿では,LLM-SSCを提案する。LLM-SSCは大規模言語モデル(LLM)をベースとした,シングルラベルとマルチラベルのSSCタスクのためのフレームワークである。
従来の中小言語モデルを用いたアプローチとは異なり、提案フレームワークはLSMを用いて設計したプロンプトを通じてSSCラベルを生成する。
また、自動重み付け方式によるマルチラベルのコントラスト学習損失も提示し、マルチラベル分類タスクを可能にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:18:49 GMT)
Evaluating Research Quality with Large Language Models: An Analysis of ChatGPT's Effectiveness with Different Settings and Inputs [4.0] 本稿では、どのChatGPT入力がより良い品質スコア推定をもたらすかを評価する。
最適な入力は記事のタイトルと抽象であり、平均的なChatGPTスコアは人間のスコアと0.67と相関している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:17:29 GMT)
Extending Classically Simulatable Bounds of Clifford Circuits with Nonstabilizer States via Framed Wigner Functions [3.9] ウィグナー関数形式主義は、量子状態の非古典的側面とその古典的シミュラビリティを調べる上で重要な役割を担っている。
フレーム化ウィグナー関数に基づく量子クリフォード回路の新しい古典的シミュレーション法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:18:59 GMT)
Gaussian Ensemble Belief Propagation for Efficient Inference in High-Dimensional Systems [3.7] 高次元モデルにおける効率的な推論は、機械学習における中心的な課題である。
本稿では,Gaussian Ensemble Belief Propagation (GEnBP)アルゴリズムを紹介する。
本稿では,GEnBPが既存の信念手法よりも精度と計算効率で優れていることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:36:49 GMT)
Zero-shot Musical Stem Retrieval with Joint-Embedding Predictive Architectures [3.5] 本稿では,コンテキストの潜在表現を生成するために,エンコーダと予測器を協調訓練する,結合埋め込み予測アーキテクチャに基づく新しい手法を提案する。
特に,任意の楽器に条件付けした予測器を設計し,ゼロショットステム検索を行えるようにした。
MUSDB18とMoisesDBデータセットを用いて,本モデルの検索性能を検証する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:11:47 GMT)
Circumventing shortcuts in audio-visual deepfake detection datasets with unsupervised learning [3.5] 私たちは、最も広く使われているオーディオビデオのディープフェイクデータセットの2つが、これまで特定されていなかった突発的な特徴である、主要な沈黙に悩まされていることを示しています。
フェイクビデオは、ごく短い沈黙の瞬間から始まり、この機能だけで、本物と偽のサンプルをほぼ完全に分離することができる。
本研究では,実データのみに基づく学習モデルによる教師なし学習から教師なし学習へのシフトを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:58:20 GMT)
Climate Adaptation with Reinforcement Learning: Experiments with Flooding and Transportation in Copenhagen [3.4] 洪水は交通インフラを損傷させ、モビリティを阻害し、都市がリスクの増大に適応する必要性を浮き彫りにする。
本研究では,Reinforcement Learning(RL)を用いて,最も効果的なタイミングと実施場所を特定する。
当社の枠組みは,将来の降雨や洪水の気候変動予測を統合し,都市全体の自動車化旅行をモデル化し,インフラと移動性に対する直接的および間接的な影響を定量化する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:44:15 GMT)
Average-Over-Time Spiking Neural Networks for Uncertainty Estimation in Regression [3.4] 本稿では,AOT-SNN(Average-Over-Time Spiking Neural Network)フレームワークを回帰タスクに適用する2つの手法を提案する。
おもちゃのデータセットといくつかのベンチマークデータセットの両方に対して、我々のアプローチを評価します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:13:52 GMT)
RL-MILP Solver: A Reinforcement Learning Approach for Solving Mixed-Integer Linear Programs with Graph Neural Networks [3.4] Mixed-Integer Linear Programming (MILP) は様々な分野で広く使われている最適化手法である。
提案手法は,MILPと対話して実現可能な解を求める,新しい強化学習(RL)に基づく解法である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:23:34 GMT)
Effective Fine-Tuning of Vision-Language Models for Accurate Galaxy Morphology Analysis [3.4] GalaxAlignは、天文学的なタスクにおいて高い精度を達成するために、事前訓練された基礎モデルを微調整する新しい方法である。
本手法は,3種類のデータを微調整で整列させるために,コントラスト学習アーキテクチャを拡張した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:10:47 GMT)
Generalized Loschmidt echo and information scrambling in open systems [3.3] 量子情報のスクランブル(英: Quantum information scrambling)は、一般に閉じた量子系で探索されるもので、初期局所化された情報がシステム全体に広まることを記述している。
我々は,Loschmidt echo (LE) とout-of-time-order correlator (OTOC) の概念をリンドブラッド力学が支配するオープン量子系に一般化することにより,消散の有無を問う。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:00:00 GMT)
Parallel Stacked Aggregated Network for Voice Authentication in IoT-Enabled Smart Devices [3.3] 本稿では,音声制御型スマートIoTデバイスのための防御システムとして設計された軽量なフレームワークを提案する。
並列スタックアグリゲーションネットワーク(PSA-Net)は、生オーディオを直接処理し、データセット依存のハンドクラフト機能を必要としない。
その結果、PSA-Netは、現在のアンチスプーフィングソリューションに存在する異なる攻撃に対して、より一貫した性能を達成することがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:57:31 GMT)
Prompt Framework for Role-playing: Generation and Evaluation [3.3] 大規模言語モデル(LLM)は、自然言語生成、ユーザ命令の理解、人間に似た言語使用のエミュレートにおいて、優れた習熟度を示す。
このプロジェクトでは、ロールプレイング対話データセットの生成にGPTの機能を活用するために設計されたプロンプトベースのフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:05:13 GMT)
DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting [3.3] 本稿では,エンドツーエンドトラッカーをベースとしたSLAMシステムを導入し,最近の3次元ガウス切削技術に基づくレンダラーで拡張する。
フレームワーク textbfDroidSplat は、共通のSLAMベンチマーク上での SotA のトラッキングとレンダリングの結果を達成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:31:24 GMT)
Train Once for All: A Transitional Approach for Efficient Aspect Sentiment Triplet Extraction [3.3] 本稿では,トークンレベルのバイアスを緩和し,位置認識のアスペクト-オピニオン関係を捉えるトランジションベースのパイプラインを提案する。
融合データセットとコントラスト学習最適化を用いることで、ロバストなアクションパターンを学習し、個別のサブタスクを共同で最適化することができる。
その結果,本モデルがASTEタスクとAOPEタスクの両方で最高の性能を達成し,F1尺度の少なくとも6.98%の精度で最先端の手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:10:41 GMT)
Can Large Language Models Reason about the Region Connection Calculus? [3.2] 大規模言語モデル(LLM)の推論能力について検討する。
我々は,3組の実験(構成表の再構成,人間の構成嗜好の整合性,概念的近傍再構築)を最先端のLCMを用いて行った。
すべてのインスタンスは、LLMの関係性を測定するために30回繰り返される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:10:16 GMT)
Analysis of High-dimensional Gaussian Labeled-unlabeled Mixture Model via Message-passing Algorithm [3.2] 半教師付き学習(SSL)は、ラベル付きデータを限られた量のラベル付きデータとともに活用する機械学習手法である。
いくつかの既存の理論的研究は、いわゆるガウス混合モデル(GMM)を用いて分類問題をモデル化することでこの問題に対処しようとしている。
本稿では,SSL設定における二項分類のための高次元GMMの特性を詳細に解析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:57:07 GMT)
Cross-Domain Recommendation Meets Large Language Models [3.2] クロスドメインレコメンデーション(CDR)がコールドスタート問題に対する有望な解決策として登場した。
既存のCDRモデルは複雑なニューラルネットワーク、大規模なデータセット、重要な計算資源に依存している。
本研究では,大規模言語モデル(LLM)の推論機能を活用し,その性能をCDR領域で検証する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:25:00 GMT)
From Prejudice to Parity: A New Approach to Debiasing Large Language Model Word Embeddings [2.9] DeepSoftDebiasは、ニューラルネットワークを使って'ソフトデバイアス'を実行するアルゴリズム
我々は、このアルゴリズムを様々なSOTAデータセット、精度メトリクス、難解なNLPタスクで徹底的に評価する。
DeepSoftDebiasは、性別、人種、宗教の偏見を減らし、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:35:25 GMT)
Explaining the Impact of Training on Vision Models via Activation Clustering [2.9] 本稿では,凍結したネットワークの機能的アクティベーションをクラスタリングすることで,エンコーダが取得した情報を抽出するニューロアクティベート・ビジョン・エクスプメンテーション(NAVE)を提案する。
NAVEはモデルの予測を説明するのではなく、どの部分を同じように処理するか、どの情報をより深い層に保持するかといった質問に答える。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:42:10 GMT)
To Ensemble or Not: Assessing Majority Voting Strategies for Phishing Detection with Large Language Models [2.8] 本研究は、フィッシングURLの検出に焦点をあてて、テキスト分類における3つの多数決戦略について検討する。
戦略はプロンプトベースのアンサンブル、モデルベースのアンサンブル、ハイブリッドアンサンブルである。
分析の結果,個々のコンポーネントが同等の性能を示す場合に,アンサンブル戦略が最も適していることがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:42:23 GMT)
Combining Pre- and Post-Demosaicking Noise Removal for RAW Video [2.8] Denoisingは、カメラセンサーが捉えたデータをディスプレイ対応の画像やビデオに変換する処理パイプラインの基本ステップの1つである。
本研究では,ベイアパターンのCFAビデオデータに対して,事前および復号化後のデノイザを重み付けする自己相似型デノイザ方式を提案する。
両者のバランスが画像品質の向上につながることを示し、高ノイズレベルがより高影響のプレデモーザックの恩恵を受けることを実証的に見出した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:33:31 GMT)
Observation of continuous time crystals and quasi-crystals in spin gases [2.7] 連続時間結晶 (CTC) と準結晶 (CTQC) は連続時間変換対称性の自発的破壊を特徴とする2つの新しい物質相である。
フィードバック機構によって非線形に相互作用する希ガス核スピンのCTCとCTQCのシグネチャを実験的に観察した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:13:32 GMT)
Clinical Document Corpora and Assorted Domain Proxies: A Survey of Diversity in Corpus Design, with Focus on German Text Data [2.7] ドイツの厳格なデータプライバシー法により、これらのリソースは安全な臨床データ空間に保管され、臨床外部研究者に対してロックされている。
この状況は、自然言語処理の分野において、データ収集の容易なアクセシビリティと再利用が一般的な実践であるのとは対照的である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:56:58 GMT)
ICPR 2024 Competition on Multilingual Claim-Span Identification [2.6] 膨大な数のソーシャルメディア投稿を考えると、クレームを識別するタスクは自動化される必要がある。
このコンペティションは、テキストが与えられた場合、クレームに対応する部分/スパンを識別する「Claim Span Identification」というタスクを扱う。
この競争のために、HECSIと呼ばれる新たに開発されたデータセットを使用し、英語で約8Kの投稿とヒンディー語で約8Kの投稿と、人間のアノテーションでマークされたクレームスパンを含む。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:50:32 GMT)
Credible fusion of evidence in distributed system subject to cyberattacks [2.6] 本稿では,サイバー攻撃に対する信頼性のある証拠融合のためのアルゴリズムを提案する。
我々は、証拠融合の3つの要件、すなわち、証拠のプライバシーを保護し、攻撃者を識別し、証拠を除外することに焦点を当てる。
通常のノードの状態はWAVCCMEに収束することが示され、攻撃者の証拠は融合から除外される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:46:04 GMT)
Development of Low-Cost IoT Units for Thermal Comfort Measurement and AC Energy Consumption Prediction System [2.5] 政府は2019年に、AIとIoT技術を活用した自主的な省エネ行動を促進するBI-Techプロジェクトを開始した。
本研究は,室内熱環境のリアルタイムモニタリングと空調設定点温度の計測にRaspberry Pi 4B+プラットフォームを利用する,費用対効果の高いIoTベースのBI-Techシステムを提案する。
機械学習モデルは、R2値97%で達成され、ユーザ間の省エネ性を促進するためのシステムの効率性を実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:24:22 GMT)
MonoPP: Metric-Scaled Self-Supervised Monocular Depth Estimation by Planar-Parallax Geometry in Automotive Applications [2.5] 本稿では,モノクロ映像データとカメラの装着位置のみを必要とする,自己監督型メカニカルスケールMDEモデルを提案する。
提案手法は, ドライビングベンチマークKITTIを用いて, 計量スケール深度予測のための最先端結果を得た。
特に、挑戦的なCityscapesデータセットのために、自己教師付きメトリックスケールの深度予測を作成するための最初の方法の1つである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:06:58 GMT)
CAREL: Instruction-guided reinforcement learning with cross-modal auxiliary objectives [2.4] 言語指導による目標達成型強化学習の課題を解決するための重要なステップである。
本稿では,ビデオテキスト検索文にヒントを得た補助的損失関数を用いた新たなフレームワークとしてCARELを提案する。
実験の結果,マルチモーダル強化学習問題において,本フレームワークのより優れたサンプル効率と系統的な一般化が示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:49:06 GMT)
Enhanced anomaly detection in well log data through the application of ensemble GANs [2.4] GAN(Generative Adversarial Network)は,画像データセットのデータ分布のモデル化において大きな成功を収めている。
本研究では、アンサンブルGANフレームワークを拡張し、ウェルログデータの分布をキャプチャし、これらの分布の外側に落下する異常を検出する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:36:31 GMT)
BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching [2.4] 上記の問題に対処するため,BatchLLMを提案する。
BatchLLMは、グローバルな共通接頭辞を明確に識別する。
BatchLLMはマイクロベンチマークのセットでvLLMを1.1倍から2倍に向上することを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:57:37 GMT)
Quantum simulation of thermal field theories [2.4] まず、一般的なデジタル量子コンピュータ上の量子ビットによる量子場の表現について調べる。
量子シミュレータを用いた1+1次元の熱場理論の数値計算結果を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:35:08 GMT)
Feedback-driven object detection and iterative model improvement [2.4] 本稿では,オブジェクト検出モデルの改良を目的としたプラットフォームの開発と評価について述べる。
このプラットフォームでは、イメージのアップロードとアノテートに加えて、微調整されたオブジェクト検出モデルも可能だ。
手動アノテーションと比較して,半自動で最大53%の時間短縮効果を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:45:25 GMT)
Unsupervised Speaker Diarization in Distributed IoT Networks Using Federated Learning [2.3] 本稿では,ネットワーク型IoTオーディオデバイスを対象とした,計算効率のよい分散話者ダイアリゼーションフレームワークを提案する。
フェデレートラーニングモデルは、トレーニングのための大規模なオーディオデータベースを必要とせずに、会話に参加する参加者を特定することができる。
話者埋め込みのコサイン類似性に依存するフェデレートラーニングモデルに対して、教師なしオンライン更新機構を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:36:32 GMT)
Antisymmetry-breaking-coupling-enhanced sensing of quantum reservoirs [2.2] 崩壊因子の符号化チャネルに加えて、非対称結合破壊は別の位相因子の符号化チャネルを引き起こす。
一般化された退化量子ビットの最適測定法を提案する。
我々の研究は、量子貯水池の超感度検知方法を開く。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:30:04 GMT)
Enhanced LLM-Based Framework for Predicting Null Pointer Dereference in Source Code [2.2] 我々は「DeLLNeuN」と呼ばれる細調整大言語モデル(LLM)を用いた新しいアプローチを提案する。
Draper VDISCデータセットを用いて87%の精度と88%の精度を示した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:24:08 GMT)
Enabling DBSCAN for Very Large-Scale High-Dimensional Spaces [2.2] DBSCANは、非パラメトリックな教師なしデータ分析ツールの中で最も重要なものの一つである。
DBSCANアルゴリズムの時間複雑性は$O(n2 beta)$であり、$n$はデータ点の数、$beta = O(D)$はデータ空間の次元を表す$D$である。
スペクトルデータ圧縮に基づくDBSCAN法を提案し、大量のデータポイントと高次元のデータセットを効率的に処理する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:02:35 GMT)
Optimizing Quantum Embedding using Genetic Algorithm for QML Applications [2.1] 遺伝的アルゴリズム(GA)を用いて、最適な特徴-量子マッピングを探索する。
MNISTとTiny ImageNetデータセットの実験では、GAがランダムな特徴-ビットマッピングより優れていることが示されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:37:39 GMT)
The WHY in Business Processes: Discovery of Causal Execution Dependencies [2.1] プロセスアクティビティの実行間の因果関係を明らかにすることは、プロセス介入の結果を予測する重要な要素である。
この研究は、既存の因果発見アルゴリズムを活動タイミングよりも活用することにより、因果ビジネスプロセスの公開に対する体系的なアプローチを提供する。
本手法は,3つの因果パターンの文脈における2つのモデル間の相違を探索し,これらの不整合がマイニングプロセスモデル上で注釈付けされるという新たな視点を導出する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:40:08 GMT)
SURE-VQA: Systematic Understanding of Robustness Evaluation in Medical VQA Tasks [2.0] VLM(Vision-Language Models)は、VQA(Visual Question Answering)のような医療タスクにおいて大きな可能性を秘めている。
我々の研究はSURE-VQAと呼ばれる新しいフレームワークを導入し、現在の落とし穴を克服するための3つの重要な要件を中心にしています。
この枠組みの妥当性を示すために,3つの医療データセットにまたがる様々な微調整手法の堅牢性について検討した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:22:52 GMT)
Online Marketplace: A Benchmark for Data Management in Microservices [1.9] Online Marketplaceは、既存のベンチマークで対処できない、コアデータ管理の課題を強調した、マイクロサービスベンチマークである。
データシステムとプラットフォーム間で適切な比較を可能にするために、さまざまなデータ管理問題の基準を定義しました。
これは、マイクロサービス実践者のニーズを満たすために、将来的なデータシステムを推進する上で、Online Marketplaceの重要性を強調している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:11:22 GMT)
Ensemble Watermarks for Large Language Models [1.9] アクロスティカとセンセーモトルのノルムは、確立された赤緑色の透かしと組み合わせて98%の検知率を達成する。
すべての特徴組合せの評価により,3つのアンサンブルが常に高い検出率を有することが明らかとなった。
この方法は特に説明責任の促進と社会的害の予防に重要である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:18:32 GMT)
Universal validity of the second law of information thermodynamics [1.9] 熱力学の第2法則と整合した量子フィードバック制御および消去プロトコルの全範囲を特徴付ける。
これにより、情報熱力学の第2法則は確かに普遍的であるという結論が導かれる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:54:36 GMT)
The AI Interface: Designing for the Ideal Machine-Human Experience (Editorial) [1.8] 本論では,AI体験デザインの心理学を探求する特集を紹介する。
このコレクションの論文は、人間とAIの相互作用における信頼、透明性、感情的な感受性の複雑さを強調している。
8つの多様な研究から得られた知見により、この論説は、効率と共感のバランスをとるためのAIインターフェースの必要性を強調している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:17:32 GMT)
Contextual Checkerboard Denoise -- A Novel Neural Network-Based Approach for Classification-Aware OCT Image Denoising [1.8] 我々は、ノイズの多い画像のデータセットのみから雑音を学習できる新しいニューラルネットワークベースの手法、emphContextual Checkerboard Denoisingを導入する。
提案手法は画像品質を大幅に改善し,より鮮明で詳細なOCT画像を提供するとともに,診断精度を向上する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:51:43 GMT)
How to correct Ehrenfest nonadiabatic dynamics in open quantum systems: Ehrenfest plus random force (E$+$$σ$) dynamics [1.8] ランダムな力(E$+$sigma$)を加えることで従来のエレンフェスト力学(ED)の精度を向上させる。
この研究において、ランダムな力の構成はマルコフ的および非マルコフ的シナリオにおいて考慮される。
E$+$sigma$モデルはEDの高効率を保ち、余分な計算を伴わない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:43:58 GMT)
Knowledge Management for Automobile Failure Analysis Using Graph RAG [1.8] 本稿では,RAGを用いた自動車故障解析のための知識管理システムを提案する。
RAGは大きな言語モデル(LLM)と知識グラフ(KG)を組み合わせる
元のQ&Aデータセットを用いて,提案手法で生成した文のROUGE F1スコアは,現行法と比較して平均157.6%向上した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:34:07 GMT)
Classical and Quantum Algorithms for the Deterministic L-system Inductive Inference Problem [1.7] L-系は、植物開発のような多くの生物学的プロセスのシミュレーションをモデル化し、作成することができる。
与えられたプロセスのL-システムを見つけることは、通常、専門家によって、非常に時間を要するプロセスで手作業で解決される。
画像のシーケンスなど、データから自動的に行うことができれば、これは重要なことだ。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:11:39 GMT)
Quantifying the synthetic and real domain gap in aerial scene understanding [1.7] 本稿では,MMCM(Multi-Model Consensus Metric)と深度に基づく構造指標を用いたシーン複雑性評価手法を提案する。
実世界(Dronescapes)と合成(Skyscenes)のデータセットを用いて、実世界のシーンは一般的に最先端のビジョントランスフォーマーの間で高いコンセンサスを示すことを示す。
結果は、固有複雑さとドメインギャップを下記し、シミュレーション忠実度の向上とモデル一般化の必要性を強調した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:18:26 GMT)
Enhancing Sentiment Analysis in Bengali Texts: A Hybrid Approach Using Lexicon-Based Algorithm and Pretrained Language Model Bangla-BERT [1.7] 我々はルールベースのアルゴリズムと事前学習された言語モデルを統合する新しいアプローチを開発する。
そこで我々は,Bangla Sentiment Polarity Score (BSPS) という新しいアルゴリズムを開発した。
分析の結果,BSPS+BanglaBERTハイブリッドアプローチは,BanglaBERTモデルよりも高い精度,精度,ニュアンス分類が得られた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:57:11 GMT)
Beyond adaptive gradient: Fast-Controlled Minibatch Algorithm for large-scale optimization [1.7] そこで我々は,F-CMA,F-Controlled Mini-batchアルゴリズムを導入し,各エポックあたりの損失低減を確保するために,十分な減少条件とライン探索手順を備えたランダムリシャッフル法を提案する。
テストでは、トレーニング時間全体の68%の削減、エポック毎の効率の最大20%向上、モデル精度の最大5%向上など、大幅な改善が見られた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:53:40 GMT)
Statistical learning theory and Occam's razor: The core argument [1.6] 本稿では,統計的学習理論から得られる単純さの核となる議論を精査する。
これは、経験的リスク最小化の方法に関する理論の中心的な学習保証に基づいて構築されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:02:21 GMT)
Action Engine: An LLM-based Framework for Automatic FaaS Workflow Generation [1.5] 本稿では,ツールAugmented Large Language Models (LLMs) をカーネルで利用し,人間の言語クエリを解釈するアクションエンジンを提案する。
Action EngineはFワークフロー生成を自動化するため、専門的な専門知識や手動設計の必要性が軽減される。
私たちの評価によると、Action Engineは開発者の関与なしに最大20%高い精度で生成できます。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:54:41 GMT)
An AI-Driven Data Mesh Architecture Enhancing Decision-Making in Infrastructure Construction and Public Procurement [1.5] Data MeshとService Meshアーキテクチャを利用した統合ソフトウェアエコシステムを導入します。
このシステムには、インフラストラクチャと調達のための最大のトレーニングデータセットが含まれており、1000億以上のトークンを含んでいる。
そのWebスケーリング可能なアーキテクチャは、ドメインキュレーションされた情報を提供し、AIエージェントが推論と不確実性の管理を容易にする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:33:51 GMT)
Streamlining Video Analysis for Efficient Violence Detection [1.4] 本稿では,監視カメラが捉えたビデオフレームにおける自動暴力検出の課題に対処する。
本稿では,3次元畳み込みニューラルネットワーク(3D CNN)に基づくモデルX3Dを用いてこの問題に対処する手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:32:36 GMT)
Exploring syntactic information in sentence embeddings through multilingual subject-verb agreement [1.4] 我々は,特定の特性を持つ大規模でキュレートされた合成データを開発するためのアプローチを採っている。
我々は、ブラックバード言語行列(Blackbird Language Matrices)と呼ばれる新しい複数選択タスクとデータセットを使用して、特定の文法構造現象に焦点を当てる。
多言語テキストを一貫した方法で訓練したにもかかわらず、多言語事前学習言語モデルには言語固有の違いがあることが示される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:43:14 GMT)
Exploring Italian sentence embeddings properties through multi-tasking [1.4] 本研究では,事前学習言語モデルを用いて構築された文表現が,特定の構文情報や意味情報をエンコードする方法について検討する。
本研究では,タスクに関連する情報を含む表現や,BLMタスクに埋め込まれた文の圧縮を,2段階のアーキテクチャで個別にモデル化する。
文構造 -- フレーズ/チャンクのシーケンスとチャンクプロパティがタスク間で共有できることを期待していましたが、パフォーマンスとエラー分析は、異なるタスクの手がかりが、文の埋め込みにおいて異なる方法でエンコードされていることを示しています。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:30:11 GMT)
Graph Neural Networks for Heart Failure Prediction on an EHR-Based Patient Similarity Graph [1.4] 本研究では,グラフニューラルネットワーク(GNN)とグラフトランスフォーマー(GT)を用いた心不全の発生予測手法を提案する。
HFの発生を予測するために、GraphSAGE、Graph Attention Network(GAT)、Graph Transformer(GT)の3つのモデルが実装された。
GTモデルは最高のパフォーマンスを示した(F1スコア: 0.5361, AUROC: 0.7925, AUPRC: 0.5168)。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:40:19 GMT)
Joint Communication and Eavesdropper Detection on the Lossy Bosonic Channel [1.4] 本稿では,光ファイバー上のワイヤタッピングの量子的観点からの連成通信と検出の問題について検討する。
システムモデルでは,通常の動作条件下でデータを送信し,盗聴時に送信側で警告を発する通信リンクを記述している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:21:10 GMT)
Imagined Speech and Visual Imagery as Intuitive Paradigms for Brain-Computer Interfaces [1.3] 脳コンピュータインタフェース(BCI)は、運動障害のある個人のためのコミュニケーションを可能にすることを約束している。
脳音声技術のような最近の進歩は、音声を神経活動から再構築することを目的としている。
非侵襲的手法を用いた想像的音声や視覚画像などの通信関連パラダイムの復号化は依然として困難である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:34:55 GMT)
LLM-Rank: A Graph Theoretical Approach to Pruning Large Language Models [1.3] 本稿では,グラフ理論からの集中度測定を利用した新しいプルーニング手法を提案し,これらのモデルの計算要求とメモリフットプリントの両方を削減した。
さらに,デコーダのみのトランスモデルを拡張してLLMRankと呼ぶ。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:21:29 GMT)
Continuous Approximation of the Fully Connected Ising Hamiltonian: Exact Ground State Solutions for a Novel Class of Ising Models with Applications to Fidelity Assessment in Ising Machines [1.2] 離散イジング・ハミルトニアンを連続的な枠組みに再構成することで、大規模イジング問題を解くための新しい分析的アプローチを提案する。
提案手法を検証するため, 解析解と量子インスパイアされたIsingアルゴリズムと量子Isingマシンから得られた解を比較した数値実験を行った。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:43:23 GMT)
MATTER: Multi-stage Adaptive Thermal Trojan for Efficiency & Resilience degradation [1.2] 本研究は、多段適応熱トロイの木馬(Multi-stage Adaptive Thermal Trojan for efficiency and Resilience Degradation, MATTER)と呼ばれる新しい攻撃手法を提案する。
MATTERは温度センサインタフェースを操作することで動的熱管理(DTM)システムの弱点を利用する。
我々の実験によると、この攻撃はDTMのパフォーマンスを最大73%低下させ、現代のモバイルデバイスの深刻な脆弱性を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:39:48 GMT)
RadioActive: 3D Radiological Interactive Segmentation Benchmark [1.1] 臨床シナリオにおける対話的セグメンテーション手法を評価するために,RadioActiveベンチマークを導入する。
多様なデータセット、ターゲット構造、インタラクティブなセグメンテーションメソッドを含む。
ドメインギャップにもかかわらず、スライス的に誘導されるアプローチのパフォーマンスがネイティブな3Dメソッドと一致できることが、驚くほど示されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:02:25 GMT)
Digital Twin in Industries: A Comprehensive Survey [1.1] Digital Twin (DT)は、現実世界のシステムをバーチャルなシステムとシームレスに統合する革新的なイノベーションとして登場した。
特に、さまざまな分野にわたる産業アプリケーションにおけるDTの役割について、技術的に深く議論する。
DTベースの業界において、さまざまな主要なプライバシとセキュリティの問題を調査し、分析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:14:45 GMT)
Unimib Assistant: designing a student-friendly RAG-based chatbot for all their needs [1.1] このパイロットスタディは,OpenAIカスタムGPT機能を用いた検索・拡張生成(RAG)システムによるChatGPT動作の専門化に重点を置いている。
我々はミラノ・ビコッカ大学(Unimib)の学生の特定のニーズに対する情報と解決策を提供するUnimib Assistantを開発した。
ユーザの満足度と全体的な経験は、システムが常に正確な情報を提供することができないことで損なわれた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:07:21 GMT)
A Mathematical Programming Approach to Optimal Classification Forests [1.0] 本稿では,WOCF(Weighted Optimal Classification Forests)を紹介する。
WOCFは決定木の最適なアンサンブルを利用して、正確かつ解釈可能な分類器を導出する。
全体として、OCFはCART、最適分類木、ランダムフォレスト、XGBoostといった既存のメソッドを補完する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:48:55 GMT)
AI-assisted summary of suicide risk Formulation [0.9] 本研究では,人工知能(AI)の分野である高度自然言語処理(NLP)アルゴリズムの開発について述べる。
自殺リスクアセスメント(英: suicide risk Assessment)とは、個人が抱える問題の性質と発展を理解するための個別化プロセスである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:40:28 GMT)
Riemannian Denoising Score Matching for Molecular Structure Optimization with Accurate Energy [0.9] 本研究では、高エネルギー精度で分子構造を生成することを目的とした、改良されたスコアマッチング手法を提案する。
この研究の意味は、計算化学における様々な応用にまで拡張され、正確な分子構造予測のための堅牢なツールを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:17:42 GMT)
AIDetx: a compression-based method for identification of machine-learning generated text [0.8] 本稿では,データ圧縮技術を用いた機械生成テキストの検出手法であるAIDetxを紹介する。
AIDetxを2つのベンチマークデータセットで評価し,F1スコアはそれぞれ97%,99%であった。
大規模言語モデル(LLM)のような現在の手法と比較して、AIDetxはより解釈可能で計算的に効率的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:31:42 GMT)
Meta-learning Loss Functions of Parametric Partial Differential Equations Using Physics-Informed Neural Networks [0.8] メタラーニングパラメトリック偏微分方程式 PDE をバーガー方程式と2次元熱方程式に適用する。
目的はメタ学習を用いてパラメトリックPDE毎に新たな損失関数を学習することである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:35:42 GMT)
Analysing Multiscale Clusterings with Persistent Homology [0.8] 本稿では,クラスタ割り当ての任意のパターンを符号化して粗さを増大させる,抽象的単純錯体のよく定義された安定なフィルタであるMultiscale Clustering filtration(MCF)を紹介する。
MCFのゼロ次元永続ホモロジーは分割列の階層の度合いを測定し、高次元永続ホモロジーは分割列のクラスタ割り当て間の衝突の発生と解決を追跡する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:33:10 GMT)
What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics [0.7] 英語カリキュラムへの新しい文学の統合は、様々な教室のニーズに対して、読みやすさとテキストの適応を迅速に評価するスケーラブルなツールがしばしば欠如しているため、依然として課題である。
本研究は,変圧器を用いたテキスト分類と言語的特徴分析を組み合わせたマルチモーダル手法により,このギャップに対処することを提案する。
提案手法は、ステークホルダーが対象とするWebアプリケーションにカプセル化され、非技術ステークホルダーが、テキストの複雑さ、読みやすさ、カリキュラムのアライメント、学習年齢範囲に関するリアルタイムな洞察にアクセスできるようにする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:41:48 GMT)
Real-time Anomaly Detection at the L1 Trigger of CMS Experiment [0.7] LHC Run 3におけるCMS実験GT(Global Trigger)テストクレートFPGAにおける新しい物理シグネチャのバイアスのない検出のために訓練されたオートエンコーダを提案する。
GTは、50 nsのレイテンシで40MHzの速度で発生する各LHC衝突からのデータの読み出しまたは破棄を最終決定する。
本稿では,超低レイテンシ異常検出を実現する手法について述べるとともに,ニューラルネットワークのGTテストクレートへの統合,およびプロトン衝突時のアルゴリズムの監視,テスト,検証について述べる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:56:42 GMT)
An Approach Towards Learning K-means-friendly Deep Latent Representation [0.7] クラスタリングは、データマイニングにおける長年の問題領域である。
ディープニューラルネットワークの出現により、この問題に対する一般的なアプローチは、データを比較的低次元の潜在空間にマッピングすることである。
良く知られたセントロイドベースのクラスタリングアルゴリズムはK平均である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:28:38 GMT)
Advanced System Integration: Analyzing OpenAPI Chunking for Retrieval-Augmented Generation [0.7] 我々は,OpenAPIのエンドポイント発見とチャンクにおけるRetrieval Augmented Generationの利用状況を分析した。
本稿では,最も関連性の高いエンドポイントの要約のみを受信し,要求の詳細を検索するディスカバリエージェントを提案する。
実験により, 前処理では, LLM ベース, フォーマット固有のアプローチが, ナイーブ・チャンキング法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:09:43 GMT)
Gated-Attention Feature-Fusion Based Framework for Poverty Prediction [0.7] 我々は、GAFM(Gated-Attention Feature-Fusion Module)を組み込んだResNet50モデルを拡張した最先端の畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
我々のアーキテクチャは、衛星画像からグローバルな特徴とローカルな特徴の両方をキャプチャする能力を向上させるために設計されており、より正確な貧困推定に繋がる。
このモデルは75%のR2スコアを達成し、貧困マッピングにおける既存の先行手法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:24:14 GMT)
Learned Random Label Predictions as a Neural Network Complexity Metric [0.7] 本研究では,教師付き学習におけるクラスラベルと並行してランダムに生成されたラベルの学習が,深層ニューラルネットワークの記憶,モデル複雑性,一般化に与える影響について検討する。
公平なAIで使用される手法にインスパイアされた我々の手法は、ランダムなラベルの学習を可能にし、ネットワークが個々のサンプルを記憶するのを防ぐ。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:52:59 GMT)
Solving Rubik's Cube Without Tricky Sampling [0.6] ルービックキューブはその広大な州空間とまばらな報酬構造を持ち、強化学習にとって重要な課題である。
従来の研究では、解決された状態からコスト・ツー・ゴーの見積を伝播し、探索手法を取り入れることによって、この問題に対処していた。
本稿では, ポリシ勾配法を用いて, ほぼ解決状態サンプリングに依存することなく, ルービックキューブを解く新しいRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:56:40 GMT)
Quantum Annealing based Feature Selection in Machine Learning [0.6] 特徴選択は、機械学習(ML)モデルの精度と効率を高めるために不可欠である。
相互情報(MI)や条件付き相互情報(CMI)を最大化する最適な特徴の集合を計算することは、古典的コンピュータ上の大規模なデータセットに対して計算的に計算可能である。
本研究は,MIQUBO(Multual Information Quadratic Unconstrained Binary Optimization)の定式化を用いて,量子アニール板上での解法を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:52:30 GMT)
Streamlining the review process: AI-generated annotations in research manuscripts [0.6] 本研究では,Large Language Models (LLM) をピアレビュープロセスに統合し,効率を向上する可能性について検討する。
我々は、AIと人間のコラボレーションの潜在的な領域として、写本の注釈、特に抜粋ハイライトに焦点を当てている。
本稿では,GPT-4を利用した原稿レビュープラットフォームAnnotateGPTを紹介する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:26:34 GMT)
Controller-decoder system requirements derived by implementing Shor's algorithm with surface code [0.6] 量子誤り補正(Quantum Error Correction, QEC)は、量子優位性への最も有望な経路と考えられている。
コントローラデコーダのクローズドループレイテンシは数十マイクロ秒以内に留まり、デコードタスクを並列化することで達成可能であることを示す。
また、物理レベルでの完全フォールトトレラント分解回路をシミュレートし、物理誤差率0.1%、1000キュービットといった短期ハードウェアの性能が回路の動作を成功させるのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:55:29 GMT)
Solution space and storage capacity of fully connected two-layer neural networks with generic activation functions [0.6] 二項分類モデルの記憶容量は、モデルが学習できるパラメータ毎のランダムな入出力ペアの最大数である。
一般活性化機能を持つ完全連結二層ニューラルネットワークの解空間の構造と記憶容量を解析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:39:27 GMT)
Improving generalization of robot locomotion policies via Sharpness-Aware Reinforcement Learning [0.5] 微分可能なシミュレータは、正確な勾配によるサンプル効率の改善を提供するが、接触豊富な環境では不安定である。
本稿では,勾配に基づく強化学習アルゴリズムにシャープネスを考慮した最適化を取り入れた新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:25:54 GMT)
Forecasting Foreign Exchange Market Prices Using Technical Indicators with Deep Learning and Attention Mechanism [0.5] 提案アーキテクチャは,Long Short-Term Memory(LSTM)とConvolutional Neural Network(CNN)で構成されている。
技術的指標を用いて、Forex通貨ペアデータから統計的特徴を抽出する。
LSTMおよびCNNネットワークは、将来の価格変動を予測するために並列に使用される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:07:44 GMT)
MCUCoder: Adaptive Bitrate Learned Video Compression for IoT Devices [0.4] 本稿では,リソース制限型IoT設定に適した,オープンソースの適応型ビデオ圧縮モデルを提案する。
MCUCoderは10.5Kのパラメータと最小350KBのメモリを持つ超軽量エンコーダを備えている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:00:21 GMT)
Parsimonious Dynamic Mode Decomposition: A Robust and Automated Approach for Optimally Sparse Mode Selection in Complex Systems [0.4] 本稿では,Parsimonious Dynamic Mode Decomposition (parsDMD)を紹介する。
ParsDMDは、時間的および純粋に時間的データの両方に対して最適にスパースされた動的モードのサブセットを自動選択するように設計された新しいアルゴリズムである。
定在波信号、隠れ力学の同定、流体力学シミュレーション、大気表面温度(SST)データなど、さまざまなデータセットで検証されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:35:30 GMT)
Enumeration algorithms for combinatorial problems using Ising machines [0.4] 最適化や制約満足度問題といった組合せ問題は意思決定に現れる。
本稿では,Ising マシンを用いた列挙アルゴリズムを提案する。
提案アルゴリズムは,従来の分岐結合アルゴリズムよりも高速に,高密度グラフの最大傾きを列挙する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 23:33:26 GMT)
Stock Price Prediction using Multi-Faceted Information based on Deep Recurrent Neural Networks [0.4] 本研究では、畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークを統合することで、株式市場の株価を予測する新しい手法を提案する。
提案手法は,ソーシャルネットワークデータの感情分析とロウソクスティックデータの2つの主成分から構成される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:12:48 GMT)
Virtual Sensing-Enabled Digital Twin Framework for Real-Time Monitoring of Nuclear Systems Leveraging Deep Neural Operators [0.4] 本稿では,デジタルツインフレームワークのコアコンポーネントとしてDeepOperator Networks (DeepONet) を導入する。
DeepONetは動的でスケーラブルな仮想センサとして機能し、操作された入力パラメータと空間的に分散されたシステムの振る舞いの間の相互作用を正確にマッピングする。
この結果から,DeepONetは平均二乗誤差と相対L2誤差で精度の高い予測を行い,従来のCFDシミュレーションの1400倍の精度で未知データの予測を行うことができた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:05:59 GMT)
An Interpretable Approach to Load Profile Forecasting in Power Grids using Galerkin-Approximated Koopman Pseudospectra [0.3] 本稿では,電力網における電力予測のための演算子理論フレームワーク内の力学を特徴付ける解釈可能な機械学習手法を提案する。
非線形力学の線形無限次元表現を提供するクープマン演算子を用いて負荷データの動的表現を行う。
本手法は,季節変化による時間的コヒーレントなパターンと,日時や日時といったより詳細な時間スケールを捉える。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:13:09 GMT)
CABBA: Compatible Authenticated Bandwidth-efficient Broadcast protocol for ADS-B [0.3] ADS-B(CABBA)のためのコンパチブル認証帯域効率ブロードキャストプロトコルを提案する。
エンティティ認証、データ元認証、データの完全性は、CABAが提供するセキュリティサービスである。
以上の結果から,CABBAは後方互換性があり,通信オーバーヘッドが大きくないこと,Eb/No値が14dB以上で許容できる誤差率があることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:07:23 GMT)
Transfer Learning for High-dimensional Quantile Regression with Distribution Shift [0.3] 本稿では,3種類の分布シフトの下での知識伝達を伴う高次元量子レグレッションに着目した。
本稿では,これら3つの相違点に対処する新しい転送可能集合と新しい転送フレームワークを提案する。
本手法の有効性と優位性を検証するため,非漸近的推定誤差境界とソース検出整合性を確立した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:49:55 GMT)
A Review of LLM-based Explanations in Recommender Systems [0.2] LLM(Large Language Models)の台頭により、レコメンダシステムを強化する新たな機会が開かれた。
本稿では,レコメンデーションのための説明書作成にLLMを活用することに焦点を当てた体系的な文献レビューを行う。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:47:32 GMT)
Enhancing AI microscopy for foodborne bacterial classification via adversarial domain adaptation across optical and biological variability [0.2] 本研究は, 対向領域適応を用いた細菌分類のためのAI対応顕微鏡の一般化可能性を高める。
効率的なNetV2はバックボーンアーキテクチャとして機能し、小さなターゲットに対してきめ細かい機能を抽出した。
ドメイン・アドバイザリ・ニューラルネットワーク(DANN)が単一のドメインに対処し、MDANN(Multi-DANN)がすべてのターゲットドメインにまたがって一般化された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:12:36 GMT)
Unitary-transformed projective squeezing: applications for circuit-knitting and state-preparation of non-Gaussian states [0.2] 連続可変(CV)量子コンピューティングは、量子計算の有望な候補である。
本研究では, 圧縮真空から一元変換された状態に量子状態を投影する形式を確立させる。
我々は、より大規模な量子デバイスをシミュレーションし、典型的な非ガウス状態の1つに状態を投影する方法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:53:47 GMT)
Utilizing encoding time as a resource to enhance quantum sensing by probe qubit dephasing [0.1] 準2次元双極子ボース-アインシュタイン凝縮体に不純物量子ビットを浸漬するシステムについて検討する。
相対双極子-双極子相互作用強度はプローブ量子ビットデファス法により推定される。
また、励起スペクトルのロトン軟化による非マルコフ効果により、長い符号化時間が知覚精度を高めるための資源となることも明らかにされた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:32:05 GMT)
Generating a Low-code Complete Workflow via Task Decomposition and RAG [0.0] GenAIベースのシステムは、そのスケールと汎用性のために設計が難しい。
我々は、GenAIベースのシステムの設計パターンとして、タスク分解と検索拡張生成の2つのテクニックを定式化した。
これらの2つのパターンがAI開発サイクル全体に影響を与えるため、データセットの生成、モデルトレーニング、モデル評価、デプロイメントフェーズにどのように影響したかを説明します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:13:56 GMT)
Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy [0.0] ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
しかし、そのポテンシャルは、画像処理中に生成される画像の量によって制限されており、それは6~8時間で最大100万枚の画像を生成することができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:49:09 GMT)
What fifty-one years of Linguistics and Artificial Intelligence research tell us about their correlation: A scientometric review [0.0] この研究は、1974年から2024年までの51年間の知的生産を合成し、この相関関係を徹底的に科学的に分析する。
これは、20835人の著者によって書かれた2124の雑誌に掲載されている5750のウェブ・オブ・サイエンス・インデクシング記事を含んでいる。
1980年代から1990年代にかけて、言語学とAIの研究は、時とともに不安定な出版によって特徴づけられ、堅牢ではなかったことが示唆された。
しかし、2023年に1478条、2024年1月から3月にかけて546条に達するなど、それ以来顕著な増刊が見られた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:12:06 GMT)
Volumetric Reconstruction of Prostatectomy Specimens from Histology [0.0] 前立腺癌に対する外科的治療は、しばしば臓器切除、すなわち前立腺切除術を含む。
診断プロセスは、レポートで表現しにくい広範囲で複雑な情報を生成する。
この領域の既存のアプローチは、労働集約的で、臨床画像モダリティへの統合が困難であることが証明されている。
3D-SLIVERは、オープンソースの3DSlicer拡張として実装された、シンプルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 22:33:49 GMT)
Unsupervised Learning Approach to Anomaly Detection in Gravitational Wave Data [0.0] 本稿では,変分オートエンコーダ(VAE)を用いた教師なし異常検出手法を提案し,重力波(GW)データを解析する。
VAEはGW信号などの異常信号の再構成に失敗しながらノイズ入力を正確に再構成する。
この研究は、VAEをGWデータ中の異常を識別するための堅牢で教師なしのアプローチとして紹介し、物理学における既知の新しい現象を検知するためのスケーラブルなフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 03:18:40 GMT)
Unbounded Quantum Advantage in Communication with Minimal Input Scaling [0.0] 一般の硬貨を使わずに関係の再構築を行う場合, 量子的に非有界な利点を示す。
また、このタスクの半デバイス非依存なディメンションの目撃や、ミューチュアルアンバイアスベースの検出への応用についても強調する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:45:30 GMT)
Twisted Convolutional Networks (TCNs): Enhancing Feature Interactions for Non-Spatial Data Classification [0.0] ツイスト畳み込みネットワーク(TCN)は、任意の特徴順序と最小空間関係を持つ一次元データを処理するように設計されている。
本稿では,従来のCNN,DeepSets,Transformers,Graph Neural Networks(GNNs)などと比較して,TNアーキテクチャとその機能の組み合わせ戦略について述べる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:12:24 GMT)
Tracking light-matter correlations in the Optical Bloch Equations: Dynamics, Energetics [0.0] 我々は,各衝突中に形成されるエミッタ-フィールド相関の追跡を行う新しい種類のACMを構築した。
各衝突の中で、各系は実効ハミルトニアンによって駆動され、残余項は相関の影響を捉えている。
この新たなACMは、様々な量子開系に対する相関の影響を研究するために拡張することができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:47:26 GMT)
Towards the Ultimate Programming Language: Trust and Benevolence in the Age of Artificial Intelligence [0.0] 人工知能の文脈におけるプログラミング言語の役割の進化について考察する。
不要な実装の詳細を排除しながら、人間の理解を確保するためのプログラミング言語の必要性を強調します。
将来のプログラムは、ユーザーの興味を認識し、積極的に支援するように設計されるべきである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:02:25 GMT)
Towards Santali Linguistic Inclusion: Building the First Santali-to-English Translation Model using mT5 Transformer and Data Augmentation [0.0] インド、バングラデシュ、ブータン、ネパールでは700万人がサンタリ語を話す。
オーストロアシア語族のムンダ(Munda)のサブファミリーでは有名だが、サンタリは世界的な認知を欠いている。
利用可能なサンタリコーパスに基づくサンタリ翻訳モデルの構築の可能性を検討することを目的としている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:17:33 GMT)
Topology-Preserving Scaling in Data Augmentation [0.0] 本稿では,データ拡張パイプラインにおけるデータセット正規化のためのアルゴリズムフレームワークを提案する。
我々の貢献は、データ拡張パイプラインにおけるデータセット正規化のための厳密な数学的フレームワークを提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:11:28 GMT)
Think Beyond Size: Adaptive Prompting for More Effective Reasoning [0.0] 本稿では,動的かつ反復的なフレームワークであるAdaptive Promptingを紹介する。
その結果、Adaptive Promptingは、算術的推論(GSM8K、MultiArithm)、論理的推論、コモンセンスタスクなど、様々な推論ベンチマークのパフォーマンスを著しく向上させることを示した。
提案手法は,計算効率を維持しつつ,GPT-4などの大規模モデルと競合する性能を実現する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:18:29 GMT)
Theory of the photonic Joule effect in superconducting circuits [0.0] 光浴に結合した電圧バイアスジョセフソン接合の力学解析を行った。
以上の結果から,光子自由度が著しく過熱する非平衡定常状態に到達できることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:17:20 GMT)
The brain versus AI: World-model-based versatile circuit computation underlying diverse functions in the neocortex and cerebellum [0.0] 脳とAIの類似点と収束進化を同定する。
確立した神経科学理論を統合する新しい理論を提案する。
私たちの体系的なアプローチ、洞察、理論は、脳を理解するための画期的な進歩を約束します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:04:49 GMT)
TakeLab Retriever: AI-Driven Search Engine for Articles from Croatian News Outlets [0.0] TakeLab Retrieverは、クロアチアのニュースメディアからニュース記事を発見し、収集し、分析するために設計されたAI駆動の検索エンジンである。
クロアチアのオンラインニュースメディアの歴史と現在の状況について、ユニークな視点を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:08:32 GMT)
Synthetic $\mathbb{Z}_2$ gauge theories based on parametric excitations of trapped ions [0.0] 捕捉したイオンの結晶における$mathbbZ$ゲージ理論のアナログ量子シミュレーションの詳細なスキームを示す。
我々は、ネイティブ内部および運動自由度を用いて、ゲージと物質場のより効率的なハイブリッド符号化を利用する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:56:30 GMT)
Symmetries as Ground States of Local Superoperators: Hydrodynamic Implications [0.0] 局所性を持つ量子多体系の対称性代数は局所超作用素のフラストレーションのない基底状態として表現できることを示す。
さらに、この超ハミルトニアンの低エネルギー励起は近似対称性として理解できることが示される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:00:02 GMT)
Strong enhancement of superconductivity on finitely ramified fractal lattices [0.0] Sierpinskiガスケット(三角形)とカーペット(四角)格子を例として,フラクタル超伝導体の特性について検討した。
Sierpinskiガスケットの場合、基礎となる結晶格子のフラクタル幾何学が超伝導に強く有用であることを示す。
対照的に、シエピンスキーのカーペット幾何学は顕著な効果をもたらすものではなく、通常の正方格子と比較して大きな違いは見つからない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:16:15 GMT)
Steering Large Language Models using Conceptors: Improving Addition-Based Activation Engineering [0.0] 本稿では,事前学習したLLMの出力を,推論時にその活性化を操作することによって制御する,アクティベーションエンジニアリングについて検討する。
本稿では,活性化ベクトルの集合を楕円体領域として表現する数学的構成法を提案する。
本実験は,複数のステアリングタスクにおいて,概念的手法が従来の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:52:31 GMT)
Spatially resolved photon statistics of general nanophotonic systems [0.0] 本稿では、任意の電磁環境において、空間と周波数で解決された光子統計情報にアクセスする新しい方法を提案する。
マクロなQEDフレームワーク内では,複雑な量子系に対する電場相関を計算するための実用的なツールが開発されている。
本研究では, プラズモンナノ粒子に近接した1および2個のエミッタの光子相関について検討し, 提案手法の有効性とロバスト性を実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:31:36 GMT)
Spatial Clustering of Molecular Localizations with Graph Neural Networks [0.0] MIROは、ニューラルネットワークを使用して、クラスタリング効率を改善するために点雲を変換するアルゴリズムである。
MIROは異なる形状のクラスタと複数のスケールのクラスタの同時処理をサポートし,様々なデータセットのパフォーマンス向上を実証している。
MIROの堅牢なクラスタリング機能は、ニューロサイエンスなどの様々な分野における、神経接続パターンの分析の可能性を秘めている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:43:57 GMT)
Spacetime Markov length: a diagnostic for fault tolerance via mixed-state phases [0.0] 測定および物理誤差を経験する局所安定化器符号の耐故障性と物質相の混合状態との対応性を確立する。
物質の混合状態における最近の発展から、これは、時空マルコフ長と呼ばれる耐故障性の診断を動機付けている。
副産物として, 脱コヒーレンスは非コヒーレントな摂動とコヒーレントな摂動によって引き起こされる高次対称性保護トポロジカル相からの遷移を明らかにするのに有用であると考えられた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:00:03 GMT)
Solving eigenvalue problems obtained by the finite element method on a quantum annealer using only a few qubits [0.0] 量子コンピューティングにおける実用的な量子優位性を達成する上での大きな障害の1つは、量子ハードウェアで現在利用可能な量子ビットの数が比較的少ないことである。
有限要素法による固有値問題の文脈でこの問題を回避する方法について述べる。
例えば、AQAEは、電磁磁気学、音響学、地震学など、幅広い文脈で関係する固有値問題に適用する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:50:00 GMT)
Single-qubit gate teleportation provides a quantum advantage [0.0] ゲートテレポーテーション回路は、量子計算の優位性をもたらすと考えられる計算の最も基本的な例である。
単一量子Clifford-gate-teleportation回路であっても、このシミュレーション問題はファンインゲートが有界な定数深さの古典回路では解けない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:09:34 GMT)
Sequential Large Language Model-Based Hyper-Parameter Optimization [0.0] 本研究では,Large Language Models (LLMs)を活用する革新的なフレームワークSLLMBOを紹介する。
SLLMBOは、最近の完全にLLMベースの手法の制限に対処することにより、より堅牢な最適化を実現する。
ベンチマークでは、GPT-3.5-turbo、GPT-4o、Claude-Sonnet-3.5、Gemini-1.5-flashを含む複数のLCMを評価している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:27:46 GMT)
Semiclassical Backreaction: A Qualitative Assessment [0.0] 古典的背景における量子自由度のバックアクションは、理論物理学においてあまり理解されていないトピックである。
多くの場合、背景の力学に対する量子励起の影響を考慮に入れた様々なアドホック処方薬の助けを借りて、半古典的近似の中で扱われる。
i) 量子自由度が量子期待値を介して古典的背景と結合する平均場近似、(ii) 量子自由度の様々なランダムサンプリングされた初期条件に対する古典的運動方程式を用いて完全に結合されたシステムを進化させる(stochastic)Trncated Wigner法、である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:36:46 GMT)
Scaling Laws Governing the Collapse of a Bose-Einstein Condensate [0.0] 我々は、不安定な系が特異点に向かって進化する魅力的なボース=アインシュタイン凝縮体の崩壊について、基礎となる立方晶非線形シュル「オーディンガー方程式」を数値的に解くことによって研究する。
我々のシミュレーションは、弱い崩壊と、このシステムがホットスポットを形成する確率の相互作用を明らかにし、この挙動を規定する新しいスケーリング法則を明らかにする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:51 GMT)
Risk-Sensitive Reinforcement Learning with Exponential Criteria [0.0] 我々は、堅牢な強化学習ポリシーを定義し、リスクに敏感な強化学習問題を定式化し、それらを近似する。
本稿では,近似更新を用いた乗算ベルマン方程式の解法に基づく新しいオンラインアクター・クリティカルアルゴリズムを提案する。
シミュレーション実験により,提案手法の実装,性能,ロバスト性を評価した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:12:22 GMT)
Real-Time Anomaly Detection in Video Streams [0.0] この論文は、Othello社とIASD研究所との間のCIFRE協定の一部である。
目的は、ビデオストリーム内のリアルタイムな危険を検出する人工知能システムを開発することである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:24:33 GMT)
Randomness-free Detection of Non-projective Measurements: Qubits & beyond [0.0] 非射影測定は、いくつかの情報処理プロトコルにおいて資源に富んでいる。
任意の偏極雑音下では、立方体非射影測定が頑健であることを示す。
非射影測度の概念を一般確率論に拡張する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:22:37 GMT)
Quantum walks advantage on the dihedral group for uniform sampling problem [0.0] 本稿では、ケイリーグラフ上での量子ウォーク混合の一般的な理解を前進させる。
これは、D_2n$で連続時間量子ウォークによって達成された改良された混合時間を強調する。
この研究は、非アーベル群に基づくサンプリング問題のクラスに対するアルゴリズムに潜在的な応用をもたらす。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:15:50 GMT)
Quantum Key Distribution with Basis-Dependent Detection Probability [0.0] セキュリティ証明における一般的な仮定は、受信機における検出確率は、与えられた入力状態に対して、測定基準とは独立であるということである。
本稿では,上記の仮定に依存しないQKDプロトコルのセキュリティ証明を提案する。
我々は,シミュレーションにより,大規模な検出確率ミスマッチに弱い設定に対して,正の鍵レートを抽出できることを実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:35:27 GMT)
Quantum Algorithm for a Stochastic Multicloud Model [0.0] 本研究では,大気科学の問題に対して量子計算アルゴリズムを適用した。
その結果,従来のコンピュータ用アルゴリズムと同じシミュレーションを実現できることがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:14:25 GMT)
Quantum Algorithm for Researching the Nearest (QARN) [0.0] 量子コンピューティングは、量子ビット、量子ビットおよびそれらの特徴的な性質を持つ並列コンピューティングの魅力的な代替品として機能する。
本論文で提案する量子アルゴリズムは,初期要素を重ね合わせに格納することにより,最良(ランダムなデータ配列内の各要素に最も近い)探索を可能にする。
これにより、すべての要素に対して同時に検索操作を実行でき、RAMの量を節約できる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:16:13 GMT)
Physical Meaning of Neumann and Robin Boundary Conditions for the Schrödinger Equation [0.0] 物理的に、ディリクレ条件は、ポテンシャルが領域内よりもはるかに外側にあるときに適用される(ポテンシャル井戸」)。
我々の答えは、電位がポテンシャル井戸の表面に沿った薄い層においてより低い(適切なレベルで)とき、または、電位井戸の表面に近い表面で適切な強度の負のデルタ電位が付加されるときである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:44:23 GMT)
Phase Space Representation of the Density Operator: Bopp Pseudodifferential Calculus and Moyal Product [0.0] 1956年に導入されたボップシフトは、量子力学の統計的解釈において重要な役割を果たした。
本稿では,ボップ量子化の探索を概観し,モヤル積との関係と基本変形量子化への応用を強調した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:33:57 GMT)
Parametrized multiqubit gate design for neutral-atom based quantum platforms [0.0] ゲートセットの巧妙な選択と設計は、量子回路の深さを減らし、量子アルゴリズムから得られる解の質を向上させることができる。
特にパラメタライズドゲートは、短期アルゴリズムと回路コンパイルの両方で使われている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:47:19 GMT)
Operator Valued Flow Equation Approach to the Bosonic Lattice Polaron: Dispersion Renormalization Beyond the Fröhlich Paradigm [0.0] 格子ボースポラロンの再正規分散を計算し、2フォノン散乱過程が分散に与える影響を評価する。
ある種の不純物フォノン相互作用では, 2-フォノン散乱イベントを含むことにより, 分散の形状が著しく変化することがわかった。
この結果は、単一フォノン散乱イベントのみを考慮したFr"ohlich型モデルには存在しない極性境界状態が出現する可能性があることを予測している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:59:46 GMT)
Open source Differentiable ODE Solving Infrastructure [0.0] 我々は、GPUアクセラレーションされたODEソルバをオープンソースのDeepChemフレームワークに統合する。
我々の解法は10~4ドルから10~6ドルという平均二乗誤差で高精度に達成し,最大100のコンパートメントを持つ大規模システムの解法におけるスケーラビリティを示した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:48:20 GMT)
Noncommutative Model Selection for Data Clustering and Dimension Reduction Using Relative von Neumann Entropy [0.0] 教師なし分類と次元削減のためのデータ駆動型アルゴリズムのペアを提案する。
我々の実験では、クラスタリングアルゴリズムは、非自明な幾何学とトポロジを持つデータセット上の$k$-meansクラスタリングよりも優れています。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:04:11 GMT)
Noncommutative Model Selection and the Data-Driven Estimation of Real Cohomology Groups [0.0] 実コホモロジー群$Hk (X ; mathbbR)$をコンパクトな計量測度空間として推定するための3つのデータ駆動手法を提案する。
X$ が $mathbbRn$ に埋め込まれている場合のいくつかの計算実験の結果を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:58:45 GMT)
No-resonance conditions, random matrices, and quantum chaotic models [0.0] 量子多体カオス系の非共鳴条件とランダム行列モデルについて検討する。
非共鳴条件による固有値の和は、ポアソン統計を持ち、レベル反発が欠如していることが示される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:34:45 GMT)
Musical composition and 2D cellular automata based on music intervals [0.0] 本研究の目的は,音楽的文脈におけるセルラーオートマトンの利用法を検討することである。
我々は、複雑なシステムと人文科学のアプローチを、音楽の創造の本質を捉えるための枠組みとして用いた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:03:41 GMT)
Multipartite entanglement measures: a review [0.0] 多部量子システムでは、絡み合いは様々な量子情報処理タスクの促進に重要な役割を果たしている。
本稿では,本論文の真理と運用上の意味に焦点をあてたマルチパーティ・エンタングルメント尺度の理論を概観する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 05:41:40 GMT)
Multi-Resolution Graph Analysis of Dynamic Brain Network for Classification of Alzheimer's Disease and Mild Cognitive Impairment [0.0] アルツハイマー病(英語: Alzheimer's disease、AD)は、記憶喪失と認知低下を特徴とする神経変性疾患である。
ピアソンの相関のような伝統的な手法は相関行列を計算するために使われてきた。
本稿では、離散ウェーブレット変換(DWT)とグラフ理論を統合し、脳ネットワークの動的挙動をモデル化する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:50:18 GMT)
Models of interacting bosons with exact ground states: a unified approach [0.0] ボソンに対するフラストレーションフリー''相互作用格子量子ハミルトニアンの無限のクラスを定義する。
様々な既知可解モデルのボソン表現を構築する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:39:47 GMT)
Misinformation Dissemination: Effects of Network Density in Segregated Communities [0.0] 本研究では,ネットワーク密度と分離が誤情報の拡散にどのように影響するかを,感染防止フレームワークを用いて検討する。
高い密度は、誤情報信奉者の比率を一貫して増加させる。
分離されたネットワークでは、マイノリティが多数派に影響を与えることが判明した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:27:54 GMT)
Micro-cavity length stabilization for fluorescence enhancement using schemes based on higher order spatial modes [0.0] 高次モードに基づくスキームは、いくつかのエミッタの蛍光検出を強化するために使用されるマイクロキャビティに特に有用である。
可変な高受動的安定性を有するマイクロキャビティ構成のためのアセンブリの設計と構築について述べる。
我々は,連続係留ビームから蛍光検出器に漏れる誤差光子を100倍以上抑制しながら,0.5 pm RMSの安定性を実現した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 22:14:06 GMT)
Machine learning force-field model for kinetic Monte Carlo simulations of itinerant Ising magnets [0.0] 電子イジングシステムの大規模動力学的モンテカルロ(kMC)シミュレーションのためのスケーラブル機械学習(ML)フレームワークを提案する。
本手法は第一原理分子動力学シミュレーションで広く用いられているML力場モデルに類似している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:35:37 GMT)
MIMDE: Exploring the Use of Synthetic vs Human Data for Evaluating Multi-Insight Multi-Document Extraction Tasks [0.0] 我々は,Multi-Insight Multi-Document extract (MIMDE)タスクのセットを定義する。
この課題は、調査回答の分析から医療記録の処理に至るまで、多くの実践的応用に欠かせないものである。
そこで本研究では, 合成データの可能性を検討するために, 補完的な人間と合成データセットを新たに導入する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:24:10 GMT)
Long-distance chronometric leveling with a portable optical clock [0.0] 我々は、干渉ファイバーリンクによる2つの光学格子クロックの比較により、457mathrmkm$で分離された2つの位置の地電位差を測定した。
年代測地量差の不確実性は、高さが27mathrmcm$の不確実性と等価である。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:16:13 GMT)
Localisation of Regularised and Multiview Support Vector Machine Learning [0.0] 我々は、H.Q., L. Bazzani, V. Murによって導入された正規化マルチビュー支援ベクトル機械学習問題の局所化バージョンに対するいくつかの代表者定理を証明した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:08:08 GMT)
Linearization (in)stabilities and crossed products [0.0] 線形化(in)安定性の研究に焦点をあて、線形化解が正確な解と一体化できるかどうかを探索する。
我々の目的は、G_Nto0$制限の線型化理論にそのような制約を課すために、様々な条件下での正当化の状態について、ある程度の明確性を提供することである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:47:17 GMT)
Learning Feedback Mechanisms for Measurement-Based Variational Quantum State Preparation [0.0] この研究は、測定とフィードバックを変動量子回路に組み込む自己学習プロトコルを導入する。
条件付き測定とフィードバックを組み合わせることで、プロトコルは単体のみのメソッドを超えて拡張される状態準備戦略を学ぶ。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:21:51 GMT)
LUMIA: Linear probing for Unimodal and MultiModal Membership Inference A!acks leveraging internal LLM states [0.0] メンバーシップ推論攻撃(MIAs)を検出する方法として線形プローブ(LP)を提案する。
LUMIAと呼ばれる我々の手法は、LPを層単位で適用し、モデル内動作の詳細なデータを取得する。
単調なMIAでは、LUMIAは以前の手法に比べて平均15.71%上昇している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:38:56 GMT)
Integrated Artificial Neurons from Metal Halide Perovskites [0.0] ハードウェアニューラルネットワークは、従来のコンピュータよりもエネルギー効率のよい特定の計算タスクを実行することができる。
人工ニューロンはこれらのネットワークの重要なコンポーネントであり、現在、コンデンサとトランジスタに基づく電子回路で実装されている。
ここでは、マイクロスケール電極とペロブスカイト半導体をベースとした、完全にオンチップな人工ニューロンを実証する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:30:23 GMT)
Input-Output Optics as a Causal Time Series Mapping: A Generative Machine Learning Solution [0.0] 生成モデル,特に変分オートエンコーダは,多体量子系の複雑な応答を学習する上で,従来のオートエンコーダよりも優れていることを示す。
最も複雑なマッピングを生成する例として、変分自動エンコーダは、テストデータ全体の90%以上の入力に対して10%未満のエラーを持つ出力を生成する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:02:16 GMT)
Improving the performance of weak supervision searches using data augmentation [0.0] 弱監督は、実際のデータに対するトレーニングの利点と、信号特性を利用する能力を組み合わせる。
我々は、データ拡張によるこの制限に対処し、トレーニングデータのサイズと多様性を高めることを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:00:31 GMT)
Image segmentation of treated and untreated tumor spheroids by Fully Convolutional Networks [0.0] MCTS(Multicellular tumor spheroids)は、放射線(化学)療法の効果を評価するための先進的な細胞培養系である。
我々は2つの完全畳み込みネットワーク(UNetとHRNet)を訓練し、未処理および処理されたMCTSの自動セグメンテーションを開発する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:44:25 GMT)
Hybridization of Persistent Homology with Neural Networks for Time-Series Prediction: A Case Study in Wave Height [0.0] 本稿では,ニューラルネットワークモデルの予測性能を向上させる機能工学手法を提案する。
具体的には、計算トポロジ手法を利用して、入力データから貴重なトポロジ的特徴を導出する。
タイムアヘッド予測では、FNN、RNN、LSTM、GRUモデルにおいて、R2$スコアの強化が重要だった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 06:57:10 GMT)
Hybrid Spiking Neural Network -- Transformer Video Classification Model [0.0] スパイキングニューラルネットワーク(SNN)はその時間的理解能力のために大きな関心を集めている。
この研究は、私たちの知る限り、時系列データ分類タスクのためのハイブリッドアーキテクチャのような最初の皮質カラムを紹介します。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:10:51 GMT)
Hybrid Architecture for Real-Time Video Anomaly Detection: Integrating Spatial and Temporal Analysis [0.0] 本研究では、空間的・時間的分析を組み合わせた人間の行動に触発された映像データにおけるリアルタイム異常検出のための新しいアーキテクチャを提案する。
このアプローチでは, 時間的解析には (i) 再帰的畳み込みネットワーク (CNN + RNN) を用い, VGG19 と GRU を関連付けて映像シーケンスを処理し, (ii) 空間解析に関して YOLOv7 を用いて個々の画像を分析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:32:45 GMT)
Handling irresolvable conflicts in the Semantic Web: an RDF-based conflict-tolerant version of the Deontic Traditional Scheme [0.0] 本稿では,RDF と SPARQL でよく知られた Deontic Traditional Scheme を実装した新しいオントロジーを提案する。
提案するフレームワークは,一階述語だけでなく,最も広く使われている知識表現言語であるRDFで符号化されている。
それは、様々なタイプの解決不可能な矛盾、違反、およびデオン的モダリティと文脈的制約の間の相互作用をモデル化し、推論するための構造を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:33:28 GMT)
HVAC-DPT: A Decision Pretrained Transformer for HVAC Control [0.0] 建設事業は世界のエネルギーの約40%を消費し、暖房、換気、空調が最大50%を占める。
既存のコントロール戦略には一般化が欠如しており、広範なトレーニングとデータが必要である。
本稿では,テキスト内強化学習を用いた決定予測変換器HVAC-DPTを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:46:37 GMT)
Graph State Fission [0.0] 我々は、最小の絡み合いオーバーヘッドで選択接続を維持しながら、キュービットを分割できるプロトコルを導入する。
このツールは、セキュアな通信、エラー修正、適応的な絡み合い分布における潜在的な応用とフレキシブルな絡み合い管理を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:00:26 GMT)
Geometry of fibers of the multiplication map of deep linear neural networks [0.0] 固定行列に乗算する構成可能な行列のクイバーの集合の幾何学について検討する。
我々の解は、同変コホモロジーにおけるポアンカー級数、二次整数プログラム、明示的な公式の3つの形式で表される。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:36:03 GMT)
Fundamental bounds on precision and response for quantum trajectory observables [0.0] 量子コヒーレンスにより精度が向上し、量子系における古典的不確実性関係を破ることができることを示す。
i)エントロピー生成と動的活動の観点から電流の相対的揺らぎを束縛する不確実性関係の量子一般化、(ii)任意の数え上げ可能な可観測物の相対的揺らぎとシンメトリケートされたリウヴィリアンのスペクトルギャップに基づいて制限する量子逆不確実性関係、(iii)動的活動の観点からの運動的摂動に対する可観測物の応答を束縛する量子応答不確実性関係の3つの主要な結果を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:45:34 GMT)
From classical probability densities to quantum states: quantization of Gaussians for arbitrary orderings [0.0] 正方偏差がパラメータ$lambda$に依存するガウス的を考える。
一般に量子対応を持たない$delta$-functionでさえ、有効な量子状態にマッピングできる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:52:32 GMT)
Fractal ground state of ion chains in periodic potentials [0.0] 周期ポテンシャルにおけるトラップイオンはフラストレーションされたウィグナー結晶のパラダイムである。
力学は長距離フレンケル・コントロワモデルによって捉えられる。
実験パラメータと,我々の予測を観察し,明らかにできる特徴について論じる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:59:12 GMT)
Fine Tuning Large Language Models to Deliver CBT for Depression [0.0] 認知行動療法(Cognitive Behavioral Therapy, CBT)は、主要なうつ病に対するエビデンスベースの治療法である。
CBTにアクセスする個人には、コスト、セラピストの不足、スティグマなど、大きな障壁がある。
本研究では、細調整された小型オープン言語モデル(LLM)が抑うつにCBTを実現する可能性について検討する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 20:48:08 GMT)
Fast convolution algorithm for state space models [0.0] 本稿では,線形時間不変系の行列伝達関数を時間領域に適用するための頑健なアルゴリズムを提案する。
有限個のユーザ選択精度に対して、行列ベクトル乗算の数は$mathcalOleft(log_2Lright)$に削減できることを示す。
重要なことに、時間領域におけるカスケードの実装を用いることで、転送関数を適用するには、N+1$行列ベクトル乗算しか必要としない。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 01:10:55 GMT)
Fast Mutual Information Computation for Large Binary Datasets [0.0] 相互情報(MI)は、確率変数間の共有情報を定量化する強力な統計測度である。
計算MIは、一般にペアの計算アプローチを必要とする大規模なデータセットでは計算が禁止される。
本研究では,ベクトル化演算と最適化行列計算を利用してMI計算を高速化する行列ベースのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:46:15 GMT)
FRAC-Q-Learning: A Reinforcement Learning with Boredom Avoidance Processes for Social Robots [0.0] 本稿では,ソーシャルロボットであるFRAC-Q学習に特化した新しい強化学習手法を提案する。
提案アルゴリズムは,プロセスのランダム化と分類に加えて,忘れるプロセスから構成される。
FRAC-Qラーニングは,従来のQラーニングに比べて関心度が高い傾向を示し,利用者のブーイングが著しく困難であった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:02:40 GMT)
Experimental Tests of Invariant Set Theory [0.0] 不変集合論と標準量子論の差点を同定する。
これらの違いは、二つの理論の予測に顕著な違いをもたらすことを示す。
我々は、これらの予測のうちどれが我々の世界に対応するかをテストするために、数多くの実験を設計する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:15:00 GMT)
Excretion Detection in Pigsties Using Convolutional and Transformerbased Deep Neural Networks [0.0] 水たまりや糞のような動物の排ガスは家畜の農業において重要な排出源である。
水たまり領域を決定するための従来の研究手法では、納屋内の水たまりを手動で検出する必要がある。
本研究は,豚の排ガス検出における各種深層学習モデルの適合性について検討した最初のものである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:00:08 GMT)
Examining a Quantum System Subject to Energy Decoherence [0.0] 本稿では,相互作用量子系のエネルギーデコヒーレンスについて検討する。
量子力学の仮定を動機づけた実験を最初にレビューした。
その後、閉系において動的に発生する非コヒーレンスについて論じる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 21:59:34 GMT)
Evidence-Based Threat Modeling for ICS [0.0] ICS環境は電力網、水処理施設、製造工場などの重要なインフラの運営に不可欠である。
本稿では,既存のコンポーネントのCVEエントリに基づいて,脅威を体系的に識別する新しいエビデンスベースの手法を提案する。
我々は、我々の方法論を使えるツールとして実装し、それを典型的なSCADAシステムに適用し、我々の方法論が現実の環境で実用的で適用可能であることを実証した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 15:05:00 GMT)
Efficient quantum-enhanced classical simulation for patches of quantum landscapes [0.0] パラメータ化量子回路によって生成される期待ランドスケープのサブリージョンの古典的なサロゲートを常に生成可能であることを示す。
我々は、量子デバイス上で単純な測定を行った後、ランドスケープのサブリージョンの近似期待値を古典的にシミュレートできる量子エンハンスな古典的アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:00:07 GMT)
Edge modes and boundary impurities in the anisotropic Heisenberg spin chain [0.0] 分数化スピン-$frac12$エッジモードと結合スピン-$frac12$エッジの不純物との相互作用について検討した。
本研究は, ギャップ付き反強磁性系における境界不純物のニュアンス挙動を明らかにするものである。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:00:06 GMT)
Dynamic EEG-fMRI mapping: Revealing the relationship between brain connectivity and cognitive state [0.0] 本研究では,脳波とfMRIの動的接続パターンについて検討し,脳ネットワークの相互作用の理解に寄与した。
その結果,脳内結合ネットワーク(ICN)内のモジュール構造が明らかになり,感覚システムと既定モードネットワークの重要な役割が明らかになった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:36:58 GMT)
Delegated verification of quantum randomness with linear optics [0.0] 量子力学は予測不可能性の観点からエントロピー源の最高の性質を提供する。
本稿では,ランダムビットの秘密性を損なうことなく,第三者が統計的テストを行うことを可能にする手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:11:01 GMT)
Data Augmentation through Background Removal for Apple Leaf Disease Classification Using the MobileNetV2 Model [0.0] 本研究の目的は,実環境下での撮影画像におけるリンゴ葉病の分類性能に対するデータ拡張手法の効果を評価することである。
提案手法は植物病理データベース上で98.71%の分類精度を達成し, 約3%の改善, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 16:06:34 GMT)
DID Link: Authentication in TLS with Decentralized Identifiers and Verifiable Credentials [0.0] 本稿では,TLS 1.3の新しい認証方式であるDID Linkについて述べる。
これはTLS準拠の方法で、台帳入りのDIDを備えた自己発行のX.509証明書を認証する権限を与える。
原型実装では、検証材料がキャッシュされている場合、DID LinkのTLSハンドシェイク期間と、台帳から取得された場合、合理的な長期化を示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 08:48:01 GMT)
Critical analysis of multiple reentrant localization in an antiferromagnetic helix with transverse electric field: Hopping dimerization-free scenario [0.0] Reentrant Localization (RL) は伝統的に、停滞した相関性障害とホッピング二量体との相互作用に結びついている。
本研究は, ホッピング二量体化がRLを実現する重要な要因ではないことを示す。
反強磁性秩序を持つヘリカル磁気系を考慮し、スピン依存RLを複数のエネルギー領域で発見する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 10:18:27 GMT)
Convolutional neural network based decoders for surface codes [0.0] 本稿では,畳み込みニューラルネットワークに基づくデコーダの研究について報告する。
その結果,畳み込みニューラルネットワークに基づくデコーダの性能は良好であり,異なるノイズモデルに適応できることがわかった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:40:43 GMT)
Continuous symmetry entails the Jordan algebra structure of quantum theory [0.0] 連続的なケースは、力学過程の数学的モデルに対する物理的要求とよく一致していることを示す。
直交格子の表現論を適用すると、連続対称性はスペクトル性やいくつかのさらなる要件とともに、有限次元の一般化確率論の基礎となる数学的構造が単純ユークリッド・ヨルダン代数となることを示す。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:56:49 GMT)
Contextuality Can be Verified with Noncontextual Experiments [0.0] 量子状態は複素単位円板の値を取るKD分布で表すことができる。
KD分布は、一連の弱いおよび射影的な測定によって測定することができる。
我々は、純粋なKD陽性状態の凸結合として分解できない混合KD陽性状態について、この関係を解析する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 19:01:03 GMT)
Can multipartite entanglement be characterized by two-point connected correlation functions ? [0.0] 混合量子状態における多重粒子の絡み合いは、2点連結相関関数によってのみ特徴づけられる。
純粋な状態の場合とは対照的に、満たすべき条件はかなり厳しいことが判明した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 09:03:17 GMT)
CP$^{\infty}$ and beyond: 2-categorical dilation theory [0.0] 我々は、$mathrmCPinfty$-構成の水平分類によって、すべてのフォン・ノイマン代数とチャネルの圏を復元できることを示した。
応用として、チェーの有限次元行列代数間の極端チャネルのキャラクタリゼーションを任意のフォン・ノイマン代数間の極端チャネルのキャラクタリゼーションに拡張する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 22:00:22 GMT)
Bohmian Mechanics at Space-Time Singularities. I. Timelike Singularities [0.0] 特異点を含む曲線付き背景空間時間へのボヘミア力学の拡張を開発する。
粒子が特異点にぶつかって消滅する確率が正の場合に、我々は関心を持っている。
結果として生じる理論は粒子の生成と消滅を伴うため、量子場理論とみなすことができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 11:03:24 GMT)
Below threshold nonsequential double ionization with linearly polarized two-color fields I: symmetry and dominance [0.0] 線形偏光二色場を用いたレーザー誘起非逐次二重イオン化法について検討した。
強磁場近似を用いて、場の対称性が支配的な事象にどのように影響するかを評価する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:31:46 GMT)
Artificial intelligence contribution to translation industry: looking back and forward [0.0] 13220件がWoS、Scopus、Lensの3つの資料から回収された。
その結果、過去のAIによる翻訳産業への貢献は厳密ではなかったことが判明し、結果としてルールベースの機械翻訳と統計機械翻訳は、出力が満足できない結果となった。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:10:33 GMT)
ApisTox: a new benchmark dataset for the classification of small molecules toxicity on honey bees [0.0] ApisToxはミツバチに対する殺虫剤の毒性に焦点を当てた包括的データセットである
このデータセットはECOTOXやPPDBといった既存のソースのデータを組み合わせて活用する。
ApisToxは、アグロケミカル化合物の分子特性予測法をベンチマークするためのユニークな資源を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 13:04:35 GMT)
Another look at inference after prediction [0.0] 予測ベース(PB)推論は、関心の結果が得られにくいアプリケーションではますます使われている。
予測駆動推論(PPI)推定器の統計的効率について検討した。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 18:12:50 GMT)
AlphaViT: A Flexible Game-Playing AI for Multiple Games and Variable Board Sizes [0.0] ビジョントランスフォーマー(ViT):AlphaViT、AlphaViD、AlphaVDAで強化されたAlphaZeroフレームワークに基づく新しいゲームプレイングAIエージェント。
これらのエージェントは、共有重み付き単一のネットワークを使用して、さまざまなサイズの複数のボードゲームをプレイするように設計されている。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 07:00:39 GMT)
Actions and Objects Pathways for Domain Adaptation in Video Question Answering [0.0] 本稿では,ビデオ質問応答タスクにおける領域外一般化のためのAOPath(Actions and Objects Pathways)を提案する。
AOPathは、大きな事前訓練されたモデルの特徴を活用して、目に見えないドメインに対する明示的なトレーニングを必要とせずに、一般化性を高める。
人間の脳にインスパイアされたAOPathは、訓練済みの特徴を行動と対象の特徴に解離させ、その後別々の推論経路を通して処理する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 02:14:05 GMT)
A data driven approach to classify descriptors based on their efficiency in translating noisy trajectories into physically-relevant information [0.0] ノイズトラジェクトリから情報を抽出する際の各種記述子の効率を比較検討する。
SOAPやLENSのような先進的な記述子は、信号と雑音の比率が高いため、古典的な記述よりも優れています。
この研究は、分子軌道からの情報抽出におけるノイズの重要な役割を強調している。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 12:50:13 GMT)
A Visual-inertial Localization Algorithm using Opportunistic Visual Beacons and Dead-Reckoning for GNSS-Denied Large-scale Applications [0.0] 拡張現実(AR)により、歩行者はリアルタイムで視覚情報を取得することができる。
低コストな視覚慣性位置決めソリューションを提案する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:04:03 GMT)
A Simple Sparse Matrix Vector Multiplication Approach to Padded Convolution [0.0] スパース変換行列としてゼロパディングとストライドによる畳み込みを効率的に表現するアルゴリズムを提案する。
コンボリューション操作におけるスパーシリティを活用する可能性についての洞察を提供するとともに、ストライドおよびパディングとの畳み込みにおけるゼロでない乗算数の明示的な表現を提供する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 00:14:24 GMT)
A Quantum Key Distribution System for Mobile Platforms with Highly Indistinguishable States [0.0] 量子鍵分散(QKD)により、2人のユーザーが暗号化アプリケーションに対して証明可能なセキュアな鍵を交換できる。
ここでは,3状態BB84偏光を用いたデコイ状態プロトコルにおいて,量子状態の不明瞭さを計測する。
生成した量子状態の空間的・スペクトル的・時間的DOFを、空間フィルタ単モードファイバ、狭帯域スペクトルフィルタ、RC-LEDを駆動する電気パルスの調整可能なタイミングでほぼ区別可能とする。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 17:45:41 GMT)
A Note on Small Percolating Sets on Hypercubes via Generative AI [0.0] ハイパーキューブのブートストラップ・パーコレーションを研究するために,PatternBoostと呼ばれる生成AI技術を適用した。
これにより、ハイパーキューブのパーコレーション部分集合のサイズに対して、最良な上界をわずかに改善する。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:27:28 GMT)
A Comprehensive Content Verification System for ensuring Digital Integrity in the Age of Deep Fakes [0.0] 本稿では,デジタルランドスケープ全体にわたる投稿やストーリーとして共有される画像やビデオの認証を目的とした,コンテンツ検証システムについて論じる。
このシステムによって、個人やインフルエンサーはデジタルフットプリントの正当性を検証することができ、相互接続された世界での評判を守ることができる。
論文参考訳(メタデータ) (Fri, 29 Nov 2024 14:47:47 GMT)