Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems [268.6] 科学のためのAI(AI4Science)として知られる新しい研究領域
領域は、物理世界(波動関数と電子密度)、原子(分子、タンパク質、物質、相互作用)、マクロ(流体、気候、地下)まで理解することを目的としている。
主要な課題は、物理第一原理、特に対称性を深層学習法によって自然システムで捉える方法である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:56:41 GMT)
Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration [100.5] オールインワン画像復元は、各分解に対してタスク固有の非ジェネリックモデルを持たずに、統一されたモデルで異なるタイプの劣化に対処する。
我々は、オールインワン画像復元タスクのためのエンコーダデコーダ方式で設計されたネットワークの動的ファミリであるDyNetを提案する。
我々のDyNetは、よりバルク化と軽量化をシームレスに切り替えることができるので、効率的なモデルデプロイメントのための柔軟性を提供します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:26:56 GMT)
Training Data Protection with Compositional Diffusion Models [99.5] 比較拡散モデル(CDM)は、異なるデータソース上で異なる拡散モデル(またはプロンプト)を訓練する手法である。
個々のモデルは、独立した、異なるタイミングで、異なる分散とドメインでトレーニングすることができる。
各モデルには、トレーニング中に露出したデータのサブセットに関する情報のみが含まれており、いくつかの形式のトレーニングデータ保護を可能にする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:32:43 GMT)
Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text [98.3] 密接に関連する2つの言語モデルとの対比に基づくスコアは、人文と機械文の分離に極めて正確である。
本稿では,一対の事前学習 LLM を用いた簡単な計算しか必要としない新しい LLM 検出器を提案する。
Binocularsと呼ばれるこの方法は、トレーニングデータなしで最先端の精度を実現する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:12:59 GMT)
Decoupled Kullback-Leibler Divergence Loss [90.5] 我々は、クルバック・リブラー(KL)の除算損失がデカップリングカルバック・リブラー(DKL)の除算損失と等価であることを証明した。
我々はKL/DKLにクラスワイドなグローバル情報を導入し、個々のサンプルからバイアスを取ります。
提案手法は,新たな最先端の対人ロバスト性を公衆のリーダーボード上で実現する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:44:46 GMT)
ModelLock: Locking Your Model With a Spell [90.4] ModelLockと呼ばれる拡散ベースのフレームワークは、テキストガイドによる画像編集を探求し、トレーニングデータをユニークなスタイルに変換するか、バックグラウンドで新しいオブジェクトを追加する。
このデータセットに微調整されたモデルはロックされ、キープロンプトによってのみアンロックされる。
画像分類とセグメンテーションの両方のタスクについて広範な実験を行い、ModelLockが期待する性能を著しく低下させることなく、効果的に細調整されたモデルをロックできることを示します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:20:03 GMT)
MMCOMPOSITION: Revisiting the Compositionality of Pre-trained Vision-Language Models [85.1] 本稿では,視覚言語モデルを包括的かつ正確に評価する新しい人間アノテーションベンチマークMMCOMPOSITIONを提案する。
GPT-4oのコンポジション性は,最も優れたオープンソースモデルよりも劣ることがわかった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:35:09 GMT)
Evaluating D-MERIT of Partial-annotation on Information Retrieval [77.4] 検索モデルは、部分的に注釈付けされたデータセットでしばしば評価される。
部分的に注釈付けされたデータセットを評価に用いると歪んだ絵が描けることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:30:32 GMT)
Towards a Theoretical Understanding of Memorization in Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:51:04 GMT)
Towards a Theoretical Understanding of Memorization in Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:51:04 GMT)
Towards a Theoretical Understanding of Memorization in Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:51:04 GMT)
Towards a Theoretical Understanding of Memorization in Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:51:04 GMT)
Mitigating the Alignment Tax of RLHF [76.4] 強化学習(Reinforcement Learning)とヒューマンフィードバック(Human Feedback)の下のLLMの調整は、事前訓練された能力(アライメント税(アライメント税)としても知られる)を忘れてしまう可能性がある。
最小アライメント税を課しながらアライメント性能を最大化するためのモデル平均化を提案する。
我々は,OpenLLaMA-3B上でのRLHFアルゴリズムによるHMAの性能評価を行い,さらにMistral-7Bまで拡張した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:27:20 GMT)
Model Developmental Safety: A Safety-Centric Method and Applications in Vision-Language Models [75.8] 本稿では,既存の画像分類能力向上のために,事前学習された視覚言語モデル(別名CLIPモデル)の開発方法について検討する。
自律走行とシーン認識データセットにおける視覚知覚能力の向上に関する実験は,提案手法の有効性を実証するものである。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 00:48:38 GMT)
Model Developmental Safety: A Safety-Centric Method and Applications in Vision-Language Models [75.8] 本稿では,既存の画像分類能力向上のために,事前学習された視覚言語モデル(別名CLIPモデル)の開発方法について検討する。
自律走行とシーン認識データセットにおける視覚知覚能力の向上に関する実験は,提案手法の有効性を実証するものである。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 00:48:38 GMT)
VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling [71.0] ビデオ入力に対応する音楽を生成するためのフレームワークであるVidMuseを提案する。
VidMuseは、ビデオと音響的、意味的に一致した高忠実な音楽を生成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:59:22 GMT)
Extreme Miscalibration and the Illusion of Adversarial Robustness [66.3] 敵の訓練は、しばしばモデルの堅牢性を高めるために使用される。
我々は、この観測されたロバストネスの利得はロバストネスの錯覚(IOR)であることを示した。
我々は,NLPコミュニティに対して,試験時間温度のスケーリングを堅牢性評価に組み込むよう促す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:11:30 GMT)
Every Shot Counts: Using Exemplars for Repetition Counting in Videos [66.2] 本稿では,対象ビデオ内の繰り返しにまたがる映像の視覚的対応を見出すための例題に基づくアプローチを提案する。
提案したEvery Shot Counts (ESCounts) モデルは,注目度に基づくエンコーダデコーダであり,同じビデオや異なるビデオの例と並行して,様々な長さのビデオをエンコードする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:54:24 GMT)
UnSeg: One Universal Unlearnable Example Generator is Enough against All Image Segmentation [64.0] 未承認のプライベートデータ上での大規模なイメージセグメンテーションモデルのトレーニングに関して、プライバシーに関する懸念が高まっている。
我々は、学習不可能な例の概念を利用して、学習不可能なノイズを原画像に生成し、付加することにより、モデルトレーニングに使用不能な画像を作成する。
6つのメインストリームイメージセグメンテーションタスク、10つの広く使われているデータセット、7つの異なるネットワークアーキテクチャでUnSegの有効性を実証的に検証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:34:46 GMT)
Self-Powered LLM Modality Expansion for Large Speech-Text Models [62.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著なパフォーマンスを示す。
本研究は,バニラ調律の限界に対処して,LSM訓練における音声データセットの利用を改良することを目的とする。
そこで本研究では,モデル自体が生成する拡張音声認識データを利用して,より効果的な命令チューニングを行う自己力 LSM を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:46:26 GMT)
Self-Powered LLM Modality Expansion for Large Speech-Text Models [62.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著なパフォーマンスを示す。
本研究は,バニラ調律の限界に対処して,LSM訓練における音声データセットの利用を改良することを目的とする。
そこで本研究では,モデル自体が生成する拡張音声認識データを利用して,より効果的な命令チューニングを行う自己力 LSM を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:46:26 GMT)
Socialized Learning: A Survey of the Paradigm Shift for Edge Intelligence in Networked Systems [62.3] 本稿では,エッジインテリジェンス(EI)と社会学習(SL)の統合に関する文献レビューの結果について述べる。
SLは、エージェントの協調能力と集団知性を増幅することを目的とした、社会的原則と行動に基づく学習パラダイムである。
ソーシャル化アーキテクチャ、ソーシャル化トレーニング、ソーシャル化推論の3つの統合コンポーネントについて詳しく検討し、その強みと弱点を分析した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:17:21 GMT)
Online Multi-modal Root Cause Analysis [61.9] ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:47:36 GMT)
AutoScale: Automatic Prediction of Compute-optimal Data Composition for Training LLMs [61.1] 本稿では,異なる領域からのトレーニングデータの最適構成がスケール依存であることを示す。
我々は、潜在的に大規模なトレーニングデータスケールでデータ合成を最適化するための、新しい実用的なアプローチである*AutoScale*を紹介します。
GPT-2Large and BERT pre-training の評価は,トレーニング収束性および下流性能向上における *AutoScale* の有効性を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 01:05:50 GMT)
Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.0] 誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:42:46 GMT)
BitDelta: Your Fine-Tune May Only Be Worth One Bit [57.6] 大規模言語モデル(LLM)は通常、大規模なインターネットスケールデータセットの事前トレーニングと、下流タスクの微調整という2つのフェーズでトレーニングされる。
我々は,このデルタを1ビットまで量子化する簡単な手法BitDeltaを導入し,性能を損なうことなく実現した。
複数の1ビットデルタを伴う1つの高精度ベースモデルを使用することで、BitDeltaはGPUメモリの要求を劇的に10倍に削減する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:42:37 GMT)
LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models [55.9] 複数モードで合成データを検出するLMMの能力を評価するための新しいベンチマークであるLOKIを紹介する。
このベンチマークには、粗粒度判定と多重選択質問、微粒度の異常選択と説明タスクが含まれている。
LOKI上で22のオープンソースLMMと6つのクローズドソースモデルを評価し、合成データ検出器としての可能性を強調し、LMM機能開発におけるいくつかの制限を明らかにした。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:26:36 GMT)
LLM-Based Agent Society Investigation: Collaboration and Confrontation in Avalon Gameplay [55.1] Avalon をテストベッドとして使用し,システムプロンプトを用いてゲームプレイにおける LLM エージェントの誘導を行う。
本稿では,Avalonに適した新しいフレームワークを提案し,効率的なコミュニケーションと対話を容易にするマルチエージェントシステムを提案する。
その結果、適応エージェントの作成におけるフレームワークの有効性を確認し、動的社会的相互作用をナビゲートするLLMベースのエージェントの可能性を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:09:00 GMT)
Combining Generative and Geometry Priors for Wide-Angle Portrait Correction [54.4] 本稿では, 自然多様体として事前に生成顔をカプセル化して, 顔領域の補正を容易にすることを提案する。
非面の背景には顕著な中心対称性関係が存在するが、補正過程では研究されていない。
この幾何学は、修正過程全体を通して対称性を明示的に強制する新しい制約を導入する動機となる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:36:52 GMT)
Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.4] コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:37:11 GMT)
Symmetry Discovery for Different Data Types [52.3] 等価ニューラルネットワークは、そのアーキテクチャに対称性を取り入れ、より高度な一般化性能を実現する。
本稿では,タスクの入出力マッピングを近似したトレーニングニューラルネットワークによる対称性発見手法であるLieSDを提案する。
我々は,2体問題,慣性行列予測のモーメント,トップクォークタグ付けといった課題におけるLieSDの性能を検証した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:39:39 GMT)
EgoChoir: Capturing 3D Human-Object Interaction Regions from Egocentric Views [51.5] エゴセントリックな人間と物体の相互作用(HOI)を理解することは、人間中心の知覚の基本的な側面である。
既存の手法は主にHOIの観測を利用して、外心的な視点から相互作用領域を捉えている。
EgoChoirは、オブジェクト構造と、外見と頭部運動に固有の相互作用コンテキストを結びつけて、オブジェクトの余裕を明らかにする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:23:36 GMT)
FAMOUS: High-Fidelity Monocular 3D Human Digitization Using View Synthesis [51.2] テクスチャを正確に推測することの難しさは、特に正面視画像の人物の背中のような不明瞭な領域に残る。
このテクスチャ予測の制限は、大規模で多様な3Dデータセットの不足に起因する。
本稿では,3次元デジタル化におけるテクスチャと形状予測の両立を図るために,広範囲な2次元ファッションデータセットを活用することを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 01:25:05 GMT)
Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.1] 本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:01:34 GMT)
SimBa: Simplicity Bias for Scaling Up Parameters in Deep Reinforcement Learning [49.8] SimBaは、単純さのバイアスを注入することによって、深いRLでパラメータをスケールアップするように設計されたアーキテクチャである。
SimBaでパラメータをスケールアップすることで、オフポリシー、オンポリシー、アン教師なしメソッドを含む様々なディープRLアルゴリズムのサンプル効率が一貫して改善される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:20:53 GMT)
Block-to-Scene Pre-training for Point Cloud Hybrid-Domain Masked Autoencoders [49.4] Masked Autoencoders (MAE) は、ポイントクラウドの自己教師型学習において主流のパラダイムとなっている。
我々は,ブロック・ツー・シーンの事前学習戦略を通じて,一般のポイントクラウドであるHybrid-Domain Masked AutoEncoder (PointHDMAE) を事前訓練することを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:51:20 GMT)
Reddit is all you need: Authorship profiling for Romanian [49.2] 著者プロファイリング(英: Authorship profiling)とは、著者の著作に基づいて著者の特徴を特定する過程である。
本稿では,ルーマニア語における短いテキストのコーパスについて紹介する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:27:31 GMT)
A Preliminary Exploration Towards General Image Restoration [48.0] 本稿では、これらの課題を統一モデル内で解決することを目的とした、一般画像復元(GIR)と呼ばれる新しい問題を提案する。
GIRは個々の画像復元タスク(例えば、画像のデノイング、デブロイング、デライニング、超解像)とそれらの組み合わせを汎用的にカバーしている。
我々は、GIR課題に対処するための既存のアプローチを包括的に評価し、その強みと実用的課題を明らかにする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:44:46 GMT)
Towards characterizing the value of edge embeddings in Graph Neural Networks [47.0] グラフニューラルネットワーク(GNN)は、グラフ上で定義された機械学習問題を解決する主要なアプローチである。
エッジの埋め込みを維持し、更新するアーキテクチャの利点について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:03:24 GMT)
Reconstruction of Manipulated Garment with Guided Deformation Prior [46.2] 衣服モデルに暗黙的縫製パターン (ISP) モデルを適用し, 形状を表すために拡散に基づく変形を加えることで拡張する。
衣服の折りたたみ時に得られる不完全な3D点雲から3Dの衣服形状を復元するために,その点を事前学習したUV空間にマッピングし,部分的なUVマップを作成し,その前者を適合させて完全なUVマップと2Dから3Dマップを復元する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:43:10 GMT)
$β$-DPO: Direct Preference Optimization with Dynamic $β$ [45.6] 直接選好最適化(DPO)は、人間の嗜好に従うために大規模言語モデル(LLM)を訓練するための魅力的なアプローチとして登場した。
我々は、$beta$とデータ品質がDPOに与える影響を分析し、最適な$beta$値がペアデータの情報性によって異なることを明らかにする。
バッチレベルで$beta$を動的に校正する新しいフレームワークを導入し、データ品質を考慮に入れます。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:53:00 GMT)
Learning Orthogonal Multi-Index Models: A Fine-Grained Information Exponent Analysis [45.1] 情報指数は、オンライン勾配降下のサンプルの複雑さを予測する上で重要な役割を果たす。
マルチインデックスモデルでは、最低度のみに焦点を合わせることで、重要な構造の詳細を見逃すことができる。
2次項と高次項の両方を考慮することで、まず2次項から関連する空間を学習できることが示される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 00:14:08 GMT)
Estimating the Hallucination Rate of Generative AI [44.9] この研究は、生成AIを用いて、文脈内学習(ICL)の幻覚率を推定することを目的としている。
ICLでは、条件生成モデル(CGM)がデータセットでトリガーされ、そのデータセットに基づいて予測問題に答えるように要求される。
我々は、ICL問題に対処し、CGMが幻覚を発生させる確率を推定する新しい方法を開発した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:23:58 GMT)
RMB: Comprehensively Benchmarking Reward Models in LLM Alignment [44.8] リワードモデル(RM)は、大きな言語モデル(LLM)のアライメントをガイドする。
我々は、49以上の実世界のシナリオをカバーする包括的なRMベンチマークであるRMBを提案する。
ベンチマークに基づいて、最先端のRMについて広範な分析を行う。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:06:54 GMT)
SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [44.3] ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
本稿では,表情ラベルの修正を支援するために,生成プロセスと擬似ラベル生成手法を提案する。
提案手法は,AffectNetトレーニングセットサイズに相当する合成データのみを用いてトレーニングを行う場合,AffectNetの67.23%の分類精度を実現する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:58:21 GMT)
Towards Mitigating more Challenging Spurious Correlations: A Benchmark & New Datasets [43.6] ディープニューラルネットワークは、しばしばクラスラベルと急激な相関を持つ非予測的特徴を利用する。
急激な相関を修復する最近の研究が増えているにもかかわらず、標準化されたベンチマークの欠如は再現可能な評価を妨げている。
本稿では,PythonパッケージであるSpuCoについて述べる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:32:30 GMT)
Sharper Guarantees for Learning Neural Network Classifiers with Gradient Methods [43.3] 本研究では,スムーズなアクティベーションを有するニューラルネットワークに対する勾配法におけるデータ依存収束と一般化挙動について検討する。
我々の結果は、よく確立されたRadecher複雑性に基づく境界の欠点を改善した。
XOR分布の分類において、NTK体制の結果に対して大きなステップサイズが大幅に改善されることが示されている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:49:29 GMT)
Author Unknown: Evaluating Performance of Author Extraction Libraries on Global Online News Articles [42.0] オンラインニュース記事の著者の言語間データセットを手作業で作成する。
既存の5つのソフトウェアパッケージと1つのカスタマイズされたモデルの性能を評価するために使用します。
Go-readabilityとTrafilaturaは著者抽出の最も一貫性のあるソリューションであるが、すべてのパッケージが言語間で非常に可変な結果を生成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:19:15 GMT)
Single Ground Truth Is Not Enough: Add Linguistic Variability to Aspect-based Sentiment Analysis Evaluation [41.7] アスペクトベース感情分析(ABSA)は、人間の言語から感情を抽出する上で困難な課題である。
このタスクの現在の評価手法は、表面形が異なる意味論的に等価な予測をペナルティ化して、単一の真実に対する答えを制限することが多い。
我々は、アスペクトと意見の項に対して、代替の有効なレスポンスで既存のテストセットを拡張する、新しく完全に自動化されたパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:48:09 GMT)
Adaptive Exploration for Data-Efficient General Value Function Evaluations [40.2] 一般値関数(GVF)は強化学習における予測的知識を表す。
GVFExplorerは、複数のGVFを並列に評価するためのデータを効率的に収集する単一の行動ポリシーを学ぶ。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:54:10 GMT)
High-Performance Fine Defect Detection in Artificial Leather Using Dual Feature Pool Object Detection [40.1] 人工皮革の微細欠陥の特徴から, DFP, IFF, AMP, EOSの4つの革新的な構造が設計された。
これらの進歩により、YOLODという高性能な人工皮革微細欠陥検出モデルが提案された。
YOLODは人工皮革欠陥データセットに優れた性能を示し、YOLOv5と比較してAP_50の11.7%から13.5%の顕著な増加を達成した。
YOLODはまた、一般のMS-COCOデータセットでも顕著なパフォーマンスを示しており、YOLOv5と比較してAPでは0.4%から2.6%増加した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:16:43 GMT)
Dualformer: Controllable Fast and Slow Thinking by Learning with Randomized Reasoning Traces [40.1] 人間の思考は、システム1とシステム2の2つのシステムによって管理されている。
近年, System 2 プロセスを Transformer に組み込むことで推論能力が大きく向上することが報告されている。
高速かつ低速な推論モードをシームレスに統合する単一トランスフォーマーモデルであるDualformerを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:53:02 GMT)
Improving Deep Learning Optimization through Constrained Parameter Regularization [39.6] 本稿では、従来の重み劣化の代替として、制約付き正規化(CPR)を提案する。
CPRは、個々のパラメータのL$-normのような統計測度上の上限を強制する。
CPRは従来の重量減少よりも優れ、トレーニング前や微調整時の性能が向上する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:59:03 GMT)
Reverse Modeling in Large Language Models [39.2] 人間は前もって読み書きに慣れている。
本稿では,自己回帰型大規模言語モデル (LLM) が逆モデリングに苦しむかを検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:24:03 GMT)
YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification [38.5] 本稿では,Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) と非対称多層圧縮デカップリングヘッド (ADH) という,バックボーンとヘッドネットワークのための2つの革新的なモジュールを紹介する。
YOLOv5モデルに統合されると、これらの2つのモジュールは例外的な性能を示し、YOLOCSと呼ばれるモデルが修正される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:58:36 GMT)
GaitContour: Efficient Gait Recognition based on a Contour-Pose Representation [38.4] 歩行認識は、外見情報ではなく歩行パターンに基づいて、被験者をしっかりと識別する約束を持っている。
本研究では,身体形状と身体部分情報の両方をコンパクトに表現する,ポイントベースコントゥール・ポース表現を提案する。
さらに、この斬新な表現を活用するために、GaitContourと呼ばれるローカル・グローバル・アーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:37:22 GMT)
LoLI-Street: Benchmarking Low-Light Image Enhancement and Beyond [37.5] 先進都市における街路シーンの低照度画像と高露光画像が33k対のLoLI-Street(Low-Light Images of Streets)を新たに導入した。
LoLI-Streetデータセットはまた、実環境下でLLIEモデルをテストするための1,000の実際の低照度テストイメージも備えている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:11:56 GMT)
"In Dialogues We Learn": Towards Personalized Dialogue Without Pre-defined Profiles through In-Dialogue Learning [37.3] In-Dialogue Learning (IDL) は、対話履歴を利用してペルソナを特徴づける、事前訓練された大規模言語モデルの能力を高めるための微調整フレームワークである。
3つのデータセットに対する実験により,IDLはBLEUとROUGEのスコアを最大200%,ROUGEは247%向上した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:06:39 GMT)
LIME: Less Is More for MLLM Evaluation [36.3] 半自動パイプラインによるベンチマークであるLIME(Less Is More for MLLM Evaluation)を提案する。
このパイプラインは、非形式的なサンプルをフィルタリングし、イメージベースの理解を必要とするタスクに集中することで、回答のリークを取り除く。
実験の結果,LIMEはサンプル数を76%減らし,評価時間を77%減らした。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:11:26 GMT)
Can In-context Learning Really Generalize to Out-of-distribution Tasks? [36.1] 本研究は,訓練中に遭遇したことのないアウト・オブ・ディストリビューション(OOD)課題に対する,イン・コンテクスト・ラーニング(ICL)のメカニズムについて検討した。
我々は、トランスフォーマーがICLを通してOODタスク機能を学ぶのに苦労していることを明らかにする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:10:26 GMT)
Building Flexible Machine Learning Models for Scientific Computing at Scale [35.4] OmniArchは,物理アライメントによるマルチスケール・マルチ物理科学計算問題の解決を目的とした,最初のプロトタイプである。
PDEBench上で1D-2D-3Dの統合事前トレーニングを行い、1D, 2D, 3D PDEの新たなパフォーマンスベンチマークを設定するだけでなく、コンテキスト内およびゼロショット学習アプローチによる新しい物理への例外的な適応性を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:54:14 GMT)
Towards Homogeneous Lexical Tone Decoding from Heterogeneous Intracranial Recordings [35.1] 神経表現のためのホモジニティ・ヘテロジニティ・ディサンタングルド・ラーニング(H2DiLR)は、複数の被験者の頭蓋内記録から同質性と異質性の両方を歪め、学習する新しいフレームワークである。
広汎な実験により、H2DiLRは統一復号法として従来の異種復号法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:09:12 GMT)
ViGoR: Improving Visual Grounding of Large Vision Language Models with Fine-Grained Reward Modeling [35.1] 大型視覚言語モデル(LVLM)は前例のない視覚推論能力を示している。
生成されたテキストは、しばしば視覚入力の不正確な接地に悩まされ、既存のシーン要素の幻覚などのエラーが発生する。
そこで我々は,LVLMの視覚的接地性を高めるために,微粒な報酬モデルを用いた新しいフレームワークViGoRを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:06:12 GMT)
TapWeight: Reweighting Pretraining Objectives for Task-Adaptive Pretraining [34.9] TapWeightはタスク適応型事前学習フレームワークで、各事前学習対象の最適な重要性を自動的に決定する。
我々はTapWeightを分子特性予測と自然言語理解タスクの両方に適用し,ベースライン法をはるかに上回った。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:56:13 GMT)
Simultaneous Computation and Memory Efficient Zeroth-Order Optimizer for Fine-Tuning Large Language Models [33.9] 微調整は、大きな言語モデルを下流タスクに適応させるには強力だが、多くの場合、大きなメモリ使用量をもたらす。
有望なアプローチはゼロ階勾配 (ZO) を使うことであり、これは第一階勾配 (FO) を置き換えると見積もられている。
本稿では,レイヤワイドスパース計算とメモリ効率の高いZO,LeZOを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:47:37 GMT)
Fine-Tuning is Fine, if Calibrated [33.4] 事前訓練されたモデルの微調整は、以前に学習した他のクラスにおいて、モデルの精度を劇的に低下させることが示されている。
本論文は,「微調整モデルで損傷を受けたものは何か?」という根本的な疑問に答えることを目的として,この問題を体系的に識別する。
微調整されたモデルは、他のクラス間の関係を忘れたり、これらのクラスを認識するために機能を劣化させたりしない。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:07:33 GMT)
Fine-Tuning is Fine, if Calibrated [33.4] 事前訓練されたモデルの微調整は、以前に学習した他のクラスにおいて、モデルの精度を劇的に低下させることが示されている。
本論文は,「微調整モデルで損傷を受けたものは何か?」という根本的な疑問に答えることを目的として,この問題を体系的に識別する。
微調整されたモデルは、他のクラス間の関係を忘れたり、これらのクラスを認識するために機能を劣化させたりしない。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:07:33 GMT)
ELF-Gym: Evaluating Large Language Models Generated Features for Tabular Prediction [33.0] 大規模言語モデル(LLM)を評価するためのフレームワークであるELF-Gymを提案する。
私たちは、トップパフォーマンスチームによって使用される251の"ゴールド"機能を含む、歴史的なKaggleコンペティションから、新たなデータセットをキュレートしました。
ベストケースのシナリオでは、LLMがゴールデン機能の約56%を意味的にキャプチャできるが、より要求の高い実装レベルでは、オーバーラップは13%に減少する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:59:33 GMT)
DFIMat: Decoupled Flexible Interactive Matting in Multi-Person Scenarios [32.8] 本稿では,フレキシブル・インタラクティブ・マッティングを実現する非結合型フレームワークDFIMatを提案する。
具体的には、まず、シーンの意味やフレキシブルなユーザ入力を理解してターゲットインスタンスをローカライズし、インスタンスレベルのマッチングの洗練を行う。
サブタスクを学習し易くし、柔軟なマルチタイプ入力により効率と効率がさらに向上するので、デカップリングによる明らかなパフォーマンス向上が観察できる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:02:58 GMT)
Text4Seg: Reimagining Image Segmentation as Text Generation [32.2] 画像分割をテキスト生成問題として用いた新しいテキスト・アズ・マスクパラダイムであるText4Segを紹介する。
セマンティックディスクリプタは、各イメージパッチを対応するテキストラベルにマッピングするセグメンテーションマスクの新しいテキスト表現である。
MLLMのバックボーンを微調整することで,Text4Segが複数のデータセット上で最先端のパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:28:16 GMT)
Blind-Match: Efficient Homomorphic Encryption-Based 1:N Matching for Privacy-Preserving Biometric Identification [31.5] Blind-Matchは、ホモモルフィック暗号(HE)を利用して、1:Nマッチングを効率よく保存する新しい生体認証システムである。
Blind-Matchは、さまざまなバイオメトリックデータセットにわたる最先端の手法と比較して、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:08:27 GMT)
Flying Quadrotors in Tight Formations using Learning-based Model Predictive Control [30.7] 本研究では、第一原理モデリングとデータ駆動アプローチの利点を組み合わせたフレームワークを提案する。
このモデルを新しい学習ベースの予測モデル制御フレームワークに組み込むことで、性能が大幅に向上することを示す。
また,本フレームワークは,46秒の飛行データのみを用いて,例外的なサンプル効率を実現している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:03:16 GMT)
Learning Pattern-Specific Experts for Time Series Forecasting Under Patch-level Distribution Shift [30.6] 時系列予測は、過去のデータに基づいて将来の価値を予測することを目的としている。
実世界の時間はしばしば、季節、動作条件、意味的な意味など、セグメントごとに異なるパターンを持つ複雑な非一様分布を示す。
本稿では,より正確で適応可能な時系列予測のために,パターン特化の専門家を活用した新しいアーキテクチャbftextSを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:35:29 GMT)
An Adaptive Approach for Infinitely Many-armed Bandits under Generalized Rotting Constraints [29.6] 本研究では、休息状態において、アームの平均報酬が各プルで減少する可能性があるが、そうでなければ変化しない、無限に多くの武器を持つバンディット問題を考察する。
本稿では,ゆがみ報酬に起因するバイアスや分散トレードオフを管理するために,適応的なスライディングウィンドウを備えたUTBを利用するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:32:54 GMT)
Safety-Aware Fine-Tuning of Large Language Models [29.6] 細調整された大規模言語モデル(LLM)は、個々のニーズや好みに合わせてモデルを調整するための一般的なプラクティスとして現れています。
本稿では,有害な可能性のあるデータを自動検出・除去する,新たなSAFT(Safety-Aware Fine-Tuning)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:24:25 GMT)
Towards Stable, Globally Expressive Graph Representations with Laplacian Eigenvectors [29.1] 本稿では,ラプラシアン固有ベクトルを用いて,安定かつグローバルに表現可能なグラフ表現を生成する手法を提案する。
提案手法は, 数値的近接固有値を円滑に処理し, 摂動に対するロバスト性を向上する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:02:25 GMT)
AM-SAM: Automated Prompting and Mask Calibration for Segment Anything Model [28.3] AM-SAMと呼ばれる自動プロンプトとマスクの校正手法を提案する。
提案手法は入力画像のプロンプトを自動生成し,早期訓練における人的関与の必要性を解消する。
実験の結果,AM-SAMは,人為的および既定のプロンプトの有効性,マッチング,あるいは超越した精度のセグメンテーションを達成できた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:47:20 GMT)
GALA: Geometry-Aware Local Adaptive Grids for Detailed 3D Generation [28.3] GALAは複雑な幾何学や表面の細部を捉え再現する3次元形状の斬新な表現である。
最適化されたC++/CUDA実装では、GALAをオブジェクトに10秒以内で適用することができます。
幾何学的なディテールで3次元形状を生成することができるカスケード生成パイプラインを提供する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:53:58 GMT)
Prioritize Alignment in Dataset Distillation [27.7] 既存の方法はエージェントモデルを使用して、ターゲットデータセットから情報を抽出し、蒸留データセットに埋め込む。
既存の手法では,情報抽出と埋め込みの両方の段階において,不整合情報を導入している。
本稿では、以下の2つの視点から情報を整列するデータセット蒸留(PAD)における優先順位付けアライメントを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:24:53 GMT)
Improving Probabilistic Diffusion Models With Optimal Covariance Matching [27.3] 対角的共分散を学習するための新しい手法を提案する。
提案手法は,拡散モデルと潜伏拡散モデルの両方のサンプリング効率,リコール率,および可能性を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:08:37 GMT)
The Roles of Contextual Semantic Relevance Metrics in Human Visual Processing [27.2] 本研究では,文脈意味的関連性の指標を紹介する。
対象オブジェクトとその周辺環境間の意味的関係を視覚的・言語的両面から評価する。
我々は、最先端のディープラーニング技術を用いて、これらのメトリクスを計算し、人間の視覚処理に対する修正措置への影響を分析する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:05:47 GMT)
Differential contributions of machine learning and statistical analysis to language and cognitive sciences [27.2] 本研究では、Buckeye Speech Corpusを用いて、機械学習と統計分析がデータ駆動型研究にどのように適用されているかを説明する。
それぞれのアプローチの理論的相違、実装手順、ユニークな目的を実証する。
この研究は、対象語に対する文脈的影響を測定する新しい尺度である意味的関連性が、発話中の単語の持続時間を理解するのにどのように貢献するかを強調した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:06:29 GMT)
Compressing Scene Dynamics: A Generative Approach [26.8] 本稿では,生成ビデオ圧縮のための映像コンテンツではなく,動きパターンから生成先行を学習することを提案する。
前者は風に揺れる木や海に浮かぶボートなど、一般的な場面における小さな動きのダイナミクスから派生したものである。
超低ビットレート通信と多様なシーンコンテンツのための高品質な再構成を実現するために、新しい生成シーンダイナミックス圧縮フレームワークを構築した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:54:02 GMT)
ECIS-VQG: Generation of Entity-centric Information-seeking Questions from Videos [26.7] 我々は、ビデオからエンティティ中心の情報検索の質問を生成することに重点を置いている。
我々の研究は、質問に値する情報を識別し、エンティティにリンクし、マルチモーダル信号を有効に活用する、という3つの重要な課題に対処する。
われわれは、YouTubeビデオの多様なデータセットであるVideoQuestionsに、2265の注釈付き質問を含む411の動画を投稿している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:33:16 GMT)
NARAIM: Native Aspect Ratio Autoregressive Image Models [26.3] NARAIMは自己回帰的対象を事前学習した視覚モデルである。
ネイティブアスペクト比を維持することにより、元の空間的コンテキストを保存し、視覚情報を解釈するモデルの能力を高める。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:13:48 GMT)
Beyond Scalar Reward Model: Learning Generative Judge from Preference Data [26.2] 嗜好フィードバックから学ぶことは、大きな言語モデル(LLM)を人間の価値と整合させる一般的なプラクティスである。
Scalarモデルは解釈可能性に欠けており、データセットのバイアスの影響を受けやすいことが知られている。
本稿では,LLMの生成能力を利用して,両方の制約を1ショットで処理する手法について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:21:29 GMT)
Beyond Scalar Reward Model: Learning Generative Judge from Preference Data [26.2] 嗜好フィードバックから学ぶことは、大きな言語モデル(LLM)を人間の価値と整合させる一般的なプラクティスである。
Scalarモデルは解釈可能性に欠けており、データセットのバイアスの影響を受けやすいことが知られている。
本稿では,LLMの生成能力を利用して,両方の制約を1ショットで処理する手法について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:21:29 GMT)
Towards Robust and Cost-Efficient Knowledge Unlearning for Large Language Models [25.9] 大規模言語モデル(LLM)は、大量のテキストコーパスの事前学習を通じて、強い推論と記憶能力を示す。
これはプライバシーと著作権侵害のリスクを生じさせ、効率的な機械学習手法の必要性を強調している。
LLMのための堅牢で効率的なアンラーニングのための2つの新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:03:38 GMT)
Understanding Robustness of Parameter-Efficient Tuning for Image Classification [25.6] 非効率チューニング(PET)技術は、事前学習されたモデルを凍結し、少数の学習可能なパラメータを導入することにより、下流タスクにおけるモデルの予測を調整する。
多くのPET法が提案されているが、その堅牢性は十分には研究されていない。
ホワイトボックス攻撃と情報摂動の両方による4つの古典的PET技術の堅牢性について,系統的に検討した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:03:00 GMT)
Predicting Molecular Ground-State Conformation via Conformation Optimization [24.2] 本稿では,分子基底状態のコンフォーメーションをコンフォーメーション最適化の観点から予測するConfOptという新しいフレームワークを提案する。
トレーニング中、ConfOptは予測された原子3D座標と対応する原子間距離を同時に最適化し、強い予測モデルを生み出した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:48:22 GMT)
LatentKeypointGAN: Controlling Images via Latent Keypoints [23.7] 古典的なGAN目標に対して,2段階のGAN訓練を施したエンドツーエンドであるLatntKeypointGANを紹介する。
LatentKeypointGANは、生成されたイメージの再配列に使用できる解釈可能な潜在空間を提供する。
さらに、キーポイントとマッチング画像の明示的な生成により、教師なしキーポイント検出のための新しいGANベースの方法が可能になる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:57:19 GMT)
Neural Solver Selection for Combinatorial Optimization [23.4] 本稿では,特徴抽出,選択モデル,選択戦略を含むニューラルソルバのコーディネートを行うための,最初の汎用フレームワークを提案する。
提案するフレームワークは,インスタンスを効果的に分散し,結果として得られる複合解法により性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:05:41 GMT)
Stability and Sharper Risk Bounds with Convergence Rate $O(1/n^2)$ [23.4] 最も鋭い高確率過剰リスク境界は、経験的リスク最小化とアルゴリズム安定性による投射降下のために最大$Oleft(1/nright)$である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:50:47 GMT)
Magnituder Layers for Implicit Neural Representations in 3D [23.1] 我々は、"magnituder"と呼ばれる新しいニューラルネットワーク層を導入する。
標準フィードフォワード層にマグニチュードを組み込むことで、推論速度と適応性を向上する。
我々のアプローチは、訓練された暗黙的ニューラル表現モデルにおいてゼロショットのパフォーマンス向上を可能にする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:06:41 GMT)
Taming Overconfidence in LLMs: Reward Calibration in RLHF [23.0] 我々は、RLHFが、モデルが自身の反応において言語化された過信を表現することを示している。
PPO-M: PPO with Calibrated Reward Modeling と PPO-C: PPO with Calibrated Reward calculation の2種類を提案する。
実験の結果,両手法はキャリブレーション誤差を低減し,標準PPOに匹敵する性能を維持することができることがわかった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:48:40 GMT)
Retrieval Instead of Fine-tuning: A Retrieval-based Parameter Ensemble for Zero-shot Learning [22.7] Retrievalをベースとする。
Ensemble (RPE) - ベクトル化されたデータベースを作成する新しい方法。
Low-Rank Adaptations (LoRA)
RPEは、広範囲なトレーニングの必要性を最小限に抑え、ラベル付きデータの要求を排除し、特にゼロショット学習に有効である。
RPEは、生のデータにアクセスせずにモデルパラメータを変更するため、ヘルスケアのようなプライバシに敏感なドメインに適している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:28:38 GMT)
HypomimiaCoach: An AU-based Digital Therapy System for Hypomimia Detection & Rehabilitation with Parkinson's Disease [22.6] hypomimaCoachは、パーキンソン病の低酸素症検出とリハビリテーションのためのアクションユニットベースのデジタルセラピーシステムである。
hypomimaCoachシステムは、緩和および制御されたリハビリテーション演習の実施を通じて、エンゲージメントを促進するように設計された。
中国で7人の参加者とともにパイロット実験が行われ、全員がパーキンソン病の低血症の症状を示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:09:42 GMT)
Two-Stage Human Verification using HandCAPTCHA and Anti-Spoofed Finger Biometrics with Feature Selection [22.5] 本稿では、攻撃の脆弱性を克服し、セキュリティを高めるために、2つの独立した段階における人間による検証手法を提案する。
第1段階では、手動画像に基づくCAPTCHA(HandCAPTCHA)が自動ボット攻撃を回避するためにテストされる。
次の段階では、ランダムなHandCAPTCHAチャレンジをパスした人の実手画像を用いて、提示攻撃検出(PAD)を用いて、正当なユーザの指生体認証を行う。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:02:21 GMT)
Statistical Inference with Limited Memory: A Survey [22.4] いくつかの標準問題において,メモリ制約下での統計的推論の現状を概観する。
本稿では,この開発分野の主な成果について論じるとともに,再帰的なテーマを同定することにより,アルゴリズム構築のための基本的な構成要素を抽出する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:26:39 GMT)
Weighted variation spaces and approximation by shallow ReLU networks [21.9] 境界領域$Omegasubset mathbbRd$ 上の関数 $f$ を、幅$n$ の単層 ReLU ニューラルネットワークの出力によって近似する。
この形式のNNAには、入力次元で近似率が成長しない$Omega$上の新しいモデルの関数クラスを導入する、いくつかの有名な近似結果がある。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:36:08 GMT)
Agentic Information Retrieval [21.7] 本稿では,大規模言語モデル(LLM)の能力によって形成される新しいIRパラダイムであるエージェント情報検索(Agentic IR)を紹介する。
本稿ではエージェントIRの3種類の最先端応用とその課題について論じる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:45:24 GMT)
Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective [21.4] 本稿では,SVDを用いた軽量刈り込みによりICL性能が向上するエキサイティングな現象を示す。
ICL推論の高速化のために,下流タスクのための単純,モデル圧縮,微分自由なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:19:58 GMT)
Streamlining Redundant Layers to Compress Large Language Models [21.3] 本稿では,LLM-Streamlineについて紹介する。
LLM-Streamlineは2つの部分から構成される: 層プルーニング(Layer pruning)は、ターゲットの間隔に基づいて最も重要でない連続的な層を除去する。
実験により, LLM-Streamlineは, 性能および訓練効率の両面において, 先行および同時のプルーニング法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:30:01 GMT)
Learning to Rank for Multiple Retrieval-Augmented Models through Iterative Utility Maximization [21.1] 本稿では,複数検索拡張世代(RAG)エージェントを対象とした統合検索エンジンの設計について検討する。
本稿では,これらのRAGエージェントの検索結果を検索エンジンが生成し,オフラインで検索した文書の品質に関するフィードバックを収集する反復的手法を提案する。
我々は、このアプローチをオンライン環境に適応させ、リアルタイムな個別エージェントのフィードバックに基づいて、検索エンジンがその振る舞いを洗練できるようにする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:53:50 GMT)
Generating Driving Simulations via Conversation [20.8] 所望のシナリオと車両動作の合成において,非コーディング領域の専門家を支援するために,自然言語インタフェースを設計する。
非常に小さなトレーニングデータセットにもかかわらず、発話をシンボルプログラムに変換するのにそれを使うことは可能であることを示す。
人間の実験により、対話はシミュレーション生成の成功に不可欠であることが示され、拡張された会話に関わらず、世代よりも4.5倍の成功率が得られる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:07:31 GMT)
Collu-Bench: A Benchmark for Predicting Language Model Hallucinations in Code [20.7] 大規模言語モデル(LLM)のコード幻覚を予測するベンチマークであるColru-Benchを紹介する。
Collu-Benchには、オープンソースモデルから商用モデルまで、5つのデータセットから収集された13,234のコード幻覚インスタンスと11のさまざまなLSMが含まれている。
我々は、従来の機械学習技術とニューラルネットワークの両方を用いて、Colru-Benchの幻覚を予測する実験を行い、22.03 -- 33.15%の精度を達成した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:41:47 GMT)
Fusion Based Hand Geometry Recognition Using Dempster-Shafer Theory [20.6] 本稿では,両手の幾何学的特徴の融合に基づく人物認識のための新しい手法を提案する。
確率に基づく2つのアルゴリズムを分類するために提案する。
正解率は99.5%、偽受容率(FAR)は0.625%である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:44:57 GMT)
Creating and controlling global Greenberger-Horne-Zeilinger entanglement on quantum processors [20.3] Greenberger-Horne-Zeilinger (GHZ) は量子物理学の基礎において重要な役割を果たす。
本稿では,大規模GHZエンタングルメントの生成,保存,操作に関する一般的な戦略を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:36:11 GMT)
GSDF: 3DGS Meets SDF for Improved Rendering and Reconstruction [20.2] フレキシブルで効率的な3次元ガウス分割表現とニューラルサイン付き距離場(SDF)の利点を組み合わせた新しいデュアルブランチアーキテクチャを提案する。
我々のデザインがより正確で詳細な表面再構成の可能性を解き放つ多様なシーンを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:52:00 GMT)
'Quis custodiet ipsos custodes?' Who will watch the watchmen? On Detecting AI-generated peer-reviews [20.0] AIが生成したテキストが、ピアレビューを含む科学出版を損なうのではないかという懸念が高まっている。
本稿では,AIが頻繁にトークンを繰り返すことを示唆するTF(Term Frequency)モデルと,ChatGPTが再プロンプト時に同様の出力を生成するという考え方に基づくRR(Review Regeneration)モデルを紹介する。
以上の結果から,提案手法は,他のAIテキスト検出方法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:06:08 GMT)
Variational Diffusion Posterior Sampling with Midpoint Guidance [19.4] State-of-the-artアプローチは、後部をターゲットとする代理拡散モデルからサンプリングする問題として問題を定式化する。
前者は事前学習した拡散モデルのスコアに置き換えられるが、誘導項は推定する必要がある。
線形および非線形逆問題に対する広範な実験を通じて提案手法を検証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:03:53 GMT)
ChroKnowledge: Unveiling Chronological Knowledge of Language Models in Multiple Domains [19.4] 提案するChroKnowledgeは,大規模言語モデルの非パラメトリック時系列知識を評価・更新するための新しいサンプリングベースフレームワークである。
我々のフレームワークは、生物医学領域と一般領域の両方において、タイムライン全体にわたる全体的な知識の更新に成功した。
我々は,ChroKnowPromptの時間的特性に基づく包括的分析を行い,本質的な時間的知識を引き出すための様々なモデルの可能性を検証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:08:49 GMT)
MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations [19.2] 我々は,人間-ロボットインタラクション(HRI)のための共有潜在空間表現学習のための新しいアプローチを提案する。
本研究では,情報的潜在空間を用いて,ロボットの動きを正規化するための変分オートエンコーダ(VAE)を訓練する。
VAEにおける人間の観察に先立って情報的MDNを使用するアプローチは,より正確なロボットの動きを生成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:57:40 GMT)
A Quantum Circuit-Based Compression Perspective for Parameter-Efficient Learning [19.2] 量子パラメータ生成の枠組みに量子s適応(QPA)を導入する。
QPAはQNNと古典的な多層パーセプトロンマッピングモデルを統合し、微調整のためのパラメータを生成する。
Gemma-2とGPT-2をケーススタディとして、QPAはパラメータ効率のよい微調整法に対して重要なパラメータ還元を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:09:29 GMT)
CR-CTC: Consistency regularization on CTC for improved speech recognition [19.0] Connectionist Temporal Classification (CTC) は自動音声認識(ASR)の手法として広く使われている。
しかし、CTCとアテンションベースのエンコーダデコーダ(CTC/AED)を組み合わせたトランスデューサやシステムと比較すると、認識性能に劣ることが多い。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:35:04 GMT)
CR-CTC: Consistency regularization on CTC for improved speech recognition [19.0] Connectionist Temporal Classification (CTC) は自動音声認識(ASR)の手法として広く使われている。
しかし、CTCとアテンションベースのエンコーダデコーダ(CTC/AED)を組み合わせたトランスデューサやシステムと比較すると、認識性能に劣ることが多い。
本稿では,入力音声メルスペクトルの異なる拡張ビューから得られた2つのCTC分布間の整合性を実現するConsistency-Regularized CTC (CR-CTC)を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:35:04 GMT)
EHI: End-to-end Learning of Hierarchical Index for Efficient Dense Retrieval [18.2] EHI(End-to-end Hierarchical Indexing)は埋め込み型検索の新しい手法である。
EHIは、MS MARCO (Dev) の MRR@10 で +1.45% 、TREC DL19 の nDCG@10 で +8.2% で、既存の最先端の手法より優れている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:49:45 GMT)
A Holistic Weakly Supervised Approach for Liver Tumor Segmentation with Clinical Knowledge-Informed Label Smoothing [17.8] 肝がんは世界中で死亡率の高い原因である。
ディープラーニングは、自動肝セグメンテーションを約束している。
これらの課題に対処する新しい全体的弱教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:52:25 GMT)
Deflated HeteroPCA: Overcoming the curse of ill-conditioning in heteroskedastic PCA [17.8] 本稿では,汚染されたデータからmathbbRn_1times n$の低ランク行列$boldsymbolXstarの列部分空間を推定することに関心がある。
信号-雑音比 (SNR) の広帯域化を図りながら, 最適な統計的精度を得る方法は困難である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:58:36 GMT)
Transformers as Game Players: Provable In-context Game-playing Capabilities of Pre-trained Models [17.7] 近年,トランスフォーマーアーキテクチャに基づく事前学習モデルの文脈内学習能力への関心が高まっている。
本研究では,競争力のあるマルチエージェントゲームにおいて,事前学習したトランスフォーマーモデルのコンテキスト内学習能力について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:44:47 GMT)
M2M-Gen: A Multimodal Framework for Automated Background Music Generation in Japanese Manga Using Large Language Models [17.7] 入力マンガブックの背景音楽を生成する自動音楽生成パイプラインを提案する。
マンガにおける対話を用いてシーン境界を検出し、シーン内のキャラクターの顔を用いて感情分類を行う。
GPT 4oの別の例は、テキストを音楽モデルに導くためにページレベルの音楽キャプションを生成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:15:59 GMT)
Fine-Grained Embedding Dimension Optimization During Training for Recommender Systems [17.6] FIITEDは、FIne-fine In-Training Embedding Dimension Pruningを通じてメモリフットプリントを自動的に削減するシステムである。
FIITEDは,モデル品質を維持しつつ,DLRMの埋め込みサイズを65%以上削減できることを示す。
公開データセットでは、FIITEDはテーブルの埋め込みサイズを2.1倍から800倍に減らすことができる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:05:51 GMT)
EITNet: An IoT-Enhanced Framework for Real-Time Basketball Action Recognition [17.1] EITNetは、ディープラーニング、I3D時間オブジェクト抽出、時間解析のためのTimeSformerを組み合わせたフレームワークである。
私たちの貢献には、認識精度を92%向上する堅牢なアーキテクチャの開発が含まれています。
IoTテクノロジの統合は、リアルタイムデータ処理を強化し、プレイヤーのパフォーマンスと戦略に関する適応的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:21:15 GMT)
Inductive Conformal Prediction under Data Scarcity: Exploring the Impacts of Nonconformity Measures [16.9] 本研究は, 帰納的共形予測において, 有効性および効率性の観点から, 種々の非整合性尺度の性能を評価することを目的とする。
焦点は小さなデータセットであり、多くの現実世界のアプリケーションでは依然として一般的な設定である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:07:16 GMT)
Human Identification using Selected Features from Finger Geometric Profiles [16.9] 本稿では,非拘束環境における指の生体計測システムについて述べる。
正常化法は2手輪郭画像から変換された2手輪郭画像のサブトラクションに追従し、指形状の左側を生成する(LSFP)。
XORはLSFP画像と手輪郭画像に印加され、指プロファイルの右側(RSFP)を生成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:30:19 GMT)
FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models [16.7] 本稿では,FakeShieldの設計とIFDLタスクを提案する。
FakeShieldは、画像の信頼性を評価し、改ざんされた領域マスクを生成し、画素レベルおよび画像レベルの改ざんヒントに基づいた判断ベースを提供するマルチモーダルフレームワークである。
実験では、FakeShieldは様々な改ざん手法を効果的に検出し、ローカライズし、従来のIFDL法と比較して説明可能で優れた解を提供する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:15:56 GMT)
FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models [16.7] 本稿では,FakeShieldの設計とIFDLタスクを提案する。
FakeShieldは、画像の信頼性を評価し、改ざんされた領域マスクを生成し、画素レベルおよび画像レベルの改ざんヒントに基づいた判断ベースを提供するマルチモーダルフレームワークである。
実験では、FakeShieldは様々な改ざん手法を効果的に検出し、ローカライズし、従来のIFDL法と比較して説明可能で優れた解を提供する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:15:56 GMT)
Task Adaptive Feature Distribution Based Network for Few-shot Fine-grained Target Classification [16.6] タスク適応型特徴分散ネットワークであるTAFD-Netを提案する。
タスクレベルのニュアンスをキャプチャするための組み込みのためのタスク適応コンポーネント、クエリサンプルとサポートカテゴリ間の特徴分布の類似性を計算するための非対称メトリック、パフォーマンスを高めるための対照的な測定戦略を備えている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:56:09 GMT)
Enhancing Peer Review in Astronomy: A Machine Learning and Optimization Approach to Reviewer Assignments for ALMA [16.5] 本稿では,レビュアーに提案を割り当てるための機械学習と最適化手法の展開と評価について述べる。
提案トピックを特定し,過去のALMA提案に基づいてレビュアーの専門知識を評価する。
重大なミスマッチのために再割り当てを必要としなかったため、手作業で3日から5日間の節約が図られた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:06:00 GMT)
Flamingo: Multi-Round Single-Server Secure Aggregation with Applications to Private Federated Learning [16.5] Flamingoは、大規模なクライアント間でデータをセキュアに集約するシステムである。
Flamingoを実装し評価し、(拡張)MNISTとCIFAR-100データセット上でニューラルネットワークをセキュアにトレーニングできることを示します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:53:20 GMT)
How Far Can We Extract Diverse Perspectives from Large Language Models? [16.2] 大規模言語モデル(LLM)が主観的トピックに対する多様な視点を生成できることを示す。
本稿では,様々な意見の根拠となる基準に基づくプロンプト手法を提案する。
本手法は,タスク主観性の度合いに応じて,LLMが多種多様な意見を生成可能であることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:49:44 GMT)
Evaluating Gender Bias of LLMs in Making Morality Judgements [16.0] 本研究は,現在かつオープンソースであるLarge Language Models (LLMs) がジェンダーバイアスを持つかどうかを考察する。
これらのモデルを評価するために、新しいデータセットGenMO(Gender-bias in Morality Opinions)をキュレートし、導入する。
GPTファミリー(GPT-3.5-turbo, GPT-3.5-turbo-instruct, GPT-4-turbo)、Llama 3および3.1ファミリー(8B/70B)、Mistral-7BおよびClaude 3ファミリー(SonnetとOpus)からモデルをテストする。
GPTは68-85%の症例に偏りを示し、Llama 3は周囲に偏っている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:19:11 GMT)
Personalized Large Language Model Assistant with Evolving Conditional Memory [15.8] 条件記憶を進化させる大規模言語モデルアシスタントをパーソナライズするためのプラグイン・アンド・プレイフレームワークを提案する。
パーソナライズされたアシスタントは、ユーザとの履歴対話から知識と経験をインテリジェントに保存することに焦点を当てる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:34:41 GMT)
A Mixed-Language Multi-Document News Summarization Dataset and a Graphs-Based Extract-Generate Model [15.6] 現実のシナリオでは、国際イベントに関するニュースは、しばしば異なる言語で複数のドキュメントを含む。
混合言語多文書ニュース要約データセット(MLMD-news)を構築する。
このデータセットには、4つの異なる言語、10,992のソースドキュメントクラスタとターゲット要約ペアが含まれている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:15:33 GMT)
FedECADO: A Dynamical System Model of Federated Learning [15.4] フェデレーション学習は分散最適化の力を活用して、別々のクライアント間で統一された機械学習モデルをトレーニングする。
本研究は,フェデレート学習プロセスの動的システム表現にインスパイアされた新しいアルゴリズムであるFedECADOを提案する。
FedProxやFedNovaといった著名な技術と比較して、FedECADOは多くの異種シナリオにおいて高い分類精度を達成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:26:43 GMT)
S$^4$ST: A Strong, Self-transferable, faSt, and Simple Scale Transformation for Transferable Targeted Attack [15.3] ディープニューラルネットワークに対するTTA(Transferable Targeted Adversarial attacks)は、標的外攻撃よりもはるかに難しいことが証明されている。
本報告では, 簡易勾配ベースラインを利用した高効率かつ転送可能なターゲットアタックについて, 新たな光を当てる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:39:13 GMT)
A Simpler Alternative to Variational Regularized Counterfactual Risk Minimization [15.3] 本稿では,f$-GAN に基づく下界ではなく,f-divergence の直接近似を最小化することで,f-divergence 最適化の新たな選択肢を提案する。
実験の結果,$f$-GANを用いた分散の最小化は期待通りには機能しないことがわかった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:46:49 GMT)
MoIN: Mixture of Introvert Experts to Upcycle an LLM [15.2] 本稿では,フルモデルの事前学習を継続することなく,既存の大規模言語モデルを改善することを目的とする。
このアイデアは、事前学習データを意味のあるグループに分割し、各サブセットで専門家を訓練する。
推論中、入力されたクエリは、最初に最も関連する専門家にルーティングされ、その後、フォワードパスのためにベースモデルにロードされる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 01:11:04 GMT)
Control the GNN: Utilizing Neural Controller with Lyapunov Stability for Test-Time Feature Reconstruction [15.1] グラフニューラルネットワーク(GNN)の性能は、トレーニングとサンプル分布のテストの相違の影響を受けやすい。
リアプノフ安定理論に基づく新しいノード特徴再構成法を提案する。
提案手法の有効性は,複数のデータセットにわたる広範な実験を通じて検証し,大幅な性能向上を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:34:19 GMT)
Weak-to-Strong Backdoor Attack for Large Language Models [15.1] 特徴アライメント強化知識蒸留(W2SAttack)に基づく新しいバックドア攻撃アルゴリズムを提案する。
我々は,W2SAttackが4つの言語モデル,4つのバックドアアタックアルゴリズム,および2つの異なる教師モデルのアーキテクチャの分類タスクにおいて優れていることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:33:20 GMT)
Backdoor Attacks for LLMs with Weak-To-Strong Knowledge Distillation [15.1] 特徴アライメント強化知識蒸留(W2SAttack)に基づく新しいバックドア攻撃アルゴリズムを提案する。
我々は,W2SAttackが4つの言語モデル,4つのバックドアアタックアルゴリズム,および2つの異なる教師モデルのアーキテクチャの分類タスクにおいて優れていることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:33:20 GMT)
Node-Time Conditional Prompt Learning In Dynamic Graphs [14.6] DYGPROMPTは動的グラフモデリングのための新しい事前学習および迅速な学習フレームワークである。
我々はノードと時間の特徴が相互に特徴付けることを認識し、下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:40:08 GMT)
LibEER: A Comprehensive Benchmark and Algorithm Library for EEG-based Emotion Recognition [14.6] 我々は,脳波に基づく感情認識における公平な比較のための総合ベンチマークとアルゴリズムライブラリであるLibEERを提案する。
LibEERは、標準化された実験環境を備えた統一評価フレームワークを確立し、10以上の代表的なディープラーニングベースのEERモデルの偏りのない評価を可能にする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:51:39 GMT)
Generalization of Compositional Tasks with Logical Specification via Implicit Planning [14.5] 論理仕様によって与えられる構成課題に対する一般化可能なポリシーを学習する問題について検討する。
サブゴールの依存関係と長いタスクの地平線により、従来の強化学習アルゴリズム(例えば、タスク条件とゴール条件のポリシー)は、依然として緩やかな収束とサブ最適性に悩まされている。
本稿では,合成タスクの効率的かつ最適な一般化のための階層的RLフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 00:57:10 GMT)
Occluded Human Pose Estimation based on Limb Joint Augmentation [14.4] そこで本研究では,人体におけるポーズ推定モデルの一般化能力を高めるために,手足関節拡張に基づく閉鎖型ポーズ推定フレームワークを提案する。
モデルの局所化能力を高めるために,手足グラフに基づく動的構造損失関数を構築し,閉塞した関節の分布を探索する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:48:24 GMT)
Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions [14.3] 本研究では, 気を散らす環境下での表現学習を容易にするための, 単純かつ効果的な補助タスクを提案する。
画像観察の課題関連成分は、先行知識と容易に識別できるという前提のもと、画像観察にセグメンテーションマスクを用いてタスク関連成分のみを識別する。
改良されたDeepMind Control Suite(DMC)とMeta-Worldタスクでは、SDは以前の作業よりもはるかに優れたサンプル効率と最終的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:24:07 GMT)
A Primer on the Inner Workings of Transformer-based Language Models [13.9] 先進言語モデルの内部動作の解釈を目的とした研究の急速な進歩は、この分野における長年の作業から得られた洞察を文脈的に理解する必要性を浮き彫りにした。
このプライマーは、トランスフォーマーベースの言語モデルの内部動作を解釈するために使われている現在の技術を紹介し、生成デコーダのみのアーキテクチャに焦点を当てている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:05:31 GMT)
AgentReview: Exploring Peer Review Dynamics with LLM Agents [13.8] 本稿では,最初の大規模言語モデル(LLM)に基づくピアレビューシミュレーションフレームワークであるAgentReviewを紹介する。
本研究は、レビュアーの偏見による紙の判断の37.1%の顕著な変化を含む、重要な洞察を明らかにした。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:43:06 GMT)
Statistical Test for Feature Selection Pipelines by Selective Inference [13.6] データ分析パイプラインは、生データを意味のある洞察に変換するステップの構造化されたシーケンスである。
本稿では,特徴選択問題におけるデータ解析パイプラインの重要性を評価するための新しい統計的テストを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:29:21 GMT)
AuthFace: Towards Authentic Blind Face Restoration with Face-oriented Generative Diffusion Prior [13.3] ブラインドフェイス修復(BFR)は、コンピュータビジョンにおける基本的な問題である。
最近の研究は、強力な事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルによる顔画像の先行性に依存している。
本稿では,顔指向生成拡散を先行して探索することにより,顔復元の精度を高めるAuthFaceを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:56:13 GMT)
3DS: Decomposed Difficulty Data Selection's Case Study on LLM Medical Domain Adaptation [13.1] 大きな言語モデルは一般的なタスクでは優れていますが、医療のような専門分野では苦労しています。
2段階モデル中心のデータ選択フレームワークDe Difficulty Data Selection (3DS)を提案する。
実世界の医療データセットに関する我々の実験は、既存の方法よりも5.29%以上の精度で3DSの方が優れていることを示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:29:00 GMT)
Elevator, Escalator or Neither? Classifying Pedestrian Conveyor State Using Inertial Navigation System [12.8] 歩行者のコンベア状態を知ることは、屋内ナビゲーションや人流管理といった多くの応用において、基本的なものである。
歩行者端末から採取した加速度計,ジャイロスコープ,磁力計のマルチモーダルINS(慣性ナビゲーションシステム)値から,歩行者のコンベア状態を初めて分類した。
歩行者がエレベーターやエスカレーターにいるかどうかを分類するための,新しい,効果的で軽量なINSベースのディープラーニング手法であるELESONを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:47:56 GMT)
Statistical Test for Auto Feature Engineering by Selective Inference [12.7] オートフィーチャーエンジニアリング(AFE)は、実用的な機械学習パイプラインの開発において重要な役割を果たす。
選択推論というフレームワークをベースとした,AFEアルゴリズムによる特徴量生成のための新しい統計的テストを提案する。
提案試験では, 生成した特徴の統計的意義を$p$-valuesの形で定量化し, 誤検出のリスクを理論的に保証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:26:51 GMT)
Lower-dimensional projections of cellular expression improves cell type classification from single-cell RNA sequencing [12.7] 単細胞RNAシークエンシング(scRNA-seq)は単細胞レベルでの細胞多様性の研究を可能にする。
細胞型分類には, 統計的, 機械的, 深層学習に基づく様々な手法が提案されている。
本研究では,EnProCellと呼ばれる細胞型分類のための参照型手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:01:38 GMT)
Gradient-Free Neural Network Training on the Edge [12.5] ニューラルネットワークのトレーニングは計算的に重く、エネルギー集約的である。
この研究は、勾配を必要とせずにニューラルネットワークをトレーニングするための新しいテクニックを提示している。
本研究では,各ニューロンの予測された分類に対する誤った寄与を同定することにより,勾配に基づく最適化手法を使わずにモデルを訓練することが可能であることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:38:39 GMT)
Facial recognition technology and human raters can predict political orientation from images of expressionless faces even when controlling for demographics and self-presentation [12.0] 実験室では, 表情, 顔の向き, 顔の向き, イメージ特性をコントロールしながら, 591人の被験者の顔画像の標準化を行った。
人間と顔認識アルゴリズムの両方が、政治的指向尺度で参加者のスコアを予測することができる。
標準化された画像からの政治的指向の予測可能性は、プライバシー、顔認識技術の規制、政治的指向の起源と結果の理解に重要な意味を持つ。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:54:21 GMT)
Less for More: Enhanced Feedback-aligned Mixed LLMs for Molecule Caption Generation and Fine-Grained NLI Evaluation [11.8] この作業は、最小限またはそれ以上のトレーニングを伴わずに、推論と評価能力を改善することで、そのようなモデルを強化する。
このような手法の動作と適合性に関する興味深い洞察を明らかにしながら、最先端のモデルを大幅に超えている。
そこで本研究では,未知の化学領域で使用するために,市販の自然言語推論(NLI)モデルを利用した新しい原子レベル評価手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:24:49 GMT)
Facial Width-to-Height Ratio Does Not Predict Self-Reported Behavioral Tendencies [11.6] 顔の幅と高さの比率(fWHR)は、様々な反社会的または暴力的な行動傾向と結びついている研究が増えている。
この研究は、137,163人の被験者を対象に、fWHRと行動傾向の関係を再検討した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:48:53 GMT)
Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale [11.4] 近年の強化学習(RL)と単純なアーキテクチャ変更が組み合わさって、ProcGenベンチマークの一般化が大幅に改善されている。
2次元の畳み込みレイヤを3次元の畳み込みレイヤに置き換え、レイヤ毎の畳み込みカーネル数をスケールアップする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:28:41 GMT)
S.T.A.R.-Track: Latent Motion Models for End-to-End 3D Object Tracking with Adaptive Spatio-Temporal Appearance Representations [10.5] トラッキング・バイ・アテンションのパラダイムに従って,3次元トラッキングのためのオブジェクト中心のトランスフォーマーベースのフレームワークを提案する。
そこで我々はS.T.A.R.-Trackを提案する。これは新しい潜伏運動モデル(LMM)を用いてオブジェクトクエリを調整し、潜伏空間における視方向や照明条件の変化を考慮に入れている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 09:39:56 GMT)
Meta-Reinforcement Learning with Universal Policy Adaptation: Provable Near-Optimality under All-task Optimum Comparator [9.9] 本稿では,メタRL(BO-MRL)の2段階最適化フレームワークを開発し,タスク固有のポリシー適応のためのメタプライヤを学習する。
提案手法の精度を実証的に検証し,提案アルゴリズムがベンチマークよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:17:58 GMT)
ChartKG: A Knowledge-Graph-Based Representation for Chart Images [9.8] 本稿では,グラフ画像の視覚的要素と意味的関係をモデル化可能な知識グラフ(KG)に基づくグラフ表現を提案する。
一連の画像処理技術を統合して視覚要素と関係を識別する。例えば、CNNはチャートを分類し、ヨロフ5、光学文字認識はチャートを解析する。
本稿では,知識グラフに基づく表現が,グラフの詳細な視覚的要素と意味的関係をどうモデル化できるかを示す4つの事例を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:38:44 GMT)
An Earth Rover dataset recorded at the ICRA@40 party [9.3] ICRAは2024年9月にロッテルダムで40周年を迎えた。
1ヶ月後、IROSカンファレンスが開催され、アースローバーチャレンジが予定されている。
提案では、ロッテルダムのアースローバーチャレンジで使用されたロボットでデータセットを記録する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:20:41 GMT)
Map-based Modular Approach for Zero-shot Embodied Question Answering [9.2] EQA(Embodied Question Answering)は、ロボットが新しい環境でナビゲートできる能力を評価するためのベンチマークタスクである。
本稿では,実世界のロボットが未知の環境を探索・地図化できるように,EQAに対するマップベースのモジュラーアプローチを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:56:37 GMT)
Provable In-Context Learning of Linear Systems and Linear Elliptic PDEs with Transformers [9.2] トランスフォーマーアーキテクチャを応用した自然言語処理の基礎モデルは、優れたコンテキスト内学習能力を示している。
線形楕円型PDEの族に付随する解演算子に適用した変換器ベースICLの厳密な誤差解析法を開発した。
分散シフトを経験する下流PDEタスクにおける事前学習された変換器の適応性を定量化する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:12:10 GMT)
Provable In-Context Learning of Linear Systems and Linear Elliptic PDEs with Transformers [9.2] トランスフォーマーアーキテクチャを応用した自然言語処理の基礎モデルは、優れたコンテキスト内学習能力を示している。
線形楕円型PDEの族に付随する解演算子に適用した変換器ベースICLの厳密な誤差解析法を開発した。
分散シフトを経験する下流PDEタスクにおける事前学習された変換器の適応性を定量化する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:12:10 GMT)
Point Cloud Novelty Detection Based on Latent Representations of a General Feature Extractor [9.1] 本稿では, 汎用クラウド特徴抽出器と一級分類器を併用した, 効率的な非教師なし3次元点雲ノベルティ検出手法を提案する。
従来の3次元座標空間の再構成誤差測定手法と比較して,形状情報を凝縮した潜在表現を利用する。
一般特徴抽出器は未知のカテゴリの形状特徴を抽出し,オートエンコーダの再学習の必要性を排除し,計算負担を軽減できることを確認した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:42:43 GMT)
Towards Reproducible Learning-based Compression [9.0] ディープラーニングシステムは通常、ハードウェアやソフトウェア実装の詳細に部分的に根ざした、保護の欠如に悩まされる。
本研究では, 深層学習が圧縮システムにどのように使われているのかを, 不再現性の問題として分析する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:13:00 GMT)
Local Attention Mechanism: Boosting the Transformer Architecture for Long-Sequence Time Series Forecasting [8.8] 局所注意機構 (LAM) は時系列解析に適した効率的な注意機構である。
LAMは時系列の連続性特性を利用して計算された注目点数を減少させる。
時間とメモリO(nlogn)で動作する代数テンソルにLAMを実装するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:45:51 GMT)
Local Attention Mechanism: Boosting the Transformer Architecture for Long-Sequence Time Series Forecasting [8.8] 局所注意機構 (LAM) は時系列解析に適した効率的な注意機構である。
LAMは時系列の連続性特性を利用して計算された注目点数を減少させる。
時間とメモリO(nlogn)で動作する代数テンソルにLAMを実装するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:45:51 GMT)
Provable Convergence and Limitations of Geometric Tempering for Langevin Dynamics [8.7] 幾何的テンパリングは、挑戦的な多モード確率分布からサンプリングする一般的なアプローチである。
本稿では,サンプリングアルゴリズムがランゲヴィン力学である場合のこのアプローチの音質について理論的に検討する。
以上の結果から,幾何的テンパリングは役に立たず,収束に有害である可能性が示唆された。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:24:31 GMT)
Real-time Fuel Leakage Detection via Online Change Point Detection [8.4] メモリベースオンライン変更点検出(MOCPD)と呼ばれる新しいフレームワークを提案する。
MOCPDは、ほぼリアルタイムで動作し、燃料漏れの早期検出を可能にする。
我々はMOCPDと一般的に使用されているオンライン変化点検出(CPD)のベースラインを比較した様々な実験を行った。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:22:13 GMT)
Expanding Search Space with Diverse Prompting Agents: An Efficient Sampling Approach for LLM Mathematical Reasoning [8.2] 大規模言語モデル(LLM)は、数学的推論を含む多くの複雑なタスクにおいて顕著な機能を示した。
従来のアプローチは、単一プロンプト方式における自己整合性の確保に大きく依存しており、多様な問題解決戦略の探索を制限している。
本研究では、数学的推論の領域内で異なるプロンプト法を実験的に解析することにより、これらの制限に対処する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:49:22 GMT)
Unsupervised Meta-Learning via Dynamic Head and Heterogeneous Task Construction for Few-Shot Classification [8.2] 教師なし不均一なタスク構成を持つ動的ヘッドメタ学習アルゴリズムDHM-UHTを提案する。
いくつかの教師なしゼロショットと少数ショットデータセットでは、DHM-UHTは最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:18:48 GMT)
Unsupervised Meta-Learning via Dynamic Head and Heterogeneous Task Construction for Few-Shot Classification [8.2] 教師なし不均一なタスク構成を持つ動的ヘッドメタ学習アルゴリズムDHM-UHTを提案する。
いくつかの教師なしゼロショットと少数ショットデータセットでは、DHM-UHTは最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:18:48 GMT)
Problem-Solving Guide: Predicting the Algorithm Tags and Difficulty for Competitive Programming Problems [8.0] ほとんどのテック企業は、Google、Meta、Amazonなど、アルゴリズムの問題を解決する能力を必要としている。
本研究は,アルゴリズムタグをエンジニアや開発者の有用なツールとして予測する作業に対処する。
また,この問題の解決に要する時間を計算するための有用なガイダンスとして,アルゴリズム問題の難易度を予測することを検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:29:06 GMT)
Several families of entanglement criteria for multipartite quantum systems based on generalized Wigner-Yanase skew information and variance [7.9] 本稿では,多部量子状態や高次元量子状態における絡み合いを検出するための絡み合い基準のいくつかのファミリを提案する。
絡み合い基準の組み合わせは、より強力な検出能力を有することを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 00:24:08 GMT)
Improving Academic Skills Assessment with NLP and Ensemble Learning [7.8] 本研究は,自然言語処理(NLP)の進歩を生かして基礎的学術的スキルを評価する上での課題について論じる。
提案手法は,BERT,RoBERTa,BART,DeBERTa,T5を含む複数の最先端NLPモデルを統合する。
この手法には、詳細なデータ前処理、特徴抽出、モデル性能を最適化するための擬似ラベル学習が含まれる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:04:47 GMT)
Cross-Lingual Transfer Learning for Speech Translation [7.8] 本稿では,制限データを用いた音声基礎モデルの音声翻訳機能の拡張について検討する。
Whisperは、音声認識と英訳に強い性能を持つ音声基礎モデルであり、その例として用いられる。
音声から音声への検索を用いて,エンコーダが生成した音声表現を分析し,異なる言語からの発話を共有意味空間にマッピングすることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:36:51 GMT)
Synthesizing Programmatic Reinforcement Learning Policies with Large Language Model Guided Search [7.8] LLM誘導検索フレームワーク(LLM-GS)について紹介する。
我々の重要な洞察は、LLMのプログラミングの専門知識と常識推論を活用して、仮定不要でランダムな探索手法の効率を高めることである。
本研究では,プログラム探索空間を効率的に探索し,一貫したプログラムを改善するための探索アルゴリズムであるSchduled Hill Climbingを開発した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:12:02 GMT)
Prompt Tuning for Audio Deepfake Detection: Computationally Efficient Test-time Domain Adaptation with Limited Target Dataset [7.5] オーディオディープフェイク検出(ADD)のためのテスト時間領域適応の検討
本稿では,プラグイン方式のプロンプトチューニングを用いたADD手法を提案する。
最先端のトランスフォーマーモデルとシームレスに統合することで、ドメインギャップをブリッジする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:07:35 GMT)
Large Model for Small Data: Foundation Model for Cross-Modal RF Human Activity Recognition [7.4] 我々は、RFベースのHARシステムを強化するために、視覚ベースのFMの知識を翻訳するクロスモーダルフレームワークであるFM-Fiを紹介する。
FM-Fiは、RFエンコーダがFMの解釈力を引き継ぐことができる新しいクロスモーダルコントラストな知識蒸留機構を含んでいる。
また、FMとRFの本質的な能力を利用して、2つのモード間のアライメントを改善するために外在的な特徴を取り除いている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:43:59 GMT)
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question Answering [7.3] S Large Language Models for Telecom Networks”は、Phi-2とFalcon-7Bの2つの小言語モデルの性能向上を目的としている。
ソリューションはPhi-2で81.9%、Falcon-7Bで57.3%の精度を達成した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:33:52 GMT)
Hardware-Efficient Quantum Random Access Memory Design with a Native Gate Set on Superconducting Platforms [7.3] 本稿では,超伝導プラットフォーム上でバケットブリガドQRAMを実装するためのハードウェア効率の良いネイティブゲートセットiSCZ,C-iSCZを提案する。
提案したゲートセットの実験的実現可能性を示し,高い忠実度と複雑さの低減を図った。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:59:43 GMT)
Federated Behavioural Planes: Explaining the Evolution of Client Behaviour in Federated Learning [6.6] FLシステムの力学を解析・可視化・説明するための新しい手法であるFBP(Federated Behavioural Planes)を紹介する。
我々の実験は、FBPがクライアントの進化状態を記述した情報トラジェクトリを提供することを示した。
我々は、悪意のあるクライアントモデルやノイズの多いクライアントモデルを検出するために、Federated Behavioural Shieldsという名前のロバストアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:40:29 GMT)
A Step Towards Mixture of Grader: Statistical Analysis of Existing Automatic Evaluation Metrics [6.6] 既存の評価指標の統計について検討し,その限界をよりよく理解する。
潜在的な解決策として、Mixture Of Graderが自動QA評価器の品質を向上する可能性について論じる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:10:42 GMT)
BGF-YOLO: Enhanced YOLOv8 with Multiscale Attentional Feature Fusion for Brain Tumor Detection [6.5] You Only Look Once (YOLO)ベースの物体検出器は、自動脳腫瘍検出に顕著な精度を示している。
両レベルのルーティングアテンション、一般化された特徴ピラミッドネットワーク、および第4検出ヘッドをYOLOv8に組み込むことにより、新しいBGF-YOLOアーキテクチャを開発する。
BGF-YOLOは、YOLOv8xと比較して4.7%のmAP$_50$を絶対的に増加させ、脳腫瘍検出データセットBr35Hの最先端を達成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:10:32 GMT)
Are KAN Effective for Identifying and Tracking Concept Drift in Time Series? [6.4] 本稿では,KAN(Kolmogorov-Arnold Networks)を時系列に紹介する。
WormKAN は Kan ベースの自動エンコーダで,共進化型時系列のコンセプトドリフトに対処する。
実験の結果, カンモデルとカンモデル(WormKAN)は, 時系列を意味のある概念に分割できることがわかった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:05:37 GMT)
Unified Framework for Histopathology Image Augmentation and Classification via Generative Models [6.4] 本稿では,データ生成とモデルトレーニングの段階を統一プロセスに統合する,革新的な統一フレームワークを提案する。
提案手法では、画像合成と分類の両方を同時に扱うために、純粋視覚変換器(ViT)ベースの条件付き生成適応ネットワーク(cGAN)モデルを用いる。
本実験により,我々の統合合成増強フレームワークは,病理組織像分類モデルの性能を一貫して向上させることが示された。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:59:08 GMT)
Large-Scale 3D Medical Image Pre-training with Geometric Context Priors [6.4] アノテーションの不足は、医用画像解析において重要な課題となっている。
大規模事前学習は有望なラベル効率のソリューションとして登場した。
医療用事前トレーニングデータセットのPreCT-160Kについて紹介する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:59:26 GMT)
Honest AI: Fine-Tuning "Small" Language Models to Say "I Don't Know", and Reducing Hallucination in RAG [6.3] 幻覚は、Large Language Models (LLM) の応用における重要な障害である
私たちは、幻覚を減らすために「私は知らない」と言うために「小さな」言語モデルを微調整する新しい戦略であるHonest AIを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:34:47 GMT)
EasyJudge: an Easy-to-use Tool for Comprehensive Response Evaluation of LLMs [6.2] 本稿では,重要な言語モデル応答を評価するために開発された EasyJudge を提案する。
軽量で、正確で、効率的で、ユーザフレンドリで、デプロイや使用が容易な、直感的な視覚化インターフェースを備えている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:24:12 GMT)
AttentionX: Exploiting Consensus Discrepancy In Attention from A Distributed Optimization Perspective [5.8] 本稿では,標準アテンションの出力更新圧縮にコンセンサスの不一致を組み込むために,アテンションXを提案する。
ViTおよびnanoGPTの実験は有望な性能を示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 09:32:21 GMT)
TextMaster: Universal Controllable Text Edit [5.7] 本研究では,任意のシナリオや画像領域において,テキストを高いリアリズムと適切なレイアウトで正確に編集できるTextMasterを提案する。
本手法では,トレーニングの指導として適応標準文字スペーシングを用い,テキスト位置やサイズ情報の漏洩を防止するために適応マスクブースティングを用いる。
テキスト編集領域に高解像度の標準フォント情報を注入し,知覚的損失を付与することにより,テキストのレンダリング精度と忠実度をさらに向上する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:39:39 GMT)
SlimSeiz: Efficient Channel-Adaptive Seizure Prediction Using a Mamba-Enhanced Network [5.5] 本稿では,軽量ニューラルネットワークモデルを用いた適応チャネル選択を利用したSlimSeizフレームワークを提案する。
SlimSeizは2つの状態で動作する。第1ステージは機械学習アルゴリズムを使用して、発作予測のための最適なチャネルセットを選択し、第2ステージは軽量ニューラルネットワークを使用する。
小児病院ボストン-MIT(CHB-MIT)のEEGデータセットでは、SlimSeizはチャンネルを22から8に減らし、94.8%の精度、95.5%の感度、94.0%の特異性を達成している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:43:01 GMT)
Understanding Deep Learning via Notions of Rank [5.4] この論文は、ディープラーニングの理論を発展させる鍵としてランクの概念を提唱している。
特に、勾配に基づくトレーニングは、いくつかのニューラルネットワークアーキテクチャにおいて、低ランクに対する暗黙の正規化を誘導できると確認する。
明示的な正規化スキームとデータ前処理アルゴリズムを設計するための我々の理論の実践的意味を述べる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:22:58 GMT)
A Neural Material Point Method for Particle-based Simulations [5.4] 本稿では,粒子シミュレーションのためのニューラルネットワークエミュレーションフレームワークNeuralMPMを提案する。
NeuralMPMは、ラグランジュ粒子を固定サイズグリッドに補間し、イメージ・ツー・イメージニューラルネットワークを使用してグリッドノードの更新を計算し、粒子に補間する。
流体力学や流体-固体相互作用など,いくつかのデータセット上でのNeuralMPMの利点を実証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:44:12 GMT)
Towards Open-World Grasping with Large Vision-Language Models [5.3] オープンワールドの把握システムは、高レベルの文脈と低レベルの物理幾何学的推論を組み合わせることができるべきである。
本稿では,視覚言語モデルとセグメンテーションとグルーピング合成モデルを組み合わせたオープンワールドグルーピングパイプラインOWGを提案する。
乱雑な屋内シーンデータセットを用いて,オープンエンド言語を基盤としたOWGのロバスト性を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:19:58 GMT)
DAS3D: Dual-modality Anomaly Synthesis for 3D Anomaly Detection [5.1] 本稿では3次元異常合成のための新しい2次元モード拡張法を提案する。
本稿では,再構成に基づく識別異常検出ネットワークを提案する。
提案手法は,検出精度において最先端の手法よりも優れ,競争力のあるセグメンテーション性能を実現する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:38:16 GMT)
QADL: Prototype of Quantum Architecture Description Language [5.0] 量子ソフトウェア(QSW)は量子力学の原理、特に量子ゲートを操作する量子ビット(量子ビット)をプログラミングして量子コンピューティングシステムを実装する。
QSWアーキテクチャのための仕様言語、設計空間、実行環境を提供するQADL(Quantum Architecture Language)を紹介します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:09:38 GMT)
Measuring Coherent Radio and Microwave Photons from the Solar Corona [5.0] 太陽大気中での励起放出から, 電波/マイクロ波N-ID光子状態 |N> の生成速度を推定した。
いくつかのケースでは、信号は検出可能であり、ノイズよりもはるかに上である、と我々は主張する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:29:29 GMT)
Measuring Coherent Radio and Microwave Photons from the Solar Corona [5.0] 太陽大気中での励起放出から, 電波/マイクロ波N-ID光子状態 |N> の生成速度を推定した。
いくつかのケースでは、信号は検出可能であり、ノイズよりもはるかに上である、と我々は主張する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:29:29 GMT)
Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering [4.8] 本稿では,Seq2seq PLMを用いた知識ベース(KB)における意味解析の候補式を付加した文法を提案する。
文法は、アクションを生産規則として定義し、我々の意味論は、型と候補式による制約の下での推論中のアクションを予測する。
我々のセマンティクスはKQA ProとOvernightで最先端の精度を達成した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:15:41 GMT)
Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering [4.8] 大規模知識ベース(KB)を用いた意味解析のための候補表現を付加した文法を提案する。
文法は、アクションを生産規則として定義し、我々の意味論は、型と候補式による制約の下での推論中のアクションを予測する。
我々のセマンティックスはKQA ProとOvernightで最先端のアキュラシーを達成し、その実装はhttps://www.daehwannam.com/daehwannam/candexpr-sp.git.comで公開されています。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:15:41 GMT)
Mpemba Meets Quantum Chaos: Anomalous Relaxation and Mpemba Crossings in Dissipative Sachdev-Ye-Kitaev Models [4.8] 熱浴に結合したSachdev-Ye-Kitaev (SYK) 系のクエンチダイナミクスについて検討した。
有効温度振動とMpemba Crosss (MPC) を観測する。
量子カオス系におけるMPCの出現は、古典的MPEと強い類似性を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:28:05 GMT)
Mpemba Meets Quantum Chaos: Anomalous Relaxation and Mpemba Crossings in Dissipative Sachdev-Ye-Kitaev Models [4.8] ムペンバ効果(MPE)は、ある条件下で熱い液体が寒さよりも速く凍ることを示し、何十年にもわたって科学者の興味を惹きつけてきた。
本稿では,サーマルバスに結合したSachdev-Ye-Kitaev(SYK)系の力学について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:28:05 GMT)
Unraveling the Potential of Large Language Models in Code Translation: How Far Are We? [4.6] 大規模言語モデル(LLM)は様々なタスクにおいて最先端のパフォーマンスを示すが、コード翻訳には苦労する。
コード翻訳タスクにおけるLLMの能力と能力を利用するための大規模な実証的研究を行う。
提案手法は,(1)ソースと対象言語間の中間言語を選択する中間翻訳と,(2)自己生成並列データ上でLPMを微調整する自己学習である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:20:12 GMT)
EMWaveNet: Physically Explainable Neural Network Based on Microwave Propagation for SAR Target Recognition [4.3] 本研究では,複雑なSAR画像認識のための物理的に説明可能なフレームワークを提案する。
ネットワークアーキテクチャは完全にパラメータ化され、全ての学習可能なパラメータには明確な物理的意味があり、計算プロセスは完全に周波数領域で完了する。
提案手法は, 高い物理的論理, 高い物理的説明性, 堅牢性, および優れた処理能力を有することを示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:04:49 GMT)
A Model Is Not Built By A Single Prompt: LLM-Based Domain Modeling With Question Decomposition [4.1] 現実世界のドメインモデリングでは、エンジニアは通常複雑なタスクを簡単に解けるサブタスクに分解する。
本稿では,開発者のモデリングプロセスに類似した質問分解によるLLMに基づくドメインモデリング手法を提案する。
予備的な結果から,本手法は単発プロンプトによるプロンプトよりも優れていた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:28:04 GMT)
Turning Up the Heat: Min-p Sampling for Creative and Coherent LLM Outputs [4.1] 大規模言語モデル(LLM)は、各復号ステップにおける語彙上の確率分布から次のトークンをサンプリングしてテキストを生成する。
トップトークンの確率に応じてスケールすることでモデルの信頼度に基づいてサンプリングしきい値を調整する動的トランケーション法である min-p サンプリングを提案する。
我々はGPQA、GSM8K、AlpacaEval Creative Writingなどのベンチマーク実験を行い、min-pサンプリングが生成したテキストの品質と多様性を特に高温で改善することを示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:21:55 GMT)
A Variational Bayesian Inference Theory of Elasticity and Its Mixed Probabilistic Finite Element Method for Inverse Deformation Solutions in Any Dimension [4.0] 弾性ひずみエネルギーはベイズ推論ネットワークの先行として用いられる。
提案手法は, 強い不連続性や破壊を伴う連続変形写像を逆予測できる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:17:53 GMT)
A Variational Bayesian Inference Theory of Elasticity and Its Mixed Probabilistic Finite Element Method for Inverse Deformation Solutions in Any Dimension [4.0] 弾性ひずみエネルギーはベイズ推論ネットワークの先行として用いられる。
提案手法は, 強い不連続性や破壊を伴う連続変形写像を逆予測できる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:17:53 GMT)
Learning from the past: predicting critical transitions with machine learning trained on surrogates of historical data [4.0] 複雑なシステムは、徐々に変化する環境条件が突然、破滅的な新しい状態へと移行する、重要な遷移を経験することができる。
これらの事象の早期警戒信号は、生態学、生物学、気候科学などの分野における意思決定に不可欠である。
本稿では,過去の遷移データに基づいて機械学習分類器を直接訓練する手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:25:49 GMT)
Adaptive Reasoning and Acting in Medical Language Agents [3.9] 本稿では, 臨床シミュレーション環境における診断精度を高めるために, LLMエージェントフレームワークを提案する。
提案した自動修正により、医師は誤診断後の推論や行動を反復的に洗練することができる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:45:16 GMT)
YanTian: An Application Platform for AI Global Weather Forecasting Models [3.8] AI Global Weather Forecasting Models (AIGWFM)のための適応型アプリケーションプラットフォーム「YanTian」
このプラットフォームは、既存のオープンソースのAIGWFMを機能強化モジュール群で拡張している。
気象学者はプラットフォームの基本機能と拡張機能の両方に容易にアクセスできる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:24:41 GMT)
YanTian: An Application Platform for AI Global Weather Forecasting Models [3.8] AI Global Weather Forecasting Models (AIGWFM)のための適応型アプリケーションプラットフォーム「YanTian」
このプラットフォームは、既存のオープンソースのAIGWFMを機能強化モジュール群で拡張している。
気象学者はプラットフォームの基本機能と拡張機能の両方に容易にアクセスできる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:24:41 GMT)
PatchMixer: A Patch-Mixing Architecture for Long-Term Time Series Forecasting [3.7] 本稿では,新しいCNNモデルであるPatchMixerを提案する。
時間的情報を保存するために、置換不変な畳み込み構造を導入する。
最先端のCNNと比べれば、PatchMixerは3.9%、相対的な改善は21.2%である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 09:35:48 GMT)
Multi-qubit gates and Schrödinger cat states in an optical clock [3.5] 我々は,グリーンベルガー・ホルン・ザイリンガー型で最大9個の光クロック量子ビットをプログラム可能な原子配列で生成するために,マルチキュービットのRydbergゲート群を開発した。
十分に短い暗黒時間での原子-レーザー比較において、最大4キュービットのGHZ状態を用いて標準量子限界以下の周波数不安定性を示す。
これらの結果は、光原子時計精度のハイゼンベルク制限スケーリングに近づくための鍵となるビルディングブロックを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:23:38 GMT)
Improving 3D Few-Shot Segmentation with Inference-Time Pseudo-Labeling [3.4] 提案手法は,クエリサンプルの本質的な情報を推論中の最終セグメンテーションに有効活用する手法である。
提案手法は,多様な設定やデータセットにまたがる性能を効果的に向上させることができる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:07:07 GMT)
From Optimization to Control: Quasi Policy Iteration [3.4] 準政治反復(QPI)と呼ばれる新しい制御アルゴリズムを提案する。
QPIは、政策反復アルゴリズムにおける「ヘシアン」行列の新たな近似に基づいて、MDPに特有の2つの線形構造制約を利用する。
これは、割引係数に対する感度が極めて低い政策反復と同様の実証的な収束挙動を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:03:23 GMT)
A Hybrid Sampling and Multi-Objective Optimization Approach for Enhanced Software Defect Prediction [3.4] 本稿では,ハイブリッドサンプリング技術と多目的最適化アルゴリズムを組み合わせた新しいSDPフレームワークを提案する。
提案モデルは,多目的最適化による特徴融合を適用し,一般化能力と予測の安定性を両立させる。
NASAとPROMISEリポジトリのデータセットで実施された実験は、提案されたハイブリッドサンプリングと多目的最適化アプローチがデータのバランスを改善し、冗長な特徴を排除し、予測精度を高めることを示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:39:04 GMT)
Tweezer interferometry with NOON states [3.4] ツイーザー干渉計における凝縮ボソンの有用性について検討した。
我々は, 凝縮ボソンの断熱分解とマージを含むツイーザー型NOON状態干渉計のプロトコルを検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:52:43 GMT)
ViFi-ReID: A Two-Stream Vision-WiFi Multimodal Approach for Person Re-identification [3.4] 人物再識別(ReID)は、安全検査、人員計数などにおいて重要な役割を担っている。
現在のReIDアプローチのほとんどは、主に目的条件の影響を受けやすい画像から特徴を抽出する。
我々は、Wi-Fi信号のチャネル状態情報(CSI)を介して歩行者からの歩行情報をキャプチャすることで、広く利用可能なルータをセンサデバイスとして活用する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:34:11 GMT)
Can pre-trained language models generate titles for research papers? [3.3] 本稿では,論文のタイトルを要約から生成するために,事前学習した言語モデルを微調整する。
また、ゼロショット設定でGPT-3.5-turboを使用して、紙のタイトルを生成する。
我々の観察では、AIが生成した論文のタイトルは一般的に正確で適切であることが示唆されている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:35:04 GMT)
Can pre-trained language models generate titles for research papers? [3.3] 本稿では,論文のタイトルを要約から生成するために,事前学習された大規模言語モデルを微調整する。
また、ゼロショット設定でChatGPTを使用してタイトルを生成します。
モデルはROUGE、METEOR、MoverScore、BERTScore、SciBERTScoreで測定される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:35:04 GMT)
Experiential-Informed Data Reconstruction for Fishery Sustainability and Policies in the Azores [3.3] 我々は2010年から2017年にかけてアゾレス諸島の漁獲データ収集プログラムのユニークなデータセットに焦点を当てた。
ドメイン知識と機械学習を利用して,魚の上陸毎にメティア関連情報を検索し,関連づける。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:14:40 GMT)
TopOC: Topological Deep Learning for Ovarian and Breast Cancer Diagnosis [3.3] トポロジカルデータ分析は、異なる色チャネルにわたるトポロジカルパターンの評価を通じて重要な情報を抽出することで、ユニークなアプローチを提供する。
卵巣癌と乳癌では, トポロジカルな特徴を取り入れることで, 腫瘍型の分化が著しく向上することが示唆された。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:24:13 GMT)
Evaluation of Version Control Merge Tools [3.2] Gitのようなバージョン管理システムでは、異なる開発者やブランチからの変更を統合する方法が必要になる。
マージツールは変更のクリーンな統合を出力するか、手作業による解決のためにコンフリクトを出力する。
新しいマージツールが提案されているが、まだ互いに評価されていない。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:35:14 GMT)
REPeat: A Real2Sim2Real Approach for Pre-acquisition of Soft Food Items in Robot-assisted Feeding [3.1] 本稿では,ロボットによる軟質食品の摂食における噛み込みの促進を目的としたReal2Sim2RealフレームワークであるREPeatを提案する。
軟食食用食材10種類からなる15種類の多種多様皿において,全皿平均27%の噛み取り成功率の向上を示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:30:56 GMT)
Comparison of Machine Learning Approaches for Classifying Spinodal Events [3.0] 我々は、いくつかのアンサンブルモデル(大投票、AdaBoost)とともに、最先端モデル(MobileViT、NAT、EfficientNet、CNN)を評価する。
以上の結果から,NATとMobileViTは他のモデルよりも優れており,トレーニングデータとテストデータの両方において,最高の測定精度,AUC,F1スコアを達成できた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:27:00 GMT)
Reframing the Mind-Body Picture: Applying Formal Systems to the Relationship of Mind and Matter [2.9] 本論は, 集合論と圏論から基本形式論を取り入れた簡単な枠組みが, 心と物質の関係に関する理論を明確にし, 伝達できることを実証することを目的とする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:55:14 GMT)
Improving Academic Skills Assessment with NLP and Ensemble Learning [2.8] 本研究は,自然言語処理(NLP)の進歩を生かして基礎的学術的スキルを評価する上での課題について論じる。
提案手法は,BERT,RoBERTa,BART,DeBERTa,T5を含む複数の最先端NLPモデルを統合する。
この手法には、詳細なデータ前処理、特徴抽出、モデル性能を最適化するための擬似ラベル学習が含まれる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:04:47 GMT)
Improving Academic Skills Assessment with NLP and Ensemble Learning [2.8] 本研究は,自然言語処理(NLP)の進歩を生かして基礎的学術的スキルを評価する上での課題について論じる。
提案手法は,BERT,RoBERTa,BART,DeBERTa,T5を含む複数の最先端NLPモデルを統合する。
この手法には、詳細なデータ前処理、特徴抽出、モデル性能を最適化するための擬似ラベル学習が含まれる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:04:47 GMT)
RISC-V Needs Secure 'Wheels': the MCU Initiator-Side Perspective [2.8] 自動車業界は大きなパラダイムシフトを経験しています。
車はますます自律的でコネクテッドでコンピュータ化されつつある。
この開発は自動車の(サイバーセキュリティの)要件を推進し、新しいセキュリティ認証標準ISO21434のリリースの道を開いた。
Ricardo-Vは、自動車コンピューティングシステムを変革する大きな可能性を秘めていますが、現在のISA/拡張はまだ準備ができていません。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:38:57 GMT)
TSViT: A Time Series Vision Transformer for Fault Diagnosis [2.7] 本稿では,効率的な故障診断のための時系列ビジョン変換器(TSViT)を提案する。
TSViTは畳み込み層を組み込み、振動信号から局所的な特徴を抽出する。
TSViTは2つのテストセットで前例のない平均精度を達成し、もう1つのテストセットで99.99%を達成している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:13:28 GMT)
Improving Colorectal Cancer Screening and Risk Assessment through Predictive Modeling on Medical Images and Records [2.7] 大腸内視鏡検査は大腸癌(CRC)に進展する前に大腸ポリープの発見と除去に有効な方法である
大腸ポリープの病理組織学的特徴の多様性は,大腸内視鏡の経過観察に困難を呈する。
デジタル病理の進化と近年の深層学習の進歩は、追加の医療記録情報を含む付加的な利益を調査するユニークな機会となる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:39:53 GMT)
Simulation of fidelity in entanglement-based networks with repeater chains [2.6] 我々はNetSquid上にシミュレーション環境を実装し、量子リピータや量子スイッチの経路にまたがるエンドツーエンドの忠実度を推定する。
スイッチモデルには、現在他のツールで利用できないいくつかの一般化が含まれている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:49:05 GMT)
Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space [2.5] 我々は、制御理論の文献から強力でよく理解された閉形式戦略を活用することが有望な道であると論じる。
既存の潜在空間モデルにおける3つの根本的な欠点は、これまでこの強力な組み合わせを妨げてきた。
これらすべての問題に同時に取り組む新しい結合ネットワーク(CON)モデルを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:04:42 GMT)
A Functional Extension of Semi-Structured Networks [2.5] 半構造化ネットワーク(SSN)は、深いニューラルネットワークを持つ付加モデルに精通した構造をマージする。
大規模データセットにインスパイアされた本研究では,SSNを機能データに拡張する方法について検討する。
本稿では,古典的機能回帰手法の優位性を保ちつつ,スケーラビリティを向上する機能的SSN法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:20:01 GMT)
System Identification of Neural Systems: Going Beyond Images to Modelling Dynamics [2.4] 本稿では,ビデオ刺激を用いた視覚野記録について,映像理解モデルの比較に焦点をあてた最初の大規模研究を提案する。
映像理解モデルが視覚野の反応を予測する方法について重要な知見を提供する。
本稿では,最高の映像理解モデル上に構築されたニューラルエンコーディング方式を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:16:02 GMT)
A Functional Extension of Semi-Structured Networks [2.3] 半構造化ネットワーク(SSN)は、深いニューラルネットワークを持つ付加モデルに精通した構造をマージする。
大規模データセットにインスパイアされた本研究では,SSNを機能データに拡張する方法について検討する。
本稿では,古典的機能回帰手法の優位性を保ちつつ,スケーラビリティを向上する機能的SSN法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:20:01 GMT)
Neural Characteristic Activation Analysis and Geometric Parameterization for ReLU Networks [2.3] 本稿では,個々のニューロンの特徴的活性化境界を調べることによって,ReLUネットワークのトレーニングダイナミクスを解析するための新しいアプローチを提案する。
提案手法は,コンバージェンス最適化におけるニューラルネットワークのパラメータ化と正規化において重要な不安定性を示し,高速収束を阻害し,性能を損なう。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:24:22 GMT)
Improving accuracy and convergence of federated learning edge computing methods for generalized DER forecasting applications in power grid [2.1] 本提案は,分散エネルギー資源(DER)予測のためのより正確な連邦学習手法の開発を目的とする。
i) 階層的および反復的クラスタリングのような最近開発されたFLの拡張を活用して、非IIDデータによるパフォーマンスを向上させること、(ii) 時系列データに適したさまざまなFLグローバルモデルの実験を行うこと、(iii) 電力システムからのドメイン固有の知識を取り入れて、より一般的なFLフレームワークやアーキテクチャを構築すること、によって実現される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:34:00 GMT)
Accreditation Against Limited Adversarial Noise [2.1] 誤りを逆数と仮定する認証プロトコル(様々な量子検証)を提案する。
このプロトコルは、短期使用に適する効率や適合性を最小限にしない。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:08:01 GMT)
Conditional and Modal Reasoning in Large Language Models [2.0] 我々は条件やモーダルを含む推論パターンに焦点を当てる。
私たちがテストしたすべてのLLMは、条件やモダルでいくつかの基本的な間違いを犯しました。
最高のLCMでさえ、モーダル推論において基本的な誤りを犯す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:08:15 GMT)
Conditional and Modal Reasoning in Large Language Models [2.0] 205大言語モデルが論理的に正しい推論と誤った推論を区別できる範囲を探索する。
GPT-4 モデルファミリー以外はすべて条件付きで基本的なミスを犯すことが多い。
ほぼ全てのモデルは、人間の判断と一致しない文献で広く議論されているある種の複雑な条件推論に対する答えを与える。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:08:15 GMT)
Braids and Higher-order Exceptional Points from the Interplay Between Lossy Defects and Topological Boundary States [2.0] 局所的損失欠陥によるSu-Schrieffer-Heeger鎖の摂動が高次例外点(HOEP)につながることを示す。
一方、パラメータ空間における例外的直線 (EL) の非アベリアブレイディング特性によって生じる。
一方、非エルミート的欠陥によって引き起こされるエッジ状態の非局在化が、欠陥状態とそれらをハイブリダイズするという事実から、そのような特別な交叉が生じていることが示される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:36:26 GMT)
STA-Unet: Rethink the semantic redundant for Medical Imaging Segmentation [2.0] スーパートークン注意(Super Token Attention, STA)機構は、スーパートークンをコンパクトな視覚表現として用い、ピクセル空間からトークン空間へのスーパーピクセルの概念を適応させる。
本研究では、豊富な情報を失うことなく冗長性を抑えるために、UNetアーキテクチャ(STA-UNet)にSTAモジュールを導入する。
4つの公開データセットの実験結果は、既存の最先端アーキテクチャよりもSTA-UNetの方が優れていることを示している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:19:46 GMT)
ACES: Automatic Cohort Extraction System for Event-Stream Datasets [1.9] 本稿では,イベントストリームデータを対象とした自動コホート抽出システム(ACES)を提案する。
ACESは、医療における機械学習(ML)のためのタスク/コホートの開発を再定義する。
ACESは、メディカルイベントデータ標準(MEDS)またはイベントストリームGPT(ESGPT)フォーマットの任意のデータセットに自動的に適用される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:55:24 GMT)
VQ-CNMP: Neuro-Symbolic Skill Learning for Bi-Level Planning [1.9] ラベルのない実演データから高いレベルのスキル表現を発見できる新しいニューラルネットワークモデルを提案する。
また、勾配に基づく計画手法を用いて、我々のモデルを利用する二段階計画パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:29:46 GMT)
Towards a Benchmark for Large Language Models for Business Process Management Tasks [1.9] 幅広いタスクに対してLLM(Large Language Models)をデプロイする組織が増えている。
汎用性にもかかわらず、LLMは不正確さから幻覚まで、エラーを起こしやすい。
本稿では、ビジネスプロセス管理領域におけるLCMパフォーマンスのベンチマークのギャップについて論じる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:32:49 GMT)
Towards a Benchmark for Large Language Models for Business Process Management Tasks [1.9] 幅広いタスクに対してLLM(Large Language Models)をデプロイする組織が増えている。
汎用性にもかかわらず、LLMは不正確さから幻覚まで、エラーを起こしやすい。
本稿では、ビジネスプロセス管理領域におけるLCMパフォーマンスのベンチマークのギャップについて論じる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:32:49 GMT)
Explicitly Modeling Pre-Cortical Vision with a Neuro-Inspired Front-End Improves CNN Robustness [1.8] CNNは、一般的な汚職で腐敗した画像の分類に苦慮している。
近年の研究では、霊長類一次視覚野(V1)のいくつかの特徴をシミュレートするCNNフロントエンドブロックを組み込むことで、全体のモデル堅牢性を向上させることが示されている。
我々は、前皮質視覚処理をシミュレートする新しいフロントエンドブロックを組み込んだ、生物学的にインスパイアされたCNNモデルファミリーを2つ導入する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:37:58 GMT)
Efficient Federated Unlearning under Plausible Deniability [1.8] 機械学習は、特定のデータポイントが重みに与える影響を忘れるため、MLパラメータを変更することでこの問題に対処する。
最近の文献では、データポイント(s)からのコントリビューションが、確率が1に近いデータセット内の他のデータポイントで鍛えられることが強調されている。
本稿では、FLサーバがクライアントの参加を確実に否定できるプライバシーモデルを用いて、フェデレートされたアンラーニングを実現する効率的な方法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:08:24 GMT)
ContextWIN: Whittle Index Based Mixture-of-Experts Neural Model For Restless Bandits Via Deep RL [1.6] 本研究では,NeurWINモデルを拡張する新しいアーキテクチャであるContextWINを紹介する。
強化学習フレームワークに専門家の混在を統合することで、ContextWINはコンテキスト情報を利用して意思決定を通知する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:58:54 GMT)
Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures [1.6] 糖尿病網膜症や緑内障などの眼疾患は、公衆衛生上の重大な課題となる。
深層学習モデルは、網膜イメージングのような医療画像を分析する強力なツールとして登場した。
課題は、モデル適合性と不確実性の推定であり、これは臨床的な意思決定に不可欠である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:35:18 GMT)
HARDMath: A Benchmark Dataset for Challenging Problems in Applied Mathematics [1.6] 本稿では,解析的近似技術を必要とする応用数学問題に挑戦するデータセットであるHARDMathを紹介する。
本フレームワークは,数値基底真理に対して検証された解を用いて,多数の問題を自動生成する。
HARDMath-miniは,366問題からなるサブサンプルテストセットであり,応用科学の文脈で定式化された40の単語問題に対して,オープンソースLLMとクローズドソースLLMの両方を評価する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:09:41 GMT)
A Transformer Based Generative Chemical Language AI Model for Structural Elucidation of Organic Compounds [1.6] 本稿では,変換器を用いた生成化学言語人工知能(AI)モデルを提案する。
我々のモデルはエンコーダ・デコーダアーキテクチャと自己保持機構を用いて、最も可能性の高い化学構造を直接生成する。
このアプローチは、従来の科学的問題解決プロセスを加速するトランスフォーマーベースの生成AIの可能性を示している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:41:20 GMT)
MARS via LASSO [1.5] 我々はMARS法の自然変種を提案し,研究する。
提案手法は,関数の凸クラス上での少なくとも2乗推定に基づいている。
我々の推定器は有限次元凸最適化によって計算できる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:12:36 GMT)
Artificial Intelligence in the Legal Field: Law Students Perspective [1.4] 人工知能分野(AI)は、法律、医学、金融など様々な分野で過去数年間にルネッサンスを経験した。
法律分野におけるAIの状況を概説する研究や、法律事務所の現在のAI活動に関する調査もあるが、我々の知る限り、法学生とAIの交わりについての調査は行われていない。
2024年7月22日から8月19日にかけて行われた調査では、法学生の背景、AI利用、法分野におけるAI応用、AI規制、意見共有のためのオープンエンドコメントがカバーされた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:44:13 GMT)
Surgical-LLaVA: Toward Surgical Scenario Understanding via Large Language and Vision Models [1.4] 手術シナリオに特化して設計されたLVLMについて紹介する。
LVLMモデルであるオペレーショナル・ラヴァを手術シナリオのデータに基づいて微調整した。
外科的ララバは、外科的文脈において、印象的なマルチモーダルチャット能力を示すことを示す実験である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:12:35 GMT)
J2N -- Nominal Adjective Identification and its Application [1.3] 本稿では,自然言語処理(NLP)における名詞形容詞(NA)による課題について考察する。
異なるPOSタグである"JN"としてNAを処理し,そのPOSタグ付け,BIOチャンキング,コア参照解決への影響について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:47:35 GMT)
J2N -- Nominal Adjective Identification and its Application [1.3] 本稿では,自然言語処理(NLP)における名詞形容詞(NA)による課題について考察する。
異なるPOSタグである"JN"としてNAを処理し,そのPOSタグ付け,BIOチャンキング,コア参照解決への影響について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:47:35 GMT)
J2N -- Nominal Adjective Identification and its Application [1.3] 本稿では,自然言語処理(NLP)における名詞形容詞(NA)による課題について考察する。
異なるPOSタグである"JN"としてNAを処理し,そのPOSタグ付け,BIOチャンキング,コア参照解決への影響について検討する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:47:35 GMT)
MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions [1.2] 手書き処方薬はユニークな課題であり、薬の認識のために訓練モデルに特別なデータを必要とする。
我々は医療記録から薬名を取り出すことに重点を置いている。
薬剤名と服薬量抽出の精度は82%であった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:19:09 GMT)
A Tidal Current Speed Forecasting Model based on Multiple Periodicity Learning [1.1] 潮流エネルギーは再生可能エネルギーの浸透速度を高める重要な要素の1つである。
これまでの研究は主に潮流の速度を予測するために物理モデルを用いてきた。
潮流の複数の周期性を研究することは潮流の速度を正確に予測するために重要である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:15:05 GMT)
EchoPrime: A Multi-Video View-Informed Vision-Language Model for Comprehensive Echocardiography Interpretation [1.1] 私たちは、1200万以上のビデオレポートペアでトレーニングされた、マルチビュー、ビューインフォームド、ビデオベースの視覚言語基盤モデルであるEchoPrimeを紹介します。
検索強化された解釈により、EchoPrimeはすべてのエコー心エコービデオから情報を総合的な研究に統合する。
2つの独立した医療システムからのデータセットでは、EchoPrimeは23種類の心臓形態と機能のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:04:22 GMT)
A Scalable and Parallelizable Digital Twin Framework for Sustainable Sim2Real Transition of Multi-Agent Reinforcement Learning Systems [1.1] マルチエージェント強化学習(MARL)システムは通常、その固有の複雑さのために、非常に長い訓練時間を必要とする。
本研究では、MARLトレーニングをオンデマンドで選択的にスケーリングすることで、MARLトレーニングを高速化するデジタルツインフレームワークを提案する。
その結果、提案した並列化方式でトレーニング時間を最大76.3%削減し、提案手法を用いて2.9%のsim2realギャップを減らした。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:16:25 GMT)
Hybrid Quantum-inspired Resnet and Densenet for Pattern Recognition [1.0] パターン認識のための残差と高密度接続を有する2つのハイブリッド量子インスピレーションニューラルネットワークを提案する。
一般化パワーに関する数値実験の集まりは、我々のハイブリッドモデルが純粋古典モデルと同じ一般化パワーを持っていることを示している。
ある研究によると、我々のハイブリッドモデルの認識精度は、残差や密接な接続のない量子ニューラルネットワークの認識精度よりも2%-3%高い。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 01:08:51 GMT)
Leveraging Customer Feedback for Multi-modal Insight Extraction [1.0] 企業は、製品やサービスを強化するために、テキストや画像など、さまざまなモダリティで顧客からのフィードバックの恩恵を受けることができる。
ユーザからのフィードバックから,行動可能なテキストセグメントとイメージのペアをひとつのパスで抽出することは困難である。
本稿では,画像とテキスト情報を潜在空間で融合し,関連したフィードバックセグメントを抽出するためにデコードする,新しいマルチモーダル手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:45:00 GMT)
Simulating Heavy-Hex Transverse Field Ising Model Magnetization Dynamics Using Programmable Quantum Annealers [0.8] ZNE量子誤差緩和を用いた127量子ビット重ヘックスIBM量子アーキテクチャにネイティブな接続グラフを持つ強磁性体2次元横磁場Isingモデル上でハミルトン動力学シミュレーションを行った。
本研究では,現在の超伝導量子ビット系プログラマブル量子アニールコンピュータ上での磁化を効率的にシミュレートできることを実証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:16:44 GMT)
DAG-aware Transformer for Causal Effect Estimation [0.8] 因果推論は、医療、経済学、社会科学などの分野における重要な課題である。
本稿では,これらの課題を克服する因果推論のためのトランスフォーマーを用いた新しい手法を提案する。
我々のモデルの中核となる革新は、注意機構に直接因果非巡回グラフ(DAG)を統合することである。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:17:58 GMT)
Learning Robust Representations for Communications over Interference-limited Channels [0.7] 本研究では、干渉制限環境下でのブロック伝送と検出のためのエンコーダとデコーダの設計のために、TwinNetとSiameseNetという2つの高効率な手法を紹介した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 09:09:21 GMT)
SoK: A Security Architect's View of Printed Circuit Board Attacks [0.5] 近年の多くの論文では、プリント基板(PCB)とプリント基板集合体(PCBA)の改ざん防止のための新しい電気的測定技術や物理的検査技術が提案されている。
モチベーションとして、これらの論文はブルームバーグ・ニュースの「The Big Hack」、ビデオゲームのモチップ、IT機器に対する「干渉攻撃」をしばしば引用している。
第一に、最近のPCBAセキュリティ研究において実装エラーとセキュリティアーキテクチャが議論されることはめったにない。
第二に、新たな対策と検証手法がこれらの攻撃に合わせたものであると仮定すると、最近の重要な研究は、既に緩和可能な攻撃に焦点を当てている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:29:42 GMT)
Responsible AI in the Global Context: Maturity Model and Survey [0.4] 責任AI(Responsible AI, RAI)は、産業、政策立案、学界に重点を置いている。
本研究は、このトピックに関する最も広範な調査の1つを通じて、RAIのグローバルな状況について調査する。
組織におけるRAIの成熟度モデルを定義し、組織的かつ運用的なRAI対策の実施方法のマップを作成します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:04:32 GMT)
Analysis and Design of a Personalized Recommendation System Based on a Dynamic User Interest Model [0.3] 本稿では,動的ユーザ関心モデルに基づくパーソナライズされたレコメンデーションシステムの設計と分析を行う。
このシステムは、ユーザの行動データをキャプチャし、動的なユーザ関心モデルを構築し、複数のレコメンデーションアルゴリズムを組み合わせて、パーソナライズされたコンテンツをユーザに提供します。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:08:16 GMT)
RoofDiffusion: Constructing Roofs from Severely Corrupted Point Data via Diffusion [0.3] RoofDiffusionは、屋根の高さマップを頑健に完成させる、エンドツーエンドの自己教師付き拡散技術である。
変種であるNo-FP RoofDiffusionは、建物の足跡と高さを同時に予測する。
先進的なCity3DアルゴリズムでテストされたRoofDiffusionは、3Dビルの再構築を著しく改善する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:32:18 GMT)
Large-scale Multi-objective Feature Selection: A Multi-phase Search Space Shrinking Approach [0.3] 特徴の選択は、特に高次元データセットにおいて、機械学習において重要なステップである。
本稿では,LMSSSと呼ばれる探索空間の縮小に基づく大規模多目的進化アルゴリズムを提案する。
提案アルゴリズムの有効性は、15の大規模データセットに対する包括的実験によって実証される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:06:10 GMT)
State of NLP in Kenya: A Survey [0.3] ケニアは言語多様性で知られており、自然言語処理の進歩において固有の課題と有望な機会に直面している。
本調査はケニアにおけるNLPの現状を詳細に評価する。
論文では、利用可能なデータセットと既存のNLPモデルを批判的に評価することで、大きなギャップを明らかにする。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:08:24 GMT)
Navigating Discoverability in the Digital Era: A Theoretical Framework [0.2] デジタルコンテンツの流通におけるデジタル技術の普及は、デジタル時代の文化的多様性への影響を懸念している。
本研究では,開始から終了までの発見の経路を含む,相互接続された6つのコンポーネントからなる発見エコシステムを提示する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:50:50 GMT)
When Neutral Summaries are not that Neutral: Quantifying Political Neutrality in LLM-Generated News Summaries [0.0] 本研究では, LLMの政治的中立性を定量化するための新たな視点を示す。
我々は、中絶、銃規制/権利、医療、移民、LGBTQ+の権利という、現在のアメリカの政治における5つの迫る問題について検討する。
我々の研究は、いくつかのよく知られたLLMにおいて、民主的偏見に対する一貫した傾向を明らかにした。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:44:39 GMT)
Universal scaling laws in quantum-probabilistic machine learning by tensor network towards interpreting representation and generalization powers [0.0] この研究は、量子確率的MLにおける普遍的スケーリング法則の出現を明らかにするのに寄与する。
生成テンソルネットワーク(GTN)を行列積状態の形で例に挙げる。
訓練されていないGTNでは、負対数確率 (NLL) $L$ は、一般に特徴数とともに線形に増加する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:48:08 GMT)
Towards a Deeper Understanding of Transformer for Residential Non-intrusive Load Monitoring [0.0] 本研究では, 注目層内の隠れ次元数, 注目層数, 注目頭部数, 落下率が変圧器性能に及ぼす影響について検討した。
この研究は、より堅牢で有能なトランスフォーマーモデルの研究と開発のための基盤となることが期待されている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:40:37 GMT)
Towards a Deeper Understanding of Transformer for Residential Non-intrusive Load Monitoring [0.0] 本研究では, 注目層内の隠れ次元数, 注目層数, 注目頭部数, 落下率が変圧器性能に及ぼす影響について検討した。
この研究は、より堅牢で有能なトランスフォーマーモデルの研究と開発のための基盤となることが期待されている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:40:37 GMT)
Towards a Deeper Understanding of Transformer for Residential Non-intrusive Load Monitoring [0.0] 本研究では, 注目層内の隠れ次元数, 注目層数, 注目頭部数, 落下率が変圧器性能に及ぼす影響について検討した。
この研究は、より堅牢で有能なトランスフォーマーモデルの研究と開発のための基盤となることが期待されている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:40:37 GMT)
Three Decades of Formal Methods in Business Process Compliance: A Systematic Literature Review [0.0] デジタル化の取り組みは、しばしば重要な課題に直面している。
本研究は,コンプライアンスの検証や保証に形式的手法を用いた厳密なフレームワークに焦点を当てる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:19:57 GMT)
The impact of complexity in the built environment on vehicular routing behavior: Insights from an empirical study of taxi mobility in Beijing, China [0.0] 運転時のアンカー効果と露光嗜好を模倣した車両経路選択モデルを提案する。
その結果,提案モデルでは,最短経路原理に基づく従来の車両経路選択モデルよりも12%高い性能を示した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 01:57:56 GMT)
The Role of Fake Users in Sequential Recommender Systems [0.0] 本研究では,ランダムなインタラクション,人気アイテムや不人気アイテムのフォロー,ひとつのジャンルに着目した偽ユーザの存在が,シーケンスレコメンダシステム(SRS)の性能に与える影響を評価する。
NDCGのような従来の指標は比較的安定しているが、偽ユーザの存在はRSSメトリクスを著しく劣化させ、多くの場合、ほぼゼロの値に低下させる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:44:04 GMT)
The Quantum Master and its Classical Emissary [0.0] イアン・マクギルシュリストの研究は、脳の2つの半球が世界と相互作用する根本的に異なるモードを持っているという仮説を提示している。
量子物理学と古典物理学の「世界」におけるこの洞察と平行して議論する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 02:41:55 GMT)
The (1+3)-dimensional 'quantum principle of relativity' is Einstein's principle of relativity [0.0] 初期の研究で提案された「相対性理論」の拡張は、単に1905年に提案されたアインシュタインの相対性理論であることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:38:30 GMT)
The (1+3)-dimensional 'quantum principle of relativity' is Einstein's principle of relativity [0.0] この「相対性理論」の拡張は単に1905年にアインシュタインが提唱した相対性理論であることを示す。
それらの$(1+3)$-dimensional superflip' は、恒等演算子を任意のリラベリングと共に適用することと同値である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 10:38:30 GMT)
Superselection rules and bosonic quantum computational resources [0.0] 我々は、ボソニック量子コンピュータ上で生成した資源に基づいて、量子光学非古典状態を古典的/古典的と分類する。
我々の研究は、量子光学の連続的な性質から離散的な性質へのシームレスな遷移を確立するのに寄与する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:33:20 GMT)
Real-time Monitoring of Lower Limb Movement Resistance Based on Deep Learning [0.0] リアルタイム下肢運動抵抗モニタリングは,リハビリテーションや運動訓練などの臨床・スポーツ分野での様々な用途において重要である。
効率的な特徴抽出のためにMobileNetV3を統合した新しいMobile Multi-Task Learning Network (MMTL-Net)を提案する。
MMTL-Netの利点は、精度の向上、レイテンシの低減、計算効率の向上であり、リアルタイムアプリケーションに非常に適している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 18:19:48 GMT)
Quantum-Classical Correspondence in a Quartic Oscillator -- Corrections to Frequency and Bounds for Periodic Motion [0.0] 量子および古典的クォート非調和振動子の振舞いを比較検討する。
関連する運動方程式により、振動順序の古典的な周波数を順序で計算することができる。
古典的および量子的両方の場合において、そのような振動の周期性の境界を導出する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:30:39 GMT)
Quantum correlations enhanced in hybrid optomechanical system via phase tuning [0.0] この研究は、ハイブリッド二重キャビティ光学系における量子相関を強化する理論的枠組みを示す。
位相 $phi$ のチューニングは光子-フォノン交絡の最大化に不可欠である。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 14:11:07 GMT)
Physics-informed AI and ML-based sparse system identification algorithm for discovery of PDE's representing nonlinear dynamic systems [0.0] 提案手法は, 3次元, 4次, 剛性方程式を含む, 様々な雑音レベルの微分方程式を探索する。
パラメータ推定は変動係数が小さい真の値に正確に収束し、ノイズに頑健性を示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:48:51 GMT)
Online Digital Investigative Journalism using SociaLens [0.0] オンラインソースからクエリ特定データを特定し,抽出するための,多目的かつ自律的な調査ジャーナリズムツールである em SociaLens を導入している。
我々は、調査ジャーナリズム、法執行、社会政策計画におけるその利用を構想する。
発展途上国におけるレイプ事件を事例として,SociaLensの機能について考察した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:20:47 GMT)
Neural Video Representation for Redundancy Reduction and Consistency Preservation [0.0] 入射神経表現(INR)は様々な信号をネットワークに埋め込む。
本稿では,フレームの高周波成分と隣接するフレーム間の特徴差を利用した映像表現手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:34:54 GMT)
Neural Video Representation for Redundancy Reduction and Consistency Preservation [0.0] 入射神経表現(INR)は、様々な信号をニューラルネットワークに埋め込む。
フレームの高周波成分と低周波成分の両方を生成する映像表現法を提案する。
実験の結果,提案手法は既存のHNeRV法よりも優れており,動画の96%において優れた結果が得られた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:34:54 GMT)
Multi class activity classification in videos using Motion History Image generation [0.0] 運動履歴画像は、時間的・活動的な情報を多次元的詳細に捉えるための、よく確立された枠組みであることを示す。
我々は、MHIを用いてサンプルデータを作成し、分類器を訓練し、単一のマルチアクションビデオにおいて、6つの異なるアクティビティにわたるアクション分類の有効性を実証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:22:02 GMT)
Movement Control of Smart Mosque's Domes using CSRNet and Fuzzy Logic Techniques [0.0] 本論文は,モスクに日光が入り込むのを許容し,新鮮な空気を保存するためのスマートドームモデルを提案する。
提案モデルでは,モスクの気象条件と過密率に基づいてドームの動きを制御する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 09:39:44 GMT)
Massive quantum systems as interfaces of quantum mechanics and gravity [0.0] 粒子物理学からの伝統的な見解では、量子重力効果は極端に高いエネルギーと小さな長さのスケールでしか検出できない。
近年、実験室で制御できる量子系のサイズと質量は前例のない規模に達している。
このレビューは、巨大な量子システムが量子力学と重力の間のインターフェースとして機能する提案に焦点を当てている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 13:15:19 GMT)
LoRE: Logit-Ranked Retriever Ensemble for Enhancing Open-Domain Question Answering [0.0] 位置バイアスを緩和することで解答精度と妥当性を向上させる新しいアプローチであるLoREを提案する。
LoREはBM25やFAISSインデックス付き文変換器といった多様なレトリバーのアンサンブルを使用している。
重要な革新は、ロジットベースの回答ランキングアルゴリズムで、大きな言語モデルからのロジットスコアとパスの検索ランクを組み合わせたものである。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:06:08 GMT)
Learning Interpretable Classifiers for PDDL Planning [0.0] PDDLで表される同様の計画課題のセットにおいて,エージェントの振る舞いを他のエージェントと比較して認識する解釈可能なモデルの問題を考える。
我々のアプローチは、エージェントが小さなプランニングインスタンスをどのように解決したかを示す小さな例から、論理式を学習することで構成される。
このような公式の学習はNPハード問題であるため、計算的に難解であることが示される。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 21:12:45 GMT)
Investigating Implicit Bias in Large Language Models: A Large-Scale Study of Over 50 LLMs [0.0] 大規模言語モデル(LLM)は幅広いタスクで採用されている。
最近の研究では、LLMは明示的な偏見評価をパスしても暗黙の偏見を抑えることができることが示されている。
この研究は、新しい言語モデルやより大きな言語モデルが自動的にバイアスを減らさないことを強調している。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 03:43:18 GMT)
Integral Transforms and $\mathcal{PT}$-symmetric Hamiltonians [0.0] 我々は$mathcalPT$-symmetric Hamiltonianの場合、積分変換を研究する。
セガル・バルグマン変換を用いて、フーリエ変換が元のハミルトニアンの固有関数に与える影響を調べる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 11:30:52 GMT)
Instruct-Tuning Pretrained Causal Language Models for Ancient Greek Papyrology and Epigraphy [0.0] 本稿では,文献研究における3つの重要な課題を支援するために,事前訓練された因果言語モデルを微調整する実験について述べる。
命令ベースのアプローチと95%/5%の列車/テスト分割を使用して、パピルスのモデルは14.9%の文字誤り率(CER)を達成した。
銘文では、CERが20.5%、トップ1の精度が63.7%、トップ20の精度が83.0%に達した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:30:09 GMT)
Instruct-Tuning Pretrained Causal Language Models for Ancient Greek Papyrology and Epigraphy [0.0] プロンプトベースのインストラクションアプローチを使用することで、微調整されたモデルは、主要なメトリクスのテクニックの状態を超越する。
入力の場合、平均文字誤り率(CER)は22.5%である。
また、再建の際に空間を無視し、古代の古文書で使われる経典の連続体と整合性を持たせることで、実用上の優位性ももたらしている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 08:30:09 GMT)
Improved phase sensitivity of an SU(1,1) interferometer based on the internal single-path local squeezing operation [0.0] 内部の単一パス LSO スキームは位相感度と量子フィッシャー情報を高めることができる。
より大きなsqueezingパラメータ$r$は、干渉計のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:38:51 GMT)
IMAS: A Comprehensive Agentic Approach to Rural Healthcare Delivery [0.0] 本稿では,農村部における医療提供の改善を目的としたエージェント・メディカル・アシスタントシステムを提案する。
このシステムは、翻訳、医療複雑性評価、専門家ネットワークの統合、応答単純化の5つの重要なコンポーネントで構成されている。
MedQA,PubMedQAおよびJAMAデータセットを用いた評価結果は、この統合アプローチが農村の医療従事者の有効性を著しく向上させることを示す。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:07:11 GMT)
How to unlearn a learned Machine Learning model ? [0.0] 機械学習モデルを学習し、その能力を視覚化するためのエレガントなアルゴリズムを提示します。
基礎となる数学的理論を解明し、所望のデータに対する未学習モデルの性能と望ましくないデータに対する無知の両方を評価するための具体的な指標を確立する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:38:09 GMT)
Gradient Span Algorithms Make Predictable Progress in High Dimension [0.0] 我々は、全ての「漸進的アルゴリズム」が、無限大となる傾向があるため、スケールされたランダム関数に決定論的に就いていることを証明した。
分布仮定はトレーニングに使用されるが、ランダムグラスやスピンも含む。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 19:26:18 GMT)
Equitable Access to Justice: Logical LLMs Show Promise [0.0] 大規模言語モデル(LLM)は、正義へのアクセスを改善する大きな可能性を秘めている。
本稿では,LLMと論理プログラミングの統合について検討し,解析能力の向上について述べる。
我々の目標は、法律や契約を特定の訴訟に適用可能な論理プログラムに変換することです。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:26:07 GMT)
Empowering Dysarthric Speech: Leveraging Advanced LLMs for Accurate Speech Correction and Multimodal Emotion Analysis [0.0] 本稿では, 変形性関節症を認識・翻訳するための新しいアプローチを提案する。
我々は、高精度な音声補正とマルチモーダル感情分析に先進的な大規模言語モデルを活用する。
我々の枠組みは、意図した文を歪んだ音声から高精度に再構成しながら、幸福、悲しみ、中立、驚き、怒り、恐怖などの感情を識別する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 20:54:44 GMT)
Empirical Study of Mutual Reinforcement Effect and Application in Few-shot Text Classification Tasks via Prompt [0.0] 相互強化効果(MRE)は,テキスト分類タスクにおける単語レベルとテキストレベルの分類の相乗的関係について検討する。
21MRE混合データセットを用いた実験により,モデルにおけるMREの存在とその影響が明らかになった。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:43:54 GMT)
EEG-based AI-BCI Wheelchair Advancement: A Brain-Computer Interfacing Wheelchair System Using Machine Learning Mechanism with Right and Left Voluntary Hand Movement [0.0] このシステムは、自発的な左右の動きに基づいて車椅子のナビゲーションをシミュレートするように設計されている。
Support Vector Machines (SVM)、XGBoost、ランダムフォレスト、双方向長短期記憶(Bi-LSTM)アテンションベースモデルなど、さまざまな機械学習モデルを開発した。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:41:37 GMT)
Dynamic Estimation of Learning Rates Using a Non-Linear Autoregressive Model [0.0] 本稿では,モーメントの概念を取り入れた適応非線形自己回帰モデルを提案する。
本枠組みでは,学習率の異なる3つの推定器を提案し,その収束の理論的証明を提供する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:55:58 GMT)
Distributed Intelligent Video Surveillance for Early Armed Robbery Detection based on Deep Learning [0.0] ラテンアメリカでの低い雇用率が犯罪の顕著な増加に寄与し、新たな犯罪戦術が出現した。
近年の研究では、兵器検知器を監視カメラに埋め込むことによって、この問題にアプローチしている。
これらのシステムは、イベントを確認できない場合、偽陽性になりがちである。
コンピュータビジョンパイプラインとオブジェクト検出機能を複数のデバイスに統合する分散IoTシステムを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 05:20:35 GMT)
Data Adaptive Few-shot Multi Label Segmentation with Foundation Model [0.0] 数発のセグメンテーションのための最先端の手法は、医療画像の準最適性能に悩まされている。
単一ラベル,多ラベルローカライゼーション,セグメンテーションのための基礎モデル (FM) ベースのアダプタを提案する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 07:29:13 GMT)
Cartesian Genetic Programming Approach for Designing Convolutional Neural Networks [0.0] 人工ニューラルネットワークの設計において、革新的なアプローチの1つの重要な側面は、新しいニューラルネットワークアーキテクチャを提案することである。
本研究では,CNNを設計するために純粋遺伝的プログラミング手法を用いる。
予備実験の過程で,提案手法は有望な結果をもたらす。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:43:33 GMT)
Cartesian Genetic Programming Approach for Designing Convolutional Neural Networks [0.0] 人工ニューラルネットワークの設計において、革新的なアプローチの1つの重要な側面は、新しいニューラルネットワークアーキテクチャを提案することである。
本研究では,CNNを設計するために純粋遺伝的プログラミング手法を用いる。
予備実験の過程で,提案手法は有望な結果をもたらす。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:43:33 GMT)
Bounds on Multipartite Nonlocality via Reduction to Biased Nonlocality [0.0] マルチパーティリート非局所ゲームとバイアス付きバイパーティリート非局所ゲームとの差が小さくなることを示す。
この還元をより大規模なゲームに一般化することは、多部主義から二部主義の原理への橋を架けることができる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:20:26 GMT)
Autoionization-enhanced Rydberg dressing by fast contaminant removal [0.0] ライドバーグドレッシングは長寿命の原子状態における絡み合い生成の強力なツールである。
アルカリ土類状原子中の自己イオン化遷移を利用した汚染物質の迅速除去を実証した。
我々は、最大144個の原子のシステムサイズに対して、これまで達成されたよりも桁違いに大きなデューティサイクルを維持しながら、等級の寿命を向上させる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 06:49:39 GMT)
An Explainable AI Model for Predicting the Recurrence of Differentiated Thyroid Cancer [0.0] 本研究は,甲状腺癌の再発を予測するために,機械学習,特にディープラーニングモデルを用いている。
患者の臨床病理学的特徴を含むデータセットを解析することにより、トレーニング中の98%、テスト中の96%の顕著な精度を達成できた。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 23:12:33 GMT)
Advancing Supervised Learning with the Wave Loss Function: A Robust and Smooth Approach [0.0] 本稿では,非対称な損失関数であるウェーブロスという,教師あり機械学習の領域への新たな貢献について述べる。
提案したウェーブロス関数を,サポートベクトルマシン (SVM) とツインサポートベクトルマシン (TSVM) の最小2乗設定に組み込む。
提案する Wave-SVM と Wave-TSVM の有効性を実証的に示すため,UCI と KEEL のベンチマークを用いて評価を行った。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 16:57:39 GMT)
A unifying polarization formalism for electric- and magnetic-multipole interactions [0.0] 我々は、原子系と偏光場との相互作用を記述する作用素のテンソル形式を導出するために、球面波膨張に依存する。
直接応用として、フォーマリズムは電気四極子転移における放射の散乱に影響を及ぼす放射異方性をモデル化し、磁場の存在下でのハンル効果をモデル化するために用いられる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 22:21:53 GMT)
A resource-efficient model for deep kernel learning [0.0] 精度の低下を最小限に抑えた学習計算の高速化には,様々なアプローチがある。
本稿では,演算子の分解とネットワークの分解を併用したモデルレベルの分解手法について述べる。
得られたアルゴリズムの精度とスケーラビリティの両面から実現可能性解析を行う。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:11:42 GMT)
A Trilogy of AI Safety Frameworks: Paths from Facts and Knowledge Gaps to Reliable Predictions and New Knowledge [0.0] AI安全は、AIコミュニティ内外の多くの科学者にとって重要な最前線の関心事となっている。
機械学習システムには、生存リスクから人間の存在、深い偽造、偏見まで、すぐに、長期にわたって予測されるリスクが数多く存在する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:35:36 GMT)
A Trilogy of AI Safety Frameworks: Paths from Facts and Knowledge Gaps to Reliable Predictions and New Knowledge [0.0] AI安全は、AIコミュニティ内外の多くの科学者にとって重要な最前線の関心事となっている。
機械学習システムには、生存リスクから人間の存在、深い偽造、偏見まで、すぐに、長期にわたって予測されるリスクが数多く存在する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 17:35:36 GMT)
A Quantum Approximate Optimization Method For Finding Hadamard Matrices [0.0] 本稿では,ゲートベース量子コンピュータ上でのアダマール行列探索アルゴリズムを実装した新しい量子ビット効率法を提案する。
本稿では,本手法の定式化,対応する量子回路の構成,および量子シミュレータと実ゲート型量子コンピュータの両方の実験結果について述べる。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 12:00:50 GMT)
A Multi-Step Minimax Q-learning Algorithm for Two-Player Zero-Sum Markov Games [0.0] 2人のプレイヤーによるゼロサムマルコフゲームを解決するため、興味深い反復手順が提案されている。
提案した2段階のミニマックスQ-ラーニングのほぼ確実に収束が理論的に得られる。
数値シミュレーションは,提案アルゴリズムが有効で実装が容易であることを認証する。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 04:24:48 GMT)
A Comparative Study of PDF Parsing Tools Across Diverse Document Categories [0.0] DocLayNetデータセットを使用して、6つのドキュメントカテゴリで10の人気のあるPDF解析ツールを比較した。
テキスト抽出では、PyMuPDFとpypdfiumは概して他のものよりも優れていたが、すべてのテキスト抽出は科学と特許の文書で苦労した。
テーブル検出では、TATRは金融、特許、法と規制、科学のカテゴリーで優れている。
論文参考訳(メタデータ) (Sun, 13 Oct 2024 15:11:31 GMT)