Alleviating Hallucinations in Large Vision-Language Models through Hallucination-Induced Optimization [123.5] 大規模ビジュアル言語モデル(LVLM)は、マルチモーダルデータの理解において、例外的な能力を示した。
彼らは必然的に幻覚に悩まされ、生成されたテキストと対応するイメージを切断する。
現在の視覚的コントラスト復号法のほとんどは、視覚的不確実性情報を導入して幻覚を緩和しようとするものである。
しかし、彼らは幻覚トークンを正確に誘導するのに苦労し、幻覚を緩和する効果を著しく制限した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:18:57 GMT)
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation [109.9] 大規模言語モデル(LLM)は,その知識に対する信頼度が低く,内部知識と外部知識の衝突をうまく扱えないことを示す。
検索の強化は、LLMの知識境界に対する認識を高める効果的なアプローチであることが証明されている。
本稿では,文書を動的に活用するための簡易な手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:35:02 GMT)
Multi-LoRA Composition for Image Generation [107.8] 復号化中心の観点から,マルチロラ合成について検討する。
我々は,各聴覚ステップで異なるLoRAを交互に切り替えるLoRA Switchと,より密着的な画像合成を導くためにすべてのLoRAを同時に組み込むLoRA Compositeの2つのトレーニングフリー手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:52:45 GMT)
Generative Timelines for Instructed Visual Assembly [106.8] この研究の目的は、自然言語の指示を通じて視覚的タイムライン(例えばビデオ)を操作することである。
そこで本研究では,教師付き視覚アセンブリタスクの実行を訓練した生成モデルであるTimeline Assemblerを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:26:30 GMT)
Visual Cue Enhancement and Dual Low-Rank Adaptation for Efficient Visual Instruction Fine-Tuning [102.2] VCE(Vision Cue Enhancement)とDual-LoRA(Dual-LoRA)の2つの新しいアプローチによる効率的な微調整フレームワークを提案する。
VCEは、マルチレベルビジュアルキューを統合することで、視覚プロジェクタを強化し、きめ細かい視覚的特徴をキャプチャするモデルの能力を向上させる。
Dual-LoRAは、命令チューニングのための2つの低ランク構造を導入し、スキルとタスク空間に学習を分離し、様々なタスクにまたがって正確な制御と効率的な適応を可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:03:09 GMT)
MVInpainter: Learning Multi-View Consistent Inpainting to Bridge 2D and 3D Editing [90.3] 新規ビュー合成(NVS)と3D生成は、最近顕著に改善されている。
我々はMVInpainterを提案し、3D編集を多視点2Dインペインティングタスクとして再フォーマットする。
MVInpainterは、スクラッチから完全に新しいビューを生成するのではなく、参照ガイダンスで複数のビューイメージを部分的に描き込む。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:31:45 GMT)
BoolQuestions: Does Dense Retrieval Understand Boolean Logic in Language? [88.3] まず,現在の検索システムが,言語に暗示されるブール論理を理解できるかを検討する。
広範な実験結果から,現在の高密度検索システムはブール論理を十分に理解していないという結論を導いた。
本研究では,研究コミュニティの強力な基盤となるコントラスト的連続学習手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:19:53 GMT)
Re-Reading Improves Reasoning in Large Language Models [87.5] 既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。
CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。
提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:06:33 GMT)
CodeXEmbed: A Generalist Embedding Model Family for Multiligual and Multi-task Code Retrieval [87.2] CodeXEmbedは400Mから7Bパラメータの大規模なコード埋め込みモデルのファミリーである。
我々の新しいトレーニングパイプラインは、複数のプログラミング言語を統合し、様々なコード関連タスクを共通の検索フレームワークに変換する。
私たちの7Bモデルは、コード検索において新しい最先端(SOTA)を設定し、以前の主要なモデルであるVoyage-CodeをCoIRベンチマークで20%以上上回っています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:54:45 GMT)
CLIP-VG: Self-paced Curriculum Adapting of CLIP for Visual Grounding [86.8] 擬似ラベルを用いて地域を特定するために、教師なしの視覚的接地法が開発された。
CLIP-VG は,CLIP を擬似言語ラベルに適応させる手法である。
提案手法は,RefCOCO/+/gデータセットにおいて,最先端の教師なし手法よりも有意差がある。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:52:04 GMT)
Q-SLAM: Quadric Representations for Monocular SLAM [85.8] 四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:26:23 GMT)
TFG: Unified Training-Free Guidance for Diffusion Models [82.1] トレーニング不要のガイダンスは、追加のトレーニングなしで望ましい目標特性を持つサンプルを生成することができる。
既存の手法は様々な個別の用途で有効であるが、理論的な根拠と広範囲なベンチマークでの厳密な試験が欠如していることが多い。
本稿では,既存の手法を特殊な事例として包含する新しいアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:12:46 GMT)
DGTR: Distributed Gaussian Turbo-Reconstruction for Sparse-View Vast Scenes [81.6] 新規ビュー合成(NVS)アプローチは、広大なシーン再構築において重要な役割を担っている。
大規模な環境下では、復元の質が悪くなる場合が少なくない。
本稿では,スパース・ビュー・ワイド・シーンのための効率的なガウス再構成のための分散フレームワークであるDGTRを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:51:44 GMT)
Safe + Safe = Unsafe? Exploring How Safe Images Can Be Exploited to Jailbreak Large Vision-Language Models [80.8] Safety Snowball Agent (SSA) は、エージェントの自律的およびツール使用能力をジェイルブレイクLVLMに活用する新しいエージェントベースのフレームワークである。
我々の実験では、ほぼすべての画像を用いてLVLMを誘導し、安全でないコンテンツを生成し、最新のLVLMに対して高いジェイルブレイク率を達成できることを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:01:43 GMT)
RedPajama: an Open Dataset for Training Large Language Models [80.7] 我々は、オープンソースの言語モデルを前進させるために対処しなければならない3つの中核的なデータ関連課題を特定します。
例えば、(1)データキュレーションプロセス、(2)大量の高品質データへのアクセス、(3)データセットキュレーションと分析のためのアーティファクトとメタデータの可用性などである。
LLaMAトレーニングデータセットのオープンレプリケーションであるRedPajama-V1と、生の未フィルタリングテキストデータと品質信号とメタデータからなる巨大なWeb専用データセットであるRedPajama-V2をリリースする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:35:28 GMT)
MLAN: Language-Based Instruction Tuning Improves Zero-Shot Generalization of Multimodal Large Language Models [79.1] マルチモーダルな大規模言語モデルのゼロショットタスクの一般化を改善するために,新しい命令チューニング手法を提案する。
提案手法の有効性を,言語と視覚の両面にまたがる9つの未知のデータセットに対して評価した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:16:28 GMT)
Repositioning the Subject within Image [78.8] 本稿では,革新的動的操作タスク,主題再構成を導入する。
このタスクは、画像の忠実性を保ちながら、ユーザが指定した対象を所望の位置に移動させることである。
本研究は, 主観的再配置の基本的なサブタスクを, 統一的, 即効的な塗装作業として効果的に再構築できることを明らかにする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:08:33 GMT)
CATCH: Complementary Adaptive Token-level Contrastive Decoding to Mitigate Hallucinations in LVLMs [74.4] CATCHは、未解決のシナリオにおいて、きめ細かい特徴知覚と累積幻覚を減少させる視覚的欠陥に関連する問題に対処する。
これは、特定のデータや事前知識を必要とせず、様々な視覚的質問応答タスクに適用でき、追加のトレーニングを必要とせず、新しいタスクにしっかりと一般化する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:27:31 GMT)
Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.1] Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:08:38 GMT)
MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.8] MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:52:59 GMT)
Look Before You Decide: Prompting Active Deduction of MLLMs for Assumptive Reasoning [68.8] そこで本研究では,MLLMの最も普及している手法が,その問題に先入観を導入することで,容易に騙せることを示す。
また, モデルに対して, 合成推論を積極的に行うための, 単純かつ効果的な手法であるアクティブ推論(AD)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:22:16 GMT)
KTO: Model Alignment as Prospect Theoretic Optimization [67.4] Kahneman & Tversky の $textitprospect theory$ は、人間が偏見はあるが明確に定義された方法でランダム変数を知覚することを示している。
人間のフィードバックとLLMを協調させる目的には,これらのバイアスが暗黙的に組み込まれていることを示す。
そこで本稿では,嗜好のログ類似度を最大化する代わりに,世代別利用率を直接最大化するHALOを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:12:45 GMT)
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues [65.4] リニアリカレントニューラルネットワーク(LRNN)は、大規模言語モデリングにおけるトランスフォーマーの効率的な代替手段として登場した。
LRNNは、コード評価やチェスゲーム追跡といったタスクのパフォーマンスを損なうような状態追跡を行うのに苦労している。
我々の研究は、現代のLRNNの表現性を高め、トレーニングや推論のコストを変えることなく適用性を高める。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:35:38 GMT)
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors [63.2] 視覚行動は、視覚行動支援型マルチモーダル感情認識データセットを作成するための重要な感情的手がかりとなる。
EMERデータセットに感情認識(ER)と表情認識(FER)の両方のアノテーションを初めて提供する。
具体的には、ERとFERの両方のパフォーマンスを同時に向上する新しいEMERTアーキテクチャを設計する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:00:19 GMT)
Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning [62.4] 本稿では,行動列上のQ値を出力する批判ネットワークを学習する新しいRLアルゴリズムを提案する。
提案アルゴリズムは,現在および将来の一連の行動の実行結果を学習するために値関数を明示的に訓練することにより,ノイズのある軌道から有用な値関数を学習することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:23:52 GMT)
Gradient Normalization Provably Benefits Nonconvex SGD under Heavy-Tailed Noise [60.9] 重み付き雑音下でのグラディエントDescence(SGD)の収束を確実にする上での勾配正規化とクリッピングの役割について検討する。
我々の研究は、重尾雑音下でのSGDの勾配正規化の利点を示す最初の理論的証拠を提供する。
我々は、勾配正規化とクリッピングを取り入れた加速SGD変種を導入し、さらに重み付き雑音下での収束率を高めた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:34:33 GMT)
Pixel-Inconsistency Modeling for Image Manipulation Localization [60.0] デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:34:58 GMT)
Smoke and Mirrors in Causal Downstream Tasks [59.9] 本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:48:17 GMT)
SoK: Unifying Cybersecurity and Cybersafety of Multimodal Foundation Models with an Information Theory Approach [58.9] MFM(Multimodal foundation model)は、人工知能の大幅な進歩を表す。
本稿では,マルチモーダル学習におけるサイバーセーフティとサイバーセキュリティを概念化する。
我々は、これらの概念をMFMに統一し、重要な脅威を特定するための総合的知識体系化(SoK)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:22:23 GMT)
AI Flow at the Network Edge [58.3] AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:51:17 GMT)
When Backdoors Speak: Understanding LLM Backdoor Attacks Through Model-Generated Explanations [58.3] 大規模言語モデル(LLM)は、バックドア攻撃に対して脆弱である。
本稿では,自然言語説明の新しいレンズを用いたバックドア機能について検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:11:36 GMT)
PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.3] 2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:55:53 GMT)
Motif Channel Opened in a White-Box: Stereo Matching via Motif Correlation Graph [57.7] ステレオマッチングのための新しい学習パラダイムであるMoCha-V2を提案する。
MoCha-V2はMotif correlation Graph (MCG)を導入し、機能チャネル内で「モチーフ」と呼ばれる反復的なテクスチャをキャプチャする。
得られたモチーフ特徴を利用してステレオマッチングプロセスの幾何学的構造を復元する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:26:21 GMT)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment [57.0] 本研究では,視覚言語アライメントを改善するための細粒度検証器として,モデル自身のビジュアルエンコーダを利用する新たな自己アライメント手法であるFiSAOを提案する。
ビジョンエンコーダからのトークンレベルのフィードバックを活用することで、FiSAOは視覚言語アライメントを大幅に改善する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:08:34 GMT)
Scalable and Effective Negative Sample Generation for Hyperedge Prediction [55.9] ハイパーエッジ予測は、Webベースのアプリケーションにおける複雑なマルチエンタリティ相互作用を理解するために不可欠である。
従来の手法では、正と負のインスタンスの不均衡により、高品質な負のサンプルを生成するのが困難であることが多い。
本稿では,これらの課題に対処するために拡散モデルを利用するハイパーエッジ予測(SEHP)フレームワークのスケーラブルで効果的な負のサンプル生成について述べる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:16:25 GMT)
Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.3] 画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:24:03 GMT)
NMT-Obfuscator Attack: Ignore a sentence in translation with only one word [54.2] 我々はNMTモデルに対する新たなタイプの敵攻撃を提案する。
我々の攻撃は、NMTモデルに入力の第2部を50%以上のケースで無視させることに成功した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:55:22 GMT)
An Overview and Catalogue of Dependency Challenges in Open Source Software Package Registries [52.2] この記事では、OSSパッケージやライブラリに依存する依存関係関連の課題のカタログを提供する。
このカタログは、これらの課題を理解し、定量化し、克服するために行われた経験的研究に関する科学文献に基づいている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:44:16 GMT)
Neuro-3D: Towards 3D Visual Decoding from EEG Signals [51.6] 脳波信号から3次元視覚知覚を復号する新しい神経科学タスクを導入する。
まず、ビデオと画像の両方でレンダリングされた72の3Dオブジェクトのカテゴリを閲覧する12人の被験者から、マルチモーダル分析データと脳波記録を含むデータセットであるEEG-3Dを提示する。
脳波信号に基づく3次元視覚デコーディングフレームワークNeuro-3Dを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:52:17 GMT)
Dimensions of Generative AI Evaluation Design [51.5] 我々は、GenAI評価設計に関わる重要な選択を捉えるための一般的な次元のセットを提案する。
これらの次元には、評価設定、タスクタイプ、入力ソース、インタラクションスタイル、期間、メトリックタイプ、スコアリング方法が含まれる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:25:30 GMT)
Beyond Gaussians: Fast and High-Fidelity 3D Splatting with Linear Kernels [51.1] 本稿では,ガウスカーネルを線形カーネルに置き換えて,よりシャープで高精度な結果を得る3Dリニアスティング(DLS)を提案する。
3DLSは、最先端の忠実さと正確さを示し、ベースライン3DGSよりも30%のFPS改善を実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:59:54 GMT)
Sparser Training for On-Device Recommendation Systems [50.7] 動的スパーストレーニング(DST)に基づく軽量埋め込み手法であるスパースRecを提案する。
これは、重要なベクトルの部分集合をサンプリングすることによって、バックプロパゲーション中の密度勾配を避ける。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:48:48 GMT)
On the Constant Depth Implementation of Pauli Exponentials [49.5] 任意の指数を$mathcalO(n)$ ancillae と 2体 XX と ZZ の相互作用を用いて一定深さの回路に分解する。
クビットリサイクルの恩恵を受ける回路の書き直し規則を導入し,本手法の正しさを実証する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:02:51 GMT)
Exceptional Points and Stability in Nonlinear Models of Population Dynamics having $\mathcal{PT}$ symmetry [49.2] 我々は、進化ゲーム理論の複製子方程式と、人口動態のロトカ・ボルテラ系によって支配されるモデルを分析する。
a) 支配対称性特性がモデルの大域的性質と結びついている場合、および(b) それらの対称性が定常状態の周囲に局所的に現れる場合の2つのケースにおける例外点の出現について検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:15:59 GMT)
Entanglement of Disjoint Intervals in Dual-Unitary Circuits: Exact Results [49.2] 量子クエンチ後の解離部分系と補体の絡み合いの増大は、動的カオス指標と見なされる。
ほぼ全ての二重ユニタリ回路において、絡み合いのダイナミクスはカオスシステムに期待されるものと一致することを示す。
多くの保存電荷を持つにもかかわらず、電荷保存二重単位回路は一般にヤン・バクスター積分とはならない。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:41:31 GMT)
A Computational Method for Measuring "Open Codes" in Qualitative Analysis [49.1] オープンコーディングは、データセットから"オープンコード"を特定し解釈する、帰納的定性的なプロセスである。
本稿では,「オープンコード」から潜在的なバイアスを系統的に計測し,同定する計算手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:44:56 GMT)
A Survey of Medical Vision-and-Language Applications and Their Techniques [48.3] 医療ビジョン・アンド・ランゲージモデル(MVLM)は、複雑な医療データを解釈するための自然言語インタフェースを提供する能力から、大きな関心を集めている。
本稿では,MVLMの概要と適用した各種医療課題について概観する。
また、これらのタスクに使用するデータセットについても検討し、標準化された評価指標に基づいて異なるモデルの性能を比較した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:27:05 GMT)
Physics-Guided Detector for SAR Airplanes [48.1] SAR航空機のための新しい物理誘導検出器(PGD)学習パラダイムを提案する。
検出性能を向上させるために、その離散性と変動性を包括的に調査する。
実験では,提案したPGDの柔軟性と有効性を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:41:09 GMT)
Neurosymbolic Graph Enrichment for Grounded World Models [47.9] 複雑な問題に対処するために, LLM の反応性を向上し, 活用するための新しいアプローチを提案する。
我々は,大規模言語モデルの強みと構造的意味表現を組み合わせた,多モーダルで知識を付加した意味の形式表現を作成する。
非構造化言語モデルと形式的意味構造とのギャップを埋めることで、自然言語理解と推論における複雑な問題に対処するための新たな道を開く。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:23:55 GMT)
One-step Generative Diffusion for Realistic Extreme Image Rescaling [47.9] 極端画像再スケーリングのためのワンステップイメージ再スケーリング拡散(OSIRDiff)と呼ばれる新しいフレームワークを提案する。
OSIRDiffは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を実行する。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:41:13 GMT)
Discovery of Timeline and Crowd Reaction of Software Vulnerability Disclosures [47.4] Apache Log4Jはリモートコード実行攻撃に対して脆弱であることが判明した。
35,000以上のパッケージが最新バージョンでLog4Jライブラリをアップデートせざるを得なかった。
ソフトウェアベンダが脆弱性のないバージョンをリリースするたびに、ソフトウェア開発者がサードパーティのライブラリを更新するのは、事実上妥当です。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:02:02 GMT)
Asymptotic robustness of entanglement in noisy quantum networks and graph connectivity [46.4] リンクが騒々しい場合には,ネットワークのグローバルな絡み合い特性に関して,大きく異なる2つの挙動が生じることを示す。
特定の構成では、ノイズレベルが一定の閾値以下であれば、ネットワークは真のマルチパーティ・エンタングルメント(GME)を表示するが、他のGMEは、固定された非ゼロレベルのノイズに対してシステムサイズが十分大きい場合、洗い流される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:01:50 GMT)
Vision-Language Model Fine-Tuning via Simple Parameter-Efficient Modification [46.3] VLMのパラメータの微調整は、CLIPモデルの微調整が性能を低下させるため、事前訓練された知識を損なうと考えられている。
ClipFitはCLIPを微調整する手法で、余分なパラメータのオーバーヘッドを発生させることなく提案する。
ClipFitが0ショットCLIPの性能を平均調和平均精度7.27%向上できることを実証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:27:37 GMT)
Q-DiT: Accurate Post-Training Quantization for Diffusion Transformers [45.8] ポストトレーニング量子化(PTQ)は有望なソリューションとして登場し、事前訓練されたモデルに対するモデル圧縮と高速化推論を可能にする。
DiT量子化の研究は依然として不十分であり、既存のPTQフレームワークは偏りのある量子化に悩まされがちである。
入力チャネル間での重みとアクティベーションの有意な分散を扱うための自動量子化粒度割当と、タイムステップとサンプルの両方にわたるアクティベーション変化を適応的にキャプチャする標本ワイド動的アクティベーション量子化という、2つの重要な手法をシームレスに統合する新しいアプローチであるQ-DiTを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:58:07 GMT)
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation [45.3] Whisperのような音声モデルは、数十万時間のデータで訓練されているため、より良い音声からテキストへのデコーダを学ぶことができる。
本稿では,Whisper音声認識と翻訳モデルに視覚的特徴を統合するWhisper-Flamingoを提案する。
LRS3 では最先端の ASR WER (0.68%) と AVSR WER (0.76%) を, LRS2 では最先端の ASR WER (1.3%) と AVSR WER (1.4%) を達成した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:19:43 GMT)
Entanglement structures in disordered chains of nitrogen-vacancy centers [45.0] 本研究では, 最大10個の連結スピンの鎖の接続性について検討した。
周期的に間隔を保ったスピンでは、固有状態の大部分が強い接続性を示し、特にスペクトルの中心と長い鎖に向いている。
位置障害はレジスタの接続性を変化させたり、あるいは減少させるが、ほとんど抑制しない。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:26:03 GMT)
A SAM-guided Two-stream Lightweight Model for Anomaly Detection [44.7] 我々は、教師なし異常検出(STLM)のためのSAM誘導2ストリーム軽量モデルを提案する。
MVTec ADベンチマークを用いて行った実験により,約16Mのパラメータを持ち,20msの推論時間を実現したSTLMは,最先端の手法と効果的に競合することが示された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:54:14 GMT)
Medical Adaptation of Large Language and Vision-Language Models: Are We Making Progress? [44.3] 医療モデルでは, ゼロ/フェールシューティング方式では, 基礎モデルよりも常に改善が得られないことが示される。
以上の結果から,最先端の汎用ドメインモデルはすでに強力な医学的知識と推論能力を持っている可能性が示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:51:58 GMT)
XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX [44.1] XLand-MiniGridは、メタ強化学習研究のためのツールとグリッドワールド環境のスイートである。
JAXで書かれたXLand-MiniGridは高度にスケーラブルで、GPUやTPUアクセラレータ上で実行することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:52:55 GMT)
Large Language Models for Lossless Image Compression: Next-Pixel Prediction in Language Space is All You Need [42.9] 前例のないインテリジェンスを持つ言語大モデル(LLM)は、様々なデータモダリティのための汎用ロスレス圧縮機である。
P$2$-LLMは,様々な入念な洞察と方法論を統合した次世代の予測型LLMである。
ベンチマークデータセットの実験では、P$2$-LLMがSOTAの古典的および学習的コーデックに勝ることを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:15:40 GMT)
Prototype Optimization with Neural ODE for Few-Shot Learning [41.7] FewShot Learningは、いくつかの例で新しいクラスを認識することを目的としている。
データ不足のため、平均ベースのプロトタイプは通常バイアスを受けます。
そこで本研究では,プロトタイプを最適化するメタ最適化手法を導入することで,プロトタイプを修正できる新しいプロトタイプ最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:17:25 GMT)
Invariant Shape Representation Learning For Image Classification [41.6] 本稿では,不変形状表現学習(ISRL)を初めて開発した新しいフレームワークを提案する。
我々のモデルISRLは、変形可能な変換によってパラメータ化される潜在形状空間における不変特徴を共同でキャプチャするように設計されている。
異なる環境にターゲット変数に関して不変な機能を埋め込むことで、我々のモデルは一貫してより正確な予測を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:39:43 GMT)
Visualizing Loss Functions as Topological Landscape Profiles [41.2] 機械学習では、損失関数はモデル予測と接地真実(または目標)値の違いを測定する。
ニューラルネットワークモデルでは、モデルパラメータが変化するにつれてこの損失がどのように変化するかを視覚化することで、いわゆるロスランドスケープの局所構造に関する洞察を得ることができる。
本稿では,高次元ロスランドスケープの可視化を可能にするトポロジカルデータ解析に基づく新しい表現を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:28:14 GMT)
GNN-Based Code Annotation Logic for Establishing Security Boundaries in C Code [41.1] 今日の相互接続されたソフトウェアランドスケープにおけるセンシティブなオペレーションの確保は、非常に難しいものです。
現代のプラットフォームは、セキュリティに敏感なコードをメインシステムから分離するために、Trusted Execution Environments (TEEs) に依存している。
Code Logic(CAL)は、TEE分離のためのセキュリティに敏感なコンポーネントを自動的に識別する先駆的なツールである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:35:01 GMT)
LibEvolutionEval: A Benchmark and Study for Version-Specific Code Generation [40.9] LibEvolutionEvalは,インラインコード補完を正確に行うために,ライブラリ進化の理解を必要とする研究である。
パブリック・モデルの評価を行い、パブリック・ライブラリの進化がモデルの性能に大きく影響することを発見した。
本稿では,検索したバージョン固有のライブラリの文書化と,高速に進化するパッケージを扱う際のモデルの能力向上について検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:52:23 GMT)
A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions [40.8] 大規模言語モデル(LLM)の出現は、自然言語処理(NLP)において大きなブレークスルーとなった。
LLMは幻覚を起こす傾向があり、可視だが非現実的な内容を生成する。
この現象は、実世界の情報検索システムにおけるLCMの信頼性に対する重大な懸念を引き起こす。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:42:45 GMT)
Disentangling critical quantum spin chains with Clifford circuits [39.6] クリフォード回路は、ゴッテマン・クニルの定理のおかげで、コストで量子状態を切り離すのに利用できる。
このアイデアに基づいて、Clifford Circuits Augmented Matrix Product States (CAMPS) が最近提案され、様々な量子系の絡み合いを低減できることが示されている。
本研究では、スケーリング限界における共形場理論(CFT)によって記述された臨界スピン鎖におけるCAMPS法のパワーについて検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:39:54 GMT)
Diversity-Driven Synthesis: Enhancing Dataset Distillation through Directed Weight Adjustment [39.1] 多様性の向上は、データセットを合成するための並列化可能であるが孤立したアプローチを改善することができる、と我々は主張する。
本稿では,動的かつ指向的な重み調整技術を用いて合成過程を変調する新しい手法を提案する。
提案手法は,合成データの各バッチが,元のデータセットの大規模かつ多様なサブセットの特徴を反映していることを保証する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:05:56 GMT)
Multilingual Large Language Models: A Systematic Survey [39.0] 本稿では,多言語大言語モデル(MLLM)の最新研究を包括的に調査する。
まず,MLLMのアーキテクチャと事前学習の目的について論じ,多言語機能に寄与する重要なコンポーネントや方法論を強調した。
本稿では,MLLMの言語間知識,推論,人的価値との整合性,安全性,解釈可能性,専門的応用に関する詳細な分類とロードマップを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:45:13 GMT)
Divide-or-Conquer? Which Part Should You Distill Your LLM? [38.6] 我々は、推論タスクを問題解決フェーズと問題解決フェーズに分解する同様の戦略を考案する。
戦略が単一ステージソリューションより優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:46:16 GMT)
Improving Multi-task Learning via Seeking Task-based Flat Regions [38.3] MTL(Multi-Task Learning)は、ディープニューラルネットワークをトレーニングするための強力な学習パラダイムである。
MTLには、究極の勾配降下方向を導出するためにタスク勾配を操作することに焦点を当てた、新たな作業ラインがある。
単タスク学習におけるモデル一般化能力を向上するシャープネス認識最小化という,最近導入されたトレーニング手法を活用することを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:17:58 GMT)
A Demonstration of Adaptive Collaboration of Large Language Models for Medical Decision-Making [38.2] 大規模言語モデル(LLM)は、膨大な医療知識とマルチモーダルヘルスデータを合成することで、このプロセスを合理化することを約束する。
我々のMDAgentsは、タスクの複雑さに基づいて協調構造をLLMに動的に割り当てることで、このニーズに対処します。
このフレームワークは、診断精度を改善し、複雑な現実世界の医療シナリオにおける適応応答をサポートする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:46:48 GMT)
GeSS: Benchmarking Geometric Deep Learning under Scientific Applications with Distribution Shifts [37.0] 分散シフトを伴う科学シナリオにおけるGDLモデルの性能評価のためのベンチマークであるGeSSを提案する。
評価データセットは, 粒子物理学, 材料科学, 生化学まで多様な科学領域を網羅し, 分布シフトの幅広い範囲をカプセル化している。
ベンチマークの結果,30の異なる実験環境が得られ,それぞれに3つのGDLバックボーンと11の学習アルゴリズムが評価された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:01:28 GMT)
Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition [36.6] STR(RCMSTR)のためのコントラスト学習とマスケ画像モデリングの統合フレームワークを提案する。
提案したRCMSTRは、STR関連下流タスクにおいて優れた性能を示し、既存の最先端の自己教師型STR技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:40:06 GMT)
Provable unlearning in topic modeling and downstream tasks [36.6] アンラーニングの保証は、しばしば教師付き学習設定に限られる。
我々は、事前学習と微調整のパラダイムにおいて、初となるアンラーニングの理論的保証を提供する。
我々は、特定のタスクに微調整されたモデルから事前学習データを容易に解放できることを示し、ベースモデルを変更することなく、このデータを解放できることを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:04:31 GMT)
A-BDD: Leveraging Data Augmentations for Safe Autonomous Driving in Adverse Weather and Lighting [35.4] A-BDDは、BDD100Kをベースとした6万以上の合成画像の大規模な集合である。
データセットには、雨、霧、曇り、日陰、日陰の増設データが含まれており、強度レベルは様々である。
我々は、悪天候や照明条件における性能ギャップを埋める上で、データ拡張が重要な役割を果たす証拠を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:55:37 GMT)
VidComposition: Can MLLMs Analyze Compositions in Compiled Videos? [35.1] VidCompositionは、マルチモーダル大言語モデル(MLLM)の映像合成理解能力を評価するためのベンチマークである。
これには、カメラの動き、アングル、ショットサイズ、物語構造、キャラクターの動作、感情など、様々な構成的な側面をカバーしている。
33個のオープンソースおよびプロプライエタリなMLLMを総合的に評価した結果,人的・モデル的能力の差は顕著であった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:46:27 GMT)
Selective Attention: Enhancing Transformer through Principled Context Control [33.9] SSA(textitSelective Self-Attention$)層を導入し,ソフトマックスの非線形性を原理的温度スケーリング戦略で強化する。
これは注意の希釈を軽減し、最適化プロセスを支援し、個々のクエリのソフトマックススパイキネスを制御するモデルの能力を高めることを実証する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:17:18 GMT)
The More the Merrier: On Evolving Five-valued Spectra Boolean Functions [32.9] ウォルシュ=アダマール係数を持つ5値のスペクトルブール関数は、5つの異なる値しか持たない。
木符号化は他の選択よりも優れていることを示し、高い非線形性を持つ5値のブール関数を得ることができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:57:55 GMT)
Robust 3D Semantic Occupancy Prediction with Calibration-free Spatial Transformation [32.5] マルチカメラとLiDARを備えた自動運転車では、高精度で堅牢な予測のために、マルチセンサー情報を統一された3D空間に集約することが重要である。
最近の手法は主にセンサキャリブレーションに依存する2D-to-3D変換に基づいて構築され,2D画像情報を3D空間に投影する。
本研究では,空間対応を暗黙的にモデル化するために,バニラ注意に基づく校正自由空間変換を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:40:42 GMT)
Efficient Contextual LLM Cascades through Budget-Constrained Policy Learning [32.0] TREACLEは、ユーザの金銭的コストとレイテンシの制約を尊重しながら、モデルとプロンプトスキームを共同で選択する強化学習ポリシーである。
評価の結果,TREACLEはベースラインに比べて最大85%のコスト削減が可能であり,精度は高いことがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:02:49 GMT)
Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service [31.9] 我々は,Timor-Lesteのリンガ・フランカであるTetunについて,実世界のMT利用の観察分析を行った。
10万ドルの翻訳要求を分析してみると、既存のコーパスに基づいて仮定に挑戦するパターンが明らかになる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:21:51 GMT)
MaIL: Improving Imitation Learning with Mamba [31.0] Mamba Imitation Learning (MaIL)は、最先端(SoTA)トランスフォーマーベースのポリシーの代替を提供する。
Mambaのアーキテクチャは、重要な特徴に焦点をあてることで、表現学習効率を高める。
MaILは、制限されたデータで全てのLIBEROタスクでトランスフォーマーを一貫して上回る。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:44:36 GMT)
Why you don't overfit, and don't need Bayes if you only train for one epoch [30.7] データリッチな設定では、各データポイントのみをトレーニングする(あるいは、同じことを、ひとつのエポックでのみトレーニングする)が、標準的な"最大可能性"トレーニングは、テスト損失に相当する真のデータ生成プロセス(DGP)損失を最適化します。
我々はベイズ推定がこれらの設定における過度な適合や校正の面でいかなる利点も与えるとは考えていないと論じている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:36:48 GMT)
On Size and Hardness Generalization in Unsupervised Learning for the Travelling Salesman Problem [30.7] 旅行セールスマン問題(TSP)における教師なし学習の一般化能力について検討する。
代理損失関数で訓練されたグラフニューラルネットワーク(GNN)を用いて各ノードに埋め込みを生成する。
次に、最終予測を生成するために局所探索を適用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:23:29 GMT)
Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models [30.1] 推論タスクを行う際に,大規模言語モデルが採用する一般化戦略について検討する。
以上の結果から, モデルを用いた推論手法は検索と異なり, より一般化可能な戦略であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:47:12 GMT)
Conformal Prediction for Class-wise Coverage via Augmented Label Rank Calibration [30.0] 本稿では,クラス条件カバレッジを実現するための予測セットサイズを削減するために,ランク校正型クラス条件CP(RC3P)アルゴリズムを提案する。
複数の実世界のデータセットの実験により、RC3Pは平均的な予測セットサイズを26.25%削減した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:56:07 GMT)
Large-scale cross-modality pretrained model enhances cardiovascular state estimation and cardiomyopathy detection from electrocardiograms: An AI system development and multi-center validation study [29.8] 本研究はCMRの診断強度を活用して心電図解析を強化する革新的なモデルであるCardiacNetsを紹介する。
心臓神経は、冠動脈疾患、心筋症、心膜炎、心不全、肺高血圧など、潜在的なCVDの心臓機能指標とスクリーニングを評価する。
その結果、CardiacNetsは従来のECGのみのモデルより一貫して優れており、スクリーニング精度が大幅に向上していることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:09:14 GMT)
Order Is All You Need for Categorical Data Clustering [29.3] 名目価値属性からなる分類データは、知識発見やデータマイニングのタスクにおいてユビキタスである。
適切に定義された距離空間がないため、分類データの分布は直感的に理解することが難しい。
本稿では,属性値間の順序関係がクラスタリング精度の決定的要因であることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:23:25 GMT)
Findings of the First Workshop on Simulating Conversational Intelligence in Chat [29.1] ワークショップの目的は、オープンドメインの対話研究に取り組む専門家を集結させることだった。
本論文の主な目的は,共有タスクの概要とワークショップでのプレゼンテーション後の共有タスク結果の詳細な分析を提供することである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:41:04 GMT)
Beyond Perceptual Distances: Rethinking Disparity Assessment for Out-of-Distribution Detection with Diffusion Models [29.0] Out-of-Distribution (OoD) 検出は、与えられたサンプルが分類器アンダープロテクションのトレーニング分布からのものであるかどうかを正当化することを目的としている。
DMベースの手法は、この分野に新たな洞察をもたらすが、未調査のままである。
本研究は、DM法における最先端検出性能を広範囲にわたる実験で実証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:55:22 GMT)
Zero-Shot Image Denoising for High-Resolution Electron Microscopy [28.3] 高分解能電子顕微鏡(HREM)イメージング技術は、広い範囲の物質を直接リアルタイムに可視化するための強力なツールである。
超低信号対雑音比(SNR)とデータ可用性の不足により、ノイズ除去の課題に直面している。
HREMのためのゼロショット自己教師型学習(ZS-SSL)フレームワークであるNoss2SRを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:51:58 GMT)
Generative World Explorer [28.1] 部分観察による計画は、AIの具体化における中心的な課題である。
我々は,エゴセントリックな世界探査フレームワークであるtextitGenerative World Explorer (Genex)$を紹介した。
Genexは、エージェントが大規模3D世界を精神的に探索し、その信念を更新するために想像された観察を得ることを可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:59:42 GMT)
Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting [27.5] 3Dガウススプレイティングを用いたロボットマニピュレータの能動的次ベストビューとタッチ選択のためのフレームワーク(3DGS)を提案する。
我々はまず,新しい意味深度アライメント法により,数発の3DGSの性能を向上する。
次に、3DGSの次のベストビュー選択方法であるFisherRFを拡張して、奥行きの不確実性に基づいたビューとタッチポーズを選択する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:23:47 GMT)
Exploiting Cross-Layer Vulnerabilities: Off-Path Attacks on the TCP/IP Protocol Suite [27.0] ICMPエラーメッセージによるTCP/IPプロトコルスイート内の層間相互作用について検討する。
情報漏洩、非同期化、セマンティックギャップ、アイデンティティスプーリングなど、いくつかの重大な脆弱性を発見しました。
これらの脆弱性は、ネットワークトラフィックを密かに操作するオフパス攻撃者によって悪用され、人気のあるウェブサイトの20%以上と公共Wi-Fiネットワークの89%以上に影響を与える。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:01:05 GMT)
Logical computation demonstrated with a neutral atom quantum processor [26.4] 距離2符号を用いて24個の論理量子ビットの絡み合いを示し、同時に誤りを検出し、損失量子ビットの補正を行う。
また,[4,1,2]コードで符号化された最大28個の論理量子ビットを用いて,Bernstein-Vaziraniアルゴリズムを実装した。
これらの結果は、プログラム可能な中性原子量子プロセッサで科学的量子優位を達成するための道を切り開く。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:55:32 GMT)
Multilingual large language models leak human stereotypes across language boundaries [25.9] モデルを多言語で訓練すると、ある言語で表現されたステレオタイプが、別の言語でモデルの振る舞いに現れる可能性がある。
ステレオタイプ漏洩の測定フレームワークを提案し,その影響を英語,ロシア語,中国語,ヒンディー語で調査する。
GPT-3.5は最もステレオタイプのリークであり,Hindiは最もリークの影響を受けやすい。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:33:17 GMT)
SkillTree: Explainable Skill-Based Deep Reinforcement Learning for Long-Horizon Control Tasks [25.7] 複雑な連続的なアクション空間を離散的なスキル空間に還元する新しいフレームワークであるSkillTreeを提案する。
スキル決定を説明可能なものにすることで、スキルレベルの説明可能性を実現し、複雑なタスクにおける意思決定プロセスの理解を深める。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:35:14 GMT)
Architectural Patterns for Designing Quantum Artificial Intelligence Systems [25.4] 人工知能システムを強化するために量子コンピューティング技術を利用することで、トレーニングと推論時間を改善し、ノイズや敵攻撃に対する堅牢性を高め、精度を損なうことなくパラメータの数を減らすことが期待されている。
しかし、概念実証やシミュレーションを超えてこれらのシステムの実用的な応用を開発することは、量子ハードウェアの限界とそのようなシステムのソフトウェア工学における未発達の知識基盤によって大きな課題に直面している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:11:58 GMT)
Combinational Backdoor Attack against Customized Text-to-Image Models [25.4] カスタマイズT2Iモデルに対するコンビネーションバックドア攻撃(CBACT2I)
この研究は、カスタマイズされたT2Iモデルのバックドア脆弱性を明らかにし、バックドアの脅威を軽減するための対策を奨励する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:20:31 GMT)
UrbanDiT: A Foundation Model for Open-World Urban Spatio-Temporal Learning [25.2] UrbanDiTTは、オープンワールドの都市時間学習の基礎モデルである。
多様な時間的データソースと、さまざまな都市やシナリオにまたがるタイプを統合している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:01:07 GMT)
Literature Meets Data: A Synergistic Approach to Hypothesis Generation [25.0] 本研究では,文献に基づく洞察とデータを組み合わせて仮説生成を行う手法を開発した。
また,人間の意思決定を支援するためのLLM生成仮説の有用性を評価するための最初の人的評価を行った。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:32:13 GMT)
Quantum teleportation with dissimilar quantum dots over a hybrid quantum network [24.6] 量子ネットワークにおけるフォトニック量子情報処理は、クラウド量子コンピューティング、セキュアな通信、グローバル量子インターネットの実現の基礎を成している。
ここでは、遠方部における全フォトニック量子テレポーテーションを実現するために、異なる量子エミッタの活用を実証する。
達成されたテレポーテーション状態の忠実度は、標準偏差が10以上の古典的限界を超える82+-1%に達する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:16:58 GMT)
SoK: On the Role and Future of AIGC Watermarking in the Era of Gen-AI [24.2] AIGCの透かしは、悪意のあるアクティビティを緩和するための効果的なソリューションを提供する。
透かしのコア特性に基づいた分類法を提供する。
我々はAIGC透かしの機能とセキュリティの脅威について論じる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:11:22 GMT)
Synergizing LLM Agents and Knowledge Graph for Socioeconomic Prediction in LBSN [24.0] 位置情報ベースのソーシャルネットワーク(LBSN)は、社会に大きな変化をもたらし、社会経済予測にLBSNデータを使用することが広く研究されている。
既存のアプローチは、様々なデータからタスク関連知識を抽出するアイデアと専門知識に依存しており、これは特定のタスクに最適ではないかもしれない。
本研究は,大言語モデル(LLM)の常識推論,埋め込み,マルチエージェント協調における顕著な能力により,LLMエージェントと知識グラフを社会経済予測のために相乗化したものである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:29:32 GMT)
Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models [22.4] 我々は,テストタイムの欲求検索として,大規模言語モデルのアライメントをフレーミングする,$textitweak-to-strong検索を導入する。
制御された知覚生成と要約では、チューニングされていない$textttgpt2$sを使用して、追加のトレーニングなしで大規模モデルのアライメントを改善する。
より難しい命令追従ベンチマークでは、市販の小型モデルの再利用により、ホワイトボックスモデルとブラックボックスモデルの両方の長制御された勝利率を改善することが示されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:27:30 GMT)
Automated 3D Physical Simulation of Open-world Scene with Gaussian Splatting [22.4] Sim Anythingは、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える物理ベースのアプローチである。
人間の視覚的推論に触発されて,MLLMに基づく物理特性知覚を提案する。
また、物理幾何学的適応サンプリングを用いて粒子をサンプリングして、オープンワールドシーンでオブジェクトをシミュレートする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:52:21 GMT)
Revisiting Fake News Detection: Towards Temporality-aware Evaluation by Leveraging Engagement Earliness [22.3] ソーシャルグラフに基づく偽ニュース検出は、社会的文脈を利用して偽情報を含むニュース記事を特定することを目的としている。
我々は、現実のシナリオを模倣するより現実的な評価スキームを定式化する。
従来の手法の識別能力は,この新しい設定下で急激に低下することを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:08:00 GMT)
Visual-Oriented Fine-Grained Knowledge Editing for MultiModal Large Language Models [22.3] 既存の知識編集は、主にテキスト指向で粗いシナリオに焦点を当てている。
本稿では,複数の対話型エンティティを持つ画像の正確な編集をターゲットとした,視覚指向できめ細かなマルチモーダル知識編集タスクを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:49:36 GMT)
RayFormer: Improving Query-Based Multi-Camera 3D Object Detection via Ray-Centric Strategies [22.0] RayFormerはカメラにインスパイアされたクエリーベースの3Dオブジェクト検出器である。
画像と鳥の視線の両方に特徴サンプリング点の分布を整理するレイサンプリング法を提案する。
提案されたRayFormerは、それぞれ55.5% mAPと63.3% NDSの優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:02:15 GMT)
HyperGAN-CLIP: A Unified Framework for Domain Adaptation, Image Synthesis and Manipulation [21.7] GAN(Generative Adversarial Networks)は、非常にリアルな画像を生成する際、顕著な能力を示した。
本稿では,CLIP空間をハイパーネットワーク経由で統合することにより,事前学習したStyleGANの機能を大幅に拡張する新しいフレームワークを提案する。
提案手法は,テキスト固有のトレーニングデータを必要としないテキスト誘導画像操作が可能な,前例のない柔軟性を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:36:18 GMT)
Detecting Multi-Parameter Constraint Inconsistencies in Python Data Science Libraries [21.7] コードとドキュメンテーションの不整合を検出するためにMPDetectorを提案する。
MPDetectorは、シンボリック実行を通じて実行パスを探索することで、これらの制約をコードレベルで識別する。
本研究では,LLM出力の予測不可能性を再現するファジィ制約論理を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:25:03 GMT)
ControlNet++: Improving Conditional Controls with Efficient Consistency Feedback [20.9] ControlNet++は、生成した画像と条件付き制御の間のピクセルレベルのサイクル一貫性を明示的に最適化することで、制御可能な生成を改善する新しいアプローチである。
ControlNetの11.1%のmIoU、13.4%のSSIM、7.6%のRMSE、それぞれセグメンテーションマスク、ラインアートエッジ、深さ条件の改善を実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:23:20 GMT)
Frequency-Aware Guidance for Blind Image Restoration via Diffusion Models [20.9] ブラインド画像復元は、低レベルの視覚タスクにおいて重要な課題である。
誘導拡散モデルは、視覚的画像復元において有望な結果を得た。
本稿では,様々な拡散モデルにプラグイン・アンド・プレイ方式で組み込むことができる新しい周波数対応誘導損失を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:18:16 GMT)
Sufficient Invariant Learning for Distribution Shift [20.9] 本稿では,SIL(Sufficient Invariant Learning)フレームワークという新しい学習原理を紹介する。
SILは、単一の機能に頼るのではなく、不変機能の十分なサブセットを学ぶことに重点を置いている。
本稿では,適応シャープネスを意識したグループ分散ロバスト最適化(ASGDRO)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:06:13 GMT)
Benchmarking Positional Encodings for GNNs and Graph Transformers [20.7] 本稿では、メッセージパッシングGNNとGTの両方を含む統一フレームワークにおいて、位置 s (PE) のベンチマークを示す。
また,MPNNとGT間の理論的接続を確立するとともに,グローバル接続の影響を調べるためのGRITアテンション機構を導入する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:57:01 GMT)
Escalating LLM-based Code Translation Benchmarking into the Class-level Era [20.2] ClassEval-Tは、Large Language Models (LLM)向けのクラスレベルのコード変換ベンチマークである。
ClassEvalをベースに構築されたClassEval-Tは、JavaとC++に拡張され、完全なコードサンプルとテストスイートが提供される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:19:27 GMT)
Off-policy estimation with adaptively collected data: the power of online learning [20.0] 適応的に収集したデータを用いて, 処理効果の線形関数を推定する。
本稿では,オンライン学習を通じて治療効果の一連の推定を生成できる一般還元方式を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:18:27 GMT)
3D-Consistent Human Avatars with Sparse Inputs via Gaussian Splatting and Contrastive Learning [19.8] CHASEはスパース入力のみを使用して高密度なインプットレベルのパフォーマンスを実現する新しいフレームワークである。
トレーニングセットからの類似のポーズを活用することにより,変形したガウスを洗練する動的アバター調整(DAA)モジュールを導入する。
スパース入力用に設計されているが、CHASEはZJU-MoCapとH36Mデータセットのフル設定とスパース設定の両方で最先端のメソッドを超越している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:49:14 GMT)
SpikingNeRF: Making Bio-inspired Neural Networks See through the Real World [19.7] 本稿では、スパイキングニューラルネットワーク(SNN)の時間次元を放射光に合わせるスパイキングNeRFを提案する。
計算はスパイクベースで乗算のない方式に変わり、エネルギー消費を減らし、ニューロモルフィックなハードウェアで高品質な3Dレンダリングを可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:55:52 GMT)
Adapting Amidst Degradation: Cross Domain Li-ion Battery Health Estimation via Physics-Guided Test-Time Training [19.6] リチウムイオン電池(LIB)の健康モデリングは、安全で効率的なエネルギー管理に不可欠であり、社会経済的に重要な意味を持つ。
本稿では,劣化中の各対象データ(UTD)を連続的に使用してモデルを適応させる,実践的なテストタイムトレーニングフレームワークであるBatteryTTTを紹介する。
それぞれのUTDを完全に活用するために、BatteryTTTはPhyscics-Guided Test-Time Trainingと呼ばれる、現代のLIB固有の物理法則を自己教師付き学習に統合する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:08:44 GMT)
Sketch-guided Cage-based 3D Gaussian Splatting Deformation [19.4] 3D Gaussian Splatting (GS)は最も有望な3D表現の1つである。
本稿では,3次元GSモデルの形状を直感的に修正できる3次元GS変形システムを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:18:19 GMT)
Reference-free Hallucination Detection for Large Vision-Language Models [19.4] 大規模視覚言語モデル(LVLM)は近年大きな進歩を遂げている。
LVLMは、言語理解、質問応答、視覚入力の会話において優れた能力を示す。
彼らは幻覚を起こす傾向がある。
LVLMの幻覚を評価するためにいくつかの手法が提案されているが、そのほとんどは参照ベースであり、外部ツールに依存している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:22:21 GMT)
GraphSnapShot: Graph Machine Learning Acceleration with Fast Storage and Retrieval [19.2] GraphSnapShotは、グラフ学習のための高速キャッシュ、ストレージ、検索、計算のためのフレームワークである。
実験では、GraphSnapShotは効率性を示し、最大30%のトレーニングアクセラレーションと73%のメモリ削減を達成することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:24:03 GMT)
NACNet: A Histology Context-aware Transformer Graph Convolution Network for Predicting Treatment Response to Neoadjuvant Chemotherapy in Triple Negative Breast Cancer [19.2] 三重複性乳癌(TNBC)に対するネオアジュバント化学療法(NAC)反応予測は臨床的に難しい課題である。
我々はNAC応答を予測するため,NACNet (Histology context-aware transformer graph convolution Network) を開発した。
我々のNACNetは、90.0%の精度、96.4%の感度、88.0%の特異性、および8倍のクロスバリデーションによって0.82のAUCを達成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:43:22 GMT)
Towards Unifying Feature Interaction Models for Click-Through Rate Prediction [19.1] 我々は、既存のモデルを統一する、IPAと呼ばれる一般的なフレームワークを提案する。
これらの3つのコンポーネントに対して特定の選択を行うことで、既存のモデルの大部分をフレームワーク内で分類できることを実証します。
我々は,最先端のCTRモデルと比較して,競争力のある結果が得られる新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:04:02 GMT)
PseudoSeer: a Search Engine for Pseudocode [18.7] 疑似コードを含む学術論文の効率的な検索と検索を容易にするために、新しい擬似コード検索エンジンが設計された。
スニペットを活用することで、ユーザはタイトル、抽象情報、著者情報、コードスニペットなど、紙のさまざまな面を検索できる。
重み付けされたBM25ベースのランキングアルゴリズムを検索エンジンで使用し、検索結果の優先順位付け時に考慮される要因について述べる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:58:03 GMT)
Mitigating Perception Bias: A Training-Free Approach to Enhance LMM for Image Quality Assessment [18.6] 画像品質評価のためのトレーニング不要な脱バイアスフレームワークを提案する。
まず,画像品質を著しく劣化させる意味保存歪みについて検討する。
次に、これらの特定の歪みをクエリやテストイメージに適用します。
品質推測の間、クエリ画像とそれに対応する劣化バージョンの両方をLMMに供給する。
劣化した画像は、セマンティックな違いに関わらず、常に品質が劣っていると評価される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:00:59 GMT)
A Layered Architecture for Developing and Enhancing Capabilities in Large Language Model-based Software Systems [18.6] 本稿では,Large Language Models (LLM) ソフトウェアシステムの開発を異なるレイヤにまとめる階層アーキテクチャを提案する。
これらのレイヤと機能を整合させることで、このフレームワークは、効果的かつ効率的な方法で機能の体系的な実装を奨励します。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:18:20 GMT)
Stacking Brick by Brick: Aligned Feature Isolation for Incremental Face Forgery Detection [18.5] 鼻訓練IFFDモデルは、新しい偽造物が統合されると破滅的な忘れがちである。
本稿では、SURデータを利用して分布を分離・調整するLatent-space Incremental Detector(LID)を提案する。
評価のために、IFFDに適したより高度で包括的なベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:20:03 GMT)
Topology-aware Human Avatars with Semantically-guided Gaussian Splatting [18.4] 本研究では, セマンティクスを組み込んだ3次元ガウス, 骨格駆動型剛性変形, および非剛性布の動的変形を用いて, フォトリアリスティックな人間のアバターを創出するSG-GSを提案する。
我々は,人間のアバター変形にトポロジカルおよび幾何学的アソシエーションを統合する3Dネットワークを採用している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:48:43 GMT)
DynFocus: Dynamic Cooperative Network Empowers LLMs with Video Understanding [18.3] 我々は,繰り返しフレームと応答不関連フレームの両方で冗長が生じ,対応するフレームは異なる質問によって異なることを観察する。
このことは、詳細なビデオ情報保存とトークン予算削減のバランスをとるためにダイナミックエンコーディングを採用する可能性を示唆している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:16:54 GMT)
Testability of Instrumental Variables in Additive Nonlinear, Non-Constant Effects Models [18.3] 本稿では,変数が有効な楽器であるかどうかをテストするための補助的独立テスト(AIT)条件を提案する。
実世界の3つのデータセットの合成実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:56:45 GMT)
Trojan Cleansing with Neural Collapse [18.2] トロイの木馬攻撃は、バックドアトリガーを埋め込んだニューラルネットワークに対する高度な訓練時間攻撃である。
トロイの木馬攻撃が様々なデータセットやアーキテクチャのこの収束を阻害する実験的な証拠を提供する。
次に、この破壊を利用して、トロイの木馬攻撃を浄化するための軽量で広く一般化可能なメカニズムを設計する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:57:40 GMT)
Maps from Motion (MfM): Generating 2D Semantic Maps from Sparse Multi-view Images [18.0] OpenStreetMapは、1100万人の登録ユーザーが手動でGPSの位置情報に157億以上のエントリをアノテートした結果である。
同時に、手動のアノテーションにはエラーが含まれ、更新が遅く、マップの精度が制限される。
動きからのマップ (MfM) は、非校正された多視点画像のコレクションから直接意味オブジェクトの2Dマップを計算することにより、そのような時間を要する地図作成手順を自動化するためのステップである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:27:31 GMT)
Near-Optimal Time-Sparsity Trade-Offs for Solving Noisy Linear Equations [18.0] 次元 $Theta において、$mathbbZ/qmathbbZ$ 上の雑音線型方程式を解くことによる時間短縮を提案する。
密接な問題からスパース問題の硬さを推定する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:53:43 GMT)
An Affine Equivalence Algorithm for S-boxes based on Matrix Invariants [17.8] S_circ A = Bcirc SARIA$ が成り立つような 2 つの可逆 AE $A,B$ を求める。
本稿では,まずSボックス上での零化を提案し,この零化演算によりAE問題を線形同値問題に変換することができる。
我々のアルゴリズムを用いて、AES、ARIA、Camellia、Chiasmus、DBlock、SEED_S0、SMS4という7つの人気のあるSボックスがアフィン等価であり、これらのSボックスのAE変換が提供されるのを見つけるのに5.5秒しかかからない。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:19:36 GMT)
HNCSE: Advancing Sentence Embeddings via Hybrid Contrastive Learning with Hard Negatives [17.7] HNCSEは、主要なSimCSEアプローチを拡張する、新しい対照的な学習フレームワークである。
HNCSEの目玉は、正と負の両方のサンプルの学習を強化するために、ハードネガティブサンプルの革新的な利用である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:26:20 GMT)
Acquire Precise and Comparable Fundus Image Quality Score: FTHNet and FQS Dataset [17.6] 基礎画像品質評価(FIQA)におけるデータセットとアルゴリズムの限界に対処する。
従来のFIQA処理の分類結果よりも回帰結果を用いてこれらのタスクを解くために,FIQAトランスフォーマーベースハイパーネットワーク(FTHNet)を提案する。
FTHNetは、PLCCが0.9423、SRCCが0.9488で、基礎画像の品質スコアを与えることができ、パラメータが少なく、複雑さも少ない他の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:52:28 GMT)
Enhancing Single Image to 3D Generation using Gaussian Splatting and Hybrid Diffusion Priors [17.5] 単一の画像から3Dオブジェクトを生成するには、野生で撮影された未ポーズのRGB画像から、目に見えない景色の完全な3D形状とテクスチャを推定する必要がある。
3次元オブジェクト生成の最近の進歩は、物体の形状とテクスチャを再構築する技術を導入している。
本稿では, この限界に対応するために, 2次元拡散モデルと3次元拡散モデルとのギャップを埋めることを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:20:37 GMT)
Asymptotic and Non-Asymptotic Convergence of AdaGrad for Non-Convex Optimization via Novel Stopping Time-based Analysis [17.3] 我々はAdaの革新的な包括的分析を導入し、文献の既存のギャップを埋める。
AdaGradの期待は、ほぼ確実に、平均的にもたらされます。
また,既存の結果と無関係に予測された平均非a-bpt-d勾配を実証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:57:39 GMT)
Automata Learning from Preference and Equivalence Queries [17.3] 本稿では,能動オートマトン学習問題の新たな変種として,嗜好クエリを用いて有限オートマトンを積極的に学習する手法を提案する。
ReMAPは、クエリの複雑さの最小限の複雑さを、正確な等価クエリの下で正確に推測することが保証されている。
実験により,REMAPを大規模オートマトンにスケールすることは,一貫した教師から正しいオートマトンを学習するのに有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:57:24 GMT)
Self-Supervised Place Recognition by Refining Temporal and Featural Pseudo Labels from Panoramic Data [17.3] 本稿では,時間的近傍と学習可能な特徴近傍を用いて未知の空間近傍を探索するTF-VPRという新しいフレームワークを提案する。
本手法は,リコール率,ロバスト性,方向多様性において,自己監督ベースラインよりも優れる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:57:57 GMT)
Loss-to-Loss Prediction: Scaling Laws for All Datasets [17.1] 我々は、ある損失を別の損失から予測し、異なる事前学習データセットにわたって予測するためにそれを適用する戦略を導出する。
我々の予測は、曲線に合わせるのに使われた最大のFLOP予算の20倍でさえ、よく表される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:23:16 GMT)
Joint Vision-Language Social Bias Removal for CLIP [17.0] 画像とテキストのバイアスを一致させる新しいV-L debiasingフレームワークを提案する。
この研究は、CLIPの社会的バイアス問題に対処する今後の研究に新たな洞察とガイダンスを提供すると信じている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:14:26 GMT)
Med-2E3: A 2D-Enhanced 3D Medical Multimodal Large Language Model [16.9] 我々は、3Dエンコーダと2Dエンコーダを統合した3次元医用画像解析のための新しいMLLMであるMed-2E3を提案する。
より効果的に2D特徴を集約するために,スライス内容とタスク命令に基づいて各2Dスライスに注目したテキストガイド型インタースライス(TG-IS)スコアリングモジュールを設計する。
大規模でオープンソースの3D医療マルチモーダルベンチマークの実験では、Med-2E3がタスク固有の注意分布を示し、現在の最先端モデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:59:59 GMT)
MoCha-Stereo: Motif Channel Attention Network for Stereo Matching [16.9] MoCha-Stereoは学習ベースのステレオマッチングネットワークである。
MoCha-Stereoは、KITTI-2015とKITTI-2012のリフレクティブ・リーダーボードで1位にランクインした。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:09:48 GMT)
Constant Rate Schedule: Constant-Rate Distributional Change for Efficient Training and Sampling in Diffusion Models [16.9] 拡散過程を通して拡散したデータの確率分布の変化率を一定に保証するノイズスケジュールを提案する。
ノイズスケジュールの関数形式は自動的に決定され、各データセットや拡散モデルのタイプに合わせて調整される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:02:39 GMT)
Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline [16.7] IMed-361Mベンチマークデータセットは、一般的なIMIS研究において重要な進歩である。
我々は、複数のデータソースから640万以上の医療画像とその対応する地底真理マスクを収集し、標準化する。
我々は,対話型入力による高品質マスク生成をサポートするIMISベースラインネットワークを開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:06:29 GMT)
Breathless: An 8-hour Performance Contrasting Human and Robot Expressiveness [16.7] 本稿では,人間のダンサーと産業用ロボットアームを組み合わせたオリジナルパフォーマンスを支えるロボット技術について述べる。
ロボットアームを制御するために, 各種の正弦波運動と各関節の振幅, 周波数, オフセットを組み合わせ, 身体労働に共通する人間の動作を誘発する。
ビデオに基づく人的対象追跡と抽出のための深層学習技術を用いて、さらなる動きが開発された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:20:51 GMT)
Evaluating the Prompt Steerability of Large Language Models [16.3] 本稿では,モデルペルソナの操作性を評価するためのベンチマークを提案する。
本ベンチマークでは, 従来のモデルでは, ベースライン挙動の歪と, 多数のペルソナ次元の非対称性の両面から, ステアビリティが制限されていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:41:54 GMT)
Versatile Cataract Fundus Image Restoration Model Utilizing Unpaired Cataract and High-quality Images [16.3] 本稿では,カチンテルという新しい白内障画像復元手法を確立する。
白内障画像合成モデルであるCatintell-Synと、復元モデルであるCatintell-Resを含んでいる。
Catintell-Synは、完全に教師なしのデータを持つGANアーキテクチャを使用して、現実的なスタイルとテクスチャを持つペアの白内障のようなイメージを生成する。
Catintell-Resは、実際の白内障原像の品質を向上させることができる画像復元ネットワークである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:57:16 GMT)
Information Extraction from Clinical Notes: Are We Ready to Switch to Large Language Models? [16.3] 大規模言語モデル(LLM)は生成タスクに優れるが、抽出タスクのパフォーマンスについては議論が続いている。
本研究は,オープンソースLLMを用いた包括的臨床用IEシステムの開発と評価を行った最初の試みである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:14:57 GMT)
Attributed Graph Clustering in Collaborative Settings [16.2] 属性グラフのための協調グラフクラスタリングフレームワークを提案する。
本手法は,異なる参加者が同一データの異なる特徴を持つ垂直分割データ上での属性グラフクラスタリングをサポートする。
本手法は,集中型属性グラフクラスタリング法と同等の精度を実現する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:30:22 GMT)
S-HR-VQVAE: Sequential Hierarchical Residual Learning Vector Quantized Variational Autoencoder for Video Prediction [16.1] 我々は,新しい残差ベクトル学習量子化変分オートエンコーダ(HR-VQE)と階層的自己回帰ベクトル予測モデル(AST-PM)を組み合わせた新しいモデルを提案する。
我々は,モデルサイズがはるかに小さいにもかかわらず,定量評価と定性評価の両面で,最先端のビデオ予測手法と比較して好意的に比較した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:09:06 GMT)
Learning general Gaussian mixtures with efficient score matching [16.1] 我々は、$d$次元で$k$ガウシアンの混合を学習する問題を研究する。
我々は、下層の混合成分について分離を前提としない。
我々は、ターゲット混合物から$dmathrmpoly(k/varepsilon)$サンプルを抽出し、サンプル-ポリノミカル時間で実行し、サンプリング器を構築するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:08:17 GMT)
SAFE-GIL: SAFEty Guided Imitation Learning for Robotic Systems [15.8] 安全に配慮した行動クローニングポリシーを学習するための設計時手法であるSAFE-GILを提案する。
我々は,データ収集中にシステム内の敵対的障害を注入し,専門家を安全クリティカルな状態へ誘導する。
この障害注入は、システムがテスト時に遭遇する可能性のある潜在的なポリシーエラーをシミュレートする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:05:02 GMT)
Do LLMs Understand Ambiguity in Text? A Case Study in Open-world Question Answering [15.3] 自然言語の曖昧さは、オープンドメインの質問応答に使用される大規模言語モデル(LLM)に重大な課題をもたらす。
我々は,明示的曖昧化戦略の効果を計測することに集中して,市販のLLM性能と数発のLLM性能を比較した。
本研究では, 難解な問合せタスクにおいて, LLM性能を向上させるために, 簡単な, トレーニング不要, トークンレベルの曖昧さを効果的に活用できることを実証する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:27:26 GMT)
Zero-shot LLM-guided Counterfactual Generation: A Case Study on NLP Model Evaluation [15.3] ゼロショット対実生成に大規模言語モデルを活用する可能性について検討する。
我々は,この生成を容易にするための構造化パイプラインを提案し,近年のLLMにおける命令追従とテキスト理解の能力を効果的に活用できるという仮説を立てた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:59:30 GMT)
PowerMove: Optimizing Compilation for Neutral Atom Quantum Computers with Zoned Architecture [15.0] ニュートラル原子系量子コンピュータ(NAQC)の効率的なコンパイラPowerMoveを提案する。
これらの重要な側面間の相互依存を認識し、活用することによって、PowerMoveは新しい最適化の機会を解放する。
本評価は, 最先端手法と比較して, 数桁の忠実度向上を図っている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:22:57 GMT)
Preliminary Evaluation of the Test-Time Training Layers in Recommendation System (Student Abstract) [15.0] 我々は,TT-Linear を特徴抽出層として利用するモデル TTT4Rec を開発した。
複数のデータセットを対象としたテストでは、TTT4Recはベースモデルとして、同じ環境で他のベースラインモデルと相容れない、あるいは超える性能を示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:46:20 GMT)
Reward driven workflows for unsupervised explainable analysis of phases and ferroic variants from atomically resolved imaging data [14.9] 本研究では,教師なしML手法の鍵ハイパーパラメータを最適化するために,報酬駆動型アプローチが利用できることを示す。
このアプローチにより、特定の物理的な振る舞いに最も適したローカルな記述子を見つけることができる。
また、変分オートエンコーダ(VAE)を介して変動の構造因子を乱すよう誘導される報酬も拡張する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:18:20 GMT)
ProSec: Fortifying Code LLMs with Proactive Security Alignment [14.9] コード固有の大規模言語モデル(LLM)のセキュリティは、まだ未調査のままである。
コードLLMをセキュアなコーディングプラクティスと整合させるために設計された,新たなセキュリティアライメントアプローチであるProSecを提案する。
実験の結果、ProSecでトレーニングされたモデルは以前の研究よりも29.2%から35.5%安全であることが示されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:00:01 GMT)
Learning multivariate Gaussians with imperfect advice [14.5] 学習強化アルゴリズムの枠組みにおける分布学習の問題を再考する。
我々の目的は、アドバイスの質が向上するにつれて、サンプルの複雑さが減少する学習アルゴリズムを開発することである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:08:01 GMT)
Improving Visual Place Recognition Based Robot Navigation By Verifying Localization Estimates [14.4] 本研究では,MLP(Multi-Layer Perceptron)整合性モニタを提案する。
パフォーマンスと一般化性の向上、環境ごとのトレーニングの削除、手動のチューニング要件の削減などがその例だ。
提案手法を実世界の大規模な実験で検証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:30:11 GMT)
Probe-Me-Not: Protecting Pre-trained Encoders from Malicious Probing [14.3] トレーニング済みのディープラーニングモデルをカスタマイズしたタスクに適応させることは、開発者にとって一般的な選択である。
事前訓練されたエンコーダ上で下流のヘッドをトレーニングする探索は、転写学習において広く採用されている。
このような訓練済みエンコーダの一般化性は、有害な意図に対する探索の潜在的な誤用に関する懸念を提起する。
我々は、トレーニング済みのエンコーダを悪意のある探索から保護するために設計された、新しい適用性認証手法であるLockを紹介した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:50:08 GMT)
Attribute Inference Attacks for Federated Regression Tasks [14.2] フェデレートラーニング(FL)は、クライアントがデータをローカライズしながら、グローバルな機械学習モデルを協調的にトレーニングすることを可能にする。
近年の研究では、FLの訓練段階が再建攻撃に弱いことが判明している。
FL環境における回帰タスクに特化したモデルベースAIAを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:06:06 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8] 非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。
我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。
我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:27:10 GMT)
Lifelong Reinforcement Learning via Neuromodulation [13.8] 進化は、高度に効果的な適応学習機能と意思決定戦略を持つ動物や人間に影響を与えた。
これらの理論の中心であり、神経科学の証拠を学習に組み込むことが神経調節システムである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:06:15 GMT)
Balancing property optimization and constraint satisfaction for constrained multi-property molecular optimization [13.7] 複数の分子特性を同時に最適化するフレキシブルかつ効率的な手法である制約付きマルチプロパタイト分子最適化フレームワーク(CMOMO)を提案する。
実験の結果,5つの最先端分子最適化法よりもCMOMOの方が優れた性能を示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:01:13 GMT)
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs [13.6] 検索拡張生成(RAG)は大規模言語モデル(LLM)の能力を向上させる
既存のRAGソリューションは、実質的に異なる内容の複数のドキュメントを取得する必要がある可能性のあるクエリに焦点を当てていない。
本稿では,このギャップをシンプルかつ強力なアイデアで解決する新しい手法として,MRAG(Multi-Head RAG)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:46:34 GMT)
PoM: Efficient Image and Video Generation with the Polynomial Mixer [13.6] MHA(Multi-Head Attention)に基づく拡散モデルがユビキタスになり,高品質な画像やビデオが生成されるようになった。
本稿では,ポリノミアルミキサー (PoM) と呼ばれるMHAのドロップイン置換法を提案する。
ポリノミアルミキサーは、通常のMHAと同様に、普遍列列列近似器であることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:16:31 GMT)
A universal approximation theorem for nonlinear resistive networks [13.6] レジストレータネットワークは、機械学習のためのアナログコンピューティングプラットフォームとして関心を集めている。
電圧源, 線形抵抗器, ダイオード, 電圧制御電圧源からなる回路網は, 連続関数を任意の精度で近似できることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:40:19 GMT)
Combining Induction and Transduction for Abstract Reasoning [13.4] 我々は、誘導(潜伏関数の推論)と伝達(与えられたテスト入力に対するテスト出力を直接予測)のためにニューラルネットワークを訓練する。
我々のモデルは、LLMに推論される関数を指定するPythonコードを生成するように促すことで生成された合成データと、その関数への入力を生成するサブルーチンに基づいて訓練されている。
インダクティブモデルとトランスダクティブモデルは、同じ問題をトレーニングしているにもかかわらず、同じニューラルアーキテクチャを共有しているにもかかわらず、非常に異なる問題を解決する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:29:58 GMT)
SymphonyQG: Towards Symphonious Integration of Quantization and Graph for Approximate Nearest Neighbor Search [13.3] 我々は、量子化とグラフのよりシンフォニーな統合を実現するSymphonyQGを提案する。
実世界のデータセットに関する広範な実験に基づいて、SymphonyQGは、時間精度のトレードオフの観点から、新たな最先端技術を確立している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:51:08 GMT)
The Game-Theoretic Symbiosis of Trust and AI in Networked Systems [13.3] この章では、人工知能(AI)とネットワークシステムにおける信頼の共生関係について論じる。
我々は、AIによって動的に管理される信頼が、いかにレジリエントなセキュリティエコシステムを形成するかを検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:04:53 GMT)
Can ChatGPT Overcome Behavioral Biases in the Financial Sector? Classify-and-Rethink: Multi-Step Zero-Shot Reasoning in the Gold Investment [13.3] 大規模言語モデル(LLM)は、理解可能で組織化されたテキストを作成する際、例外的な能力を示すことで、近年大きな成功を収めています。
最近、最も強力なLCMの1つであるChatGPTを使用し、この目標を達成するためにエンジニアリングを推進します。
我々の研究では、ChatGPTとCoTのプロンプトがより説明可能な予測を提供し、行動バイアスを克服できることが判明した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:45:58 GMT)
Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus [13.3] 大規模言語モデル(LLM)は幅広いタスクを解くことができるが、推論に苦戦している。
本稿では,プログラム生成論理推論サンプルを用いてLLMの推論能力を高めることを目的として,$textbfAdditional Logic Training (ALT)$を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:31:53 GMT)
Towards Understanding the Impact of Data Bugs on Deep Learning Models in Software Engineering [13.2] ディープラーニング(DL)システムは、トレーニングデータを含む多くのソースからのバグがちである。
既存の文献では、トレーニングデータのバグが非常に多いことが示唆されている。
本稿では,コードベース,テキストベース,メトリックベースの3種類のデータについて検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:28:20 GMT)
Domain Consistency Representation Learning for Lifelong Person Re-Identification [13.0] LReID(Lifelong person re-identification)は、連続データから学ぶ際に、ドメイン内識別とドメイン間ギャップの間に矛盾した関係を示す。
ドメイン内識別とドメイン間ギャップのバランスをとるために,グローバルおよび属性ワイド表現を探索する新しいドメイン一貫性表現学習(DCR)モデルを提案する。
我々のモデルは最先端のLReID法と比較して優れた性能が得られる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:17:30 GMT)
From Classical to Quantum: Uniform Continuity Bounds on Entropies in Infinite Dimensions [13.0] 無限状態空間上の古典的確率変数のエントロピーと無限次元系の量子状態に対する一様連続性境界を証明する。
この証明は、新しい平均制約されたファノ型不等式と確率変数の最大結合の概念に依存している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:15:19 GMT)
Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation [13.0] MUSHRAテストは、TSシステムの評価を同時に行うための有望な代替手段である。
人間の参照音声の一致への依存は、現代のTSシステムのスコアを不当に考慮していることを示す。
MUSHRAテストの2つの改良版を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:37:45 GMT)
A Multimodal Approach Combining Structural and Cross-domain Textual Guidance for Weakly Supervised OCT Segmentation [12.9] Weakly Supervised Semantic (WSSS) アプローチを提案する。
本手法は診断精度の向上と医用画像の効率向上に資する技術である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:20:27 GMT)
Human-In-the-Loop Software Development Agents [12.8] 大規模言語モデル(LLM)は、ソフトウェア開発タスクを自動的に解決するために導入された。
ソフトウェア開発のためのHuman-in-the-loop LLMベースのエージェントフレームワーク(HULA)を紹介する。
私たちは社内使用のために、HULAフレームワークをAtlassianに設計、実装、デプロイしています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:22:33 GMT)
StreetviewLLM: Extracting Geographic Information Using a Chain-of-Thought Multimodal Large Language Model [12.8] 地理空間予測は災害管理、都市計画、公衆衛生など様々な分野において重要である。
提案するStreetViewLLMは,大規模言語モデルと連鎖推論とマルチモーダルデータソースを統合した新しいフレームワークである。
このモデルは、香港、東京、シンガポール、ロサンゼルス、ニューヨーク、ロンドン、パリを含む7つの世界都市に適用されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:15:19 GMT)
BiSSL: Bilevel Optimization for Self-Supervised Pre-Training and Fine-Tuning [12.7] BiSSLは、自己教師型学習において、プリテキスト事前学習と下流の微調整ステージのアライメントを強化するために、バイレベル最適化を導入する、第一級のトレーニングフレームワークである。
本稿では,BiSSLで定義された2つの目的の最適化を交互に行うトレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:39:41 GMT)
Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.7] ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。
これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。
本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。
我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:46:01 GMT)
Designing Multi-layered Runtime Guardrails for Foundation Model Based Agents: Swiss Cheese Model for AI Safety by Design [12.6] Foundation Model(FM)ベースのエージェントは、さまざまなドメインにわたるアプリケーション開発に革命をもたらしている。
本稿では,FMをベースとしたエージェントを対象としたランタイムガードレールの包括的分類を行い,ガードレールと設計次元の重要な品質特性を同定する。
また,Swiss Cheese ModelにインスパイアされたFMエージェントのための多層型ランタイムガードレールの設計のための参照アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:10:07 GMT)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [12.4] 大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。
医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:14:31 GMT)
Key-Element-Informed sLLM Tuning for Document Summarization [12.1] 文書中のキー要素を識別し,これらのキー要素をキャプチャする要約を生成するためのsLLMを指示する,KEITSumと呼ばれるキー要素インフォームド命令チューニングを提案する。
対話とニュースデータセットの実験結果から,KEITSumを用いたsLLMは高い関連性と幻覚の少ない高品質な要約を実現し,プロプライエタリなLLMと競合することを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:41:04 GMT)
Learning from Label Proportions and Covariate-shifted Instances [12.1] ラベル比(LLP)から学ぶ場合、アグリゲートラベルはバッグ内のインスタンスラベルの平均である。
我々は,対象のバッグラベルとソースのインスタンスラベルを自然に組み込むハイブリッドLPの手法を開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:36:34 GMT)
Guide-to-Explain for Controllable Summarization [11.9] 大規模言語モデル (LLMs) による制御可能な要約は未定である。
制御可能な要約のためのガイド・ツー・説明フレームワーク(GTE)を提案する。
我々のフレームワークは、初期ドラフトで間違った属性を識別し、前回の出力でエラーを説明するのに役立てます。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:36:02 GMT)
Cross-Layer Encrypted Semantic Communication Framework for Panoramic Video Transmission [11.4] パノラマビデオ伝送のための層間暗号化セマンティック通信(CLESC)フレームワークを提案する。
セマンティック情報の重要性に基づいて,CRC,チャネル符号化,再送方式を動的に調整する適応型クロス層伝送機構を提案する。
従来のクロス層伝送方式と比較して、CLESCフレームワークは帯域幅を85%削減できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:18:38 GMT)
Variational Graph Autoencoder for Heterogeneous Information Networks with Missing and Inaccurate Attributes [11.4] Heterogeneous Information Networks (HINs) は近年,グラフマイニングにおいて優れた性能を示している。
本稿では,欠落属性,不正確な属性,ノードのラベル不足に対処するための自己教師付き生成モデルGraMIを提案する。
GraMIは、非分散ノードに対する情報機能を完備するだけでなく、属性ノードに対する不正確な機能を修正できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:34:03 GMT)
SCIGS: 3D Gaussians Splatting from a Snapshot Compressive Image [11.4] Snapshot Compressive Imaging (SCI)は、高速なダイナミックシーンで情報をキャプチャすることができる。
現在のディープラーニングに基づく再構築手法では,シーン内の3次元構造的整合性を維持するのに苦労している。
本稿では,3DGSの変種であるSCIGSを提案し,カメラのポーズスタンプとガウスの原始座標を埋め込みとして利用するプリミティブレベルの変換ネットワークを開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:52:37 GMT)
MTFusion: Reconstructing Any 3D Object from Single Image Using Multi-word Textual Inversion [10.9] 高忠実度3D再構成に画像データとテキスト記述の両方を活用するMTFusionを提案する。
提案手法は,2つの段階から構成される。まず,新しい多語テキスト変換手法を採用し,詳細なテキスト記述を抽出する。
そして、この記述と画像を用いてFlexiCubesで3Dモデルを生成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:29:18 GMT)
Regular-pattern-sensitive CRFs for Distant Label Interactions [10.6] RPCRF(Regular-pattern-sensitive CRF)は、標準線形鎖CRFを強化し、長距離ラベルの相互作用を学習する手法である。
ユーザが指定したパターンの集合からRPCRFを自動構築する方法を示し、合成データに対するモデルの有効性を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:08:03 GMT)
AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction [10.6] AdaCM$2$は、ビデオストリーム上のビデオテキストアライメントに対する適応型クロスモダリティメモリリダクションアプローチである。
最大65%のGPUメモリ消費削減で、LVUデータセットの複数のタスク間で4.5%の改善を実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:04:13 GMT)
Towards motion from video diffusion models [10.5] 本稿では,ビデオ拡散モデルを用いて計算したスコア蒸留サンプリング(SDS)によって導かれるSMPL-Xボディ表現を変形させることにより,人間の動作を合成することを提案する。
得られたアニメーションの忠実度を解析することにより、公開されているテキスト・ビデオ拡散モデルを用いて、動作の程度を把握できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:35:28 GMT)
Debiased Regression for Root-N-Consistent Conditional Mean Estimation [10.5] 本稿では,高次元および非パラメトリック回帰推定器を含む回帰推定器のデバイアス化手法を提案する。
理論解析により,提案した推定器は,緩やかな収束率条件下で$sqrtn$-consistencyと正規性を達成することを示した。
提案手法は,推定精度の向上や信頼区間の簡易化など,いくつかの利点を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:50:19 GMT)
LSSInst: Improving Geometric Modeling in LSS-Based BEV Perception with Instance Representation [10.4] 本稿では,BEVおよびインスタンス表現をタンデムに組み込んだ2段階物体検出器であるLSSInstを提案する。
提案した検出器は、既存のLSSベースのBEVネットワークに柔軟に統合可能な、きめ細かいピクセルレベルの特徴を利用する。
提案するフレームワークは,高性能な一般化能力と性能を備え,ベルやホイッスルを使わずに,現代のLSSベースのBEV認識手法の性能を向上させる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:42:32 GMT)
Self-supervised denoising of visual field data improves detection of glaucoma progression [10.4] 4000名以上の患者からの視覚野データに自己教師型深層学習が有効であることを示す。
マスク付きオートエンコーダは従来の方法よりもクリーンな復号化データを生み出した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:50:01 GMT)
Region Prompt Tuning: Fine-grained Scene Text Detection Utilizing Region Text Prompt [10.2] リージョンプロンプトチューニング手法は、領域テキストプロンプトを個々の文字に分解し、視覚特徴マップを領域視覚トークンに分割する。
これにより、文字はトークンの局所的な特徴と一致し、詳細な特徴やきめ細かいテキストが省略されるのを避けることができる。
提案手法は,画像テキストプロセスから得られた一般的なスコアマップと,文字とトークンのマッチングから得られた領域スコアマップを組み合わせる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:26:07 GMT)
InvisMark: Invisible and Robust Watermarking for AI-generated Image Provenance [10.2] InvisMarkは、高解像度のAI生成画像のために設計された新しい透かし技術である。
InvisMarkは、非許容で最先端のパフォーマンスを達成する。
我々は、高度な攻撃に対する潜在的な脆弱性に対処し、緩和戦略を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:19:44 GMT)
Advancing Large Language Models for Spatiotemporal and Semantic Association Mining of Similar Environmental Events [10.2] 本稿では,Large Language Models(LLMs)を利用した新しい検索検索フレームワークを提案する。
本稿では,空間的近接性,時間的関連性,意味的類似性,カテゴリー的類似性などの多面的基準を分類するGTR(Geo-Time Re- rank)戦略を提案する。
提案手法をローカル環境オブザーバ(LEO)ネットワークイベント4万件のデータセットに適用し,複数の最先端高密度検索モデル間で類似イベントを推奨する性能を実現する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:57:22 GMT)
Variational learning of integrated quantum photonic circuits [10.1] 本稿では,量子フォトニック回路の設計のための変分学習手法を提案する。
回路は1つの論理演算子として扱われ、変分学習により統一設計が発見される。
自動制御を備えた集積フォトニックチップを設計し,タスク固有のコスト関数に対して,チップの内部パラメータをリアルタイムで調整・最適化する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:04:12 GMT)
Redefining Information Retrieval of Structured Database via Large Language Models [10.1] 本稿では,ChatLRと呼ばれる新しい検索拡張フレームワークを提案する。
主に、Large Language Models (LLM) の強力な意味理解能力を用いて、正確かつ簡潔な情報検索を実現する。
実験の結果、ChatLRがユーザクエリに対処する効果を示し、全体の情報検索精度は98.8%を超えた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:15:44 GMT)
The Illusion of Empathy: How AI Chatbots Shape Conversation Perception [10.1] GPTベースのチャットボットは、人間の会話相手よりも共感的でないと認識された。
GPT-4oアノテーションからの共感評価はユーザの評価と一致し、低い共感の知覚を補強する。
人間と人間の会話を訓練した共感モデルでは共感言語に有意な差は認められなかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:47:08 GMT)
JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation [10.0] JoyVASAは、音声駆動型顔アニメーションにおける顔の動きと頭部の動きを生成する拡散法である。
本研究では,静的な3次元顔表現から動的表情を分離する分離された顔表現フレームワークを提案する。
第2段階では、拡散変圧器を訓練し、文字の同一性によらず、オーディオキューから直接動作シーケンスを生成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:09:23 GMT)
GaussianPretrain: A Simple Unified 3D Gaussian Representation for Visual Pre-training in Autonomous Driving [10.0] 本稿では,自律運転のための視覚前訓練のための新しい事前訓練パラダイムであるGaussian Pretrainを紹介する。
本手法は,シーンのより深い理解を学習し,詳細な空間構造とテクスチャで事前学習性能を向上させる。
我々は,複数の3次元知覚タスクにおけるガウスプレトレインの有効性を実証し,大幅な性能向上を示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:19:45 GMT)
Estimate exponential memory decay in Hidden Markov Model and its applications [9.9] 本稿では,隠れマルコフモデルにおける固有記憶減衰を利用して,前向きと後向きの確率をサブシーケンスで計算する。
ソフトマックスパラメトリゼーション後のギャップを数値的に推定するアルゴリズムを提案する。
リアプノフスペクトルの連続性は、推定された$B$が推論中に近くのパラメータに対して再利用可能であることを保証している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:45:15 GMT)
MLDGG: Meta-Learning for Domain Generalization on Graphs [9.9] グラフ上のドメインの一般化は、堅牢な一般化機能を持つモデルを開発することを目的としている。
我々のフレームワークであるMDDGGは、多分野間メタラーニングを統合することで、多分野にわたる適応可能な一般化を実現する。
実験の結果,MDDGGはベースライン法を超越し,3種類の分散シフト設定で有効性を示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:57:38 GMT)
Different Horses for Different Courses: Comparing Bias Mitigation Algorithms in ML [9.6] いくつかのアルゴリズムが達成した公正度に有意なばらつきを示し、学習パイプラインが公正度スコアに与える影響を明らかにした。
ほとんどのバイアス軽減技術は同等のパフォーマンスを実現することができると強調する。
私たちの研究は、アルゴリズムの開発ライフサイクルにおける様々な選択が公正性にどのように影響するか、将来の研究を促進することを願っています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:39:53 GMT)
The Implicit Bias of Heterogeneity towards Invariance: A Study of Multi-Environment Matrix Sensing [9.6] 本稿では,不均一なデータに対するグラディエント・ディキセント(SGD)の暗黙バイアスについて検討し,その暗黙バイアスがモデル学習を不変解へと導くことを示す。
具体的には、各環境において、信号が(i)全環境間で共有される低ランク不変部分と(ii)環境依存のスプリアス成分とを含む多環境低ランク行列センシング問題について理論的に検討する。
重要な洞察は、明示的な正規化を伴わずに各環境で大きなステップサイズの大バッチSGDを逐次使用するだけで、不均一性に起因する振動は、モデル学習の急激なシグナルを確実に阻止することができることである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:10:32 GMT)
PLA4D: Pixel-Level Alignments for Text-to-4D Gaussian Splatting [9.5] 従来のテキストから4Dへの方法は、複数のスコア蒸留サンプリング(SDS)技術を活用している。
textbfPixel-textbfLevel textbfAlignment for text-driven textbf4D Gaussian splatting (PLA4D)
PLA4Dはアンカー参照、すなわちテキスト生成ビデオを提供し、画素空間内の異なるDMによって条件付けられたレンダリングプロセスを調整する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:12:54 GMT)
Structured Multi-Track Accompaniment Arrangement via Style Prior Modelling [9.5] 本稿では,これらの課題に対処するために,不整合型因子に対する事前モデリングを活用する新しいシステムを提案する。
私たちのキーとなる設計は、ベクトル量子化と、オーケストレーションスタイルの長期フローをモデル化するためのユニークなマルチストリームトランスの使用です。
本システムでは,既存のベースラインに比べて,コヒーレンス,構造,全体的な配置品質が優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:12:47 GMT)
CUE-M: Contextual Understanding and Enhanced Search with Multimodal Large Language Model [9.5] 本稿では,マルチモーダルテキスト検索パイプラインであるMLLM (CUE-M) について述べる。
マルチモーダルなQ&Aデータセットとパブリックセーフティベンチマークによる評価は、CUE-Mが精度、知識統合、安全性のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:16:48 GMT)
Automatic Classification of General Movements in Newborns [9.3] 一般運動(GM)は神経発達障害の信頼できる予測因子である。
新生児スクリーニングのスケールアップには、幼児のビデオ録画からGMを自動的に分類するアルゴリズムが必要である。
本研究では,これらの記録から特徴を抽出するツールを導入し,自動GM分類のための様々な機械学習手法を探索する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:57:40 GMT)
Diffusion-Based Semantic Segmentation of Lumbar Spine MRI Scans of Lower Back Pain Patients [9.2] 腰痛 (LBP) 患者における脊椎椎間板 (IVDs) と脊椎椎間板 (intravertebral discs) の堅牢かつ正確なセグメンションのための拡散型枠組みについて検討した。
その結果, SpineSegDiffは, 劣化IVDの同定において, 拡散非拡散モデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:30:44 GMT)
Contrast Similarity-Aware Dual-Pathway Mamba for Multivariate Time Series Node Classification [9.2] MTSノード分類(CS-DPMamba)のためのコントラスト類似性を考慮したデュアルパスMambaを提案する。
Fast Dynamic Time Warping (FastDTW) を用いて, MTS表現間の類似度行列を構築する。
長距離依存性と動的類似性を考慮し、正確なTSノード分類を実現した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:32:41 GMT)
IMUVIE: Pickup Timeline Action Localization via Motion Movies [9.1] 高齢者の転倒は、健康と安全に大きなリスクをもたらす。
既存のウェアラブルベースのピックアップ測定ソリューションは、いくつかのニーズに対処するが、一般化性には限界がある。
我々は,映画と機械学習モデルを用いて,ピックアップイベントを自動的に検出・測定するウェアラブルシステムIMUVIEを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:53:30 GMT)
Reward Modeling with Ordinal Feedback: Wisdom of the Crowd [9.0] 人間の好みから報酬モデル(RM)を学ぶことは、大きな言語モデルを調整する上で重要な要素である。
順序フィードバックの下でRMを学習するためのフレームワークを提案する。
我々は,Rademacher複雑性の低減の観点から,順序フィードバックの統計的利点を証明した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:17:04 GMT)
Recall and Refine: A Simple but Effective Source-free Open-set Domain Adaptation Framework [9.0] Open-set Domain Adaptation (OSDA)は、ラベル付きソースドメインからラベルなしターゲットドメインへのモデルを適応することを目的としている。
リコール・アンド・リファイン(RRDA)はSF-OSDAフレームワークで,対象とする未知のクラスに対する特徴を明示的に学習することで,制約に対処する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:18:50 GMT)
HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments [9.0] 廊下や家具などの環境制約のある密集した対話型群集におけるロボットナビゲーションの問題点について検討する。
従来の手法ではエージェントと障害物間のあらゆる種類の相互作用を考慮できないため、安全で非効率なロボット経路につながる。
本稿では,ロボットナビゲーションポリシーを強化学習で学習するための構造化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:56:35 GMT)
Action-Attentive Deep Reinforcement Learning for Autonomous Alignment of Beamlines [8.9] 放射光源は材料科学、生物学、化学などの分野で重要な役割を果たしている。
ビームラインのアライメントは複雑で時間を要するプロセスであり、主にエンジニアが手動で行う。
本稿では,ビームラインのアライメントをマルコフ決定プロセス(MDP)としてモデル化し,RLを用いたインテリジェントエージェントのトレーニングを行う。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:50:11 GMT)
Adaptively Controllable Diffusion Model for Efficient Conditional Image Generation [8.9] 本稿では,新たな適応フレームワークである$textitAdaptively Controllable Diffusion (AC-Diff) Model$を提案する。
AC-Diffは、文学拡散モデルと同じ性能を維持しつつ、平均生成ステップ数と実行時間を大幅に削減することが期待されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:26:30 GMT)
A Full-History Network Dataset for BTC Asset Decentralization Profiling [8.8] まず、フルヒストリーBTCグラフとネットワークプロパティデータセットの可用性における大きなギャップについて論じる。
次に、BTCの資産分散をプロファイル化し、いくつかの分散度を設計するための最初の体系的な調査を示す。
我々の発見は、Bitcoinのトランザクションダイナミクスと分散化の研究を進める上で、包括的なデータセットと分析の重要性を示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:55:29 GMT)
DiM: $f$-Divergence Minimization Guided Sharpness-Aware Optimization for Semi-supervised Medical Image Segmentation [8.7] 本稿では,$f$-divergence最小化に基づくシャープネスを考慮した最適化手法を提案する。
この方法はモデルパラメータの感度を微調整することでモデルの安定性を向上させる。
さらに、$f$-divergenceの導入により、さまざまなデータセットへのモデルの適応性も向上する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:07:26 GMT)
SSEditor: Controllable Mask-to-Scene Generation with Diffusion Model [8.7] SSEditorはコントロール可能なセマンティックシーンエディタで、複数のステップを再サンプリングすることなく特定のターゲットカテゴリを生成することができる。
第2段階では、幾何学的・意味的な情報を学習するモデルの能力を高める幾何学的・意味的融合モジュールを導入する。
未確認のOcc-3Dデータセットの実験は、SSEditorが新しい都市シーンを生成することができることを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:19:05 GMT)
Faster Multi-GPU Training with PPLL: A Pipeline Parallelism Framework Leveraging Local Learning [8.6] 本稿では,ローカル学習アルゴリズムを活用する新しいフレームワークPPLL(Pipeline Parallelism based on Local Learning)を提案する。
GPU間のデータ転送を管理するキューを利用することで、PPLLはシームレスなクロスGPU通信を保証する。
その結果,PPLLは従来のパイプライン並列処理と同等あるいはそれ以上の訓練速度を達成しつつ,局所的な学習手法の学習速度を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:09:18 GMT)
The Effect of Scheduling and Preemption on the Efficiency of LLM Inference Serving [8.6] INFERMAXは様々なスケジューラを比較するために推論コストモデルを使用する分析フレームワークである。
その結果,プリエンプション要求はプリエンプションを回避するよりもGPUコストを30%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:57:16 GMT)
Approximating Families of Sharp Solutions to Fisher's Equation with Physics-Informed Neural Networks [8.5] 本稿では,フィッシャー方程式の解法として物理インフォームドニューラルネットワーク(PINN)を用いる。
主眼は、大きな反応速度係数の条件下でのフィッシャー方程式の研究である。
ネットワークトレーニングにおいて、標準のPINNアプローチに関連する問題を軽減するために、残留重み付け方式が導入された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:29:44 GMT)
Efficient and Green Large Language Models for Software Engineering: Vision and the Road Ahead [8.5] 大規模言語モデル(LLM)は、様々なソフトウェアエンジニアリングタスクにおいて顕著な機能を示している。
本稿は,LLM4SEの効率性と緑化に向けた研究コミュニティの焦点を振り返ることを目的としている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:57:41 GMT)
Just KIDDIN: Knowledge Infusion and Distillation for Detection of INdecent Memes [8.3] 本稿では,LVLM(Large Visual Language Models)の知識蒸留(KD)と知識注入を統合し,有害度検出性能を向上させる新しいフレームワークを提案する。
提案手法は,コンパクトなVLMフレームワーク内で注入可能な大規模コモンセンス知識グラフ(KG)であるConceptNetから,サブ知識グラフを抽出する。
2つのヘイトスピーチベンチマークデータセットによる実験結果から,最先端のベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:39:28 GMT)
libcll: an Extendable Python Toolkit for Complementary-Label Learning [8.3] 補完ラベル学習(Complementary-label Learning, CLL)は、多クラス分類のための弱い教師付き学習パラダイムである。
textttlibcllはCLL研究用のPythonツールキットである。
textttlibcllは、幅広い世代の仮定をサポートする普遍的なインターフェースを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:56:24 GMT)
GRL-Prompt: Towards Knowledge Graph based Prompt Optimization via Reinforcement Learning [8.3] 大規模言語モデル(LLM)の迅速な最適化のための新しいフレームワークを提案する。
GRL-Promptは、強化学習(RL)を通じて、エンドツーエンドで最適なプロンプトを自動構築することを目的としている。
GRL-Promptは最近の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:52:25 GMT)
Regulating Chatbot Output via Inter-Informational Competition [8.2] 本稿では、AI関連コンテンツリスクとそれに対応する規制提案を再評価するためのヤードスティックを開発する。
情報市場における情報ソース間の十分な競争は、生成的AI技術によって引き起こされるコンテンツリスクを十分に軽減し、解決することができる、と同社は主張する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:18:04 GMT)
Local Anti-Concentration Class: Logarithmic Regret for Greedy Linear Contextual Bandit [8.1] 本研究では,線形文脈帯域問題に対する探索自由グリードアルゴリズムの性能保証について検討する。
提案手法では,テキストローカルアンチ集中(LAC)条件という新しい条件を導入し,グリーディバンディットアルゴリズムを有効活用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:53:06 GMT)
Anderson transition and mobility edges on hyperbolic lattices with randomly connected boundaries [8.0] 双曲格子は、双曲平面を通常の多角形でテーセリングすることによって形成され、多様な異方性物理現象を示す。
双曲格子に対する障害の影響について検討し、アンダーソン局在が強い障害強度で起こることを明らかにした。
我々の研究は、双曲格子上のアンダーソン転移とモビリティエッジの包括的理解の基盤となる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:54:52 GMT)
VMGNet: A Low Computational Complexity Robotic Grasping Network Based on VMamba with Multi-Scale Feature Fusion [8.0] ロボットグルーピングのための低計算量・高精度モデルVMGNetを提案する。
まず,視覚状態空間をロボットの把握領域に導入し,線形計算複雑性を実現する。
モデルの精度を向上させるために,効率よく軽量なマルチスケール機能融合モジュールを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:07:17 GMT)
LatentQGAN: A Hybrid QGAN with Classical Convolutional Autoencoder [7.9] 量子機械学習の潜在的な応用は、古典的なデータを生成するために量子コンピュータのパワーを利用することである。
本稿では,自己エンコーダと結合したハイブリッド量子古典的GANを用いた新しい量子モデルであるLatntQGANを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:44:26 GMT)
AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression [7.9] 本稿では,非同期イベントと慣性データを融合した単分子イベント慣性オドメトリーAsynEIOを提案する。
AsynEIOは、特に高速・低照度シナリオにおいて、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:39:57 GMT)
Ranking Unraveled: Recipes for LLM Rankings in Head-to-Head AI Combat [7.9] 大規模言語モデル(LLM)に対する人間の嗜好を評価する新しい方法として、ペアワイズランキングが登場した。
LLMの前後比較におけるランキングシステムの有効性について検討する。
我々の分析は、ランキングの精度と効率に影響を与える要因について重要な洞察を見出している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:16:26 GMT)
D-commuting SYK model: building quantum chaos from integrable blocks [7.9] 我々はこのモデルのスペクトルを二重スケール限界で解析的に研究する。
有限$d$コピーの場合、スペクトルはUVの通常のSYKモデルに近いが、IRの指数的なテール$eE/T_c$を持つ。
我々は、$T_c$ の周りの新しい位相の存在を提案し、ダイナミクスは2つの相において非常に異なるものとなる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:00:06 GMT)
Preference-Conditioned Gradient Variations for Multi-Objective Quality-Diversity [7.8] 優先条件付きポリシー段階突然変異を用いた多目的品質多様性アルゴリズムを提案する。
提案手法は,新たに提案した疎度測定値により,よりスムーズなトレードオフを実現する。
この性能は、従来の方法に比べて計算ストレージコストが低い。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:50:03 GMT)
How to Choose How to Choose Your Chatbot: A Massively Multi-System MultiReference Data Set for Dialog Metric Evaluation [7.8] 我々はMMSMR(Massively Multi-System Multi Reference dataset)をリリースし、ダイアログのメトリクスと評価の今後の取り組みを可能にする。
我々は、単一参照評価セットを拡張して8参照ダイアログデータセットを作成し、リリースする。
次に、1750のシステムをトレーニングし、新しいテストセットとDailyDialogデータセットで評価します。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:34:17 GMT)
Designing a Dataset for Convolutional Neural Networks to Predict Space Groups Consistent with Extinction Laws [7.8] 本論文では,一次元粉体回折パターンのデータセットを,空間群を予測するために畳み込みニューラルネットワークを学習するための新しい戦略を用いて設計した。
回折パターンを格子パラメータと排他法則に基づいて計算した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:49:25 GMT)
Enhancing Low Dose Computed Tomography Images Using Consistency Training Techniques [7.7] 本稿では,雑音レベル調整の柔軟性を提供するベータノイズ分布について紹介する。
HN-iCT(High Noise Improved Consistency Training)は、教師付き方式で訓練される。
以上の結果より,HN-iCTを用いた非条件画像生成はNFE=1。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:48:36 GMT)
Quantum Coherence and Distinguishability: A Resource-Theoretic Perspective on Wave-Particle Duality [7.6] 波動-粒子双対性(英語版)は量子力学の基礎であり、量子系の2つの相補的な側面の間の重要なトレードオフを示している。
互いに純状態のアンサンブルにおける量子コヒーレンスと識別可能性の新たな双対関係を明らかにする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:27:02 GMT)
Diffusion-Inspired Cold Start with Sufficient Prior in Computerized Adaptive Testing [7.6] コンピュータ適応テスト(CAT)は、被験者の能力に基づいて最も適切な質問を選択することを目的としている。
既存のCATシステムは、しばしば試験員の能力に対する最初の理解が欠如しており、ランダムな探索問題を必要としている。
これは、マッチの悪い質問につながり、テスト期間を延ばし、テスターの考え方に悪影響を及ぼす。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:48:58 GMT)
Hierarchical Spatio-Temporal Uncertainty Quantification for Distributed Energy Adoption [7.5] DERは電力グリッド管理に重大な時間的不確実性を導入した。
既存のアプローチはしばしば、個々の空間単位において過度に保守的な不確実な間隔を生じる。
本稿では,これらの課題に対処するためのコンフォメーション・フレームワークに基づく,新しい階層的予測モデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:18:31 GMT)
TSFormer: A Robust Framework for Efficient UHD Image Restoration [7.5] TSFormerは、textbfTrusted LearningとtextbfSparsificationを統合するオールインワンフレームワークである。
我々のモデルは3.38Mパラメータを持つ4K画像をリアルタイムで(40fps)実行することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:09:25 GMT)
Smart Predict-then-Optimize Method with Dependent Data: Risk Bounds and Calibration of Autoregression [7.4] 本稿では,決定段階における最適化問題を直接対象とする自己回帰型SPO手法を提案する。
我々は, 絶対損失と最小二乗損失と比較して, SPO+サロゲートの有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:02:04 GMT)
An AI-Enabled Side Channel Power Analysis Based Hardware Trojan Detection Method for Securing the Integrated Circuits in Cyber-Physical Systems [7.3] 最もステルスな脅威の1つは、ハードウェアトロイの木馬をICに挿入することである。
トロイの木馬はシステムの安全性とセキュリティを著しく侵害することができる。
本稿では,サイドチャネル電力解析に基づくハードウェアトロイの木馬検出のための非侵襲的手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:39:20 GMT)
RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control [7.3] 深層強化学習(Deep Reinforcement Learning, RL)は、複数のドメインで有能なエージェントとコントロールポリシーを得られるが、一般的には、非常に長い訓練時間によって悩まされる。
RLtoolsは依存性のない、ヘッダのみの純粋なC++ライブラリで、深い教師付きと強化学習のためのライブラリである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:41:00 GMT)
CCIS-Diff: A Generative Model with Stable Diffusion Prior for Controlled Colonoscopy Image Synthesis [7.2] 拡散アーキテクチャに基づく高品質な大腸内視鏡画像合成のための制御された生成モデルを提案する。
本手法は, 臨床記述に適合するポリープの空間特性(ポリープ位置と形状)と臨床特性の両方を正確に制御する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:30:06 GMT)
Error-Feedback Model for Output Correction in Bilateral Control-Based Imitation Learning [7.1] 文字書き作業では、予め訓練されていない文字を書く際の精度が向上した。
この研究は、ニューラルネットワークと制御理論を統合するための有望なステップである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:09:09 GMT)
Pretraining a Neural Operator in Lower Dimensions [7.1] 我々は,データ収集が最安値である低次元PDE(PreLowD)上で,ニューラルPDEソルバを事前訓練することを目指している。
我々は,この事前学習戦略の有効性を,高次元のPDEで評価した。
私たちの仕事は、この事前訓練戦略を最大限に活用するために、微調整構成の効果に光を当てています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:08:20 GMT)
Robust Pareto Set Identification with Contaminated Bandit Feedback [7.0] マルチオブジェクト・マルチアーム・バンディット(MO-MAB)の報奨観測における問題点を考察する。
本稿では, 中央値に基づく適応除去アルゴリズムを提案し, 終端に設定した(アルファ, デルタ)-PACを返却する。
汚染確率が減少するにつれて、MO-MABでよく知られたサンプルの複雑さが回復する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:30:22 GMT)
Exploring the Manifold of Neural Networks Using Diffusion Geometry [7.0] ニューラルネットワークの隠蔽層表現間の距離を導入することにより,データポイントがニューラルネットワークである多様体を学習する。
これらの距離は非線形次元減少アルゴリズムPHATEに供給され、ニューラルネットワークの多様体を生成する。
解析の結果,高い性能のネットワークが一貫した埋め込みパターンを表示できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:34:45 GMT)
Predicting User Intents and Musical Attributes from Music Discovery Conversations [6.9] 音楽発見会話における意図的分類モデルについて検討する。
また,音楽的属性分類という,音楽的ニーズを分類するタスクも含んでいる。
提案手法はユーザ意図と音楽属性の分類においてF1スコアを大幅に改善する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:58:22 GMT)
ADV2E: Bridging the Gap Between Analogue Circuit and Discrete Frames in the Video-to-Events Simulator [6.8] イベントカメラは、従来のActive Pixel Sensor(APS)カメラとは根本的に異なり、大きな利点がある。
近年の研究では、ビデオフレームをイベントに変換するシミュレータが開発されており、実際のイベントデータセットの不足に対処している。
本稿では,イベントカメラにおける画素回路の詳細な解析に基づいて,信頼性の高いイベントデータを生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:52:51 GMT)
Quantum Indistinguishable Obfuscation via Quantum Circuit Equivalence [6.8] 量子コンピューティングソリューションは、委譲されたコンピューティングを通じて、ますます商用環境にデプロイされている。
最も重要な問題の1つは、量子実装の秘密性とプロプライエタリ性を保証することである。
汎用不特定性難読化(iO)と機能暗号化スキームの提案以来、iOは一見汎用的な暗号プリミティブとして登場してきた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:37:24 GMT)
Exact Risk Curves of signSGD in High-Dimensions: Quantifying Preconditioning and Noise-Compression Effects [6.7] 本稿では,高次元限界における符号SGDの解析について述べる。
我々は,実効学習率,雑音圧縮,対角前処理,勾配,雑音再構成の4つの効果を定量化する。
これらの結果はAdamにどのように拡張されるかという予想で締めくくります。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:24:50 GMT)
Gradient-Weighted Feature Back-Projection: A Fast Alternative to Feature Distillation in 3D Gaussian Splatting [6.6] 提案手法は, 最終レンダリングにおけるガウスの影響に基づいて, 重み付け和を用いて, 事前学習した3次元ガウスの2次元特徴を逆投影する。
トレーニングベースの特徴場レンダリング手法は2次元セグメンテーションでは優れるが,後処理なしでは3次元セグメンテーションでは性能が劣る。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:17:15 GMT)
A Survey on E-Commerce Learning to Rank [6.6] Amazon、Alibaba、eBay、Walmartなどの商業eコマースプラットフォームは、検索結果ランキングアルゴリズムを完璧にするために、広範囲かつ絶え間ない調査を行っている。
検索結果のランク付けを最適化するためには、関連性、パーソナライゼーション、売り手の評判、有償プロモーションから生じる多くの特徴について検討する。
電子商取引において最も最適な検索結果を見つけるのに、どのアルゴリズムか、どの特徴が最も効果的かを知ることは困難である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:12:51 GMT)
AI's Spatial Intelligence: Evaluating AI's Understanding of Spatial Transformations in PSVT:R and Augmented Reality [6.5] 3次元空間の回転を理解するには、言葉による記述や視覚的、インタラクティブな例が伴う。
近年の研究では、言語と視覚能力を備えた人工知能は、空間推論の限界に直面している。
我々は,その画像と言語処理機能を利用してオブジェクトの回転を理解する,生成AIの空間的能力について検討した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:37:03 GMT)
Rethinking Top Probability from Multi-view for Distracted Driver Behaviour Localization [6.5] アクションローカライゼーションタスクは、現実世界の運転シナリオでキャプチャされたビデオデータから人間の行動や行動を認識し、理解することを目的としている。
従来の研究では、認識モデルを適用した上で、確率に基づく後処理を行うことで、優れた動作ローカライゼーション性能を示した。
本研究では,自己監督学習に基づく行動認識モデルを用いて,注意をそらした行動を検出し,潜在的な行動確率を与える。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:18:02 GMT)
Balancing Accuracy and Efficiency in Multi-Turn Intent Classification for LLM-Powered Dialog Systems in Production [6.5] 本稿では,本システムにおけるスケーラビリティ向上と遅延低減のための新しい2つのアプローチを提案する。
まず,タスクの複雑さを低減し,マルチターン対話におけるパフォーマンスを向上させるために,意図ラベルを簡略化するシンボリックチューニングを提案する。
第2に,データ拡張と擬似ラベル作成にLLMを用いるフレームワークであるC-LARAを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:48:35 GMT)
Isogeny-based Group Signatures and Accountable Ring Signatures in QROM [6.5] 量子乱数オラクルモデル(QROM)において、最初の証明可能なセキュアな同種グループシグネチャ(GS)と説明可能なリングシグネチャ(ARS)を提示する。
我々は、オープンブルシグマプロトコルと呼ばれる中間プリミティブを導入して構築し、そのようなプロトコルがセキュアなGSとARSをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:24:54 GMT)
Freezing of Gait Detection Using Gramian Angular Fields and Federated Learning from Wearable Sensors [6.4] 歩行凍結はパーキンソン病(PD)の不安定な症状である
従来の検出法は、患者内および患者間変動による課題に直面している。
FOGSenseは、制御不能で自由な環境のために設計された新しいFOG検出システムである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:48:26 GMT)
Is Programming by Example solved by LLMs? [6.4] PBE(Programming-by-Examples)は、入力出力の例からアルゴリズムを生成することを目的としている。
我々は,大規模言語モデルが PBE を「解決した」と言える程度について検討する。
事前訓練されたモデルはPBEでは有効ではないが、より高性能に微調整できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:49:27 GMT)
Cavity-enabled real-time observation of individual atomic collisions [6.3] 光学式ツイーザにおける原子の高速かつ非破壊的な数分解検出を実証する。
個々の原子と原子の衝突、量子状態のジャンプ、原子の損失事象を100 mu$sの時間分解能で観測する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:31:57 GMT)
log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling [6.3] log-RRIMは、化学反応の収量を予測するために設計された革新的なグラフトランスフォーマーベースのフレームワークである。
本手法は,一意の局所的-グローバル的反応表現学習戦略を実装している。
反応剤-試薬相互作用の高度なモデリングと小さな分子断片への感受性により、化学合成における反応計画と最適化のための貴重なツールとなる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:49:12 GMT)
SNN-Based Online Learning of Concepts and Action Laws in an Open World [6.0] スパイキングニューラルネットワーク(SNN)を中心に構築された完全自律型バイオインスパイアされた認知エージェントのアーキテクチャについて述べる。
エージェントは宇宙を探索し、物体や位置の概念と自身の行動を1ショットで学習する。
実験の結果, エージェントは学習済みの一般的な概念にアピールし, 環境変化に適応するためにその概念を迅速に修正することで, 新たな状況に対処できることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:49:22 GMT)
A Combined Encoder and Transformer Approach for Coherent and High-Quality Text Generation [5.9] 本研究は,BERTのセマンティック解釈強度とGPT-4の生成能力を組み合わせた新しいテキスト生成モデルを提案する。
このモデルはセマンティックディープを強化し、スムーズな人間のようなテキストフローを維持し、以前のモデルに見られる制限を克服する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:41:56 GMT)
FedDCT: A Dynamic Cross-Tier Federated Learning Framework in Wireless Networks [5.9] フェデレートラーニング(FL)は、ローカルデータを公開せずにデバイス全体でグローバルモデルをトレーニングする。
無線ネットワークにおけるリソースの不均一性と避けられないストラグラーは、FLトレーニングの効率と正確性に大きな影響を与えます。
動的クロスティアフェデレーション学習フレームワーク(FedDCT)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:51:39 GMT)
Forecasting Application Counts in Talent Acquisition Platforms: Harnessing Multimodal Signals using LMs [5.8] 本稿では,採用領域における新たな課題,すなわちアプリケーション数予測について論じる。
本稿では,既存の自己回帰型時系列予測手法が,この課題に対して不十分であることを示す。
簡単なエンコーダを用いて,様々なモダリティの求人メタデータを融合したマルチモーダルLMモデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:18:32 GMT)
Integrating Secondary Structures Information into Triangular Spatial Relationships (TSR) for Advanced Protein Classification [5.7] 二次構造要素(SSE)は三角空間関係(TSR)に基づくタンパク質表現に統合される。
以上の結果から,SSEはタンパク質分類の精度と信頼性を様々な程度に向上させることが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:50:16 GMT)
Dimension Reduction via Sum-of-Squares and Improved Clustering Algorithms for Non-Spherical Mixtures [5.7] 我々は,非球面(すなわち任意の成分共分散)ガウス混合モデルをサブルーチンでクラスタリングするための新しいアプローチを開発した。
本手法は特異値分解に基づく古典的次元減少の非球面アナログを与える。
我々のアルゴリズムは自然に任意の外れ値の次元非依存の分数に許容するように拡張する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:58:51 GMT)
Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities [5.6] MRIの脳病変のモデルは通常、特定の疾患のために開発され、事前に定義されたMRIモダリティのセットでデータに基づいて訓練される。
この訓練パラダイムは、モデルが異種データベースから学習する利点を使用するのを防ぐ。
モデルとトレーニング戦略の適切な,シンプルな,実践的な変更を組み合わせることで,有望な結果を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:27:45 GMT)
FT2TF: First-Person Statement Text-To-Talking Face Generation [5.5] FT2TF-Person文のテキスト・トゥ・トーク・フェイスジェネレーションを提案する。
これは、一対一のステートメントテキストによって駆動される顔生成のための、新しいワンステージのエンドツーエンドパイプラインである。
私たちのモデルは、推論中に他のソース(例えば、オーディオ/ランドマーク/目的)を使わずに、視覚情報とテキスト情報のみを活用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:11:40 GMT)
Puppet-CNN: Input-Adaptive Convolutional Neural Networks with Model Compression using Ordinary Differential Equation [5.5] 我々は2つのモジュールを含む新しいCNNフレームワークを$textitPuppet-CNN$として提案する。
パペットモジュールは、他の作業と同じように入力データを処理するために使用されるCNNモデルである。
人形モジュール内でカーネルパラメータを繰り返し生成することにより、異なる畳み込み層のカーネル間の依存を利用してCNNモデルのサイズを大幅に削減することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:44:21 GMT)
StrTune: Data Dependence-based Code Slicing for Binary Similarity Detection with Fine-tuned Representation [5.4] BCSDは、悪意のあるコードスニペットの識別や、コードパターンの比較によるバイナリパッチ解析といったバイナリタスクに対処することができる。
バイナリは異なるコンパイル構成でコンパイルされるため、既存のアプローチはバイナリの類似性を比較する際にも注目すべき制限に直面している。
データ依存に基づいてバイナリコードをスライスし,スライスレベルの微調整を行うStrTuneを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:20:08 GMT)
On the Implicit Relation Between Low-Rank Adaptation and Differential Privacy [5.4] 言語モデルの低ランクタスク適応(LoRAやFLoRAなど)が提案されている。
データプライバシのレンズからの低ランク適応に注目します。
他の既存の微調整アルゴリズムとは異なり、低ランク適応は暗黙的に微調整データのプライバシーを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:10:18 GMT)
CoMeDi Shared Task: Models as Annotators in Lexical Semantics Disagreements [5.3] 本稿では,多数決とアノテータの不一致を予測したCoMeDi共有タスクのシステム結果を示す。
提案手法は,事前学習された言語モデルに基づいて学習したアンサンブルベースおよびしきい値ベース手法とモデル戦略を組み合わせる。
特に、同じモデル内であっても、連続的な類似度スコアは、集約された離散ラベルと比較して、人間の不一致パターンとよく一致していることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:50:06 GMT)
A More Advanced Group Polarization Measurement Approach Based on LLM-Based Agents and Graphs [5.3] ソーシャルメディア上でのグループ偏極を測定することは、既存のソリューションでまだ解決されていないいくつかの課題を提示する。
我々はマルチエージェントシステムに基づくソリューションを設計し、偏光状態を表すためにグラフ構造化コミュニティセンチメントネットワーク(CSN)を用いた。
要約すると、提案手法はユーザビリティ、正確性、解釈可能性の観点から大きな価値を持っている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:29:17 GMT)
S3TU-Net: Structured Convolution and Superpixel Transformer for Lung Nodule Segmentation [5.3] マルチ次元空間コネクタとスーパーピクセルベースの視覚変換器を統合したセグメンテーションモデルS3TU-Netを提案する。
S3TU-NetはマルチビューCNN-Transformerハイブリッドアーキテクチャ上に構築されており、スーパーピクセルアルゴリズム、構造化重み付け、空間シフト技術が組み込まれている。
LIDC-IDRIデータセットの実験結果は、S3TU-Netがそれぞれ89.04%、90.73%、90.70%のDSC、精度、IoUを達成したことを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:00:18 GMT)
SCOUT: A Situated and Multi-Modal Human-Robot Dialogue Corpus [5.1] SCOUT(Situated Corpus of Understanding Transactions)を紹介する。
これは、協調探索のタスク領域における人間とロボットの対話の集合である。
SCOUTは、89,056発の発声と、278発の対話から310,095発の発声を含む。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:18:55 GMT)
LEDRO: LLM-Enhanced Design Space Reduction and Optimization for Analog Circuits [5.1] アナログ回路サイズの設計空間を反復的に洗練する最適化手法とともに,Large Language Models (LLMs) を用いたLEDROを導入する。
LEDROは、他のRLやBOベースラインと比較して非常に一般化可能であり、異なるトポロジや技術ノードの設計アノテーションやモデルトレーニングは不要である。
結果,LEDROは平均13%のFoM改善,2.15倍のOp-Amp,48%のFoM改善,1.7倍のOp-Ampを向上した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:43:25 GMT)
EndoOmni: Zero-Shot Cross-Dataset Depth Estimation in Endoscopy by Robust Self-Learning from Noisy Labels [5.0] 単一画像深度推定は、局所化、再構成、拡張現実といった内視鏡的タスクに不可欠である。
既存の手術シーンのほとんどの方法は、領域内深さの推定に焦点を合わせ、実際の応用性を制限する。
内視鏡のためのゼロショットクロスドメイン深度推定のための最初の基礎モデルであるEndo Omniを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:43:30 GMT)
DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning [4.9] Federated Learning(FL)は、ローカルデータのプライバシを保持しながら、分散デバイス間の協調的なモデルトレーニングを可能にする。
しかし、FLの分散された性質は、特にバックドアアタックをモデル化するための脆弱性も開放する。
DeTriggerは、スケーラブルで効率的なバックドアロバストなフェデレーション学習フレームワークである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:12:14 GMT)
Predicting Customer Satisfaction by Replicating the Survey Response Distribution [4.9] コールセンターは、顧客が調査を完了していないコールに対して、顧客の満足度を予測するモデルから恩恵を受けることができる。
本稿では,コールセンタ毎のCSAT応答の分布を正確に再現する手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:39:29 GMT)
Stochastic BIQA: Median Randomized Smoothing for Certified Blind Image Quality Assessment [4.9] 最新のNo-Reference Image-Quality Assessment(NR-IQA)メトリクスは、敵の攻撃に弱いニューラルネットワークに基づいている。
この研究は、証明可能な堅牢な非参照IQA計量の開発に焦点を当てている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:42:48 GMT)
CDI: Copyrighted Data Identification in Diffusion Models [4.9] 拡散モデル(DM)は、トレーニングのための大規模で多様なデータセットの恩恵を受ける。
このデータは、データ所有者の許可なくインターネットから取り除かれることが多いため、著作権や知的財産権保護に関する懸念が高まる。
我々は、データ所有者がデータセットを使用してDMをトレーニングするかどうかを特定するためのフレームワークであるCDIを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:02:09 GMT)
ACING: Actor-Critic for Instruction Learning in Black-Box Large Language Models [4.9] ACINGは、タスク固有のプロンプト最適化アプローチであり、ステートレスな継続的アクション強化学習問題である。
我々は30の命令ベースタスク上でChatGPTのプロンプトを最適化することでACINGを検証する。
ACingはベースラインの手法を一貫して上回り、スコアの中央値が10ポイント向上した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:58:03 GMT)
A Benchmark for Long-Form Medical Question Answering [4.8] 長期医療質問応答(QA)における大規模言語モデル(LLM)の評価のためのベンチマークの欠如
既存のQA評価ベンチマークのほとんどは、自動メトリクスと複数項目の質問に焦点を当てている。
本研究は,医科医が注釈を付した長文回答評価を伴う現実の消費者医療質問を特徴とする,新たに公開されたベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:04:38 GMT)
Auto-Evaluation with Few Labels through Post-hoc Regression [4.8] 予測パワー推論(PPI)フレームワークは、自動評価の統計的パワーとラベル付きデータの小さなプールを活用する方法を提供する。
本稿では, 頑健な回帰器を用いたPPIに基づく2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:17:46 GMT)
Mini-Splatting2: Building 360 Scenes within Minutes via Aggressive Gaussian Densification [4.7] Mini-Splatting2は最適化時間、ガウス数、レンダリング品質のバランスの取れたトレードオフを実現する。
我々の研究は、現実世界のアプリケーションにおいて、より効率的で高品質な3Dシーンモデリングのステージを定めている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:47:40 GMT)
Consistency Regularization for Complementary Clothing Recommendations [4.7] 本稿では,ベイジアンパーソナライズランキング(CR-BPR)の一貫性正規化モデルの開発について報告する。
これは、既存の補完的な衣服推薦手法の欠点、すなわち、多モードデータの多様な特徴尺度によって引き起こされる限定された一貫性と偏りのある学習に対処する。
CR-BPRモデルの有効性は、2つのベンチマークデータセットを含む詳細な分析によって検証された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:30:07 GMT)
Human-Robot Dialogue Annotation for Multi-Modal Common Ground [4.7] 本稿では,人間とロボットの対話データにアノテートした記号表現の開発について述べる。
遠隔対話では,人間とロボットが不慣れな環境における共同ナビゲーションと探索作業に従事しているが,ロボットは限られた通信制約のため,すぐには高品質な視覚情報を共有できない。
このパラダイム内では、抽象的意味表現の強化である対話-AMRアノテーションを通じて、対話中の1つの発話の命題意味と補間力を取り込む。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:33:54 GMT)
Problem-dependent convergence bounds for randomized linear gradient compression [4.7] 分散最適化では、通信モデルの更新がパフォーマンスのボトルネックになる可能性がある。
最適化向上の手段として勾配圧縮法が提案されている。
我々は, 圧縮がスループットに与える影響を, ヘッセン目標のノルムの観点から検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:26:42 GMT)
Relationship between spinons and magnetic fields in a fractionalized state [4.7] 150mK以下の14Tまでの磁場の適用により,熱容量の急激な上昇を最大5000%も引き起こすことがわかった。
本研究では,ミリケルビン温度における熱容量の急激な上昇(エントロピー)と強磁場がスピノンの磁場誘起局在を示すことを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:13:02 GMT)
What Makes a Good Dataset for Knowledge Distillation? [4.6] 知識蒸留(KD)は、モデル圧縮の一般的かつ効果的な方法である。
KDの重要な前提の1つは、教師のオリジナルのデータセットが学生のトレーニング時にも利用できることである。
企業なしデータセットでトレーニングされた大規模なモデルの連続学習や蒸留といった状況では、元のデータにアクセスすることは必ずしも不可能である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:10:12 GMT)
Enhancing Deep Learning-Driven Multi-Coil MRI Reconstruction via Self-Supervised Denoising [4.6] 自己教師型認知は、深層学習(DL)に基づく再構成手法を訓練するための前処理のステップである。
以上の結果から, denoising は DL-based MRI 再構成法の有効性を向上させる上で必要不可欠な前処理技術であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:17:09 GMT)
CLIC: Contrastive Learning Framework for Unsupervised Image Complexity Representation [4.6] 画像の複雑性表現を学習するためのコントラスト学習に基づく教師なしフレームワークCLICを提案する。
この手法はラベルのないデータから画像の複雑さの特徴を学習し、高いラベル付けコストを回避する。
結果は,CLICが画像複雑性表現を効果的に学習できることを示唆している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:03:14 GMT)
Efficient Model-Stealing Attacks Against Inductive Graph Neural Networks [4.6] グラフニューラルネットワーク(GNN)は、グラフ構造で組織された実世界のデータを処理するための強力なツールとして認識されている。
事前に定義されたグラフ構造に依存しないグラフ構造化データの処理を可能にするインダクティブGNNは、広範囲のアプリケーションにおいてますます重要になりつつある。
本稿では,誘導型GNNに対して教師なしモデルステアリング攻撃を行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:37:54 GMT)
Welfare Analysis in Dynamic Models [4.5] 動的選択の期待値の関数に対する推定法と推定法を提案する。
利子パラメータに対する動的リース表現器の最小二乗推定器が与えられる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:47:13 GMT)
Large Language Models for Combinatorial Optimization of Design Structure Matrix [4.5] エンジニアリングアプリケーションの効率と性能を改善するためには、組合せ最適化(CO)が不可欠である。
実世界の工学的問題に関しては、純粋数学的推論に基づくアルゴリズムは限定的であり、最適化に必要な文脈ニュアンスを捉えることができない。
本研究では,工学的CO問題の解法におけるLarge Language Models (LLMs) の可能性について,その推論能力と文脈的知識を活用して検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:39:51 GMT)
HouseLLM: LLM-Assisted Two-Phase Text-to-Floorplan Generation [4.2] 本稿では,Large Language Model (LLM) を誘導して初期レイアウトを生成する2段階のテキスト・ツー・フロアプラン生成手法を提案する。
我々は、ユーザテキスト仕様に基づいてLCMを誘導するためにChain-of-Thoughtアプローチを導入し、よりユーザフレンドリで直感的な住宅レイアウト設計を可能にした。
実験結果から,本手法は全指標の最先端性能を実現し,実用的ホームデザインにおける有効性を検証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:57:45 GMT)
Realised Volatility Forecasting: Machine Learning via Financial Word Embedding [4.2] 本研究は15年間のビジネスニュースを用いた財務用語の埋め込みを開発する。
応用として、この単語を単純な機械学習モデルに組み込んで、実現されたボラティリティを予測するためのHARモデルを強化する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:33:22 GMT)
Lucia: A Temporal Computing Platform for Contextual Intelligence [4.2] Luciaはオープンソースのテンポラルコンピューティングプラットフォームで、連続したコンテクストメモリをキャプチャして利用することによって人間の認知を高めるように設計されている。
Luciaは、日々のアクティビティを記録、解釈することで、ユーザが堅牢な時間記憶にアクセスし、意思決定やメモリリコールなどの認知プロセスを強化する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:38:31 GMT)
Taming Generative Diffusion Prior for Universal Blind Image Restoration [4.1] BIR-Dはマルチ誘導ブラインド画像復元を実現することができる。
また、複数の複雑な分解を行うイメージを復元し、実用的な応用を実証することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:36:59 GMT)
Bullion: A Column Store for Machine Learning [4.1] 本稿では,機械学習処理に適した列記憶システムであるBullionについて述べる。
Bundyはデータコンプライアンスの複雑さに対処し、長いシーケンススパース機能のエンコーディングを最適化し、拡張可能なプロジェクションを効率的に管理し、ストレージに機能量子化を導入し、包括的なカスケードエンコーディングフレームワークを提供する。
予備的な実験結果と理論的分析は、機械学習ワークロードのユニークな要求に直面して、Bullionが強力なパフォーマンスを提供する能力が改善されたことを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:04:06 GMT)
Complex Frequency Fingerprint [4.1] 本稿では, 複合周波数指紋 (CFF) を用いて, 複素周波数グリーン関数, $G(omegainmathbbC)$ を駆動散逸系で検出する手法を提案する。
CFFを利用することで、状態(DOS)と局所DOS(LDOS)の複素周波数密度を測定し、非エルミート系の特性に関するユニークな洞察を与えることができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:43:03 GMT)
Exploring Non-Linear Effects of Built Environment on Travel Using an Integrated Machine Learning and Inferential Modeling Approach: A Three-Wave Repeated Cross-Sectional Study [4.1] 本研究では,20年間のテキサス州オースティンにおける建設環境と旅行の動的関係について検討した。
機械学習と推論モデリングを統合して、旅行における非線形関係と構築環境特性のしきい値効果を明らかにする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:23:14 GMT)
Multiplexed readout of ultrasensitive bolometers [4.0] 超伝導量子プロセッサにおける多重量子ビット読み出しのための資源効率の高いソリューションとして、超感度温度計が提案されている。
単一チップ上での周波数多重入力・プローブ回路を用いた3つのSNSセンサの設計,製造,動作について述べる。
これらの実験は、関連するリソースを最小化するための有望なステップである複数のキュービットの多重ボロメトリキャラクタリゼーションとカロリー測定の読み出しの道を開く。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:29:30 GMT)
Generalized Prompt Tuning: Adapting Frozen Univariate Time Series Foundation Models for Multivariate Healthcare Time Series [4.0] 時系列基礎モデルは、大規模なデータセットで事前訓練され、様々なタスクで最先端のパフォーマンスを達成することができる。
我々は、既存の単変量時系列基礎モデルに適応できる、素早いチューニングインスパイアされた微調整技術Gen-P-Tuningを提案する。
2つのMIMIC分類課題とインフルエンザ様疾患予測における各種ベースラインに対する微調整アプローチの有効性を実証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:20:58 GMT)
Low loss lumped-element inductors made from granular aluminum [3.9] ランプ素子インダクタは、回路QEDツールボックスの積分成分である。
本研究では, 超伝導アルミニウム(grAl)による高速度インダクタンスを活用することで, この課題を克服する。
純アルミニウム(Al)製のインダクタよりも100ドルほどコンパクトな数nHのインダクタンスを有するラッピング素子インダクタを実演する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:17:14 GMT)
ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [3.9] ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:03:07 GMT)
Advancing Marine Heatwave Forecasts: An Integrated Deep Learning Approach [3.9] 極端気候現象熱波(MHW)は海洋生態系や産業に重大な課題をもたらす。
本研究では,世界規模での短期的・長期的MHW予測のための統合型ディープラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:11:52 GMT)
Hypergraph $p$-Laplacian equations for data interpolation and semi-supervised learning [3.8] ハイパーグラフ $p$-Laplacian 方程式は、$p$-Laplacian 正規化の部分微分から導かれる。
代案として、数学的によく提案され、計算的に効率的である単純化された方程式を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:05:35 GMT)
WIA-SZZ: Work Item Aware SZZ [3.7] 既存のSZZアルゴリズムは、修正コミットを入力として与えられたときにバグを引き起こした潜在的なコミットを特定する。
私たちは、コミットを検出する作業項目を活用して、最初にバグを誘発するコミットを提案する、新しいSZZの亜種を構築します。
私たちの評価では、作業項目を見つけるのに64%の正確さが示されていますが、最も重要なのは、多くのバグを誘発するコミットを見つけることができることです。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:59:14 GMT)
An embedding-based distance for temporal graphs [3.7] 時間参照ランダムウォークに基づく埋め込みを用いて、時間グラフ間の距離の新しい概念を導入する。
この距離は、異なるノード数と異なる時間間隔を持つ時間グラフのペアに対してよく定義されている。
我々は、位相的および時間的特性の異なる微分グラフを導入する距離を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:34:20 GMT)
Leveraging Computational Pathology AI for Noninvasive Optical Imaging Analysis Without Retraining [3.7] 非侵襲的な光学画像モダリティは、患者の組織を3Dでプローブし、時間とともに、サンプルごとに臨床的に関係のあるデータをギガバイト生成する。
このデータを分析し、臨床ワークフローを支援するために、AIモデルが必要である。
本稿では,リトレーニングなしで計算病理から任意のAIモデルを適用する手法であるFoundationShiftを紹介する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:36:38 GMT)
On the existence of minimizers in shallow residual ReLU neural network optimization landscapes [3.6] 多次元入力層とReLUアクティベーションを持つ1つの隠蔽層を有する残差ニューラルネットワーク(ANN)の損失ランドスケープに最小化器が存在することを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:16:38 GMT)
Unveiling and Mitigating Bias in Large Language Model Recommendations: A Path to Fairness [3.5] 大言語モデル(LLM)ベースのレコメンデーションシステムは、従来のシステムよりも包括的なレコメンデーションを提供する。
本研究では,LLMに基づくレコメンデーションシステムとバイアスの関係について検討した。
我々の発見は、バイアスが深く埋め込まれているだけでなく、これらのシステムに広く浸透していることを浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:51:37 GMT)
Ultrastrong coupling limit to quantum mean force Gibbs state for anharmonic environment [3.5] 量子系の平衡状態は、システム環境結合(SE)が弱くない場合、ギブス状態から逸脱することができる。
この平均力ギブス状態(MFGS)の解析式はカルデイラ・レゲットモデル(CL)の超強結合系で知られている。
ここでは、より一般的なSEモデルに対するUSC体制におけるMFGSの分析式を導出する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:14:14 GMT)
Perfecting Imperfect Physical Neural Networks with Transferable Robustness using Sharpness-Aware Training [3.5] 現在のアプローチは、オフラインとオンラインのトレーニングに関わらず、かなりの精度の損失を被っている。
シャープネス・アウェアトレーニング(SAT)は、不正確なモデルであっても、効率的なバックプロパゲーションアルゴリズムを用いた正確なトレーニングを可能にする。
SATはまた、デバイス間でモデルの信頼できる転送を可能にすることで、オンライントレーニングの制限を克服する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:15:08 GMT)
Quantum state tomography with muons [3.5] ミューオン電子散乱における異なるフレーバーフェルミオンからなる状態における量子エンタングルメントの包括的研究を提案する。
結果として生じるミューオン電子量子ビット系の絡み合いとベルの不等式は、高い事象率で観測できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:01:07 GMT)
Identifying Differential Patient Care Through Inverse Intent Inference [3.4] セプシス(英: Sepsis)は、感染に対する宿主の反応の低下により、臓器不全によって定義される生命を脅かす状態である。
多くの研究で、救急部や集中治療室に入院する患者の軌跡に、ケアの格差が存在することが報告されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:53:51 GMT)
Mixed-Output Gaussian Process Latent Variable Models [3.4] 我々は信号分離のための非パラメトリックなアプローチを開発し、信号は潜時変数に応じて変化する可能性がある。
我々の貢献は分光学に特に関係しており、そこでは変化条件が変化し、基礎となる純粋な成分信号がサンプルからサンプルへと変化する可能性がある。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:40:43 GMT)
STRisk: A Socio-Technical Approach to Assess Hacking Breaches Risk [3.4] 我々は被害者組織と非被害者組織を含む3800以上の米国組織を調査した。
技術的特徴と社会的特徴の両方を活用することで、AUC(Area Under Curve)スコアは98%を超えた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:52:10 GMT)
Associative Knowledge Graphs for Efficient Sequence Storage and Retrieval [3.4] シーケンスの保存と認識に非常に効果的な連想的知識グラフを作成します。
個々のオブジェクト(ノードとして表現される)は、複数のシーケンスの一部あるいは単一のシーケンス内で繰り返し現れる。
このアプローチは、金融取引における異常検出や過去の行動に基づくユーザの振る舞いの予測など、さまざまな分野への応用の可能性を持っている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:00:31 GMT)
RoSIS: Robust Framework for Text-Promptable Surgical Instrument Segmentation Using Vision-Language Fusion [3.3] 手術器具のセグメンテーションは、コンピュータによる外科手術に欠かせない課題である。
近年,ターゲットオブジェクトを記述するテキストプロンプトに基づいてマスクを生成する手法が提案されている。
これにより、オブジェクトが画像から欠落している場合でも、関連するテキストプロンプトが提供されるたびにマスクが生成される。
既存の方法では、イメージに存在することがわかっているオブジェクトに対してのみプロンプトを使用することで、これを処理している。
本稿では,全クラスのプロンプトをフォワードし,与えられたテキストプロンプトからオブジェクトの存在を公正な比較のために決定するRobust text-promptable SIS (R-SIS)を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:30:44 GMT)
Integrating Neural Networks and Dictionary Learning for Multidimensional Clinical Characterizations from Functional Connectomics Data [3.3] 本稿では、ニューラルネットワークと辞書学習を組み合わせた統合フレームワークを提案し、静止状態機能MRIと行動データの間の複雑な相互作用をモデル化する。
自閉症スペクトラム障害(ASD)52例を用いたマルチスコア予測課題における組み合わせモデルの評価を行った。
統合されたフレームワークは,3種類の臨床重症度を予測するために,10倍のクロス・コンフィグレーション・セッティングにおいて最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:17:44 GMT)
RadPhi-3: Small Language Models for Radiology [3.3] 本研究では,Phi-3-mini-4k-インストラクションを3.8Bパラメータで調整し,放射線学における様々なタスクを支援する小型言語モデルRadPhi-3を提案する。
これまでの研究では, 印象要約生成が主な課題であったが, これまでの放射線学報告とそれ以前の報告とを比較した要約生成, 放射線学レポートからのセクション抽出, 各種の病理, 管, 線, デバイスとのタグ付けなど, その他の有用な課題も検討している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:24:28 GMT)
M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction [3.2] M3Dは複雑なシーンのための新しい単一ビュー3D再構成フレームワークである。
グローバルな特徴と局所的な特徴の抽出のバランスを保ち、シーンの理解と表現精度を向上させる。
その結果,2重分岐特徴抽出による深度情報との融合により,幾何的整合性と忠実度が著しく向上することが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:49:24 GMT)
Efficient Verifiable Differential Privacy with Input Authenticity in the Local and Shuffle Model [3.2] ローカルディファレンシャルプライバシ(LDP)は、中央サーバ(アグリゲータ)を信頼することなく、アグリゲーション統計の効率的なリリースを可能にする。
LDPは、入力と出力の両方を操作できる悪意のあるクライアントに対して脆弱であることが示されている。
悪意あるクライアントが LDP スキームを妥協するのを防ぐ方法を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:04:55 GMT)
CV-Cities: Advancing Cross-View Geo-Localization in Global Cities [3.1] クロスビュージオローカライゼーション(CVGL)は、地上画像の地理的位置を決定するために衛星画像のマッチングと検索を行う。
この課題は, 視点の相違, 局所化シナリオの複雑化, グローバルなローカライゼーションの必要性など, 重大な課題に直面している。
本稿では,基本モデルであるDINOv2と高度な機能ミキサーを統合した新しいCVGLフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:41:22 GMT)
Trace formula for quantum chaotic systems with geometrical symmetries and spin [3.0] 我々は、粒子スピン沈降と離散幾何学的対称性の両方を考慮に入れた量子カオス系のグッツウィラー型トレース式を導出した。
後続の論文では、我々の公式は、幾何学的対称性とスピンがスペクトル統計に与える影響を研究できることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:39:07 GMT)
EVT: Efficient View Transformation for Multi-Modal 3D Object Detection [3.0] 効率的なビュー変換(EVT)による新しい3次元物体検出法を提案する。
EVTは、アダプティブサンプリングとアダプティブプロジェクション(ASAP)を使用して、3Dサンプリングポイントとアダプティブカーネルを生成する。
トランスデコーダ内で得られたマルチモーダルBEV機能を効果的に活用するように設計されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:07:18 GMT)
Quantum Supercritical Crossovers with Dynamical Singularity [3.0] テンソルネットワーク計算とスケーリング解析により量子イジングモデルとライドバーグ原子配列について検討する。
2つの交差線によって閉ざされ、相関や絡み合いの普遍的な振る舞いを持つ超臨界量子状態が存在する。
我々は、Rydberg原子配列が、量子超臨界クロスオーバーを研究し、臨界指数を測定するための理想的なプラットフォームを提供することを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:54:37 GMT)
Graph as a feature: improving node classification with non-neural graph-aware logistic regression [3.0] Graph-aware Logistic Regression (GLR) はノード分類タスク用に設計された非神経モデルである。
GNNにアクセスできる情報のごく一部しか使わない従来のグラフアルゴリズムとは異なり、提案モデルではノードの特徴とエンティティ間の関係を同時に活用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:32:14 GMT)
STREAM: A Universal State-Space Model for Sparse Geometric Data [2.9] ポイントクラウドやイベントベースのビジョンなど、非構造化の幾何学的データを扱うことは、マシンビジョンの分野における急激な課題である。
状態空間モデルのパラメータ化に幾何構造を明示的にエンコードすることを提案する。
本モデルでは, スパースデータを最新のハードウェアに効率的にマッピングするために, カーネルを改良したMamba選択状態空間モデルをデプロイする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:06:32 GMT)
Non-IID data in Federated Learning: A Systematic Review with Taxonomy, Metrics, Methods, Frameworks and Future Directions [2.9] この体系的なレビューは、非IIDデータ、パーティションプロトコル、メトリクスの詳細な分類を提供することによってギャップを埋めることを目的としている。
非IIDデータに対処するための一般的なソリューションと、異種データを用いたフェデレートラーニングで使用される標準化されたフレームワークについて述べる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:53:28 GMT)
Distributionally robust self-supervised learning for tabular data [2.9] エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:45:14 GMT)
Securing Satellite Link Segment: A Secure-by-Component Design [2.9] 本稿では,地球観測(EO)の2つのミッションについて検討し,その1つは1つの低軌道衛星(LEO)と1つの低軌道衛星(LEO)を衛星ネットワークを通じて利用し,安全な設計戦略を採用する。
このアプローチは、技術セキュリティエンジニアリングの範囲を定義し、システムをコンポーネントとデータフローに分解し、攻撃面を列挙することから始まります。
低レベルのコンポーネントに対する脅威を特定し、セキュア・バイ・デザインの原則を適用し、スペースアタック・リサーチ・戦術分析(SPARTA)フレームワークに従ってコンポーネントをセキュアなブロックに再設計し、システム設計へのステートメントを作成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:45:12 GMT)
CARLA2Real: a tool for reducing the sim2real gap in CARLA simulator [2.9] 我々は、シミュレーションデータのフォトリアリズムを高めるために最先端のアプローチを採用し、それらを実世界のデータセットの視覚的特徴と整合させる。
そこで我々はCARLA2Realを開発した。CARLA2Realは、広く使われているオープンソースのCARLAシミュレーターである。
このツールは、CARLAをほぼリアルタイムで出力し、13FPSのフレームレートを実現し、実世界のデータセットの視覚的スタイルとリアリズムに変換する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:06:20 GMT)
ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems [2.9] Retrieval-Augmented Generation (RAG) システムは、無関係またはゆるい関連情報の検索によって不正確な応答を生成する。
チャンクレベルで取得した情報を評価・フィルタリングすることでRAGシステムを強化するフレームワークであるChunkRAGを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:00:41 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8] 本稿では,診療所における低コストシステムを用いた心疾患の迅速かつ効率的な診断方法を提案する。
LSCNネットワークによる心臓音の総合的分類精度は96%以上である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:30:46 GMT)
\textsc{Neon}: News Entity-Interaction Extraction for Enhanced Question Answering [2.8] 本稿では,ニュース記事に記載されている新たなエンティティインタラクションの抽出を目的としたNEONフレームワークを提案する。
NEONは、そのようなインタラクションをキャプチャするエンティティ中心のタイムスタンプ知識グラフを構築する。
オープンな情報抽出(openIE)スタイルを大規模言語モデルに組み込むことによって,我々のフレームワークは革新的になる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:17:43 GMT)
Computer-Vision-Enabled Worker Video Analysis for Motion Amount Quantification [2.8] 本稿では,上肢動作の追跡と定量化のための新しい枠組みを提案する。
姿勢推定による関節位置データを用いて、このフレームワークは、運動量の定量化と監視にHotellingの$T2$統計を使用する。
その結果, 作業者の関節運動量とHotellingのT2$統計値との相関は, マイクロタスクの方がマクロタスクよりも約35%高いことがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:45:30 GMT)
Optimal Geometry of Oscillators in Gravity-Induced Entanglement Experiments [2.7] この研究は、フォームファクタを最大化する最適幾何を$Lambda$で検証する。
数学的には、この形式係数はすべての測地線と空間配置において2pi$の上限を持つことが証明されている。
これは、将来の実験と量子重力検出を補助する基本的な限界を確立する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:44:26 GMT)
Generating bilingual example sentences with large language models as lexicography assistants [2.7] 本稿では,資源レベルの異なる言語におけるバイリンガル辞書の例文の生成と評価におけるLLMの性能について検討する。
GDEX(Good Dictionary Example)基準に対するLCM生成例の品質評価を行った。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:57:28 GMT)
Head and Neck Tumor Segmentation from [18F]F-FDG PET/CT Images Based on 3D Diffusion Model [2.5] 頭頸部がん(H&N)は、世界で最も多いがんの1つである。
近年,様々な画像生成タスクにおいて拡散モデルが顕著な性能を示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:48:07 GMT)
IoT-Based 3D Pose Estimation and Motion Optimization for Athletes: Application of C3D and OpenPose [2.3] IoT-Enhanced Pose Optimization Network (IEPO-Net) for High-precisionD 3 pose Estimation and Motion Optimization of track and field athletes。
IEPO-Netは、リアルタイムキーポイント検出とハイパーテンポラルパフォーマンスチューニングのための抽出機能としてC3Dを統合している。
本研究は、AP+(p50)スコアが90.5、91.0、mAPスコアが74.3、74.0の優れたデータセットを示す。
今後は、さらなるモデル最適化、マルチモーダルデータ統合、実用的なアプリケーションを強化するリアルタイムフィードバックメカニズムの開発に注力する予定である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:29:59 GMT)
HW/SW Implementation of MiRitH on Embedded Platforms [2.3] 組込みデバイスのための有望なMPCitHアルゴリズムであるMiRitHの最初の設計空間探索について、私たちの知る限りの知見を提示する。
我々は,Xilinx ZYNQ 7000 上で混合 HW/SW ブロックのライブラリを開発し,このライブラリに基づいて,実行時あるいはFPGA リソース制約下での最適解を探索する。
この結果から,MiRitHは,実行時およびFPGAリソース要求の観点から,組込みデバイスに対して実行可能なアルゴリズムであることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:30:08 GMT)
Perspective-Equivariance for Unsupervised Imaging with Camera Geometry [2.3] 光イメージングシステムにおける投影型カメラ幾何を利用するフレームワークである視点同変イメージング(EI)を提案する。
カメラ幾何学から派生した,よりリッチな非線形変換は,衛星画像や都市画像データに優れた先行技術であることを示す。
パースペクティブ-EIは、文献における他の教師なし手法よりも優れた、マルチスペクトルパンシャーピングにおける最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:51:34 GMT)
Magnetic steganography based on wide field diamond quantum microscopy [2.3] ダイヤモンド窒素空孔中心を用いた広視野量子顕微鏡による磁気ステガノグラフィーを実験的に実証した。
本発明の方法は、従来の光学的計測では見えない隠蔽情報を明らかにすることができる磁気イメージングを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:45:00 GMT)
ShadowGPT: Learning to Solve Quantum Many-Body Problems from Randomized Measurements [2.2] 本稿では,量子実験から収集したランダム化測定データから学習することで,量子多体問題を解く新しい手法であるShadowGPTを提案する。
このモデルは量子ハミルトニアンの基底状態のシミュレーションされた古典的影データに基づいて訓練された生成前訓練変圧器(GPT)である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:57:57 GMT)
Accelerating UMAP for Large-Scale Datasets Through Spectral Coarsening [2.2] 提案手法は,本質的な多様体構造を保ちながら,データセットのサイズを大幅に削減する。
USPSのような実世界のデータセットの実験では、埋め込み忠実さを損なうことなく、実質的なデータ削減を実現する方法の能力を実証している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:32:17 GMT)
LazyDINO: Fast, scalable, and efficiently amortized Bayesian inversion via structure-exploiting and surrogate-driven measure transport [2.1] 本稿では,高次元非線形逆問題に対する高速でスケーラブルで効率的に補正された解に対する輸送マップ変分推定法であるLazyDinoについて述べる。
本手法は,PtOマップとヤコビアンとの結合サンプルを用いて,PtOマップの微分インフォームド・ニューラルサロゲートを構成するオフライン位相からなる。
オンラインフェーズでは、観測データを与えられた場合、遅延マップの代理駆動学習を用いて、素早い後部近似を求める。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:48:00 GMT)
Quantum Prometheus: Defying Overhead with Recycled Ancillas in Quantum Error Correction [2.1] 量子エラー訂正(QEC)は、量子コンピュータの信頼性を確保するために重要である。
QEC符号は安定化器測定のためのアンシラ量子ビットに大きく依存する。
我々は,X型およびZ型安定器で同じアンシラ量子ビットを再利用することにより,アンシラ量子ビット数の削減を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:06:24 GMT)
Quantum memory circuit for ion channel dynamics in the nervous system [2.1] イオンチャネルをナノスケールの2末端イオントンネル接合としてモデル化する。
2つの終端イオントンネル接合に作用する外部時間変化電圧は、外部からのニューロンの刺激を模倣する。
I-V曲線における非零交差点の数と微分コンダクタンスの振動が、アクティブな量子メモリを定量的に記述する特性であることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:22:57 GMT)
Declare and Justify: Explicit assumptions in AI evaluations are necessary for effective regulation [2.1] 規制は、開発者が評価に関する主要な前提を明示的に識別し、正当化する必要がある、と我々は主張する。
我々は、包括的脅威モデリング、プロキシタスクの妥当性、適切な能力付与など、AI評価における中核的な仮定を特定する。
提案したアプローチは,AI開発における透明性の向上を目標とし,先進的なAIシステムのより効果的なガバナンスに向けた実践的な道筋を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:13:56 GMT)
Data Pruning in Generative Diffusion Models [2.0] 生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:13:25 GMT)
Plurals: A System for Guiding LLMs Via Simulated Social Ensembles [1.9] 本稿では,多言語AIのためのシステムとPythonライブラリであるPluralsを紹介する。
複数は、カスタマイズ可能な構造内で意図的にエージェントで構成され、モデレーターは熟考を監督する。
6つのケーススタディは、理論的構成と有効性に対する忠実さを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:37:57 GMT)
Integrating Dynamic Correlation Shifts and Weighted Benchmarking in Extreme Value Analysis [1.9] 本稿では、EVDBM(Extreme Value Dynamic Benchmarking Method)を導入することにより、EVA(Extreme Value Analysis)に対する革新的なアプローチを提案する。
EVDBMは極端な事象を検出するために極端な値理論を統合し、新しいDISC(Dynamic Identification of Significant correlation)-Thresholdingアルゴリズムと結合している。
EVDBMの柔軟性は、意思決定の感度が不可欠である他のセクターの幅広い応用の可能性を示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:00:39 GMT)
Probing false vacuum decay on a cold-atom gauge-theory quantum simulator [1.8] 本研究では, 冷原子量子シミュレータを用いて, 無限質量真空の対生成に及ぼす背景場の影響を実験的に検討した。
ゼロ質量極限における時間発展可観測物のエネルギースペクトルは、シュウィンガー模型のボソニックモードに類似した励起ピークを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:28:24 GMT)
DLBacktrace: A Model Agnostic Explainability for any Deep Learning Models [1.7] ディープラーニングモデルは、意思決定プロセスにおける透明性が制限された不透明な'ブラックボックス'として機能する。
この研究は、AIシステムにおける解釈可能性の押し付けの必要性に対処し、信頼の育成、説明責任の確保、ミッションクリティカルな分野における責任あるデプロイメントの促進におけるその役割を強調した。
DLBacktraceは、AryaXAIチームが開発し、幅広い領域にわたるモデル決定を照らす革新的なテクニックです。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:54:30 GMT)
Refusal in LLMs is an Affine Function [1.7] 本稿では,アフィン概念編集 (ACE) を言語モデルの振る舞いを制御するためのアプローチとして提案する。
ACEはアフィン部分空間の投影とアクティベーションの追加を組み合わせて、モデルの拒絶反応を確実に制御する。
実験の結果、ACEは既存の手法よりもモデル動作をより正確に制御できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:53:47 GMT)
Graph Neural Network-Based Entity Extraction and Relationship Reasoning in Complex Knowledge Graphs [1.6] 本研究では,グラフニューラルネットワークに基づく知識グラフ実体抽出と関係推論アルゴリズムを提案する。
本稿では、エンドツーエンドのジョイントモデルを構築することにより、エンティティと関係の効率的な認識と推論を実現する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:23:49 GMT)
Evaluating the Effectiveness of Hybrid Quantum-Classical Convolutional Neural Networks for Image Classification in Multiple Color Spaces [1.6] そこで本研究では,4種類のカラー空間画像の性能解析を行うためのハイブリッド量子古典畳み込みニューラルネットワーク(HQCCNN)モデルを提案する。
一部のスーパークラスでは、モデルがラボ、YCrCb、HSVの色空間だけでなく、RGBよりも優れている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:53:43 GMT)
Careless Whisper: Exploiting Stealthy End-to-End Leakage in Mobile Instant Messengers [1.5] 本稿では,配送レシートがユーザに対して重大なプライバシー上のリスクをもたらすことを強調する。
特別に作られたメッセージを使って、配達のレシートをトリガーすることで、ユーザーは自分の知識や同意なしに入力できるのです。
私たちはこの問題に対処するための設計変更を主張する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:26:29 GMT)
Sensor-fusion based Prognostics Framework for Complex Engineering Systems Exhibiting Multiple Failure Modes [1.5] 複雑なエンジニアリングシステムは、しばしば複数の障害モードを必要とする。
本稿では,ラベルのないトレーニングデータセットに対して,クラスタリングとセンサの選択を同時に行う手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:52:59 GMT)
A Universal Protocol for Quantum-Enhanced Sensing via Information Scrambling [1.5] 本稿では,ハイゼンベルクに制限された量子強調センシングを可能にする新しいプロトコルを提案する。
我々は「スクランブル」および「アンスクランブル」量子状態のコヒーレントな重ね合わせを生成するために前方および逆時間進化を利用する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:00:00 GMT)
Rethinking cluster-conditioned diffusion models for label-free image synthesis [1.5] 拡散に基づく画像生成モデルは、地上の真理ラベルに条件付けされた場合の画質を向上させることができる。
クラスタ数やクラスタリング手法など,個々のクラスタリング決定要因が画像合成に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:00:38 GMT)
A Comparative Study of Text Retrieval Models on DaReCzech [1.5] 本稿では,Splade,Plaid,Plaid-X,SimCSE,Contriever,OpenAI ADA,Gemma2の7つの市販文書検索モデルの総合評価を行う。
本実験の目的は,チェコ語における現代の検索手法の質を推定することである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:19:46 GMT)
Enabling Large Language Models to Perform Power System Simulations with Previously Unseen Tools: A Case of Daline [1.4] この研究は、パワーシステムと大規模言語モデルの両方から専門知識を統合するモジュラーフレームワークを提案する。
GPT-4oのシミュレーション符号化精度は0%から96.07%に向上し、ChatGPT-4oのウェブインタフェースの33.8%の精度を上回っている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:16:11 GMT)
Inclusive content reduces racial and gender biases, yet non-inclusive content dominates popular culture [1.4] 私たちは最先端の機械学習モデルを使用して、50年以上にわたって30万以上の画像を分類しています。
人種的少数派は白人よりもはるかに頻度が低く、それらが現れると、顕著に描写されなくなる。
また、女性は全身で描かれる傾向が強く、男性は顔で描かれる傾向が強いこともわかりました。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:21:20 GMT)
Solving the Perfect Domination Problem by Quantum Approximate Optimization Algorithm with Small Layers [1.3] 完全支配問題(PDP)は、無線やソーシャルネットワークといった現実のシナリオにおいて重要な応用がある。
量子コンピューティングの最近の進歩により、NP完全問題に対処する量子アルゴリズムの開発が急増した。
この研究は、量子アルゴリズムをPDPに適用する先駆的な取り組みであり、それを解決するための有効性を示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:12:36 GMT)
SAM Carries the Burden: A Semi-Supervised Approach Refining Pseudo Labels for Medical Segmentation [1.3] 我々は、Segment Anything Modelの抽象オブジェクト理解を医用画像セグメンテーションに活用し、半教師付き学習のための擬似ラベルを提供する。
提案手法は,注釈付きデータの限られた量から得られる初期セグメンテーションを改良する。
本手法は,強度に基づく後処理法より優れる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:06:21 GMT)
Analysing Explanation-Related Interactions in Collaborative Perception-Cognition-Communication-Action [1.3] 我々は、シミュレーションされた緊急対応タスクを完了させるために協力する人間同士のコミュニケーションを分析し、分類する。
ほとんどの説明関連メッセージは、決定や行動の明確化を求めている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:07:04 GMT)
PR-ENDO: Physically Based Relightable Gaussian Splatting for Endoscopy [1.3] 本稿では,内視鏡の複雑な取得条件に合わせて,物理ベースで再現可能なモデル内で3D Splattingを利用するフレームワークであるPR-ENDOを提案する。
提案手法は,ベースライン手法に比べて画質が優れていた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:52:30 GMT)
A Decentralised Digital Token Architecture for Public Transport [1.2] 本研究の目的は,プライバシ向上型デジタルトークン管理サービスの公共交通機関への適用の可能性を確立することにある。
概念実証実装が開発され、Goodell と Aste が提案した設計に基づいている。
デモされたスループットとレイテンシは、システムが現在使用されているソリューションと競合できることを示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:07:35 GMT)
Stream-Based Active Learning for Process Monitoring [1.2] 本稿では,統計的プロセスモニタリング(SPM)のためのストリームベースの新しいアクティブラーニング戦略を提案する。
最終的な目標は、限られた予算で制約されたリソースのラベル付けを最適化し、可能なOC状態を動的に更新することである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:27:54 GMT)
Brain-inspired Computing Based on Deep Learning for Human-computer Interaction: A Review [1.2] 脳にインスパイアされたコンピューティングは、マルチモーダル技術とバイオメディカル分野の間の重要な交差点である。
本稿では、ディープラーニング(DL)に基づく脳に触発されたコンピューティングモデルについて、その進化、アプリケーション価値、課題、潜在的研究動向について概観する。
脳にインスパイアされた計算モデルの大幅な進歩にもかかわらず、その能力を完全に活用することが課題である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:27:27 GMT)
Wavelets Are All You Need for Autoregressive Image Generation [1.2] 本稿では,2つの主成分をベースとした自己回帰画像生成手法を提案する。
1つ目はウェーブレット画像符号化で、画像の視覚的詳細を粗いものから細部までトークン化することができる。
2つ目は、アーキテクチャが再設計され、トークンシーケンスに最適化された言語トランスフォーマーの変種である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:28:19 GMT)
Multivariate and Online Transfer Learning with Uncertainty Quantification [1.2] 未治療の歯周炎は、歯の支持組織内で炎症を起こし、歯の喪失を引き起こす。
本稿では,RECaSTベイズ変換学習フレームワークの拡張を提案する。
負の移動は、他の人口集団から共有された情報が、未表現の参加者のモデリングに悪影響を及ぼさないよう緩和される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:14:13 GMT)
Measurement-Based Quantum Compiling via Gauge Invariance [1.2] 我々は,任意の量子回路を直接グラフ状態のクラスに変換する量子コンパイルのための新しいパラダイムを,そのサイズとは独立に導入する。
グラフ状態は、ファインマンのものと似たグラフィカルな規則のセットを用いることで、回路と入力から再構築することができる。
測定値と比較すると,QFTで50%,QAOAで75%減少する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:09:49 GMT)
Cascaded Diffusion Models for 2D and 3D Microscopy Image Synthesis to Enhance Cell Segmentation [1.1] 本稿では,高密度な2Dおよび3D細胞顕微鏡画像の合成のための新しいフレームワークを提案する。
マルチレベル拡散モデルと3次元表面再構成手法であるNeuSを用いて,スパース2次元アノテーションから2次元および3次元セルマスクを合成する。
合成データと実データを組み合わせたセグメンテーションモデルをトレーニングすることで,複数のデータセットで最大9%のセルセグメンテーション性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:50:38 GMT)
Superconductivity in a Topological Lattice Model with Strong Repulsion [1.1] 時間反転対称性,バンドトポロジ,強い反発相互作用を組み込んだ最小2次元格子モデルを提案する。
本研究は,QSH絶縁体上の孔の弱い対から形成されることを示す。
このことから,本モデルとTBGのキラル限界における構造的類似点と相違点を解明した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:39:48 GMT)
Weakly-supervised land classification for coastal zone based on deep convolutional neural networks by incorporating dual-polarimetric characteristics into training dataset [1.0] 本研究では, 空間偏光合成開口レーダ(PolSAR)を用いた意味的セグメンテーションにおけるDCNNの性能について検討する。
PolSARデータを用いたセマンティックセグメンテーションタスクは、SARデータの特徴とアノテート手順が考慮されている場合、弱い教師付き学習に分類することができる。
次に、SegNet、U-Net、LinkNetを含む3つのDCNNモデルが実装されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:30:22 GMT)
Tangential Randomization in Linear Bandits (TRAiL): Guaranteed Inference and Regret Bounds [1.0] 本稿では,線形帯域探索アルゴリズムTRAiLの提案と解析を行う。
TraiLは、設計(回帰器)行列の最小固有値によって測定された推論品質の$Omega(sqrtT)$成長を保証する。
我々は,期待された後悔に対して,任意のアルゴリズムに対して$Omega(sqrtT)$ minimax小境界を特徴付ける。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:08:13 GMT)
Optimizing Airline Reservation Systems with Edge-Enabled Microservices: A Framework for Real-Time Data Processing and Enhanced User Responsiveness [1.0] 本稿では,航空会社におけるエッジコンピューティングの実現のための概念的枠組みについて概説する。
エッジコンピューティングは、座席在庫チェック、予約プロセス、さらにはユーザに近い確認など、特定のアクティビティを可能にするため、全体の応答時間を短縮し、システムの性能を向上させる。
フレームワークの価値には、低レイテンシ、高スループット、高ユーザエクスペリエンスなど、システムのハイパフォーマンスを達成することが含まれるべきです。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:58:15 GMT)
Classification of Geographical Land Structure Using Convolution Neural Network and Transfer Learning [1.0] 本研究は, 都市計画・開発, 環境モニタリング, 災害管理など, 一連の応用を創出することができる。
本稿では、地理的な土地構造を分類するプロセスを自動化するための深層学習に基づくアプローチを開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:01:30 GMT)
Design of an FPGA-Based Neutral Atom Rearrangement Accelerator for Quantum Computing [1.0] ニュートラル原子は量子コンピュータを実装するための有望な技術として登場した。
本稿では,分割・対数戦略を応用し,複数の原子の同時移動を可能にする新しい四分法に基づく再配置アルゴリズムを提案する。
これは原子再構成のための最初のハードウェアアクセラレーションであり、処理時間を著しく短縮する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:38:21 GMT)
Low-characteristic-impedance superconducting tadpole resonators in the sub-gigahertz regime [1.0] 共平面導波路の一端に短絡し、他方端に大きな平行平板コンデンサを配置し、簡易で多目的な共振器の設計を実証する。
これらのタドポール共振器は、チップのフットプリントを小さく保ちながら、低周波数・低文字インピーダンスを必要とするアプリケーションに適していると結論付けている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:05:51 GMT)
Transfer Learning on Transformers for Building Energy Consumption Forecasting -- A Comparative Study [0.9] 本研究では,トランスフォーマーアーキテクチャへのトランスファーラーニング(TL)の適用について検討した。
我々は、ビルディングデータゲノムプロジェクト2から16のデータセットを使用して、ビルディングエネルギー消費予測モデルを作成します。
本研究は, TLやTransformerアーキテクチャといった先進的な手法による建築エネルギー消費予測を推し進めるものである。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:19:12 GMT)
On the Accuracy and Precision of Moving Averages to Estimate Wi-Fi Link Quality [0.9] 移動平均に基づいて無線リンク品質を推定する手法を解析した。
結果は、無線ネットワークの予測不能を緩和するために人工知能をどのように使用できるかを研究する際に、ベースラインとして使用できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:28:58 GMT)
DDIM-Driven Coverless Steganography Scheme with Real Key [0.9] ステガノグラフィーはその冗長性を利用して 秘密情報を画像に埋め込む
そこで本研究では,DDIM(Denoising Diffusion Implicit Model)を用いて高品質なステゴイメージを生成する。
本手法はカオス暗号を組み込むことにより,低画像相関の実鍵保護を実現する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:31:31 GMT)
A new Input Convex Neural Network with application to options pricing [0.9] 入力の凸関数として設計されたニューラルネットワークの新たなクラスを導入する。
これらのニューラルネットワークは、特に凸ペイオフでオプションの価格を近似するのに適しています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:50:42 GMT)
Probing the Capacity of Language Model Agents to Operationalize Disparate Experiential Context Despite Distraction [0.8] 大規模言語モデル(LLM)エージェントは、多くのドメインでpromiseを示す。
OEDDコーパス(OEDD corpus)を提案する。
我々は,最小限のチェーン・オブ・シークレット・プロンプト戦略を用いて,最先端の3つのLSMを評価した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:33:16 GMT)
Time dependent Markovian master equation beyond the adiabatic limit [0.8] 我々は、駆動および制御対象系の進化をモデル化するマルコフのマスター方程式を導出する。
提案手法の信頼性と適用範囲を,数値的精度のシミュレーションに対して導出した還元時間進化の解をベンチマークすることによって示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:56:29 GMT)
Sequential Quantum Maximum Confidence Discrimination [0.8] 最大信頼度を有する量子状態判別の逐次シナリオについて検討する。
最大信頼度測定のための正の演算値測定要素が線形独立である場合にのみ、等しく高い信頼度を持つ逐次状態判別が実現できることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:03:34 GMT)
Quantum advantage from soft decoders [0.8] 最適多項式補間法(OPI)問題におけるいくつかのインスタンス化の改善について述べる。
我々の結果は自然で説得力のある復号問題をもたらし、量子的優位性を持っていると信じている。
本稿では,Regevのリダクションの設定にデコーダを利用できるように,シンドロームからコセットサンプリング問題への新たなリダクションを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:12:03 GMT)
Transforming Teacher Education in Developing Countries: The Role of Generative AI in Bridging Theory and Practice [0.7] この研究はガーナに焦点を当てており、限られた教育モデル、パフォーマンスベースアセスメント、実践者と実践者のギャップといった課題が進歩を妨げる。
GenAIは、コンテンツ知識獲得の支援により、これらの課題に対処する能力を持っている。
この研究は、これらの役割をさらに探求するための実証的研究を推奨し、教員教育システムにGenAIを統合するための実践的なステップを効果的に発展させることで結論付けられた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:36:27 GMT)
Towards a framework on tabular synthetic data generation: a minimalist approach: theory, use cases, and limitations [0.7] このフレームワークは、実生活の金融アプリケーションと平行する高次元のクレジットスコアリングデータに適用される。
提案手法は単純であり,解釈可能性を保証するとともに,追加のチューニングを必要とせず,独特なメリットを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:20:47 GMT)
Machine learning-based probabilistic forecasting of solar irradiance in Chile [0.7] 本研究はチリの第三地域及び第四地域における太陽放射の確率論的予測について検討する。
ニューラルネットワークを用いた後処理手法を提案し、8員のアンサンブル予測を改善した。
全ての予測は30か所の観測結果に対して評価され、後処理の予測技術は生のWRFアンサンブルと比較される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:50:56 GMT)
SOWA: Adapting Hierarchical Frozen Window Self-Attention to Visual-Language Models for Better Anomaly Detection [0.7] CLIPモデルに基づく新しいウィンドウ自己認識機構を導入し、学習可能なプロンプトを付加してマルチレベル機能を処理する。
提案手法は5つのベンチマークデータセットで厳格に評価され,20項目中18項目をリードすることで,優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:01:50 GMT)
SCORPION Cyber Range: Fully Customizable Cyberexercises, Gamification, and Learning Analytics to Train Cybersecurity Competencies [0.7] サイバーセキュリティ能力を訓練する最も重要なツールの1つは、サイバーレンジだ。
本稿では,完全に機能的でモチベーションの高いサイバーレンジであるSCORPIONを紹介する。
さらにSCORPIONには、学生のモチベーションを改善するためのいくつかの要素が含まれている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:05:07 GMT)
Quantum Gravity, Hydrodynamics and Emergent Cosmology: A Collection of Perspectives [0.7] このパースペクティブ・ピースのコレクションは、量子重力、流体力学、創発的な宇宙論をブリッジする研究コミュニティの最近の進歩とリフレクションを捉えている。
a) アナログ重力系を含む流体力学と宇宙学の相互作用、(b) 相転移、連続極限、量子重力における創発的幾何学、(c) 重力と量子重力における関係的な視点、(d) 量子重力の枠組みに根ざした宇宙学モデルの出現である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:38:14 GMT)
Hybrid Gaussian Process Regression with Temporal Feature Extraction for Partially Interpretable Remaining Useful Life Interval Prediction in Aeroengine Prognostics [0.6] 本稿では,Remaining Useful Life (RUL) 間隔予測のための改良されたガウスプロセス回帰(GPR)モデルを提案する。
修正されたGPRは、過去のデータから学習することで信頼区間を予測し、より構造化された方法で不確実性モデリングに対処する。
現代の製造システムに固有の複雑な時系列パターンや動的挙動を効果的に捉えている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:00:02 GMT)
Grading and Anomaly Detection for Automated Retinal Image Analysis using Deep Learning [0.6] 本研究はPRISMA分析を用いた系統的な文献レビューを行い,62項目について検討した。
DR病変の検出に使用される多種多様なディープラーニング技術について論じる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:01:03 GMT)
Target Height Estimation Using a Single Acoustic Camera for Compensation in 2D Seabed Mosaicking [0.6] 撮像過程における高度角の喪失は、元の音響カメラ画像における目標高さ情報の欠如をもたらす。
乱雑で探索されていない海洋環境を知覚する際、標的高度データは海洋ロボットとの衝突を避けるために不可欠である。
本研究では,1台の音響カメラを用いて海底高度を推定し,標高データを2次元海底モザイクに統合する手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:42:24 GMT)
Efficient Training in Multi-Agent Reinforcement Learning: A Communication-Free Framework for the Box-Pushing Problem [0.6] 本稿では,自己組織化システムのための共有プール(SPI)モデルを提案する。
SPIは、情報を全てのエージェントにアクセスし、調整を容易にし、エージェント間の力の衝突を減らし、探索効率を高める。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:51:10 GMT)
ERUP-YOLO: Enhancing Object Detection Robustness for Adverse Weather Condition by Unified Image-Adaptive Processing [0.5] 霧や低照度などの悪天候に対する画像適応型物体検出法を提案する。
本フレームワークでは, 後段物体検出に適した画像強調を行うために, 可変プリプロセッシングフィルタを用いる。
我々は,統一画像処理(ERUP)-YOLOによる拡張ロバストネス(Enhanced Robustness)と呼ばれる提案手法をYOLOv3検出器に適用することにより評価した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:13:43 GMT)
Copula-Linked Parallel ICA: A Method for Coupling Structural and Functional MRI brain Networks [0.5] 機能的MRI(fMRI)と構造的MRI(sMRI)を融合させる以前の研究では、このアプローチの利点が示されている。
我々は、深層学習フレームワーク、コプラと独立成分分析(ICA)を組み合わせた新しい融合法、コプラリンク並列ICA(CLiP-ICA)を開発した。
CLiP-ICAは、脳、感覚運動、視覚、認知制御、デフォルトモードネットワークなど、強い結合と弱い結合sMRIとfMRIネットワークの両方を効果的にキャプチャする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:56:20 GMT)
From Text to Pose to Image: Improving Diffusion Model Control and Quality [0.5] 提案手法では,新しいサンプリングアルゴリズムとともにテキスト・ツー・プレイス(T2P)生成モデルを導入し,ポーズの忠実度を高めるためにより多くのポーズ・キーポイントを組み込んだ新しいポーズ・アダプタを提案する。
これら2つの新しい最先端モデルによって、拡散モデルにおける高ポーズ制御のための生成的テキスト・ツー・プレイス・ツー・イメージ・フレームワークが、初めて実現された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:34:50 GMT)
A Context-Based Numerical Format Prediction for a Text-To-Speech System [0.5] 提案手法は既存の特徴抽出手法よりも優れ,分類精度が30%から37%向上した。
数値形式分類の使用により、TSシステムの信頼性が向上する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:06:43 GMT)
IDCIA: Immunocytochemistry Dataset for Cellular Image Analysis [0.5] そこで我々は,細胞画像解析のための機械学習手法の有効性を向上させるために,新しい注釈付き微視的セル画像データセットを提案する。
我々のデータセットには、細胞の顕微鏡像と、各画像、細胞数、細胞の位置が含まれています。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:51:07 GMT)
Stabilizer Tensor Networks with Magic State Injection [0.5] 本稿では,多数の非クリフォード演算で回路をシミュレートする機構を改良した新しいフレームワークについて報告する。
具体的には、ランダムな$T$-doped $N$-qubit Clifford 回路は、$t lesssim N$$T$-gatesを持つ場合、$mathcalO(textpoly(N))$としてマジック状態注入スケールで作成された回路の計算コストを$mathcalO(textpoly(N))$とする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:03:27 GMT)
Intelligent Tutors for Adult Learners: An Analysis of Needs and Challenges [0.5] 本稿では,知的学習システムなどの教育技術を用いた成人学習者のニーズを明らかにすることを目的とする。
私たちは4つのインテリジェントな家庭教師を作り、それを1年間、州立大学の110の教室に展開しました。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:05:04 GMT)
Interpretable Fusion Analytics Framework for fMRI Connectivity: Self-Attention Mechanism and Latent Space Item-Response Model [0.5] 本稿では,ディープラーニングプロセスの分類結果を解釈する新しい分析フレームワークを提案する。
この枠組みを4種類の認知障害に適用することにより,本手法が重要なROI関数の決定に有効であることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:28:29 GMT)
Hyper-parameter Optimization for Federated Learning with Step-wise Adaptive Mechanism [0.5] Federated Learning(FL)は、クライアントの生のデータセットを共有するのではなく、ローカルモデルパラメータを利用して機密情報を保護する分散学習アプローチである。
本稿では、FL設定における2つの軽量ハイパー最適化(HPO)ツールであるRaytuneとOptunaの展開と統合について検討する。
この目的のために、ローカルとグローバルの両方のフィードバック機構が統合され、検索空間が制限され、HPOプロセスが高速化される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:49:00 GMT)
Railway LiDAR semantic segmentation based on intelligent semi-automated data annotation [0.5] 本稿では,スキャンと画像の併用による2DPassネットワークアーキテクチャに基づくポイントワイズ3次元セマンティックセマンティックセマンティックセマンティクスのアプローチを提案する。
また,ドイツの鉄道線路に記録された必要なデータセットを効率よく正確にラベル付けするために,半自動のインテリジェントデータアノテーション手法を提案する。
我々は、鉄道環境からのカメラやLiDARデータを含むレールデータを注釈し、画像セグメンテーションネットワークを用いて生のLiDAR点雲を転送し、アクティブラーニングを効率的に活用する最先端の3DLiDARセグメンテーションネットワークを訓練する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:49:45 GMT)
A Hybrid Data-Driven Multi-Stage Deep Learning Framework for Enhanced Nuclear Reactor Power Prediction [0.4] 本稿では,リアクトル過渡期の最終定常電力を予測するための,新しい多段階深層学習フレームワークを提案する。
我々は、分類段階と回帰段階の両方のフィードフォワードニューラルネットワークを使用し、リアクトルパワーの実環境計測と制御状態を統合したユニークなデータセットをトレーニングする。
ノイズを伴うシミュレーションデータの取り込みにより、モデルの一般化能力が大幅に向上し、オーバーフィッティングのリスクが軽減される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:10:34 GMT)
Vision-based Manipulation of Transparent Plastic Bags in Industrial Setups [0.4] 本稿では, 産業設備における透明プラスチック袋の自律切削・開梱における視覚的操作の課題について述べる。
提案手法は、高度な機械学習アルゴリズム、特に畳み込みニューラルネットワーク(CNN)を用いる。
追尾アルゴリズムと深度センシング技術は、ピック・配置中の3次元空間認識に利用される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:15:56 GMT)
A Review on Generative AI Models for Synthetic Medical Text, Time Series, and Longitudinal Data [0.3] 本稿では3種類の合成健康記録(SHR)を作成するための実用モデルに関する新しいスコーピングレビューの結果について述べる。
52の出版物が医療時系列(22件)、縦断データ(17件)、医用テキスト(13件)を生成するための適格基準を満たした。
プライバシー保護は研究論文の主要な研究目的であり,他の目的として,クラス不均衡,データ不足,データ改ざんなどがあった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:53:54 GMT)
Instrumentation of Software Systems with OpenTelemetry for Software Visualization [0.3] OpenTelemetryは、モニタリングデータの収集の標準になっています。
ソフトウェアビジュアライゼーションのために,ソフトウェアシステムを自動的に計測するために,OpenTelemetryをどのように活用するかを,さまざまな方法で紹介する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:01:26 GMT)
Empirical Privacy Evaluations of Generative and Predictive Machine Learning Models -- A review and challenges for practice [0.3] 生成技術を展開する前に、生成した合成データに関連するプライバシーリスクを実証的に評価することが重要である。
本稿では,機械学習に基づく生成および予測モデルにおける経験的プライバシ評価の基礎となる概念と前提について概説する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:19:28 GMT)
A hybrid quantum solver for the Lorenz system [0.3] 我々は,ロレンツ系を解くための古典量子ハイブリッド法を開発した。
フォワードオイラー法を用いて系を時間的に離散化し、方程式系に変換する。
本稿では,ハイブリッド法と古典的アプローチを比較し,ロレンツ系を解く数値計算結果について述べる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:27:45 GMT)
Variational Bayesian Bow tie Neural Networks with Shrinkage [0.3] 我々は、標準フィードフォワード修正ニューラルネットワークの緩和版を構築した。
我々は、条件付き線形およびガウス的モデルをレンダリングするために、Polya-Gammaデータ拡張トリックを用いる。
層間における分布仮定や独立性を回避する変分推論アルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:13:58 GMT)
Emergence of Implicit World Models from Mortal Agents [0.3] 本稿では,自律エージェントにおけるオープンエンド行動最適化の創発的特性として,世界モデルと積極的な探索の可能性について論じる。
生物のオープン・エンディネスの源泉を論じる際、我々は、理論生物学と人工生命の力学的アプローチによって理解される生物学的システムの観点から始める。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:43:30 GMT)
Enhanced Sign Language Translation between American Sign Language (ASL) and Indian Sign Language (ISL) Using LLMs [0.3] 我々は、アメリカ手話の利用者と話し言葉とインド手話(ISL)の利用者の間に橋渡しを提供することを目標とする研究を思いついた。
このフレームワークは、ジェスチャーの可変性の自動処理や、ASLとISLの言語的違いを克服するといった重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:45:12 GMT)
Building Trust: Foundations of Security, Safety and Transparency in AI [0.2] 我々は、問題の追跡、修復、AIモデルのライフサイクルとオーナシッププロセスの明らかな欠如といった課題を強調しながら、現在のセキュリティと安全性のシナリオをレビューする。
本稿では,AIモデルの開発と運用において,より標準化されたセキュリティ,安全性,透明性を実現するための基礎的要素を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 06:55:57 GMT)
Perception of Digital Privacy Protection: An Empirical Study using GDPR Framework [0.2] 本研究では、一般データ保護知覚規則(General Data Protection Perception Regulation, システム二分法)フレームワークを用いて、政府データのデジタルプライバシ保護の認識について検討する。
発見は、人々のプライバシー権の保護に対する認識を二分していることを示唆している。
同意を与えて無断で反対する権利は、最も保護されていないものと認識される。
第2に、この研究は、社会的ジレンマが、彼らのコンテキストと文化に基づいて、デジタルプライバシを知覚する人々の社会的なジレンマの証拠を示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:36:31 GMT)
Conversational Medical AI: Ready for Practice [0.2] 実際の医療環境において,医師が監督する会話エージェントの大規模評価を行う。
当社のエージェントであるMoは、既存の医療アドバイスチャットサービスに統合されました。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:00:31 GMT)
PyAWD: A Library for Generating Large Synthetic Datasets of Acoustic Wave Propagation with Devito [0.2] PyAWDは、高次元合成音響波動伝播データセットを生成するために設計されたPythonライブラリである。
PyAWDは、波速、外部力、空間的および時間的離散化などのパラメータを細かく制御することで、MLスケールのデータセットの作成を可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:49:58 GMT)
Barttender: An approachable & interpretable way to compare medical imaging and non-imaging data [0.1] Barttenderは、画像の有効性と、病気の予測のようなタスクの非画像データの比較にディープラーニングを使用する解釈可能なフレームワークである。
本フレームワークでは,局所的な(サンプルレベルの)説明やグローバルな(人口レベルの)説明だけでなく,パフォーマンス測定による実用性の違いを評価することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:22:25 GMT)
Can Agents Spontaneously Form a Society? Introducing a Novel Architecture for Generative Multi-Agents to Elicit Social Emergence [0.1] 我々は,ITCMA-Sと呼ばれる生成エージェントアーキテクチャを導入し,個々のエージェントの基本的なフレームワークと,マルチエージェント間のソーシャルインタラクションをサポートするフレームワークを紹介する。
このアーキテクチャは、エージェントが社会的相互作用に有害な行動を識別し、フィルタリングし、より好ましい行動を選択するように誘導することを可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:44:30 GMT)
Tailoring the Hyperparameters of a Wide-Kernel Convolutional Neural Network to Fit Different Bearing Fault Vibration Datasets [0.1] 最先端のアルゴリズムは、健康な機械軸受や損傷を受けた機械軸受から発生する振動を識別するのにほぼ完璧であると報告されている。
しかし、新しいデータへの応用はどうだろう?
本稿では, 故障検出のためのニューラルネットワークが, 誤パラメータ化によって損なわれることを確認できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:17:13 GMT)
Volume-law entanglement fragmentation of quasiparticles [0.1] 準粒子状態において、ある単位パターンが運動量空間において繰り返し連続的に励起される絡み合いエントロピーについて検討する。
スケーリングの限界において、各単位パターンは独立かつ普遍的に絡み合いに寄与し、絡み合いエントロピーの体積法的なスケーリングにつながる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:57:40 GMT)
Residual Vision Transformer (ResViT) Based Self-Supervised Learning Model for Brain Tumor Classification [0.1] 自己教師付き学習モデルは、限られたデータセット問題に対するデータ効率と注目すべき解決策を提供する。
本稿では2段階の脳腫瘍分類のための生成型SSLモデルを提案する。
提案されたモデルが最も精度が高く、T1シークエンスでBraTsデータセットで90.56%、Figshareで98.53%、Kaggle脳腫瘍データセットで98.47%を達成している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:42:57 GMT)
Facial Wrinkle Segmentation for Cosmetic Dermatology: Pretraining with Texture Map-Based Weak Supervision [0.1] 私たちは、NVIDIA FFHQデータセットの拡張である、最初の公開顔しわデータセット 'FFHQ-Wrinkle' を構築し、リリースします。
人間のラベル付き1000枚の画像と、自動生成された弱いラベル付き5万枚の画像が含まれている。
このデータセットは、研究コミュニティが高度なしわ検出アルゴリズムを開発する基盤となる可能性がある。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:58:40 GMT)
Child Speech Recognition in Human-Robot Interaction: Problem Solved? [0.0] 我々は、2017年からの子どもの音声認識に関する研究を再考し、実際に性能が向上したことを示す。
Newcomer OpenAI Whisperは、主要な商用クラウドサービスよりもはるかに優れている。
転写はまだ完璧ではないが、最高のモデルは文の60.3%を正しく認識し、小さな文法的な違いを抑える。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:27:37 GMT)
mDAE : modified Denoising AutoEncoder for missing data imputation [0.0] 本稿では,DAE(Denoising AutoEncoder)をベースとした手法を提案する。
Ablation study showed the benefit of using this modified loss function and a Overcomplete structure, terms of Root Mean Squared Error (RMSE) of reconstruction。
平均距離ベスト(Mean Distance to Best、MDB)と呼ばれる基準が提案され、すべてのデータセットでメソッドがグローバルにどのように機能するかを測定する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:31:53 GMT)
X-ray Phase Measurements by Time-Energy Correlated Photon Pairs [0.0] 各種ノイズに対する免疫性を高めた新しいX線干渉法による位相測定法について述べる。
2つの薄いラメラを持つモノリシックシリコン完全結晶デバイスを用いて、自発的なパラメトリックダウンコンバージョンにより相関光子対を生成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:14:56 GMT)
Whisper Finetuning on Nepali Language [0.0] 本研究は,ネパール語の転写精度を向上させるために,OpenAIのWhisperモデルを微調整し,包括的で一般化したデータセットを作成することに焦点を当てる。
ASRデータセットと自己記録されたカスタムデータセットを多種多様なアクセント、方言、話し方で活用し、拡張によってさらに充実させます。
我々のアプローチは、FleurのデータセットでトレーニングされたWhisperのベースラインモデルよりも優れており、中規模モデルでは36.2%、中型モデルでは23.8%のWER削減を実現している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:55:56 GMT)
Variation between Credible and Non-Credible News Across Topics [0.0] 本稿では,フェイクニュースの言語的,スタイリスティックな分析を行う。
様々なニューストピックのバリエーションに焦点を当てている。
その結果、言語的特徴は、各ドメインの信条と偽ニュースの間で異なることが強調された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:29:30 GMT)
Tree Species Classification using Machine Learning and 3D Tomographic SAR -- a case study in Northern Europe [0.0] 樹木種の分類は、自然保護、森林在庫、森林管理、絶滅危惧種の保護において重要な役割を担っている。
本研究では,SLC(Single-look Complex)画像のスタックを利用した3次元トモグラフィーデータセットであるTtomoSenseを用いた。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:25:26 GMT)
Transforming Triple-Entry Accounting with Machine Learning: A Path to Enhanced Transparency Through Analytics [0.0] Triple Entry(TE)会計は、ブロックチェーンのような複雑な金融およびサプライチェーントランザクションの透明性向上に役立つ。
機械学習(ML)は、TE会計の透明性の優位性を高めるための、有望な道を提供する。
TEブックキーピングに必要なデータ収集と分析の自動化によって、ML技術は、これをより透過的にする可能性がある。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:58:44 GMT)
Towards Fairness in AI for Melanoma Detection: Systemic Review and Recommendations [0.0] 本研究は,2013年から2024年にかけて発行されたAIによるメラノーマ検出研究の体系的レビューと予備的分析を行う。
以上の結果から,AIはメラノーマの検出を増強するが,皮膚の色調の軽さには有意な偏りがあることが示唆された。
この研究は、すべての患者に公平で効果的なAIモデルを開発するために、多様なデータセットと堅牢な評価指標の必要性を強調している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:31:38 GMT)
Timescales of quantum and classical chaotic spin models evolving toward equilibrium [0.0] 一次元スピンモデルにおけるクエンチダイナミクスについて検討し、量子的記述と古典的記述を比較した。
半解析解析によって支持された数値シミュレーションにより, システムサイズによらず, 単一粒子エネルギー(球状量)とオンサイト磁化(局所観測可能)の緩和が時間スケールで起こることが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:10:50 GMT)
Thermodynamic limitations on fault-tolerant quantum computing [0.0] 冷凍機に弱結合した量子ビット配列の発熱と散逸を特徴付けるモデルを提案する。
現在の実験パラメータは、システムを境界エラーフェーズに配置する。
この熱力学的制約は, 現在のハードウェア能力がシステムスケールとして維持されている場合, スケーラブルなフォールトトレランスを制限すべきではない。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:00:05 GMT)
Thermalization of a Closed Sachdev-Ye-Kitaev System in the Thermodynamic Limit [0.0] 閉結合Majorana SYK系の力学を解析する。
最終定常状態はグリーンの機能とエネルギーに関して熱平衡に達する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:18:02 GMT)
The time-dependent quantum harmonic oscillator: a pedagogical approach via the Lewis-Riesenfeld dynamical invariant method [0.0] 時間依存型量子調和振動子(TDHO)は、いくつかの問題をモデル化するのに重要である。
本稿では,ルイス=リースフェルト力学不変法を用いて時間依存周波数のTDHOについて考察する。
量子力学コースにおけるTDHOsとLewis-Riesenfeld法の適用例として、以下の問題を解く。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:19:32 GMT)
The Moral Mind(s) of Large Language Models [0.0] 我々は、多くの構造化された倫理的シナリオを持つ主要なプロバイダと40の異なるモデルを提示します。
私たちの合理性テストでは、各プロバイダから少なくとも1つのモデルが、安定した道徳原理と整合した振る舞いを示しました。
我々はこれらの実用機能を同定し、中立的倫理的スタンスに関するモデルの顕著なクラスタリングを観察した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:40:16 GMT)
The Hermeneutic Turn of AI: Is the Machine Capable of Interpreting? [0.0] 本稿では、ディープラーニング(人工ニューラルネットワーク)によってコンピューティングのアプローチが破壊されていることを実証することを目的としている。
また、この運動と平行な点を強調し、人間のようなAIの考え方を軽視するために、ハーメニューティクスの哲学的伝統を論じている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:59:16 GMT)
Testing classical properties from quantum data [0.0] 古典的テスタをサンプルに制限する場合のスピードアップは,量子データを使用するテスタによって回復可能であることを示す。
単調性テストでは、古典的に必要とされる2Omega(sqrtn)$サンプルと比較して、$tildemathcalO(n2)$関数状態コピーを使用する量子アルゴリズムを提供する。
Omega(n1/4)$ および $Omega(n)$ の古典的下限と比較し,対称性と三角形自由度に関する $mathcalO(1)$-copy テスタも提示する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:52:55 GMT)
Testing Continuous Spontaneous Localization model with charged macro-molecules [0.0] 量子実験は、ついにそのようなモデルをテストできる範囲に到達した。
線形ポールトラップに閉じ込められた2イオンをベースとした手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:42:00 GMT)
Tensor-Based Foundations of Ordinary Least Squares and Neural Network Regression Models [0.0] 本稿では,通常の最小二乗モデルとニューラルネットワーク回帰モデルの数学的発展に対する新しいアプローチを紹介する。
解析と基本的な行列計算を活用することにより、両方のモデルの理論的基礎は慎重に詳細化され、完全なアルゴリズム形式に拡張される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:36:04 GMT)
Survey on Emotion Recognition through Posture Detection and the possibility of its application in Virtual Reality [0.0] 様々な技術を用いた感情認識におけるポーズ推定手法と、リアルタイムの深度カメラ、ベクトル空間に記述された画像、ビデオ、三次元ポーズを含むVRおよびインプットの潜在的な利用に焦点を当てた調査を行った。
本研究では,その方法論,分類アルゴリズム,および感情認識とポーズ推定に関連する使用済みデータセットに着目し,選択した雑誌やデータベースから収集した19の研究論文について考察した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:42:21 GMT)
Stylecodes: Encoding Stylistic Information For Image Generation [0.0] StyleCodesはオープンソースでオープンソースの検索スタイルのエンコーダアーキテクチャであり、イメージスタイルを20シンボルのbase64コードとして表現するためのトレーニング手順である。
実験の結果,従来のイメージ・ツー・スタイルの手法と比較して,符号化によって品質が低下する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:04:31 GMT)
Strengthening Fake News Detection: Leveraging SVM and Sophisticated Text Vectorization Techniques. Defying BERT? [0.0] 本研究では,機械学習と自然言語処理,具体的にはSVM(Support Vector Machines)とBERTを用いて,偽ニュースを検出する。
実ニュースと偽ニュースを区別する上での有効性を評価するために, TF-IDF(Term Frequency Inverse Document Frequency), Word2Vec(Word2Vec), Bag of Words(BoW)の3つの異なるテキストベクトル化手法を用いる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:15:46 GMT)
Signformer is all you need: Towards Edge AI for Sign Language [0.0] 我々は手話の性質解析を行い、アルゴリズム設計を知らせ、畳み込みと注目の新規性を備えたスケーラブルなトランスフォーマーパイプラインを提供する。
我々は2024年現在、最高値に対して467-1807xのパラメトリックな減少を達成し、0.57万パラメータの軽量な構成で、他のほとんどのメソッドに勝っている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:27:53 GMT)
Signaling and Social Learning in Swarms of Robots [0.0] 本稿では,ロボット群における協調性向上におけるコミュニケーションの役割について検討する。
クレジット代入問題に対処する上で,コミュニケーションが果たす役割を強調した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:11:04 GMT)
Separating a particle's mass from its momentum [0.0] 反直感的な結果は、中性子はスピンなしである場所にあると測定され、スピンは中性子なしで別の場所にあると測定された。
この効果の一般化は質量を運動量のない一箇所で測定し、運動量は質量のない別の場所で測定する質量粒子で示される。
この実験の微妙な解釈は非常に議論の余地があり、いくつかの仮定に基づいている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:28:38 GMT)
Separable DeepONet: Breaking the Curse of Dimensionality in Physics-Informed Machine Learning [0.0] ラベル付きデータセットがない場合、PDE残留損失を利用して物理系を学習する。
この手法は、主に次元の呪いによる重要な計算課題に直面するが、計算コストは、より詳細な離散化とともに指数関数的に増加する。
本稿では,これらの課題に対処し,高次元PDEのスケーラビリティを向上させるために,分離可能なDeepONetフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:30:14 GMT)
Semi-Automatic Extraction of Formal Models from Object Oriented Code [0.0] オブジェクト指向コードをプロセスに変換するためのフレームワークを提供する。最小限のユーザ入力と組み合わせると、モデルが自動生成され、構成される。
我々は、このフレームワークの実装を提供する新しいSSTraGen(StateSpace Transformation & Generation)ツールを紹介します。
Philips Image Guided Therapy Systems のケーススタディを通じて,本ツールの実用性と有用性について紹介する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:14:40 GMT)
Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0] まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。
その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:01:56 GMT)
Scientific Machine Learning Based Reduced-Order Models for Plasma Turbulence Simulations [0.0] 本稿では, プラズマ乱流シミュレーションのための非侵襲的科学機械学習 (SciML) 還元次数モデル (ROM) について検討する。
我々は,演算子推論(OpInf)に着目し,そのようなシミュレーションデータから低コストな物理ベースのROMを構築する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:16:03 GMT)
Scaling laws for nonlinear dynamical models of speech [0.0] 非線形タスクの動的モデルのパラメータ化のための簡単な数値計算法を提案する。
音声生成を支える非線形なジェスチャー力学の解釈的シミュレーションをいかに促進するかを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:38:01 GMT)
Runge-Lenz operator in the momentum space [0.0] 積分フォック方程式の代わりに運動量空間でSO(4)シミュレートを持つ微分方程式が得られた。
ルンゲ=レンツ作用素は座標空間の作用素よりも単純である。
新しい作用素と3次元フォック球面の無限小回転作用素の関係が決定された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:32:54 GMT)
Room-temperature ladder-type optical memory compatible with single photons from InGaAs quantum dots [0.0] 我々はCs D1線で動作する室温ラダー型原子蒸気メモリを実験的に実現した。
メモリは、$eta_textint=15(1)%$の最大内部記憶効率を達成する。
これらの結果は、不均一なオンデマンド量子光インタフェースを開発するための明確な可能性を与える。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:52:50 GMT)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:00:13 GMT)
Reinforcement Learning, Collusion, and the Folk Theorem [0.0] 学習エージェントから生まれる行動は、幅広い学習力学のために戦略的に反復的に相互作用する。
我々は,異なる形式の監視を行うために,リコールが有限である一般的な繰り返しゲームの設定を検討する。
フォーク・セオレムのような結果を得て、これらのダイナミクスによって得られるペイオフベクトルの集合を特徴づける。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:45:55 GMT)
Refl-Spanners: A Purely Regular Approach to Non-Regular Core Spanners [0.0] そこで本研究では,文字列品質の選択を直接正規言語に組み込む,コアスパンナーの代替手法を提案する。
コアスパンナーの断片は、コアスパンナーの完全なクラスよりもわずかに表現力の弱いものの、情報抽出のための文字列平等選択の直感的な応用をカバーしている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 20:12:32 GMT)
Reducing Entanglement With Physically-Inspired Fermion-To-Qubit Mappings [0.0] ab-initio電子構造シミュレーションでは、フェルミオンからクォービットへの写像はフェルミオン問題の初期符号化ステップを表す。
この研究は、絡み合い要求を著しく単純化するマッピングを構築するために、物理的に着想を得た手法を導入する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:43:52 GMT)
Quantum ergodicity and scrambling in quantum annealers [0.0] 量子異方体の完全な力学を記述するユニタリ進化作用素は、典型的には量子カオスである。
我々は、量子アニールのハイゼンベルク力学が、量子情報の揺らぎの目印である広範な演算子拡散につながることを観察する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:34:35 GMT)
Quantum Time Travel Revisited: Noncommutative Möbius Transformations and Time Loops [0.0] グリーンベルガーとソヴィルによって導入された量子時間ループの理論を、時間旅行系がヒルベルト空間の多次元基底を持つ一般的な状況にまで拡張する。
出現する主要な数学的ツールは非可換モフス変換である。
新しい環境では、祖父のパラドックスを分析します。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:00:23 GMT)
Quantum Thermodynamics in Spin Systems: A Review of Cycles and Applications [0.0] 量子熱力学は、新しい技術の基盤として量子材料の適合性を評価する強力な理論ツールである。
本稿では,小型システムの量子熱力学挙動をモデル化するための数学的定式化について述べる。
この手法をハイゼンベルク系スピン系に応用した理論結果について論じる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:51:32 GMT)
Quantum Teleportation with Telecom Photons from Remote Quantum Emitters [0.0] グローバルな量子インターネットの探求は、非常に優れた量子ハードウェアを必要とするスケーラブルなネットワークの実現に基づいている。
ここでは、最も有望なプラットフォームの一つである半導体量子ドットを用いたフルフォトニック量子テレポーテーションを実現する。
2つの分極保存量子周波数変換器を用いて、トリガ源間の周波数ミスマッチを消去する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:42:36 GMT)
Quantum Mini-Apps for Engineering Applications: A Case Study [0.0] 本稿では,ポアソン方程式を解くための変分量子アルゴリズムの実装におけるケーススタディを提案する。
我々は,アルゴリズムを物理ハードウェアにマッピングする際の現実的な課題を強調した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 23:19:43 GMT)
Quantum Field Measurements in the Fewster-Verch Framework [0.0] Fewster-Verchフレームワークは、場の量子論における局所的な操作を定義するための処方として導入された。
FVフレームワークが任意の局所測定を行うことができるかどうかは不明である。
局所スミアフィールドの測定はFVフレームワークに適合することを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:02:32 GMT)
Quantifying imaginarity in terms of pure-state imaginarity [0.0] 複素数は量子系とその動的挙動を記述するのに必要な成分である。
想像力の資源理論は近年構築されており、量子情報理論における複素数に関する体系的な研究を可能にしている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 04:04:00 GMT)
Probability of Presence Versus $ψ(x,t)^* ψ(x, t)$ [0.0] 物理的確率密度を持つ $psi*(x, t) psi(x,t)$ の同定を仮定することは概念的には不満足であり、現実的には過度に制限される。
電子に対しては、$nabla psi* cdot nabla psi$に比例する単純で計算可能な相対論的補正が存在する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:12:56 GMT)
Polarization Entanglement with highly non-degenerate photon pairs enhanced by effective walk-off compensation method [0.0] バルク偏極ニオブ酸リチウム(PPLN)結晶を用いた非縮退光子対の偏光絡みを実証した。
両屈折性結晶ウェッジを用いた有効補償法を導入し,空間的および時間的歩行を同時に除去する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:24:23 GMT)
Planning vs Reasoning: Ablations to Test Capabilities of LoRA layers [0.0] 低ランク適応層は効率的なモデル微調整のための有望なアプローチとして現れている。
本稿では,LoRA層が推論・計画能力の向上に有効かどうかを考察する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:51:49 GMT)
Phase transition from Weyl to knotted semimetal using bi-circular laser [0.0] 双円光は非エルミート三重ワイルの対称性を変調する。
虚帯域間の交換を観察し、二重環と結び目という形で独自のフェルミ曲面を生じる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:27:19 GMT)
Phase transition analogues in laser collisions with a dark-field setup [0.0] 相互作用領域における衝突レーザーパルスの逆プロファイルに対する信号特性の強い依存性を観察する。
シミュレーションデータを用いて臨界点を決定し、遠距離場における信号の主放出方向の2次遷移の臨界指数を抽出する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:26:24 GMT)
Partially Unitary Learning [0.0] ヒルベルト空間の最適写像 $IN$ of $left|psirightrangle$ と $OUT$ of $left|phirightrangle$ が提示される。
この最適化問題の大域的な最大値を求める反復アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:27:27 GMT)
Optimizing Entanglement in Nanomechanical Resonators through Quantum Squeezing and Parametric Amplification [0.0] 本研究では, ナノメカニカル共振器の絡み合いを, 放射圧を補助する圧縮磁場の量子状態伝達により最適化する手法を提案する。
システムは、機械共振器の同時冷却を可能にする、赤みがかったレーザー磁場によって駆動される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:51:55 GMT)
On the fermionic van der Waals and Casimir-Polder interactions [0.0] ファンデルワールスとカシミール・ポルダー相互作用のフェルミオンバージョンを定式化し、それらの性質について研究する。
どちらの場合も、我々が導入する系は、真空のディラック場と結合した2レベル系の局所化原子を含む。
このディラック場はファン・デル・ワールスの場合の電磁場に似た役割を果たす。
この文脈において、ディラック体に対するバッグモデル条件は、カシミール・ポルダー効果における「鏡」の類似として機能する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:01:51 GMT)
Nonlinear skin modes and fixed-points [0.0] 非対称結合と様々な非線形性を持つ一次元強結合格子について検討し,非線形非エルミート皮膚効果について検討した。
非線形スキンモードの特徴として,パワー・エネルギー依存,デジェネリアシー,パワー・エネルギ・不連続などの特徴を同定した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:22:42 GMT)
Nonclassicality in correlations without causal order [0.0] アンチノミズム(Antinomicity)とは、不確定因果関係の存在下での相関関係に対する非古典性の概念である。
本稿では、arXiv:2411.11397で採用されているデバイス非依存の視点を補完する、アンチノミリティに関する因果的視点を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:29:08 GMT)
Nonassociative gauge gravity theories with R-flux star products and Batalin-Vilkovisky quantization in algebraic quantum field theory [0.0] 一般相対性理論、GR、量子重力の非連想的な修正、QGは、弦/M理論で考慮されたR-フラックス変形と星生成物として生じる。
そのような非結合的および非可換な幾何学的および量子的情報理論は、非結合対称および非対称計量と非線形および線型接続構造で有効となる共接ローレンツ束として定義される位相空間上で定式化された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:41:57 GMT)
Neutrino oscillations originate from virtual excitation of Z bosons [0.0] ニュートリノ振動は空間上のZボゾン場の仮想励起に由来する。
ニュートリノが物質中に伝播するとき、その挙動は散乱に起因するコヒーレントフレーバー変換とデコヒーレンス効果の競合によって決定される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:16:19 GMT)
NPGPT: Natural Product-Like Compound Generation with GPT-based Chemical Language Models [0.0] 我々は、天然製品データセットで化学言語モデルを訓練し、天然製品のような化合物を生成した。
その結果, 生成した化合物の分布は天然物と類似していた。
本手法は, 広大な化学領域を探索し, 天然物の薬物発見の時間とコストを削減できる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:08:26 GMT)
Modifying the U-Net's Encoder-Decoder Architecture for Segmentation of Tumors in Breast Ultrasound Images [0.0] U-Netとエンコーダデコーダアーキテクチャに基づくニューラルネットワーク(NN)を提案する。
我々のネットワーク(CResU-Net)は82.88%、77.5%、90.3%、98.4%のDice類似係数を得た。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:18:02 GMT)
Microsegmented Cloud Network Architecture Using Open-Source Tools for a Zero Trust Foundation [0.0] 本稿では,ゼロ信頼原則とマイクロセグメンテーションに基づくマルチクラウドネットワークアーキテクチャを提案する。
提案されている設計には、幅広いアプリケーションとワークロードユースケースをサポートするマルチクラウドネットワークが含まれている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 01:58:40 GMT)
Measuring photon correlation using imperfect detectors [0.0] 我々は、効率・回復性、光子統計、強度が、検出器が光子を数え、相関を測る能力を抑制する相互依存関係を持つことを示す。
また、この効果を$n$そのような検出器を用いて、擬熱光による$nmathrmth$オーダー相関関数を決定する実験で実証する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:41:59 GMT)
Machine Learning Approaches on Crop Pattern Recognition a Comparative Analysis [0.0] 収穫パターンの生成に時系列リモートセンシングデータを用いた。
分類アルゴリズムは、作物のパターンと地図化された農地の分類に使用される。
本稿では,Deep Neural Network(DNN)に基づく分類を提案し,作物パターン認識の性能向上を図る。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:19:20 GMT)
Machine Learning Algorithms to Assess Site Closure Time Frames for Soil and Groundwater Contamination [0.0] この研究は、長期環境モニタリング用に設計されたPythonパッケージであるPyLEnMの機能を拡張する。
我々は,Sr-90やI-129のような汚染物質が規制基準に達するのに必要な時間枠を推定する手法を導入する。
本手法は,Savannah River Site (SRS) F-Areaから得られたデータを用いて検討した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:09:10 GMT)
MAViS: Modular Autonomous Virtualization System for Two-Dimensional Semiconductor Quantum Dot Arrays [0.0] ゲート定義の半導体量子ドットは、スケーラブルな量子プロセッサを構築するための主要な候補である。
密閉ゲートピッチのため、ゲート間の容量的クロストークは化学的ポテンシャルと相互結合の独立なチューニングを妨げる。
我々の研究は、大規模半導体量子ドットシステムの効率的な制御のためのエレガントで実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:58:20 GMT)
Loop Feynman integration on a quantum computer [0.0] 近い将来の量子コンピュータと量子シミュレータにおけるファインマン積分の最初の時間ループを数値的に評価する。
QFIAEは、多次元積分を効率的にフーリエ級数に分解する量子ニューラルネットワーク(QNN)を導入している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:22:09 GMT)
Leveraging Virtual Reality and AI Tutoring for Language Learning: A Case Study of a Virtual Campus Environment with OpenAI GPT Integration with Unity 3D [0.0] We have developed a scenario that have a virtual campus environment using Unity。
この仮想環境内には、OpenAIのGPTモデルを利用したAIチューターがあります。
これは、GPTが言語翻訳を処理できるため、ヒンディー語で言語学習のサポートを提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:26:19 GMT)
Learning the Simplicity of Scattering Amplitudes [0.0] 本研究は,スピノルヘリシティ変数で表される散乱振幅を単純化するタスクへの機械学習の適用について検討する。
エンコーダ・デコーダ変換器アーキテクチャは、少数の項からなる式に対する印象的な単純化機能を実現する。
長文表現は、コントラスト学習を用いて訓練された追加の埋め込みネットワークで実装され、より単純化しやすい部分表現を分離する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:57:07 GMT)
Leadsee-Precip: A Deep Learning Diagnostic Model for Precipitation [0.0] 本稿では,気象循環場から降水を生成するための地球規模の深層学習モデルであるPedsee-Precipを提案する。
このモデルは、降水量予測の課題に取り組むために、情報バランススキームを利用する。
Leadsee-Precipの降水量は観測値とより一致しており、地球規模の数値天気予報モデルと競合する性能を示している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:51:56 GMT)
LX-mixers for QAOA: Optimal mixers restricted to subspaces and the stabilizer formalism [0.0] 与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。
我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:02:45 GMT)
Intrinsic exceptional point -- a challenge in quantum theory [0.0] 未解決の$cal PT-$対称性にもかかわらず、一般的な虚数振動子ハミルトニアン$H(IC)=p2+rm ix3$は、量子力学に必要な全ての仮定を満たさない。
この失敗は、本質的な例外点'' (IEP) が$H(IC)$であり、特に、その境界状態ミミキング固有ベクトルの高エネルギー並列化現象に起因する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:40:30 GMT)
Intertwined Quantum Phase Transitions in Bose and Bose-Fermi Systems [0.0] 有限ボースおよびボース・フェルミ系におけるそのようなシナリオの証拠を議論し提示する。
2種類のQPTは、異なる力学対称性と交差する形状共存の相転移を記述している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:07:13 GMT)
Information Theory of Meaningful Communication [0.0] シャノンの論文では、印刷された英語のエントロピーは固定的な処理として扱われ、1文字あたり約1ビットと推定された。
本研究では,最近開発された大規模言語モデルを用いて,意味ある物語に伝達される情報を節ごとの意味のビットで定量化することができることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:51:23 GMT)
Hybrid Quantum Deep Learning Model for Emotion Detection using raw EEG Signal Analysis [0.0] 本研究は、感情認識のためのハイブリッド量子深層学習技術を提案する。
従来の脳波に基づく感情認識技術はノイズと高次元データ複雑さによって制限される。
このモデルは、リアルタイムアプリケーションと将来の研究におけるマルチクラス分類のために拡張される予定である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:44:04 GMT)
High-precision minmax solution of the two-center Dirac equation [0.0] 有限要素法 (FEM) を用いて, minmax 2-center Dirac 方程式を数値解き, ディラック方程式の高精度解法を提案する。
minmax FEMは、軽い原子核電荷または重い原子核電荷を持つシステムに対して、非常に正確なベンチマーク結果を提供する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:26:43 GMT)
HEARTS: A Holistic Framework for Explainable, Sustainable and Robust Text Stereotype Detection [0.0] HEARTS (Holistic Framework for Explainable, Sustainable, and Robust Text Stereotype Detection)は、モデル性能を高め、炭素フットプリントを最小化し、透過的で解釈可能な説明を提供するフレームワークである。
我々は,LGBTQ+や地域ステレオタイプなど,6つのグループにわたる57,201のラベル付きテキストからなるEMGSD(Expanded Multi-Grain Stereotype dataset)を確立する。
そして、SHAPを用いて微調整された炭素効率のALBERT-V2モデルを解析し、トークンレベルの重要度を生成し、人間の理解との整合性を確保し、SHAPとSHAPを比較して説明可能性の信頼性スコアを算出する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:39:57 GMT)
Guiding Word Equation Solving using Graph Neural Networks (Extended Technical Report) [0.0] 本稿では,単語方程式を解くためのグラフニューラルネットワーク誘導アルゴリズムを提案する。
このアルゴリズムは方程式の各辺の最初の項を反復的に書き直し、木のような探索空間を生み出す。
人工および実世界のベンチマークで実験を行う。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:15:34 GMT)
Grammarization-Based Grasping with Deep Multi-Autoencoder Latent Space Exploration by Reinforcement Learning Agent [0.0] 本稿では,高次元の目標とグリップの特徴を圧縮するアイデアに基づく,ロボットグルーピングのための新しいフレームワークを提案する。
提案手法は,対象とグリップに専用の3つのオートエンコーダと,その潜在表現を融合させる第3のオートエンコーダを用いて,把握を簡略化する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:03:58 GMT)
Geometrical Aspects Of Resources Distribution In Quantum Random Circuits [0.0] マルチパーティの非局所性に焦点をあてるが、異なる絡み合いや非古典性対策に訴えて量子相関も分析する。
我々は、普遍的なゲートと非普遍的なゲートの集合を比較して、量子的優位性を説明する問題の洞察を得る。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:19:55 GMT)
GNNAS-Dock: Budget Aware Algorithm Selection with Graph Neural Networks for Molecular Docking [0.0] 本稿では,新しいグラフネットワーク(GNN)を用いた分子ドッキングのための自動アルゴリズム選択システムであるGNNASDockを紹介する。
GNNは、状況とタンパク質の両方の複雑な構造データを処理できる。
これらは、異なる条件下での様々なドッキングアルゴリズムの性能を予測するために、固有のグラフのような特性の恩恵を受ける。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:01:54 GMT)
Fundamental limit to cavity linewidth narrowing with single atoms [0.0] EITは、媒体の光学応答を変えることができる量子干渉現象である。
我々は、光学キャビティの直線幅が、その内部に閉じ込められた原子数の異なる原子に対してどのように振る舞うかを調査する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 11:22:04 GMT)
From $SU(2)$ holonomies to holographic duality via tensor networks [0.0] スピンネットワーク状態のテンソルネットワーク表現を構築し、$SU(2)$ゲージ不変離散場理論に対応する。
スピンネットワーク状態は、プランクスケール物理学に対するループ量子重力(LQG)アプローチにおいて中心的な役割を果たす。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 09:50:48 GMT)
First-principle theory of the Casimir screening effect [0.0] イオン揺らぎの寄与は、電磁揺らぎの寄与とは別物であることを示す。
これは、以前は純粋に直感的に使われていた「分離仮説」と一致している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:00:47 GMT)
Fermionic transport through a driven quantum point contact: breakdown of Floquet thermalization beyond a critical driving frequency [0.0] 誘導量子点接触(QPC)により結合された2つのフェルミオン鎖からなる量子系について検討する。
システムの進化を数値的に追跡し、臨界周波数以上の周波数では、QPCを通した電流が停止し、鎖間の粒子の不均衡が永遠に続くことを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:44:02 GMT)
Fair Generalized Linear Mixed Models [0.0] 機械学習の公正性は、データとモデルの不正確さのバイアスが差別的な決定に結びつかないことを保証することを目的としている。
両問題を同時に処理できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:17:57 GMT)
Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languages [0.0] 本稿では,12の大規模言語モデル (LLM) が使用するトークンの包括的評価を行った。
SUTRAトークンライザは、いくつかのIndic特化モデルを含む他のモデルよりも優れており、14言語で優れている。
本研究は,多言語およびインデックス中心モデルを対象としたトークン化戦略の開発において重要であることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:37:17 GMT)
Estimating quantum Markov chains using coherent absorber post-processing and pattern counting estimator [0.0] 量子マルコフ連鎖の一次元動的パラメータを推定する手法を提案する。
我々は、推定器が大きな出力サイズの極限で有界な量子Cram'eRaoを達成するという強い理論的および数値的な証拠を提供する。
これは、連続時間力学における同様の推定戦略の道を開く。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:12:13 GMT)
Estimating Dark Matter Halo Masses in Simulated Galaxy Clusters with Graph Neural Networks [0.0] シミュレーション銀河団の恒星質量から$rmM_rmhalo$を予測するグラフニューラルネットワーク(GNN)モデルを提案する。
ランダムな森林のような従来の機械学習モデルとは異なり、我々のGNNは銀河団の情報豊富なサブ構造を捉えている。
TNG-Clusterデータセットに基づいてトレーニングされ、TNG300シミュレーションで独立にテストされたGNNモデルは、他のベースラインモデルよりも優れた予測性能を達成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 16:40:17 GMT)
Entanglement in flavored scalar scattering [0.0] 高エネルギー2~2$スカラー散乱における量子絡み合いについて検討する。
最終状態密度行列を初期状態と外部状態とを接続する散乱振幅の関数として構築する。
最終状態粒子の運動量と香味度の間の散乱後の絡み合いを考察する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:29:55 GMT)
Enhancing Multi-Class Disease Classification: Neoplasms, Cardiovascular, Nervous System, and Digestive Disorders Using Advanced LLMs [0.0] BioBERTは、医学データに基づいて事前訓練され、医用テキスト分類において優れた性能を示した。
BERTの軽量バージョンに基づくカスタムモデルであるXLNetも87.10%の精度で競合した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:27:25 GMT)
Enhancing Blind Source Separation with Dissociative Principal Component Analysis [0.0] 疎主成分分析(sPCA)は、負荷ベクトル(LV)に間隔制約を課すことにより主成分(PC)の解釈可能性を高める
この制限を克服するために、sPCAの解釈可能性の優位性を保ちながら、ソース抽出能力を著しく向上する洗練されたアプローチを提案する。
このアルゴリズムは2つのアルゴリズムからなる: 解離型PCA (DPCA1 と DPCA2)。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:24:01 GMT)
Enhancement of Microwave to Optical Spin-Based Quantum Transduction via a Magnon Mode [0.0] 磁気材料中のスピンフル不純物に基づいて、単一マイクロ波光子を単一光サイドバンド光子に変換する新しい方法を提案する。
我々は,エルビウムドーパントを用いた通信通信の高速化を実現するために,必要な磁気相互作用と潜在的材料システムを特定した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:31:37 GMT)
Empowering Large Scale Quantum Circuit Development: Effective Simulation of Sycamore Circuits [0.0] この研究は、ランダム回路サンプリング(RCS)回路と同じくらい大きく複雑な回路を、開発者がよく利用できる古典的なシステムに対して、高い忠実さで効果的にシミュレートできることを示した。
この能力により、研究者や開発者は、低エラーレートの量子コンピュータが一般利用可能になる前に大規模な量子回路を構築し、デバッグし、実行することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 00:13:44 GMT)
Electromagnetic Response of the Electron Gas and the Thermal Casimir Pressure Anomaly [0.0] 2つの厚い導電板間の古典的なカシミール相互作用を再解析する。
縦方向と横方向の誘電率(または偏光テンソル)の違いは、電子ガスのランダウ(軌道)双磁性をもたらす。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:38:45 GMT)
Efficient Medicinal Image Transmission and Resolution Enhancement via GAN [0.0] 本稿では,ネットワーク伝送の最適化により画像の品質を向上する効率的な手法を提案する。
Real-ESRGANによるX線画像の低解像度ファイルへの前処理は、サーバの負荷と送信帯域幅の削減に役立つ。
低解像度画像はReal-ESRGANを用いて受信端でアップスケールされる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:39:42 GMT)
Deep Learning-Driven Heat Map Analysis for Evaluating thickness of Wounded Skin Layers [0.0] 本稿では,皮膚層を分類し,熱マップ解析による創傷深度測定を支援する,深層学習の非侵襲的手法を提案する。
皮膚の約200枚のラベル付き画像は、傷、傷、健康な皮膚など5つの分類を区別することができる。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:31:36 GMT)
Deep Learning-Based Classification of Hyperkinetic Movement Disorders in Children [0.0] 小児の高速度運動障害 (HMD) は, 重なり合う臨床的特徴により, 重要な診断上の課題となる。
本研究では,運動課題を遂行する小児患者の映像記録からジストニアと胆管を区別するニューラルネットワークモデルを開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 22:02:04 GMT)
Comparing Prior and Learned Time Representations in Transformer Models of Timeseries [0.0] 時間表現は実験装置の主要な側面であり、目の前のアプリケーションに関係のある時間的関係を適切に表現する必要がある。
実験では, 太陽パネルのエネルギー出力の予測から得られたデータを用いて, 固定時間表現において, 直進的に符号化される既知の周期性を示す。
以上の結果から,この現象を十分に理解した実験でも,副作用による事前知識の符号化は困難であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:56:43 GMT)
Classical and quantum chaos of closed strings on a charged confining holographic background [0.0] 閉弦の古典的および量子的カオスを、最近構築された荷電閉じ込めホログラフィック背景上で論じる。
古典的な場合、パワースペクトル、ポアンカー断面積、リャプノフ指数を用いてカオスを解析する。
同様に、スペクトルのレベルSpacingとout-of-time-ordered correlatorの分布を用いて量子カオスを解析する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 14:33:57 GMT)
Classical and Bohmian trajectories in integrable and non integrable systems [0.0] 積分可積分の古典的軌跡と量子的軌跡と非可積分のH'enon Heiles Hamiltonianの比較を行う。
どちらのケースもカオスであることがわかったが、異なるタイミングでカオスが出現する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:54:49 GMT)
Circuit Quantisation from First Principles [0.0] 我々は、BCS基底空間をフルフェルミオンヒルベルト空間の部分空間として導入する。
電子ハミルトニアンをこの部分空間に射影すると、接合、コンデンサ、インダクタの標準ハミルトニアン項が得られることを示す。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 05:21:56 GMT)
CLIP Unreasonable Potential in Single-Shot Face Recognition [0.0] 顔認識は、顔のパターンや特徴を分析して個人を識別し、認証するために設計されたコンピュータビジョンの中核的なタスクである。
従来の顔認識のアプローチは、目、鼻、口などの顔の特徴を捉え、それらをデータベースとマッチングして身元を確認することに重点を置いていた。
最近,OpenAIが開発したCLIP(Contrastive Language Image Pretraining)モデルでは,自然言語処理と視覚タスクをリンクすることで,将来的な進歩が示されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 08:23:52 GMT)
Bringing multilevel quantum master equations into Lindblad form for complete positivity tests: Two approaches [0.0] 任意のマルコフ QME のコサコフスキー行列をリウヴィリアンから計算する。
非コヒーレント光によって駆動される$Lambda$およびV-システムに対して、部分的世俗的ブロッホ・レッドフィールド QME の完全正当性を証明する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 19:03:02 GMT)
Benchmarking and fidelity response theory of high-fidelity Rydberg entangling gates [0.0] 我々は、時間最適化のRydberg CZゲートを実装し、その忠実度をベンチマークする回路を設計し、対称入力状態平均0.9971(5)を達成する。
非自明なパワースペクトル密度を持つレーザノイズから不確かさを効率的に予測するための忠実度応答理論を開発した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 18:42:40 GMT)
AzSLD: Azerbaijani Sign Language Dataset for Fingerspelling, Word, and Sentence Translation with Baseline Software [0.0] データセットは、ビジョンベースのAzSL翻訳プロジェクトのフレームワーク内で作成された。
AzSLDには30,000の動画が含まれており、それぞれに正確な記号ラベルと対応する言語翻訳が注記されている。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 21:15:47 GMT)
Automatic staff reconstruction within SIMSSA proect [0.0] 本稿では,従来の音楽オブジェクト識別システムの出力を後処理する手法について述べる。
デジタルサルジンネスデータベース(英語版)から古代のスコアのスタッフラインの検出、追跡、調査による復元を可能にする。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:09:08 GMT)
Arabic-Nougat: Fine-Tuning Vision Transformers for Arabic OCR and Markdown Extraction [0.0] 我々は、アラビア語の書籍ページを構造化テキストに変換するためのOCRモデルの組であるアラビア・ヌーガを提示する。
MetaのNougatアーキテクチャに基づくアラビア・ヌーガットには、アラビア小ヌーガット、アラビアベースヌーガット、アラビア大ヌーガットの3つの特殊モデルがある。
主な貢献は、効率的なトークン化のために設計されたAranizer-PBE-86kトークンライザと、Flash Attention 2による torch.bfloat16 の精度の使用である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:09:12 GMT)
AI Guided Early Screening of Cervical Cancer [0.0] このプロジェクトでは、医療画像データセットの事前処理、強化、整理に重点を置いている。
データセットには、正常と異常の2つの分類と、追加のノイズ変動がある。
医療異常検出のための正確かつ効果的な機械学習モデルを作成するため、この徹底的なアプローチにより高品質な入力データが保証される。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 17:39:03 GMT)
A semi-supervised learning using over-parameterized regression [0.0] 半教師付き学習(SSL)は機械学習において重要なテーマである。
本稿では,未ラベルサンプルに関する情報をカーネル関数に組み込む手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 07:44:51 GMT)
A quantum algorithm for solving 0-1 Knapsack problems [0.0] 与えられたインスタンスのすべての実現可能なソリューションを重ね合わせに生成するアプローチである"Quantum Tree Generator"を導入する。
新しい実行時計算手法を導入することで、既存のプラットフォームやシミュレータの範囲を超えて、メソッドのランタイムを予測できます。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 10:06:50 GMT)
A mathematical framework for maze solving using quantum walks [0.0] 本稿では、グローバーウォーク(Grover walk)を用いて迷路の最短経路を識別する枠組みについて述べる。
グラバー・ウォークの有限グラフ上の定常状態の解析は、このアプローチが迷路を効果的に解くことができることを示した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 03:10:17 GMT)
A data driven approach to classify descriptors based on their efficiency in translating noisy trajectories into physically-relevant information [0.0] ノイズトラジェクトリから情報を抽出する際の各種記述子の効率を比較検討する。
SOAPやLENSのような先進的な記述子は、信号と雑音の比率が高いため、古典的な記述よりも優れています。
この研究は、分子軌道からの情報抽出におけるノイズの重要な役割を強調している。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 15:39:25 GMT)
A Note on the Relativistic Transformation Properties of Quantum Stochastic Calculus [0.0] 均一に加速された開系に対しては、量子ノイズのフォック表現から単位非等価な非フォック表現へ移動するとき、形式主義は分解されなければならない。
単位的不等式は、究極的には基礎となる量子過程に対する平坦なノイズスペクトル近似の結果である。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 12:40:24 GMT)
A Coherent Theory for Superconductivity through Integration of Bardeen-Cooper-Schrieffer Theory and Density Functional Theory [0.0] 現在、従来の超伝導体と非伝統的な超伝導体の超伝導に関するコヒーレント理論は欠落している。
本稿では,Bardeen-Cooper-Schrieffer(BCS)理論と密度汎関数理論(DFT)に基づく統合理論を提案する。
本研究では,Cu,Ag,Au,Sb,Biの0Kおよび0GPaにおける予測超伝導,YBCO7を含む18個の純元素の従来型超伝導体13と,非従来型超伝導体YBCO7について検証した。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 02:10:02 GMT)
3D Reconstruction by Looking: Instantaneous Blind Spot Detector for Indoor SLAM through Mixed Reality [0.0] LiMRSF(LiDAR-MR-RGB Sensor Fusion)は、ユーザーがMixed-Reality(MR)ヘッドセットを通してその場でクラウドを登録することを可能にする。
システムは、ポイントメッシュをホログラムとして可視化し、シースルーメガネのリアルタイムシーンとシームレスにマッチングする。
ブラインドスポット検出器は、F1スコア75.76%の誤差検出精度を達成する。
論文参考訳(メタデータ) (Tue, 19 Nov 2024 13:55:58 GMT)