Images are Achilles' Heel of Alignment: Exploiting Visual Vulnerabilities for Jailbreaking Multimodal Large Language Models [107.9] マルチモーダル大言語モデル(MLLM)の無害アライメント問題について検討する。
そこで本研究では,テキスト入力における悪意のある意図の有害性を隠蔽し,増幅する,HADESという新しいジェイルブレイク手法を提案する。
実験の結果、HADESは既存のMLLMを効果的にジェイルブレイクし、LLaVA-1.5では90.26%、Gemini Pro Visionでは71.60%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 11:57:55 GMT)
Transferring Annotator- and Instance-dependent Transition Matrix for Learning from Crowds [88.1] 現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。
まず、すべてのアノテータによるノイズパターンの混合をモデル化し、その後、個々のアノテータにこのモデリングを転送する。
実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 11:08:27 GMT)
Interactive Generative AI Agents for Satellite Networks through a Mixture of Experts Transmission [74.1] 本稿では、モデル定式化のための生成人工知能(AI)エージェントを開発し、送信戦略の設計に専門家(MoE)の混合を適用した。
具体的には,大規模言語モデル(LLM)を活用して対話型モデリングパラダイムを構築する。
定式化問題の解法として, MoE-proximal Policy Optimization (PPO) アプローチを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 03:44:54 GMT)
The Curse of Recursion: Training on Generated Data Makes Models Forget [70.0] 大規模言語モデル(LLM)が存続し、オンラインテキストと画像のエコシステム全体に劇的な変化をもたらすだろう。
トレーニングにおけるモデル生成コンテンツの使用は、元のコンテンツ分布の尾部が消える結果のモデルに不可逆的な欠陥を引き起こす。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:20:10 GMT)
FLASK: Fine-grained Language Model Evaluation based on Alignment Skill Sets [69.9] FLASKは、人間に基づく評価とモデルに基づく評価の両方のためのきめ細かい評価プロトコルである。
モデル性能の全体像を得るためには,評価の微粒化が重要であることを実験的に観察する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 04:29:51 GMT)
InstantMesh: Efficient 3D Mesh Generation from a Single Image with Sparse-view Large Reconstruction Models [66.8] InstantMeshは、単一のイメージからインスタント3Dメッシュを生成するためのフィードフォワードフレームワークである。
最新世代の品質とトレーニングのスケーラビリティが特徴だ。
InstantMeshのコード、重み、デモをすべてリリースし、3D生成AIのコミュニティに多大な貢献ができることを意図しています。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:54:24 GMT)
Fusion-Mamba for Cross-modality Object Detection [63.6] 異なるモダリティから情報を融合するクロスモダリティは、オブジェクト検出性能を効果的に向上させる。
We design a Fusion-Mamba block (FMB) to map cross-modal features into a hidden state space for interaction。
提案手法は,m3FD$が5.9%,FLIRデータセットが4.9%,m3FD$が5.9%である。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:28:46 GMT)
REBEL: A Regularization-Based Solution for Reward Overoptimization in Robotic Reinforcement Learning from Human Feedback [61.5] 報酬関数とユーザの意図、価値観、社会的規範の相違は、現実世界で破滅的なものになる可能性がある。
人間の嗜好から報酬関数を学習することで、このミスアライメント作業を軽減するための現在の方法。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:07:19 GMT)
Quantity Matters: Towards Assessing and Mitigating Number Hallucination in Large Vision-Language Models [57.4] 本研究では,画像中の特定の物体の数を誤って識別するモデルを参照しながら,特定の種類の幻覚数幻覚に焦点を当てた。
そこで,本研究では,数幻覚を減らすための一貫性向上を目的としたトレーニング手法を考案し,直接微調整法よりも8%の性能向上を図った。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:45:16 GMT)
Post-Semantic-Thinking: A Robust Strategy to Distill Reasoning Capacity from Large Language Models [55.3] 思考の微調整の連鎖は、特定のタスクに向けたパフォーマンスを改善するために、推論能力を持つ小さな学生モデルを提供することを目的としている。
本稿では,理性前に回答を生成するために,PST(Post-Semantic-Thinking)戦略を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:19:27 GMT)
Language Models for Text Classification: Is In-Context Learning Enough? [54.9] 最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:45:53 GMT)
DeS3: Adaptive Attention-driven Self and Soft Shadow Removal using ViT Similarity [54.8] 本稿では,適応的注意とViT類似性に基づいて,ハード,ソフト,セルフシャドーを除去する手法を提案する。
提案手法はSRD, AISTD, LRSS, USR, UIUCデータセットの最先端手法より優れている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:02:59 GMT)
An Empirical Evaluation of Manually Created Equivalent Mutants [54.0] 手動で作成した突然変異体の10%未満は等価である。
驚くべきことに、我々の発見は、開発者の大部分が同等のミュータントを正確に識別するのに苦労していることを示している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:04:10 GMT)
MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection [53.0] 長距離モデリングと線形効率の優れたマンバモデルが注目されている。
MambaADは、事前訓練されたエンコーダと(Locality-Enhanced State Space)LSSモジュールをマルチスケールで備えたMambaデコーダで構成されている。
提案したLSSモジュールは、並列カスケード(Hybrid State Space) HSSブロックとマルチカーネル畳み込み操作を統合し、長距離情報とローカル情報の両方を効果的にキャプチャする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 09:14:23 GMT)
AM-RADIO: Agglomerative Vision Foundation Model -- Reduce All Domains Into One [47.6] このアプローチをAM-RADIO(Agglomerative Model -- すべてのドメインを1に還元する)と名付けます。
教師モデルより少なくとも7倍高速な新しいアーキテクチャ(E-RADIO)を開発した。
包括的なベンチマークプロセスでは、ImageNet分類、ADE20kセマンティックセグメンテーション、COCOオブジェクト検出、LLaVa-1.5フレームワークなどの下流タスクをカバーしています。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:35:14 GMT)
Tri-modal Confluence with Temporal Dynamics for Scene Graph Generation in Operating Rooms [47.3] 本稿では、TriTemp-ORと呼ばれる時間動的フレームワークとTri-modal(画像、点雲、言語)の結合を提案する。
我々のモデルは2次元フレームと3次元点雲間の時間的相互作用を行い、スケール適応型多視点時間的相互作用(ViewTemp)と幾何時間的点集合(PointTemp)を含む。
提案したTriTemp-ORは,関係認識統合による三モーダル特徴の集約を可能にし,シーングラフを生成するために関係を予測する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:19:16 GMT)
OmniControl: Control Any Joint at Any Time for Human Motion Generation [46.3] テキスト条件付き人体動作生成モデルにフレキシブルな空間制御信号を統合するために,OmniControlという新しい手法を提案する。
本稿では,入力制御信号に厳密に適合した動作を実現するための解析的空間ガイダンスを提案する。
同時に、全ての関節を洗練してよりコヒーレントな動きを生み出すためにリアリズムガイダンスが導入された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 22:23:18 GMT)
Raidar: geneRative AI Detection viA Rewriting [42.5] 大規模な言語モデル(LLM)は、書き直しのタスクを行う場合、AI生成テキストよりも人間の書き起こしテキストを変更する傾向にある。
テキストの書き直しを LLM に促し,出力の編集距離を計算することで,AI 生成コンテンツを検出する手法を提案する。
この結果から,機械自体のレンズを通した機械生成テキストのユニークなインプリントが明らかになった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 22:34:37 GMT)
Adapting LLM Agents with Universal Feedback in Communication [42.4] 我々は,Learning through Communication (LTC)を導入し,大規模言語モデル(LLM)エージェントの訓練を容易にする。
全てのフィードバックを格納するためのユニバーサルバッファと、LCMエージェントがポリシーを探索して更新できるように反復パイプラインを設計する。
4つの多様なデータセットに対するLCCアプローチの有効性を評価した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 03:47:19 GMT)
Making Large Language Models Perform Better in Knowledge Graph Completion [42.2] 大言語モデル(LLM)に基づく知識グラフ補完(KGC)は、LLMによるKGの欠落を予測することを目的としている。
本稿では,LLMに構造情報を組み込む手法について検討する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:30:19 GMT)
Breast Cancer Image Classification Method Based on Deep Transfer Learning [40.4] 深層学習と転写学習を組み合わせた乳癌画像分類モデルを提案する。
実験結果から, アルゴリズムは, 従来のモデルに比べて分類精度が有意に向上し, テストセットの84.0%以上の効率を達成することが示された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:09:47 GMT)
PANet: A Physics-guided Parametric Augmentation Net for Image Dehazing by Hazing [33.4] 合成ヘイズ画像と実世界のヘイズ画像のドメインギャップは、現実的な環境でのデハージング性能を低下させる。
本研究では,光実写とクリーンなトレーニングペアを生成する物理誘導パラメトリック拡張ネットワーク(PANet)を提案する。
実験の結果,PANetは多様なリアルなハジーイメージを増強し,既存のハジーイメージベンチマークを拡張できることが示された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:24:13 GMT)
Mitigating Heterogeneity among Factor Tensors via Lie Group Manifolds for Tensor Decomposition Based Temporal Knowledge Graph Embedding [32.9] 我々は、因子テンソルを統一滑らかなリー群多様体に写像し、因子テンソルの分布をテンソル分解において均一に近似させる新しい方法を提案する。
提案手法は, 余分なパラメータを導入することなく, 既存のテンソル分解に基づくTKGE法に直接統合することができる。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 06:10:46 GMT)
High Probability Bounds for Stochastic Subgradient Schemes with Heavy Tailed Noise [32.3] 重み付き雑音下での過次手法の高確率境界について検討する。
このクリッピング戦略は、多くの古典的平均化スキームに対して、ほぼ最適な時空と有限な地平線の境界に導かれることを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:29:23 GMT)
FaceCat: Enhancing Face Recognition Security with a Unified Generative Model Framework [30.8] 対面防止(FAS)と対向検出(FAD)は、顔認識システムの安全性を確保するための重要な技術であると考えられている。
顔生成モデルを事前学習モデルとして利用し,FASおよびFADの性能向上を図る。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 09:01:26 GMT)
Retro-fallback: retrosynthetic planning in an uncertain world [29.4] 再合成は、よりシンプルで購入可能な分子から望ましい分子を作るために一連の化学反応を計画するタスクである。
本稿では,この不確実性を考慮したレトロ合成の新規な定式化を提案する。
そこで我々は,少なくとも1つの計画が実験室で実行可能である確率を最大化する,レトロフォールバック(retro-fallback)と呼ばれる新しいグリージーアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:50:35 GMT)
Face-voice Association in Multilingual Environments (FAME) Challenge 2024 Evaluation Plan [29.2] フェース・ボイス・アソシエーション・イン・マルチ言語環境(FAME)チャレンジ2024は,多言語シナリオのユニークな条件下でのフェース・ボイス・アソシエーションの探求に焦点を当てている。
本報告では、FAME Challengeの課題、データセット、ベースライン、タスクの詳細について説明する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:51:32 GMT)
In-N-Out: Faithful 3D GAN Inversion with Volumetric Decomposition for Face Editing [28.8] 3D対応のGANは、2D対応の編集機能を保ちながら、ビュー合成のための新しい機能を提供する。
GANインバージョンは、入力画像や動画を再構成する潜時コードを求める重要なステップであり、この潜時コードを操作することで様々な編集タスクを可能にする。
我々は3次元GANの入力からOODオブジェクトを明示的にモデル化することでこの問題に対処する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:46:05 GMT)
Towards Practical Tool Usage for Continually Learning LLMs [28.6] 大規模言語モデルは、言語ベースのタスクを解くために生まれつきのスキルを示す。
しかし、彼らの知識はパラメータの中に直接格納され、時間内には静的のままである。
ツールの使用は、LLMがインターフェイスを通してアクセス可能なシステムに作業をオフロードするのに役立つ。
しかし、それらを使用するLCMは、長期間使用するためには、まだ非定常環境に適応する必要がある。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:45:47 GMT)
Private Multiple Linear Computation: A Flexible Communication-Computation Tradeoff [27.5] 複製ストレージシステム上でのプライベート多重線形計算 (PMLC) の問題点について考察する。
本稿では,通信コストと計算複雑性とのフレキシブルなトレードオフを確立するための新しいPMLC方式を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:07:08 GMT)
DKE-Research at SemEval-2024 Task 2: Incorporating Data Augmentation with Generative Models and Biomedical Knowledge to Enhance Inference Robustness [27.1] 本稿では,生物医学的自然言語推論のためのモデルロバスト性向上のための新しいデータ拡張手法を提案する。
意味摂動とドメイン固有の語彙置換によって合成例を生成することにより,多様性の向上とショートカット学習の削減を図る。
マルチタスク学習とDeBERTaアーキテクチャを組み合わせることで,NLI4CT 2024ベンチマークで大幅な性能向上を実現した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 10:02:47 GMT)
LSROM: Learning Self-Refined Organizing Map for Fast Imbalanced Streaming Data Clustering [26.9] 本研究では、不均衡なストリーミングデータクラスタリング問題に対処するため、LSROM(Learning Self-Refined Organizing Map)と呼ばれる効率的な手法を提案する。
既存の不均衡なデータクラスタリングアプローチと比較して、LSROMは、非常に競争力のあるクラスタリング精度を達成しつつ、より低い時間複雑性の$O(nlog n)$を持つ。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:08:21 GMT)
Enhancing Fault Detection for Large Language Models via Mutation-Based Confidence Smoothing [24.6] 大きな言語モデル(LLM)の欠点を素早く明らかにする方法は重要だが、難しい。
既存の故障検出手法はLLMではうまく動作しない。
そこで本研究では,Mutation-based prediction Confidence Smoothing method for LLMsを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:06:12 GMT)
PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models [23.9] PEFT法,主特異値および特異ベクトル適応(PiSSA)を導入する。
PiSSA は Intrinsic SAID にインスパイアされており、これは事前訓練された過度にパラメータ化されたモデルが低内在次元の空間に存在することを示唆している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:24:10 GMT)
Heuristic Solution to Joint Deployment and Beamforming Design for STAR-RIS Aided Networks [23.5] 本稿ではSTAR-RISの位置と方向を共同で最適化することを強調する。
連成最適化とハイブリッドビームフォーミング設計による総和率問題について考察する。
数値的な結果は、最適な配置設計によって実現可能な実質的な性能向上を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:45:41 GMT)
RSBuilding: Towards General Remote Sensing Image Building Extraction and Change Detection with Foundation Model [22.6] 本稿では、基礎モデルの観点から、RSBuildingと呼ばれる総合的なリモートセンシング画像構築モデルを提案する。
RSBuildingはクロスシーンの一般化とタスク理解を強化するように設計されている。
我々のモデルは最大245,000の画像からなるデータセットでトレーニングされ、複数のビルの抽出と変更検出データセットで検証された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:11:58 GMT)
Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers [22.1] 視覚変換器のための新規な数ショット特徴蒸留手法を提案する。
まず、既存の視覚変換器の断続的な層から、より浅いアーキテクチャ(学生)へと重みをコピーする。
次に、Low-Rank Adaptation (LoRA) の強化版を用いて、数ショットのシナリオで学生に知識を抽出する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:57:38 GMT)
FiP: a Fixed-Point Approach for Causal Generative Modeling [20.9] 因果順序付き変数上の不動点問題を記述するのにDAGを必要としない新しい等価形式法を提案する。
トポロジカル秩序(TO)を考慮し,一意に回復できる3つの重要な症例を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 22:44:11 GMT)
Emerging Platforms Meet Emerging LLMs: A Year-Long Journey of Top-Down Development [20.9] TapMLは、さまざまなプラットフォームへの機械学習システムのデプロイを合理化するために設計された、トップダウンのアプローチとツーリングである。
従来のボトムアップメソッドとは異なり、TapMLはテスト彫刻を通じてユニットテストを自動化し、マイグレーションベースの戦略を採用する。
TapMLは1年間にわたる現実世界の取り組みを通じて開発され、重要な新興モデルやプラットフォームをデプロイすることに成功しました。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 06:09:35 GMT)
Deceptive Patterns of Intelligent and Interactive Writing Assistants [20.4] 大規模言語モデルは、新しいインテリジェントでインタラクティブな書き込みアシスタントの不可欠な部分となっている。
これにより、この新しいタイプの広汎なシステムは、偽造デザインパターンの潜在的なターゲットとなる。
文献からAI記述アシスタントの新たなコンテキストへ、いくつかの偽造パターンを概念的に転送する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:05:10 GMT)
Arena: A Patch-of-Interest ViT Inference Acceleration System for Edge-Assisted Video Analytics [19.9] 視覚変換器(ViT)を用いたエッジ・ツー・エンドビデオ推論高速化システムであるArenaを紹介する。
その結果、アリーナは平均で1.58タイムと1.82タイム、それぞれ54%と34%の帯域しか消費せず、それぞれ高い推論精度で推論速度を最大で1.58タイムと1.82タイムに向上させることができることがわかった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:14:13 GMT)
VMambaMorph: a Multi-Modality Deformable Image Registration Framework based on Visual State Space Model with Cross-Scan Module [19.5] 本稿では,VMambaMorphという画像登録機能を備えたVMambaの探索について紹介する。
新たなハイブリッドVMamba-CNNネットワークは、3D画像登録用に特別に設計されている。
我々は,VMambaMorphを公開ベンチマーク脳MR-CT登録データセットを用いて検証し,その性能を現在の最先端手法と比較した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:27:41 GMT)
Integrating Physiological Data with Large Language Models for Empathic Human-AI Interaction [19.3] 本稿では,Large Language Models (LLMs) における共感の促進を生理的データと組み合わせることで検討する。
本稿では,心理学的状態を認識するための生理学的データを用いたディープラーニングモデルの開発を含む,生理学的コンピューティング手法を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:40:00 GMT)
Adversarial Robustness Limits via Scaling-Law and Human-Alignment Studies [19.1] モデルサイズ,データセットサイズ,合成データ品質が,対戦型トレーニングのための最初のスケーリング法則を開発することにより,ロバスト性にどのように影響するかを分析する。
我々のスケーリング法則は、先行技術における非効率性を明らかにし、現場を前進させるための実用的なフィードバックを提供する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:14:38 GMT)
\textit{sweet} -- An Open Source Modular Platform for Contactless Hand Vascular Biometric Experiments [19.1] スイーツという非接触型血管バイオメトリックスセンサプラットフォームを提案する。
手の血管バイオメトリックス(毛、手のひら、指の静脈)の研究や、手のひらプリントのような表面の特徴の研究に使用できる。
マルチスペクトル近赤外(NIR)、RGBカラー、ステレオビジョン(SV)、測光ステレオ(PS)など、いくつかの取得モードをサポートしている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:17:01 GMT)
ChangeMamba: Remote Sensing Change Detection with Spatio-Temporal State Space Model [18.1] 状態空間モデルに基づくMambaアーキテクチャは、一連の自然言語処理タスクにおいて顕著なパフォーマンスを示している。
本稿では,リモートセンシングCDタスクにおけるMambaアーキテクチャの可能性について検討する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 10:41:40 GMT)
TransformerFAM: Feedback attention is working memory [18.0] 本稿では,フィードバックループを利用した新しいトランスフォーマーアーキテクチャを提案する。
TransformerFAMは追加の重みを必要とせず、事前訓練されたモデルとのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:43:45 GMT)
Penalized Overdamped and Underdamped Langevin Monte Carlo Algorithms for Constrained Sampling [17.8] 目的が目標分布である$pi(x)prop ef(x)$から$x$が制約されたときにサンプリングする制約付きサンプリング問題を考える。
ペナルティ法によって動機付けられた制約付き問題を,制約違反に対するペナルティ関数を導入することにより,非制約サンプリング問題に変換する。
PSGLD と PSGULMC の場合、$tildemathcalO(d/varepsilon18)$ が強凸で滑らかであるとき、$tildemathcalO(d/varepsilon) を得る。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:57:21 GMT)
Miscibility of Binary Bose-Einstein Condensates with $p$-wave Interaction [17.7] 我々は,2成分系BEC混合物の種間相互作用が$p$-waveである場合のミスシブル・イミューシブルな遷移について検討した。
我々の研究は、正の種間相互作用が$p$-wave相互作用の二重効果(不一致性を高めるか、減少させるか)を明らかにする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:09:57 GMT)
Confidence Calibration and Rationalization for LLMs via Multi-Agent Deliberation [17.1] 大規模言語モデル(LLM)の既存のキャリブレーション手法は、「集団知恵」を最大限に活用することなく、個人の信頼度を推定または引き出すことに重点を置いている。
我々は,複数ツール強化LDMエージェントの協調的・表現的能力を活用した,ポストホックトレーニングフリーキャリブレーション戦略であるCollaborativeを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:40:43 GMT)
EE-TTS: Emphatic Expressive TTS with Linguistic Information [16.1] 強調音声と言語情報を用いて表現音声を合成するEmphatic Expressive TTS(EE-TTS)を提案する。
EE-TTSはテキストから適切な強調位置を識別できる強調予測器を含んでいる。
実験の結果、EE-TTSは、表現性と自然性において、MOSの改善0.49と0.67でベースラインを上回った。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:33:07 GMT)
In-Context Learning through the Bayesian Prism [16.1] In-context Learning (ICL) は、大きな言語モデルの驚くべき特徴の1つである。
本稿では,このベイズ的視点がICLの理解にどの程度役立つのかを実証的に検討する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:12:52 GMT)
When Hindsight is Not 20/20: Testing Limits on Reflective Thinking in Large Language Models [15.8] 自己回帰はTrthfulQAのパフォーマンスを高めるが、HotpotQAの結果に悪影響を及ぼす。
自己回帰は、モデルが最初は正しくない可能性が低く、全体的な疑問の難しさが高い場合に最も有益であることが分かる。
そこで本研究では,自己回帰の実施時期を判断するためのガイドラインを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:47:32 GMT)
Generalization Error Bounds for Learning under Censored Feedback [15.4] 学習理論からの一般化誤差は、以前に見つからなかったデータに対してアルゴリズムがどれだけうまく機能するかを統計的に保証する。
このような境界に対する検閲されたフィードバックによるデータ非IIDnessの影響を特徴付ける。
既存の一般化誤差境界がモデルの一般化保証を正しく捕捉できないことを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:17:32 GMT)
RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion [15.2] RF信号の時間・周波数・複素値領域における情報入力を可能にするため,新しい時間周波数拡散理論を導入する。
RF拡散(RF-Diffusion)は、多種多様な高品質かつ時系列のRFデータを生成する汎用的なソリューションである。
また、5Gネットワークにおいて、Wi-Fiセンシングシステムを強化し、チャネル推定を行う上で、RF拡散の汎用性を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 04:56:05 GMT)
A Survey on Multimodal Wearable Sensor-based Human Action Recognition [15.1] WSHAR(Wearable Sensor-based Human Activity Recognition)は、高齢者の日常生活を支援するための有望な補助技術である。
WSHARの最近の調査は、ディープラーニングアプローチのみに焦点を絞ったものや、単一センサーのモダリティに焦点が当てられている。
本研究では,新参者や研究者を対象に,マルチモーダル学習をWSHARドメインに活用するための総合的な調査を行う。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:43:16 GMT)
BERT-like Pre-training for Symbolic Piano Music Classification Tasks [15.0] 本稿では,BERT (Bidirectional Representations from Transformers) を用いたシンボリックピアノ音楽分類のベンチマーク研究について述べる。
BERT手法を用いて2つの12層トランスフォーマーモデルを事前訓練し、4つの下流分類タスクでそれらを微調整する。
評価の結果,BERTアプローチはリカレントニューラルネットワーク(RNN)ベースラインよりも高い分類精度が得られた。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 03:40:35 GMT)
Specialty-Oriented Generalist Medical AI for Chest CT Screening [14.3] 本稿では,肺がん検診および関連する課題に応用したM3FM(Maltimodal-multitask foundation model)を提案する。
M3FMは、最先端のシングルモーダルタスク特化モデルより一貫して優れている。
専門的な汎用的な医療AIモデルとして、M3FMは、他の医療分野における同様のブレークスルーの道を開く。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:55:55 GMT)
A Novel State Space Model with Local Enhancement and State Sharing for Image Fusion [14.3] 状態空間モデルとしてのMambaは自然言語処理の分野で登場している。
これらの課題に感化されて、画像融合タスク用に設計されたMambaネットワークをカスタマイズし、改善する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:09:33 GMT)
ToNER: Type-oriented Named Entity Recognition with Generative Language Model [14.1] 生成モデルに基づく新しいNERフレームワーク、すなわちToNERを提案する。
ToNERでは、文中に最も現れる可能性が最も高いエンティティタイプを特定するために、最初は型マッチングモデルが提案されている。
我々は、生成モデルのエンコーダを微調整するために、複数のバイナリ分類タスクを追加し、入力文の洗練された表現を生成する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:13:37 GMT)
A Unified Combination Framework for Dependent Tests with Applications to Microbiome Association Studies [12.6] 一般的な条件下で依存テストを組み合わせるための新しいメタ分析フレームワークを提案する。
同じデータセットから計算した各種微生物関連試験の合成に利用した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:33:39 GMT)
Understanding Catastrophic Forgetting in Language Models via Implicit Inference [12.1] 微調整データ配信におけるタスクの性能向上は、他のタスクの能力の犠牲となることを実証する。
そこで本研究では,タスクを細調整分布から人工的に遠ざかるコンジュゲート・プロンプティングを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 01:15:31 GMT)
Allowing humans to interactively guide machines where to look does not always improve human-AI team's classification accuracy [11.6] CHM-Corr++はCHM-Corrのインタラクティブなインタフェースであり、CHM-Corrが提供する特徴属性マップを編集することができる。
静的な説明よりも,CUB-200の鳥画像分類において,対話的アプローチがユーザ精度を向上させるという統計的意義は見つからない。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:48:55 GMT)
FuzzLLM: A Novel and Universal Fuzzing Framework for Proactively Discovering Jailbreak Vulnerabilities in Large Language Models [11.5] FuzzLLMは,大規模言語モデル(LLM)におけるジェイルブレイク脆弱性を積極的にテストし,発見するために設計された,自動ファジリングフレームワークである。
テンプレートを使用してプロンプトの構造的整合性をキャプチャし、制約としてJailbreakクラスの重要な特徴を分離します。
異なるベースクラスを強力なコンボ攻撃に統合し、制約や禁止された質問の要素を変更することで、FazLLMは手作業の少ない効率的なテストを可能にする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:39:41 GMT)
Convex SGD: Generalization Without Early Stopping [11.4] まず、反復数$T$とデータセットサイズ$n$が任意の速度でゼロになるときに消滅する一般化誤差について示す。
特に、勾配降下がうまく一般化するためには、強い凸性は必要ない。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:26:06 GMT)
Knowledgeable Agents by Offline Reinforcement Learning from Large Language Model Rollouts [10.9] 本稿では,言語モデルロールアウト(KALM)の知識エージェントを紹介する。
大規模言語モデル(LLM)から、オフラインの強化学習手法によってエージェントが容易に学習できる想像上のロールアウトの形で知識を抽出する。
未確認の目標を持つタスクの実行において46%の成功率を達成し、ベースラインメソッドによって達成された26%の成功率を大幅に上回る。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:19:40 GMT)
Detection of ChatGPT Fake Science with the xFakeSci Learning Algorithm [10.7] 各種疾患, 病態に対する迅速な工学的手法を用いて, 物品の創出方法を示す。
本稿では,ChatGPT生成記事と科学者による出版物を区別できる新しい学習アルゴリズムであるxFakeSciを紹介する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:20:58 GMT)
FedDistill: Global Model Distillation for Local Model De-Biasing in Non-IID Federated Learning [10.6] フェデレートラーニング(FL)は、協調機械学習を可能にする新しいアプローチである。
FLは、クライアント間で均一に分散されていない(非ID)データのために、課題に直面します。
本稿では,グローバルモデルからローカルモデルへの知識伝達を促進するフレームワークであるFedDistillを紹介する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 10:23:30 GMT)
Self-Selected Attention Span for Accelerating Large Language Model Inference [10.3] 大規模言語モデル(LLM)は困難なタスクを解くことができる。
LLMの推論計算は、新しいトークンを生成する際に出席しなければならないトークンの数が増えるため、非常に非効率である。
LLMの問題解決能力を利用して、推論時間の効率を最適化する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:36:04 GMT)
Improved Optimization for the Neural-network Quantum States and Tests on the Chromium Dimer [10.1] ニューラルネットワーク量子状態(NQS)は、かなり高度な波動関数アンザッツ研究を持っている。
この研究は、NQSを用いたVMC最適化の計算要求を減らすために、3つのアルゴリズム拡張を導入する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:07:57 GMT)
Towards Optimizing Human-Centric Objectives in AI-Assisted Decision-Making With Offline Reinforcement Learning [10.1] 人間のAI意思決定をモデル化するための一般的なアプローチとしてのオフライン強化学習(RL)。
精度に最適化されたポリシーと対話する人は、他の種類のAIサポートと対話する人々よりもはるかに精度が高いことを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:17:57 GMT)
High-quality Image Dehazing with Diffusion Model [10.0] DehazeDDPM - DDPMをベースとした物理認識型画像デハージングフレームワークを提案する。
提案手法は,合成および実世界のハジーデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:43:56 GMT)
Engaging Young Learners with Testing Using the Code Critters Mutation Game [9.9] Code Crittersは、テストの概念を積極的に教えるための真剣なゲームです。
一般的なタワーディフェンスゲームでは、プレイヤーは、正しいコードで記述された行動を示す生物と変異している生物とを区別するために必要な魔法のポータルを戦略的に配置する。
40人の子供を巻き込んだ実証的研究は、Code Crittersに積極的に関与していることを示している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:14:17 GMT)
Experimental demonstration of input-output indefiniteness in a single quantum device [9.2] 単一量子デバイスにおける入出力不確定性を目撃するための理論的手法を提案する。
我々は,69の標準偏差を超える統計的に有意な入力出力不確定性を示すフォトニックセットアップを構築して実験的に実証した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:56:46 GMT)
TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models [9.2] TextHawkは文書指向マルチモーダル言語モデル(MLLM)である。
4つの専用コンポーネントを設計することで、効率的な微粒化知覚を探索するように設計されている。
汎用MLLMベンチマークと文書指向MLLMベンチマークの両方で広範な実験を行い、TextHawkが最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 09:48:37 GMT)
VideoSAGE: Video Summarization with Graph Representation Learning [9.2] 本稿では,映像要約のためのグラフベース表現学習フレームワークを提案する。
この方法で構築されたグラフは、ビデオフレーム間の長距離インタラクションをキャプチャすることを目的としている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:49:02 GMT)
Analysis of the Two-Step Heterogeneous Transfer Learning for Laryngeal Blood Vessel Classification: Issue and Improvement [8.8] 本研究は喉頭病変分類のための2段階ヘテロジニアストランスファーラーニング(THTL)のパイオニアである。
中間領域は糖尿病網膜症カラー・ファンドス画像,意味的には非同一であるが血管像である。
本稿では、SWFT(Step-Wise Fine-Tuning)と呼ばれるTHTLの微調整戦略を改良し、ResNetモデルに適用する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:13:01 GMT)
The intelligent prediction and assessment of financial information risk in the cloud computing model [8.4] 本報告では,クラウドコンピューティングと金融情報処理の共通点について考察する。
セキュリティとプライバシの懸念に対処しながら、データ処理の効率性と正確性を向上させるインテリジェントなソリューションの必要性について論じる。
金融業界におけるクラウドコンピューティングに関連する集中リスクを軽減するための政策勧告を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:42:20 GMT)
Cutoff brane vs the Karch-Randall brane: the fluctuating case [8.2] 近年、あるホログラフィックワイル変換 CFT$$ は AdS$_3$/BCFT$ 対応の主な特徴を捉えるために提案されている。
また, ブレーン形状のバランス部分絡み合い (BPE) を算出し, 絡み合い断面積 (EWCS) で変動することがわかった。
これは BPE と EWCS の対応に対する非自明なテストであり、ワイル変換 CFT セットアップに対する非自明な整合性チェックである。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 08:37:19 GMT)
A Simple Strategy for Body Estimation from Partial-View Images [8.1] 仮想試行と製品パーソナライズは、現代オンラインショッピングにおいてますます重要になってきており、正確な身体計測推定の必要性を強調している。
従来の研究では、RGB画像から3次元の身体形状を推定する研究が進んでいるが、画像中の人間の観察スケールは、距離と体次元の2つの未知の要因に依存するため、本質的に不明瞭である。
対象骨格を所望の位置に移動させ, スケールを正規化し, 両変数の関係を解消する, モジュラーで単純な高さ正規化法を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:55:23 GMT)
Explainable Artificial Intelligence for Autonomous Driving: A Comprehensive Overview and Field Guide for Future Research Directions [8.0] この研究は、自律運転のための説明可能な人工知能(XAI)アプローチの開発に光を当てている。
まず、XAIをベースとした自動運転における最先端および新興のアプローチの概要について概説する。
次に、説明可能なエンドツーエンド自動運転に必要な要素をすべて考慮した概念的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:48:21 GMT)
Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection [7.9] 本稿では,共同モーメント検索とハイライト検出のためのタスク駆動型トップダウンフレームワークを提案する。
このフレームワークはタスク固有の共通表現をキャプチャするタスク分離ユニットを導入している。
QVHighlights、TVSum、Charades-STAデータセットに関する総合的な実験と詳細なアブレーション研究は、提案フレームワークの有効性と柔軟性を裏付けるものである。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:06:42 GMT)
Tighter Generalization Bounds on Digital Computers via Discrete Optimal Transport [7.4] ユークリッド空間の入力を持つ機械学習モデルは、サンプルサイズ$N$に関して$c/N1/2$のレートで$0$に収束する。
デジタルコンピュータ上での学習モデルに適した一般化の族を$c_m/N1/ (2vee m)_m=1infty$とする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 23:17:15 GMT)
The Effect of Data Partitioning Strategy on Model Generalizability: A Case Study of Morphological Segmentation [7.0] さまざまな形態体系を持つ10の言語ファミリーにまたがる10の先住民または絶滅危惧言語を含む、19の言語からのデータを使用します。
トレーニングと評価セットの様々な組み合わせと新しいテストデータを用いて大規模な実験を行う。
その結果、新しいテストデータに直面すると、ランダムスプリットからトレーニングされたモデルにより、より高い数値スコアが得られることがわかった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 22:22:58 GMT)
HANet: A Hierarchical Attention Network for Change Detection With Bitemporal Very-High-Resolution Remote Sensing Images [6.9] 本研究では,変化情報の追加を含まないことに基づく,段階的前景バランスサンプリング戦略を提案する。
この戦略は、初期のトレーニングプロセス中に変更したピクセルの特徴を正確に学習するのに役立つ。
また,階層型注意ネットワーク(HANet)を設計し,マルチスケール機能の統合と詳細機能の改良を図る。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 08:01:27 GMT)
Exploring Generative AI for Sim2Real in Driving Data Synthesis [6.8] ドライビングシミュレータは、対応するアノテーションで様々なドライビングシナリオを自動的に生成するソリューションを提供するが、シミュレーションとリアリティ(Sim2Real)ドメインギャップは依然として課題である。
本稿では,現実的なデータセット作成のためのブリッジとして,運転シミュレータからのセマンティックラベルマップを活用するために,3つの異なる生成AI手法を適用した。
実験の結果,手動のアノテートラベルが提供されると,GANベースの手法は高品質な画像を生成するには適しているが,ControlNetは,シミュレータ生成ラベルを使用すると,より少ないアーティファクトとより構造的忠実度を持つ合成データセットを生成することがわかった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 01:23:19 GMT)
An Experimental Comparison Of Multi-view Self-supervised Methods For Music Tagging [6.4] 自己教師付き学習は、大量のラベルのないデータに基づいて、一般化可能な機械学習モデルを事前訓練するための強力な方法として登場した。
本研究では,音楽タギングのための新たな自己指導手法の性能について検討し,比較する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:56:08 GMT)
Affirmative safety: An approach to risk management for high-risk AI [6.1] 高いリスクを持つAIシステムを開発または展開するエンティティは、肯定的な安全性の証拠を示すために必要であるべきだ、と私たちは主張する。
本稿では,モデル開発者が一定のリスクを規制基準値以下に維持する証拠を提示しなければならない,高度なAIのためのリスク管理手法を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:48:55 GMT)
SNN4Agents: A Framework for Developing Energy-Efficient Embodied Spiking Neural Networks for Autonomous Agents [6.1] スパイキングニューラルネットワーク(SNN)は、イベントベースのカメラやデータ変換前処理からのスパイクを使用して、スパース計算を効率的に行う。
本稿では,自律エージェントアプリケーションを対象としたエネルギー効率のよいSNNを設計するための最適化手法からなるSNN4Agentsを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:06:00 GMT)
Can AI Understand Our Universe? Test of Fine-Tuning GPT by Astrophysical Data [6.0] ChatGPTはここ数ヶ月で最も話題になっているコンセプトで、プロフェッショナルと一般大衆の両方を魅了している。
本稿では、銀河、クエーサー、星、ガンマ線バースト(GRBs)、ブラックホール(BHs)の観測から得られた天文学データを用いて、生成前訓練変圧器モデル(GPT)を微調整する。
我々は、LLMが科学的研究において証明された有効性を示す試験として、これを成功とみなしている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:52:19 GMT)
Evaluating Large Language Models as Virtual Annotators for Time-series Physical Sensing Data [5.1] 時系列物理センシングデータをラベル付けするための仮想アノテータとして, 最先端(SOTA) LLM が利用できるかを検討した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 11:24:26 GMT)
Node Classification in Random Trees [4.8] ランダムな木として構造化されたオブジェクトの分類法を提案する。
我々の目的は、ツリーデータ構造がノード属性に関連付けられている設定において、ノードラベル割り当ての分布をモデル化することである。
本研究では,Stanford Sentiment Treebank データセットのノード分類タスクについて評価を行った。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 11:28:37 GMT)
Monte Carlo Search Algorithms Discovering Monte Carlo Tree Search Exploration Terms [4.6] 最適化されたモンテカルロ木探索アルゴリズムはPUCTとSHUSSである。
32評価の小さな探索予算に対して、発見されたルート探索条件は両方のアルゴリズムを競合させる。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:06:20 GMT)
ML-based handover prediction over a real O-RAN deployment using RAN Intelligent controller [4.5] 我々は、ハンドオーバイベントの予測可能性を調べるために、オープンで再構成可能なネットワークのためのユースケースを開発する。
ハンドオーバイベントの予測に標準無線アクセスネットワーク計測を用いる長短短期記憶機械学習手法を提案する。
その結果,必要なリソースと利用可能なリソースをMLでマッチングすることで,運用コストを80%以上削減できることがわかった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:48:05 GMT)
Model Failure or Data Corruption? Exploring Inconsistencies in Building Energy Ratings with Self-Supervised Contrastive Learning [4.2] ビルエネルギーレーティング(ビルエネルギーレーティング、BER)は、ビル所有者、政策立案者、都市計画者がエネルギー効率を改善することで省エネの可能性を理解するための重要な指標である。
しかし、BERアセスメントプロセスは、欠落と不正確な測定に対して脆弱である。
我々は,データ駆動型アプローチであるttCLEARを導入し,自己教師付きコントラスト学習を通じてBER評価の不整合を精査する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:07:11 GMT)
Evidence from counterfactual tasks supports emergent analogical reasoning in large language models [3.9] 大規模な言語モデルでは、ゼロショット方式で幅広いテキストベースの類似問題を解くことができるという証拠を報告する。
最近の2つの注釈は、アルファベットの標準配列が任意に置換されるいわゆる反事実的タスクの証拠を引用して、これらの結果に異議を唱えている。
ここでは、これらの批判に回答し、本研究で使用した試験材料に関する誤解を明らかにし、言語モデルがこれらの新しい対実的タスク変種に一般化できることを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:51:02 GMT)
Foundational GPT Model for MEG [3.5] 本研究では,脳信号の予測を用いて学習可能な2種類のディープラーニング基礎モデルを提案する。
まず、改良されたWavenetを検討し、次に、改良されたTransformer-based (GPT2)モデルを検討する。
我々は,これらのディープラーニングモデルの性能を,MEGデータに基づく標準的な線形自己回帰(AR)モデルと比較する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:48:24 GMT)
LuminLab: An AI-Powered Building Retrofit and Energy Modelling Platform [3.3] 本稿では,LuminLabプラットフォームの技術的および概念的開発について述べる。
このプラットフォームは、個々の予算に合わせて調整された様々な再適合経路をオンデマンドで構築する機能を提供する。
このようなAIを活用したツールは、現実的にサイロ知識を非現実的に排除し、コミュニケーションを改善し、個々の住宅所有者に、他の方法では起こらないインクリメンタルな再適合プロジェクトを実行する権限を与える可能性があると感じています。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:47:00 GMT)
Qandle: Accelerating State Vector Simulation Using Gate-Matrix Caching and Circuit Splitting [3.3] 量子回路の状態ベクトルシミュレーションに伴う計算複雑性に対処する。
量子ゲート行列キャッシングは、Kronecker製品の繰り返し適用のオーバーヘッドを低減する。
回路分割は、依存グラフを構築することにより、回路をより少ないゲートでサブ回路に分割する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 10:52:01 GMT)
Extending Mean-Field Variational Inference via Entropic Regularization: Theory and Computation [2.3] 変分推論 (VI) は高次元ベイズモデルに対する近似推論の一般的な方法として登場した。
エントロピー正則化を通したナイーブ平均場を拡張する新しいVI法を提案する。
我々は,$Xi$-variational rearsが真の後縁依存性を効果的に回復することを示した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 01:40:11 GMT)
Reap the Wild Wind: Detecting Media Storms in Large-Scale News Corpora [2.2] 本稿では,大規模ニュース記事のコーパスにおいて,メディア・ストームを識別する反復的ヒューマン・イン・ザ・ループ手法を提案する。
本手法の適用性は,まず,特定の時間枠内にメディアストームの最初のリストを補足すること,および新しい時間帯におけるメディアストームを検出することの2つのシナリオで実証する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 16:47:38 GMT)
TEXT2TASTE: A Versatile Egocentric Vision System for Intelligent Reading Assistance Using Large Language Model [2.2] 組込みRGBカメラとLarge Language Model(LLM)を用いたスマートグラスを用いたインテリジェントリーディングアシスタントを提案する。
眼鏡をかけている人の自我中心から見た映像を処理し、オブジェクト検出と光学文字認識方法を用いてテキスト情報をローカライズする。
LLMはデータを処理し、ユーザはテキストと対話し、所定のクエリに応答し、修正レンズの機能を拡張する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:39:02 GMT)
Long-term Human Participation Assessment In Collaborative Learning Environments Using Dynamic Scene Analysis [2.1] 本研究では,実生活における協調学習環境における学生の参加を評価するためのデータセットと手法を開発する。
本研究では,学生集団が他グループからの強い背景干渉を検知し,グループ内の動的参加者追跡を行うという2つのサブプロブレムに学生の参加を評価することの問題点を定式化する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:39:00 GMT)
SyntStereo2Real: Edge-Aware GAN for Remote Sensing Image-to-Image Translation while Maintaining Stereo Constraint [1.9] 現在の手法では、2つのネットワーク、未ペア画像間翻訳ネットワークとステレオマッチングネットワークを組み合わせている。
両タスクを同時に処理するエッジ対応のGANネットワークを提案する。
我々は,既存のモデルよりも定性的かつ定量的に優れた結果が得られ,その適用性は多様な領域にまで及んでいることを実証した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:58:52 GMT)
Understanding the Role of Temperature in Diverse Question Generation by GPT-4 [1.8] 高い温度値を使用することで、異なる温度が生成した質問の集合間の異なる種類の類似性を露呈し、多様性が著しく向上することがわかった。
また,ブルーム分類の下位レベルを対象とする質問に対して,多様な質問生成が特に困難であることを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:38:50 GMT)
Make Split, not Hijack: Preventing Feature-Space Hijacking Attacks in Split Learning [1.7] クライアントデータのプライバシを確保するために,Split Learning(SL)とFunction Secret Sharing(FSS)を組み合わせたハイブリッドアプローチを導入する。
我々のプロトコルは有望な結果をもたらし、SLを使わずに通信オーバヘッドを2倍以上削減し、FSSと同じモデルと比較して訓練時間を7倍以上削減する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:14:31 GMT)
SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation [1.6] テキストと画像の拡散モデルは、しばしば遅い反復的なサンプリングプロセスに悩まされる。
我々は$textbfSwiftBrush$という新しいイメージフリー蒸留方式を提案する。
SwiftBrushは、COCO-30Kベンチマークで、$textbf16.67$のFIDスコアと$textbf0.29$のCLIPスコアを達成している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:39:27 GMT)
Causal Inference for Genomic Data with Multiple Heterogeneous Outcomes [1.6] 複数の導出結果を持つ2つのロバストな推定のための一般的な半パラメトリックフレームワークを提案する。
分析を標準化された平均処理効果と定量処理効果に専門化する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:07:14 GMT)
In My Perspective, In My Hands: Accurate Egocentric 2D Hand Pose and Action Recognition [1.5] アクション認識は、エゴセントリックなビデオ理解に不可欠であり、ユーザの努力なしに日々の生活活動(ADL)の自動的かつ継続的なモニタリングを可能にする。
既存の文献では、計算集約的な深度推定ネットワークを必要とする3Dハンドポーズ入力や、不快な深度センサーを装着することに焦点を当てている。
EffHandEgoNetとEffHandEgoNetの2つの新しい手法を導入する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:33:33 GMT)
Advanced Intelligent Optimization Algorithms for Multi-Objective Optimal Power Flow in Future Power Systems: A Review [1.5] 多目的最適潮流(MOPF)へのインテリジェント最適化アルゴリズムの適用について
再生可能エネルギーの統合、スマートグリッド、エネルギー需要の増加による課題を掘り下げている。
アルゴリズムの選択は、現在ある特定のMOPF問題に近づき、ハイブリッドアプローチは大きな可能性を秘めている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 09:44:08 GMT)
Momentum-based gradient descent methods for Lie groups [1.4] Polyak's Heavy Ball (PHB)、別名Classical Momentum、Nesterov's Accelerated Gradientは、最適化のための運動量差法のよく知られた例である。
本稿では、古典的運動量法と加速的運動量法との変分1対1対応に基づくリー群最適化のためのNAGライクな手法の一般化を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:30:00 GMT)
Multi-role Consensus through LLMs Discussions for Vulnerability Detection [0.7] 本稿では,実生活のコードレビュープロセスをシミュレートする異なる役割として,LLMを用いたマルチロールアプローチを提案する。
このアプローチの予備評価は、精度が13.48%、リコールレートが18.25%、F1スコアが16.13%上昇していることを示している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 08:02:31 GMT)
Towards Understanding Variants of Invariant Risk Minimization through the Lens of Calibration [0.7] 実世界のアプリケーションでは、テスト分布はトレーニングとは異なることが多い。
不変リスク最小化(Invariant Risk Minimization)は、異なる環境間で不変な特徴を特定し、アウト・オブ・ディストリビューションを強化することを目的としている。
本研究では,これらの近似IRM手法について検討し,予測誤差(ECE)を指標として検討した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 08:18:58 GMT)
LLeMpower: Understanding Disparities in the Control and Access of Large Language Models [0.7] 大きな言語モデル(LLM)は新しい機会を生み出すために人間のスキルを増強する強力な技術である。
LLMは、訓練とサービスのために、かなりの計算資源とエネルギーを必要とする。
管理とアクセスの不平等は、少数の企業の所有と権限の集中につながった。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:49:53 GMT)
Exploring Feedback Generation in Automated Skeletal Movement Assessment: A Comprehensive Overview [0.7] 生成可能なフィードバックの種類を説明し、自動フィードバック生成のための既存のソリューションをレビューし、今後の研究方向性について議論する。
我々の知る限り、骨格運動評価におけるフィードバック生成の総合的なレビューはこれが初めてである。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:14:47 GMT)
RoofDiffusion: Constructing Roofs from Severely Corrupted Point Data via Diffusion [0.3] RoofDiffusionは、屋根の高さマップを頑健に完成させる、エンドツーエンドの自己教師付き拡散技術である。
変種であるNo-FP RoofDiffusionは、建物の足跡と高さを同時に予測する。
先進的なCity3DアルゴリズムでテストされたRoofDiffusionは、3Dビルの再構築を著しく改善する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:50:10 GMT)
Quantum Machine Learning with HQC Architectures using non-Classically Simulable Feature Maps [0.3] 本稿では,QSVM(Quantum Support Vector Machines)を応用して,将来,精神的な治療を必要とするかどうかを予測する。
我々は、NISQ HQC Architectures for Quantum Machine Learningが、短期実世界のアプリケーションで優れたパフォーマンスモデルを作成するために、代替として使用できることを証明した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 01:07:38 GMT)
Knowledge Discovery in Surveys using Machine Learning: A Case Study of Women in Entrepreneurship in UAE [0.3] 知識に基づく経済における起業は、国の経済の発展に大きく貢献する。
本稿では,アラブ首長国連邦における起業女性に対する調査について分析する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 01:06:06 GMT)
Counteracting Concept Drift by Learning with Future Malware Predictions [0.2] 新しい悪意のあるファイルはマルウェアの作者によって作成され、検出を避けることを目的としている。
今後のサンプルを予測するための2つの手法の比較を行った。(1)逆トレーニングと(2)生成逆ネットワーク(GAN)である。
GANは将来のマルウェアの予測としてうまく利用することができる。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:28:07 GMT)
Evaluating Fast Adaptability of Neural Networks for Brain-Computer Interface [0.2] 我々は,CNN(Convolutional Neural Networks)に基づく分類器の入力として,運動運動と想像信号を用いる。
実験により,CNNを用いたEEG分類器の適応性は10段階未満で向上することが示された。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 22:36:53 GMT)
Z-AGI Labs at ClimateActivism 2024: Stance and Hate Event Detection on Social Media [0.0] この研究は、ケース2024における気候活動状況とヘイト事象の検出に関する共有タスクの確立につながった。
ソーシャルメディア上でヘイトスピーチと競合する気候活動家に焦点をあてて、我々の研究はツイートからのヘイトスピーチの識別に寄与する。
チームZ-AGI LabsはTLTM、Xgboost、LGBMなど様々なモデルをTf-Idfに基づいて評価した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:43:39 GMT)
TrafficVLM: A Controllable Visual Language Model for Traffic Video Captioning [0.0] 本稿では,車載エゴカメラビューのためのマルチモーダル高密度映像キャプションモデルであるTrafficVLMを提案する。
私たちのソリューションは、AI City Challenge 2024のトラック2で傑出した成果を上げました。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:51:44 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0] 拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。
人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:58:40 GMT)
The TikToking troll and weaponization of conscience: A systems perspective case study [0.0] 良心の武器化は、詐欺師が彼らの活動を偽装し、犠牲者を欺き、彼らのモディオペランディの有効性を拡大するために使う戦術である。
このケーススタディは議論を呼んでいるTikTokerを中心におり、プロパガンダの標的人口内で複数のアクターを操作するために、良心の武器化をどのように活用できるかを強調している。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 21:05:40 GMT)
Text-to-Song: Towards Controllable Music Generation Incorporating Vocals and Accompaniment [0.0] ボーカルと伴奏の両方を組み込んだテキスト・ツー・サング・シンセサイザーという新しいタスクを提案する。
我々は,歌唱音声合成 (SVS) とV2A合成 (V2A) を組み合わせた2段階音声合成法であるメロディストを開発した。
評価結果は,メロディストが同等の品質とスタイルの整合性で楽曲を合成できることを実証した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:00:05 GMT)
Test Code Generation for Telecom Software Systems using Two-Stage Generative Model [0.0] 大規模Telecomソフトウェア企業にとって、すべてのデプロイメントシナリオのためのソフトウェアの開発とテストが課題となっている。
本稿では,大規模テレコムソフトウェアシステムを対象とした自動テスト生成フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 13:25:15 GMT)
Survey on Embedding Models for Knowledge Graph and its Applications [0.0] 知識グラフ(KG)は、ノードが現実世界の実体や抽象的な概念を表現し、エッジが実体間の関係を表現する世界の事実を表現するグラフベースのデータ構造である。
知識グラフ埋め込みは、それらの間の意味的関係をキャプチャすることで、低次元ベクトル空間における実体と関係を表現することによって、欠点に取り組む。
ここでは、意味的特性、スコアリング機能、使用するアーキテクチャに基づいて異なる翻訳ベースとニューラルネットワークベースの埋め込みモデルについて議論する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 07:15:59 GMT)
Subtle Signs of Scribal Intent in the Voynich Manuscript [0.0] 本研究は,「ヴォイニチェーゼ」文字の見過ごされた特徴に隠された,スクレイブ意図の微妙な兆候を探すことによって,ヴォイニッヒ写本を探索する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:54:01 GMT)
Service Weaver: A Promising Direction for Cloud-native Systems? [0.0] GoogleのService Weaverは、クラウドネイティブシステムの実装に関連する複雑さを単純化することを目的としている。
Service Weaverは、クラウドネイティブアプリケーションの開発を合理化する、有望なアプローチを提供する。
別個のコードベース、ルーティング機構、レジリエンス、セキュリティなど、特定の機能がフレームワークに欠けていることを認識しておくことが重要です。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 20:57:32 GMT)
Quantum transport in randomized quantum graphs [0.0] ランダム化量子グラフ(RQG)の伝送係数を計算する。
主な結果は、輸送が一対の頂点間の接続の除去によって重要な影響を受けていることを示している。
また、エッジ除去数があまり小さくなくても、送信が完全に抑制される領域の存在を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 00:20:39 GMT)
Quantum subspace expansion in the presence of hardware noise [0.0] 現在の量子処理ユニット(QPU)の基底状態エネルギーの発見は課題を呈し続けている。
ハードウェアノイズは、パラメタライズド量子回路の表現性とトレーニング性の両方に深刻な影響を及ぼす。
量子サブスペース拡張とVQEを統合する方法を示し、量子コンピューティング能力と古典コンピューティング能力とコストの最適なバランスを可能にする。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 02:48:42 GMT)
Optimal Control of a Markovian Qubit with Unitary Control [0.0] 我々はリンドブラッドマスター方程式によって支配される1つのマルコフ量子ビットを高速なユニタリ制御の対象として研究する。
i) ブロッホ球における安定化状態のセットと同様に, (ii) 時間最適に冷却および加熱を行うための制御を決定した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:02:28 GMT)
On the Reduction of Variance and Overestimation of Deep Q-Learning [0.0] 本稿では,分散度と過大評価量を削減する方法として,深層Q-LearningアルゴリズムにおけるDropout手法を提案する。
また、ベンチマーク環境で実施した実験により、安定性の向上とモデル性能のばらつきと過大評価の両面において、我々の方法論の有効性を実証した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:30:12 GMT)
On the Feasibility of Deep Learning Classification from Raw Signal Data in Radiology, Ultrasonography and Electrophysiology [0.0] 本稿では,ラジオグラフィ,超音波,電気生理学におけるディープラーニングの主な応用について述べる。
提案するニューラルネットワークトレーニングが生信号に直接適用可能かどうかを論じる。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 14:56:26 GMT)
On Strong Bounds for Trotter and Zeno Product Formulas with Bosonic Applications [0.0] バナッハ空間上の強作用素位相において量的境界が証明できる仮定について議論する。
ボース・ハバードモデル、オルンシュタイン・ウレンベック半群、多光子駆動散逸などの自然ボソニックな例を提供する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:01:42 GMT)
New Class of Ciphers Using Hardware Entropy Source [0.0] 物理過程のエントロピーを抽出してランダムビットのストリームを生成する。
メッセージのビットをランダムビットのストリームに配置するプロセスは、その後の挿入の間にスキップされたランダムビットの数によって制御される。
与えられた乱数ビットからランダム鍵を効率的に計算する方法を提案する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:44:50 GMT)
Large Language Models are as persuasive as humans, but why? About the cognitive effort and moral-emotional language of LLM arguments [0.0] 本稿では,Large Language Models (LLMs) の説得戦略について検討する。
実験における1,251人の参加者のデータセットを用いて, LLMと人為的議論の説得戦略を分析した。
研究によると、LLMは高い認知力を必要とする議論を生み出し、人間よりも複雑な文法構造と語彙構造を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 19:01:20 GMT)
Good Books are Complex Matters: Gauging Complexity Profiles Across Diverse Categories of Perceived Literary Quality [0.0] 我々は、文学的「品質」の異なるカテゴリーが独自の言語的プロファイルを示すことを示すために、分類アプローチを採用する。
分析の結果,他の品質カテゴリと比較すると,標準テキストやいわゆるハイブロウテキストは異なるテキスト特徴を示すことが明らかとなった。
品質カテゴリは、他の品質カテゴリよりもコントロールグループと区別しやすい傾向にある。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:30:24 GMT)
From Bytes to Borsch: Fine-Tuning Gemma and Mistral for the Ukrainian Language Representation [0.0] 生成型大規模言語モデル(LLM)は、テキスト理解と生成において非並列的な能力を示すイノベーションの最前線にある。
しかし、ウクライナ語のような低リソース言語の限られた表現は、この技術のリーチと関連性を制限し、顕著な課題となっている。
本稿は, オープンソースのGemmaとMistral LLMをウクライナのデータセットで微調整し, 言語能力の向上を目指す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 04:25:41 GMT)
Fault Detection in Mobile Networks Using Diffusion Models [0.0] 本稿では,生成型AIモデルを用いて通信網の異常を検出するシステムを提案する。
拡散モデルを用いて、異常検出のためのモデルを訓練するいくつかの戦略を評価する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 12:59:35 GMT)
Enhancing teleportation via noisy channels: effects of the induced multipartite entanglement [0.0] 双方向の資源状態に作用するノイズチャネルが検討されている。
分析の結果,資源状態の固定的な絡み合いでは,ノイズの有害な影響に対してテレポーテーションの忠実性をよりよく保護するチャネルは,より高量の(GHZ型)多部絡み合いを発生させるチャネルであることが判明した。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 03:30:14 GMT)
Electron delocalization in aromaticity as a superposition phenomenon [0.0] 芳香族性は、もともと構造対称性、エネルギー安定性、ベンゼンとその誘導体の化学反応性を解明するために開発された基本的な概念である。
生物直交原子軌道で示される真の量子重ね合わせは、代表単環分子の芳香族度秩序を効果的に捉えることを実証する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:43:26 GMT)
Convert any android device into a programmable IoT device with the help of IoT Everywhere Framework [0.0] IoT EverywhereフレームワークとOrigプログラミング言語を使用することで、任意のAndroidスマートフォンをIoTデバイスに変換することが可能になる。
これは、電気工学の学生が単純な関数呼び出しを通じて多くの抽象化を提供するので、プログラミングのアイデアを理解するのに役立つ。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 15:28:35 GMT)
Compass: Large Multilingual Language Model for South-east Asia [0.0] CompassLLMは東南アジアの言語に特化した多言語モデルである。
我々のモデルはインドネシア語のような東南アジアの言語で優れた性能を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 11:48:33 GMT)
Biorthogonal resource theory of genuine quantum superposition [0.0] 密度作用素の擬エルミート表現を導入し、その対角要素はカークウッド・ディラック準確率の直交拡大に対応する。
この表現は、基底間量子重ね合わせと基底状態の不識別性のための統一的な枠組みを提供し、私たちがthitgenuine量子重ね合わせと呼ぶものを生み出します。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:00:44 GMT)
Binary bi-braces and applications to cryptography [0.0] XORベースの交互ブロック暗号では、平文はそれぞれ異なる動作を行う複数の層によって隠蔽される。
本稿では,一組の差分を導出できる特別な括弧群を紹介する。
そのような括弧は nilpotency class 2 の双対代数の交互化の観点から記述できることを示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 18:02:43 GMT)
A data-driven approach to modeling brain activity using differential equations [0.0] この研究は、不完全データから方程式を抽出する革新的なタスクに焦点を合わせ、完全解の伝統的な方法から遠ざかる。
この研究は、特に、不十分な情報によって制限される電気生理学的データを用いた脳活動の研究において、データから方程式を抽出するという課題に対処する。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 17:33:09 GMT)
A convergence result of a continuous model of deep learning via Łojasiewicz--Simon inequality [0.0] これは、ディープニューラルネットワーク(DNN)の連続的なモデルのプロセスを表現する、ワッサースタイン型フローに焦点をあてる。
まず、L2正則化下でのモデルの平均損失に対する存在arを確立する。
フロー最適化時の時間として,損失の傾きの存在を示す。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 05:39:11 GMT)
A computational model for gender asset gap management with a focus on gender disparity in land acquisition and land tenure security [0.0] 土地取得と土地維持のセキュリティは、様々な文化的グループに異なる影響を与える複雑な問題である。
提案手法は,新しい測定枠組みの開発に文化・政策要素を取り入れることで,このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Sun, 14 Apr 2024 06:59:25 GMT)