AICL: Action In-Context Learning for Video Diffusion Model [124.4] 本稿では,参照ビデオにおける行動情報を理解する能力を備えた生成モデルを実現するAICLを提案する。
大規模な実験では、AICLが効果的にアクションをキャプチャし、最先端の世代パフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:02:50 GMT)
LLM-PBE: Assessing Data Privacy in Large Language Models [111.6] 大規模言語モデル(LLM)は多くのドメインに不可欠なものとなり、データ管理、マイニング、分析におけるアプリケーションを大幅に進歩させた。
この問題の批判的な性質にもかかわらず、LLMにおけるデータプライバシのリスクを総合的に評価する文献は存在しない。
本稿では,LLMにおけるデータプライバシリスクの体系的評価を目的としたツールキットであるLLM-PBEを紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:37:29 GMT)
Tuning Language Models by Proxy [110.5] 直接チューニングと同じ目的を達成するために,ブラックボックスLM上で動作する軽量復号時間アルゴリズムであるプロキシチューニングを導入する。
提案手法は, 小型のLMをチューニングし, 小型のLMと未チューニングのLMの予測の差を適用して, より大型の未チューニングモデルの本来の予測をチューニング方向にシフトさせる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:21:44 GMT)
A Heterogeneous Dynamic Convolutional Neural Network for Image Super-resolution [108.0] 画像超解像(HDSRNet)における異種動的畳み込みネットワークを提案する。
下位のネットワークは対称アーキテクチャを使用して、異なるレイヤの関係を強化し、より構造的な情報をマイニングする。
実験結果から,HDSRNetは画像解決に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:18:17 GMT)
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation [105.5] 3D没入型シーン生成はコンピュータビジョンとグラフィックスにおいて難しいが重要な課題である。
LayerPano3Dは、単一のテキストプロンプトからフルビューで探索可能なパノラマ3Dシーンを生成するための新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:50:23 GMT)
Image Segmentation in Foundation Model Era: A Survey [99.2] イメージセグメンテーションにおける現在の研究は、これらの進歩に関連する特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:07:59 GMT)
SpeechPrompt: Prompting Speech Language Models for Speech Processing Tasks [94.1] 我々はまず,音声処理分野における音声 LM の促進の可能性を探る。
音声処理タスクを音声単位生成タスクに再構成する。
提案手法は, 強い微調整法と比較して, 競争性能を向上できることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:00:10 GMT)
UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models [88.2] UniGenは、多様で正確で高度に制御可能なデータセットを作成するように設計された包括的なフレームワークである。
データ多様性を強化するため、UniGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、UniGenによって生成されたデータの優れた品質を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:14:51 GMT)
Grounding Fallacies Misrepresenting Scientific Publications in Evidence [84.3] 誤検出データセットMisciの拡張であるMisciPlusを紹介する。
MissciPlusはMissci上に構築されており、誤表現された研究から現実世界の通路で適用された誤報を根拠にしている。
MissciPlusは、現実世界の誤った証拠と誤った主張を組み合わせた最初の論理的誤認データセットである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:16:26 GMT)
Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.6] 我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:19:06 GMT)
Learning a Decision Tree Algorithm with Transformers [76.0] メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:56:36 GMT)
CathAction: A Benchmark for Endovascular Intervention Understanding [74.6] CathActionはカテーテル化理解のための大規模なデータセットである。
我々のデータセットは、約50,000の注釈付きフレームを含み、カテーテル化アクション理解と衝突検出を行う。
各タスクについて、この分野における最近の関連する研究をベンチマークする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:54:49 GMT)
LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description [73.8] ビジュアル空間記述は、画像内のオブジェクト間の空間的関係を記述するテキストを生成することを目的としている。
LLaVA-VSDは視覚空間関係の分類、記述、オープンな記述のために設計されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:47:59 GMT)
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation [73.8] 本稿では、ビデオ生成のためのEasyControlというユニバーサルフレームワークを提案する。
提案手法により,ユーザーは単一の条件マップで映像生成を制御できる。
その結果,UCF101とMSR-VTTのFVDおよびISが向上した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:48:29 GMT)
Semantic Alignment for Multimodal Large Language Models [72.1] 多モード大言語モデル(SAM)のセマンティックアライメントについて紹介する。
画像間の双方向的意味指導を視覚的・視覚的抽出プロセスに組み込むことにより,コヒーレント解析のためのリンク情報の保存性を高めることを目的とする。
画像間の双方向的意味指導を視覚的・視覚的抽出プロセスに組み込むことにより,コヒーレント解析のためのリンク情報の保存性を高めることを目的とする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:48:46 GMT)
Model Merging by Uncertainty-Based Gradient Matching [70.5] ミスマッチを減らすことで性能を改善するための不確実性に基づく新しいスキームを提案する。
我々の新しい手法は、大きな言語モデルと視覚変換器に一貫した改善をもたらす。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:25:44 GMT)
Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation [64.1] CoSERは、テキストから3Dへの一貫した高密度テキスト・ツー・イメージ・ジェネレータである。
隣人のビューコヒーレンスを巧みに学習することで効率と品質を両立させる。
物理原理によって明確に定義された運動経路に沿って情報を集約し、詳細を洗練させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:16:01 GMT)
Can Large Language Models Automatically Jailbreak GPT-4V? [64.0] 本稿では,迅速な最適化にインスパイアされた革新的な自動ジェイルブレイク技術であるAutoJailbreakを紹介する。
実験の結果,AutoJailbreakは従来の手法をはるかに上回り,95.3%を超えるアタック成功率(ASR)を達成した。
この研究は、GPT-4Vのセキュリティ強化に光を当て、LCMがGPT-4Vの完全性向上に活用される可能性を強調している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:52:10 GMT)
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? [64.0] MME-RealWorldは、これまでで最大の手動アノテーション付きベンチマークであり、最も高解像度で、現実世界のアプリケーションに焦点を当てている。
私たちの結果は、最も先進的なモデルでさえベンチマークに苦戦していることを示しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:59:51 GMT)
GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections [63.8] GarmentAlignerは、検索強化マルチレベル補正で訓練されたテキスト間拡散モデルである。
コンポーネントレベルでのセマンティックアライメントを実現するために,自動コンポーネント抽出パイプラインを導入する。
衣服画像内の成分関係を活用すべく,各衣服の検索サブセットを構築した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:01:35 GMT)
Scaling Virtual World with Delta-Engine [62.5] この仮想世界を駆動する特別なエンジンであるtextemphDelta-Engineを提案する。
デルタエンジンの重要な特徴は、世界中の未知の要素へのスケーラビリティである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:57:24 GMT)
Quality or Quantity? On Data Scale and Diversity in Adapting Large Language Models for Low-Resource Translation [62.2] 本稿では,Large Language Models (LLM) を低リソースの翻訳環境に適用するためにどうすればよいかを検討する。
我々は、事前トレーニングとスーパーバイザードファインチューニング(SFT)の間に並列データが重要であることを示す。
これらの知見は、多言語 LLM-MT モデルへのスケールアップに有用であると考えています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:59:38 GMT)
Semi-Supervised Unconstrained Head Pose Estimation in the Wild [60.1] 本研究では,最初の半教師なしヘッドポーズ推定手法であるSemiUHPEを提案する。
本手法は,野生頭部のアスペクト比不変収穫が,それまでのランドマークベースのアフィンアライメントよりも優れているという観測に基づいている。
実験とアブレーション研究は、SemiUHPEが既存の手法を公開ベンチマークで大きく上回っていることを示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:38:07 GMT)
Instruction-Driven Game Engines on Large Language Models [59.3] IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:06:41 GMT)
Imitation Learning in Discounted Linear MDPs without exploration assumptions [58.8] ILARLと呼ばれる無限水平線形MDPにおける模倣学習のための新しいアルゴリズムを提案する。
所望の精度$epsilon$から$mathcalO(epsilon-5)$から$mathcalO(epsilon-4)$への依存を改善する。
線形関数近似による数値実験により、ILARLは他のよく使われるアルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:56:53 GMT)
Evidential Deep Partial Multi-View Classification With Discount Fusion [58.7] Evidential Deep partial Multi-View Classification (EDP-MVC) と呼ばれる新しいフレームワークを提案する。
欠落したビューに対処するためにK-means命令を使用し、マルチビューデータの完全なセットを作成します。
この暗示されたデータ内の潜在的な衝突や不確実性は、下流の推論の信頼性に影響を与える可能性がある。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:50:49 GMT)
Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.6] 本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:53:36 GMT)
The All-Seeing Project V2: Towards General Relation Comprehension of the Open World [58.4] 本稿では,画像のオブジェクト関係を理解するために設計された新しいモデルとデータセットであるAll-Seeing Project V2を紹介する。
本稿では,テキスト生成,オブジェクトローカライゼーション,関係理解の定式化を関係会話タスクに統合するAll-Seeing Model V2を提案する。
我々のモデルは、画像内の全ての物体を知覚・認識するだけでなく、それらの間の複雑な関係グラフの把握にも優れている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:20:57 GMT)
Performance Law of Large Language Models [58.3] 性能法則は、LLMアーキテクチャの選択と計算資源の効率的な割り当てを導くために用いられる。
性能法則は、LLMアーキテクチャの選択と計算資源の効率的な割り当てを広範な実験なしで導くのに利用できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:14:18 GMT)
Verification of Geometric Robustness of Neural Networks via Piecewise Linear Approximation and Lipschitz Optimisation [57.1] 我々は、回転、スケーリング、せん断、翻訳を含む入力画像の幾何学的変換に対するニューラルネットワークの検証の問題に対処する。
提案手法は, 分枝・分枝リプシッツと組み合わせたサンプリングおよび線形近似を用いて, 画素値に対する楽音線形制約を求める。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:02:09 GMT)
Bidirectional Gated Mamba for Sequential Recommendation [56.9] 最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:56:29 GMT)
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities [56.6] CustomCrafterは、追加のビデオやリカバリのための微調整なしで、モデルの動き生成と概念的な組み合わせ能力を保持する。
動作生成においては,VDMは早期に映像の動きを回復する傾向にあり,後期では被写体の詳細の回復に焦点をあてる傾向が見られた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:26:06 GMT)
Analysis of Unstructured High-Density Crowded Scenes for Crowd Monitoring [55.2] 我々は,人群集の組織的動きを検出する自動システムの開発に興味がある。
コンピュータビジョンアルゴリズムは、混雑したシーンのビデオから情報を抽出することができる。
組織化されたコホート内の参加者数を見積もることができます。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:38:07 GMT)
IFH: a Diffusion Framework for Flexible Design of Graph Generative Models [53.2] グラフ生成モデルは,1行にグラフを生成するワンショットモデルと,ノードとエッジの連続的な付加によるグラフを生成するシーケンシャルモデルという,2つの顕著なファミリーに分類される。
本稿では,逐次度を規定するグラフ生成モデルであるInsert-Fill-Halt(IFH)を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:24:40 GMT)
Say No to Freeloader: Protecting Intellectual Property of Your Deep Model [52.8] コンパクト・アントランスファーブル・ピラミッド分離ドメイン(CUPI-Domain)は、権限のないドメインから権限のないドメインへの違法な転送に対する障壁として機能する。
本稿では,CUPI-Domain と CUPI-Domain の両方の特徴をアンカーとして選択する CUPI-Domain ジェネレータを提案する。
非許可ドメインが知られているかどうかに基づいて、CUPI-Domainを利用するための2つのソリューションを提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:34:33 GMT)
S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching [51.4] 本稿ではスムースなスケルトンスケッチに基づくアテンション構造S$3$Attentionを提案する。
S$3$Attentionは、線形複雑性をシーケンス長に保ちながら、ノイズの影響を効果的に最小化する2つのメカニズムを持つ。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:53:11 GMT)
CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.7] CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:43:00 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6] View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:50:18 GMT)
Hierarchical certification of nonclassical network correlations [50.3] ネットワークに対して線形および非線形ベル様の不等式を導出する。
我々はこの仮定を挿入し、その結果が実験で証明できる結果に繋がる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:10:56 GMT)
Third quantization with Hartree approximation for open-system bosonic transport [49.2] 定常状態における弱い相互作用を持つ開系ボソニックリンドブラッド方程式を解くための自己整合形式論を提案する。
ハーツリー近似を用いた第3のQは、ボソンの無限のフォック空間を考慮に入れ、その資源の需要はシステムサイズとともに管理可能である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:50:48 GMT)
DOMAINEVAL: An Auto-Constructed Benchmark for Multi-Domain Code Generation [48.1] この研究には、コード生成ベンチマークデータセットであるDOMAINEVALが含まれており、6つの人気のあるドメインを含んでいる。
私たちのパイプラインは完全に自動化され、コードリポジトリから研究対象のフォーマットへのプッシュボットの構築が可能になります。
本研究のコントリビューションには、コード生成ベンチマークデータセットであるDOMAINEVAL、コードベンチマークを構築するための完全自動化パイプライン、DOMAINEVALのパフォーマンスに基づいたコード生成タスクにおけるLLMの制限の識別が含まれている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:33:58 GMT)
Informational Embodiment: Computational role of information structure in codes and robots [48.0] 我々は,センサの精度,モータの精度,配置,体形状,ロボットの情報構造や計算符号の形状について,情報理論(IT)を考察する。
本研究は,本質的な騒音や物質的制約にもかかわらず,情報の伝達・伝達を行う物理的通信路としてロボットの身体を想定する。
我々は、誤り訂正やノイズに対する堅牢性、パシモニーといった情報容量の観点から、シャノン限界に達したITで使用される効率的なコードの特別なクラスを紹介します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:59:45 GMT)
UniM$^2$AE: Multi-modal Masked Autoencoders with Unified 3D Representation for 3D Perception in Autonomous Driving [47.6] Masked Autoencoders (MAE)は、強力な表現の学習において重要な役割を担い、様々な3D知覚タスクにおいて優れた結果をもたらす。
この研究は、自律運転における統一された表現空間に適したマルチモーダルのMasked Autoencodersに展開する。
画像に固有のセマンティクスとLiDAR点雲の幾何学的複雑さを複雑に結合するため,UniM$2$AEを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:51:18 GMT)
AppAgent v2: Advanced Agent for Flexible Mobile Interactions [46.8] 本研究は,モバイル機器向けの新しいLLMベースのマルチモーダルエージェントフレームワークを提案する。
我々のエージェントは、様々なアプリケーションにまたがる適応性を高めるフレキシブルなアクション空間を構築する。
本研究は,実世界のシナリオにおいて,フレームワークの優れた性能を実証し,その有効性を確認した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:13:48 GMT)
Deep Learning at the Intersection: Certified Robustness as a Tool for 3D Vision [46.6] 空間の占有度を表す分類器と空間の符号距離関数(SDF)との興味深いリンクを強調した。
ランダム化スムーシング(RS)の認証手法をSDFの計算に用いることを提案する。
提案手法は,新しい視点合成における概念実証実験を通じて検証された,SDFを計算するための革新的で実用的なツールを提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:00:32 GMT)
Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding [46.1] 我々はtextbf-textbfImage Guided Invariant-textbfFeature-Aware 3D textbfAffordance textbfGrounding frameworkを紹介した。
複数の人間と物体の相互作用画像に共通する相互作用パターンを同定することにより、3Dオブジェクトの空き領域を推定する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:27:33 GMT)
MCTR: Multi Camera Tracking Transformer [45.7] Multi-Camera Tracking tRansformer (MCTR)は、マルチオブジェクト検出と複数のカメラ間のトラッキングに適した、エンドツーエンドのアプローチである。
MCTRは、Detector TRansformer (DETR)のようなエンドツーエンドの検出器を利用して、カメラビューごとに独立して検出および検出埋め込みを生成する。
このフレームワークは、追跡されたオブジェクトに関するグローバル情報を付加する一連のトラック埋め込みを維持し、ビュー固有の検出埋め込みからローカル情報を統合することで、各フレームでそれらを更新する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:37:03 GMT)
SPARK: Multi-Vision Sensor Perception and Reasoning Benchmark for Large-scale Vision-Language Models [43.8] 本稿では,SPARKと呼ばれるマルチビジョンセンサ知覚と推論ベンチマークの構築を目的とする。
我々は6,248個の視覚言語検定サンプルを作成し,多視点感覚知覚と多視点感覚推論を物理センサ知識の熟練度に基づいて検討した。
その結果、ほとんどのモデルでは、様々な範囲で多視点感覚理論の欠陥が見られた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:35:30 GMT)
Strong coupling between a single photon and a photon pair [43.1] 超強結合回路-QED系における単一光子対と光子対の強い結合を実験的に観察した。
結果は、量子非線形光学の新しい体制への重要な一歩である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:43:21 GMT)
Has Multimodal Learning Delivered Universal Intelligence in Healthcare? A Comprehensive Survey [42.1] 我々は,データセット,タスク指向手法,普遍的基礎モデルの観点から,医療マルチモーダル学習の現状を包括的に調査する。
我々は、データや技術からパフォーマンス、倫理に至るまで、医療における高度な技術の本当の影響を探るため、5つの課題から提案された質問について議論する。
答えは、現在の技術は普遍的な知性を達成しておらず、実行すべき重要な道程がまだ残っているということだ。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:31:01 GMT)
Online Fair Division with Contextual Bandits [41.6] 本稿では,学習者が不可分な項目を観察する複数のエージェントを含む,オンラインフェア分割問題について考察する。
既存のアルゴリズムは、十分な数のコピーを持つ少数のアイテムを仮定し、全てのアイテムとエージェントのペアに対して優れたユーティリティー推定を可能にする。
次に,オンラインフェアディビジョンのためのサブ線形後悔保証付きアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:25:58 GMT)
Flexible categorization using formal concept analysis and Dempster-Shafer theory [40.3] 本稿では、二部グラフとして表されるデータから説明可能な分類を入手し、研究するための公式な基盤を提供する。
このフレームワークを用いて,検出と分類のための機械学習メタアルゴリズムを記述し,その結果の局所的およびグローバル的説明を提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:28:20 GMT)
Xinyu: An Efficient LLM-based System for Commentary Generation [39.2] 新友(しんゆう)は、中国の注釈文作成のコメンテーターを支援するために設計された、効率的なLCMベースのシステムである。
基本要件を満たすため、我々は生成プロセスを逐次ステップに分解し、ターゲット戦略を提案し、微調整を監督する。
実際のシナリオではコメンテーターの効率が大幅に向上し,コメント作成に要する平均時間は4時間から20分に短縮された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:40:44 GMT)
Multimodal Analysis of White Blood Cell Differentiation in Acute Myeloid Leukemia Patients using a β-Variational Autoencoder [38.1] 形態学的および転写学的データを探索・再構成する教師なし手法を提案する。
本手法は,カスタマイズされた損失関数を持つβ変分オートエンコーダ(ss-VAE)に基づく。
バイオメディシンと診断のための白血球成熟の理解を改善するためのユニークなツールを提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:10:34 GMT)
Atlas Gaussians Diffusion for 3D Generation with Infinite Number of Points [37.7] 我々は、フィードフォワードネイティブな3D生成のための新しい表現であるAtlas Gaussiansを紹介する。
我々は、UVに基づくサンプリングを導入し、十分に大きく、理論上は無限の3Dガウス点の生成を可能にする。
実験により,本手法は,フィードフォワードネイティブな3D世代における先行技術よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:27:27 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [37.1] ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。
本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。
我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:27:06 GMT)
PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments [37.0] ポイントレベルのアベイランス表現とリレートレーニングを取り入れた,新しいプレグラッピング計画フレームワークであるPreAffordを紹介する。
提案手法は適応性を大幅に向上させ,多様な環境やオブジェクトタイプに対して効果的な操作を可能にする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:36:18 GMT)
Causal-Guided Active Learning for Debiasing Large Language Models [36.8] 現在の生成型大規模言語モデル(LLM)は、それでもデータセットバイアスを捕捉し、生成に利用することができる。
従来の知識に基づくデバイアス法や微調整に基づくデバイアス法は、現在のLCMには適さない可能性がある。
LLM自体を利用して情報バイアスされたサンプルを自動かつ自律的に識別し,バイアスパターンを誘導する,カジュアル誘導型アクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:46:15 GMT)
Addressing Skewed Heterogeneity via Federated Prototype Rectification with Personalization [35.5] フェデレートラーニング(Federated Learning)は、複数の分散デバイス間の協調モデルトレーニングを容易にするために設計された、効率的なフレームワークである。
連合学習の重要な課題は、データレベルの不均一性、すなわち、スキュードまたはロングテールのプライベートデータの分散である。
本稿では,フェデレーション・パーソナライゼーションとフェデレーション・プロトタイプ・レクティフィケーションの2つの部分からなる新しいフェデレーション・プロトタイプ・レクティフィケーションを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:03:54 GMT)
Feature Selection from Differentially Private Correlations [35.2] 高次元回帰はデータセット内の個々のデータポイントに関する情報をリークすることができる。
相関に基づく順序統計を用いて、データセットから重要な特徴を選択し、それらを民営化する。
提案手法は,多くのデータセット上でのプライベートな特徴選択において,確立されたベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:03:57 GMT)
Measuring Variable Importance in Individual Treatment Effect Estimation with High Dimensional Data [35.1] 因果機械学習(ML)は、個々の治療効果を推定するための強力なツールを提供する。
ML手法は、医療応用にとって重要な解釈可能性の重要な課題に直面している。
統計的に厳密な変数重要度評価のための条件置換重要度(CPI)法に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:44:07 GMT)
ControlDreamer: Blending Geometry and Style in Text-to-3D [34.9] 我々は、慎重にキュレートされたテキストコーパスからデータセットに基づいて訓練された、新しい深度対応多視点拡散モデルであるMulti-view ControlNetを紹介する。
マルチビューコントロールネットは、2段階のパイプラインであるControlDreamerに統合され、テキストガイドによるスタイリングされた3Dモデルの生成を可能にします。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:05:36 GMT)
A Web-Based Solution for Federated Learning with LLM-Based Automation [34.8] フェデレートラーニング(FL)は、分散デバイス間で協調的な機械学習に有望なアプローチを提供する。
我々は,フェデレート平均化(FedAvg)アルゴリズムをサポートするユーザフレンドリーなWebアプリケーションを開発した。
FLにおける意図に基づく自動化を、カスタマイズされたデータセットで訓練された微調整言語モデル(LLM)を用いて検討する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:57:02 GMT)
Power Scheduler: A Batch Size and Token Number Agnostic Learning Rate Scheduler [34.4] 提案したWSDスケジューラの最適学習率,バッチサイズ,トレーニングトークン数の相関について検討した。
本稿では,学習率スケジューラであるPowerスケジューラを提案する。
Powerスケジューラでトレーニングした3B高密度モデルとMoEモデルは、最先端の小型言語モデルと同等のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:22:20 GMT)
End-to-end Surface Optimization for Light Control [34.3] 本稿では,光学面メッシュのエンドツーエンド最適化手法を提案する。
我々の定式化は、得られた光の分布と対象の分布との差によって引き起こされる。
また, 設計面のCNC加工および研磨を容易にするため, 加工条件に関する幾何学的制約を課す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:40:40 GMT)
ParGo: Bridging Vision-Language with Partial and Global Views [34.2] マルチモーダル大言語モデル(MLLM)のビジョンと言語モダリティを接続する新しい部分言語プロジェクタであるParGoを紹介する。
グローバルアテンションベースのプロジェクタに依存する従来の作業とは異なり、ParGoは個別に訓練された視覚エンコーダとLLMの間の表現ギャップを橋渡しします。
実験の結果,ParGoは他のプロジェクタよりも優れており,特に知覚能力の細部を重視したタスクでは顕著に優れていた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:14:58 GMT)
Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering [33.9] 本稿では,IEKRと呼ばれる新たな内部知識と外部知識の対話的改良パラダイムを提案する。
LLM に “Tell me something about” のようなプロンプトを追加するだけで、関連する明示的な知識をレビューして、クエリに挿入して外部検索します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:52:57 GMT)
In-Context Learning with Reinforcement Learning for Incomplete Utterance Rewriting [33.9] 大規模言語モデル(LLM)の文脈内学習は、いくつかの例で拡張された命令に基づいて予測を行う。
ICLの既存の例選択方法はスパースまたは高密度レトリバーを使用し、有効性能を導出する。
本稿では,言語モデルセレクタとLLMジェネレータから構成される実例選択(RLS)のためのポリシーベース強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:32:12 GMT)
Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.4] 自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:26:54 GMT)
Search-Adaptor: Embedding Customization for Information Retrieval [32.8] 事前学習されたLarge Language Models (LLM) によって抽出された埋め込みは、情報検索と検索を改善する重要な可能性を持っている。
本稿では,情報検索のためのLLMを効率的かつロバストな方法でカスタマイズする新しい手法であるSearch-Adaptorを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:55:12 GMT)
TWLV-I: Analysis and Insights from Holistic Evaluation on Video Foundation Models [32.6] 本稿では,映像理解における2つの中核的能力(外観と動作理解)を測定するための枠組みを提案する。
我々は、モーションベースと外観ベースの両方で堅牢な視覚表現を構築する、新しいビデオ基盤モデルであるTWLV-Iを紹介する。
V-JEPA (ViT-L) に比べて4.6%改善し, UMT (ViT-L) よりも7.7%改善した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:33:17 GMT)
Mapping Degeneration Meets Label Evolution: Learning Infrared Small Target Detection with Single Point Supervision [32.3] 我々は、赤外小目標検出をポイントレベルの監視で実現するための最初の試みを行っている。
本稿では,ラベルを段階的に拡張するために,単一点監視(LESPS)を用いたラベル進化というラベル進化フレームワークを提案する。
本手法の有効性を検証するため,洞察力のある可視化実験を行った。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:53:17 GMT)
Leveraging Task Structures for Improved Identifiability in Neural Network Representations [31.9] 教師あり学習における識別可能性の理論を,タスクの分布にアクセスできる結果を考慮して拡張する。
一般マルチタスク回帰設定において線形識別性が達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:26:46 GMT)
Improving Equivariant Model Training via Constraint Relaxation [31.5] 等価ニューラルネットワークは、基礎となるデータ対称性が知られているタスクでうまく一般化できるため、様々なアプリケーションで広く利用されている。
そこで本研究では,トレーニング中の厳密な均衡制約を緩和することにより,そのようなモデルの最適化を改善する新しい枠組みを提案する。
本研究では,様々な最先端ネットワークアーキテクチャの実験結果を提供し,このトレーニングフレームワークが一般化性能を向上した同変モデルを実現する方法を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:35:08 GMT)
Multivariate Time-Series Anomaly Detection based on Enhancing Graph Attention Networks with Topological Analysis [31.4] 時系列における教師なし異常検出は、手動による介入の必要性を大幅に低減するため、産業応用において不可欠である。
従来の手法では、グラフニューラルネットワーク(GNN)やトランスフォーマーを使用して空間を解析し、RNNは時間的依存をモデル化していた。
本稿では,TopoGDNと呼ばれる多変量時系列異常検出のための拡張グラフ注意ネットワーク(GAT)上に構築された新しい時間モデルを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:06:30 GMT)
MetaGAD: Meta Representation Adaptation for Few-Shot Graph Anomaly Detection [31.2] 少数ショットグラフ異常検出の重要な問題について検討する。
本稿では,自己指導学習から少数ショット指導学習へ知識を適応させるメタGADを提案する。
具体的には、二段階最適化として問題を定式化し、MetaGADの収束を保証し、検証損失を最小限に抑える。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:31:31 GMT)
The Best of Both Worlds: Toward an Honest and Helpful Large Language Model [30.8] 大規模言語モデル(LLM)は、その例外的な生成能力により、様々な産業で顕著な成功を収めている。
正直さを維持しながらLLMの有用性を優先できるだろうか?
LLMの誠実さと有用性を高めるための2つのアプローチとして、トレーニング不要の強化と微調整に基づく改善を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:39:57 GMT)
Eliminating Surface Oxides of Superconducting Circuits with Noble Metal Encapsulation [30.7] タンタルベースの超伝導量子ビットは記録的な寿命で実証されている。
主な損失源は、酸化タンタル表面の2レベル系(TLS)の存在である。
天然酸化物を生成しない貴金属でタンタルをカプセル化することにより酸化防止戦略を実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:16:09 GMT)
MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark [30.0] 我々は,視覚情報とテキスト情報の組み合わせの理解と適用を強調する新しいベンチマークであるMathScapeを提案する。
MathScapeは、MLLMの理論的理解と応用能力を評価し、写真に基づく数学問題シナリオを評価するように設計されている。
我々は11の高度MLLMに対して多次元評価を行い、最も洗練されたモデルでさえベンチマークが困難であることを明らかにした。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:09:34 GMT)
A Survey on Drowsiness Detection -- Modern Applications and Methods [29.4] 眠気検知は、職場や車輪の後ろの安全を確保する上で、最重要事項である。
本総説では,各分野における眠気検知の重要性について概説する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:15:21 GMT)
Adversarial Training on Purification (AToP): Advancing Both Robustness and Generalization [29.1] 本稿では,AToP (Adversarial Training on Purification) という,ロバストな浄化器モデルを得るための新しいパイプラインを提案する。
そこで我々は,CIFAR-10,CIFAR-100,ImageNetteの大規模実験を行った。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:08:14 GMT)
Hypothesis Generation with Large Language Models [28.7] データに基づく仮説生成(ラベル付き例)に焦点を当てる。
マルチアームの盗賊にインスパイアされた我々は、更新プロセスにおけるエクスプロイト探索のトレードオフを通知する報酬関数を設計する。
我々のアルゴリズムは、分類タスクにおいて、数発のプロンプトよりもずっと優れた予測性能を実現する仮説を生成することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:00:00 GMT)
Mechanistic Interpretability for AI Safety -- A Review [28.4] 本稿では,機械的解釈可能性について概説する。
機械的解釈性は、AIシステムがより強力で精査されるにつれて、破滅的な結果を防ぐのに役立つ。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:02:28 GMT)
Robust Diffusion Models for Adversarial Purification [28.3] 拡散モデル(DM)に基づく対位法(AP)は、対位法トレーニング(AT)の最も強力な代替手段であることが示されている。
本稿では,事前訓練したDMとは独立に,敵対的指導を施した新しい頑健な逆過程を提案する。
この堅牢なガイダンスは、よりセマンティックなコンテンツを保持する純粋化された例を生成するだけでなく、DMの正確でロバストなトレードオフを軽減することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:55:11 GMT)
Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation [28.2] 本稿では,最小限の計算資源を用いて高品質な亀裂分節マップを生成する階段型亀裂分節ネットワーク(CrackSCF)を提案する。
そこで我々は,局所的な亀裂パターンと画素の長距離依存性を効果的に捉えた階段列融合モジュールを構築した。
モデルが必要とする計算資源を削減するため,ネットワーク内のすべての畳み込み操作を置き換える軽量な畳み込みブロックを導入した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:21:51 GMT)
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting [28.0] セマンティック・ガウシアン(Semantic Gaussians)は,3次元ガウシアン・スプレイティングをベースとした,新しいオープン語彙シーン理解手法である。
既存の手法とは異なり、様々な2次元意味的特徴を3次元ガウスの新たな意味的構成要素にマッピングする多目的投影手法を設計する。
我々は,高速な推論のために,生の3Dガウスから意味成分を直接予測する3Dセマンティックネットワークを構築した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:44:36 GMT)
BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks on Large Language Models [27.6] textitBackdoorLLMは、生成型大規模言語モデルに対するバックドア攻撃を研究するための、最初の包括的なベンチマークである。
textitBackdoorLLMの機能: 1) 標準化されたトレーニングパイプラインを備えたバックドアベンチマークのレポジトリ、2) データ中毒、重毒、隠れ状態攻撃、およびチェーンオブ思想攻撃を含む多様な攻撃戦略、3) 7つのシナリオと6つのモデルアーキテクチャにわたる8つの攻撃に関する200以上の実験による広範な評価。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:21:21 GMT)
CoSQA+: Enhancing Code Search Dataset with Matching Code [27.1] CoSQA+は、複数の適切なコードで高品質なクエリをペアリングする。
CoSQA+はCoSQAよりも優れた品質を示している。
我々は1対Nのコード検索性能を評価するための新しい指標を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:55:52 GMT)
Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification [27.0] 本稿では,まずハイパースペクトル画像パッチを空間スペクトルトークンに変換するトークン生成モジュールである空間スペクトル形態マンバ(MorpMamba)モデルを提案する。
これらのトークンはモルフォロジー演算によって処理され、奥行き分離可能な畳み込み演算を用いて構造情報と形状情報を計算する。
広く使われているHSIデータセットの実験では、MorpMambaモデルはCNNモデルとTransformerモデルの両方で(パラメトリック効率)優れていた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:57:07 GMT)
La-SoftMoE CLIP for Unified Physical-Digital Face Attack Detection [27.0] 顔認識システムは、物理的攻撃とデジタル攻撃の両方に影響を受けやすい。
スパースモデルを用いてスパースデータを処理する新しい手法を提案する。
フレキシブルな自己適応型重み付け機構を導入し、モデルに適合し、適応できるようにします。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:12:13 GMT)
OpsEval: A Comprehensive IT Operations Benchmark Suite for Large Language Models [26.6] 大規模言語モデル(LLM)用に設計された総合的なタスク指向のOpsベンチマークであるOpsEvalを提示する。
このベンチマークには、英語と中国語で7184の質問と1736の質問回答(QA)形式が含まれている。
評価の信頼性を確保するため、何十人ものドメインエキスパートを招待して、質問を手動でレビューします。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:46:17 GMT)
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points [26.3] 離散的な3次元制御点を利用した新しい手法を提案する。
この方法は局所光を物理的にモデル化し、運動デカップリング座標系を確立する。
また,NVIDIA 4070 GPUの1フレームあたり2秒以内で達成可能な3Dコントロールポイントの最適化によって,トレーニングの大幅な高速化を実現しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:51:49 GMT)
CSRec: Rethinking Sequential Recommendation from A Causal Perspective [25.7] シーケンシャルなレコメンデータシステム(RecSys)の本質は、ユーザが意思決定を行う方法を理解することです。
我々は、CSRec(Causal Sequential Recommendation)と呼ばれる、シーケンシャルレコメンデーションの新しい定式化を提案する。
CSRecは、シーケンシャルなコンテキスト内で推奨項目が受け入れられる確率を予測し、現在の決定がどのようになされるかをバックトラックすることを目的としている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:19:14 GMT)
AnyDesign: Versatile Area Fashion Editing via Mask-Free Diffusion [25.6] ファッション画像編集は、与えられた指示に基づいて人物の外観を変更することを目的としている。
現在の手法ではセグメンタやキーポイント抽出器のような補助的なツールが必要であり、柔軟性と統一されたフレームワークが欠如している。
本稿では,多目的領域におけるマスフリー編集を可能にする拡散法であるAnyDesignを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:03:21 GMT)
Examining the Commitments and Difficulties Inherent in Multimodal Foundation Models for Street View Imagery [25.4] 本稿では,ストリートビュー画像,ビルディング環境,インテリアにおけるChatGPT-4VとGemini Proの機能について検討する。
その結果,長さ測定,スタイル分析,質問応答,基本画像理解の習熟度が明らかになった。
全体として、この発見は基礎的なマルチモーダルインテリジェンスを示し、先進的な学際的応用を促進するためのFMの可能性を強調している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:45:31 GMT)
SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM [24.7] SUBLLMは、サブサンプリング、アップサンプリング、バイパスモジュールを組み込むことで、コアデコーダのみのフレームワークを拡張する革新的なアーキテクチャである。
トレーニング中、SUBLLMはスピードを26%向上し、GPU毎にメモリを10GB削減する。
推論では、スピードを最大37%向上し、1GPUあたりのメモリを1GB削減する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:17:58 GMT)
Cinematic Gaussians: Real-Time HDR Radiance Fields with Depth of Field [23.9] 放射場法は、多視点写真から複雑なシーンを再構成する際の技法の状態を表現している。
ピンホールカメラモデルへの依存は、すべてのシーン要素が入力画像に集中していると仮定し、実用的な課題を提示し、新規な視点合成において再焦点を複雑にする。
様々な露光時間,開口の放射率,焦点距離を多視点LDR画像を用いて高ダイナミックレンジシーンを再構成する3Dガウススメッティングに基づく軽量解析手法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:56:57 GMT)
Analysis of DNS Dependencies and their Security Implications in Australia: A Comparative Study of General and Indigenous Populations [23.9] 我々は、先住民社会に奉仕するオーストラリア政府のドメインのDNS依存を分析した。
オーストラリア政府ドメインとDNSプロバイダ間の直接的な依存関係を示すために、依存関係グラフを構築します。
また、DNSプロバイダのIPロケーション分析を行い、DNSサーバの地理的分布をマップアウトする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:09:28 GMT)
Spiking NeRF: Representing the Real-World Geometry by a Discontinuous Representation [23.6] 既存のNeRFベースの手法が成功した決定的な理由は、複数のパーセプトロン層(MLP)を介して幾何学表現のための神経密度場を構築することである。
本稿では、スパイキングニューロンとハイブリッドニューラルネットワーク(ANN)-スパイキングニューラルネットワーク(SNN)を用いて、忠実な幾何表現のための不連続密度場を構築するためのスパイキングNeRFを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:16:29 GMT)
End-To-End Causal Effect Estimation from Unstructured Natural Language Data [23.5] 本研究では,大規模言語モデル(LLM)を用いて,多種多様なテキストデータをマイニングして,安価な因果効果推定を行う方法を示す。
NATURALは,LLMを用いて構築され,非構造化テキストのデータセット上で動作する因果効果推定器である。
この結果から、非構造化テキストデータは因果効果情報の豊富な情報源であり、NATURALはこのリソースを利用するための自動パイプラインへの第一歩であることを示唆した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:41:47 GMT)
What Do You Want? User-centric Prompt Generation for Text-to-image Synthesis via Multi-turn Guidance [23.4] テキスト・ツー・イメージ合成(TIS)モデルは、テキスト・プロンプトの品質と特異性に大きく依存している。
既存のソリューションは、ユーザクエリから自動モデル優先のプロンプト生成を通じてこれを緩和する。
ユーザ中心性を重視したマルチターン対話型TISプロンプト生成モデルであるDialPromptを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:35:35 GMT)
mHuBERT-147: A Compact Multilingual HuBERT Model [23.2] mHuBERT-147は90K時間のクリーンでオープンなデータに基づいて訓練された最初の汎用多言語HuBERT音声表現モデルである。
マルチイテレーションの HuBERT アプローチをスケールアップするために,ファイスベースのクラスタリングを用い,元の手法よりも5.2倍高速なラベル割り当てを実現した。
以上の結果から,mHuBERT147は多言語音声タスクの有望なモデルであり,高い性能とパラメータ効率のバランスを保っていることが示唆された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:55:50 GMT)
Learning to Plan Long-Term for Language Modeling [23.0] 今後,多くの文の潜在計画を予測するプランナーを提案する。
複数のプランを一度にサンプリングすることにより、テキスト継続の分布の正確な近似に基づいて言語モデルを条件付けする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:18:10 GMT)
Experimental practical quantum tokens with transaction time advantage [22.9] 本報告では, 誤り, 損失, 実験不完全にもかかわらず, 安全性が証明された量子Sトークンの完全な実演を報告する。
都市内2.77kmと都市間60.54kmの光ファイバーネットワークに対するトランザクション時間優位性を,古典的クロスチェック方式と比較して示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:42:00 GMT)
Map-Free Visual Relocalization Enhanced by Instance Knowledge and Depth Knowledge [22.7] 地図のない再ローカライズ技術は、自律ナビゲーションや拡張現実の応用に不可欠である。
マッチング方法の制限や、単眼画像のスケールの欠如により、大きな課題に直面している。
本稿では,実例知識と深度知識によって強化された地図のない再局在化手法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:12:03 GMT)
Disentangling, Amplifying, and Debiasing: Learning Disentangled Representations for Fair Graph Neural Networks [22.6] 本稿では,新しいGNNフレームワークであるDAB-GNNを提案する。
Dab-GNNは、正確性と公正性の最適バランスを達成するという点で、最先端の10のライバルを著しく上回っている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:14:56 GMT)
Guiding IoT-Based Healthcare Alert Systems with Large Language Models [22.5] 医療アラートシステム(HAS)は、人工知能(AI)、IoT(Internet of Things)技術の進歩、健康意識の向上など、急速に進化している。
パーソナライズされたヘルスアラートの正確さと、リソースに制約されたHAS環境における厳格なプライバシー保護のバランス。
本稿では,Large Language Models (LLM) をHASに組み込んだ一様フレームワーク LLM-HAS を導入し,その精度を大幅に向上させ,ユーザのプライバシーを確保し,パーソナライズされたヘルスサービスを強化する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:55:36 GMT)
DiffLoad: Uncertainty Quantification in Load Forecasting with Diffusion Model [22.4] 再生可能エネルギー源の統合と、新型コロナウイルスのパンデミックなどの外部イベントの発生により、負荷予測の不確実性が急速に高まっている。
本稿では, エピステミック不確かさを推定するための拡散型Seq2Seq構造を提案し, 強靭性付加コーシー分布を用いてアレタリック不確かさを推定する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:30:49 GMT)
D&M: Enriching E-commerce Videos with Sound Effects by Key Moment Detection and SFX Matching [22.1] 本稿では,SFXマッチングを同時に行うために,キーモーメント検出とモーメントを同時に行う統一手法を提案する。
新しいVDSFXタスクのために、Eコマースプラットフォームから大規模なデータセットSFX-Momentを構築します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:01:35 GMT)
Towards Fine-Grained Citation Evaluation in Generated Text: A Comparative Analysis of Faithfulness Metrics [22.0] 大型言語モデル(LLM)は、しばしば「幻覚」として知られる、サポートされていない、または検証できないコンテンツを生成している。
本稿では,3段階のサポートレベル間での引用を識別する上で,メトリクスの有効性を評価するための比較評価フレームワークを提案する。
以上の結果から,全ての評価において一貫した指標が得られず,きめ細かな支援評価の複雑さが明らかとなった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:04:38 GMT)
Animal Identification with Independent Foreground and Background Modeling [21.9] 本研究では,個々の動物の視覚的識別において,背景と前景をしっかりと活用する手法を提案する。
実験では、Segment Anythingのようなメソッドと独立のフォアグラウンドとバックグラウンド関連のモデリングで簡単に分離できることが示され、結果が改善された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:19:34 GMT)
cc-DRL: a Convex Combined Deep Reinforcement Learning Flight Control Design for a Morphing Quadrotor [21.9] 本稿では,モーフィング・クオーターのクラスの位置と姿勢に対する凸結合型DRL(cc-DRL)飛行制御アルゴリズムを提案する。
提案したcc-DRL飛行制御アルゴリズムでは、モデルフリーのDRLアルゴリズムであるポリシー最適化アルゴリズムを用いて、対応する最適飛行制御法をオフラインで訓練する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:25:04 GMT)
VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models [21.2] 本稿では,VFM-Detと呼ばれる,事前訓練された基礎車両モデル(VehicleMAE)と大規模言語モデル(T5)に基づく新しい車両検出パラダイムを提案する。
我々のモデルは、それぞれ$AP_0.5$と$AP_0.75$で、ベースラインアプローチを$+5.1%$、$+6.2%$で改善する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:39:02 GMT)
Long-Term Pre-training for Temporal Action Detection with Transformers [21.2] 時間的行動検出(TAD)は、現実の動画アプリケーションには難しいが、基本的なものである。
本稿では,データ不足による2つの重要な問題,すなわち注意崩壊と不均衡性能について述べる。
本稿では,変圧器に適した新しい事前学習戦略である長期事前学習を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:20:53 GMT)
Near-field Beam training for Extremely Large-scale MIMO Based on Deep Learning [20.7] 深層学習に基づく近接場ビームトレーニング手法を提案する。
我々は,歴史データからチャネル特性を効率的に学習するために,畳み込みニューラルネットワーク(CNN)を用いる。
提案手法は,従来のビームトレーニング法と比較して,より安定したビームフォーミングゲインを実現し,性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:02:49 GMT)
ESVAE: An Efficient Spiking Variational Autoencoder with Reparameterizable Poisson Spiking Sampling [20.4] 可変オートエンコーダ(VAE)は、最も人気のある画像生成モデルの一つである。
現在のVAE法は、精巧な自己回帰ネットワークによって潜在空間を暗黙的に構築する。
本稿では,解釈可能な潜在空間分布を構成する効率的なスパイキング変分オートエンコーダ(ESVAE)を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:09:22 GMT)
Contrasting Linguistic Patterns in Human and LLM-Generated Text [20.1] 人書き英語のニューステキストに比較して,LLM(Large Language Model)の出力を定量的に分析する。
結果は、人間とAIが生成したテキストの様々な測定可能な相違を明らかにした。
人間の文章は、より散在した文の長さの分布、より多様な語彙、依存と構成型の明確な利用を示す。
LLM出力は人文よりも数字、記号、補助語が多用され、代名詞も多用される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:42:45 GMT)
DutyTTE: Deciphering Uncertainty in Origin-Destination Travel Time Estimation [20.1] 旅行時間推定(TTE)の不確実性定量化は、旅行時間の信頼区間を推定することを目的としている。
提案するDutyTTEは,(1)真実に整合した経路の予測,2)各セグメントにおける旅行時間の影響のモデル化,という2つの課題に対処する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:06:04 GMT)
Reduce, Reuse, Recycle: Categories for Compositional Reinforcement Learning [19.8] 我々は圏論のプリズムを通してタスク構成を考察する。
マルコフ決定過程の分類的性質は、複雑なタスクを管理可能なサブタスクに切り離す。
実験結果は強化学習のカテゴリー理論を支持する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:23:22 GMT)
Structural Representation Learning and Disentanglement for Evidential Chinese Patent Approval Prediction [19.3] 本稿では,検索に基づく分類手法を用いて,本課題の先駆的取り組みについて述べる。
本稿では,構造表現学習と絡み合いに着目したDiSPatという新しいフレームワークを提案する。
弊社のフレームワークは、特許承認の予測に関する最先端のベースラインを超越し、明確性の向上も示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:44:16 GMT)
Uniform Inference for Subsampled Moment Regression [19.0] 本研究では,条件付きモーメント方程式の解に対する同時信頼区間を構築する手法を提案する。
我々は高次元U.S.の濃度と正規近似に関する新しい順序抽出結果を得た。
副産物として、高次元U.S.の濃度と正規近似に関するいくつかの新しい順序抽出結果を得る。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:03:03 GMT)
CALRec: Contrastive Alignment of Generative LLMs for Sequential Recommendation [19.0] 大規模言語モデル(LLM)は、シーケンシャルなレコメンデーションのために大量のテキストコーパスで事前訓練される。
本稿では,2つの対照的な損失と言語モデリング損失を混合して,事前学習したLLMを2tower方式で微調整する2段階のLLMファインタニングフレームワークを提案する。
我々のモデルは、多くの最先端のベースラインを著しく上回ります。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:46:32 GMT)
High-dimentional Multipartite Entanglement Structure Detection with Low Cost [18.9] 本稿では,絡み合い構造検出に適した表現を生成するニューラルネットワークモデルを提案する。
提案手法は最大19量子ビット系における95%以上の検出精度を実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:09:26 GMT)
Enhanced Fine-Tuning of Lightweight Domain-Specific Q&A Model Based on Large Language Models [18.1] 大規模言語モデル(LLM)は、一般的な質問回答(Q&A)では優れているが、ドメイン固有の知識が不足しているため、専門分野では不足することが多い。
本稿では,軽量なオープンソース LLM を活用することで,これらの問題に対処する新しいフレームワークであるSelf-Evolutionを提案する。
我々はQwen1.5-7B-Chat上での自己進化(Self-Evolution)を、China Mobileの豊富なドメイン知識を含む4000のドキュメントを用いて採用する。
中国モバイルの毎日の運用とメンテナンスに117日間、セルフエボリューションが展開され、アラームの発見、問題修正、関連するレポートの発見の効率が向上している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:25:26 GMT)
MedDec: A Dataset for Extracting Medical Decisions from Discharge Summaries [18.1] メドデック」データセットには10種類の医学的判断によって注釈付けされた11種類の表現型(障害)の臨床ノートが含まれている。
本研究の目的は,臨床ノート内で異なるタイプの医療判断を共同で抽出し,分類することである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:54:44 GMT)
Hierarchical Consensus-Based Multi-Agent Reinforcement Learning for Multi-Robot Cooperation Tasks [17.9] 階層型合意に基づくマルチエージェント強化学習(HC-MARL)フレームワークを導入し,その限界に対処する。
HC-MARLは、エージェント間のグローバルコンセンサスを促進するために対照的な学習を採用し、直接のコミュニケーションなしに協調行動を可能にする。
様々なタスクの動的な要求を満たすために、コンセンサスを複数の層に分割し、短期的および長期的考慮を包含する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:07:46 GMT)
Investigating LLM Applications in E-Commerce [17.9] 大規模言語モデル(LLM)は、特にeコマースにおける様々なアプリケーションにおける自然言語処理に革命をもたらした。
本稿では,電子商取引分野におけるLLMの有効性を考察し,様々な規模の公開電子商取引データセットを用いたオープンソースのLLMモデルの構築に焦点をあてる。
電子商取引特化業務において,テキスト内学習を用いた大規模LLMのニッチ産業応用の有効性について検討した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:57:37 GMT)
DBHP: Trajectory Imputation in Multi-Agent Sports Using Derivative-Based Hybrid Prediction [17.6] 本稿では,複数のエージェントの欠落した軌跡を効果的に説明できるDBHP(デリバティブベースハイブリッド予測)フレームワークを提案する。
我々のフレームワークは既存の計算基準を著しく上回っている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:27:46 GMT)
From Few to More: Scribble-based Medical Image Segmentation via Masked Context Modeling and Continuous Pseudo Labels [17.4] 医用画像セグメンテーションのための弱教師付きフレームワークを提案する。
MaCoはマスク付きコンテキストモデリングと連続擬似ラベルを採用している。
3つの公開データセットを用いて、他の弱教師付き手法に対するMaCoの評価を行った。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:19:20 GMT)
Data Exposure from LLM Apps: An In-depth Investigation of OpenAI's GPTs [17.4] 本稿は,LLMアプリのデータプラクティスにおける透明性の実現を目的とする。
OpenAIのGPTアプリエコシステムを研究します。
パスワードなどのOpenAIが禁止している機密情報を含む,ユーザに関する広範囲なデータを収集する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:42:06 GMT)
Bayesian Logarithmic Derivative Type Lower Bounds for Quantum Estimation [17.3] 近年、量子領域におけるベイズリスクに対するベイズ長岡-早橋境界と呼ばれる下界が提案されている。
本論文は, このベイズ長岡-早橋境界を, より低い境界で探索することを目的とする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:09:44 GMT)
Multi-Layer Transformers Gradient Can be Approximated in Almost Linear Time [17.1] 本稿では,多層変圧器モデルにおける勾配計算のための新しい高速計算法を提案する。
大規模言語モデルにおける勾配の効率を改善することで、より効果的なトレーニングと長期コンテキスト言語モデルのデプロイが促進されることを願っています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:16:43 GMT)
Deep Learning for Lung Disease Classification Using Transfer Learning and a Customized CNN Architecture with Attention [17.1] 本研究は、健康な肺を描写するX線、肺不透明度を示すX線、ウイルス性肺炎を示すX線を分類することに集中する。
トレーニング済みの5つのモデルをLung X-ray Imageデータセットでテストする予定である。
MobileNetV2をベースとしたMobileNet-Lungは肺疾患分類に取り組み,0.933の精度を実現した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:00:10 GMT)
Learning Causally Disentangled Representations via the Principle of Independent Causal Mechanisms [17.1] 本稿では、因果関係の観測ラベルによって教師される因果関係の非絡み合い表現を学習するための枠組みを提案する。
この枠組みは, 極めて不整合な因果関係を生じさせ, 介入の堅牢性を向上し, 反事実発生と相容れないことを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:01:07 GMT)
E-code: Mastering Efficient Code Generation through Pretrained Models and Expert Encoder Group [16.9] 本研究は,この領域における研究ギャップに対処し,遭遇した様々な課題に対する実践的な解決策を提供することを目的としている。
具体的には、従来の性能エラー修正戦略の制約を克服し、競合するコード効率最適化領域に適した言語モデル(LM)を開発した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:57:37 GMT)
Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.7] 我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:37:06 GMT)
Seeing is not Believing: An Identity Hider for Human Vision Privacy Protection [16.5] 人間の視覚保護に有効なアイデンティティ隠蔽器を提案する。
顔認証装置の識別を許可しながら、外観を大きく変えて身元を視覚的に隠すことができる。
提案したID隠蔽装置は、プライバシー保護と識別可能性保護に優れた性能を発揮する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:23:05 GMT)
Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment [16.4] BERTやT5のような事前訓練された言語モデルは、高密度検索のための重要なバックボーンエンコーダとして機能する。
近年,大規模言語モデル (LLM) をレトリバーとして使用し,様々なタスクでSOTA性能を達成している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:46:41 GMT)
OMEGAS: Object Mesh Extraction from Large Scenes Guided by Gaussian Segmentation [15.8] 大きな場面から特定の物体を正確に再構築することは困難である。
現在のシーン再構築技術は、しばしばオブジェクトの詳細テクスチャが失われる。
本稿では,ガウシアンがガイドした大規模シーンからオブジェクト抽出を行う OMEGAS というフレームワークを提案する。
本研究では,大規模シーンから,定量的かつ定性的に,特定のターゲットを正確に再構築できることを実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:29:20 GMT)
ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth [15.5] 単一深度画像からのカテゴリーレベルのオブジェクトのポーズと形状推定は、ロボット工学や自動運転に広く応用されているため、最近研究の注目を集めている。
ポーズアノテートされたデータから学習する必要がない反復的推定法を提案する。
われわれのアルゴリズムはShapeICPと呼ばれ、ICPアルゴリズムの基盤となっているが、カテゴリレベルのポーズと形状推定のための追加機能を備えている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:12:55 GMT)
Transforming Location Retrieval at Airbnb: A Journey from Heuristics to Reinforcement Learning [15.0] 本稿では,機械学習に基づく位置情報検索プロダクトをゼロから構築する手法,課題,およびその影響について述べる。
適切な機械学習ベースのアプローチが欠如しているにもかかわらず、コールドスタート、一般化、微分、アルゴリズムバイアスに取り組む。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:51:14 GMT)
Controlled Learning of Pointwise Nonlinearities in Neural-Network-Like Architectures [14.9] 本稿では,階層型計算アーキテクチャにおける自由形式非線形性のトレーニングのための一般的な変分フレームワークを提案する。
傾斜制約により、1-Lipschitz安定性、堅固な非膨張性、単調性/可逆性といった特性を課すことができる。
本稿では, 非線形性を適切な(一様でない)B-スプラインベースで表現することで, 数値関数最適化問題の解法を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:39:27 GMT)
Protecting against simultaneous data poisoning attacks [14.9] 現在のバックドア防御法は、一度に1回の攻撃に対して評価される。
同時に実行されたデータ中毒攻撃は、複数のバックドアを単一のモデルに効果的にインストールできることを示す。
我々は,マルチアタック・セッティングに有効である新しいディフェンス,BaDLossを開発した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:57:27 GMT)
On Class Separability Pitfalls In Audio-Text Contrastive Zero-Shot Learning [14.8] 測定されたゼロショット学習精度のかなりの部分は、音声とテキストのバックボーンから受け継がれた強度によるものであることを示す。
本研究では,ゼロショット学習精度のかなりの部分は,音声とテキストのバックボーンから受け継がれた強度によるものであることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:52:56 GMT)
Zeoformer: Coarse-Grained Periodic Graph Transformer for OSDA-Zeolite Affinity Prediction [14.8] ゼオフォーマーは、粗粒の結晶周期性ときめ細かい局所変動性を効果的に表すことができる。
本モデルは,OSDA-ゼオライトペアデータセットと2種類の結晶材料データセットにおいて,最高の性能を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:05:48 GMT)
Sapiens: Foundation for Human Vision Models [14.7] サピエンス(Sapiens)は、4つの基本的人間中心の視覚タスクのモデル群である。
モデルは1Kの高解像度推論をサポートし、個々のタスクに容易に適応できる。
人間の画像のキュレートされたデータセット上での自己教師付き事前トレーニングは、多種多様な人間中心のタスクのパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:34:56 GMT)
IntelliCare: Improving Healthcare Analysis with Variance-Controlled Patient-Level Knowledge from Large Language Models [14.7] LLM(Large Language Models)からの外部知識の統合は、医療予測を改善するための有望な道を示す。
我々は,LLMを活用して高品質な患者レベルの外部知識を提供する新しいフレームワークであるIntelliCareを提案する。
IntelliCareは患者のコホートを特定し、LCMの理解と生成を促進するためにタスク関連統計情報を利用する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:56:00 GMT)
DTN: Deep Multiple Task-specific Feature Interactions Network for Multi-Task Recommendation [14.5] 本稿では,新しいモデル構造を持つDeep Multiple Task-specific Feature Interactions Network (DTN)を提案する。
DTNは、MTLネットワークにおいて複数のタスク固有特徴相互作用法とタスク依存ネットワークを導入し、タスク固有特徴相互作用表現を学習できるようにする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:13:07 GMT)
G3FA: Geometry-guided GAN for Face Animation [14.5] この制限に対処するために、顔アニメーション(G3FA)のための幾何学誘導型GANを導入する。
我々の新しいアプローチは、顔アニメーションモデルに2次元画像のみを用いて3次元情報を組み込むことを可能にした。
顔の再現モデルでは、動きのダイナミクスを捉えるために2次元の運動ワープを利用する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:13:24 GMT)
A Safe Self-evolution Algorithm for Autonomous Driving Based on Data-Driven Risk Quantification Model [14.4] 本稿では,データ駆動型リスク定量化モデルに基づく自動運転のための安全な自己進化アルゴリズムを提案する。
アルゴリズムの自己進化能力に対する過保守的安全保護ポリシーの影響を回避するため, 安全限度を調整可能な安全限度付き安全進化型決定制御統合アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:52:35 GMT)
Attractive-repulsive interaction in coupled quantum oscillators [14.4] 量子極限周期の振動から量子不均一定常状態への興味深い対称性を破る遷移が見つかる。
この遷移は、既知の対称性を破る量子同次状態から不均一な定常状態への遷移とは反対である。
注目すべきは、古典的領域に類推を持たない対称性を破る遷移に関連した絡み合いの発生である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:45:19 GMT)
How Diffusion Models Learn to Factorize and Compose [14.2] 拡散モデルは、トレーニングセットに表示されない可能性のある要素を組み合わせた、フォトリアリスティックな画像を生成することができる。
本研究では,拡散モデルが構成可能な特徴の意味的意味的・要因的表現を学習するかどうかを考察する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:59:03 GMT)
Trustworthy, Responsible, and Safe AI: A Comprehensive Architectural Framework for AI Safety with Challenges and Mitigations [14.2] AI安全性は、AIシステムの安全な採用とデプロイにおいて重要な領域である。
私たちの目標は、AI安全研究の進歩を促進し、究極的には、デジタルトランスフォーメーションに対する人々の信頼を高めることです。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:33:48 GMT)
RSTAR: Rotational Streak Artifact Reduction in 4D CBCT using Separable and Circular Convolutions [14.0] 4次元コーンビームCT(4D CBCT)は呼吸分解画像を提供し、放射線治療に用いられる。
しかし、呼吸運動を明らかにする能力は、イメージアーティファクトのコストがかかる。
本稿では,ローテーションSTreakアーチファクトリダクションに対処するために,新しい4次元ニューラルネットワークモデル RSTAR4D-Net を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:40:48 GMT)
A Two-Time-Scale Stochastic Optimization Framework with Applications in Control and Reinforcement Learning [13.9] 最適化問題の解法として,新しい2段階勾配法を提案する。
最初の貢献は、提案した2時間スケール勾配アルゴリズムの有限時間複雑性を特徴づけることである。
我々は、強化学習における勾配に基づく政策評価アルゴリズムに適用する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:16:10 GMT)
SeA: Semantic Adversarial Augmentation for Last Layer Features from Unsupervised Representation Learning [13.8] 事前訓練された深層モデルの特定の層から抽出した深部特徴は、従来の手作りの特徴よりも優れた性能を示す。
本稿では,特徴空間におけるセマンティック・アジュメンテーション(SeA)を最適化するために提案する。
提案手法は,SeAを含まないディープ機能よりも平均で2%$よい。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:55:13 GMT)
Pessimistic Off-Policy Optimization for Learning to Rank [13.7] オフ政治学習は、ポリシーをデプロイせずに最適化するためのフレームワークである。
レコメンデーションシステムでは、ログデータの不均衡のため、これは特に難しい。
我々は、ランク付け学習のための悲観的非政治最適化について研究する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:19:15 GMT)
SPICED: News Similarity Detection Dataset with Multiple Topics and Complexity Levels [13.1] 本研究では,7つのトピックを含む類似ニュースのデータセットSPICEDを提案する。
我々は,ニュース類似度検出タスクに特化して設計した4種類の複雑さを提示する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:58:22 GMT)
Temporal Fairness in Decision Making Problems [13.1] 我々は、過去の決定の歴史の公平さを考慮して、時間的視点から公平さを判断する方法に焦点をあてる。
本稿では,最適化問題として定式化された意思決定問題に時間的公正さを取り入れた3つのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:36:58 GMT)
Robust Feature Inference: A Test-time Defense Strategy using Spectral Projections [12.8] 我々はロバスト特徴推論(RFI)と呼ばれる新しいテスト時間防衛戦略を提案する。
RFIは、追加のテスト時間計算なしで既存の(ロバストな)トレーニング手順と簡単に統合できる。
RFIは、適応攻撃や転送攻撃によるロバスト性を継続的に改善することを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:54:39 GMT)
Top Score on the Wrong Exam: On Benchmarking in Machine Learning for Vulnerability Detection [12.5] 我々は、最も人気のあるML4VDデータセットにおいて、脆弱な機能と非脆弱性な機能の両方について研究する。
ほとんどすべてのケースにおいて、この決定は、それ以上の文脈なしでは行われない。
ML4VDの現在の問題ステートメントは未定義であり、この成長する作業体の内部的妥当性に疑問を呈する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:08:49 GMT)
Multi-rater Prompting for Ambiguous Medical Image Segmentation [12.5] 医用画像が複数の専門家(レーダ)によって独立して注釈付けされる場合、マルチラターアノテーションは一般的に発生する。
本稿では,これら2つの課題を完全に解決するためのマルチラッタープロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:26:56 GMT)
CSPs with Few Alien Constraints [12.3] CSP$(mathcalA cup mathcalB)$ ここで$mathcalA$は構造、$mathcalB$は異方構造である。
我々は、以前分類の試みを免れたいくつかのよく研究された問題に対して、接続を確立し、転送可能な複雑性結果を得る。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:34:13 GMT)
Uncertainty-Aware Mean Opinion Score Prediction [12.3] 平均オピニオンスコア(MOS)予測は特定の領域で大きく進歩した。
MOS予測モデルの不安定な性能は、これらのシステムの実用化における継続的な課題を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:24:40 GMT)
Multi-Treatment Multi-Task Uplift Modeling for Enhancing User Growth [12.2] マルチタスクシナリオにおける処理効果を推定するために,マルチタスク・マルチタスク(MTMT)アップリフトネットワークを提案する。
MTMTは、タスク毎の自然な応答を測定するために、ユーザの特徴と治療を符号化する。
MTMTは、ユーザエクスペリエンスを改善するために、当社のゲームプラットフォームにデプロイされています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:44:08 GMT)
Non-Homophilic Graph Pre-Training and Prompt Learning [12.0] 本稿では,好ましくないグラフに対する事前学習と迅速な学習の枠組みであるProNoGを提案する。
まず、既存のグラフ事前学習手法を分析し、事前学習タスクの選択に関する理論的知見を提供する。
第2に,各ノードが特異な非ホモフィル性を示すことを認識し,下流タスクにおけるノード固有のパターンを特徴付ける条件付きネットワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:23:53 GMT)
SpecGaussian with Latent Features: A High-quality Modeling of the View-dependent Appearance for 3D Gaussian Splatting [12.0] Lantent-SpecGSは、各3Dガウス内の普遍的な潜在神経記述子を利用するアプローチである。
2つの並列CNNは、分割された特徴マップを拡散色と特異色に分離してデコーダとして設計されている。
視点に依存するマスクが学習され、これらの2色をマージし、最終的なレンダリング画像が生成される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:25:08 GMT)
ORCHID: Streaming Threat Detection over Versioned Provenance Graphs [11.8] 本稿では,リアルタイムイベントストリーム上でプロセスレベルの脅威を詳細に検出する新しいProv-IDSであるORCHIDを提案する。
ORCHIDは、バージョン付き前処理グラフのユニークな不変特性を利用して、グラフ全体を逐次RNNモデルに反復的に埋め込む。
我々は、DARPA TCを含む4つの公開データセット上でORCHIDを評価し、ORCHIDが競合する分類性能を提供できることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:44:40 GMT)
Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach [11.8] 車両ネットワークを支えるためにはISAC技術が不可欠である。
このシナリオの通信チャネルは時間変化を示し、潜在的なターゲットは急速に移動し、二重ダイナミクスをもたらす。
制約付き強化学習を用いてISACプリコーダの動的更新を容易にすることを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:31:28 GMT)
Phi-3 Safety Post-Training: Aligning Language Models with a "Break-Fix" Cycle [11.6] 本稿では,Phi-3シリーズの言語モデルの安全性向上のための手法を提案する。
サイクルを利用して、複数のデータセットキュレーション、安全後のトレーニング、ベンチマーク、レッドチーム、脆弱性識別を実行します。
結果は、このアプローチが幅広いAIベンチマークでPhi-3モデルの性能を反復的に改善したことを示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:04:31 GMT)
Dynamic Label Adversarial Training for Deep Learning Robustness Against Adversarial Attacks [11.4] 対人訓練は、モデルの堅牢性を高める最も効果的な方法の1つである。
従来のアプローチでは、主に敵の訓練に静的接地真理を用いるが、しばしば強固なオーバーフィッティングを引き起こす。
本稿では,動的ラベル対逆トレーニング(DYNAT)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:25:12 GMT)
Predicting Affective States from Screen Text Sentiment [11.4] スマートフォンで見るテキストコンテンツを分析して感情状態を予測する可能性については、まだ解明されていない。
画面テキストと感情状態の関係を解析するために,線形回帰,ゼロショット,マルチショットを用いた。
以上の結果から,マルチショットプロンプトは線形回帰とゼロショットプロンプトの両方で著しく優れていた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:25:11 GMT)
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering [11.2] 現実世界のデータセットは、大きな属性と複雑な値の配列を特徴とすることが多い。
従来の手法ではデータセットのサイズと複雑さをLarge Language Modelsに完全にリレーすることはできません。
入力テーブル上でFTS(Full-Text Search)を利用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:11:09 GMT)
HGNAS: Hardware-Aware Graph Neural Architecture Search for Edge Devices [11.2] 本研究は,リソース制約エッジデバイス,すなわちHGNASに適した,ハードウェア対応の新たなグラフニューラルネットワーク探索フレームワークを提案する。
HGNASは効率的なGNNハードウェア性能予測器を統合し、ミリ秒でGNNのレイテンシとピークメモリ使用率を評価する。
ModelNet40のDGCNNと比較して、最大10.6倍のスピードアップと82.5%のピークメモリ削減を実現している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:11:22 GMT)
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding [11.0] LLM(Large Language Models)は、長いコンテキストのアプリケーションで広く使われるようになった。
投機的復号法(SD)は、性能を犠牲にすることなくレイテンシを低減する手法として広く用いられている。
我々は,中間列から長列の高スループット推論方式であっても,驚くほどSDが高速化可能であることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:54:34 GMT)
BiGS: Bidirectional Gaussian Primitives for Relightable 3D Gaussian Splatting [10.9] 本稿では、画像に基づく新規ビュー合成技術である双方向ガウスプリミティブについて述べる。
提案手法はガウススプラッティングフレームワークに光の内在分解を取り入れ,3次元物体のリアルタイムリライティングを可能にする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:04:40 GMT)
DrugAgent: Explainable Drug Repurposing Agent with Large Language Model-based Reasoning [10.5] 本稿では,最先端の機械学習技術と知識統合を用いた医薬品再調達プロセスを強化するためのマルチエージェントフレームワークを提案する。
AIエージェントは、DTIモデルを訓練し、知識グラフエージェントはDGIdbを使用してDTIを系統的に抽出する。
これらのエージェントからの出力を統合することで、外部データベースを含む多様なデータソースを効果的に活用し、実行可能な再資源化候補を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:24:59 GMT)
Reproduction of scan B-statistic for kernel change-point detection algorithm [10.5] 変化点検出は、幅広い応用のために大きな注目を集めている。
本稿では,カーネルベースの効率的なスキャンB統計に基づくオンライン変更点検出アルゴリズムを最近提案した。
数値実験により, 走査型B統計が常に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:12:31 GMT)
Reproduction of IVFS algorithm for high-dimensional topology preservation feature selection [10.5] IVFSはランダムサブセット法にインスパイアされ、トポロジカルな構造を維持することによってデータの類似性を保っている。
我々は,IVFSの数学的基礎を体系的に整理し,数値実験によりその有効性を検証する。
その結果、IVFSは多くのデータセットにおいてSPECとMCFSよりも優れており、収束と安定性の問題が持続していることがわかった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:08:38 GMT)
Gait Patterns as Biomarkers: A Video-Based Approach for Classifying Scoliosis [10.3] スコリオーシスは、特に青年期において重要な診断上の課題を呈する。
従来の診断と追跡方法は、臨床専門知識と放射線曝露のリスクのために限界に直面している。
歩行分析を用いた新しいビデオベース非侵襲的スコリオーシス分類法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:09:55 GMT)
Accelerated Markov Chain Monte Carlo Using Adaptive Weighting Scheme [10.3] 本研究では,各潜伏変数を非一様に選択するランダムスキャンギブスサンプリング法が,対象の後方分布を不変に残すことを示す。
特に、選択確率の関数として目的を構築し、制約付き最適化問題を解く。
アルゴリズムは,その限界確率に応じて変数更新を選択することでマルコフ連鎖の混合時間を高めるという単純な直観に依存している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:45:32 GMT)
Recent Advances in Generative AI and Large Language Models: Current Status, Challenges, and Perspectives [10.2] 生成人工知能(AI)と大規模言語モデル(LLM)の出現は、自然言語処理(NLP)の新しい時代を象徴している。
本稿では,これらの最先端技術の現状を概観し,その顕著な進歩と広範囲な応用を実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:14:21 GMT)
Systematic Evaluation of LLM-as-a-Judge in LLM Alignment Tasks: Explainable Metrics and Diverse Prompt Templates [10.1] GPT-4のような商用の大規模言語モデル(LLM)は、近年、異なるアライメントアプローチの評価と比較に使われている。
LLM審査員の信頼性とアライメントを評価・比較・可視化する枠組みを開発した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:49:01 GMT)
Causal machine learning for sustainable agroecosystems [10.1] 予測機械学習(ML)は、収量予測や天気予報といった応用のために持続可能な農業に活用されている。
本稿では,MLのデータ処理と因果関係を融合した因果関係MLを提案する。
農家、政策立案者、研究者など、アグリフードチェーン全体の利害関係者に利益をもたらす8つの多様なアプリケーションを通じて因果MLを紹介します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:25:50 GMT)
Real-time goal recognition using approximations in Euclidean space [10.0] 本研究では,個別領域における各目標に対するプランナーへの1回の呼び出し,あるいは連続領域における計算負担を軽減する簡易な動作モデルのいずれかに依存する,効率的なゴール認識手法を開発する。
結果として得られたアプローチは、現在の最先端技術よりもはるかに高速な認識順序のオンラインコンポーネントを実行し、サブ秒単位の認識を必要とするロボティクスアプリケーションに効果的に使用できる最初のオンライン手法となった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:22:59 GMT)
Reconstruction-based Multi-Normal Prototypes Learning for Weakly Supervised Anomaly Detection [9.5] 異常検出は様々な領域において重要な課題である。
既存の手法のほとんどは、単一の中央プロトタイプを中心とした通常のサンプルデータクラスタを前提としています。
本稿では,再構成に基づく多正規プロトタイプ学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:27:58 GMT)
ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models [9.4] 本稿では,新しい任意のビット量子化アルゴリズムと推論フレームワークであるABQ-LLMを紹介する。
様々な量子化設定において優れた性能を実現し、GPU上で効率的な任意の精度の量子化推論を可能にする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:09:08 GMT)
EMAG: Ego-motion Aware and Generalizable 2D Hand Forecasting from Egocentric Videos [9.3] 2次元手の位置を予測するための既存の手法は視覚的表現に依存しており、主に手動物体の相互作用に焦点を当てている。
本研究では,エゴモーション認識と一般化可能な2次元手指予測手法であるEMAGを提案する。
本モデルでは,従来手法よりも1.7%,7.0%性能が向上した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:55:54 GMT)
When Diffusion MRI Meets Diffusion Model: A Novel Deep Generative Model for Diffusion MRI Generation [9.3] 深部拡散モデルを用いたdMRI生成のための新しい生成手法を提案する。
勾配情報と脳構造を保存する高次元(4D)と高解像度のデータを生成することができる。
提案手法は,現在の最先端手法と比較して,dMRI画像の生成性能が向上していることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:03:15 GMT)
CMA-ES for Discrete and Mixed-Variable Optimization on Sets of Points [9.1] 本稿では,点集合の最適化に焦点をあて,共分散行列適応進化戦略(CMA-ES)を拡張した最適化手法を提案する。
CMA-ES-SoPは、隣接点の生成確率を維持するマージン補正を組み込んで、特定の非最適点への早めの収束を防ぐ。
数値シミュレーションにより、CMA-ES-SoPは点集合の最適化に成功し、単純CMA-ESは初期収束のために最適化に失敗した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:10:06 GMT)
Online Zero-Shot Classification with CLIP [9.1] オンラインゼロショット転送のシナリオについて検討し、各画像がランダムな順序で分類され、1回だけ訪れて予測を得る。
バニラゼロショットの分類と比較すると、提案フレームワークはオンラインサービスに対する柔軟性を保っている。
オンラインゼロショット転送方式(OnZeta)は,データセット全体にアクセスすることなく,ImageNet上で78.94%の精度を実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:12:12 GMT)
Extraction of Typical Operating Scenarios of New Power System Based on Deep Time Series Aggregation [9.1] 典型的な運用シナリオの抽出は、新しい電源システムのディスパッチにおいて柔軟な決定を行う上で不可欠である。
本研究では、典型的な運用シナリオを生成するための新しいディープ時系列アグリゲーションスキーム(DTSA)を提案する。
ケーススタディでは,提案手法が新たな微粒化電力系統分割方式を抽出し,最新のハイスクリーン機能法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:39:25 GMT)
Classifier-Free Guidance is a Predictor-Corrector [9.0] CFGはテキスト・画像拡散モデルにおける条件付きサンプリングの主要な手法である。
我々は、CFGがDDPMやDDIMと異なる相互作用を示すことで、一般的な誤解を解消する。
SDE の極限では、CFG は実際に条件分布の DDIM 予測器とガンマ動力分布のランゲヴィン力学補正器とを結合していることを証明している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:21:35 GMT)
T3M: Text Guided 3D Human Motion Synthesis from Speech [8.9] 音声駆動の3Dモーション合成は、人間の音声に基づくライフライクなアニメーションを作ろうとしている。
既存のアプローチは音声のみに応答して動作生成を行い、不正確で非フレキシブルな合成結果をもたらす。
テキスト誘導型3次元人体動作合成法「textitT3M」について述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:37:26 GMT)
Resilience through Scene Context in Visual Referring Expression Generation [8.9] 画像中のオブジェクトに対する参照表現生成(REG)におけるコンテキストの役割について検討する。
我々は、REGにおけるシーンコンテキストに関する新たな視点を捉え、REGモデルをより弾力性のあるものにするためのリソースとして、コンテキスト情報が考えられることを仮定する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:58:12 GMT)
FLoD: Integrating Flexible Level of Detail into 3D Gaussian Splatting for Customizable Rendering [8.8] 3D Gaussian Splatting (3DGS) は多数の小さなガウスを用いて高速かつ高品質なレンダリングを実現する。
この多数のガウスモデルへの依存は、メモリ制限のため、低コストデバイスへの3DGSベースのモデルの適用を制限する。
本稿では,FLoD(Flexible Level of Detail)を3DGSに統合し,ハードウェアの能力に応じて,シーンを様々な詳細レベルでレンダリングできるようにする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:56:25 GMT)
iMTSP: Solving Min-Max Multiple Traveling Salesman Problem with Imperative Learning [8.7] MTSP(Min-Max Multiple Traveling Salesman)問題の検討
目標は、最長ツアーの長さを最小化しながら、各エージェントが一括してすべての都市を訪れるツアーを見つけることである。
我々は、命令型MTSP(iMTSP)と呼ばれる、新しい自己教師型双方向エンドツーエンド学習フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:02:34 GMT)
Functional Tensor Decompositions for Physics-Informed Neural Networks [8.7] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)の近似において連続的かつ増加する公約を示した。
本稿では,古典変数分離法を一般化したPINNバージョンを提案する。
提案手法は,複雑な高次元PDEの性能向上により,PINNの性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:24:43 GMT)
Transientangelo: Few-Viewpoint Surface Reconstruction Using Single-Photon Lidar [8.5] ライダーは、ターゲットに光のパルスを放出し、反射光の光速遅延を記録することで、3Dシーンの幾何学を捉えている。
従来のライダーシステムは、後方散乱光の生で捕獲された波形を出力しない。
我々は,光子ノイズに対するロバスト性を向上させる新しい正則化戦略を開発し,画素あたり10光子程度で正確な表面再構成を可能にする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:26:36 GMT)
Rational Sensibility: LLM Enhanced Empathetic Response Generation Guided by Self-presentation Theory [8.4] LLM(Large Language Models)の開発は、人間中心の人工知能(AGI)に希望の光を与えている。
共感は人間にとって重要な感情的属性として機能し、人間中心のAGIにおいて不定の役割を果たす。
本稿では,社会学における自己表現理論にインスパイアされた革新的なエンコーダモジュールを設計する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:03:13 GMT)
Memory-Efficient LLM Training with Online Subspace Descent [8.4] 特異値分解を伴わない新しいサブスペース降下系である Online Subspace Descent を提案する。
Online Subspace Descentは柔軟性があり、トレーニングに最小限のオーバーヘッドしか導入しない。
C4データセット上の60Mから7BパラメータのLLaMAモデルを事前学習するタスクにおいて、オンラインサブスペースDescentは低いパープレキシティと下流タスクのパフォーマンス向上を実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:54:53 GMT)
Unleashing the Potential of SAM2 for Biomedical Images and Videos: A Survey [8.2] Segment Anything Model (SAM) は、プロンプト駆動のパラダイムをイメージセグメンテーションの領域に拡張したことを示す。
最近のSAM2の導入は、オリジナルのSAMをストリーミング方式に効果的に拡張し、ビデオセグメンテーションにおいて強力なパフォーマンスを示す。
本稿では,SAM2をバイオメディカル画像やビデオに適用するための最近の取り組みの概要について述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:51:10 GMT)
Multi-modal Intermediate Feature Interaction AutoEncoder for Overall Survival Prediction of Esophageal Squamous Cell Cancer [8.2] 本稿では,ESCCの生存率を予測するための,新しいオートエンコーダに基づくディープラーニングモデルを提案する。
マルチモーダルな予後関連機能強化とモデリング能力向上のための2つの新しいモジュールが設計された。
本モデルでは, 識別能力, リスク階層化, 提案モジュールの有効性の観点から, 良好な結果が得られる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:11:05 GMT)
QuCLEAR: Clifford Extraction and Absorption for Significant Reduction in Quantum Circuit Size [8.0] 現在利用可能な量子デバイスは、実行された量子回路の忠実さを低下させるノイズの多い量子ゲートに悩まされている。
本稿では,量子回路の最適化を目的としたコンパイルフレームワークQuCLEARを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:03:57 GMT)
FLrce: Resource-Efficient Federated Learning with Early-Stopping Strategy [8.0] フェデレートラーニング(FL)がIoT(Internet of Things)で大人気
FLrceは、関係ベースのクライアント選択と早期停止戦略を備えた効率的なFLフレームワークである。
その結果,既存のFLフレームワークと比較してFLrceは計算効率を少なくとも30%,通信効率を43%向上させることがわかった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:44:23 GMT)
O-Mamba: O-shape State-Space Model for Underwater Image Enhancement [7.9] マンバ法は画像強調タスクにおいて有望な結果を得た。
O-mamba は O-shaped dual-branch network を用いて、空間情報とチャネル間情報を個別にモデル化する。
ブランチ内でのマルチスケール情報の融合のためのMS-MoE,ブランチ間の空間情報とチャネル情報の相互作用のための相互促進モジュール,循環型マルチスケール最適化戦略。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:33:33 GMT)
MAML MOT: Multiple Object Tracking based on Meta-Learning [7.9] MAML MOTは、マルチオブジェクト追跡のためのメタラーニングベースのトレーニングアプローチである。
マルチオブジェクト追跡のためのメタラーニングに基づくトレーニング手法であるMAML MOTを紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:23:56 GMT)
Towards Weaknesses and Attack Patterns Prediction for IoT Devices [7.7] 本稿では,IoTデバイスの事前デプロイセキュリティチェックを容易にするための費用効率のよいプラットフォームを提案する。
このプラットフォームでは、双方向長短メモリ(Bidirectional Long Short-Term Memory, Bi-LSTM)ネットワークを使用して、デバイス関連のテキストデータを分析し、弱点を予測する。
同時に、グラディエントブースティングマシン(GBM)モデルは、これらの弱点を悪用する可能性のある攻撃パターンを予測する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:43:51 GMT)
Abductive Reasoning in a Paraconsistent Framework [7.5] 有名なベルナップ・ダンパラ一貫性の4値論理の2つの拡張を考える。
古典命題論理では、$mathsfBD_circ$ と $mathsfBD_triangle$ で abduction を減らす方法を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:05:17 GMT)
Measuring Code Efficiency Optimization Capabilities with ACEOB [7.4] モデルトレーニングデータセットの「コードパターン」を詳細に分析し、人間の手書きコードを慎重に探索する。
95,359組の効率非効率コードからなる自動コード効率最適化ベンチマーク(ACEOB)を導入する。
私たちの知る限り、ACEOBはPythonコードの効率最適化に特化した最初のデータセットです。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:10:37 GMT)
Low-light phase retrieval with implicit generative priors [7.4] 低放射線線量イメージングは放射線感受性試料の応用に不可欠である。
光データ取得装置の最近の進歩は、低線量撮像の可能性を示唆している。
単一画像の低線量位相探索に対処するために,低線量深度画像前処理(LoDIP)を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:11:31 GMT)
QD-VMR: Query Debiasing with Contextual Understanding Enhancement for Video Moment Retrieval [7.3] Video Moment Retrieval (VMR) は、クエリに対応する未トリミングビデオの関連モーメントを検索することを目的としている。
本稿では,文脈理解度を高めたクエリデバイアスモデルであるQD-VMRを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:56:42 GMT)
Self-Organization in Computation & Chemistry: Return to AlChemy [7.3] 1990年代、Walter Fontana と Leo Buss は $lambda$ として知られる公式な計算モデルに基づく新しいモデリング手法を提案した。
ここでは、この古典的なモデルであるAlChemyを再考する。
複雑で安定した組織は、以前予想されていたよりも頻繁に出現し、これらの組織は、自明な固定点への崩壊に対して堅牢であるが、これらの安定した組織は、より高次のエンティティに簡単に統合できない。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:26:16 GMT)
Adaptive Backtracking For Faster Optimization [7.1] そこで本研究では,通常のバックトラックに使用される定数係数であるステップサイズを調整する新しい手法を提案する。
適応的なバックトラックは、実行可能なステップサイズを生成するために、調整を少なくする必要があることを証明します。
15以上の実世界のデータセットに関するすべての実験は、適応的なバックトラックがしばしば大幅に高速な最適化をもたらすことを確認している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:16:57 GMT)
Semi-Supervised Variational Adversarial Active Learning via Learning to Rank and Agreement-Based Pseudo Labeling [6.8] アクティブラーニングは、ラベルなしサンプルの選択を自動化することで、データラベリングに関わる労力を軽減することを目的としている。
トレーニング中に大量のラベルのないデータの使用を大幅に改善する新しい手法を導入する。
様々な画像分類およびセグメンテーションベンチマークデータセットにおける技術状況に対するアプローチの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:35:07 GMT)
NAS-Cap: Deep-Learning Driven 3-D Capacitance Extraction with Neural Architecture Search and Data Augmentation [6.8] CNNベースのキャパシタンスモデル(CNN-Cap)は、フィールドソルバよりもはるかに低コストで正確な結果を得るために提案されている。
異なる設計によるデータセットの実験により、得られたNAS-CapモデルがCNN-Capよりも驚くほど高い精度を達成することが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:25:33 GMT)
Enhancing Training Efficiency Using Packing with Flash Attention [6.7] Hugging Face SFTトレーナーは、パッキングを使って複数のトレーニング例を組み合わせるオプションを常に提供してきた。
これまでのところ、各満員のトレーニング例の適切なマスキングは提供されなかった。
この機能はHugging Face Transformers 4.44に追加された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:11:05 GMT)
Evaluation of quantum Fisher information for large system [6.7] 量子フィッシャー情報(QFI)は、量子精度の測定、量子情報、多体物理学、その他の領域において重要な役割を果たす。
本稿では,補助システムに情報を転送し,そのサブQFIを測定することで,高次元システムのQFIを評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:50:52 GMT)
EWMoE: An effective model for global weather forecasting with mixture-of-experts [6.7] 本研究では,地球規模の天気予報に有効なモデルであるEWMoEを提案する。
本モデルは,3次元絶対位置埋め込み,Mixture-of-Experts層,および2つの特定の損失関数の3つの重要な要素を組み込んで予測精度を向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:30:55 GMT)
Find the Assembly Mistakes: Error Segmentation for Industrial Applications [6.7] 我々は,(正しい)意図したアセンブリ状態とテストイメージの差を検出することによって,アセンブリエラーをローカライズするStateDiffNetを提案する。
提案手法は,実際のエゴ中心のビデオデータから得られたアセンブリエラーを,トレーニング中に提示されない状態とエラータイプの両方に対して正しくローカライズする手法である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:51:55 GMT)
AI Reliance and Decision Quality: Fundamentals, Interdependence, and the Effects of Interventions [6.4] 私たちは、AIによる意思決定に関する現在の文献で、信頼と意思決定品質が不適切に混ざり合っていると論じています。
我々の研究は、AIによる意思決定における信頼行動と意思決定品質の区別の重要性を強調している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:06:01 GMT)
A Note on Randomized Kaczmarz Algorithm for Solving Doubly-Noisy Linear Systems [6.3] 大規模線形システムである$Ax=b$は、実際にしばしば発生し、効果的な反復解法を必要とする。
本稿では,雑音系に対するランダム化Kaczmarzアルゴリズムの収束性について解析する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:15:29 GMT)
Code Ownership: The Principles, Differences, and Their Associations with Software Quality [6.1] 本稿では,開発者の集合,コードオーナシップの近似値,専門性レベルの観点から,一般的に使用されているオーナシップの近似の相違について検討する。
コミットベースのオーナシップとラインベースのオーナシップの近似は、さまざまな開発者のセット、コードのオーナシップの値、さまざまな主要な開発者のセットを生成します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:01:59 GMT)
LalaEval: A Holistic Human Evaluation Framework for Domain-Specific Large Language Models [6.0] LalaEvalは、特定のドメイン内で標準化された人間の評価を行うための体系的な方法論を提供することによって、重要な研究ギャップを埋めることを目指している。
本稿では,ロジスティクス業界におけるフレームワークの適用例を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:12:45 GMT)
Optical ISAC: Fundamental Performance Limits and Transceiver Design [6.0] 本稿では,単一入力単出力通信を用いた光ポイントツーポイント(P2P)システムにおける最適容量歪み(C-D)トレードオフを特徴付ける。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:14:36 GMT)
On the Robustness of Kernel Goodness-of-Fit Tests [6.0] 既存のカーネル良性テストは、ロバスト性という一般的な概念により堅牢ではないことを示す。
本稿では,このオープンな問題をカーネルStein離散性球を用いて解決する,最初の堅牢なカーネル善良性テストを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:32:33 GMT)
Abductive and Contrastive Explanations for Scoring Rules in Voting [5.9] 我々は、ルールの採点のための帰納的および対照的な説明を計算するためのアルゴリズムを設計する。
ボルダの法則では、最小の導出的説明の大きさの低い境界を求める。
選好プロファイルの特性と最小誘引的説明の大きさの相関関係をシミュレーションにより同定する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:12:58 GMT)
Linear Combinations of Patches are Unreasonably Effective for Single-Image Denoising [5.9] ディープニューラルネットワークは、画像のノイズ化に革命を起こし、大幅な精度向上を実現している。
画像先行を外部から学習する必要性を軽減するため、入力ノイズ画像の分析のみに基づいて、単画像方式で復調を行う。
本研究は, この制約下でのデノナイズのためのパッチの線形結合の有効性について検討する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:25:39 GMT)
Generative Blockchain: Transforming Blockchain from Transaction Recording to Transaction Generation through Proof-of-Merit [5.8] 生成ブロックチェーンは、トランザクション生成と記録を組み合わせることで、従来のブロックチェーン技術を変革することを目指している。
私たちのデザインの中心は、新しいコンセンサスメカニズムであるProof-of-Merit(PoM)である。
我々は、複雑なトランザクション生成問題を解決するタスクが独立した問題解決者のプールに委譲される、オンデマンドプラットフォーム上でPoMを実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:51:10 GMT)
An Overview on Machine Learning Methods for Partial Differential Equations: from Physics Informed Neural Networks to Deep Operator Learning [5.8] 数値アルゴリズムによる偏微分方程式の解の近似は、応用数学における中心的なトピックである。
近年多くの注目を集めている手法の1つは、機械学習に基づく手法である。
本稿では,これらの手法の紹介と,それらに基づく数学的理論について述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:57:34 GMT)
Robust Predictions with Ambiguous Time Delays: A Bootstrap Strategy [5.7] Time Series Model Bootstrap (TSMB) は、時系列モデリングにおいて潜在的に変動または非決定論的な時間遅延を処理するために設計された汎用的なフレームワークである。
TSMBはトレーニングされたモデルの性能を大幅に向上させ、このフレームワークを使って予測する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:38:20 GMT)
LIMP: Large Language Model Enhanced Intent-aware Mobility Prediction [5.7] 本稿では,新しい LIMP (LLMs for Intent-ware Mobility Prediction) フレームワークを提案する。
具体的には、LIMPは「Analyze-Abstract-Infer」(A2I)エージェントワークフローを導入し、移動意図推論のためのLLMの常識推論力を解き放つ。
実世界の2つのデータセット上でLIMPを評価し,次の位置予測における精度の向上と効果的な意図推定を行った。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:28:56 GMT)
State-of-the-Art Fails in the Art of Damage Detection [5.7] 教師付きトレーニングの後にも、機械学習モデルは損傷の場所を予測できないことを示す。
各種アナログメディアにおける損傷検出のためのデータセットであるDamBenchを紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:03:07 GMT)
RIFF: Inducing Rules for Fraud Detection from Decision Trees [5.6] 本稿では,決定木から直接設定した低偽陽性率ルールを蒸留するルール誘導アルゴリズムRIFFを提案する。
提案実験により,FPRの低いタスクに対して,誘導ルールが元のモデルの性能を維持・改善できることがよく示されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:14:20 GMT)
Focused Discriminative Training For Streaming CTC-Trained Automatic Speech Recognition Models [5.6] 本稿では,ストリーム語片エンドツーエンド(E2E)自動音声認識(ASR)モデルを改善するために,FDT(Focused Discriminative Training)と呼ばれる新たなトレーニングフレームワークを提案する。
提案手法は,音声の難解なセグメントに対するモデルの認識を識別し,改善するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:54:25 GMT)
Physics-Inspired Generative Models in Medical Imaging: A Review [5.5] 物理にインスパイアされた生成モデル(GM)はベイジアン法を強化し、医用画像における優れた有用性を約束する。
画像再構成、画像生成、画像解析を含む医用画像における物理にインスパイアされたGMの主な応用について述べる。
将来の研究の方向性には、物理学にインスパイアされたGMの統合、ビジョン・ランゲージ・モデル(VLM)の統合、GMの新たな応用の可能性などが含まれる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:13:19 GMT)
Accurate Explanation Model for Image Classifiers using Class Association Embedding [5.4] 本稿では,グローバルな知識とローカルな知識の利点を組み合わせた生成的説明モデルを提案する。
クラスアソシエーション埋め込み(CAE)は、各サンプルを1組のクラス関連コードと個別コードにエンコードする。
クラス関連特徴を個々の特徴から効率的に分離するビルディングブロック・コヒーレンシー特徴抽出アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:07:57 GMT)
Personhood credentials: Artificial intelligence and the value of privacy-preserving tools to distinguish who is real online [5.4] 悪質な俳優は長い間、不正行為、偽情報拡散、その他の偽装的なスキームの実行に誤解を招くアイデンティティを使用してきた。
ますます有能なAIの出現により、悪いアクターは彼らの活動の潜在的な規模と効果を増幅することができる。
我々は、この課題に対処する新しいツールの価値を分析する:「個人認証」(PHC)。
PHCは、ユーザーに対して、個人情報を開示することなく、実際の人間(AIではなく)をオンラインサービスに示すことを可能にする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:38:34 GMT)
Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification [5.3] ピクセルワイドラベルを用いたセマンティックセグメンテーションデータセットにおけるラベル誤り検出手法を初めて提案する。
提案手法では,誤検出回数を制御しながら,ラベルエラーの大部分を検出することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:47:25 GMT)
On the design of scalable, high-precision spherical-radial Fourier features [5.2] 我々は、その等方性を利用して高次元のガウス測度を正確に近似する新しい二次規則の族を導入する。
従来の研究と比較して,本手法は近似誤差を徹底的に解析し,ラジアル成分と球面成分の両方に対する自然な選択を示唆している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:11:25 GMT)
Enhancing Knowledge Tracing with Concept Map and Response Disentanglement [5.2] 本稿では,知識追跡(CRKT)モデルを強化するための概念マップ駆動型応答不整合法を提案する。
CRKTは、答えの選択を直接活用することでKTに恩恵を与える。
さらに,不整合表現を用いて,学生が選択しない選択肢から洞察を得るアンチョセン応答の新規利用について紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:25:56 GMT)
Causally-Aware Spatio-Temporal Multi-Graph Convolution Network for Accurate and Reliable Traffic Prediction [5.2] 本研究は,高精度かつ信頼性の高い予測を行うための高度な深層学習モデルを実証するために,時間的問題-トラヒック予測の事例に焦点を当てた。
本稿では,3つの主要コンポーネントを有効活用し,高精度かつ信頼性の高いトラフィック予測を行う,エンドツーエンドのトラフィック予測フレームワークを提案する。
2つの実世界の交通データセットの実験結果から,この手法は予測精度においていくつかの最先端モデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:35:54 GMT)
SEQ+MD: Learning Multi-Task as a SEQuence with Multi-Distribution Data [5.1] マルチタスク学習(MTL)のための逐次学習と,マルチディストリビューション入力のための特徴生成領域マスクを統合したSEQ+MDフレームワークを提案する。
クリック性能を中立に保ちながら、付加品と購入を含む高価値エンゲージメントの増大を示す。
我々のマルチリージョン学習モジュールは"plug-and-play"であり、他のMTLアプリケーションに容易に適応できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:14:27 GMT)
Multi-feature Compensatory Motion Analysis for Reaching Motions Over a Discretely Sampled Workspace [5.0] 上肢補綴における手首などの機能的腕関節の欠如は、補償運動を引き起こす。
この研究は、個別にサンプリングされた7*7 2Dグリッドに到達した被験者の最終ポーズにおける補償運動を分析した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:39:08 GMT)
Latent Space Disentanglement in Diffusion Transformers Enables Zero-shot Fine-grained Semantic Editing [4.9] Diffusion Transformer (DiTs) は多種多様な高品質のテキスト・トゥ・イメージ(T2I)生成において顕著な成功を収めた。
テキストと画像の潜伏者が、生成した画像のセマンティクスに、個々と共同でどのように貢献するかを検討する。
ゼロショットきめ細かい画像編集のための簡易かつ効果的な抽出マニピュレーション・サンプル・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:00:52 GMT)
Avatar Visual Similarity for Social HCI: Increasing Self-Awareness [4.9] 鏡やビデオ記録による自己認識の増大は、対面訓練において一般的である。
しかし,仮想アバターを用いた仮想トレーニングでは,自己認識の増大がほとんど検討されていない。
本稿では,仮想トレーニング環境におけるアバターの視覚的類似性と自己認識の増大との関係について検討する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:11:35 GMT)
DeepDelveAI: Identifying AI Related Documents in Large Scale Literature Data [4.9] データセットは、バイナリ分類タスクに基づいてトレーニングされた高度なLong Short-Term Memory(LSTM)モデルを使用して作成された。
モデルはトレーニングされ、膨大なデータセットで検証され、高精度、精度、リコール、F1スコアが達成された。
結果として得られたDeepDelveAIデータセットは、1956年から2024年までのダートマス会議以来、940万以上のAI関連論文で構成されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:05:12 GMT)
Two infinite families of facets of the holographic entropy cone [4.9] 我々は、最近証明されたホログラフィックエントロピーの不等式の無限族が極大にきついこと、すなわち、ホログラフィックエントロピー円錐の対称性面であることを検証する。
星グラフ上では、両方の不等式族は、サブシステムに作用する二面体に対して、情報の集中/拡散の程度を定量化する。
さらに、K-基底に見られるトーリック不等式は、四者と六者完全テンソルの間の興味深い相互作用を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:04:00 GMT)
UMERegRobust -- Universal Manifold Embedding Compatible Features for Robust Point Cloud Registration [4.8] 我々は、剛性変換を推定するために、ユニバーサルマニフォールド埋め込み(UME)フレームワークを採用する。
独自のUMEコントラスト損失とサンプリング等化器を付加したUME互換特徴抽出手法を導入することで、UMEフレームワークを拡張した。
本稿では,大規模な回転を含むシナリオの登録方法を評価するために,Rot KITTIベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:48:02 GMT)
Exploring Multi-modal Neural Scene Representations With Applications on Thermal Imaging [4.8] 我々は、RGB以外の2次モードをNeRFに組み込むための4つの戦略を提案する。
放射能の点でRGBと大きく異なるため,熱画像は第2のモダリティとして選択した。
以上の結果から,第2分枝をNeRFに付加することは熱画像の新規なビュー合成に最適であり,かつRGBに有意な結果をもたらすことが判明した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:40:59 GMT)
Distillation Contrastive Decoding: Improving LLMs Reasoning with Contrastive Decoding and Distillation [4.6] 本稿では,大規模言語モデル (LLM) の推論能力を高めるため,DCD (Distillation Contrastive Decoding) という簡単な手法を提案する。
DCDは、DropoutやQuantizationなど、Contrastive Chain-of- Thought Promptingと高度な蒸留技術を採用している。
評価の結果,DCD は様々な推論ベンチマークにおいて LLM 性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:31:42 GMT)
Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack [4.6] 顔の偽造防止アルゴリズムは、プレゼンテーション攻撃に対する顔認識システムの堅牢な展開において重要な役割を果たす。
我々は5種類のマスクを用いて、顔の下部を様々なカバー領域で覆っている。
また、顔の上部を覆う様々な種類の眼鏡も使用しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:48:22 GMT)
BERT-ASC: Auxiliary-Sentence Construction for Implicit Aspect Learning in Sentiment Analysis [4.5] 本稿ではアスペクト分類とアスペクトベース感情サブタスクに対処する統合フレームワークを提案する。
コーパスのセマンティック情報を用いて暗黙的側面のための補助文を構築する機構を導入する。
次に、BERTはアスペクト自体ではなく、この補助文に応答してアスペクト固有の表現を学ぶことを推奨する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:46:00 GMT)
Ancient Wisdom, Modern Tools: Exploring Retrieval-Augmented LLMs for Ancient Indian Philosophy [4.5] 標準の非RAG LLMに対してRAGモデルを開発・ベンチマークする。
人間による評価では、RAGモデルは、事実および包括的応答を生成する上で、標準モデルよりも著しく優れていた。
本研究は,現代の大規模言語モデルと古代の知識システムとを効果的に統合するための知見を提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:15:39 GMT)
Identifying Crucial Objects in Blind and Low-Vision Individuals' Navigation [4.4] 本稿では,視覚障害者と低視野者(BLV)のナビゲーションに不可欠な90個の物体のキュレートしたリストを示す。
BLVの個人が様々な設定をナビゲートした21の公開ビデオを分析して、初期リストを作成する。
その後の分析では、最近のコンピュータビジョンモデルのトレーニングに使われているほとんどの現代のデータセットは、提案したリストにあるオブジェクトの小さなサブセットしか含まないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:50:50 GMT)
Collaborative Control for Geometry-Conditioned PBR Image Generation [4.4] 我々は、RGB生成における測光不正確さを回避し、直接PBR画像分布をモデル化することを提案する。
我々は、新しいネットワーク間通信パラダイムを用いて、凍結したRGBモデルに強く結びついている新しいPBRモデルを訓練する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:19:54 GMT)
A Review of Nine Physics Engines for Reinforcement Learning Research [4.4] Reviewは、強化学習(RL)のためのシミュレートされた物理環境を作成するためのツールの選択を研究者に指導することを目的とする。
人気、機能範囲、品質、ユーザビリティ、RL機能に基づいて9つのフレームワークを評価する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:16:52 GMT)
Improved Recursive QAOA for Solving MAX-CUT on Bipartite Graphs [4.4] 両部グラフ上のMAX-CUT問題の解法におけるレベル1QAOAの性能限界を解析的に証明する。
レベル1再帰QAOA(RQAOA)を用いて同じ問題を解く数値結果を通して示す。
本稿では,QAOAに最適化されたパラメータ構造を削減したRQAOAを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:35:47 GMT)
Growing Deep Neural Network Considering with Similarity between Neurons [4.3] 我々は、訓練段階におけるコンパクトモデルにおいて、ニューロン数を漸進的に増加させる新しいアプローチを探求する。
本稿では,ニューロン類似性分布に基づく制約を導入することにより,特徴抽出バイアスと神経冗長性を低減する手法を提案する。
CIFAR-10とCIFAR-100データセットの結果、精度が向上した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:16:37 GMT)
Accuracy Improvement of Cell Image Segmentation Using Feedback Former [4.3] トランスフォーマーは、詳細な情報よりも文脈情報に焦点を当てる傾向がある。
本稿では,トランスフォーマーをエンコーダとして使用し,フィードバック処理機構を備えたセマンティックセマンティックセマンティクスアーキテクチャを提案する。
提案手法は,従来のフィードバック手法よりも計算コストを低減しつつ,高いセグメンテーション精度を実現した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:48:03 GMT)
Large Language Models are Zero-Shot Next Location Predictors [4.3] 大規模言語モデル(LLM)は、優れた一般化と推論能力を示している。
LLMは最大36.2%の精度を得ることができ、人間の移動性に特化して設計された他のモデルに比べて640%近く改善されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:24:22 GMT)
IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities [4.3] マルチモーダル大言語モデル(MLLM)のための内適応アーキテクチャを導入する。
このアーキテクチャは、大きな言語モデル内の様々な深さで複数のマルチモーダルアダプタを組み込んで、テキスト指向のトランスフォーマー層との直接の相互作用を容易にする。
大規模な整列データを必要とする従来のフリーズ言語モデルとは異なり、提案アーキテクチャは小規模データセットにおいて優れた性能を実現することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:10:13 GMT)
ADMM Based Semi-Structured Pattern Pruning Framework For Transformer [4.0] 本稿では,アクティベーションマップの分布を再構成する,ADMM(Alternating Direction Method of Multipliers)に基づくパターン解析フレームワークを提案する。
GLUEデータセット上の分類タスクについて広範な実験を行った。
GLUEデータセットの総合スコア80.1を維持しながら圧縮率50%を達成した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:36:41 GMT)
Less for More: Enhancing Preference Learning in Generative Language Models with Automated Self-Curation of Training Corpora [4.0] 言語における曖昧さは、より強化された言語モデルを開発する上での課題である。
本稿では,これらのデータセットを直接トレーニングしたプロキシモデルを活用することで,アノテーション付きデータセットを前処理するセルフキュレーション手法を提案する。
提案手法は,データセット内の曖昧なアノテーションを自動的に検出し,削除することにより,嗜好学習を強化する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:27:14 GMT)
Motion-driven quantum dissipation in an open electronic system with nonlocal interaction [3.9] 相対運動を持つ2つの無限平行金属板の励起と散逸について検討した。
相対運動の過程は、シュウィンガー効果の散逸過程と同様、オンシェル励起を誘導する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:36:23 GMT)
UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios [3.8] 無人航空機(UAV)は捜索救助(SAR)活動に革命をもたらした。
機械学習モデルをトレーニングするための、特殊なヒューマン検出データセットが欠如していることは、大きな課題である。
本稿では,UAVが捉えた災害現場に人間のポーズをオーバーレイして合成したC2Aデータセットについて述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:01:25 GMT)
Tamgram: A Frontend for Large-scale Protocol Modeling in Tamarin [3.8] この研究は、Tamgramと呼ばれる高レベルなプロトコルモデリング言語を導入し、Tamrinのマルチセット書き換えセマンティクスに変換できる形式的セマンティクスを導入している。
TamgramはネイティブなTamarinコードを直接記述できるだけでなく、さまざまな高レベルな構成で大きな仕様を簡単に構築できる。
本研究では,タマリンのトレースセマンティクスに関するタマグラムの健全性と完全性を証明し,異なる翻訳戦略について議論し,手作業によるタマリン仕様に匹敵する性能をもたらす最適戦略を特定する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:00:44 GMT)
CLLMFS: A Contrastive Learning enhanced Large Language Model Framework for Few-Shot Named Entity Recognition [3.7] CLLMFSは、Few-Shot Named Entity RecognitionのためのContrastive LearningEnhanced Large Language Modelフレームワークである。
Low-Rank Adaptation (LoRA)と、数発のNER用に特別に調整された対照的な学習メカニズムを統合している。
提案手法は,F1スコアの現行性能を2.58%から97.74%まで向上させた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:44:05 GMT)
An Overview and Comparison of Axiomatization Structures Regarding Inconsistency Indices' Properties in Pairwise Comparisons Methods [3.7] 不整合指数は、すべてのペア比較行列(PCM)を実数にマッピングする関数である。
不整合指数は、適切な性質の集合を満たすとき、より信頼できるものとみなすことができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:20:09 GMT)
Ensemble Modeling of Multiple Physical Indicators to Dynamically Phenotype Autism Spectrum Disorder [3.7] 自閉症スペクトラム障害(ASD)に関連する表現型マーカーを検出するためのコンピュータビジョンモデルをトレーニングするためのデータセットを提供する。
視線,頭位,顔のランドマークを入力として,LSTMを用いた個別モデルを訓練し,テストAUCは86%,67%,78%であった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:55:58 GMT)
Indoor scene recognition from images under visual corruptions [3.5] 本稿では,マルチモーダルデータ融合を利用した屋内シーン認識への革新的アプローチを提案する。
グラフ畳み込みネットワーク(GCN)を用いて,CNNモデルから意味字幕を合成する2つのマルチモーダルネットワークについて検討した。
本研究では,Places365データセットの破損したサブセットに対して評価した場合,Top-1の精度が顕著に向上し,モデル性能が著しく向上することを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:35:45 GMT)
Domain-specific long text classification from sparse relevant information [3.4] 本稿では,候補文の検索に候補単語の短いリストを利用する階層モデルを提案する。
用語(s)埋め込みのプーリングは、分類される文書表現を必要とする。
より狭い階層モデルは、ドメイン固有のコンテキストで関連する長いドキュメントを取得するために、より大きな言語モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:54:19 GMT)
Moral Judgments in Online Discourse are not Biased by Gender [3.3] r/AITAはRedditのコミュニティで1700万人のメンバーが参加し、コミュニティの行動に関する判断を求める経験を共有しています。
受理した道徳判断に対する主人公の性別の直接的な因果関係は見つからない。
本研究は、既存の相関研究を補完し、ジェンダーの役割が特定の社会的文脈により大きな影響を及ぼす可能性を示唆している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:10:48 GMT)
DesignQA: A Multimodal Benchmark for Evaluating Large Language Models' Understanding of Engineering Documentation [3.2] 本研究は,多モーダル大規模言語モデル(MLLM)の熟練度を評価するための新しいベンチマークであるDesignQAを紹介する。
DesignQAは、フォーミュラSAE学生コンペティションから派生したマルチモーダルデータ、テキストデザイン要件、CADイメージ、エンジニアリング図面を独自に組み合わせている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:19:18 GMT)
ReCon: Reconfiguring Analog Rydberg Atom Quantum Computers for Quantum Generative Adversarial Networks [3.1] ReConはアナログRydberg原子量子コンピュータ上で量子対向ネットワーク(GAN)を実装する最初の研究である。
本評価は, 超伝導量子ビット技術に実装された最先端技術よりも33%高い品質(Frechet Inception Distance (FID) を用いた生成画像の評価)を示した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:58:45 GMT)
Using Process Mining to Improve Digital Service Delivery [3.0] カナダ政府における人事安全検査のためのプロセスマイニング(PM)の事例研究について述べる。
私たちは顧客(プロセス時間)と組織(コスト)の観点から考えます。
介入前分析では、初期ボトルネックを指摘し、介入後の分析では、介入の影響と改善のための残りの領域を特定した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:28:47 GMT)
GraphiQ: Quantum circuit design for photonic graph states [2.8] GraphiQはフォトニックグラフ状態生成スキームを設計するための汎用的なオープンソースフレームワークである。
複数のシミュレーションバックエンドや最適化メソッドを含む、一連のデザインツールで構成されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:44:54 GMT)
A New Era in Computational Pathology: A Survey on Foundation and Vision-Language Models [2.8] ディープラーニングの最近の進歩は、計算病理学(CPath)の領域を変えている。
ファンデーションモデル(FM)とビジョン言語モデル(VLM)は、病理学者の評価と意思決定プロセスに統合されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:33:57 GMT)
Exploring Bias and Prediction Metrics to Characterise the Fairness of Machine Learning for Equity-Centered Public Health Decision-Making: A Narrative Review [2.8] 機械学習の公衆衛生応用によるアルゴリズムバイアスの包括的理解が欠如している。
このレビューは、エクイティの観点から、公衆衛生に関するMLの評価フレームワークの形式化に役立ちます。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:47:10 GMT)
Object Recognition from Scientific Document based on Compartment Refinement Framework [2.7] 膨大な資源から貴重な情報を効率的に抽出することがますます重要になっている。
科学文書の現在のデータ抽出方法は、ルールベース(RB)または機械学習(ML)アプローチを用いるのが一般的である。
我々はCTBR(Compartment & Text Blocks Refinement)と呼ばれる新しい文書レイアウト分析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:37:56 GMT)
Spatio-Temporal Road Traffic Prediction using Real-time Regional Knowledge [2.7] 本稿では,POI,衛星画像,LTEによるリアルタイムアクセストレースを用いて,リアルタイムな地域レベルの知識を組み込む手法を提案する。
そして、この組み込み知識を道路レベルの注意に基づく予測モデルに取り込みます。
実世界の道路交通予測実験の結果,我々のモデルはベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:34:26 GMT)
Evolvable Psychology Informed Neural Network for Memory Behavior Modeling [2.5] 本稿では,PsyINNというメモリ挙動モデリングのためのニューラルネットワークの理論を提案する。
ニューラルネットワークとスパース回帰の微分を組み合わせたフレームワークを構築し、共同最適化を実現する。
4つの大規模実世界のメモリ挙動データセットにおいて,提案手法は予測精度において最先端の手法を超越する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:35:32 GMT)
ChatSpamDetector: Leveraging Large Language Models for Effective Phishing Email Detection [2.4] 本研究では,大規模な言語モデル(LLM)を用いてフィッシングメールを検出するシステムChatSpamDetectorを紹介する。
LLM解析に適したプロンプトに電子メールデータを変換することにより、電子メールがフィッシングされているか否かを高精度に判定する。
総合的なフィッシングメールデータセットを用いて評価を行い,複数のLLMおよびベースラインシステムと比較した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:03:44 GMT)
N-DriverMotion: Driver motion learning and prediction using an event-based camera and directly trained spiking neural networks [2.4] 本稿では,ドライバーの動きを学習し,予測する新しいシステムと,イベントベース高分解能データセット(1280x720)を提案する。
提案したニューロモルフィック視覚システムは、CSNNアーキテクチャでドライバの動きを認識する際に、同等の精度94.04%を達成する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:25:16 GMT)
Which Prosodic Features Matter Most for Pragmatics? [2.4] 時間的特徴はピッチ的特徴よりも重要であり,発話初期特徴は発話最終特徴よりも重要であることがわかった。
これらの知見は, 将来の韻律基礎研究の指針となり, 音声合成評価を改善する方法について提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:29:05 GMT)
Quantum Information Scrambling and Entanglement: An Elegant Mathematical Connection [2.4] 非熱状態における量子情報スクランブル(QIS)と二部構造絡みの数学的関係を示す。
我々は、X状態、非最大絡み合うベル状態、およびワーナー状態におけるそのような接続について研究する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:36:37 GMT)
QAdaPrune: Adaptive Parameter Pruning For Training Variational Quantum Circuits [2.3] emphQAdaPruneは適応パラメータのプルーニングアルゴリズムで、しきい値を自動的に決定し、冗長パラメータと非パフォーマンスパラメータをインテリジェントにプルーする。
得られたスパースパラメータ集合は、未計算の量子回路と同等に動作する量子回路を生成する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:57:40 GMT)
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning [2.3] 本研究では、空間-関係変換とカリキュラムQ-Learning(S2RCQL)という革新的なモデルを提案する。
そこで我々は,Qラーニングに基づく経路計画アルゴリズムを設計し,文脈不整合の幻覚を緩和する。
プロンプトの補助情報として状態反応のQ-値を用いて,LLMの幻覚を補正する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:02:54 GMT)
S-CycleGAN: Semantic Segmentation Enhanced CT-Ultrasound Image-to-Image Translation for Robotic Ultrasonography [2.1] 我々はS-CycleGANと呼ばれる高度なディープラーニングモデルを導入し,CTデータから高品質な合成超音波画像を生成する。
合成画像を用いて,ロボット支援超音波スキャンシステムの開発の諸側面を解明する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:32:35 GMT)
A Novel Refactoring and Semantic Aware Abstract Syntax Tree Differencing Tool and a Benchmark for Evaluating the Accuracy of Diff Tools [2.1] Syntax Tree (AST) diffツールは、ほとんどの開発者が使っている行ベースのdiffツールの制限を克服するために開発された。
上記の制限をすべて解決するRefactoringMinerに基づく新しいAST diffツールを提案する。
当社のツールは,特にコミットにおいて,非互換性ツールに匹敵する実行時間で,大幅な精度の向上とリコールを実現しています。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:04:27 GMT)
Fair Pairs: Fairness-Aware Ranking Recovery from Pairwise Comparisons [2.1] 本稿では,ペア比較による公平性を考慮したランキング回復の問題を紹介する。
ペア比較から得られたランクの公平度を定量化するグループ条件付き精度尺度を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:46:16 GMT)
Can AI Assistance Aid in the Grading of Handwritten Answer Sheets? [2.0] この作業では、AI支援のグレーティングパイプラインが導入されている。
パイプラインはまずテキスト検出を使用して、質問紙PDFに存在する質問領域を自動的に検出する。
次に、SOTAテキスト検出法を用いて、スキャンされた回答シートの手書き回答領域に存在する重要なキーワードをハイライトし、評価プロセスを支援する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:00:25 GMT)
Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews [2.0] Aspect-based Sentiment Analysis (ABSA)は自然言語処理(NLP)における重要な課題である
従来の感情分析手法は、全体的な感情を決定するのに有用だが、特定の製品やサービス機能に関する暗黙の意見を見逃すことが多い。
本稿では、レキシコンベースのアプローチから機械学習まで、ABSA方法論の進化を包括的に概観する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:31:07 GMT)
SIMPLE: Simultaneous Multi-Plane Self-Supervised Learning for Isotropic MRI Restoration from Anisotropic Data [2.0] 従来のMRIスキャンでは、技術的制約により異方性データが得られることが多い。
超解像技術は、異方性データから等方性高解像度画像を再構成することでこれらの制限に対処することを目的としている。
異方性データからの等方性MRI復元のための同時多平面自己監督学習手法SIMPLEを導入する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:48:11 GMT)
Does Differentially Private Synthetic Data Lead to Synthetic Discoveries? [2.0] 評価は、テストのタイプIとタイプIIのエラーの観点から行われる。
評価結果の大部分は,特にプライバシー予算が$epsilonleq 1$である場合に,I型エラーが劇的に膨らんだ。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:53:37 GMT)
AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights [1.9] AirPilotは、非線形ディープ強化学習 (DRL) - プロポーショナル・インテグレーショナル・デリバティブ (PID) ドローン・コントローラである。
AirPilotコントローラは、従来のPID制御のシンプルさと有効性と、DRLの適応性、学習能力、最適化能力を組み合わせる。
Airpilotは、デフォルトのPX4 PID位置コントローラのナビゲーションエラーを90%削減し、微調整されたPIDコントローラのナビゲーション速度を21%改善する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:37:29 GMT)
How to Measure Human-AI Prediction Accuracy in Explainable AI Systems [1.9] 人間との実証的研究において、明らかなアプローチは、タスクを二分法(すなわち、予測は正しいか間違っているか)としてフレーム化することである。
問題の要点は、二項フレーミングが異なる「怒り」の度合いのニュアンスを捉えていないことである。
我々は「部分的誤り」を測定するための3つの数学的基盤を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:52:37 GMT)
Locally Differentially Private Distributed Online Learning with Guaranteed Optimality [1.8] 本稿では,分散オンライン学習における差分プライバシーと学習精度を両立させる手法を提案する。
予想される即時後悔の減少を確実にする一方で、このアプローチは有限累積プライバシー予算を同時に確保することができる。
私たちの知る限りでは、このアルゴリズムは厳密な局所的な差分プライバシーと学習精度の両方を確実にする最初のアルゴリズムです。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:38:50 GMT)
Fundamental limits for realising quantum processes in spacetime [1.8] 古典的背景時空で実現可能な量子実験のノーゴー定理を導出する。
我々の最初の定理は、相対論的因果性に反しないICOプロセスの実現は、時空におけるシステムの非局在化を伴わなければならないことを示唆している。
第二の定理は、ICO過程のそのような実現には、定性的かつ非巡回因果順序過程の観点でよりきめ細かな記述が存在することを示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:41:49 GMT)
Monogamy of highly symmetric states [1.8] 完全グラフ上の他の粒子とも同様に絡み合っているとき、2つの粒子が最大に絡み合える範囲について検討する。
これを解決するために、多体物理学、計算複雑性、量子暗号の概念に基づく最適化問題を定式化し、解決する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:06:29 GMT)
Hierarchical Spatio-Temporal State-Space Modeling for fMRI Analysis [1.7] 機能的マンバ(FST-Mamba, FST-Mamba)は,fMRIを用いた神経バイオマーカーの発見を目的とした機能的マンバ(FST-Mamba)モデルである。
脳ネットワーク内の個々のコンポーネント間の接続を集約するコンポーネントワイド・バラエティ・スケール・アグリゲーション(CVA)機構を提案する。
実験結果から,脳の分類と回帰作業におけるFST-Mambaモデルの有効性が示唆された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:58:14 GMT)
EAViT: External Attention Vision Transformer for Audio Classification [1.7] 本稿では,音声分類精度の向上を目的とした新しいアプローチであるEAViTモデルを提案する。
この研究はEAViTが93.99%の精度を達成し、最先端のモデルを上回ることを示した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:31:06 GMT)
Accelerating the k-means++ Algorithm by Using Geometric Information [1.7] 実験により、アクセラレーションされたバージョンは、訪問点数や距離計算の点で標準k-means++バージョンより優れていることが示された。
追加実験では、複数のジョブで並列に実行されるアルゴリズムの挙動を示し、メモリ性能が実用的なスピードアップにどのように影響するかを調べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:15:47 GMT)
Real-Time Posture Monitoring and Risk Assessment for Manual Lifting Tasks Using MediaPipe and LSTM [1.7] 筋骨格障害(英: Musculoskeletal disorders、MSD)は、手動浮揚に関わる労働者にとって重要な問題である。
従来の姿勢補正法は、フィードバックの遅れやパーソナライズされた評価の欠如により、しばしば不十分である。
提案手法は,AIによる姿勢検出,詳細なキーポイント分析,リスクレベル決定,ユーザフレンドリーなWebインターフェースによるリアルタイムフィードバックを統合した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:19:52 GMT)
Fullerene-encapsulated Cyclic Ozone for the Next Generation of Nano-sized Propellants via Quantum Computation [1.6] 周期的なオゾン添加剤は、ロケット燃料の特定のインパルスを著しく増加させる可能性がある。
量子法はフラーレンカプセル化による環状オゾンの分離に有効である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:38:44 GMT)
SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models [1.6] 現実的な手術画像を生成するために, 連続拡散法であるemphSurgicaL-CDを導入する。
以上の結果から,本手法はGANや拡散に基づく手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:01:11 GMT)
Shape-Preserving Generation of Food Images for Automatic Dietary Assessment [1.6] 条件付き食品画像生成のための簡単なGANベースのニューラルネットワークアーキテクチャを提案する。
生成された画像中の食品や容器の形状は、参照入力画像の形状とよく似ている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:18:51 GMT)
Quantum metrological capability as a probe for quantum phase transition [1.6] 量子フィッシャー情報によって定量化された気象能力は、量子臨界点付近でユニークなピークを示す。
干渉計発生器の量子ゆらぎを抽出することにより、この探索を実現できることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:59:11 GMT)
Optimizing Collaboration of LLM based Agents for Finite Element Analysis [1.5] 本稿では,Large Language Models (LLM) 内の複数のエージェント間の相互作用について,プログラミングおよびコーディングタスクの文脈で検討する。
我々はAutoGenフレームワークを利用してエージェント間の通信を容易にし、各セットアップの40のランダムランからの成功率に基づいて異なる構成を評価する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:11:08 GMT)
Lessons in co-creation: the inconvenient truths of inclusive sign language technology development [1.5] 本稿は、EU水平2020(EASIER)とシグノン(Signon)の2つのプロジェクトにおける、聴覚障害者の欧州連合(EU)の関与について検討する。
これらのプロジェクトは、署名された言語と音声言語の間のモバイル翻訳アプリケーションを開発することを目的としていた。
我々は、現状を根本的に変化させ、競技場をレベルづけする変革的活動として、共創を主張する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:43:34 GMT)
A Survey on Retrieval-Augmented Text Generation for Large Language Models [1.5] Retrieval-Augmented Generation (RAG)は、検索手法とディープラーニングの進歩を融合する。
本稿では,RAGパラダイムを検索前,検索後,検索後,生成の4つのカテゴリに分類する。
RAGの進化を概説し、重要な研究の分析を通して分野の進歩について論じている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:17:02 GMT)
Energy-Efficient Spiking Recurrent Neural Network for Gesture Recognition on Embedded GPUs [1.4] 本研究では,スピーキングリカレントニューラルネットワーク(SRNN)と液体時間定数ニューロンを併用したジェスチャー認識システムについて検討した。
NVIDIA Jetson Nano組み込みGPUプラットフォームにおけるエネルギー効率と計算効率に着目した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:50:29 GMT)
Unconventional and robust light-matter interactions based on the non-Hermitian skin effect [1.3] 本研究では,量子エミッタと波多野-ネルソンモデルとの連成な光-物質相互作用について検討する。
消散からの保護は、非ハーモニティと自己干渉効果の協調から生じることが判明した。
これらの結果は、工学的エキゾチックスピンハミルトニアンと量子ネットワークに潜在的に応用できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:32:05 GMT)
Analysis of child development facts and myths using text mining techniques and classification models [1.2] 本研究は,児童発達に関する神話と事実を区別するために,テキストマイニング手法と分類モデルを適用した。
ロジスティック回帰は高い精度を示し、Bag-of-Words特徴抽出技術で90%の精度を達成した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:16:54 GMT)
MergeUp-augmented Semi-Weakly Supervised Learning for WSI Classification [1.2] 多重インスタンス学習(MIL)は、WSI分類のための弱い教師付き学習手法である。
機能拡張技術であるMergeUpを導入し、低優先度のバッグをマージしてカテゴリ間情報を強化する。
CAMELYON-16, BRACS, TCGA-LUNGデータセットによる実験結果から, 既存の最先端手法よりも本手法の方が優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:08:30 GMT)
Time-resolved sensing of electromagnetic fields with single-electron interferometry [1.1] 電子ファブリペロ干渉計で測定された単一電子波動関数の位相を利用する量子センサを実証する。
この能力は、圧縮された状態やフォック状態のような量子放射のオンチップ検出の道を開く。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:10:34 GMT)
Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification [1.0] 空間スペクトルマンバ(SSM)は計算効率を改善し、長距離依存関係をキャプチャする。
マルチヘッド・セルフアテンション・トークンエンハンスメント(MHSSMamba)を用いたSSMを提案する。
MHSSMambaはパヴィア大学で97.62%、ヒューストン大学で96.92%、サリナスで96.85%、武漢・長九のデータセットで99.49%という顕著な分類精度を達成した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:14:00 GMT)
Environment-Centric Active Inference [1.0] 通常の能動推論では、マルコフ・ブランケットはエージェントから始まる。
提案したEC-AIFでは、エージェントに対応するエンティティは存在しない。
ロボットや人間を含む全ての州が推論対象に含まれる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:54:28 GMT)
Automating Governing Knowledge Commons and Contextual Integrity (GKC-CI) Privacy Policy Annotations with Large Language Models [0.9] 本稿では,大規模言語モデルを用いて高精度なGKC-CIパラメータアノテーションを自動実行できることを実証する。
我々は16の根拠となる真実のプライバシポリシから,21,588 GKC-CIアノテーション上で,50のオープンソースおよびプロプライエタリなモデルを精査する。
私たちの最高のパフォーマンスモデルは90.65%の精度で、同じタスクのエキスパートの精度に匹敵する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:28:27 GMT)
Universal dimensions of visual representation [0.9] 我々は、様々な構成の視覚ニューラルネットワークから数十万の表現次元の普遍性を特徴づけた。
様々なアーキテクチャを持つネットワークは、潜在次元の共有集合を用いて自然画像を表現することを学習する。
ニューラルネットワークにおける最も脳に整合した表現は、普遍的で、ネットワークの特定の特性に依存しない表現である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:48:44 GMT)
Context-Aware Temporal Embedding of Objects in Video Data [0.8] ビデオ分析において、時間的コンテキストを理解することは、時間とともにオブジェクトの相互作用、イベントパターン、コンテキストの変化を認識するために不可欠である。
提案モデルは、隣接するビデオフレームからのオブジェクト間の隣接性と意味的類似性を利用して、コンテキスト対応の時間的オブジェクト埋め込みを構築する。
実証実験により、従来の視覚的埋め込みと組み合わせて、文脈対応の時間的埋め込みを利用でき、下流アプリケーションの有効性を高めることができることが示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:44:10 GMT)
Electronic interferometry with ultrashort plasmonic pulses [0.8] 量子コヒーレンスを超短パルスに保存し,直流状態と比較してコヒーレント振動のコントラストが高められることを示した。
このマイルストーンは、ローカライズされたキュービットアーキテクチャに代わる有望な代替手段としてのフライングキュービットの実現可能性を示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:29:02 GMT)
XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory [0.8] 説明可能な人工知能(XAI)は、説明を通じて自律的な意思決定の透明性を向上させることを目的としている。
近年の文献では、ユーザによる総合的な「マルチショット」の説明の必要性と、XAIシステムとの関わりをパーソナライズする能力を強調している。
我々は,XAI体験のユーザ中心品質を評価するためのXAI Experience Quality (XEQ)尺度を紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:51:43 GMT)
A Kaczmarz-inspired approach to accelerate the optimization of neural network wavefunctions [0.7] 本稿では, このボトルネックを軽減するために, サブスタンプ・プロジェクテッド・グラディエント・インクリメント・ナチュラル・ディフレクション(SPRing)を提案する。
SPRingは、最近導入された最小ステップ再構成(MinSR)と、線形最小二乗問題を解くための古典的ランダム化カッツマルツ法(英語版)のアイデアを組み合わせたものである。
我々は、SPRingがMinSRとKronecker-Factored Approximate Curvature法(KFAC)の両方を多数の小さな原子や分子で上回ることを示した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:22:39 GMT)
Smooth InfoMax -- Towards easier Post-Hoc interpretability [0.7] 自己教師型表現学習のための新しい手法であるSmooth InfoMax(SIM)を紹介する。
SIMは、ニューラルネットワークの様々な深さにおける学習された表現に解釈可能性制約を組み込む。
逐次音声データを用いたSIMの性能評価を行い、Greedy InfoMax(GIM)と競合することを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:36:09 GMT)
iSee: Advancing Multi-Shot Explainable AI Using Case-based Recommendations [0.7] iSeeプラットフォームは、説明体験のインテリジェントな共有と再利用のために設計されている。
ケースベースの推論は、XAIのベストプラクティスを前進させるために使用されます。
iSeeプラットフォーム内で生成されたすべての知識は、相互運用性のためのiSeeオントロジーによって形式化されている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:44:57 GMT)
Understanding Defects in Generated Codes by Language Models [0.7] 本研究では,大規模言語モデルによって生成されたコードスニペットの367の欠陥を分類,解析する。
エラーカテゴリは、LLMが頻繁に失敗する重要な領域を示し、目標とする改善の必要性を強調している。
本稿では,スクラッチパッド・プロンプト・プログラム・オブ・ソート・プロンプト・チェーン・オブ・ソート・プロンプト・チェーン・オブ・ソート・プロンプト・ストラクテッド・オブ・ソート・プロンプト・オブ・ソート・プロンプト・プログラム・オブ・ソート・プロンプト・プログラム・オブ・ソート・プロンプト・プログラム・オブ・ソート・プロンプト・オブ・ソート・プロンプト・プログラム・オブ・ソート・プロンプト・オブ・ソート・プロンプト・プログラム・オブ・ソート・プロンプト・プログラム・オブ・オブ・ソート・プロンプト・プロンプト・アンド・ストラクテッド・オブ・フォーンティング(Structued Chain-of-Thought Prompting)の5つの迅速な技術技術
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:10:09 GMT)
Topics as Entity Clusters: Entity-based Topics from Large Language Models and Graph Neural Networks [0.6] 本稿では,エンティティのバイモーダルベクトル表現を用いたトピッククラスタリング手法を提案する。
我々のアプローチは、最先端のモデルと比較してエンティティを扱うのに適している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:57:16 GMT)
Graph Classification with GNNs: Optimisation, Representation and Inductive Bias [0.6] このような等価性は、付随する最適化問題を無視するものであり、GNN学習プロセスの全体像を提供するものではない、と我々は主張する。
理論的には、グラフ内のメッセージパッシング層は、識別サブグラフか、あるいはグラフ全体に分散した識別ノードの集合を探索する傾向にあることを証明している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:55:08 GMT)
A density ratio framework for evaluating the utility of synthetic data [0.6] 合成データの品質評価を改善するために密度比推定法を提案する。
非パラメトリック密度比モデルの自動選択による手動チューニングをほとんど必要としない推定器を開発する。
実世界のデータアプリケーションは、密度比がモデルの洗練を導く方法を示し、下流の分析を改善するために使用できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:39:30 GMT)
Data-Centric Approach to Constrained Machine Learning: A Case Study on Conway's Game of Life [0.6] 本稿では、ConwayのGame of Lifeの文脈における機械学習アプリケーションに対するデータ中心のアプローチに焦点を当てる。
我々は,ゲーム・オブ・ライフの移行ルールを学習するために,最小限のアーキテクチャネットワークをトレーニングする作業を検討する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:56:34 GMT)
Emergence of global receptive fields capturing multipartite quantum correlations [0.6] 量子物理学において、波動関数レベルで明確に定義された構造を持つ単純なデータでさえ、非常に複雑な相関によって特徴づけられる。
量子統計学を学習しながら、ニューラルネットワークの重み空間をモニタリングすることで、複雑な多部パターンに関する物理的直観を発達させることができることを示す。
この結果から,非局所パターンを用いたデータ処理のための畳み込みニューラルネットワークの構築について,新たな知見が得られた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:45:40 GMT)
Unveiling gravity's quantum fingerprint through gravitational waves [0.5] 本稿では,新しい理論枠組みを用いて重力の量子的側面を探索する革新的な手法を提案する。
我々のモデルは、LOCCの原理によって課された古典的な通信制限をサイドステッピングしながら、重力誘起絡み合い(GIE)に発展する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:53:54 GMT)
Advancing Voice Cloning for Nepali: Leveraging Transfer Learning in a Low-Resource Language [0.5] ニューラル・ボーカル・クローンシステムは、ほんの少しのオーディオサンプルを使って誰かの声を模倣することができる。
話者符号化と話者適応は、音声クローニングの分野における研究のトピックである。
主な目的は、ネパールアクセントで音声出力を生成する音声クローニングシステムを作ることである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:15:30 GMT)
Reconstructing networks from simple and complex contagions [0.5] ネットワークと動的を一連のノード状態から再構築するノンパラメトリック手法を開発した。
そして、複雑な感染のレンズを通してネットワークを観察すると、ネットワークをより簡単に再構築できることが示される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:22:19 GMT)
SHEDAD: SNN-Enhanced District Heating Anomaly Detection for Urban Substations [0.4] 本研究は, 近近近近近近近温暖房地域異常検出(SHEDAD)手法について紹介する。
DHネットワークトポロジを近似し、サブステーション位置などの機密情報を開示することなく、局所的な異常検出を可能にするように設計されている。
その結果、SHEDADは従来のクラスタリング法よりも優れており、クラスタ内のばらつきや距離が著しく低いことが判明した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:25:41 GMT)
ml_edm package: a Python toolkit for Machine Learning based Early Decision Making [0.4] textttml_edmは、時間/シーケンスデータを含む学習タスクの早期決定のために設計されたPython 3ライブラリである。
textttscikit-learnは、textttml_edmと互換性のある推定器とパイプラインを作成する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:08:17 GMT)
Enhancing Vehicle Environmental Awareness via Federated Learning and Automatic Labeling [0.4] 本稿では、画像データと車車間通信データの統合に焦点を当てる。
私たちのゴールは、画像内のメッセージを送信する車両の位置を特定することです。
車両識別問題に対処するために,教師付き学習モデルを用いる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:03:59 GMT)
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities [0.4] 本稿では,Large Language Models (LLM) の微調整について検討する。
従来の自然言語処理(NLP)モデルから、AIにおける彼らの重要な役割まで、LLMの歴史的進化を概説している。
本報告では, 微調整LDMのための構造化7段パイプラインについて紹介する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:48:02 GMT)
Differentially Private Spatiotemporal Trajectory Synthesis with Retained Data Utility [0.3] DP-STTSは差分プライベートシンセサイザーである。
ノイズモデルから合成軌道を生成する。
実験では、DP-STTSが優れたデータユーティリティを提供することを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:17:36 GMT)
SIn-NeRF2NeRF: Editing 3D Scenes with Instructions through Segmentation and Inpainting [0.3] Instruct-NeRF2NeRF(in2n)は、テキストプロンプトを用いてNeRF(Neural Radiance Field)からなる3Dシーンの編集を可能にする有望な方法である。
本研究では,3次元シーン内におけるオブジェクトの幾何学的変化を,シーンから分離したオブジェクトを選択的に編集することで実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:20:42 GMT)
Benchmarking the algorithmic reach of a high-Q cavity qudit [0.3] 自然な戦略は、Fockベースを使ってクォーディットで情報をエンコードすることだ。
キャビティモードqudit上の量子演算は、系を非線形のアシラリートランスモン量子ビットに結合することで行うことができる。
我々は,これらのquditシステムのベンチマークツールをアルゴリズムに依存しない方法で開発する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:04:19 GMT)
Reconciling Different Theories of Learning with an Agent-based Model of Procedural Learning [0.3] 我々は、手続き的知識を学習するためのICAP、知識学習指導、認知的負荷理論フレームワークを再構築する、手続き的ABICAPという新しい人間の学習の計算モデルを提案する。
ICAPは、建設的学習は一般的により良い学習結果をもたらすと仮定するが、KLIやCLTのような理論は、これは必ずしも真実ではないと主張している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:45:14 GMT)
Designing elegant Bell inequalities [0.3] 本稿では,ベルの不等式を従来のエレガントなベル不等式に類似した違反特徴で構築する方法を提案する。
そのような特徴を持つベルの不等式は、初めて3次元で導出される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:54:15 GMT)
Ancillary entangling Floquet kicks for accelerating quantum algorithms [0.2] 我々は、一次系量子ビットとアシラリー量子ビットを絡めるデジタル多ビットゲートを用いて量子シミュレーションを高速化する。
単純だが非自明な短距離無限長距離逆場イジングモデルと、量子ビット符号化後の水素分子モデルに対して、解法時間の改善を100%に示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:40:24 GMT)
Empirical Power of Quantum Encoding Methods for Binary Classification [0.2] 我々は、様々な機械学習メトリクスに対する符号化スキームとその効果に焦点を当てる。
具体的には、実世界の複数のデータセットの量子符号化戦略の違いを示すために、実世界のデータ符号化に焦点を当てる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:34:57 GMT)
Optimal OnTheFly Feedback Control of Event Sensors [0.1] イベントベースの視覚センサは、ピクセル強度の変動が閾値を超えるとトリガされるイベントの非同期ストリームを生成する。
本稿では,過去のイベントをコントローラネットワークが解析する,アクティベーションしきい値の動的フィードバック制御手法を提案する。
本手法は,LPIPSの知覚的画像差度測定値において,固定的およびランダムに変化する閾値スキームを6~12%向上させることを示した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:49:16 GMT)
Intelligent Energy Management with IoT Framework in Smart Cities Using Intelligent Analysis: An Application of Machine Learning Methods for Complex Networks and Systems [0.1] 本稿では,スマートシティのエネルギー管理を目的としたIoTベースのフレームワークについて概観する。
データを収集、保存するだけでなく、監視、制御、システムの効率向上のためのインテリジェントな分析をサポートするシステムに注力する。
この結果から、IoTベースのフレームワークは、スマートな建物におけるエネルギー消費と環境への影響を低減できる重要な可能性を示唆している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:10:19 GMT)
Perturbation on Feature Coalition: Towards Interpretable Deep Neural Networks [0.1] ディープニューラルネットワーク(DNN)の“ブラックボックス”という性質は、透明性と信頼性を損なう。
本稿では,ネットワークの深い情報を利用して相関した特徴を抽出する,特徴連立による摂動に基づく解釈を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:44:21 GMT)
AI and Jobs: Has the Inflection Point Arrived? Evidence from an Online Labor Platform [0.1] 我々は、AIが異なるオンライン労働市場(OLM)のフリーランサーにどのように影響するかを調査する。
そこで我々はCournot型競合モデルを開発した。
合衆国のWebデベロッパは、他のリージョンに比べてChatGPTのリリースの恩恵を受ける傾向にある。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:29:05 GMT)
Impossibility of adversarial self-testing and secure sampling [0.1] 対戦型自己検査は安全なサンプリングを意味することを示す。
二次元量子暗号における可視性の拡張により、これらのタスクがいずれも簡単な設定では不可能であるという簡単な証明を与える。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:09:49 GMT)
WildFusion: Individual Animal Identification with Calibrated Similarity Fusion [0.0] 本研究では,多様な動物種の個体識別のための新しい手法,WildFusionを提案する。
この方法は深度スコア(例えばMegaDescriptorやDINOv2)と局所的な類似性を融合させ、個々の動物を識別する。
ゼロショット設定では、WildFusionは平均精度を76.2%の17データセットで測定した。
コードと事前訓練されたモデルを公開し、エコロジーと保全の即時利用を可能にします。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:30:11 GMT)
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese [0.0] Vintern-1Bはベトナム語タスクのための信頼性の高いマルチモーダル大言語モデル(MLLM)である。
このモデルは、300万以上の画像検索と回答のペアからなる広範囲なデータセットに基づいて微調整されている。
Vintern-1Bは、様々なデバイス上のアプリケーションに簡単に適合できるほど小さい。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:52:52 GMT)
VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models [0.0] VALE Visual and Language Explanation という新しいフレームワークを提案する。
VALEは説明可能なAI技術と高度な言語モデルを統合し、包括的な説明を提供する。
本稿では,画像分類タスクのためのVALEフレームワークの試験的検討を行う。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 03:02:11 GMT)
Upper Bound on Locally Extractable Energy from Entangled Pure State under Feedback Control [0.0] 我々は,多粒子交絡純状態に対する有効熱力学を導入する。
局所ハミルトニアンの下でのサブシステムからのフィードバック制御による抽出可能エネルギーの上界を導出する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:21:33 GMT)
Underwater SONAR Image Classification and Analysis using LIME-based Explainable Artificial Intelligence [0.0] 本稿では,水中画像分類結果の解釈に,eXplainable Artificial Intelligence (XAI)ツールの適用について検討する。
ベンチマーク畳み込みニューラルネットワーク(CNN)アーキテクチャを用いた画像分類のための転写学習手法の広範な解析を行う。
XAIのテクニックは、結果の解釈可能性をより人間に準拠した方法で強調することで、信頼性と信頼性を高めます。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:54:18 GMT)
Towards a Resource-Optimized Dynamic Quantum Algorithm via Non-iterative Auxiliary Subspace Corrections [0.0] 動的に選択された主成分へのアンザッツの分離に依存する新しい理論フレームワークを開発する。
本稿では,主パラメータから補助パラメータを解析的に予測する形式的手法を提案する。
我々は、多くの強い相関分子系を用いて、我々の形式主義の資源効率と精度を数値的に検証した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:50:15 GMT)
Topological p-wave Superconductors with Disorder and Interactions [0.0] 二重臨界イジング(DCI)相が障害に対する強い相互作用によって安定化されることを初めて示す。
ワイヤ間ホッピング項の存在下では、DCI相はバルクギャップを持つ保護位相となる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:36:47 GMT)
The News Comment Gap and Algorithmic Agenda Setting in Online Forums [0.0] 我々はオーストリアの新聞Der Standardから120万件のコメントを分析し、"News Comment Gap"と異なるランキングアルゴリズムの効果を理解する。
ジャーナリストはポジティブで、タイムリーで、複雑で、直感的な反応を好むのに対し、読者は、エリート作家の記事に類似したコメントを好む。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 09:29:34 GMT)
The Model Mastery Lifecycle: A Framework for Designing Human-AI Interaction [0.0] ますます多くの分野におけるAIの利用は、長いプロセスの最新のイテレーションである。
異なる状況でAIをどのように使うべきかを決定する方法が緊急に必要である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:00:32 GMT)
Symmetric masking strategy enhances the performance of Masked Image Modeling [0.0] Masked Image Modeling (MIM) は、ラベルのない画像から詳細な視覚表現を取得することに焦点を当てた自己教師付き学習の技法である。
モデルがグローバルな特徴とローカルな特徴を効果的に捉えるのに役立つ新しいマスキング戦略を提案する。
このマスキング戦略であるSymMIMに基づいて,MIMのためのトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:15:43 GMT)
Stable Formulations in Optimistic Bilevel Optimization [0.0] 双レベル最適化問題は、問題データの変更による不安定性に悩まされる傾向がある。
我々は、軽度の仮定の下で望ましい安定性を示す、持ち上げられた代替の定式化を構築した。
我々は,低レベルの問題に対して,広範囲に保持する意味で,ポイントワイドかつ局所的な落ち着きを生じさせる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:14:33 GMT)
Speakable and unspeakable in quantum measurements [0.0] いわゆる「弱測定」に基づく新たなアプローチは、不正確な摂動デバイスに対するシステムの応答を研究することによって、そのような禁止された知識を得ることができることを示唆している。
さらに、物理変数の概念全体を改訂することを提案し、反直観的量子行動の様々な例を提示している。
新しいテクニックは、正統的な極限を超越するか、あるいは単にこれらの限界が本当に必要であることを証明しなければならない。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:24:18 GMT)
Spacetime geometry of acoustics and electromagnetism [0.0] 音響と電磁界は、動的ポテンシャル場の観点から測定可能な場を表す。
これらの従来のポテンシャル表現に基づくスピン角運動量の標準場理論解析は、最近の実験と矛盾する。
我々は、時空の完全な幾何学的構造を用いて真空波伝搬によって強制される本質的な対称性を尊重する両方の理論の拡張を分析する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:53:01 GMT)
Solving Robotics Problems in Zero-Shot with Vision-Language Models [0.0] Wonderful Teamは、ゼロショット方式でロボットの問題を解決するためのフレームワークだ。
エージェント階層間でタスクを分割するマルチエージェントビジュアルLLMの進歩の上に構築されている。
VIMABenchと現実世界のロボット環境の実験は、様々なロボットタスクを扱うシステムの能力を実証している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:06:27 GMT)
Single-qubit rotations on a binomial code without ancillary qubits [0.0] 本稿では,二項符号上で論理キュービット回転を行う方法を提案する。
具体的には、非線形な共振器に2周波パラメトリック駆動を同時に適用することにより、$X$軸回転を実現する方法について説明する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:31:13 GMT)
SecDOAR: A Software Reference Architecture for Security Data Orchestration, Analysis and Reporting [0.0] 我々はSecDOAR(Security Data Orchestration, Analysis and Reporting)のためのSRAを発表した。
SecDOAR SRAは、既存の科学文献とセキュリティデータ標準を活用して設計されている。
提案されたSecDOAR SRAは、サイバーセキュリティ監視、分析、レポートシステムの設計と実装のための構造化アプローチとして、研究者や実践者が使用することができる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:11:27 GMT)
S3Simulator: A benchmarking Side Scan Sonar Simulator dataset for Underwater Image Analysis [0.0] 本稿では,S3Simulator データセットと呼ぶ,Simulated Side-Scan Sonar 画像のベンチマークデータセットを提案する。
我々のデータセットは高度なシミュレーション技術を利用して水中条件を正確に再現し、多様な合成ソナー画像を生成する。
特に、最先端のAIセグメンテーションツールであるSAM(Seegment Anything Model)は、実際のシーンから船や飛行機などのオブジェクトイメージを最適に分離し、セグメンテーションするために利用される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:41:20 GMT)
Recent advances in Meta-model of Optimal Prognosis [0.0] 仮想プロトタイピングプロセス内の実例では、物理モデルの複雑さを減らすことは必ずしも不可能である。
本稿では,実際の問題に対して最適なメタモデルを選択するための自動アプローチを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:54:10 GMT)
Rate Coefficients for Rotational State-to-State Transitions in H$_2$O + H$_2$ Collisions as Predicted by Mixed Quantum/Classical Theory (MQCT) [0.0] バックグラウンドガスと衝突したH$Oの回転状態間の遷移に対する衝突速度係数の新しいデータベースを開発した。
目的は、水の回転状態(200状態を含む)と水素の回転状態(10状態)の観点から、他の既存のデータベースを超えて拡張することである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:19:53 GMT)
Rabi frequency for polar systems interacting with light [0.0] 超強結合系における古典的外部ビームに結合した極性系のダイナミクスについて検討する。
周波数シフト, 駆動磁場との結合強度, 再スケール緩和率について, 効果的なパラメータを記述したJaynes-Cummings型フレームワークを導出する。
相互作用強度と磁場振幅とのよく知られた線形スケーリングは、非線形依存に置き換えられ、量子系アンサンブルのコヒーレンスを改善する潜在的な応用が示唆される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:57:58 GMT)
Quantum-critical and dynamical properties of the XXZ bilayer with long-range interactions [0.0] 反強磁性非フラストレーション長範囲相互作用を持つXXZ正方格子二層モデルについて検討した。
等方点における3d XY と Ising の2つの拡張領域と 3d Heisenberg 臨界指数を観察する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:12:05 GMT)
Pseudo Channel: Time Embedding for Motor Imagery Decoding [0.0] 運動画像(MI)に基づく脳波は、外部デバイスを直接神経制御し、神経リハビリテーションを進めるためのフロンティアである。
本研究は、MI-EEG信号の復号精度を高めるために擬似チャネルとして使用される、旅行波ベースの時間埋め込みと呼ばれる新しい時間埋め込み手法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:53:26 GMT)
Predicting Solar Energy Generation with Machine Learning based on AQI and Weather Features [0.0] 大気質指数と気象特性が太陽エネルギー発生に与える影響について検討する。
各種機械学習アルゴリズムとConv2D長短期記憶モデルに基づくディープラーニングモデルをこれらの変換に適用する。
我々は,Conv2D Long Short-Term Memoryモデルを用いた0.9691$R2$Score,0.18 MAE,0.10 RMSEを実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:40:13 GMT)
Phrasing for UX: Enhancing Information Engagement through Computational Linguistics and Creative Analytics [0.0] 本研究では,デジタルプラットフォーム上でのテキスト特徴と情報エンゲージメント(IE)の関係について検討する。
計算言語学と分析がユーザインタラクションに与える影響を強調します。
READモデルは、代表性、使いやすさ、影響、分散といった重要な予測要素を定量化するために導入された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 00:33:47 GMT)
Phonon-assisted Casimir interactions between piezoelectric materials [0.0] 圧電材料における電磁場と格子振動のカップリングはフォノンポラリトン励起を引き起こす。
圧電体中のフォノンは、縦型光フォノン、横型光フォノン、およびフォノンポラリトンである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:02:31 GMT)
Personalised Medicine: Establishing predictive machine learning models for drug responses in patient derived cell culture [0.0] パーソナライズドメディカルは、しばしばオミクスデータの利用に関連している。
精密医療への別のアプローチは、細胞の機能ベースのプロファイルを採用することである。
ここでは、極めて多様な患者由来の細胞株に対する薬物スクリーニングの集合体を活用して、「新規患者」に対する治療オプションを同定する概念実証を行う。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:58:50 GMT)
Optimally Solving Simultaneous-Move Dec-POMDPs: The Sequential Central Planning Approach [0.0] 分散実行パラダイムのためのエクシロントレーニングは、分散された部分的に観察可能な意思決定プロセスを最適に解決するための最先端のアプローチとして登場した。
本稿では、分散実行のためのシーケンシャルモブ集中型トレーニングという、新しい、よりスケーラブルな代替手段を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:01:37 GMT)
Optimal Quantum Circuit Design via Unitary Neural Networks [0.0] 本稿では,量子回路モデル表現に量子アルゴリズムの機能を合成する自動手法を提案する。
この訓練されたモデルが、元のアルゴリズムと同等の量子回路モデルを効果的に生成できることを実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:41:15 GMT)
Open Llama2 Model for the Lithuanian Language [0.0] リトアニア語に対する最初のオープンなLlama2大言語モデル(LLM)を提案し,記述する。
本稿では,オープン地域LSMの簡単なレビューと,提案するLSMとそのトレーニングプロセスの詳細情報について述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 10:18:39 GMT)
On the good reliability of an interval-based metric to validate prediction uncertainty for machine learning regression tasks [0.0] 本研究では,不確実性の平均校正を予測するための(より)信頼性の高い検証手法を提案する。
不確実性や誤差分布の重みの存在に非常に敏感な分散ベースのキャリブレーション指標を考えると、間隔ベースの測度であるPICP(Prediction Interval Coverage Probability)へのシフトが提案される。
結果のPICPは、分散ベースのキャリブレーション指標よりも迅速かつ確実に検査される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:16:10 GMT)
Multi-controlled single-qubit unitary gates based on the quantum Fourier transform [0.0] マルチコントロール(MC)ユニタリ(U)ゲートは量子アルゴリズムや回路で広く使われている。
MCUゲートの最先端分解には、非元素の$C-R_x$と$C-U1/2m-1$ Gateを使用するものはほとんどない。
提案手法は,マルチコントロールX(MCX)ゲートの2つの一般化に基づいている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:10:30 GMT)
Mastering the Digital Art of War: Developing Intelligent Combat Simulation Agents for Wargaming Using Hierarchical Reinforcement Learning [0.0] 対象とする観察抽象化、マルチモデル統合、ハイブリッドAIフレームワーク、階層的な強化学習フレームワークなど、包括的なアプローチを提案する。
線形空間減衰を用いた局所的な観測抽象化は,RL問題を単純化し,計算効率を向上し,従来の大域的観測法よりも優れた有効性を示す。
我々のハイブリッドAIフレームワークは、スクリプトエージェントとRLを同期させ、高レベルの決定にRLを、低レベルのタスクにスクリプトエージェントを活用し、適応性、信頼性、パフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:50:57 GMT)
Localized Observation Abstraction Using Piecewise Linear Spatial Decay for Reinforcement Learning in Combat Simulations [0.0] 本稿では,一方向線形空間減衰を用いた局所的な観測抽象化手法を提案する。
この技術は状態空間を単純化し、重要な情報を保持しながら計算要求を減らす。
分析の結果,この局所的な観測アプローチは,シナリオの複雑さが増大する中で,従来型のグローバルな観測手法よりも一貫して優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:26:10 GMT)
LCA and energy efficiency in buildings: mapping more than twenty years of research [0.0] ライフサイクルアセスメント(LCA)に関する20年以上の研究を概観する。
著者らは、ビルディングとサステナビリティクラスタ(BSC)の7つの主要なテーマ群を同定した。
主な研究テーマは主に建築材料とエネルギー効率に関するものである。
この記事ではまた、先進的で未発達のテーマに関する洞察も提供し、今後の重要な研究の方向性を概説している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 08:43:25 GMT)
KonvLiNA: Integrating Kolmogorov-Arnold Network with Linear Nyström Attention for feature fusion in Crop Field Detection [0.0] 本研究では,コンボリュータル・コルモゴロフ・アルノルドネットワーク(cKAN)とNystr"om attention mechanismを統合した新しいフレームワークであるKonvLiNAを紹介した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:33:07 GMT)
Knowledge Graph Modeling-Driven Large Language Model Operating System (LLM OS) for Task Automation in Process Engineering Problem-Solving [0.0] 本稿では,化学・プロセス産業における複雑な問題の解決を目的としたAI駆動型フレームワークであるプロセスエンジニアリングオペレーションアシスタント(PEOA)を紹介する。
このフレームワークはメタエージェントによって構成されたモジュラーアーキテクチャを採用しており、中央コーディネータとして機能している。
その結果、計算の自動化、プロトタイピングの高速化、産業プロセスに対するAIによる意思決定支援におけるフレームワークの有効性が示された。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:52:47 GMT)
Is Generative AI the Next Tactical Cyber Weapon For Threat Actors? Unforeseen Implications of AI Generated Cyber Attacks [0.0] 本稿では,AIの誤用によるエスカレート脅威,特にLarge Language Models(LLMs)の使用について述べる。
一連の制御された実験を通じて、これらのモデルがどのようにして倫理的およびプライバシー保護を回避し、効果的にサイバー攻撃を発生させるかを実証する。
私たちはまた、サイバー攻撃の自動化と実行のために特別に設計されたカスタマイズされた微調整のLLMであるOccupy AIを紹介します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:56:13 GMT)
IoT Monitoring with Blockchain: Generating Smart Contracts from Service Level Agreements [0.0] この研究は、与えられたSLAからスマートコントラクトを生成することができるJavaライブラリの開発に焦点を当てている。
このライブラリによって生成されたスマートコントラクトは、リモート患者監視IoTシステムの形式で提示されたモックシナリオを通じて検証される。
このシナリオでは、エミュレートされたすべての違反をキャプチャして100%の成功率を示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 21:00:45 GMT)
Interpretable breast cancer classification using CNNs on mammographic images [0.0] 本研究は,マンモグラム分類のための畳み込みニューラルネットワーク(CNN)の決定過程に関する知見を得る必要性に対処する。
マンモグラフィー画像解析学会(MIAS)データセットをトレーニングしたCNNに対して,LIME,Grad-CAM,Kernel SHAPといったポストホック解釈技術を比較した。
以上の結果から,特にGrad-CAMは,正常,良性,悪性の乳房組織に特徴的なパターンを呈し,CNNの行動に関する包括的知見を提供することが明らかとなった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:25:42 GMT)
Improving the Classification Effect of Clinical Images of Diseases for Multi-Source Privacy Protection [0.0] 医療分野におけるプライバシーデータ保護は、データ共有に課題をもたらす。
従来の集中型トレーニング手法は、プライバシー保護原則に違反しているため、適用が難しい。
データベクトルに基づく医療プライバシデータトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:52:24 GMT)
Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications [0.0] 浮動小数点非連想性(FPNA)による並列プログラムのラン・バイ・ランの変動はアルゴリズムに大きな影響を与えることが知られている。
本稿では,並列プログラミングモデルにおけるFPNAの統計的特性について検討する。
我々は、最近追加されたPyTorchフレームワークにおける決定論的オプションについて、GPUデプロイメントのコンテキスト内で検討する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:40:15 GMT)
High fidelity quantum state tomography of electron-$^{14}$N nuclear hybrid spin register in diamond using Rabi oscillations [0.0] 我々はRavi-based Quantum State Tomography (RQST)と呼ばれる新しい量子状態特徴化法について報告する。
我々は、特にダイヤモンド中の単一の窒素空孔中心の電子スピンと核スピンについて、単一量子ビットの量子状態で検証した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 19:49:46 GMT)
HBIC: A Biclustering Algorithm for Heterogeneous Datasets [0.0] Biclusteringは、データマトリックス内で行と列を同時にクラスタすることを目的とした、教師なしの機械学習アプローチである。
複素異種データから有意義なビクラスタを発見することが可能な,HBICと呼ばれるビクラスタリング手法を提案する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:48:10 GMT)
Gravitational-wave matched filtering with variational quantum algorithms [0.0] 重力波検出におけるマッチングフィルタリング問題に対する変分量子アルゴリズムの適用について検討する。
LIGOのオープンサイエンスデータを用いた量子アルゴリズムの古典的数値シミュレーションの結果について述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:53:56 GMT)
Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure [0.0] 本研究では,3次元土壌構造の複雑なマトリックス内における微生物活性の領域について検討する。
本研究は,長期システム行動に重要な意味を持つ基本的特徴である,グローバルなアトラクションの発見につながる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:42:14 GMT)
Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption [0.0] 半導体電子顕微鏡画像(MAEMI)解析のための小型フレームワークについて紹介する。
我々は、顕微鏡画像解析において、大規模なマルチモーダルモデルを用いて、カスタマイズされた命令追従データセットを生成する。
知識蒸留により,より大規模なモデルからより小さなモデルへの知識伝達を行い,視覚的質問応答タスクにおいて,より小さなモデルの精度を向上させる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:42:11 GMT)
Feshbach resonances in cold collisions as a benchmark for state of the art ab initio theory [0.0] 衝突や反応における量子共鳴は分子間力の感度の高いプローブである。
これにより、このような測定の感度が相互作用の理論モデルの品質を評価するのに十分かどうかという疑問が提起される。
分子自由度に対するエネルギー再分配の正しい予測をテストする能力は限界に達しており、現在の実験ではエネルギー分解能をわずかに改善するしかなかった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:29:23 GMT)
Fabrication and characterization of low-loss Al/Si/Al parallel plate capacitors for superconducting quantum information applications [0.0] アルミニウムで接触した結晶状シリコンフィンからなるパラレルプレートコンデンサは、超伝導回路での使用に有望な技術であることが示されている。
単結晶Siコンデンサは、リソグラフィーパターンのアルミニウムインダクタと、従来の$Al/AlO_x/Al$ジョセフソン接合部とで、積層素子共振器とトランモンに組み込まれている。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:13:21 GMT)
Exploring Machine Learning Models for Lung Cancer Level Classification: A comparative ML Approach [0.0] 本稿では,肺がんレベルを分類する機械学習(ML)モデルについて検討する。
オーバーフィッティングを減らし、パフォーマンスを最適化するために、最小の児童体重と学習率モニタリングを使用します。
投票やバッグングを含むアンサンブル手法も、予測精度と堅牢性を高めることを約束している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 04:56:36 GMT)
Event Detection via Probability Density Function Regression [0.0] 本研究では、時間間隔定義イベント検出問題を再編成する一般化回帰に基づく手法を提案する。
コンピュータビジョンからの熱マップ回帰技術にインスパイアされた本手法は,事象発生時の確率密度を予測することを目的としている。
回帰に基づくアプローチは,様々な最先端のベースラインネットワークやデータセットのセグメンテーションに基づく手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 01:58:56 GMT)
Entropy Production from Maximum Entropy Principle: a Unifying Approach [0.0] エントロピー生成は、不可逆現象と熱力学の第2法則を特徴づける重要な量である。
私たちはJaynesの最大エントロピー原理を使って、際立った、明らかに矛盾する定義をまとめるフレームワークを構築します。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:20:05 GMT)
Entanglement buffering with two quantum memories [0.0] 量子ネットワークは、絡み合ったリンクとして知られる高品質な量子ビット対の可用性に極めて依存している。
これらのリンクの品質を維持することは、時間依存ノイズが存在するため難しい課題である。
絡み合い浄化プロトコルは、複数の低品質な絡み合い状態からより少数の高品質な状態に変換することで解を提供する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:38:28 GMT)
Enhancing Few-Shot Transfer Learning with Optimized Multi-Task Prompt Tuning through Modular Prompt Composition [0.0] マルチタスクのプロンプトチューニングは、その固有のモジュラリティと、パラメータ効率のよい転送学習を向上する可能性に対して、かなりの注意を払っている。
本稿では,マルチタスク環境において,対応するプロンプト間の知識伝達を容易にすることで,複数のタスクのパフォーマンスを解析・改善することを目的とする。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:01:51 GMT)
Encoder-Decoder Neural Networks in Interpretation of X-ray Spectra [0.0] シミュレーションX線分光データのエミュレーションと解釈におけるこのアーキテクチャの利用について検討する。
EDNNは対象変数の分散度でECAを上回り、物理用語で潜伏変数を解釈する際の複雑さも発見できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 02:28:18 GMT)
Electromagnetically-Induced-Transparency Cooling with a Tripod Structure in a Hyperfine Trapped Ion with Mixed-Species Crystals [0.0] 電磁誘導透明性(EIT)冷却は、相対速度、低レーザーパワー要件、幅広い冷却帯域に注目されている。
ここでは、25Mg+のEIT冷却にレーザーの余分な周波数を加えて成功したことを実証する。
この方法は、非ゼロ核スピンを持つ任意のイオンに応用できる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:19:44 GMT)
Efficient post-selection in light-cone correlations of monitored quantum circuits [0.0] 選択後の光円錐動的相関関数は、異なるユニタリ回路の平均相関から効率的に得られることを示す。
これは、ある回路における稀な測定結果と別の回路における典型的な結果とを結びつける。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:20:55 GMT)
EUR-USD Exchange Rate Forecasting Based on Information Fusion with Large Language Models and Deep Learning Methods [0.0] 本稿では、ニュースや分析からの非構造化テキストデータを交換レートや財務指標に関する構造化データと統合する新しいフレームワークIUSを提案する。
次に、オプトゥーナ最適化Bi-LSTMモデルを用いて、EUR/USD交換レートを予測する。
実験の結果、提案手法はベンチマークモデルを上回る性能を示し、MAEを10.69%、RMSEを9.56%削減した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:46:36 GMT)
Double Descent: Understanding Linear Model Estimation of Nonidentifiable Parameters and a Model for Overfitting [0.0] 我々は、最小二乗推定における通常の最小二乗推定と変分を考察する。
p>nと関連する問題と、新しい観測結果の予測について論じる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:19:17 GMT)
Demonstration of weighted graph optimization on a Rydberg atom array using local light-shifts [0.0] Rydberg 原子アレイ上での重み付きグラフ最適化の最初の実演を示す。
重み付きグラフを1次元および2次元配列で作成する能力を検証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 12:11:44 GMT)
Demonstration of Algorithmic Quantum Speedup for an Abelian Hidden Subgroup Problem [0.0] Simon の問題は、未知の 2$-to-$1$ 関数にエンコードされた隠された周期を見つけることである。
これは、理想的でノイズのない量子コンピュータにおいて指数的な量子スピードアップが証明された最も初期の問題の1つである。
隠れた周期がハミング重み$w$に制限されたシモン問題の変種に対するアルゴリズム的量子スピードアップを実証する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:18:11 GMT)
Data-Driven Dynamic Friction Models based on Recurrent Neural Networks [0.0] ゲーテッド・リカレント・ユニット(GRU)アーキテクチャに基づくリカレントニューラルネットワーク(RNN)は、合成データからレート・アンド・ステート摩擦則の複雑な力学を学習する。
その結果, GRUをベースとしたRNNは, 速度ジャンプによる摩擦係数の変化を効果的に予測できることがわかった。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:08:25 GMT)
CortexCompile: Harnessing Cortical-Inspired Architectures for Enhanced Multi-Agent NLP Code Synthesis [0.0] 神経科学の原則を自然言語処理に統合することは、自動コード生成に革命をもたらす可能性がある。
本稿では,ヒト脳皮質領域の特殊機能に触発された新しいモジュラーシステムであるCortexCompileについて述べる。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:36:20 GMT)
Constrained or Unconstrained? Neural-Network-Based Equation Discovery from Data [0.0] 我々はPDEをニューラルネットワークとして表現し、物理情報ニューラルネットワーク(PINN)に似た中間状態表現を用いる。
本稿では,この制約付き最適化問題を解くために,ペナルティ法と広く利用されている信頼領域障壁法を提案する。
バーガーズ方程式とコルトヴェーグ・ド・ヴライス方程式に関する我々の結果は、後者の制約付き手法がペナルティ法より優れていることを示している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 16:26:55 GMT)
Collective behavior in quantum interference: an alternative superposition principle [0.0] 全ての成分が量子体として扱われる干渉計は、標準解釈と、その非結合空間分離成分が集合的に作用するモデルを用いて検討される。
周波数シフトとリコイルの干渉係数の差は測定が困難であることが示されている。
集団散乱は標準モデルの代替となりうることが示され、3つ以上の体を持つ系における重ね合わせ原理の試験を構築するための洞察を与える。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 22:05:08 GMT)
CodeRefine: A Pipeline for Enhancing LLM-Generated Code Implementations of Research Papers [0.0] CodeRefineは、研究論文の方法論を大規模言語モデルを用いて機能コードに変換するためのフレームワークである。
我々の多段階アプローチはまず、論文からキーテキストチャンクを抽出して要約し、それらのコード関連性を分析し、知識グラフを作成する。
その後、この構造化表現からコードが生成され、提案されたリフレクション検索拡張生成アプローチによって拡張される。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 20:51:04 GMT)
Clustering-Based Validation Splits for Model Selection under Domain Shift [0.0] トレーニングバリデーション分割は2つのセット間の分布ミスマッチを最大化するべきである。
線形プログラミングを利用してスプリットのサイズ、ラベル、および(任意に)グループ分布を制御する制約付きクラスタリングアルゴリズムを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:35:26 GMT)
COVID-19 Probability Prediction Using Machine Learning: An Infectious Approach [0.0] 本研究は、新型コロナウイルス感染確率を予測するための高度な機械学習(ML)技術の適用について検討する。
我々はXGBoost, LGBM, AdaBoost, Logistic Regression, Decision Tree, RandomForest, CatBoost, KNN, Deep Neural Networks (DNN) などのMLモデルの有効性について厳密な調査を行った。
以上の結果から,Deep Neural Networks (DNN) が最高性能モデルとして登場し,精度が向上し,リコール指標が得られた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:15:24 GMT)
BoostTrack++: using tracklet information to detect more objects in multiple object tracking [0.0] 類似度尺度と過去の信頼度スコアに基づいて,新たな信頼度スコアを算出するソフト検出信頼度向上手法を提案する。
提案手法は,MOT17データセット上でのアート結果の近況と,MOT20データセット上でのアートHOTAとIDF1スコアの新たな状態を実現する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 11:44:21 GMT)
Augmented Functional Random Forests: Classifier Construction and Unbiased Functional Principal Components Importance through Ad-Hoc Conditional Permutations [0.0] 本稿では,木に基づく手法と関数型データ解析を統合した新しい教師付き分類手法を提案する。
機能的分類木と機能的ランダム林の拡張版を提案し,機能的主成分の重要性を評価するための新しいツールを取り入れた。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 15:58:41 GMT)
Atomic fluorescence collection into planar photonic devices [0.0] 個々のエミッタからの蛍光収集は、状態検出とリモート絡み合い生成において重要な役割を果たす。
平面フォトニクスは、閉じ込められたイオン系の堅牢でスケーラブルな対処のために実証されている。
遠距離場光子収集効率は、エミッタ位置のみの集光光学に関連付けられたフィールドで簡単に表現できることを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 17:53:19 GMT)
Atomic clock interferometry using optical tweezers [0.0] 我々は、クロック干渉計を実装するための光ツイーザを提案する。
提案するクロック干渉計は,光トラップに保持されるアルカリ性アース様原子を魔法の波長で利用している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 05:21:48 GMT)
Applying graph neural network to SupplyGraph for supply chain network [0.0] サプライチェーンネットワークは、製品の供給と需要の文脈における製品、製造設備、ストレージ間の相互作用を記述している。
本研究は、分析プロセス、データ品質保証、機械学習(ML)モデル仕様をより明確化し、サプライチェーンデータセットであるサプライグラフを評価した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 23:42:18 GMT)
An alternative formulation of attention pooling function in translation [0.0] 本稿では,翻訳作業における注目度評価関数の定式化について述べる。
数学的には、この公式は注意点行列(例えば$H$)を固定帯域幅を持つ帯域行列の空間に投影するものと考えることができる。
これは、$H$を最もよく近似する行列の存在を保証するコンパクトな部分空間であることを証明している。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:42:00 GMT)
An IoT Framework for Building Energy Optimization Using Machine Learning-based MPC [0.0] 本研究では,モノのインターネット(IoT)フレームワークを用いてエアハンドリングユニット(AHU)システムを制御するための,機械学習に基づくモデル予測制御(MPC)アプローチを提案する。
提案フレームワークは,ニューラルネットワーク(ANN)を用いて動的線形熱モデルパラメータをリアルタイムに構築する手法である。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 14:38:18 GMT)
Abstract Art Interpretation Using ControlNet [0.0] 我々は、ユーザがより細かい合成過程を制御できるようにし、合成画像のさらなる操作を可能にします。
抽象画に見られるミニマリスト形式に触発されて、三角形のような幾何学的原始的要素から作られた新しい条件を導入する。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 06:25:54 GMT)
A systematic review: Deep learning-based methods for pneumonia region detection [0.0] 肺炎は世界中の子供や成人の主要な死因の1つである。
診断プロセスの効率と精度を向上させるため, コンピュータ支援型肺炎検出法が開発されている。
本報告では, 肺炎領域の検出において, 従来主流であった深層学習アプローチを探索し, 検討した。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 18:00:22 GMT)
A Generalised Haldane Map from the Matrix Product State Path Integral to the Critical Theory of the $J_1$-$J_2$ Chain [0.0] 行列積状態(MPS)上に構築された経路積分について検討する。
非自明な絡み合い構造により、MPSアンザッツは半古典的、サドル点レベルでもモデルのキーフェーズをキャプチャする。
本稿では,MPSアンザッツが臨界相の場理論の物理的動機付けによる導出を促進することを示す。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 07:41:16 GMT)
A Comparison of Deep Learning and Established Methods for Calf Behaviour Monitoring [0.0] 本報告では,動物活動の認知に関する福祉モニタリング支援研究について報告する。
このデータは、ホルスタインとジャージーの子牛が装着した首輪搭載加速度センサーから得られたものだ。
振る舞いの変化を検出する上で重要な要件は、アクティビティをクラスに分類できることである。
論文参考訳(メタデータ) (Fri, 23 Aug 2024 13:02:24 GMT)