Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.7] 関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。
本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。
RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:24:32 GMT)
MMBench: Is Your Multi-modal Model an All-around Player? [114.5] 視覚言語モデルのマルチモーダル能力を評価するためのベンチマークであるMMBenchを提案する。
MMBenchは、よく設計された品質制御スキームで慎重にキュレートされている。
MMBenchは英語版と中国語版の両方で複数の質問を取り入れている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:56:03 GMT)
ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining [104.3] ShapeNetとModelNetを用いた大規模3DGSデータセットを構築した。
データセットのShapeSplatは、87のユニークなカテゴリから65Kのオブジェクトで構成されています。
textbftextitGaussian-MAEを導入し、ガウスパラメータからの表現学習の独特な利点を強調した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:49:14 GMT)
F-Eval: Assessing Fundamental Abilities with Refined Evaluation Methods [103.0] F-Evalは、表現、常識、論理などの基本能力を評価するためのバイリンガル評価ベンチマークである。
参照不要な主観的タスクに対しては,APIモデルによるスコアの代替として,新たな評価手法を考案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:27:44 GMT)
Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model [101.7] 離散的かつ連続的なデータに対してマルチモーダルモデルをトレーニングするためのレシピであるTransfusionを紹介する。
我々はテキストと画像の混合データに基づいて,テキストから最大7Bパラメータまでの複数のTransfusionモデルを事前訓練する。
実験の結果,Transfusionは画像の定量化や個別画像トークンによる言語モデルの訓練よりも,はるかに優れたスケールを実現していることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:48:20 GMT)
Unconditional Truthfulness: Learning Conditional Dependency for Uncertainty Quantification of Large Language Models [96.4] 対象変数が条件と非条件生成信頼度のギャップである回帰モデルを訓練する。
この学習条件依存モデルを用いて、前のステップの不確実性に基づいて、現在の生成ステップの不確かさを変調する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:42:26 GMT)
Auto-ICL: In-Context Learning without Human Supervision [93.1] 本稿では,モデルが問題解決のための例と指示を自律的に生成できる自動文脈学習フレームワークを提案する。
さまざまなモデルやデータセットにわたる実験により、結果は、モデル生成コンテキストが人間の注釈付きコンテキストより優れていることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:34:37 GMT)
InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds [91.8] スパース画像からの新しいビュー合成(NVS)は3次元コンピュータビジョンにおいて大きく進歩している。
これはStructure-from-Motion (SfM) を用いたカメラパラメータの正確な初期推定に依存する
本研究では,スパースビュー画像から堅牢なNVSを向上するための,新規で効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:57:47 GMT)
Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications [90.7] 大規模言語モデル(LLM)は高度な金融アプリケーションを持っているが、十分な財務知識がなく、テーブルや時系列データといったマルチモーダル入力に関わるタスクに苦労することが多い。
我々は、総合的な財務知識をテキスト、テーブル、時系列データに組み込む一連の金融LLMであるtextitOpen-FinLLMsを紹介する。
また、複雑な財務データ型を扱うために、1.43Mの画像テキスト命令で訓練されたマルチモーダルLLMであるFinLLaVAについても紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:15:28 GMT)
LongVILA: Scaling Long-Context Visual Language Models for Long Videos [86.3] LongVILAは、システム、モデルトレーニング、データセット開発を含む、長期コンテキストの視覚言語モデルのためのフルスタックソリューションである。
システム側では、長いトレーニングと推論が可能な最初の長文マルチモーダルシーケンス並列システム(MM-SP)を導入する。
MM-SPはリングシーケンスの並列性より2.1x - 5.7倍、Megatronコンテキストの並列性とテキストのみの設定におけるテンソル並列性より1.1x - 1.4倍速い。
モデルトレーニングでは、アライメント、事前学習、短い教師付き微調整、コンテキスト拡張を含む5段階パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:56:24 GMT)
New Job, New Gender? Measuring the Social Bias in Image Generation Models [85.3] 画像生成モデルは、社会的ステレオタイプとバイアスを永続するコンテンツを生成できる。
画像生成モデルにおける社会的バイアスを的確に、かつ、かつ、包括的に引き起こすことのできるフレームワークであるBiasPainterを提案する。
BiasPainterは、自動バイアス検出において90.8%の精度を達成することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:11:26 GMT)
A Manifold Perspective on the Statistical Generalization of Graph Neural Networks [84.0] グラフニューラルネットワーク(GNN)は、グラフ畳み込みの連続的な応用により、隣接ノードからの情報を結合する。
ノードレベルとグラフレベルの両方のタスクにおけるGNNの一般化ギャップについて検討する。
トレーニンググラフのノード数によって一般化ギャップが減少することを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:19:39 GMT)
PRformer: Pyramidal Recurrent Transformer for Multivariate Time Series Forecasting [82.0] Transformerアーキテクチャにおける自己保持機構は、時系列予測において時間順序を符号化するために位置埋め込みを必要とする。
この位置埋め込みへの依存は、トランスフォーマーの時間的シーケンスを効果的に表現する能力を制限している、と我々は主張する。
本稿では,Prepreを標準的なTransformerエンコーダと統合し,様々な実世界のデータセット上での最先端性能を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:56:07 GMT)
SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.5] SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:59:44 GMT)
Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.2] GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:41:10 GMT)
Analysis of Plan-based Retrieval for Grounded Text Generation [78.9] 幻覚は、言語モデルがそのパラメトリック知識の外で生成タスクが与えられるときに起こる。
この制限に対処するための一般的な戦略は、言語モデルに検索メカニズムを注入することである。
我々は,幻覚の頻度をさらに減少させるために,探索のガイドとして計画をどのように利用できるかを分析する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:19:35 GMT)
Using Unreliable Pseudo-Labels for Label-Efficient Semantic Segmentation [78.6] 私たちは、すべてのピクセルがモデルトレーニングに重要であり、信頼できない、曖昧なピクセルでさえも重要だと論じます。
我々は予測のエントロピーを通して信頼できないピクセルを分離し、信頼できない各ピクセルを負のキーからなるカテゴリワイドキューにプッシュする。
トレーニングの進化を考えると、信頼できない分割の閾値を適応的に調整する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:30:35 GMT)
Compression-Realized Deep Structural Network for Video Quality Enhancement [78.1] 本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:35:19 GMT)
V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning [76.3] ビデオ要約は、長いビデオの短く、正確で、結束的な要約を作ることを目的としている。
既存のデータセットのほとんどは、ビデオ間要約用に作成されている。
マルチモーダル映像要約への取り組みが近年行われている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:47:02 GMT)
MPL: Lifting 3D Human Pose from Multi-view 2D Poses [75.3] 本稿では,大規模かつリッチなトレーニングデータセットが存在する2次元ポーズ推定と,トランスフォーマーネットワークを用いた2次元から3次元ポーズリフトを提案する。
実験の結果,MPJPEの誤差は2次元ポーズを三角測量した3次元ポーズと比較して最大45%減少することがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:55:14 GMT)
CULTURE-GEN: Revealing Global Cultural Perception in Language Models through Natural Language Prompting [73.9] 110か国・地域での3つのSOTAモデルの文化認識を,文化条件付き世代を通して8つの文化関連トピックについて明らかにした。
文化条件付き世代は、デフォルトの文化と区別される余分な文化を区別する言語的な「マーカー」から成り立っていることが判明した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:53:45 GMT)
MUSE: Mamba is Efficient Multi-scale Learner for Text-video Retrieval [73.8] 効率的なクロスレゾリューションモデリングのための線形計算複雑性を持つマルチスケールマンバであるMUSEを提案する。
具体的には、最後の単一スケールのフィーチャーマップに特徴ピラミッドを適用することで、マルチスケールの表現を生成する。
我々は,Mamba構造を効率的なマルチスケール学習者として用いて,スケールワイド表現を共同学習する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:30:37 GMT)
Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance [72.7] 本稿では,3次元ラベルを必要とせずに2次元ドメインと3次元ドメイン間の制約を活用できるフレームワークを提案する。
具体的には、LiDARと画像特徴をオブジェクト認識領域に基づいて整列する特徴レベルの制約を設計する。
第二に、出力レベルの制約は、2Dと投影された3Dボックスの推定の重なりを強制するために開発される。
第3に、トレーニングレベルの制約は、視覚データと整合した正確で一貫した3D擬似ラベルを生成することによって利用される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:12:31 GMT)
Analytical and Empirical Study of Herding Effects in Recommendation Systems [72.7] 評価アグリゲーションルールとショートリストされた代表レビューを用いて製品評価を管理する方法について検討する。
本稿では,Amazon と TripAdvisor の収束速度を向上させるために,適切な信頼度評価アグリゲーションルールが有効であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:29:23 GMT)
PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety [70.8] 大規模言語モデル(LLM)で拡張されたマルチエージェントシステムは、集団知能において重要な能力を示す。
しかし、悪意のある目的のためにこのインテリジェンスを誤用する可能性があり、重大なリスクが生じる。
本研究では,エージェント心理学を基盤とした枠組み(PsySafe)を提案し,エージェントのダークパーソナリティ特性がリスク行動にどう影響するかを明らかにする。
実験の結果,エージェント間の集団的危険行動,エージェントが危険な行動を行う際の自己反射,エージェントの心理的評価と危険な行動との相関など,いくつかの興味深い現象が明らかになった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:45:50 GMT)
"Image, Tell me your story!" Predicting the original meta-context of visual misinformation [70.5] オープンウェブから検索した画像の内容とテキスト証拠を用いて,画像を元のメタコンテキストにグラウンドする自動システムを導入する。
実験では,検索と推論におけるいくつかのオープンな課題を強調しながら,有望な結果を示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:59:22 GMT)
Multi-agent Multi-armed Bandits with Stochastic Sharable Arm Capacities [69.3] 我々は、各アームへのリクエストの到着とプレイヤーへのリクエストの割り当てポリシーをキャプチャするマルチプレイヤーマルチアーム・バンディット(MAB)モデルの新しいバリエーションを定式化する。
課題は、プレイヤーが最適な腕引きプロファイルに従って腕を選択するように分散学習アルゴリズムを設計する方法である。
我々は,Mラウンドのみの最適腕引きプロファイルにおいて,プレイヤーがコンセンサスに達することを保証した反復分散アルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:57:00 GMT)
MambaDS: Near-Surface Meteorological Field Downscaling with Topography Constrained Selective State Space Modeling [68.7] 気象予測において重要な課題であるダウンスケーリングは、ターゲット領域に対する高解像度気象状態の再構築を可能にする。
以前のダウンスケーリング手法には気象学のための調整された設計が欠けており、構造的な限界に遭遇した。
本稿では,多変数相関と地形情報の利用性を高める新しいモデルであるMambaDSを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:45:49 GMT)
How Much are Large Language Models Contaminated? A Comprehensive Survey and the LLMSanitize Library [68.1] 大規模言語モデル(LLM)は、ビジネスアプリケーションやAIの資金調達でますます利用されている。
LLMの性能は、データへの以前の露出のために、少なくとも部分的には高性能である可能性があるため、もはや信頼性が低い可能性がある。
我々はLLMSanitizeというオープンソースのPythonライブラリをリリースし、主要な汚染検知アルゴリズムを実装した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:51:26 GMT)
Inside the Black Box: Detecting Data Leakage in Pre-trained Language Encoders [68.0] 我々は、事前学習した言語エンコーダから適応した下流モデルを通して、事前学習したデータのメンバシップリークに焦点を当てた。
評価の結果,下流モデルのブラックボックス出力のみを露呈しても,メンバシップリークの存在が確認された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:55:15 GMT)
Predicting Rewards Alongside Tokens: Non-disruptive Parameter Insertion for Efficient Inference Intervention in Large Language Model [66.7] オッターは、複数の需要のあるタスクに対して最先端のパフォーマンスを提供し、86.5%の余剰スペースと98.5%の余剰時間を節約している。
Otterは既存の推論エンジンとシームレスに統合され、1行のコードの変更しか必要としない。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:00:35 GMT)
SZTU-CMU at MER2024: Improving Emotion-LLaMA with Conv-Attention for Multimodal Emotion Recognition [65.2] 我々は,マルチモーダル感情認識におけるMER2024チャレンジのMER-NOISEとMER-OVトラックに対する勝利のアプローチを示す。
Emotion-LLaMAの高度な感情理解機能を利用して、ラベルなしサンプルの高品質なアノテーションを生成する。
MER-OVトラックでは,オープンボキャブラリアノテーションにEmotion-LLaMAを用いることで,GPT-4Vと比較して平均精度とリコールが8.52%向上した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:46:03 GMT)
GaussianStyle: Gaussian Head Avatar via StyleGAN [64.9] 本稿では,3DGSのボリューム強度とStyleGANの強力な暗黙表現を統合する新しいフレームワークを提案する。
提案手法は, 再現性, 新規なビュー合成, アニメーションにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:40:18 GMT)
Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.8] 本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:51:04 GMT)
Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations [63.7] 自己教師付き表現学習は、しばしばデータの「スタイル」属性を誘導するためにデータ拡張を使用する。
データの属性が実際に"スタイル"であり、安全に破棄されるような先入観を推論することは困難である。
スタイル機能を捨てるよりも、スタイル機能を切り離そうとする、より原則化されたアプローチを導入します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:33:12 GMT)
Segment, Select, Correct: A Framework for Weakly-Supervised Referring Segmentation [63.1] 参照画像(RIS)は、自然言語文を通して画像中の物体を識別する問題である。
本稿では、RISを3つのステップに分解することで、RISに対処する弱い教師付きフレームワークを提案する。
最初の2ステップ(ゼロショットセグメントとセレクト)のみを使用して、他のゼロショットベースラインを最大16.5%上回る。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:35:24 GMT)
SAM Meets UAP: Attacking Segment Anything Model With Universal Adversarial Perturbation [61.7] 画像認識不能なユニバーサル適応摂動(UAP)を用いてSAM(Segment Anything Model)を攻撃できるかどうかを検討する。
自己教師付きコントラスト学習(CL)に基づくUAP生成手法を実現する新しい摂動中心フレームワークを提案する。
CLを用いたUAP生成手法の有効性を定量的および定性的に検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:10:24 GMT)
D$^3$FlowSLAM: Self-Supervised Dynamic SLAM with Flow Motion Decomposition and DINO Guidance [61.1] 本稿では,動的シーンにおいて動的コンポーネントを正確に識別しながら頑健に動作する自己教師型ディープSLAM法を提案する。
本稿では,この表現に基づく動的更新モジュールを提案し,動的シナリオに優れた高密度SLAMシステムの開発を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:14:46 GMT)
CAUSE: Counterfactual Assessment of User Satisfaction Estimation in Task-Oriented Dialogue Systems [60.3] 我々は,大規模言語モデル(LLM)を利用して,満足度を考慮した対実対話を生成する。
生成されたサンプルの信頼性を確保するために、人間のアノテーションを収集します。
この結果から,TODシステムにおけるユーザ満足度推定のためのデータ拡張手法の必要性が明らかになった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:56:18 GMT)
Fake News in Sheep's Clothing: Robust Fake News Detection Against LLM-Empowered Style Attacks [60.1] SheepDogは、ニュースの正確性を決定する際に、スタイルよりもコンテンツを優先する、スタイルに反する偽ニュース検出ツールだ。
SheepDog はこのレジリエンスを,(1) LLM を利用したニュースリフレーミング,(2) 異なるスタイルに対応する記事のカスタマイズによる学習プロセスへのスタイル多様性の注入,(2) スタイルの異なるリフレーミング間で一貫した妥当性予測を保証するスタイル非依存のトレーニング,(3) LLM からコンテンツ中心のガイドラインを抽出して偽ニュースを抽出するコンテンツ中心の属性を通じて達成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:28:14 GMT)
Automating Knowledge Discovery from Scientific Literature via LLMs: A Dual-Agent Approach with Progressive Ontology Prompting [60.0] LLM-Duoという,プログレッシブプロンプトアルゴリズムとデュアルエージェントシステムを組み合わせた,大規模言語モデル(LLM)に基づく新しいフレームワークを提案する。
言語治療領域における64,177論文からの2,421件の介入を同定した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:42:23 GMT)
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks [59.5] 我々は、オフラインのRLとオフラインのMARLをカバーする、事前コンパイルされたデータセットの包括的なセットであるHokoffを提案する。
このデータは、Multiplayer Online Battle Arena(MOBA)ゲームとして認知されているHonor of Kingsに由来する。
また,ゲーム固有の階層的アクション空間に適した,新しいベースラインアルゴリズムを導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:38:50 GMT)
MoDeGPT: Modular Decomposition for Large Language Model Compression [59.4] 本稿では,新しい構造化圧縮フレームワークである textbfModular bfDecomposition (MoDeGPT) を紹介する。
MoDeGPTはTransformerブロックを行列対からなるモジュールに分割し、隠れた次元を減らす。
本実験では, 後方伝播を伴わないMoDeGPTが, 従来の圧縮手法と一致するか, あるいは超えていることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:28:27 GMT)
Clarify: Improving Model Robustness With Natural Language Corrections [59.0] モデルを教える標準的な方法は、大量のデータを提供することです。
このアプローチは、データ内の誤解を招く信号を拾うため、モデルに誤ったアイデアを教えることが多い。
モデル誤解をインタラクティブに修正するためのインターフェースと手法であるClarifyを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:00:32 GMT)
QPO: Query-dependent Prompt Optimization via Multi-Loop Offline Reinforcement Learning [58.8] クエリ依存型プロンプト最適化(QPO)を導入し、入力クエリに合わせて最適なプロンプトを生成するために、小さな事前訓練された言語モデルを反復的に微調整する。
我々は、オープンソースのタスクに様々なプロンプトをベンチマークする副産物として、すでに大量に存在するオフラインのプロンプトデータから洞察を得る。
様々なLLMスケールと多様なNLPおよび数学タスクの実験は、ゼロショットと少数ショットの両方のシナリオにおいて、我々の手法の有効性とコスト効率を実証している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:06:48 GMT)
TrackNeRF: Bundle Adjusting NeRF from Sparse and Noisy Views via Feature Tracks [57.7] TrackNeRFは新しいベンチマークをノイズとスパースビューの再構築で設定する。
TrackNeRFは最先端のBARFとSPARFよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:14:23 GMT)
RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.6] ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:56:52 GMT)
CO2Wounds-V2: Extended Chronic Wounds Dataset From Leprosy Patients [57.3] 本稿では,レプロシー患者のRGB創傷画像の拡張コレクションであるCO2Wounds-V2データセットについて紹介する。
医療分野における画像処理アルゴリズムの開発とテストを強化することを目的としている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:21:57 GMT)
SearchLVLMs: A Plug-and-Play Framework for Augmenting Large Vision-Language Models by Searching Up-to-Date Internet Knowledge [56.8] 大規模視覚言語モデル(LVLM)は、LLaVAシリーズのような最新の知識を知らない。
本稿では,サーチLVLMと呼ばれる最新の知識に関する視覚的質問応答(VQA)を扱うために,既存のLVLMを増補するプラグイン・アンド・プレイフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:04:25 GMT)
MEGen: Generative Backdoor in Large Language Models via Model Editing [56.5] 大規模言語モデル(LLM)は目覚ましい能力を示している。
その強力な生成能力は、様々なクエリや命令に基づいて柔軟な応答を可能にする。
本稿では,最小サイドエフェクトでNLPタスクをカスタマイズしたバックドアを構築することを目的とした,MEGenという編集ベースの生成バックドアを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:44:29 GMT)
Recurrent Neural Networks Learn to Store and Generate Sequences using Non-Linear Representations [54.2] 線形表現仮説(LRH)に対する反例を提示する。
入力トークンシーケンスを繰り返すように訓練されると、ニューラルネットワークは、方向ではなく、特定の順序で各位置のトークンを表現することを学ぶ。
これらの結果は、解釈可能性の研究はLRHに限定されるべきでないことを強く示唆している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:04:37 GMT)
Efficient and Deployable Knowledge Infusion for Open-World Recommendations via Large Language Models [53.5] 大規模言語モデル(LLM)からユーザとアイテムに関する2種類の外部知識を取得するためのREKIを提案する。
個別の知識抽出と個別の知識抽出を,異なるシナリオのスケールに合わせて開発し,オフラインのリソース消費を効果的に削減する。
実験によると、REKIは最先端のベースラインより優れており、多くの推奨アルゴリズムやタスクと互換性がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:45:24 GMT)
Kalib: Markerless Hand-Eye Calibration with Keypoint Tracking [52.4] ハンドアイキャリブレーションでは、カメラとロボット間の変換を推定する。
ディープラーニングの最近の進歩は、マーカーレス技術を提供するが、それらは課題を提示している。
自動的かつ普遍的なマーカーレスハンドアイキャリブレーションパイプラインであるKalibを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:03:40 GMT)
Deep Generative Models in Robotics: A Survey on Learning from Multimodal Demonstrations [52.1] 近年、ロボット学習コミュニティは、大規模なデータセットの複雑さを捉えるために、深層生成モデルを使うことへの関心が高まっている。
本稿では,エネルギーベースモデル,拡散モデル,アクションバリューマップ,生成的敵ネットワークなど,コミュニティが探求してきたさまざまなモデルについて述べる。
また,情報生成から軌道生成,コスト学習に至るまで,深層生成モデルを用いた様々なアプリケーションについて述べる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:45:29 GMT)
GECO: Generative Image-to-3D within a SECOnd [51.2] 本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。
GECOは、前例のないレベルの効率で高品質な3Dメッシュ生成を実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:54:10 GMT)
Large Language Models for Multimodal Deformable Image Registration [50.9] そこで本研究では,様々な医用画像からの深い特徴の整合を図るために,新しい粗いMDIRフレームワークLLM-Morphを提案する。
具体的には、まずCNNエンコーダを用いて、クロスモーダル画像ペアから深い視覚的特徴を抽出し、次に、最初のアダプタを使ってこれらのトークンを調整する。
第3に、トークンのアライメントのために、他の4つのアダプタを使用して、LLM符号化トークンをマルチスケールの視覚特徴に変換し、マルチスケールの変形場を生成し、粗いMDIRタスクを容易にする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:58:30 GMT)
Total Uncertainty Quantification in Inverse PDE Solutions Obtained with Reduced-Order Deep Learning Surrogate Models [50.9] 機械学習サロゲートモデルを用いて得られた逆PDE解の総不確かさを近似したベイズ近似法を提案する。
非線型拡散方程式に対する反復的アンサンブルスムーズおよび深層アンサンブル法との比較により,提案手法を検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:06:02 GMT)
From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.8] GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:19:06 GMT)
Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [49.9] 大規模言語モデル(LLM)は、特殊モデルから多目的基礎モデルへと移行してきた。
LLMは印象的なゼロショット能力を示すが、ローカルデータセットとデプロイメントのための重要なリソースを微調整する必要がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:42:17 GMT)
REInstruct: Building Instruction Data from Unlabeled Corpus [49.8] 本稿では,ラベルのないコーパスから命令データを自動的に構築するREInstructを提案する。
Llama-7bをREInstructから3kシードデータと32k合成データの組み合わせで訓練することにより、微細調整されたモデルがAlpacaEvalのリーダーボード上でテキストダヴィンチ003に対して65.41%の勝利率を達成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:05:03 GMT)
A Roadmap to Pluralistic Alignment [49.3] 本稿では,言語モデルをテストベッドとして用いた多元的アライメントのロードマップを提案する。
我々は,AIシステムにおける多元性を定義・運用する3つの可能な方法を特定し,定式化する。
我々は、現在のアライメント技術は、基本的に多元的AIに限られていると論じる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:14:31 GMT)
Rethinking the Zigzag Flattening for Image Reading [49.0] 我々はHilbert fractal flattening (HF) をコンピュータビジョンにおけるシーケンスオーダの別の方法として検討する。
HFは空間的局所性を維持する上で他の曲線よりも優れていることが証明されている。
ほとんどのディープニューラルネットワーク(DNN)に簡単に接続できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:31:41 GMT)
Large Point-to-Gaussian Model for Image-to-3D Generation [49.0] 2次元画像上での3次元拡散モデルから生成された初期点雲を入力する大規模点-ガウスモデルを提案する。
点雲はガウス生成に先立って最初の3次元幾何学を提供し、画像から3次元生成を著しく促進する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:17:53 GMT)
Disparate Impact on Group Accuracy of Linearization for Private Inference [48.3] 多数派と比較して,ReLUアクティベーション数の減少は少数派に対する精度を著しく低下させることを示す。
また,線形化モデルの微調整手順を変更する簡単な手順が,効果的な緩和戦略として有効であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:08:53 GMT)
CooPre: Cooperative Pretraining for V2X Cooperative Perception [47.0] 本稿では,V2X協調認識のための自己教師付き学習手法を提案する。
膨大な量のラベルのない3D V2Xデータを用いて知覚性能を向上させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:39:26 GMT)
Normalise for Fairness: A Simple Normalisation Technique for Fairness in Regression Machine Learning Problems [46.9] 回帰問題に対する正規化(FaiReg)に基づく単純かつ効果的な手法を提案する。
データバランシングと敵対的トレーニングという,公正性のための2つの標準的な手法と比較する。
その結果、データバランスよりも不公平さの影響を低減できる優れた性能を示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:31:45 GMT)
QA-MDT: Quality-aware Masked Diffusion Transformer for Enhanced Music Generation [46.3] 本稿では,高品質な学習戦略を取り入れた高品質音楽生成のための新しいパラダイムを提案する。
我々はまず,TTMタスクにマスク付き拡散トランスフォーマー(MDT)モデルを適用し,その品質管理能力と音楽性の向上を実証した。
実験では、MusicCapsとSong-Describerデータセット上でのSOTA(State-of-the-art)のパフォーマンスを実証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:54:40 GMT)
Atmospheric Transport Modeling of CO$_2$ with Neural Networks [46.3] 大気中のCO$の分布を大気トレーサー輸送モデルで正確に記述することは、温室効果ガスモニタリングおよび検証支援システムに不可欠である。
大きな深層ニューラルネットワークは、大気の3Dモデリングを必要とする気象予報に革命を起こす可能性がある。
本研究では,気象予測の最先端として実証された4種類の深層ニューラルネットワークについて検討し,大気トレーサー輸送モデルの有用性について検討した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:33:20 GMT)
Event Stream based Sign Language Translation: A High-Definition Benchmark Dataset and A New Algorithm [46.0] 本稿では,手話翻訳における高精細イベントストリームの利用を提案する。
イベントストリームは高ダイナミックレンジと高密度の時間信号を持ち、照度が低く、動きがぼやけやすい。
本稿では,CNNの特徴の時間的情報を統合するMambaモデルの能力を完全に活用する新しいベースライン手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:01:30 GMT)
HMoE: Heterogeneous Mixture of Experts for Language Modeling [45.7] 伝統的に、Mixture of Experts (MoE)モデルは同一容量の均一なエキスパートを使用する。
本稿では,HMOE(Heterogeneous Mixture of Experts)を提案する。
HMoEは、活性化パラメータを少なくして低い損失を達成し、様々な事前学習評価ベンチマークにおいて、従来の均質なMoEモデルより優れる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:35:24 GMT)
Domain Adaptation based Object Detection for Autonomous Driving in Foggy and Rainy Weather [44.7] ドメインギャップのため、晴れた天候下で訓練された検出モデルは、霧や雨の条件下ではうまく機能しない可能性がある。
霧や雨の天候下での領域ギャップを埋め、オブジェクト検出の性能を向上させるため、ドメイン適応型オブジェクト検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:36:09 GMT)
Probing the Safety Response Boundary of Large Language Models via Unsafe Decoding Path Generation [44.1] 大きな言語モデル(LLM)は暗黙のトラブルメーカーである。
LLMは有害なデータ収集や隠蔽攻撃に使用できる。
私たちはこのデコード戦略をJVD(Jailbreak Value Decoding)と名付けます。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:11:21 GMT)
Fast Algorithms and Implementations for Computing the Minimum Distance of Quantum Codes [44.0] 安定化器量子コードの距離は、検出および修正可能なエラーの数を決定する。
本稿では,関連する古典符号のシンプレクティック距離を計算するために,3つの新しい高速アルゴリズムと実装を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:24:30 GMT)
OpenScan: A Benchmark for Generalized Open-Vocabulary 3D Scene Understanding [43.7] Open-vocabulary 3D scene understanding (OV-3D)は、閉じたオブジェクトクラス以外の新しいオブジェクトをローカライズし分類することを目的としている。
既存のアプローチとベンチマークは、主にオブジェクトクラスのコンテキスト内のオープンな語彙の問題に焦点を当てている。
我々は、オブジェクトクラスを超えたオープンな語彙問題を探索するために、汎用オープン語彙3Dシーン理解(GOV-3D)と呼ばれるより困難なタスクを導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:31:48 GMT)
Speech Representation Learning Revisited: The Necessity of Separate Learnable Parameters and Robust Data Augmentation [43.5] 我々は、学習可能なパラメータを別々に使用して、他の情報をモデリングすることの重要性を理解するための予備的研究を行う。
まず、O-HuBERT法は、すべてのレイヤを利用して、他の情報をエンコードする複雑な機能を構築することができ、次に、他の情報に依存するタスクに必要な情報を学ぶために、堅牢なデータ拡張戦略が不可欠である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:45:04 GMT)
Beyond the Typical: Modeling Rare Plausible Patterns in Chemical Reactions by Leveraging Sequential Mixture-of-Experts [43.0] TransformerやVAEのような生成モデルは一般的に反応生成物を予測するために使用される。
反応物と電子再分配パターンのマッピング空間を分割・分散的に整理することを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:52:56 GMT)
Large Language Models Know What Makes Exemplary Contexts [42.9] In-context Learning (ICL) は、Large Language Model (LLM) の発展において重要な機能であることが証明されている。
本稿では,LLMのための統合フレームワークを提案する。このフレームワークにより,影響力のあるインコンテキストのサンプルを自己選択してコンテキストを構成することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:50:48 GMT)
MambaLoc: Efficient Camera Localisation via State Space Model [42.9] 位置情報は、端末デバイスと自動運転車や拡張現実のようなエッジクラウドIoTシステムの自動化とインテリジェンスにとって重要なものだ。
さまざまなIoTアプリケーションにまたがる信頼性の高い位置決めを実現することは、トレーニングコストの大幅な増加と、密集したデータの必要性により、依然として困難である。
我々は,選択状態空間(SSM)モデルを視覚的ローカライゼーションに革新的に応用し,MambaLocという新しいモデルを導入した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:44:42 GMT)
Recent Advances in End-to-End Simultaneous Speech Translation [42.6] 同時音声翻訳(SimulST)は、音声入力を継続的に処理しながら、リアルタイムに翻訳を生成するタスクである。
本稿では,SimulST研究の最近の展開を概観し,4つの課題に焦点をあてる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:47:49 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [42.4] 本稿では,オープン語彙フレームワークを用いた複数のオブジェクトカテゴリの同時カウントを実現するための,より実践的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察(優先順位)を用いて、ユーザが指定した複数のカテゴリのオブジェクトをカウントすることで際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示し、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:08:48 GMT)
How Well Do Large Language Models Serve as End-to-End Secure Code Producers? [42.1] GPT-3.5 と GPT-4 の 4 つの LLM で生成されたコードの脆弱性を識別し,修復する能力について検討した。
4900のコードを手動または自動でレビューすることで、大きな言語モデルにはシナリオ関連セキュリティリスクの認識が欠けていることが判明した。
修復の1ラウンドの制限に対処するため,LLMにより安全なソースコード構築を促す軽量ツールを開発した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:42:29 GMT)
Proposal of an optical Bell's experiment to test the boundary between determinism and indeterminism in Quantum Mechanics [41.9] 量子力学において、決定論と不決定論の間に明らかに不連続な境界が存在することが最近指摘された。
本稿では,他のパリティの結果によって中断されたパリティの結果の分布を記録することによって,この境界を探索することを提案する。
これらの分布の特徴は、臨界点付近の角度設定の小さな回転に対して、基礎となる過程が非決定論的であるか否かを示す可能性がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:48:08 GMT)
Multimodal self-supervised learning for lesion localization [41.7] テキストレポートから全文を局所的意味的アライメントの基本単位として取り出す新しい手法が導入された。
このアプローチは胸部X線画像と対応するテキストレポートを組み合わせることで、グローバルレベルとローカルレベルの両方でコントラスト学習を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:49:28 GMT)
Multi-view Hand Reconstruction with a Point-Embedded Transformer [41.4] この研究は、POEMという名前の新規で一般化可能なマルチビューハンドメッシュ再構成モデルを導入している。
POEMは実世界のハンドモーションキャプチャのシナリオで実用化するために設計されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:42:17 GMT)
PersonViT: Large-scale Self-supervised Vision Transformer for Person Re-Identification [41.2] 本稿では,最近登場したMasked Image Modeling (MIM) の自己教師型学習手法について紹介する。
大規模な教師なし事前訓練を通じて、高品質でグローバルな特徴とローカルな特徴を効果的に抽出する。
MSMT17、Market1501、DukeMTMC-reID、Occluded-Dukeなど、公開されているベンチマークデータセットの最先端結果を実現している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:50:29 GMT)
MsMemoryGAN: A Multi-scale Memory GAN for Palm-vein Adversarial Purification [40.8] 本稿では,MsMemoryGANという新しい防衛モデルを提案する。
MsMemoryGANは、メモリに記録された通常のパターンのより少ない原型要素を使用することで、入力を再構築することを学ぶ。
本手法では, 血管分類器が高い認識精度を達成できるため, 様々な逆方向の摂動を除去する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:46:30 GMT)
Leveraging LLMs for the Quality Assurance of Software Requirements [40.6] ISO 29148標準に従って,ソフトウェア要件の品質特性を評価するために,LLM(Large Language Model)の能力を導入,評価する。
本稿では,LCMが要求をどう評価するか,その意思決定プロセスを説明するとともに,要件の改良版を提案する能力について考察する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:17:50 GMT)
Beyond English-Centric LLMs: What Language Do Multilingual Language Models Think in? [40.5] 我々は、英語中心のLLMが、その強い性能にもかかわらず、それぞれの支配言語に「思考」があるかどうかを考察する。
内部の$textbflatent Language$のように表現します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:05:41 GMT)
Does Current Deepfake Audio Detection Model Effectively Detect ALM-based Deepfake Audio? [40.4] 音声言語モデル(ALM)は、大規模言語モデルと音声ニューラルコーデックの発展により急速に進歩している。
本稿では,ALM音声に対する電流対策(CM)の有効性について検討する。
その結果,最新のCMはALMに基づく音声を効果的に検出でき,ほとんどのALM試験条件下では0%の誤差率が得られることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:45:34 GMT)
Surrogate-Assisted Search with Competitive Knowledge Transfer for Expensive Optimization [39.4] 重大最適化問題 (EOP) は, 様々な応用に応用されているため, 何十年にもわたって研究の関心が高まりつつある。
多くの高度なサロゲート支援進化アルゴリズム (SAEA) にもかかわらず、これらのアルゴリズムの多くは以前に解決されたタスクから知識を伝達する能力に欠けていた。
様々なSAEAを促進するために,プラグアンドプレイの知識伝達手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:21:07 GMT)
MegaFusion: Extend Diffusion Models towards Higher-resolution Image Generation without Further Tuning [38.6] MegaFusionは、既存の拡散ベースのテキスト-画像生成モデルを拡張して、効率的な高解像度生成を実現する。
我々は、異なる解像度でデノナイジングプロセスをブリッジするために、革新的なトランケートとリレー戦略を採用しています。
拡張畳み込みとノイズ再スケジューリングを統合することで、より高分解能のモデルに先行するモデルをさらに適応させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:53:34 GMT)
Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection [38.2] QAT(Quantization-Aware Training)は、重みとアクティベーションの冗長性を低減するための代表的なモデル圧縮手法である。
既存のQATメソッドの多くは、データセット全体のエンドツーエンドのトレーニングを必要とします。
トレーニング中の各試料の重要性を定量化するために, 量化重量の損失と勾配の分析に基づく2つの指標を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:37:12 GMT)
Surgical Workflow Recognition and Blocking Effectiveness Detection in Laparoscopic Liver Resections with Pringle Maneuver [37.3] 腹腔鏡下肝切除におけるプリングル手術 (PM) は, 出血を減少させ, 明確な手術観を提供することを目的としている。
ワークフロー認識とブロック有効性検出の2つの補完的AI支援手術モニタリングタスクを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:32:50 GMT)
QUITO-X: An Information Bottleneck-based Compression Algorithm with Cross-Attention [37.3] 本稿では,メトリクスが要求する特性を調べるために,情報ボトルネック理論を導入する。
これに影響を受け、エンコーダ・デコーダアーキテクチャにおけるクロスアテンションを新しいメトリクスとして使用します。
我々の単純な手法は、レイテンシーの低い小さなモデルでは大幅に性能が向上する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:44:45 GMT)
Dependable Classical-Quantum Computer Systems Engineering [37.2] 本稿では,統合の課題を特定し,失敗を予測し,HPC-QCシステムの多種多様な共同設計を促進することを目的とする。
この新たな学際的取り組みの焦点は、ハイブリッドシステムの信頼性を保証するエンジニアリング原則を開発することである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:57:17 GMT)
SubgoalXL: Subgoal-based Expert Learning for Theorem Proving [37.1] SubgoalXLは、正規の定理証明を強化するために、専門家の学習とサブゴールベースの証明を相乗化する新しいアプローチである。
SubgoalXLは、標準のminiF2Fデータセット上で、Isabelleで56.1%の最先端パフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:10:53 GMT)
Microsatellite-based real-time quantum key distribution [37.0] 量子衛星コンステレーションは、グローバルスケールでの量子ネットワークを促進するソリューションを提供する。
携帯型地上局を用いた空間間量子鍵分布(QKD)を実現する量子マイクロサテライトを開発した。
我々は、1つの衛星パスで最大0.59万ビットのセキュアなキーを共有することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:42:15 GMT)
Multilingual Non-Factoid Question Answering with Silver Answers [36.3] この研究は、非ファクトイデアルな質問を持つ多言語QuADであるMuNfQuADを提示する。
BBCニュース記事の疑わしいサブヘッドを質問として、それに対応する段落を銀の回答として利用する。
データセットは38言語にまたがる370万以上のQAペアで構成され、いくつかの低リソース言語を含んでいる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:37:06 GMT)
Enhancing Adversarial Transferability with Adversarial Weight Tuning [36.1] 敵対的な例(AE)は、人間の観察者に対して良心を抱きながらモデルを誤解させた。
AWTは、勾配に基づく攻撃法とモデルに基づく攻撃法を組み合わせて、AEの転送可能性を高めるデータフリーチューニング手法である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:28:55 GMT)
NeCo: Improving DINOv2's spatial representations in 19 GPU hours with Patch Neighbor Consistency [35.8] NeCo: Patch Neighbor Consistencyは、学生モデルと教師モデルにまたがる、パッチレベルの近接一貫性を強制する新しいトレーニング損失である。
本手法は,DINOv2-Registersのような事前学習された表現の上に適用された微分可能なソート手法を用いて学習信号をブートストラップする。
この厳密な事前トレーニングは、単一のGPUで19時間しか必要とせず、さまざまなモデルやデータセットでパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:58:59 GMT)
Feature Selection from Differentially Private Correlations [35.2] 高次元回帰はデータセット内の個々のデータポイントに関する情報をリークすることができる。
相関に基づく順序統計を用いて、データセットから重要な特徴を選択し、それらを民営化する。
提案手法は,多くのデータセット上でのプライベートな特徴選択において,確立されたベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:54:07 GMT)
Microwave-driven multistability in a strongly interacting Rydberg atoms [34.5] 我々は、マイクロ波場強度を変化させることで、不安定状態の状態から強く相互作用するリドベルク原子の多重性への相転移を観察する。
報告された結果は、散逸性リドバーグ原子系における乗算可能性の操作に光を当て、非平衡多体物理学の応用に期待を持てる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:28:35 GMT)
Large Language Model Driven Recommendation [34.5] 言語主導のレコメンデーションの出現は、リコメンデーションのための自然言語(NL)インタラクションの使用を解放した。
この章では、LLMの一般NL能力が、高度にパーソナライズされたRSを構築する新しい機会を導く方法について論じる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:36:24 GMT)
More Options for Prelabor Rupture of Membranes, A Bayesian Analysis [34.3] PROM (prelabor rupture of membranes) の患者は頚椎リライニング(英語版)、ピトシン(英語版)、ミソプロストオール(英語版)の2つの選択肢しか使用していない。
産婦人科でよく用いられるtextitBishop スコアの違いを考慮できないことが, 産婦人科関連研究の最も大きな限界となっている。
本研究では,専門医が伝達する関連因子間の関係をベイズモデルを用いて解析し,その影響から相反する変数を分離する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:05:25 GMT)
Vision Calorimeter for Anti-neutron Reconstruction: A Baseline [32.9] ビジョン・カロリメータ (ViC) は、深層学習検出器を用いた反中性子再構成のためのベースライン法である。
ViCは従来の再建手法よりも大幅に優れており、インシデント位置の予測誤差を42.81%削減している。
本研究は, インシデント$barn$運動量の測定を初めて実現した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:14:28 GMT)
Genesis: Towards the Automation of Systems Biology Research [32.7] 我々はGenesisという次世代ロボット科学者を開発している。
我々は,ロボット科学者を用いた科学の分野を,人間科学者よりも明らかに速く,低コストで研究できることを実証することを目的とする。
ここでは、Genesisプロジェクトの進捗状況を報告する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:40:43 GMT)
Strategist: Learning Strategic Skills by LLMs via Bi-Level Tree Search [32.7] 本手法はモンテカルロ木探索とLLMに基づく反射による自己再生シミュレーションにより品質フィードバックを収集する。
本手法は,従来の強化学習手法よりも優れた性能でエージェントを訓練する上で有効であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:22:04 GMT)
PooDLe: Pooled and dense self-supervised learning from naturalistic videos [32.7] 本稿では,プール表現における不変性に基づくSSL目的と高密度SSL目標とを組み合わせた新しいアプローチを提案する。
BDD100K駆動ビデオデータセットとウォーキングツアーの1対1ビデオデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:40:48 GMT)
SVIPTR: Fast and Efficient Scene Text Recognition with Vision Permutable Extractor [32.3] シーンテキスト認識は構造化情報データベースを構築する上で重要かつ困難なタスクである。
現在のSTRのSOTAモデルは高い性能を示すが、推論効率は低い。
高速かつ効率的なシーンテキスト認識のための第3次可変抽出器を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:34:29 GMT)
DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset [32.2] 生成したビデオのオープンソースデータセットと検出手法を初めて提案する。
まず,964のプロンプトからなるスケーラブルなデータセットを提案する。
第二に、空間的人工物に基づく検出器が一般化性に欠けていることの探索実験により明らかになった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:17:31 GMT)
Task-level Distributionally Robust Optimization for Large Language Model-based Dense Retrieval [32.1] 本稿では,大規模言語モデルに基づくDense Retrievalファインタニングのためのタスクレベル分散ロバスト最適化(tDRO)を提案する。
tDROはドメインの重みをパラメータ化し、拡張されたドメイン勾配で更新する。
実験では、大規模検索ベンチマークの最適改善と、最大30%のデータセット使用率の削減が示されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:48:19 GMT)
AvatarPose: Avatar-guided 3D Pose Estimation of Close Human Interaction from Sparse Multi-view Videos [31.9] 既存のマルチビュー手法は、複数の密接な対話の人々の3Dポーズと形状を推定する上で、しばしば課題に直面します。
個人ごとのパーソナライズされた暗黙的神経アバターを前者として活用する新しい手法を提案する。
実験により、いくつかの公開データセット上での最先端の性能を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:19:58 GMT)
Beneath the Surface of Consistency: Exploring Cross-lingual Knowledge Representation Sharing in LLMs [31.9] 言語モデルは、言語全体で同じ事実に答える能力に矛盾する。
モデルがクエリに一貫して答える能力と、複数の言語で共有された表現で'ストア'する能力の2つの側面から、多言語的な事実知識を探求する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:38:30 GMT)
HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning [31.9] 階層型オフライン深層強化学習(DRL)フレームワーク「HiBid」を提案する。
HiBidは、非競争的な予算配分のための補助的損失を備えた高レベルプランナーで構成されている。
チャネル間CPC制約を満たすためにCPC誘導動作選択機構を導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:09:26 GMT)
PromptBench: A Unified Library for Evaluation of Large Language Models [31.5] 大規模言語モデル(LLM)を評価する統合ライブラリであるPromptBenchを紹介する。
プロンプト構築、プロンプトエンジニアリング、データセットとモデルのローディング、敵のプロンプトアタック、動的評価プロトコル、分析ツールなど、研究者が使いやすく拡張した重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:28:45 GMT)
Solving an Industrially Relevant Quantum Chemistry Problem on Quantum Hardware [31.2] 我々は、捕捉されたイオン量子ハードウェア上で、工業的に関係があり、強く相関する金属キレートの活性空間ハミルトニアンの最低エネルギー固有値を算出する。
量子ハードウェア上で変分量子アルゴリズムを訓練し,次に量子回路の出力として測定された状態の部分空間における古典的対角化を施すことにより,化学的精度を実現することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:50:15 GMT)
Dr.Academy: A Benchmark for Evaluating Questioning Capability in Education for Large Language Models [30.8] 本研究では,大規模言語モデル(LLM)の教師として教育における質問能力を評価するためのベンチマークを紹介する。
関連性, カバレッジ, 代表性, 一貫性の4つの指標を適用し, LLMのアウトプットの教育的品質を評価する。
以上の結果から, GPT-4は一般・人文・理科教育において有意な可能性を秘めていることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:36:30 GMT)
SysBench: Can Large Language Models Follow System Messages? [30.7] 大規模言語モデル (LLM) は様々なアプリケーションで実装されており、これらのモデルのカスタマイズがますます重要になっている。
AI駆動型ソリューションを最適化するシステムメッセージの可能性は認識されているが、これらのシステムメッセージに異なるLLMがどの程度うまく従うかを評価するための包括的なベンチマークが存在しないことは注目すべきである。
SysBenchは,制約複雑性,命令ミスアライメント,マルチターン安定性という3つの課題の観点から,システムメッセージの追従能力を体系的に解析するベンチマークである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:33:16 GMT)
Multiwinner Temporal Voting with Aversion to Change [30.2] 我々は、有権者が候補者よりもダイナミックに選好する2段階の委員会選挙を調査する。
各段階において、委員会は所定の投票規則の下で選ばれる。
ティーレ則のクラスに対する完全複雑性二分法を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:16:54 GMT)
MUSES: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration [29.7] ユーザクエリから3次元制御可能な画像生成のための汎用AIシステムであるMUSESを導入する。
このマルチモーダルエージェントパイプラインは、人間のプロのコラボレーションを模倣することにより、3D制御可能なオブジェクトによる画像の効果的かつ自動生成を容易にする。
T2I-CompBenchおよびT2I-3DisBenchにおけるMUSESの最先端性能を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:37:23 GMT)
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality [29.4] 大規模言語モデル(LLM)は、高い確率で因果引数を生成することができる。
LLMは人間のドメインの専門家によって因果解析のセットアップの労力を節約するために使われる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:16:20 GMT)
Aligning Explanations for Recommendation with Rating and Feature via Maximizing Mutual Information [29.3] 現在の説明生成手法は,既存のユーザレビューを模倣する目的で一般的に訓練されている。
MMIフレームワークと呼ばれるフレキシブルなモデルに依存しない手法を提案し、生成した自然言語の説明と予測された評価/重要項目の特徴との整合性を高める。
私たちのMMIフレームワークは、さまざまなバックボーンモデルを強化し、予測された評価やアイテム機能との整合性の観点から、既存のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:28:47 GMT)
Promoting Equality in Large Language Models: Identifying and Mitigating the Implicit Bias based on Bayesian Theory [29.2] 大規模言語モデル(LLM)は、必然的にバイアスのある情報を含む広範なテキストコーパスで訓練される。
我々は、暗黙のバイアス問題を正式に定義し、ベイズ理論に基づくバイアス除去のための革新的な枠組みを開発した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:40:12 GMT)
DOMBA: Double Model Balancing for Access-Controlled Language Models via Minimum-Bounded Aggregation [28.5] データセット上での大規模言語モデル(LLM)のトレーニングは、無許可のユーザに機密情報を暴露する可能性がある。
DOMBA - 二重モデルバランシング - LLMのトレーニングとデプロイのためのシンプルなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:23:38 GMT)
An Information-Theoretic Approach to Generalization Theory [27.9] 学習アルゴリズムと学習データ間の依存度を定量化する情報理論境界を解析する。
一定のプライバシーパラメータを持つ場合であっても,最大リークが制限されたアルゴリズムにより一般化が保証されることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:08:21 GMT)
Prompt-Agnostic Adversarial Perturbation for Customized Diffusion Models [27.8] 本稿では,カスタマイズした拡散モデルのためのPAP(Prompt-Agnostic Adversarial Perturbation)手法を提案する。
PAPはまず、ラプラス近似を用いてプロンプト分布をモデル化し、その後、外乱期待を最大化することで、急激な摂動を発生させる。
このアプローチは、即時無敵攻撃に効果的に取り組み、防御安定性を向上させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:17:56 GMT)
Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code Debugging [27.7] ソクラテス質問は効果的な教育戦略であり、批判的思考と問題解決を奨励する。
TreeInstructは、学生が個別にエラーを特定し、解決するのを助けるために、探索的な質問をする。
学生の概念的・統語的知識を推定し、質問ツリーを動的に構築する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:33:19 GMT)
Look at the Text: Instruction-Tuned Language Models are More Robust Multiple Choice Selectors than You Think [27.6] テキスト回答は、最初のトークン確率よりも、摂動に疑問を呈するほど堅牢であることを示す。
本研究は,第1トークン確率評価よりもテキスト応答評価が有効であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:07:49 GMT)
UIE-UnFold: Deep Unfolding Network with Color Priors and Vision Transformer for Underwater Image Enhancement [27.5] 水中画像強調(UIE)は様々な海洋用途において重要な役割を担っている。
現在の学習に基づくアプローチは、水中画像形成に関わる物理過程に関する明確な事前知識を欠いていることが多い。
そこで本稿では,UIEのカラープリエントとステージ間特徴付与を統合した新しいディープ・アンフォールディング・ネットワーク(DUN)を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:48:33 GMT)
Limited Communications Distributed Optimization via Deep Unfolded Distributed ADMM [27.1] 本稿では,D-ADMMが各エージェントによって交換される少数のメッセージで確実に動作できるようにするための展開D-ADMMを提案する。
分散推定タスクと分散学習シナリオの2つの代表的な設定に対して,展開D-ADMMを特化している。
提案手法は,D-ADMMの通信性能を損なうことなく,D-ADMMの通信回数を大幅に削減することを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:56:03 GMT)
Iterative Window Mean Filter: Thwarting Diffusion-based Adversarial Purification [26.9] 顔認証システムは、敵攻撃のような目立たない摂動に敏感なため、信頼性が低い。
我々はIWMF (Iterative Window Mean Filter) と呼ばれる,新しい非深層学習に基づく画像フィルタを開発した。
我々は,IWMFと拡散モデルを統合した,IWMF-Diffという逆浄化のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:19:43 GMT)
Swim till You Sink: Computing the Limit of a Game [26.8] 本研究では,ノイズレプリケータ力学と呼ばれる自然力学のクラスにおける挙動の計算問題について検討する。
実験により, 標本化とシミュレーションにより, 合理的な大ゲームの限界分布を正確に推定できることを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:09:21 GMT)
Accelerating the Surrogate Retraining for Poisoning Attacks against Recommender Systems [26.7] データ中毒攻撃では、敵はターゲットアイテムを宣伝するために推奨者のトレーニングデータに慎重に偽ユーザーインタラクションを注入する。
現在の攻撃方法は、攻撃を最適化するために、最新のフェイクユーザーと、毒データでサロゲートレコメンデーターを反復的に再訓練することを含む。
EmphGradient Passing (GP) は、バックプロパゲーション中に相互作用するユーザとイテムのペア間の勾配を明示的に通過する新しい手法である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:08:13 GMT)
Fishers Harvest Parallel Unlearning in Inherited Model Networks [26.5] 本稿では、継承を示すモデル間で完全に並列なアンラーニングを可能にする、新しいアンラーニングフレームワークを提案する。
重要なイネーブルは、新しいUMIG(Unified Model Inheritance Graph)であり、DAG(Directed Acyclic Graph)を使用して継承をキャプチャする。
我々のフレームワークは、代替手法と比較して、アンラーニングを99%高速化します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:41:58 GMT)
PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.1] フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な限界に遭遇している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:14:21 GMT)
TimeSieve: Extracting Temporal Dynamics through Information Bottlenecks [25.9] 本稿では,時系列予測モデルTimeSieveを提案する。
提案手法では、ウェーブレット変換を用いて時系列データを前処理し、マルチスケールの特徴を効果的にキャプチャする。
本研究は,時系列予測における課題に対処するためのアプローチの有効性を検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:31:21 GMT)
LSVOS Challenge 3rd Place Report: SAM2 and Cutie based VOS [25.9] ビデオオブジェクト(VOS)は、オブジェクトの隠蔽と断片化、オブジェクトの非出現と再出現、混雑したシーン内の特定のオブジェクトの追跡など、いくつかの課題を提示している。
本研究では,これらの課題に対処するために,最新技術モデル(SOTA)SAM2とCutieの長所を組み合わせる。
LSVOS チャレンジ VOS トラックの試験段階での J&F スコアは 0.7952 であり,第3位にランクインしている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:45:13 GMT)
GSLoc: Efficient Camera Pose Refinement via 3D Gaussian Splatting [25.8] 本稿では,新しいテストタイムカメラ・ポーズ・リファインメントフレームワークGSLocを提案する。
このフレームワークは、最先端の絶対ポーズ回帰とシーン座標回帰法の局所化精度を高める。
GSLocは、RGBイメージを直接操作することで、特徴抽出器や記述器をトレーニングする必要がなくなる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:58:23 GMT)
Joint Selective State Space Model and Detrending for Robust Time Series Anomaly Detection [25.6] 深層学習に基づくシーケンスモデルは時系列異常検出タスクに広く利用されている。
TSADの能力は、(i)長距離依存をモデル化する能力と(ii)非定常データの存在下での一般化問題という2つの主要な課題によって制限されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:00:02 GMT)
Enhancing One-shot Pruned Pre-trained Language Models through Sparse-Dense-Sparse Mechanism [25.4] 事前学習された言語モデル(PLM)は、文脈理解において堅牢で、様々な自然言語処理タスクにおいて優れた性能を示すように設計されている。
現代のプルーニング戦略では、タスク特化データや一般的なデータの再トレーニングを必要とせずに、PLMを圧縮するためのワンショット技術を採用している。
重み分布最適化の観点から, 刈り取られたPLMの性能を向上させるためのスパース・デンス・スパース・プルーニング・フレームワークであるSDSを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:05:45 GMT)
ConFIG: Towards Conflict-free Training of Physics Informed Neural Networks [25.3] 本稿では,物理インフォームドニューラルネットワーク(PINN)タスクの学習を改善するためのConFIG法を提案する。
最終更新と各損失固有の勾配の間の正のドット積を保証することで、コンフリクトフリーな更新を提供する。
また、全ての損失項に対する一貫した最適化率を維持し、競合レベルに基づいて勾配の等級を動的に調整する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:20 GMT)
Hierarchical Retrieval-Augmented Generation Model with Rethink for Multi-hop Question Answering [24.7] マルチホップ質問回答 (Multi-hop Question Answering, QA) は、複雑な質問を解決するために複数の情報を統合することで複雑な推論を必要とする。
既存のQAシステムは、時代遅れの情報、コンテキストウィンドウの長さ制限、精度-量トレードオフといった課題に直面する。
本稿では,Decomposer,Definer,Retriever,Filter,Summarizerの5つのキーモジュールからなる,階層型検索拡張生成モデル(HiRAG)を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:29:31 GMT)
Coarse-to-Fine Detection of Multiple Seams for Robotic Welding [24.4] 本稿では, 溶接シームを概ね局在させることにより, 関心領域を得るための枠組みを提案する。
この結果は、実世界の産業応用の可能性を示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:24:59 GMT)
What can Large Language Models Capture about Code Functional Equivalence? [24.2] SeqCoBenchは、コード-LLMがコード関数同値をキャプチャする方法を評価するベンチマークである。
我々は,SeqCoBenchにおける意味論的に等価なプログラムと異なるプログラムのペアを識別できるかどうかを,最先端(Code-)LLMで評価する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:19:06 GMT)
Box-Free Model Watermarks Are Prone to Black-Box Removal Attacks [24.0] 箱のないモデル透かしは、現実世界の脅威モデルの下でも、攻撃を除去する傾向にある。
本研究では,抽出器がReLU活性化のみを使用する場合に,EGG除去器を開発し,その有効性を示す。
いずれの場合も,提案する除去器は,処理画像の品質を保ちながら,埋め込まれた透かしを除去することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:37:37 GMT)
Gaussian in the Dark: Real-Time View Synthesis From Inconsistent Dark Images Using Gaussian Splatting [23.9] 3次元ガウススプラッティングは、一貫したマルチビューイメージを入力として、驚くべき新しいビューを合成することができる。
しかし、暗い環境で撮影された画像は、かなりの明るさの変化と多視点の不整合を示す可能性がある。
ゴーストやフローターのアーティファクトを使わずに高品質なレンダリングを実現するガウシアンDKを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:03:51 GMT)
HYDEN: Hyperbolic Density Representations for Medical Images and Reports [23.8] ハイパーボリック密度埋め込みに基づく画像テキスト表現学習アプローチは、特定の医学領域のデータに適合する。
カプセル化損失関数を用いて画像-テキスト密度分布間の部分順序関係をモデル化する。
実験により,本手法の解釈可能性とその性能について,ベースライン法と比較して検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:13:41 GMT)
Multi-level Monte-Carlo Gradient Methods for Stochastic Optimization with Biased Oracles [23.6] バイアスのあるオラクルにアクセスし、低いバイアスで目的を得る必要がある場合、最適化を検討する。
偏り勾配法は,非分散状態のばらつきを低減できることを示す。
また、条件最適化手法は、条件最適化とリスク最適化の文献における最もよく知られた複雑さを著しく改善することを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:56:16 GMT)
Subspace Prototype Guidance for Mitigating Class Imbalance in Point Cloud Semantic Segmentation [23.3] 本稿では,サブスペースのプロトタイプガイダンス(textbfSPG)を用いて,セグメンテーションネットワークのトレーニングを指導する手法を提案する。
提案手法はセグメンテーション性能を大幅に向上し,最先端の手法を超越する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:31:46 GMT)
DAAD: Dynamic Analysis and Adaptive Discriminator for Fake News Detection [23.2] 偽ニュース検出のための動的解析・適応識別器(DAAD)手法を提案する。
知識に基づく手法では,モンテカルロ木探索(MCTS)アルゴリズムを導入する。
意味に基づく手法では,4つの典型的な偽造パターンを定義する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:13:54 GMT)
Can LLMs Beat Humans in Debating? A Dynamic Multi-agent Framework for Competitive Debate [22.8] Agent for Debate (Agent4Debate)は、大規模言語モデル(LLM)に基づく動的マルチエージェントフレームワークである。
評価には、Debatrix自動スコアシステムと、確立されたDebatrix-EloとHuman-Eloのランキングに基づく専門家の人間レビュアーが使用されている。
実験の結果、最先端のAgent4Debateは人間の能力に匹敵する能力を示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:36:06 GMT)
Language-Guided Self-Supervised Video Summarization Using Text Semantic Matching Considering the Diversity of the Video [22.6] 本研究では,映像要約タスクを自然言語処理(NLP)タスクに変換する可能性について検討する。
本手法は,ランク相関係数のSumMeデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:19:38 GMT)
Training Matting Models without Alpha Labels [22.2] この研究は、前景/背景を監督として粗く示すトリマップのような粗いアノテーションを用いて調査する。
本研究は, 既知領域からの学習意味論と適切な仮定マッチング規則との協調が, 遷移領域におけるアルファ値の推測に有効であることが示唆された。
AM-2K と P3M-10K のデータセットを用いた実験により,我々のパラダイムはファインレーベルの教師付きベースラインと同等の性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:34:06 GMT)
Ferret: Faster and Effective Automated Red Teaming with Reward-Based Scoring Technique [22.2] FerretはRainbow Teamingをベースにした新しいアプローチである。
フェレットは総合攻撃成功率(ASR)を95%に改善し、レインボーチームよりも46%高い。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:58:01 GMT)
Rethinking Video Segmentation with Masked Video Consistency: Did the Model Learn as Intended? [22.2] ビデオセグメント化は、ビデオシーケンスを、オブジェクトやフレーム内の関心領域に基づいて意味のあるセグメントに分割することを目的としている。
現在のビデオセグメンテーションモデルは、しばしば画像セグメンテーション技術から派生している。
本研究では,空間的・時間的特徴集約を向上する学習戦略であるMasked Video Consistencyを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:08:32 GMT)
Generation of squeezed vacuum state in the millihertz frequency band [22.1] 圧縮真空場を4ミリヘルツのフーリエ周波数まで直接観測し,最大8dBの量子ノイズ低減を行った。
我々の研究は将来の重力波観測のための量子資源を提供し、量子精度測定の開発を促進する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:39:21 GMT)
Towards Personalized Federated Multi-Scenario Multi-Task Recommendation [22.1] PF-MSMTrecは、パーソナライズされたマルチシナリオマルチタスクレコメンデーションのための新しいフレームワークである。
複数の最適化競合の独特な課題に対処するために,ボトムアップ共同学習機構を導入する。
提案手法は最先端手法より優れている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:47:41 GMT)
Scene123: One Prompt to 3D Scene Generation via Video-Assisted and Consistency-Enhanced MAE [22.1] Scene123は3次元シーン生成モデルであり,映像生成フレームワークを通じて現実性と多様性を保証する。
具体的には、入力画像(またはテキストから生成された画像)をワープして、隣接したビューをシミュレートし、MAEモデルで見えない領域を埋める。
生成したビューの細部やテクスチャの忠実度をさらに高めるため,映像生成モデルを用いて入力画像から得られた画像に対して,GANベースのロスを用いた。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:16:00 GMT)
LoopSplat: Loop Closure by Registering 3D Gaussian Splats [21.9] LoopSplatはRGB-D画像を入力として取り出し、3DGSサブマップとフレーム・ツー・モデル追跡による密集マッピングを実行する。
LoopSplatはループ閉鎖をオンラインでトリガーし、サブマップ間の相対ループエッジ制約を直接3DGS登録を通じて計算する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:43:25 GMT)
Novel class discovery meets foundation models for 3D semantic segmentation [21.9] 本稿では,ポイントクラウドセマンティックセマンティックセグメンテーションにおけるNCDの新たな課題を紹介する。
2次元セマンティックセグメンテーションのための既存のNCD法を直接3次元データに変換することで、最適以下の結果が得られることを示す。
オンラインクラスタリング,不確実性推定,セマンティック蒸留に基づく新しいNCD手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:13:35 GMT)
Asymmetric Graph Error Control with Low Complexity in Causal Bandits [21.8] 目的は、因果グラフ内のノードに対する最適な介入シーケンスを選択することである。
信号が報酬に寄与するノード間の因果関係を利用することで、介入を最適化する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:37:08 GMT)
Towards Rehearsal-Free Multilingual ASR: A LoRA-based Case Study on Whisper [21.7] 本研究は,学習データがない場合の新たな言語モデルを強化するための戦略について検討する。
中国のウイスパーモデル(ウイグル語とチベット語)による実験では、よりコンパクトなパラメータセットでより良い結果が得られる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:31:59 GMT)
A Circuit Approach to Constructing Blockchains on Blockchains [21.4] 私たちは、特定のブロックチェーンセットを読み込み、書き込みすることで、よりセキュアなオーバーレイブロックチェーンを構築する方法を示します。
1) 2つのブロックチェーン間のシリアルコンポジションは、少なくとも1つのアンダーレイブロックチェーンが安全で、両方のブロックチェーンが稼働している場合、安全であるオーバーレイブロックチェーンを生成する。
結果は同期設定にも拡張される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:18:25 GMT)
Single-cell Curriculum Learning-based Deep Graph Embedding Clustering [21.3] シングルセル学習に基づく深層グラフ埋め込みクラスタリング(scCLG)を提案する。
まず,3つのデコーダに対応する3つの最適化目標を組み合わせたマルチデコーダ(ChebAE)を用いたChebyshevグラフ畳み込みオートエンコーダを提案する。
我々は、ノードの特徴とエントロピーに基づいてGNNを訓練し、高品質なグラフを維持するための難易度スコアに基づいて困難なノードを訓練する選択的なトレーニング戦略を採用している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:20:13 GMT)
Investigating and Improving Latent Density Segmentation Models for Aleatoric Uncertainty Quantification in Medical Imaging [21.3] イメージセグメンテーションでは、この問題に対処するために潜在密度モデルを利用することができる。
最も一般的なアプローチは確率的U-Net (PU-Net) である。
我々は,すべての潜伏次元における等質性を促進するために,相互情報更新とエントロピー規則化されたシンクホーン更新を導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:47:44 GMT)
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation [21.3] 本稿では,MLLM-MSRモデルを提案する。
動的ユーザの嗜好を捉えるために,2段階のユーザ選好要約法を設計する。
次に、ユーザ嗜好の動的変化を捉えるために、繰り返しユーザー嗜好要約生成パラダイムを用いる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:09:33 GMT)
Autonomous Negotiation Using Comparison-Based Gradient Estimation [21.2] 交渉はマルチエージェントシステムにおける対立を解決するのに有用である。
2つの利己的な合理的なエージェントが、有限のカテゴリからアイテムを順次取引する環境で、自律的な交渉について検討する。
提案手法は,事前の受理応答や拒絶応答によって提供物を生成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:42:41 GMT)
Elephants Never Forget: Memorization and Learning of Tabular Data in Large Language Models [21.1] 大規模言語モデル (LLM) は様々なタスクに適用できるが、データ汚染と記憶の重大な問題はしばしば誇張される。
この研究は、トレーニング中に言語モデルがデータセットを見たかどうかを評価するためのさまざまなテクニックを導入している。
次に、トレーニング中に見られたデータセット上でのLLMの数発の学習性能と、トレーニング後にリリースされたデータセットのパフォーマンスを比較した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:35:03 GMT)
DisMix: Disentangling Mixtures of Musical Instruments for Source-level Pitch and Timbre Manipulation [21.1] DisMixは、ソースのメロディと楽器を構築するためのビルディングブロックとして、ピッチと音色の表現が機能する生成フレームワークである。
表現の操作により, モデルサンプルは, 構成楽器のピッチと音色の組み合わせとを混合する。
音源レベル表現の集合に条件付き混合を再構成する非絡み合ったピッチ音色表現と潜時拡散変換器を共同で学習することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:56:49 GMT)
Privacy-preserving Universal Adversarial Defense for Black-box Models [21.0] 本稿では,対象モデルのパラメータやアーキテクチャへのアクセスを必要としない,汎用的なブラックボックス防御手法であるDUCDを紹介する。
このアプローチでは、データをクエリすることでターゲットモデルをクエリし、データのプライバシを保持しながら、ホワイトボックスサロゲートを生成します。
複数の画像分類データセットの実験では、DUCDは既存のブラックボックスディフェンスよりも優れており、ホワイトボックスディフェンスの精度と一致している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:40:39 GMT)
Information-Theoretic Foundations for Machine Learning [20.6] 本稿では,洞窟外に存在する問題に答えようとする理論的枠組みを提案する。
我々はベイズ統計とシャノンの情報理論に根ざしたフレームワークを提供し、機械学習における多くの現象の分析を統一するのに十分一般的なものである。
我々は、不特定アルゴリズムの性能を特徴付けるセクションを締めくくる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:34:20 GMT)
NeuralMatrix: Compute the Entire Neural Networks with Linear Matrix Operations for Efficient Inference [20.4] 本稿では,ディープニューラルネットワーク(DNN)モデル全体の計算を線形行列演算に弾性的に変換するニューラルマトリックスを提案する。
CNNとトランスフォーマーベースのモデルによる実験は、広範囲のDNNモデルを正確かつ効率的に実行するためのNeuralMatrixの可能性を実証している。
このレベルの効率性は通常、特定のニューラルネットワーク用に設計されたアクセラレータでのみ達成できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:45:34 GMT)
Persistent Ballistic Entanglement Spreading with Optimal Control in Quantum Spin Chains [20.2] エンタングルメントエントロピー(EE)は通常、ページ値 $tildeS_P =tildeS - dS$ と呼ばれるサブ飽和にアプローチする。
EEの弾道的な普及は、通常、早い段階で現れ、ページの価値が到達するずっと前に起こるでしょう。
EEの線形成長は、(平坦な絡み合いスペクトルとともに)最大$tildeS$に達するまで持続することが示されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:09:16 GMT)
MambaEVT: Event Stream based Visual Object Tracking using State Space Model [20.1] バックボーンネットワークとして線形複雑性を持つ状態空間モデルを採用した新しいマンバ型ビジュアルトラッキングフレームワークを提案する。
動的テンプレートと静的テンプレートを効果的に組み合わせることで、Mambaベースのトラッキングアルゴリズムは、複数の大規模データセットの精度と計算コストのバランスが良くなります。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:01:17 GMT)
Effective Bilevel Optimization via Minimax Reformulation [20.0] ミニマックス問題としてバイレベル最適化の再構成を提案する。
穏やかな条件下では、これらの2つの問題が等価であることを示す。
提案手法は, 計算コストを大幅に削減しつつ, 最先端の2段階法より優れる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:27:21 GMT)
ViLReF: A Chinese Vision-Language Retinal Foundation Model [19.9] この研究は、451,956枚の網膜画像とそれに対応する診断用テキストレポートからなるペアデータセットを事前トレーニングすることで、ViLReFと呼ばれる網膜基盤モデルを開発することを目的としている。
ビジョン言語による事前学習戦略では、専門家の知識を活用してラベルの抽出を容易にする。
我々は,モーメントエンコーダが保持する動的メモリキューを備えたバッチ拡張モジュールを用いて,偽陰性の排除による余分なサンプルの供給と空洞の補充を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:27:03 GMT)
CHASE: 3D-Consistent Human Avatars with Sparse Inputs via Gaussian Splatting and Contrastive Learning [19.8] ポーズ間における本質的な3次元一貫性と3次元幾何の対比学習を両立させるCHASEを提案する。
CHASEはスパース入力に匹敵する性能をフル入力で達成する。
CHASEはスパース入力用に設計されているが、現在のSOTAメソッドよりも驚くほど優れている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:51:58 GMT)
MTFinEval:A Multi-domain Chinese Financial Benchmark with Eurypalynous questions [19.8] 我々は LLM の経済に関する基本的な知識に焦点を当てた新しいベンチマーク MTFinEval をコンパイルした。
MTFinEvalは、経済学の6つの主要な分野から洗練され、より包括的な能力を反映する360の質問で構成されている。
実験の結果, MTFinEval では全ての LLM の性能が良くないことがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:04:38 GMT)
SelectLLM: Can LLMs Select Important Instructions to Annotate? [19.6] SelectLLMは、未実装の命令を選択的にアノテートするフレームワークである。
AlpacaEval2 と MT-Bench で評価し,最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:51:22 GMT)
CHECKWHY: Causal Fact Verification via Argument Structure [19.3] CheckWhyは、新しい因果事実検証タスクに適したデータセットである。
CheckWhyは19K以上の「なぜ」クレーム・エビデンス・アグメント構造三重奏団で構成されており、サポート、反響、十分な情報ラベルがない。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:03:35 GMT)
Kilometer-Scale Convection Allowing Model Emulation using Generative Diffusion Modeling [19.3] ストームスケール対流許容モデル(CAM)は雷雨とメソスケール対流システムの進化を予測する重要なツールである。
深層学習モデルは、これまでのところ、kmスケールの大気シミュレーションでは十分には証明されていない。
我々は,高分解能高速リフレッシュ(HRRR)モデル-NOAAの最先端3km動作CAMをエミュレートしたStormCastと呼ばれる生成拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:56:01 GMT)
Impact of Guidance and Interaction Strategies for LLM Use on Learner Performance and Perception [19.3] 大規模言語モデル(LLM)は、その教育的有用性を探求する研究の増加とともに、有望な道を提供する。
本研究は,LLM支援学習環境の形成において,教師が果たす役割を強調した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:31:25 GMT)
Towards Robust Knowledge Unlearning: An Adversarial Framework for Assessing and Improving Unlearning Robustness in Large Language Models [19.0] 我々は、未学習モデルを攻撃する動的かつ自動化されたフレームワークであるDynamic Unlearning Attack (DUA)を設計する。
学習過程の堅牢性を効果的に向上する普遍的な枠組みであるLatent Adrial Unlearning (LAU)を提案する。
LAUは学習効率を53.5%以上改善し、近隣の知識の11.6%以下に減らし、モデルの一般的な能力にはほとんど影響を与えないことを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:36:04 GMT)
GraphFSA: A Finite State Automaton Framework for Algorithmic Learning on Graphs [19.0] GraphFSAは、与えられたグラフの各ノード上で動作する有限状態オートマトンを学ぶように設計されている。
セルラーオートマトン問題に対してGraphFSAを試験し、その能力を簡単なアルゴリズム設定で示す。
メインのアプリケーションとして、より精巧なグラフアルゴリズムを学ぶことに集中します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:49:47 GMT)
Perception-guided Jailbreak against Text-to-Image Models [18.8] PGJと呼ばれるLPM駆動型知覚誘導ジェイルブレイク法を提案する。
これは、特定のT2Iモデル(モデルフリー)を必要としないブラックボックスジェイルブレイク方式であり、非常に自然な攻撃プロンプトを生成する。
6つのオープンソースモデルと何千ものプロンプトによる商用オンラインサービスによる実験により,PGJの有効性が検証された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:40:25 GMT)
SUBER: An RL Environment with Simulated Human Behavior for Recommender Systems [18.7] 強化学習 (Reinforcement Learning, RL) はレコメンデーションシステムの領域で人気を集めている。
この研究は、RLベースのレコメンデータシステムをトレーニングするためのモジュラーで斬新なフレームワークを導入している。
RL環境を含むソフトウェアはGitHubで公開されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:56:21 GMT)
SSL-TTS: Leveraging Self-Supervised Embeddings and kNN Retrieval for Zero-Shot Multi-speaker TTS [18.7] TTSの効果的な中間表現として,自己教師付き学習(SSL)音声の特徴が出現している。
本研究では、単一話者からの音声の書き起こしに基づいて訓練された軽量で効率的なゼロショットTTSフレームワークであるSSL-TTSを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:09:58 GMT)
CodeJudge-Eval: Can Large Language Models be Good Judges in Code Understanding? [18.7] 我々は,大規模言語モデルのコード理解能力を評価するための新しいベンチマークであるCodeJudge-Evalを紹介する。
きめ細かい判断システムを活用することで、CJ-Evalは従来のベンチマークの限界に対処する。
CJ-Evalでよく知られた12個のLCMの評価は、最先端のモデルでさえ苦戦していることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:40:35 GMT)
BLADE: Benchmarking Language Model Agents for Data-Driven Science [18.6] プランニング、メモリ、コード実行機能を備えたLMベースのエージェントは、データ駆動科学をサポートする可能性がある。
本稿では,エージェントの多面的アプローチを自動的に評価するベンチマークBLADEについて述べる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:25:10 GMT)
LeCov: Multi-level Testing Criteria for Large Language Models [18.6] 大きな言語モデル(LLM)は多くの異なるドメインで広く使われているが、その解釈可能性に限界があるため、それらがどの程度信頼できるかという疑問がある。
最近の研究は、デプロイ前に信頼できない問題を明らかにすることを目的として、LSMのテスト方法の開発を開始した。
この脅威を軽減するために,LLMのマルチレベルテスト基準であるLeCovを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:17:54 GMT)
Bayesian Optimization with LLM-Based Acquisition Functions for Natural Language Preference Elicitation [18.6] 大規模言語モデル(LLM)は、完全な自然言語(NL)PE対話を可能にする。
ユーザの好みの発話とNL項目記述の間で自然言語推論(NLI)を利用する新しいNL-PEアルゴリズムであるPEBOLを提案する。
PEBOLは最大0.27のMRR@10を達成できるのに対し、最高のモノリシックLCMベースラインのMRR@10は0.17のMRR@10を達成できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:15:07 GMT)
A Short Review and Evaluation of SAM2's Performance in 3D CT Image Segmentation [18.5] 既存のベンチマークをレビューし、SAM2論文が明らかにゼロショット評価パイプラインを概説していることを指摘した。
以上より, SAM2をゼロショット撮影で直接3D画像に応用することは, 十分ではないことが明らかとなった。
腎臓や大動脈のような小さな単連結体ではSAM2は適度に機能するが、ほとんどの臓器では最先端の3Dアノテーション法よりもはるかに遅れている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:08:42 GMT)
Representation Matters for Mastering Chess: Improved Feature Representation in AlphaZero Outperforms Switching to Transformers [18.3] ビジョントランスフォーマー(ViT)はチェスの習得には不十分である。
本稿では、入力表現と値損失関数の簡単な変更を含む実用的な改善を提案する。
その結果、チェスにおいて現在AlphaZeroで達成可能なものを超え、最大180エロポイントの大幅なパフォーマンス向上を実現した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:49:43 GMT)
Rejection in Abstract Argumentation: Harder Than Acceptance? [18.3] 我々は、否定条件(RC)と呼ばれる拡張から引数を推論するための柔軟な条件を考える。
還元AFは非常に表現力が高く、階層の上位層に自然の問題を引き起こす。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:37:04 GMT)
DemMamba: Alignment-free Raw Video Demoireing with Frequency-assisted Spatio-Temporal Mamba [18.1] 周波数アシスト時間型マンバ(DemMamba)を用いたアライメントレスRawビデオ復調ネットワークを提案する。
提案したMoiMambaは1.3dBの最先端アプローチを超越し、優れた視覚体験を提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:31:03 GMT)
Adversarial Attack for Explanation Robustness of Rationalization Models [17.8] 合理化モデルは、人間が予測を理解し、信頼するために、入力テキストのサブセットを選択する。
本論文は, 合理化モデルの説明可能性について, 予測を変更せずに損なうことを目的としている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:43:58 GMT)
Putting People in LLMs' Shoes: Generating Better Answers via Question Rewriter [17.7] 本稿では,単一ラウンドのインスタンスレベルのプロンプト最適化について述べる。
ブラックボックスLSMに対する人間の質問の信頼性を高めることにより、質問書き直しは生成した回答の品質を向上させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:24:47 GMT)
Device Sampling and Resource Optimization for Federated Learning in Cooperative Edge Networks [17.6] フェデレーテッド・ラーニング(FedL)は、サーバによって定期的に集約されたローカルモデルをトレーニングすることで、機械学習(ML)をワーカーデバイスに分散させる。
FedLは、同時代の無線ネットワークの2つの重要な特徴を無視している: (i) ネットワークには異種通信/計算資源が含まれており、 (ii) デバイスのローカルデータ分布にかなりの重複がある可能性がある。
デバイス間オフロード(D2D)によって補完されるインテリジェントデバイスサンプリングにより,これらの要因を共同で考慮する新しい最適化手法を開発した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:45:40 GMT)
DBHP: Trajectory Imputation in Multi-Agent Sports Using Derivative-Based Hybrid Prediction [17.6] 本稿では,複数のエージェントの欠落した軌跡を効果的に説明できるDBHP(デリバティブベースハイブリッド予測)フレームワークを提案する。
我々のフレームワークは既存の計算基準を著しく上回っている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:08:16 GMT)
CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network [17.3] CrossFiはシアムネットワークベースのアプローチで、ドメイン内シナリオとクロスドメインシナリオの両方に優れています。
私たちは、クラスごとにテンプレートを生成することができる余分なWeight-Netを開発し、CrossFiがさまざまなシナリオで機能できるようにします。
ジェスチャー認識タスクでは、ドメイン内シナリオで98.17%、ワンショットクロスドメインシナリオで91.72%、ゼロショットクロスドメインシナリオで64.81%、ワンショット新しいクラスシナリオで84.75%の精度を達成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:04:14 GMT)
Accelerating Goal-Conditioned RL Algorithms and Research [17.2] 自己指導型目標条件強化学習(GCRL)エージェントは、環境との非構造的相互作用において達成された目標から学習することで、新しい行動を発見する。
これらの手法は、遅い環境からのデータの欠如と安定したアルゴリズムの欠如により、同様の成功を見られなかった。
我々は、自制的なGCRLのためのJaxGCRLをリリースし、研究者は単一のGPU上で数百万の環境ステップでエージェントを訓練することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:58:40 GMT)
LADDER: Language Driven Slice Discovery and Error Rectification [17.0] LADDER: 言語駆動スライスディスカバリとエラー修正。
本稿では,Large Language Modelの推論機能を利用して,複雑なエラーパターンを分析し,検証可能な仮説を生成する。
私たちのメソッド全体は、明示的にも外部タグ付けモデルを通しても、属性アノテーションを一切必要としません。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:22:10 GMT)
Compress Guidance in Conditional Diffusion Sampling [16.7] この研究は問題を識別し、定量化し、多くのタイミングでガイダンスを減らしたり除いたりすることでこの問題を軽減できることを示した。
画像の質と多様性を著しく向上させながら、必要なガイダンスタイムステップを40%近く削減する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:02:54 GMT)
MS$^3$D: A RG Flow-Based Regularization for GAN Training with Limited Data [16.6] 物理における再正規化群(RG)の考え方に基づく新しい正規化法を提案する。
本手法は,限られたデータシナリオ下でのGANの性能と安定性を効果的に向上できることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:37:37 GMT)
Learning Part-aware 3D Representations by Fusing 2D Gaussians and Superquadrics [16.4] ポイントクラウド、メッシュ、NeRF、そして3Dガウスのような低レベルの3D表現は、一般的に3Dオブジェクトやシーンを表現するために使用される。
オブジェクトやシーンをセマンティックな部分に解析する部分認識型3D再構成の実現を目指している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:30:37 GMT)
Do Neural Scaling Laws Exist on Graph Self-Supervised Learning? [16.4] 自己教師付き学習(SSL)は、大規模未ラベルデータの知識を効果的に活用することにより、NLPおよびCVドメインの基盤モデルを得るのに不可欠である。
グラフドメインの既存のSSLが、大規模な事前トレーニングでGraph Foundation Models(GFMs)を構築するためのスケーリング動作に従うことができるかどうかは、いまだ謎のままである。
本稿では,GFM開発における既存のSSL技術の実現可能性について検討し,新しい評価試行でグラフSSL設計の新たな方向性を開拓する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:45:11 GMT)
Robust Regression with Ensembles Communicating over Noisy Channels [16.3] 本稿では,付加雑音チャネルを介して通信する回帰アルゴリズムを実装したデバイス集合の問題について検討する。
本研究では,チャネル内の雑音のパラメータに対するアグリゲーション係数を最適化する手法を開発した。
本研究は,バギングと勾配向上という,最先端のアンサンブル回帰手法に適用した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:32:47 GMT)
AnyGraph: Graph Foundation Model in the Wild [16.3] グラフ基盤モデルは、グラフデータから堅牢で一般化可能な表現を学ぶ可能性を提供します。
本研究では,主要な課題に対処するために設計された統一グラフモデルであるAnyGraphについて検討する。
多様な38のグラフデータセットに対する実験は、AnyGraphの強力なゼロショット学習性能を実証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:57:13 GMT)
Human-Aware 3D Scene Generation with Spatially-constrained Diffusion Models [16.3] 従来の自己回帰に基づく3Dシーン生成手法は、複数の物体と入力人間の関節分布を正確に捉えるのに苦労してきた。
本研究では,人間-物体衝突回避機構とオブジェクト-部屋境界制約という2つの空間衝突誘導機構を導入する。
我々のフレームワークは、人間とシーンのインタラクションを正確に行うことで、より自然でわかりやすい3Dシーンを生成することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:46:05 GMT)
Asymptotic Classification Error for Heavy-Tailed Renewal Processes [16.1] 更新プロセスの分類を検討する。
Bhattacharyyaの表現は, 高度更新過程の誤分類確率に基づく。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:47:24 GMT)
Effective Off-Policy Evaluation and Learning in Contextual Combinatorial Bandits [15.9] 文脈的包帯における非政治評価と学習について検討する。
この設定はレコメンデーターシステムやヘルスケアといった分野で広く使われている。
因子化された作用空間の概念を導入し、各サブセットをバイナリインジケータに分解する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:25:04 GMT)
Notes on solvable models of many-body quantum chaos [15.6] ブラウン・サハデフ・イェ・キタエフモデルに関連する多くの身体カオスモデルのクラスについて検討する。
創発対称性は量子力学を古典的過程にマッピングする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:24:52 GMT)
PriorMapNet: Enhancing Online Vectorized HD Map Construction with Priors [15.5] 先行データを用いたオンラインベクトル化HDマップ構築を強化するために,PreferMapNetを導入する。
提案したPreferMapNetは,nuScenesおよびArgoverse2データセット上でのオンラインベクトル化HDマップ構築タスクにおいて,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:22:52 GMT)
Prompt Your Brain: Scaffold Prompt Tuning for Efficient Adaptation of fMRI Pre-trained Model [15.3] Scaffold Prompt Tuning (ScaPT)は、大規模な機能的磁気共鳴画像(fMRI)を下流タスクに適用するための新しいプロンプトベースのフレームワークである。
パラメータ効率が高く、微調整に比べて性能が向上し、プロンプトチューニングのベースラインも向上した。
ScaPTは、神経変性疾患の診断/予後と性格特性予測において、微調整とマルチタスクに基づく即時チューニングに優れる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:08:37 GMT)
An Interpretable Deep Learning Approach for Morphological Script Type Analysis [15.1] 本稿では,形態素スクリプト型解析に対する解釈可能な深層学習手法を提案する。
より正確には、我々は同等の文字のプロトタイプを学ぶために、ディープ・インスタンス・セグメンテーション法を適用する。
我々は、A. Derolez が定式化した Textualis Formata スクリプトタイプとその2つのサブタイプに適用することで、我々のアプローチを実証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:15:06 GMT)
High-Quality Mesh Blendshape Generation from Face Videos via Neural Inverse Rendering [15.0] メッシュをベースとしたブレンドシェイプリグを,シングルあるいはスパースなマルチビュービデオから再構成する新しい手法を提案する。
実験により,シングルあるいはスパースなマルチビュービデオのフレキシブルな入力により,パーソナライズされた高忠実度ブレンドサップを再構築することを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:22:34 GMT)
LBC: Language-Based-Classifier for Out-Of-Variable Generalization [14.9] 大規模言語モデル(LLM)は、応答生成のような自然言語処理タスクにおいて大きな成功を収めている。
LLMの事前学習された知識により、追加のトレーニングなしでテストに現れる新しい変数を解釈できることがわかった。
本稿では,LBC(Language-Based-Classifier)を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:05:02 GMT)
Interplay of Quantum Resources in Nonlocality Tests [14.8] ベルの不等式違反によって証明された非局所性は、量子系における測定の不整合性を強調する。
我々は混合状態を生成し、高速スイッチングによる絡み合いの柔軟な変調を可能にする。
本研究はベル不品質に基づく量子情報処理のための量子資源の最適管理に光を当てる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:03:22 GMT)
Identifying Query-Relevant Neurons in Large Language Models for Long-Form Texts [14.7] 本稿では,大規模言語モデルにおけるクエリ関連ニューロンの同定が可能な,アーキテクチャに依存しない新しいフレームワークを提案する。
検出されたニューロンの知識編集およびニューロンによる予測への応用の可能性を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:25:23 GMT)
KeySpace: Public Key Infrastructure Considerations in Interplanetary Networks [14.7] 本稿では,メガコンステレーションと惑星間ネットワークに着目し,衛星ネットワークにおける鍵管理システムの実現に向けた目標と要件について検討する。
本研究では、高度に分散した惑星間ネットワークにおいて、地球上のPKI技術が実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:00:17 GMT)
InstructRAG: Instructing Retrieval-Augmented Generation via Self-Synthesized Rationales [14.7] InstructRAGを提案する。そこでは、LMが自己合成的理性を通して認知過程を明示的に学習する。
インストラクションRAGは追加の監視を必要としないため、予測された回答の検証が容易になる。
実験によると、InstructRAGはトレーニング不要とトレーニング可能な両方のシナリオにおいて、既存のRAGメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:48:49 GMT)
PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis [14.5] 本稿では,この急速に発展する分野におけるベンチマークの標準化を目的として,単一細胞における摂動の影響を予測するための包括的なフレームワークを提案する。
当社のフレームワークであるPerturBenchには、ユーザフレンドリなプラットフォーム、多様なデータセット、フェアモデル比較のためのメトリクス、詳細なパフォーマンス分析が含まれています。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:40:20 GMT)
Side-Channel Analysis of OpenVINO-based Neural Network Models [14.0] モデルパラメータを高精度に復元し,元のパラメータに非常に近い精度でモデルパラメータを復元できることを示す。
GoogleNet v1の実験では、トップ1の1%の違いとトップ5の0.64%の違いしか示されていない。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:48:43 GMT)
Large Language Models Might Not Care What You Are Saying: Prompt Format Beats Descriptions [13.9] 本稿では,複数のコンテキスト内サンプルの選択基準を記述するためのアンサンブルプロンプトフレームワークを提案する。
6つの翻訳方向にわたる機械翻訳(MT)の予備実験により、このフレームワークがICLの出現を促進することが確認された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:01:09 GMT)
CoRA: Collaborative Information Perception by Large Language Model's Weights for Recommendation [13.9] LLM(Large Language Models)における協調情報の導入は,LLMを推奨に適応させる上で有望な手法である。
既存の手法では、テキストトークンと協調的な特徴を統一シーケンス入力に結合することでこれを実現する。
我々は、協調重み生成器を備えた新しいパラダイム、CoRA(Collaborative LoRAの頭字語)を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:36:59 GMT)
PrimeComposer: Faster Progressively Combined Diffusion for Image Composition with Attention Steering [13.8] 我々は、画像合成を主観的な局所的な編集タスクとして定式化し、前景生成にのみ焦点をあてる。
本研究では,様々なノイズレベルに対して注意制御を適切に設計することで,画像の合成を行う高速なトレーニングフリーディフューザであるPrimeComposerを提案する。
提案手法は,最も高速な推論効率を示し,定性的かつ定量的に,我々の優位性を実証する広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:14:00 GMT)
DEGAS: Detailed Expressions on Full-Body Gaussian Avatars [13.7] 顔表情の豊かなフルボディアバターに対する3次元ガウススティング(3DGS)に基づくモデリング手法であるDEGASを提案する。
本稿では,2次元の顔と3次元のアバターのギャップを埋めて,2次元の肖像画にのみ訓練された潜在空間を採用することを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:52:03 GMT)
Convergence of Unadjusted Langevin in High Dimensions: Delocalization of Bias [13.6] 問題の次元が$d$になるにつれて、所望の誤差内で収束を保証するのに必要なイテレーションの数が増加することを示す。
私たちが取り組んだ重要な技術的課題は、収束を測定するための$W_2,ellinfty$メートル法に一段階の縮約性がないことである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:24:54 GMT)
NoMatterXAI: Generating "No Matter What" Alterfactual Examples for Explaining Black-Box Text Classification Models [13.5] 対物的説明(CE)は重要な機能にのみ焦点をあて、無関係なものを無視します。
人工的な説明(AE)は「何があっても」という代替の現実を探求する
本稿では,テキスト分類タスクのためのAEを生成する新しいアルゴリズムであるMoMatterXAIを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:06:21 GMT)
Adversarial training of Keyword Spotting to Minimize TTS Data Overfitting [13.5] キーワードスポッティング(KWS)問題では,多様な個体群間で高い精度を達成するために,大量の実声訓練データが必要となる。
我々は,大量のTSデータに基づいてトレーニングを行った場合,KWSモデルがTS特有の特徴を学習するのを防ぐために,敵対的トレーニング手法を適用することを提案する。
実験により, 実音声データに対するKWSモデルの精度は, 元のKWS損失に加えて, 対向損失を用いた場合, 最大12%向上できることが示された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:16:12 GMT)
To Code, or Not To Code? Exploring Impact of Code in Pre-training [13.3] 一般性能に対するコードデータの影響を系統的に検討する。
コーディングタスクをはるかに超越した一般化のための重要なビルディングブロックがコードであることに気付きました。
私たちの研究は、事前トレーニング中のコード品質とコード保存への投資がポジティブな影響を与えることを示唆しています。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:58:13 GMT)
Navigating Spatio-Temporal Heterogeneity: A Graph Transformer Approach for Traffic Forecasting [13.3] 交通予測はスマートシティの発展において重要な研究分野として浮上している。
最短時間相関のためのネットワークモデリングの最近の進歩は、パフォーマンスのリターンが低下し始めている。
これらの課題に対処するために、時空間グラフ変換器(STGormer)を導入する。
本研究では,その構造に基づく空間符号化手法を2つ設計し,時間位置をバニラ変圧器に統合して時間的トラフィックパターンをキャプチャする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:18:21 GMT)
Pluto and Charon: A Time and Memory Efficient Collaborative Edge AI Framework for Personal LLMs Fine-Tuning [13.3] Pluto and Charon(PAC)は、個人用LLMの微調整のための、時間とメモリ効率のよい協調エッジAIフレームワークである。
PACは、パラメータ、時間、メモリの点で効率的なパーソナルLLMの微調整技術を実装している。
プロトタイプ実装に基づく大規模な評価は、PACが最先端のアプローチを著しく上回っていることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:30:12 GMT)
Which Side Are You On? A Multi-task Dataset for End-to-End Argument Summarisation and Evaluation [13.2] 本稿では,議論のための議論的エッセイを作成するエンドツーエンドの過程を捉えた議論マイニングデータセットを提案する。
私たちのデータセットには、上記のタスクをサポートするさまざまなプロパティで完全に注釈付けされたクレームの14万の例が含まれています。
ベンチマークでは,各タスクに対する有望な結果を示す一方で,4つのタスクすべてに対するエンドツーエンドのパフォーマンスが著しく低下していることが判明した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:41:27 GMT)
What is in Your Safe Data? Identifying Benign Data that Breaks Safety [13.0] 良質なデータで整列モデルを微調整することは、必然的にジェイルブレイクに寄与することを示す。
本稿では,有害な事例に近づき,良性に欠けるデータポイントを優先する双方向アンカー手法を提案する。
また、選択したデータは、しばしばリスト、弾丸点、数学の質問として現れ、ジェイルブレイクに寄与する微調整データの体系的なパターンを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:54:08 GMT)
Efficient quantum Gibbs samplers with Kubo--Martin--Schwinger detailed balance condition [13.0] 有限個のジャンプ演算子を用いた効率的な量子ギブスサンプリング器群を開発する。
既存の研究と比較すると、我々の量子ギブスサンプリングは、同等の量子シミュレーションコストを持つ。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:57:07 GMT)
Dual-path Frequency Discriminators for Few-shot Anomaly Detection [13.0] 本稿では、これらの問題に対処するために、周波数観点からDual-Path Frequency Discriminator (DFD)ネットワークを提案する。
もともとの空間画像は多周波画像に変換され、カスタマイズされた識別器に対してより分かりやすい。
MVTec AD と VisA ベンチマークで行った実験では、DFD が現在の最先端手法を超越していることが示されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:58:19 GMT)
Benchmarking Large Language Models for Math Reasoning Tasks [12.9] 我々は、4つの強力な基礎モデル上の5つの広く使われている数学的データセットの数学的問題解決のための、最先端の文脈内学習アルゴリズムを7つ比較した。
以上の結果から, GPT-4o や LLaMA 3-70B のような大規模基盤モデルでは, 具体的なプロンプト戦略とは独立に数学的推論を解くことが可能であることが示唆された。
将来の研究で追加モデルの統合をサポートするために、ベンチマークコードをオープンソースにしています。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:34:17 GMT)
SAM-COD: SAM-guided Unified Framework for Weakly-Supervised Camouflaged Object Detection [12.9] カモフラージュされたオブジェクト検出(COD)手法の多くは、取得するのに時間と労力を要するマスクアノテーションに大きく依存している。
既存の弱教師付きCODアプローチは、完全教師付き手法に比べて性能が著しく劣っている。
我々は、任意の弱教師付きラベルをサポート可能な、SAM-CODと呼ばれる統合CODフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:49:27 GMT)
Tailoring Graph Neural Network-based Flow-guided Localization to Individual Bloodstreams and Activities [12.9] 血流中ナノデバイスを用いたフローガイドの局在化は,早期疾患の検出,生物状態の連続モニタリング,標的治療に有用であることが期待される。
ナノデバイスは、ローカライゼーション目的のために誤った生データを生成する、サイズと電力制約を呈する。
オンボディアンカーはこのデータを受信し、興味のある診断イベントの場所を導出する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:12:23 GMT)
Reference-Guided Verdict: LLMs-as-Judges in Automatic Evaluation of Free-Form Text [12.9] 大きな言語モデル(LLM)は、人間のような会話を生成できる。
BLEUやROUGEのような従来のメトリクスは、このような生成出力の微妙な意味と文脈的な豊かさを捉えるには不十分である。
本稿では,複数のLSM-as-judgesを活用することで,評価プロセスを自動化する基準誘導型判定手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:12:08 GMT)
ProgramAlly: Creating Custom Visual Access Programs via Multi-Modal End-User Programming [12.9] 本稿では,視覚情報のためのカスタムフィルタ作成システムであるProgramAllyを紹介する。
盲目の成人12名を対象にしたユーザスタディでは,課題によって異なるプログラミングのモダリティが好まれていた。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:45:31 GMT)
Optimizing Large Language Model Hyperparameters for Code Generation [12.7] 大規模言語モデル(LLM)は、ソフトウェア工学において、様々なタスクを自動化するためにますます使われている。
本研究では,様々なハイパーパラメータの影響を徹底的に検討し,LLMのコード生成性能を評価することを目的とする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:32:57 GMT)
Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance [12.7] 本稿では、地上画像から現実的な空中画像を生成することのできる、新しい幾何学保存地上空間モデル(G2A)を提案する。
モデルをトレーニングするために、新しいマルチモーダル・クロスビューデータセット、すなわちVIGORv2を提案する。
また、クロスビューなジオローカライズのためのデータ拡張と、スケッチベースの領域探索という2つのアプリケーションを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:13:08 GMT)
CRACKS: Crowdsourcing Resources for Analysis and Categorization of Key Subsurface faults [12.7] 我々は,クラウドソーシングリソースを利用して,地下画像の欠陥を検出し,セグメント化するための$texttCRACKS$データセットを提案する。
我々は、アマゾン・メカニカル・トルクを利用して、オランダ北海の地下画像から断層線を得る。
この論文は、初心者および実践者のラベルから専門家ラベルを検出し、セグメンテーションするためのベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:40:11 GMT)
Flexora: Flexible Low Rank Adaptation for Large Language Models [12.7] 大規模言語モデル(LLM)は、モデルパラメータのスケールを拡大することで、人工知能の進歩を推進している。
特定の下流タスクにおけるそれらのパフォーマンスは、通常これらのタスクの知識境界によって妨げられる。
本稿では,フレキシブルな低ランク適応法 (Flexora) を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:13:04 GMT)
Distillation Matters: Empowering Sequential Recommenders to Match the Performance of Large Language Model [12.7] 大規模言語モデル(LLM)はレコメンデーションとして効果的に利用されており、優れたパフォーマンスを実現している。
しかし、LLMの高推論遅延は、実用的デプロイメントを著しく制限する。
本研究では,LLMに基づく推薦モデルから軽量シーケンシャルモデルへの知識蒸留について検討する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:33:32 GMT)
GAIM: Attacking Graph Neural Networks via Adversarial Influence Maximization [12.7] 我々は,厳密なブラックボックス設定を考慮しつつ,ノードベースで行う統合逆攻撃手法を提案する。
提案手法では,対象ノードの選択と特徴摂動の構成を単一最適化問題に統一する。
ラベル指向攻撃に対応するため,本手法を拡張し,適用範囲を広げる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:41:20 GMT)
MalLight: Influence-Aware Coordinated Traffic Signal Control for Traffic Signal Malfunctions [12.5] 本稿では,交通信号の故障による悪影響を軽減するために,新しい信号制御フレームワーク(MalLight)を提案する。
本研究は,交通信号の故障による課題に対処する強化学習(RL)に基づくアプローチの先駆者となる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:43:50 GMT)
Leveraging Near-Field Lighting for Monocular Depth Estimation from Endoscopy Videos [12.5] 内視鏡ビデオにおける単眼深度推定は、補助手術やロボット手術により、臓器のより良いカバレッジと様々な健康問題の検出が可能になる。
主流の自然画像深度推定では有望な進歩があったが、内視鏡画像では技術が不十分であった。
本稿では, 内視鏡から放射される光を表面から反射する光学的手がかりを用いて, 単分子深度推定を改善する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:17:30 GMT)
The FruitShell French synthesis system at the Blizzard 2023 Challenge [12.5] 本稿では,Blizzard Challenge 2023のためのフランス語音声合成システムを提案する。
この課題は、女性話者から高品質な音声を生成することと、特定の個人によく似た音声を生成することの2つのタスクから構成される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:26:16 GMT)
Diff-PCC: Diffusion-based Neural Compression for 3D Point Clouds [12.5] 我々はDiff-PCCと呼ばれる最初の拡散ベースの点クラウド圧縮手法を導入し、拡散モデルの表現力を利用して生成的かつ審美的に優れた復号を行う。
実験により,提案したDiff-PCCが最先端の圧縮性能を実現することを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:55:29 GMT)
FLAME: Learning to Navigate with Multimodal LLM in Urban Environments [12.4] 大規模言語モデル(LLM)は視覚・言語ナビゲーション(VLN)タスクの可能性を実証している。
LLMは専門的なナビゲーションタスクに苦労し、専門的なVLNモデルと比較すると、最適以下の性能が得られる。
本稿では,都市VLNタスク用に設計された新しいマルチモーダルLLMエージェントとアーキテクチャであるFLAMEを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:57:46 GMT)
Enhancing Robustness in Large Language Models: Prompting for Mitigating the Impact of Irrelevant Information [12.3] GSMIRという無関係情報を含む小学校数学問題のデータセットを構築した。
LLMは無関係な情報を識別できるが、一度特定されると引き起こされる干渉を効果的に軽減しない。
無関係な情報の影響を識別し、自己緩和するLSMの能力を高める新しい自動構築手法であるATFを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:49:38 GMT)
TextMastero: Mastering High-Quality Scene Text Editing in Diverse Languages and Styles [12.2] シーンテキスト編集は、オリジナルのように新たに生成されたテキストのスタイルを維持しながら、画像上のテキストを変更することを目的としている。
最近の研究は拡散モデルを活用し、改善された結果を示しているが、依然として課題に直面している。
emphTextMastero - 潜時拡散モデル(LDM)に基づく多言語シーンテキスト編集アーキテクチャを慎重に設計した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:06:09 GMT)
OMEGA: Efficient Occlusion-Aware Navigation for Air-Ground Robot in Dynamic Environments via State Space Model [12.1] 地上ロボット(AGR)は、監視や災害対応に広く利用されている。
現在のAGRナビゲーションシステムは、静的環境においてよく機能する。
しかし、これらのシステムは動的で厳しい閉塞シーンの課題に直面している。
これらの問題に対処するために,効率的なAGR-Plannerを用いたOccMambaを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:50:29 GMT)
An Efficient Real-Time Object Detection Framework on Resource-Constricted Hardware Devices via Software and Hardware Co-design [11.9] 本稿では,ハードウェアとソフトウェアの共同設計による資源制約のあるハードウェアデバイス上での効率的なリアルタイムオブジェクト検出フレームワークを提案する。
その結果,提案手法はモデルサイズを大幅に削減し,実行時間を短縮できることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:15:50 GMT)
Revisiting Evolutionary Program Repair via Code Language Model [11.7] 本稿では,多目的進化アルゴリズムをCLMと統合し,Javaプロジェクトのマルチロケーションバグを修正するARJA-CLMを提案する。
また,提案手法は,CLMが候補文を生成するための,アクセス可能なフィールドとメソッドに関する追加情報により,プロンプトを充実させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:57:45 GMT)
ECAFormer: Low-light Image Enhancement using Cross Attention [11.6] 低照度画像強調(LLIE)はコンピュータビジョンにおいて重要である。
我々はクロスアテンショントランス(ECAFormer)による階層的相互強化を設計する。
我々は,ECAFormerが複数のベンチマークで競合性能に到達し,PSNRを最適化法よりも3%近く改善したことを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:54:01 GMT)
While GitHub Copilot Excels at Coding, Does It Ensure Responsible Output? [11.5] 大きな言語モデル(LLM)は、コード補完機能が大きく進歩し、新しい世代のコード補完ツール(LCCT)を生み出した。
LCCTには固有の特徴があり、複数の情報ソースを入力として統合し、自然言語の相互作用に対するコード提案を優先順位付けする。
本稿では、これらの特徴を利用して、脱獄とデータ抽出攻撃の訓練という、2つの重大なセキュリティリスクに対する攻撃手法を開発する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:00:04 GMT)
ETGuard: Malicious Encrypted Traffic Detection in Blockchain-based Power Grid Systems [11.5] ブロックチェーンベースの電力グリッドシステムにおいて,悪意のある暗号化されたトラフィックを自動的に検出できる新しいフレームワークを提案する。
我々は、古い攻撃パターンを忘れることに抵抗するため、数学的に漸進的な学習損失を導出する。
提案手法は,3つのベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:53:42 GMT)
Vocabulary-Free 3D Instance Segmentation with Vision and Language Assistant [11.4] 語彙自由な設定で3Dインスタンスのセグメンテーションに対処する最初の手法を提案する。
我々は、大きな視覚言語アシスタントとオープン語彙の2Dインスタンスセグメンタを活用して、セマンティックなカテゴリを発見し、グラウンド化する。
ScanNet200 と Replica を用いて提案手法の評価を行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:46:54 GMT)
Non-convex matrix sensing: Breaking the quadratic rank barrier in the sample complexity [11.4] 分解された勾配は、基底真理行列の階数$r$のサンプル数でスペクトルにスケールすることを示す。
我々の証明は、勾配が個々の地上測定に弱いだけ依存していることを示す独立な議論に依存している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:09:28 GMT)
OCTCube: A 3D foundation model for optical coherence tomography that improves cross-dataset, cross-disease, cross-device and cross-modality analysis [11.3] OCTCubeは、26,605個の3D OCTボリュームで事前訓練された3Dファンデーションモデルである。
インダクティブとクロスデータセットの両方の設定で8つの網膜疾患を予測する場合、2Dモデルよりも優れています。
また、クロスデバイス予測や、糖尿病や高血圧などの全身疾患の予測に優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:55:19 GMT)
FedMFS: Federated Multimodal Fusion Learning with Selective Modality Communication [11.3] 選択的モーダル通信を用いたFedMFS(Federated Multimodal Fusion Learning)を提案する。
鍵となる考え方は、各デバイスに対するモダリティ選択基準の導入であり、(i)Shapley値解析によって測定されたモダリティの影響を重み付けし、(ii)モダリティモデルサイズを通信オーバーヘッドの指標とする。
実世界のActionSenseデータセットの実験では、FedMFSが複数のベースラインに匹敵する精度を達成し、通信オーバーヘッドを4倍に削減できることを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:05:20 GMT)
Passive decoy-state quantum secure direct communication with heralded single-photon source [11.1] シャード単一光子源(HSPS)を用いた高効率受動デコイ状態QSDCプロトコルを提案する。
我々のプロトコルは最大通信距離が17.975 km、平均光子数は0.01である。
我々の研究は、実用的な受動デコイ状態QSDCシステムのさらなる発展に向けた大きなステップとなる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:58:58 GMT)
Disentangling segmental and prosodic factors to non-native speech comprehensibility [11.1] 現在のアクセント変換システムは、非ネイティブアクセントの2つの主要な源である分節的特徴と韻律的特徴を分離しない。
本稿では,アクセントから声質を分離するACシステムを提案する。
本研究では,非母語音声の知覚的理解度に係わる部分的特徴と韻律の個人的寄与を定量化するために,知覚的聴取テストを実施している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:43:55 GMT)
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding [11.0] 投機的復号法(SD)は、性能を犠牲にすることなくレイテンシを低減する手法として広く用いられている。
我々は,中間列から長列の高スループット推論方式であっても,驚くほどSDが高速化可能であることを示す。
より興味深いことに、インテリジェントなドラフト戦略は、厳密な分析に基づいてバッチサイズを増やすことで、より良いスピードアップを達成することができます。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:57:31 GMT)
MagicID: Flexible ID Fidelity Generation System [11.0] 現在の方法では、解像度の低い画像のごく一部を顔が占める場合、高忠実度ポートレートの結果を生成するのが困難である。
我々は、IDZoomという自己構築された100万レベルのマルチモーダルデータセットに基づいて、MagicIDと呼ばれる体系的なソリューションを提案する。
MagicID は Multi-Mode Fusion Training Strategy (MMF) と DDIM Inversion based ID Restoration Inference framework (DIIR) から構成される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:39:46 GMT)
Facial Demorphing via Identity Preserving Image Decomposition [10.9] モルヒネ攻撃検出技術は ボナファイドの情報を抽出しない
参照不要でボナファイドを高精度に回収する手法を提案する。
本手法は, 高品質なボナファイドを定義・忠実度で再構成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:42:11 GMT)
SCLA: Automated Smart Contract Summarization via LLMs and Semantic Augmentation [10.8] 大規模言語モデル(LLM)には、プロンプトに埋め込まれたコード例からコード要約を生成する能力がある。
コード要約性能を向上させるために,LLMとセマンティック拡張を利用したフレームワークであるSCLAを提案する。
SCLAは他の最先端モデル(CodeBERT、CodeT5、CodeT5+)を上回り、37.53%のBLEU-4、52.54%のMETEOR、56.97%のROUGE-L、63.44%のBLEURTを達成している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:34:56 GMT)
Generating Multi-frame Ultrawide-field Fluorescein Angiography from Ultrawide-field Color Imaging Improves Diabetic Retinopathy Stratification [10.8] 生成人工知能(GenAI)を用いた無染UWF-FA画像の取得を目指す。
生成したUWF-FA画像の品質を定量化と人的評価により評価した。
このモデルは静脈内染料注入なしで現実的な多フレームUWF-FA画像を生成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:22:29 GMT)
Representation Norm Amplification for Out-of-Distribution Detection in Long-Tail Learning [10.7] 提案手法はtextitRepresentation Norm Amplification (RNA) と呼ばれ, 分布外サンプルの検出の問題を解決する。
実験により、RNAは最先端の方法と比較してOODの検出と分類の両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:27:07 GMT)
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments [10.5] High-Resolution Early Dropping (HiRED) は、Large Language Model (LLM) ステージの前に固定トークン予算内で機能するトークンドロップ方式である。
HiREDは既存の高解像度ビジョンランゲージモデルとプラグイン・アンド・プレイで統合することができる。
NVIDIA TESLA P40 GPU上のLLaVA-Next-7Bに適用されると、20%のトークン予算を持つHiREDはトークン生成スループットを4.7向上し、ファーストトーケン生成遅延を15秒短縮し、単一の推論のために2.3GBのGPUメモリを節約する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:34:27 GMT)
Finding the DeepDream for Time Series: Activation Maximization for Univariate Time Series [10.4] 逐次情報解析に最大活性化を適用する手法であるSequence Dreamingを紹介する。
モデル決定プロセスに最も影響を及ぼす時間的ダイナミクスとパターンを可視化する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:09:44 GMT)
CoDi: Conversational Distillation for Grounded Question Answering [10.3] 我々はCoDiという新しいデータ蒸留フレームワークを導入する。
CoDiを使えば、大規模でアシスタントスタイルのデータセットを、さまざまな方法で合成することができます。
我々は,CoDi合成データを用いてトレーニングしたSLMが,標準的な測定値において,人間の注釈付きデータに基づいてトレーニングしたモデルに匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:35:47 GMT)
Optimization of Multi-Agent Flying Sidekick Traveling Salesman Problem over Road Networks [10.2] 道路ネットワーク上でのマルチエージェント飛行サイドキック走行セールスマン問題(MA-FSTSP)について紹介する。
このNPハード問題に対して,混合整数線形計画モデルと効率的な3相アルゴリズムを提案する。
当社のアプローチは5分間の時間制限内で300以上の顧客にスケールし、大規模な実世界のロジスティクスアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:44:18 GMT)
How to Make the Gradients Small Privately: Improved Rates for Differentially Private Non-Convex Optimization [10.1] 非一般化損失関数の定常点を近似的に求めるために、微分プライベートアルゴリズムを設計するためのシンプルで柔軟なフレームワークを提供する。
我々は、このフレームワークを用いて、いくつかの非一般化損失関数に対して、時折改善された最適率を得る。
アシュシュシュ・ハイツ(英語版)は上記の問題のそれぞれに対して以前の最先端を達成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:37:32 GMT)
Hide Your Malicious Goal Into Benign Narratives: Jailbreak Large Language Models through Neural Carrier Articles [10.1] 本稿では,言語モデルモデル(LLM)の注意を移す新しいタイプのジェイルブレイク攻撃を提案する。
提案攻撃では,知識グラフとLLMを利用して,禁止クエリのトピックに類似したキャリア記事を自動的に生成する。
実験の結果,提案手法はクロード3を除いて,高い成功率の目標LLMを投獄できることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:35:04 GMT)
Discovery of Generalizable TBI Phenotypes Using Multivariate Time-Series Clustering [10.0] 我々の研究は、様々な設定や個体群で一貫して一般化されるTBI表現型に対処する。
解析の結果,TBI表現型は3種類(アルファ,ベータ,ガンマ)であった。
年齢はTBIの結果の重要な決定要因であり、高齢のコホートは死亡率が高い。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:12:44 GMT)
SparseGrow: Addressing Growth-Induced Forgetting in Task-Agnostic Continual Learning [9.9] 連続学習(CL)では、モデルの成長は新しいデータに対する適応性を高め、より多くのタスクに対する知識保持を改善する。
GIFt(Growth-induced forgeting)はGIFt(GIFt)と呼ばれる問題であり,特にタスク認識CLでは,成長モデル全体を用いて推論を行う。
SparseGrowはデータ駆動のスパース層拡張を使用して、成長中の効率的なパラメータ使用量を制御し、過剰な成長と機能変更からGIFtを削減する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:05:52 GMT)
Unboxing Occupational Bias: Grounded Debiasing LLMs with U.S. Labor Data [9.9] 大規模言語モデル(LLM)は、社会的バイアスを継承し増幅する傾向がある。
LLMバイアスは、不公平な慣行をもたらし、社会的不平等を悪化させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:54:26 GMT)
Non-autoregressive Generative Models for Reranking Recommendation [9.9] 推薦システムでは、項目間のリスト内相関をモデル化することで、リランクが重要な役割を果たす。
本研究では, 効率と効率性を高めるために, 提案するレコメンデーション(NAR4Rec)の再評価のための非自己回帰生成モデルを提案する。
NAR4Recは、毎日3億人のアクティブユーザーがいる人気ビデオアプリKuaishouに完全にデプロイされている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:29:37 GMT)
A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse [9.8] 生成AI、特に潜在拡散モデル(LDM)の最近の進歩は、画像合成と操作に革命をもたらした。
VAEが訓練中に後部崩壊をきたすという観察に基づくPCA(Posterior Collapse Attack)を提案する。
本手法は,対象モデルのホワイトボックス情報への依存を最小限に抑え,モデル固有の知識への暗黙的な依存を取り除く。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:43:53 GMT)
Conformalized Interval Arithmetic with Symmetric Calibration [9.6] 我々は,複数の目標の和に対する予測区間に対して,単一目標に対する共形予測区間を開発する。
提案手法は, 既存のコンフォメーション手法や非コンフォメーション手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:27:18 GMT)
Minor SFT loss for LLM fine-tune to increase performance and reduce model deviation [9.5] 最適化されたモデルと元のモデルとの差分を測定するためのSFTのトレーニング指標と、トレーニングの有効性を高めることができる損失関数MinorSFTを提案する。
本稿では,DPO と MinorDPO の知見を得て,最適化モデルとオリジナルモデルとの差分を測定するための SFT のトレーニング指標と,トレーニングの有効性を高めることができる損失関数 MinorSFT を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:32:44 GMT)
Universal Novelty Detection Through Adaptive Contrastive Learning [9.3] ノベルティ検出は、オープンな世界で機械学習モデルをデプロイするための重要なタスクである。
本研究では,既存の手法が,その剛性帰納バイアスから生じる普遍性を維持することを実験的に示す。
本稿では,新しい確率論的自己負対生成法であるAutoAugOODを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:46:23 GMT)
The Instance-centric Transformer for the RVOS Track of LSVOS Challenge: 3rd Place Solution [9.3] 2つのインスタンス中心モデルを構築し、フレームレベルとインスタンスレベルの予測結果を融合する。
検証段階では52.67 J&F, 試験段階では60.36 J&F, 第6回 LSVOS Challenge RVOS Track では3位となった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:45:13 GMT)
Crafting Tomorrow's Headlines: Neural News Generation and Detection in English, Turkish, Hungarian, and Persian [9.3] 我々は、英語、トルコ語、ハンガリー語、ペルシア語という4つの言語でニューラルニュース検出のために設計されたベンチマークデータセットを紹介した。
このデータセットには、BloomZ、LLaMa-2、Mistral、Mixtral、GPT-4など、複数の多言語ジェネレータ(ゼロショットと微調整の両方)からの出力が含まれている。
本研究は,全言語を対象とした機械生成テキスト検出器の解釈性と頑健性を明らかにすることを目的とした検出結果を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:45:36 GMT)
XCB: an effective contextual biasing approach to bias cross-lingual phrases in speech recognition [9.0] 本研究では,言語間コンテキストバイアス(XCB)モジュールを提案する。
我々は、補助言語バイアスモジュールと言語固有の損失を統合することで、支配言語のための事前訓練されたASRモデルを強化する。
社内のコードスイッチングデータセットで行った実験結果から,本手法の有効性が検証された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:00:19 GMT)
Atlas-Based Interpretable Age Prediction In Whole-Body MR Images [8.9] 全身3D画像を用いて人体を大規模に老化させる方法について検討した。
我々はGrad-CAM法を用いて、人の年齢を最も予測する身体領域を推定する。
対象者の年齢を予測する上で,全身の3次元容積と全人口分析は,どの部位が最も重要な役割を担っているかという重要な洞察を与えることができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:52:17 GMT)
An End-to-End Reinforcement Learning Based Approach for Micro-View Order-Dispatching in Ride-Hailing [8.9] ディディにおけるエンドツーエンドの強化学習に基づく秩序分散手法を提案する。
我々はこの問題をモデル化するために2層決定プロセスフレームワークを使用し、注文代入を生成するエンコーダ-デコーダ構造ネットワークであるアンダーラインDouble underlineScalable underlineNetwork (DSN2)を提案する。
コンテキストダイナミクスを活用することで、私たちのアプローチは行動パターンに適応してパフォーマンスを向上させることができます。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:30:53 GMT)
WRIM-Net: Wide-Ranging Information Mining Network for Visible-Infrared Person Re-Identification [8.9] 本稿では,多次元インタラクティブ情報マイニング(MIIM)モジュールと補助情報に基づくコントラスト学習(AICL)アプローチを主とするワイドランキング情報マイニングネットワーク(WRIM-Net)を紹介する。
計算複雑性の低い設計により、別々のMIIMを浅い層に配置することができ、ネットワークは特定のモダリティの多重次元情報をよりよくマイニングすることができる。
我々は、よく知られたSYSU-MM01とRegDBデータセットだけでなく、最新の大規模クロスモダリティLLMデータセットにも広範な実験を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:06:16 GMT)
On Learning Action Costs from Input Plans [8.7] 入力計画の集合が最適であるような行動の集合のコストを学習する新たな問題を導入する。
ラベルのない入力計画からアクションのコストを学習するアルゴリズムであるLACFIPk$を提示する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:20:19 GMT)
Soda-Eval: Open-Domain Dialogue Evaluation in the age of LLMs [8.7] 本稿では,Sodaをベースとした注釈付きデータセットであるSoda-Evalについて紹介する。
そこで,Soda-Eval をベンチマークとして,オープンアクセス命令チューニング LLM の性能について検討する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:45:23 GMT)
Human-inspired Explanations for Vision Transformers and Convolutional Neural Networks [8.7] 本稿では,Deep Neural Networks のための新しいヒューマンインスパイアされた視覚的説明可能性 (XAI) 手法である Foveation-based Explanations (FovEx) を紹介する。
提案手法は変圧器(5つの指標のうち4つ)と畳み込みモデルの両方で最先端の性能を達成し,その汎用性を実証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:57:06 GMT)
Learning Randomized Algorithms with Transformers [8.6] 本稿では,深層ニューラルネットワーク,特にトランスフォーマーモデルをランダム化して拡張する。
ランダム化されたアルゴリズムは、学習を通じて、純粋にデータと客観的に駆動された方法でトランスフォーマーに組み込むことができることを初めて実証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:13:36 GMT)
Exploiting Large Language Models Capabilities for Question Answer-Driven Knowledge Graph Completion Across Static and Temporal Domains [8.5] 本稿では,GS-KGC(Generative Subgraph-based KGC)と呼ばれる新しい生成完了フレームワークを提案する。
GS-KGCは、ターゲットエンティティを直接生成するために質問応答形式を採用し、複数の可能な答えを持つ質問の課題に対処する。
本手法は,新たな情報発見を容易にするために,既知の事実を用いて負のサンプルを生成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:13:41 GMT)
Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation [8.5] 本稿では、IRSTLGラベル生成のためのエネルギダブルガイドシングルポイントプロンプト(EDGSP)フレームワークを提案する。
実験により、EDGSPはSIRST、NUDT-SIRST、IRSTD-1kデータセット上で100%オブジェクトレベルの検出確率(Pd)と0%の偽アラームレート(Fa)を達成することが示された。
EDGSPは、初めてシングルポイント生成された偽のマスクをフルラベルを超えて認識する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:05:20 GMT)
DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation [8.3] DSLRは、検索された文書を文に分解し、無関係な文をフィルタリングし、それらを再び一貫性のある文に再構成する、教師なしのフレームワークである。
我々は,複数のオープンドメインQAデータセット上でDSLRを実験的に検証し,DSLRが従来の固定サイズパスよりもRAG性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:27:56 GMT)
IIDM: Image-to-Image Diffusion Model for Semantic Image Synthesis [8.1] 本稿では,セマンティック画像合成を画像認識タスクとして扱う。
スタイル参照はまずランダムノイズで汚染され、その後IIDMによって徐々に認知される。
改良,色変換,モデルアンサンブルの3つの手法が提案され,生成品質がさらに向上した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:05:59 GMT)
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model [8.1] 大規模言語モデル(LLM)の急速な進歩はロールプレイングに革命をもたらし、一般的なロールプレイングモデルの開発を可能にした。
現在のロールプレイングトレーニングには2つの大きな問題がある: (I) 特定のシナリオに対する対話トレーニングを促すために事前に定義されたロールプロファイルを使用することで、対話とプロファイルの間に矛盾や矛盾が生じ、トレーニングバイアスが生じる。
我々はこれらのハードルを克服するために、DIALOGUEと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:47:38 GMT)
EPiC: Cost-effective Search-based Prompt Engineering of LLMs for Code Generation [8.0] 大規模言語モデル(LLM)は、特にコード生成において、様々なソフトウェア開発タスクで利用が増加している。
我々は、コードのための進化的プロンプトエンジニアリング(EPiC)という別のアプローチを提案し、高品質なコードを生成するより良いプロンプトに向けて、元のプロンプトを進化させる。
最先端(SOTA)LLMベースのコード生成モデルに対する評価は,コスト効率の観点から,EPiCがすべてのベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:15:36 GMT)
Aligning Object Detector Bounding Boxes with Human Preference [7.9] 一般的に使われている物体検出器は、大小の箱を等しく予測する。
定性的評価は、人間の嗜好が物体の形状のようないくつかの物体の特徴に影響される可能性があることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:37:02 GMT)
Breast tumor classification based on self-supervised contrastive learning from ultrasound videos [7.8] 我々は,胸部超音波ビデオクリップから表現を学習するために,トリプルトネットワークと自己教師付きコントラスト学習手法を採用した。
本モデルでは,受信機動作特性曲線 (AUC) の0.952の領域を達成した。
提案フレームワークはラベル付きデータに対する需要を大幅に減らし,乳房超音波画像の自動診断に活用する可能性を秘めている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:16:01 GMT)
Challenging the Human-in-the-loop in Algorithmic Decision-making [7.8] 技術的・哲学的な観点から,社会問題に対するアルゴリズム意思決定(ADM)における人間の役割を論じる。
特に、関係する人間による様々な期待、価値観、制約から生じる緊張について説明する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:48:13 GMT)
NeR-VCP: A Video Content Protection Method Based on Implicit Neural Representation [7.7] 暗黙的ニューラル表現に基づくビデオコンテンツ保護のための自動暗号化手法を提案する。
NeR-VCPはまず、送信者によって訓練されたキー制御可能なモジュールを受信者に事前配布する。
我々は,視覚的表現,不正ユーザに対する非受容性,暗号的観点からのセキュリティにおいて,優れた性能を有することを実験的に見出した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:23:51 GMT)
Language Modeling on Tabular Data: A Survey of Foundations, Techniques and Evolution [7.7] タブラルデータは、その異種の性質と複雑な構造的関係により、固有の課題を示す。
表型データ解析における高い予測性能とロバスト性は、多くのアプリケーションにとって大きな可能性を秘めている。
GPTやLLaMAといった最近の大規模言語モデルの出現はこの分野にさらなる革命をもたらし、最小限の微調整でより高度で多様なアプリケーションを容易にした。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:59:19 GMT)
Mistral-SPLADE: LLMs for for better Learned Sparse Retrieval [7.7] 本稿では,意味的キーワード拡張学習にデコーダのみを用いたモデルを提案する。
我々はMistralをバックボーンとして,SPLADEに似たLearned Sparse Retrieverを開発した。
提案実験は,デコーダのみに基づくスパース検索モデル (LLM) が既存のLSRシステムの性能を上回るという仮説を支持する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:21:54 GMT)
An Efficient Sign Language Translation Using Spatial Configuration and Motion Dynamics with LLMs [7.6] グロスフリー手話翻訳(英: Gloss-free Sign Language Translation, SLT)は、手話の動画を直接言語文に変換する言語である。
本稿では手話に固有の空間的構成や動きのダイナミクスを捉えることの重要性を強調する。
本稿では,空間と運動に基づく手話翻訳(SpaMo)について紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:10:40 GMT)
Reading with Intent [7.6] オープンインターネットを知識源として依存するRAGシステムは、人間が生成するコンテンツの複雑さと競合する必要がある。
本稿では,サルカズムの存在下での応答の解釈・生成能力を高めるプロンプトシステムを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:47:27 GMT)
S3E: A Mulit-Robot Multimodal Dataset for Collaborative SLAM [7.5] 拡張型マルチモーダルデータセットであるS3Eを紹介する。
S3Eは4つの異なる共同軌道パラダイムを横断する無人地上車両群によって捕獲され、13の屋外および5つの屋内シーケンスを含んでいる。
これらのシーケンスは、360度LiDAR点雲、高分解能ステレオ画像、高周波慣性測定ユニット(IMU)、UWB(Ultra-wideband)の相対観測を含む、細心の同期と空間的に校正されたデータストリームを特徴としている。
我々のデータセットは、スケール、シーンの多様性、データの複雑度に関する過去の取り組みを上回るだけでなく、協調的なSLAM方法論と個別のSLAM方法論の徹底的な分析とベンチマークも提供しています。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:12:38 GMT)
BrainVis: Exploring the Bridge between Brain and Visual Signals via Image Reconstruction [7.5] 脳信号からの視覚刺激の分析と再構成は、人間の視覚系の理解を効果的に進める。
しかし、脳波信号は複雑であり、大きなノイズを含む。
これにより、脳波からの視覚刺激再建の既存の作品にかなりの制限が生じる。
我々はこれらの課題に対処するためにBrainVisと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:06:39 GMT)
LLM-Barber: Block-Aware Rebuilder for Sparsity Mask in One-Shot for Large Language Models [7.5] 大規模言語モデル(LLM)は大規模に大きく成長しており、効率的なモデルプルーニング技術を必要としている。
LLM-Barber (Block-Aware Rebuilder for Sparsity Mask in One-Shot) は, プレナードモデルのスポーシティマスクをリトレーニングや重量再構成なしに再構築する, ワンショットプルーニングフレームワークである。
実験の結果,LLM-Barber は 1 つの A100 GPU 上で 7B から 13B のパラメータを持つモデルを 30 分で効率的にプルークできることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:13:52 GMT)
Interactive Counterfactual Generation for Univariate Time Series [7.3] 私たちのアプローチは、ディープラーニングモデルの意思決定プロセスの透明性と理解を高めることを目的としています。
提案手法は,提案するデータポイントとユーザインタラクションを抽象化することにより,直感的な事実説明の生成を容易にする。
本手法をECG5000ベンチマークデータセットを用いて検証し,解釈可能性と時系列分類のユーザ理解の大幅な向上を実証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:19:55 GMT)
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question Answering [7.3] S Large Language Models for Telecom Networks”は、Phi-2とFalcon-7Bの2つの小言語モデルの性能向上を目的としている。
ソリューションはPhi-2で81.9%、Falcon-7Bで57.3%の精度を達成した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:58:16 GMT)
A Practical Solver for Scalar Data Topological Simplification [7.1] 本稿では,トポロジカル単純化の最適化のための実践的アプローチを提案する。
フィラメントループを除去する標準的なトポロジカル手法よりも,本手法が優れていることを示す。
また,本手法は表面処理における遺伝子欠陥の修復にも有効であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:27:00 GMT)
The Dilemma of Uncertainty Estimation for General Purpose AI in the EU AI Act [6.9] AI法は、欧州連合全体のAIシステムの規制である。
我々は、不確実性推定が、実世界でモデルをデプロイするために必要なコンポーネントであるべきだと論じる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:59:51 GMT)
GPT-based Textile Pilling Classification Using 3D Point Cloud Data [6.9] 布の実際のテスト環境で数千の3Dポイントのクラウドイメージを収集し、それらをTextileNet8データセットとしてラベル付けします。
TextileNet8をベンチマークとして、提案したPointGPT+NNモデルは91.8%の総合精度(OA)、平均クラス毎の平均精度(mAcc)が92.2%であることを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:43:19 GMT)
Open 3D World in Autonomous Driving [6.9] 本稿では,LIDARセンサから取得した3Dポイントクラウドデータをテキスト情報と統合する手法を提案する。
本稿では,鳥眼ビュー (BEV) 領域の特徴とテキスト特徴を融合するための効率的な枠組みを提案する。
提案手法の有効性は,新たに導入されたNuScenes-Tデータセット上での広範囲な実験を通じて明確に評価されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:10:44 GMT)
Planning Domain Model Acquisition from State Traces without Action Parameters [6.8] 学習行動のパラメータが提供されない状況における学習について検討する。
本稿では,どの情報を提供するかに基づいて,トレース品質のレベルを2つ提示し,それぞれにアルゴリズムを提案する。
提案アルゴリズムを実験により評価し,最先端の学習ツールFAMAと比較した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:24:00 GMT)
Unc-TTP: A Method for Classifying LLM Uncertainty to Improve In-Context Example Selection [6.8] 大規模言語モデル(LLM)は、様々な下流タスクで例外的なパフォーマンスを示している。
ユーザにとって、応答が確実に生成されるか、あるいはユーザの期待に応えて作られているかを判断することは困難である。
本稿では,LLMの不確かさを分類するために,新しい不確実性三部テストパラダイム (Uncertainty Tripartite Testing Paradigm: Unc-TTP) を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:51:59 GMT)
Beyond Labels: Aligning Large Language Models with Human-like Reasoning [6.8] 我々は,言語モデルの整合化を支援するために,DFAR(Aligning Reasons)のための倫理データセットをキュレートした。
データセットには倫理的非倫理的なラベルとそれに対応する理由が記載されている。
本研究では,倫理ラベルとそれに対応する理由を利用した,独特で斬新な微調整アプローチを採用した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:44:51 GMT)
Optimizing Quantum Fourier Transformation (QFT) Kernels for Modern NISQ and FT Architectures [6.8] 量子変換(QFT)のためのドメイン固有ハードウェアマッピング手法を提案する。
プログラム合成ツールの助けを借りて、キュービットマッピングソリューションを探索するために、QFTにおける緩和順序付けとユニット探索の洞察を統一する。
本手法は, Google Sycamore, IBM Heavy-hex, 格子手術において, 量子ビット数に関して線形深度QFT回路を保証する最初の方法である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:54:16 GMT)
Does Co-Development with AI Assistants Lead to More Maintainable Code? A Registered Report [6.7] 本研究は,AIアシスタントがソフトウェア保守性に与える影響を検討することを目的とする。
フェーズ1では、開発者はAIアシスタントの助けなしに、Javaプロジェクトに新しい機能を追加する。
ランダム化されたコントロールされた試行のフェーズ2では、さまざまな開発者がランダムフェーズ1プロジェクトを進化させ、AIアシスタントなしで作業する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:48:42 GMT)
Statistical Challenges with Dataset Construction: Why You Will Never Have Enough Images [6.7] 近年、ディープニューラルネットワークは多くのコンピュータビジョンベンチマークで顕著なパフォーマンスを達成している。
ベンチマークにおける印象的なパフォーマンスが、現実の環境での強いパフォーマンスに変換されると確信していますか?
我々は、統計理論と経験的証拠の両方を通して、モデルをテストするための代表的な画像データセットを選択することは、多くの領域で不可能であると主張している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:33:24 GMT)
High-gain photon pair generation in a microring resonator with time-dependent non-perturbative effects [6.7] 単一リング共振器におけるパルス光子対生成の量子論を提案する。
このアプローチは、ハイゼンベルク図形入力出力形式と古典非線形光学からの池田写像を組み合わせる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:15:54 GMT)
Deep Index Policy for Multi-Resource Restless Matching Bandit and Its Application in Multi-Channel Scheduling [6.6] 異種資源システムのためのマルチリソースレスマッチングバンディット(MR-RMB)モデルについて論じる。
MR-RMBに適したオンライン学習アルゴリズムであるDeep Index Policy(DIP)を導入する。
シミュレーションの結果,DIPが効率よく部分指数を学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:20:10 GMT)
Audio Match Cutting: Finding and Creating Matching Audio Transitions in Movies and Videos [6.6] マッチカット」は、類似した構成を持つ一対のショットが、あるものから別のものへ流動的に遷移する、一般的なビデオ編集技法である。
本稿では,ビデオや映画の中で"オーディオマッチカット"を自動的に見つけ,生成する能力について検討する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:46:54 GMT)
A study on the adequacy of common IQA measures for medical images [6.6] 医学画像に現れる不整合は、自然画像とは異なる性質を持つため、驚くべきことではない。
本研究では,手動評価胸部X線(5名)と光音響画像(2名)と比較し,医療画像データに対する一般的なIQA測定の有効性を検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:05:44 GMT)
Does GPT Really Get It? A Hierarchical Scale to Quantify Human vs AI's Understanding of Algorithms [6.4] 我々は,アルゴリズムの理解に焦点をあて,理解の階層化を提案する。
階層構造を用いて、人間の対象だけでなく、大きな言語モデルを用いた研究を設計し、実施する。
我々の厳格な基準は、そのような認知領域におけるAIの進歩を追跡するのに役立つと期待しています。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:08:13 GMT)
Investigating Context Effects in Similarity Judgements in Large Language Models [6.4] 大規模言語モデル(LLM)は、自然言語テキストの理解と生成におけるAIモデルの能力に革命をもたらした。
命令バイアスによる人的判断とLCMのアライメントに関する調査が進行中である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:26:02 GMT)
AutoBench: Automatic Testbench Generation and Evaluation Using LLMs for HDL Design [6.4] テストベンチはシミュレーションベースのハードウェア検証の基礎となる。
LLM(Large Language Models)は、回路設計フローの自動化の可能性を実証している。
デジタル回路設計のための最初のLCMベースのテストベンチジェネレータであるAutoBenchを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:19:07 GMT)
TDS-CLIP: Temporal Difference Side Network for Image-to-Video Transfer Learning [6.3] 本稿では,知識伝達と時間的モデリングのバランスをとるために,メモリ効率の良い時間差分側ネットワーク(TDS-CLIP)を提案する。
具体的には、動作特徴の局所的な時間差を効果的に捉えることのできる時間差適応器(TD-Adapter)を導入する。
また,ビデオ中のリッチモーション情報を効率的に学習するために,提案するサイドネットワークを誘導するサイドモーション拡張アダプタ(SME-Adapter)を設計した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:40:08 GMT)
A Structure-aware Generative Model for Biomedical Event Extraction [6.3] GenBEEという名前のイベント構造を意識した生成モデルは、バイオメディカルテキストで複雑なイベント構造をキャプチャできる。
我々は3つのバイオメディカルイベント抽出ベンチマークを用いて提案したGenBEEモデルを評価した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:32:37 GMT)
Graph Reinforcement Learning for Combinatorial Optimization: A Survey and Unifying Perspective [6.2] 我々は、強化学習の試行錯誤パラダイムを用いて、より良い意思決定戦略を発見する。
この研究は、パフォーマンスアルゴリズムが典型的に知られていない非標準グラフ問題に焦点を当てている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:21:32 GMT)
A Review of Human-Object Interaction Detection [6.2] ヒトと物体の相互作用(HOI)の検出は、高レベルの視覚的理解において重要な役割を果たす。
本稿では,画像に基づくHOI検出における最近の研究を体系的に要約し,考察する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:32:39 GMT)
Detecting Fraudulent Services on Quantum Cloud Platforms via Dynamic Fingerprinting [6.2] Noisy Intermediate-Scale Quantum (NISQ) デバイスは、クラウドプラットフォームを介してアクセス可能であるが、可用性の制限とサブ最適品質のために課題に直面している。
本研究では,量子クラウドプラットフォーム上での不正サービス提供を検出するための動的フィンガープリント手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:26:59 GMT)
World Models Increase Autonomy in Reinforcement Learning [6.2] 強化学習(Reinforcement Learning, RL)は、知的エージェントを訓練するための魅力的なパラダイムである。
MoReFreeエージェントは、リセット不要タスクを処理するために、探索とポリシー学習という2つの重要なメカニズムを適用する。
環境報酬やデモンストレーションへのアクセスなしに、様々なリセットのないタスクに対して優れたデータ効率を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:23:34 GMT)
Target-Oriented Object Grasping via Multimodal Human Guidance [6.0] 従来の把握検出手法は、シーン全体を解析して把握を予測し、冗長性と非効率性をもたらす。
本研究では,目標参照視点から6-DoFのグリップ検出を再検討し,TOGNet(Target-Oriented Grasp Network)を提案する。
TOGNetは特に、より効率的に把握を予測するために、ローカルでオブジェクトに依存しない領域パッチをターゲットにしている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:42:56 GMT)
Ghost Echoes Revealed: Benchmarking Maintainability Metrics and Machine Learning Predictions Against Human Assessments [6.0] この研究は、State-of-the-Art (SotA) ML、SonarQube's Maintainability Rating、CodeScene's Code Health、Microsoft's Maintainability Indexなど、いくつかの保守性予測アプローチをベンチマークする。
結果は、CodeSceneがSotA MLの精度と一致し、平均的な人間専門家を上回っていることを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:37:30 GMT)
Trustworthy Compression? Impact of AI-based Codecs on Biometrics for Law Enforcement [6.0] 我々は,AI圧縮が虹彩,指紋,軟生体計測画像に与える影響について検討する。
虹彩認識は強い影響を受けうるが、指紋認識は非常に堅牢である。
細部が失われることは、布地やタトゥー画像によく見られる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:18:28 GMT)
Shadow Ansatz for the Many-Fermion Wave Function in Scalable Molecular Simulations on Quantum Computing Devices [5.9] シャドウトモグラフィーは、量子デバイス上の多周波関数に対して効率的かつ正確なアンサッツを生成することができることを示す。
シミュレータと量子デバイス上でのH$_3$の計算により、拡張性のあるシミュレーションに対するアンザッツの利点を実証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:27:53 GMT)
Breaking Language Barriers with MMTweets: Advancing Cross-Lingual Debunked Narrative Retrieval for Fact-Checking [5.9] 言語横断的な物語検索は未検討の問題である。
本研究は, 言語間分離された物語検索を導入し, (i)多言語誤報ツイート(MMTweets)を作成することにより, この研究ギャップに対処する。
MMTweetsは、言語間のペア、画像、人間のアノテーション、きめ細かいラベルを特徴としている。
MMTweetsは言語横断的な物語検索の課題を示し,検索モデルの改善領域を強調している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:24:50 GMT)
Eigenvalues and eigenvectors of complex Hadamard matrices [5.8] 6$6の複素アダマール行列(CHM)を特徴づけることは、線形代数と量子情報においてオープンな問題である。
脱相形式を持つ任意の$ntimes n$ CHM が 2 つの定数固有値 $pmsqrtn$ を持ち、2 つの定数固有ベクトルを持つことを示す。
固有値と固有ベクトルが6倍のCHMを6倍のCHMを6倍のCHMの完全分類に導くと推測する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:52:43 GMT)
Combining Objective and Subjective Perspectives for Political News Understanding [5.7] 本稿では、両視点を統合し、主観的側面のきめ細かい処理を提供するテキスト分析フレームワークを提案する。
本稿では、ニュースメディア、政治的指向、トピック、個々のエンティティ、人口構成に関する洞察とともに、その機能について説明する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:13:19 GMT)
End-to-end learned Lossy Dynamic Point Cloud Attribute Compression [5.7] 本研究では、エンドツーエンドの動的損失属性符号化手法を提案する。
我々は、遅延テンソルをビットストリームに符号化する自動回帰コンテキストモデルとともに、従来の潜時空間を利用するコンテキストモデルを用いる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:06:59 GMT)
ELASTIC: Efficient Linear Attention for Sequential Interest Compression [5.7] 最先端のシーケンシャルレコメンデーションモデルは、トランスフォーマーの注意機構に大きく依存している。
逐次的関心圧縮のための効率的な線形注意法であるELASTICを提案する。
我々は、様々な公開データセットに関する広範な実験を行い、それをいくつかの強力なシーケンシャルなレコメンデータと比較する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:24:50 GMT)
Experimental evaluation of architectural software performance design patterns in microservices [5.7] 本研究の目的は,設計パターンがシステム性能指標に与える影響を定量化することである。
実際のパフォーマンス測定は、モデルベースの予測と比較される。
その結果、ベンチマークシステムのパラメータ化が難しいにもかかわらず、モデルベースの予測は実際の実験と一致していることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:21:40 GMT)
Automated Detection of Algorithm Debt in Deep Learning Frameworks: An Empirical Study [5.6] 最近の研究では、機械学習モデル(ML/DL)が、SATD(Self-Admitted Technical Debt)と呼ばれるソースコードコメントから技術的負債を検出できることが示されている。
我々の目標は、様々なML/DLモデルのAD検出性能を改善することである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:06:58 GMT)
Conditional Brownian Bridge Diffusion Model for VHR SAR to Optical Image Translation [5.6] 本稿では,Brownian Bridge Diffusion Model(BBDM)に基づく条件付き画像から画像への変換手法を提案する。
我々は、MSAWデータセット、ペアSAR、0.5m Very-High-Resolution (VHR) の光学画像収集に関する総合的な実験を行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:30:11 GMT)
Adaptive Gradient Regularization: A Faster and Generalizable Optimization Technique for Deep Neural Networks [5.5] 本稿では、勾配ベクトルの和正規化を係数として、ディープニューラルネットワークの新しい最適化手法を研究するための最初の試みである。
提案手法は適応勾配正規化 (Adaptive gradient regularization, AGR) と呼ばれる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:21:38 GMT)
Synergistic Approach for Simultaneous Optimization of Monolingual, Cross-lingual, and Multilingual Information Retrieval [5.4] 本稿では,モノリンガル,クロスリンガル,マルチリンガル設定におけるゼロショット検索性能を改善するためのハイブリッドバッチ学習手法を提案する。
このアプローチは、データセットサイズに基づいてサンプリングされたモノリンガルとクロスリンガルの問合せ対のバッチを混合したマルチリンガル言語モデルを微調整する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:30:26 GMT)
A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection [5.4] 本稿では、カスタムデータ拡張のモデル性能とエネルギー効率の両立と自動データ拡張選択戦略について検討する。
多くの場合、データ拡張戦略の性能向上は、そのエネルギー使用量の増加によって、過度に隠蔽されていることが示されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:29:56 GMT)
CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models [5.4] 臨床治験結果予測 (CTOP) を試験設計文書を用いて検討し, 相転移を自動的に予測する。
GPT-3.5-based model (CTP-LLM) は,ヒトに選択された特徴を必要とせず,試験のオリジナルプロトコルテキストを解析することにより臨床治験相転移を予測する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:43:05 GMT)
Active Learning of Molecular Data for Task-Specific Objectives [5.3] アクティブラーニング(AL)は、特にデータ効率のよい機械学習アプローチであることを約束している。
本稿では,3つの分子データセットと2つの共通科学課題に対して,系統的なAL性能評価を行う。
その結果, ALの性能は, ターゲット分子の相対分布に依存することがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:50:29 GMT)
Low-Quality Image Detection by Hierarchical VAE [5.3] 本研究では,低画質画像の教師なし検出という新たな課題に対処する。
そこで本研究では,低画質の画像のさまざまな劣化を検知するだけでなく,その視覚的手がかりを提供する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:14:15 GMT)
Knowledge Sharing and Transfer via Centralized Reward Agent for Multi-Task Reinforcement Learning [5.2] 本稿では,中央報酬エージェント(CRA)と分散政策エージェントを統合したマルチタスク強化学習フレームワークを提案する。
CRAは知識プールとして機能し、様々なタスクから知識を抽出し、学習効率を向上させるために個別の政策エージェントに配布することを目的としている。
提案手法を離散領域と連続領域の両方で検証し,マルチタスク・スパース・リワード設定におけるロバスト性を実証し,未確認タスクに対する効果的な転送性を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:49:26 GMT)
Assisting Novice Developers Learning in Flutter Through Cognitive-Driven Development [5.2] 認知駆動開発(CDD、Cognitive-Driven Development)は、開発者が認知的限界内でコードの設計に集中するのを支援するコーディング設計技術である。
本研究では、Flutterプログラミングと、FlutterとCDDの両方に馴染みのない初心者開発者を対象とした2つの新しい次元におけるCDDの使用について検討した。
以上の結果から,CDDはCDD測定値であるICP(Intrinsic Complexity Points)を用いて,参加者のコードの複雑さを低く抑えるのに有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:46:46 GMT)
Tracing Privacy Leakage of Language Models to Training Data via Adjusted Influence Functions [5.2] この研究は、インフルエンス関数(IF)を実装して、トレーニングデータにプライバシリークをトレースする。
本稿では,大きな勾配ノルムを持つトークンの重みを減少させるHuristically Adjusted IF (HAIF)を提案する。
HAIFは追跡精度を大幅に改善し、PII-Eデータセットでは20.96%から73.71%、PII-CRデータセットでは3.21%から45.93%に向上した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:40:49 GMT)
SoftTiger: A Clinical Foundation Model for Healthcare Workflows [5.2] 医療基盤モデルとして設計された臨床用大規模言語モデル(CLaM)であるSoftTigerを紹介する。
我々は,3つのサブタスク,すなわち国際患者要約,臨床印象,医療的出会いのデータを収集し,注釈する。
公立および認証臨床データを用いて,最先端のLCMの微調整を指導した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:37:02 GMT)
Gender, Race, and Intersectional Bias in Resume Screening via Language Model Retrieval [5.1] 文書検索フレームワークを用いて,履歴書のスクリーニング設定において,大規模言語モデル (LLM) を用いることの可能性を検討する。
次に、履歴スクリーニングシナリオにおいて、MTE(Massive Text Embedding)モデルの選択がバイアスされているかどうかを判定するために、履歴監査を行う。
MTEは偏りがあり、85.1%のケースでは白人関連、11.1%のケースでは女性関連である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:49:26 GMT)
Creative Problem Solving in Large Language and Vision Models -- What Would it Take? [5.0] 計算創造性と大規模言語と視覚モデル(LLVM)の研究を統合するためのアプローチについて議論する。
予備実験では、CCの原理が拡張的プロンプトによってこの制限にどう対処できるかが示されている。
LLVMにおける創造的問題解決のためのMLアルゴリズムの文脈における計算創造性に関する議論の促進を期待する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:03:14 GMT)
Variable Assignment Invariant Neural Networks for Learning Logic Programs [4.8] 解釈遷移から学ぶ(LFIT)は、観察された状態遷移から規則を学ぶためのフレームワークである。
LFITは純粋にシンボリックなアルゴリズムで実装されているが、ノイズに対処したり、観測されていない遷移に一般化することはできない。
本稿では,記号領域に固有の変分不変性を活用する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:23:35 GMT)
Utilizing Resource Estimation for the Development of Quantum Computing Applications [4.7] 本稿では,実世界の量子コンピューティングアプリケーションの開発と評価を改善するために資源推定を利用する方法を紹介する。
これにより、エンドユーザーはすでに将来の量子コンピューティングアプリケーションの可能性をチェックできる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:48:01 GMT)
On the Potential of Open-Vocabulary Models for Object Detection in Unusual Street Scenes [4.7] アウト・オブ・ディストリビューション(OOD)オブジェクト検出は、トレーニングデータとは異なるデータ分布に由来するオブジェクトを検出することに焦点を当てた重要なタスクである。
本研究では,最先端のオープンボキャブラリオブジェクト検出器が街路における異常な物体をどの程度検出できるかを検討する。
3つの異なるデータセット上で、最先端のオープン語彙オブジェクト検出モデル4つをベンチマークする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:39:52 GMT)
Fine-Tuning a Local LLaMA-3 Large Language Model for Automated Privacy-Preserving Physician Letter Generation in Radiation Oncology [4.6] 本研究では,大規模言語モデル(LLM)の局所的な微調整,特にLLaMAモデルについて,放射線腫瘍学の分野におけるプライバシ保存的手法を用いて検討した。
QLoRAアルゴリズムは、限られた計算資源を持つLLMの局所的な構造内微調整のための効率的な方法を提供する。
臨床的メリットは, 臨床専門家に高く評価された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:31:36 GMT)
Inferring Underwater Topography with FINN [4.5] 有限体積ニューラルネットワーク(FINN)は、データの潜在構造を明らかにする上で特に効率的であることが証明されている。
その結果,FINNは波動力学のみから地形を推測する能力に優れていたことが判明した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:42:00 GMT)
On NVD Users' Attitudes, Experiences, Hopes and Hurdles [4.4] National Vulnerability Database (NVD)は主要な脆弱性データベースであり、誰でも自由に利用できる。
脆弱性に関する情報と、リンクされたアドバイザリやパッチなどの有用なリソースを提供する。
NVDは脆弱性情報の中央ソースとされ、脆弱性管理のリソース集約的なプロセスを改善するのに役立つ。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:46:53 GMT)
Improved Differential Evolution based Feature Selection through Quantum, Chaos, and Lasso [4.4] 医学において、解釈可能性が非常に重要である場合、特徴部分選択は重要な問題である。
本稿では,量子化メタヒューリスティックスにおける確率変数の代わりにカオス生成変数を導入することにより,その性能が大幅に向上することを示す。
このカオスによって引き起こされる改善は、基礎となる量子インスパイアされたメタヒューリスティック(英語版)の多種多様な変種に対してこれを実証することで一般的な現象であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:46:11 GMT)
Just a Hint: Point-Supervised Camouflaged Object Detection [4.4] カモフラージュされたオブジェクト検出(COD)は、環境内でシームレスにオブジェクトを迅速かつ正確に識別するモデルを要求する。
我々は,この課題を一点監督の助けを借りて遂行することを提案する。
具体的には、各オブジェクトを素早くクリックすることで、最初に元のポイントベースのアノテーションを合理的なヒント領域に適応的に拡張する。
そこで本研究では,物体全体に注意を散布するアテンションレギュレータを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:17:25 GMT)
MV-MOS: Multi-View Feature Fusion for 3D Moving Object Segmentation [4.4] 3D-to-2Dプロジェクションにおける動作と意味的特徴の有効活用と情報損失の回避は依然として重要な課題である。
点雲の異なる2次元表現からモーションセマンティックな特徴を融合させることにより,新しい多視点MOSモデル(MV-MOS)を提案する。
提案するマルチブランチ融合MOSフレームワークの有効性を総合実験により検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:30:00 GMT)
Hologram Reasoning for Solving Algebra Problems with Geometry Diagrams [4.4] 幾何学図を用いた代数問題の解法(APGD)は、図処理が言語処理ほど集中的に研究されないため、依然として難しい問題である。
本稿では,ホログラム推論方式を提案し,この方式を用いてAPGDを解く高性能な手法を開発した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:10:05 GMT)
Quantum Inverse Contextual Vision Transformers (Q-ICVT): A New Frontier in 3D Object Detection for AVs [4.4] 我々はQuantum Inverse Contextual Vision Transformer (Q-ICVT)と呼ばれる革新的な2段階融合プロセスを開発している。
このアプローチは、量子概念における断熱計算を利用して、Global Adiabatic Transformer (GAT)として知られる新しい可逆的視覚変換器を作成する。
実験の結果,Q-ICVTはL2障害に対して82.54mAPHを実現し,現状の核融合法よりも1.88%向上した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:36:57 GMT)
Towards Efficient Large Language Models for Scientific Text: A Review [4.4] 大規模言語モデル(LLM)は、科学を含む様々な分野において複雑な情報を処理するための新しい時代を迎えている。
LLMのパワーのため、非常に高価な計算資源、大量のデータ、訓練時間が必要である。
近年、研究者は科学的LLMをより手頃な価格にするための様々な手法を提案している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:57:34 GMT)
Generating Synthetic Fair Syntax-agnostic Data by Learning and Distilling Fair Representation [4.2] 既存のバイアス緩和生成法は、公平性目標を処理し、計算オーバーヘッドを考慮するのに失敗する。
我々は知識蒸留に基づく公正なデータ生成手法を提案し、そこでは小さなアーキテクチャを用いて潜在空間における公正な表現を蒸留する。
提案手法は, 最先端の公正生成モデルに比べて, フェアネス, 合成試料品質およびデータ有用性において, 5%, 5%, 10%の上昇を示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:37:52 GMT)
FairX: A comprehensive benchmarking tool for model analysis using fairness, utility, and explainability [4.2] FairXは、フェアネス、ユーティリティ、およびeXplainability(XAI)の傘の下でのモデルの包括的分析のために設計されたオープンソースのベンチマークツールである。
FairXは、ベンチマークのバイアス除去モデルをトレーニングし、さまざまな公正度メトリクス、データユーティリティメトリクスを使用して公正性を評価し、統一されたフレームワーク内でモデル予測の説明を生成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:19:16 GMT)
A Noncontact Technique for Wave Measurement Based on Thermal Stereography and Deep Learning [4.2] 室内の水面の光学的性質は、画像とステレオ再構成の課題を提起する。
長波長赤外スペクトルの水の光学イメージング特性はステレオマッチングに適していることが判明した。
ステレオマッチング性能を向上させるため,ディープラーニング技術を用いた再構成手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:13:12 GMT)
Deep Learning-based Classification of Dementia using Image Representation of Subcortical Signals [4.2] アルツハイマー病 (AD) と前頭側頭型認知症 (FTD) は認知症の一般的な形態であり、それぞれ異なる進行パターンを持つ。
本研究は,脳深部領域の時系列信号を解析し,認知症に対する深い学習に基づく分類システムを開発することを目的とする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:11:43 GMT)
Scaling Law with Learning Rate Annealing [4.1] ニューラルネットワークモデルのクロスエントロピー損失曲線は、学習率によるスケーリング則に従う。
学習速度スケジューラを介して任意のステップで正確な損失予測を達成できます。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:30:48 GMT)
The Stable Model Semantics for Higher-Order Logic Programming [4.1] 本稿では,高階論理プログラムのための安定モデルセマンティクスを提案する。
我々のセマンティクスは、強力な形式主義である近似固定点理論(AFT)を用いて開発されている。
安定モデルセマンティクスの下での高階論理プログラミングは強力で汎用的な形式であることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:03:52 GMT)
Approximation Rates for Shallow ReLU$^k$ Neural Networks on Sobolev Spaces via the Radon Transform [4.1] 我々は,ReLU$k$アクティベーション関数がソボレフ空間からの関数をいかに効率的に近似できるかという問題を考察する。
例えば、$qleq p$, $pgeq 2$, $s leq k + (d+1)/2$ などである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:43:45 GMT)
Learning Multimodal Latent Space with EBM Prior and MCMC Inference [4.0] 本稿では,マルチモーダル生成のための潜在空間における表現的エネルギーベースモデル(EBM)とマルコフ・チェイン・モンテカルロ(MCMC)推論とを結合したアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:33:45 GMT)
Inverse Deep Learning Ray Tracing for Heliostat Surface Prediction [4.0] 我々は、ヘリオスタット校正時に得られたターゲット画像のみに基づいてヘリオスタット表面を予測するために、逆ディープラーニングレイトレーシング(iDLR)を導入する。
シミュレーションに基づく研究により, ヘリオスタット表面のフラックス密度分布にはヘリオスタット表面に関する十分な情報が保持されていることが示された。
以上の結果から,iDLRはCSPプラントの操業を増強し,発電所全体の効率とエネルギー消費を増大させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:51:35 GMT)
The Evolution of Reinforcement Learning in Quantitative Finance [3.9] 強化学習(RL)は過去10年間で大きな進歩を遂げており、金融分野のアプリケーションへの関心が高まっている。
この調査は167の出版物を批判的に評価し、金融における多様なRLアプリケーションとフレームワークを調査している。
金融市場は、その複雑さ、マルチエージェントの性質、情報非対称性、および固有のランダム性によって特徴付けられ、RLの興味深いテストベッドとして機能する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:15:10 GMT)
Two-Timescale Optimization Framework for Decentralized Linear-Quadratic Optimal Control [3.7] 疎性促進関数の選択に基づいて、いくつかの近似可分制約最適化問題を初めて定式化する。
分割2次間隔促進関数を導入し、同じ2時間スケールのアルゴリズムを実行することにより、誘導最適化を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:45:15 GMT)
Nanodiamond-based spatial-temporal deformation sensing for cell mechanics [3.7] この研究は、生きた細胞における幅広いエラストカピラリティ関連界面力学とメカノロジープロセスを理解するための基礎を築いている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:37:16 GMT)
A Little Confidence Goes a Long Way [3.6] 大規模言語モデル(LLM)における隠れ状態アクティベーションのプローブを用いたバイナリ分類タスクの関連手法のグループを紹介する。
性能は、現在利用可能な最大かつ最も先進的なLCMと同等であるが、桁違いに少ない計算資源が必要であり、ラベル付きデータを必要としない。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:36:00 GMT)
Carbon Footprint Accounting Driven by Large Language Models and Retrieval-augmented Generation [3.4] 従来のライフサイクルアセスメント手法は人間の専門知識に大きく依存しており、ほぼリアルタイムのアップデートを困難にしている。
本稿では,大規模言語モデル(LLM)と検索拡張生成技術を統合し,炭素フットプリント情報検索と分析のリアルタイム,専門的,経済的な側面を強化する新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:22:16 GMT)
Exploiting Defenses against GAN-Based Feature Inference Attacks in Federated Learning [3.4] フェデレートラーニング(FL)は、データプライバシを維持しながら、孤立したデータアイランドをマージすることを目的としている。
近年の研究では、GANベースの攻撃をFLで使用して、プライベートデータセットの分布を学習できることが示されている。
攻撃者が被害者のデータの実際の分布を学習するのを防ぐためのフレームワークであるAnti-GANを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:11:18 GMT)
ISLES'24: Improving final infarct prediction in ischemic stroke using multimodal imaging and clinical data [3.3] 本研究はISLES'24課題であり, 術前急性期脳梗塞画像と臨床データから最終治療後の脳梗塞予測に対処するものである。
本研究の貢献は2つある: まず, ISLES'24チャレンジを通じて最終脳梗塞セグメンテーションアルゴリズムの標準化ベンチマークを導入する; 次に, マルチモーダルイメージングと臨床データ戦略を用いた梗塞セグメンテーションに関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:01:05 GMT)
Abstract Weighted Based Gradual Semantics in Argumentation Theory [3.3] 段階的意味論と受容可能性度を結びつける4つの重要な問題を導入する。
まず、逆問題を再検討し、議論フレームワークの引数重みを特定して、特定の最終的な受容可能性の度合いを導いた。
第三に、議論の受理度が考慮されるのではなく、選好時に議論の重みが見つかるかどうかを問う。
第4に、この空間に「ギャップ」が存在するかどうかを問う、有効な受容可能性次数の空間の位相を考える。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:44:00 GMT)
Shotgun crystal structure prediction using machine-learned formation energies [3.3] 組み立てられた原子の結晶構造は、原子配置の広い空間内でエネルギー表面の大域的または局所的なミニマを見つけることで予測できる。
本稿では,結晶構造予測問題の解決に向けた大きな進展を示す。
我々は,機械学習エネルギー予測器を備えた仮想結晶構造の大規模なライブラリを用いて,非定常単発スクリーニングを行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:41:52 GMT)
DSP-MLIR: A MLIR Dialect for Digital Signal Processing [3.2] 本稿では,MLIRフレームワークを用いてDSPダイアレクトを導入し,方言レベル(ハイレベル)でのドメイン固有最適化を行う。
IRがC/アフィンレベルであった場合,これらのサンプルアプリの実行時間を最大10倍に向上することを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:33:17 GMT)
Out-of-Distribution Detection with Attention Head Masking for Multimodal Document Classification [3.1] 本稿では,文書分類システムにおける多モードOODタスクに対するアテンションヘッドマスキング(AHM)と呼ばれる新しい手法を提案する。
実験により,提案手法がすべての最先端手法より優れていることを示す。
高品質な公開可能なドキュメントデータセットの不足に対処するために、新しいドキュメントAIデータセットであるFunderDocsを紹介します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:30:00 GMT)
Screen Them All: High-Throughput Pan-Cancer Genetic and Phenotypic Biomarker Screening from H&E Whole Slide Images [3.1] 通常のH&EスライドでのAIの使用は、複数の分子バイオマーカーのスクリーニングに迅速かつ経済的アプローチを提供する。
我々は,300万スライドで事前学習した基礎モデルであるVirchow2を利用した高スループットAIベースシステムを提案する。
バイオマーカーや癌の種類ごとに個別のモデルを訓練する従来の手法とは異なり、我々のシステムは、幅広い臨床関連分子バイオマーカーを同時に予測するために統一されたモデルを採用している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:47:35 GMT)
Athena: Safe Autonomous Agents with Verbal Contrastive Learning [3.1] 大規模言語モデル(LLM)は、様々なタスクを実行するために言語ベースのエージェントとして利用されてきた。
本研究では,言語コントラスト学習の概念を活用したアテナフレームワークを提案する。
このフレームワークには、エージェントを誘導するクオリティ機構も組み込まれており、各ステップにおけるリスクのあるアクションを防ぐ。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:21:10 GMT)
Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles [3.1] センサーの配置が小さくても、特に長距離での出力が著しく低下する可能性がある。
本稿では,センサの相違点を検出する,単純で汎用的で効率的なマルチタスク学習手法を実証する。
また, 補正の不確かさを予測し, 予測誤認識値のフィルタリングや拡散に役立てることができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:06:05 GMT)
Beyond skyrmion spin texture from quantum Kelvin-Helmholtz instability [2.9] トポロジーは様々な科学分野に深く影響を与え、物質の相を分類するための強力な枠組みを提供する。
強磁性超流体中のトポロジーの枠組みを超えた特異なスカイミオンの観測を報告する。
量子ケルビン・ヘルムホルツ不安定性の普遍的な状態の実現に成功し、偏心分数スカイミオンを同定した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:28:01 GMT)
ISLES 2024: The first longitudinal multimodal multi-center real-world dataset in (sub-)acute stroke [2.8] ストロークは世界的死亡率と死亡率の主要な原因であり、社会経済的重荷を負っている。
脳卒中画像から有意義で再現可能な脳機能のモデルを抽出できる機械学習アルゴリズムを開発する。
このデータセットは, 血管造影と灌流による急性CT像, 2~9日間の経過観察, 急性期, 慢性期の臨床データなど, 経時的脳梗塞の包括的データとして初めて提供された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:59:52 GMT)
Towards Efficient Formal Verification of Spiking Neural Network [2.8] スパイクニューラルネットワーク(SNN)は、人間の脳のようにイベント駆動で、時間的に情報を圧縮する。
本稿では,SNNの対角的ロバスト性を検証するために,時間符号化を導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:43:33 GMT)
The fusion of phonography and ideographic characters into virtual Chinese characters -- Based on Chinese and English [2.8] 中国語は習得し難く、習得し易いが、英語は習得し易いが、語彙は大きい。
単語に結合できる新しい文字は、学習すべき語彙を減らす。
新しいキャラクターは、人間がより高度な知識を素早く学べるようにします。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:13:28 GMT)
Edge modes, extended TQFT, and measurement based quantum computation [2.7] citeWong:2022mnvでは、1次元における測定に基づく量子計算がゲージ理論の用語で理解できると説明されている。
本研究では、この「絡み合いゲージ理論」を拡張位相場理論として定式化する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:49:16 GMT)
Application of Large Language Models in Automated Question Generation: A Case Study on ChatGLM's Structured Questions for National Teacher Certification Exams [2.7] 本研究では,全国教師認定試験(NTCE)における構造化質問の自動生成における大規模言語モデル(LLM)ChatGLMの適用可能性について検討する。
筆者らは,ChatGLMを指導し,一連の模擬質問を生成するとともに,過去の質問を総合的に比較した。
研究結果は,ChatGLMが生み出した質問は,実際の試験質問と同様,高い合理性,科学的性,実践性を示すことを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:41:13 GMT)
Explainable Depression Symptom Detection in Social Media [2.7] 本稿では, トランスフォーマーアーキテクチャを用いて, ユーザの文章中の抑うつ症状マーカーの出現を検知し, 説明する。
我々の自然言語による説明により、臨床医はバリデーションされた症状に基づいてモデルの判断を解釈できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:10:27 GMT)
ARAP: Demystifying Anti Runtime Analysis Code in Android Apps [2.7] セキュリティ対策を回避するために、多くの悪意あるアプリがアンチアナリシス技術を採用している。
本稿では,117,171個のAndroidアプリケーションを対象に,ARAの実装に関する最初の体系的研究を行う。
ほとんど全てのアプリがARAテクノロジーの少なくとも1つのカテゴリを実装している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:50:56 GMT)
Physics-Driven AI Correction in Laser Absorption Sensing Quantification [2.4] レーザー吸収分光法(LAS)の定量化は、気体の温度と濃度を測定するのによく用いられるツールである。
現在のMLベースのソリューションは、その測定信頼性を保証することはできない。
この問題に対処するための新しいフレームワークSPECを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:29:41 GMT)
Expanding the reach of quantum optimization with fermionic embeddings [2.4] 本研究では、このクラス LNCG 問題の自然な埋め込みをフェルミオンハミルトニアンに確立する。
量子表現は、線形数の量子ビットしか必要としないことを示す。
この丸みを帯びた量子緩和が高品質な近似を生み出す証拠を提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:11:06 GMT)
Clustering by Mining Density Distributions and Splitting Manifold Structure [2.4] 近年,スペクトルクラスタリングの効率向上のためのトップダウン手法が提案されている。
本稿では,局所構造からマイクロクラスターを得る方法を提案する。
その後、最終的なスペクトルクラスタリングのために、マイクロクラスタ間の新しい類似度尺度が提案される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:22:59 GMT)
EdgeNAT: Transformer for Efficient Edge Detection [2.3] エンコーダとしてDiNATを用いた一段変圧器を用いたエッジ検出器EdgeNATを提案する。
複数のデータセットに対する実験により,RGB画像と深度画像の両方で最先端の性能が得られた。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:04:22 GMT)
FAGStyle: Feature Augmentation on Geodesic Surface for Zero-shot Text-guided Diffusion Image Style Transfer [2.3] イメージスタイル転送の目標は、オリジナルのコンテンツを維持しながら、スタイル参照によってガイドされたイメージをレンダリングすることである。
ゼロショットテキスト誘導拡散画像スタイル転送方式であるFAGStyleを紹介する。
提案手法は,スライディングウィンドウクロップを組み込むことにより,パッチ間の情報インタラクションを向上させる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:20:11 GMT)
PetFace: A Large-Scale Dataset and Benchmark for Animal Identification [2.3] 動物顔識別のための包括的リソースであるPetFaceデータセットを紹介する。
PetFaceには、13の動物科の257,484個体と、実験動物とペット動物の両方を含む319種の品種が含まれている。
我々は、見知らぬ個人に対する再識別や、見つからない個人に対する検証を含むベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:12:41 GMT)
A Neurosymbolic Framework for Bias Correction in Convolutional Neural Networks [2.2] 我々は、訓練されたCNNにおいて、バイアス補正のためのNeSyBiCorと呼ばれるニューロシンボリックフレームワークを導入する。
textitPlacesデータセットのサブセットでトレーニングされたCNNのバイアスを,我々のフレームワークが修正したことを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:17:40 GMT)
An Overlooked Role of Context-Sensitive Dendrites [2.2] コンテクスト感受性 (CS-TPN) は, CモーメントとFFソマティック電流を柔軟に統合できることが示唆された。
これにより、よりコヒーレントな信号(バースト)の伝播が可能になり、より少ないニューロンで学習を速くする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:18:54 GMT)
DPM: Clustering Sensitive Data through Separation [2.2] 幾何学的クラスタリングアプローチに基づいてデータセットをクラスタに分離するDPMと呼ばれるプライバシ保護クラスタリングアルゴリズムを提案する。
我々は,DPMが標準クラスタリング指標の最先端性を実現し,一般的なKMeansアルゴリズムに近いクラスタリング結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:46:40 GMT)
Exploring Saliency Bias in Manipulation Detection [2.2] ソーシャルメディアによる偽ニュースの爆発と改ざん画像による誤報は、画像検出のためのモデルとデータセットの開発に発展をもたらした。
既存の検出手法は、特定の操作が視聴者の知覚に与える影響を考慮せずに、主にメディアオブジェクトを分離して扱う。
本稿では,一般的な画像操作データセットにおける視覚的・意味的サリエンシの傾向とその検出への影響を解析する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:20:44 GMT)
Adaptive Knowledge Distillation for Classification of Hand Images using Explainable Vision Transformers [2.1] 本稿では,手動画像の分類における視覚変換器(ViT)の使用について検討する。
説明可能性ツールを用いて、ViTの内部表現を探索し、モデル出力への影響を評価する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:03:56 GMT)
Strong hallucinations from negation and how to fix them [2.1] 提案手法は,疎い負のデータに対する訓練を必要とせずに,クローゼプロンプトや否定を伴う自然言語推論タスクにおけるモデル性能を向上させることを示す。
このような応答をテキストストロング幻覚と呼び、論理演算子の内部表現とそれらの表現からの出力に対するLMの計算からそれに従うことを証明する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:36:26 GMT)
Metasurface-enabled quantum holograms with hybrid entanglement [1.9] 我々は、信号イドラー光子対間の偏光-ホログラムハイブリッド絡み合わせを生成し、量子ホログラムを構築する。
量子ホログラムの性質は、アイドラー光子の偏光度を崩壊させることによって明らかにすることができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:57:29 GMT)
On the Approximability of Stationary Processes using the ARMA Model [1.8] 自動回帰移動平均 (ARMA) モデルを用いて, 定常確率変数の近似性に関する文献上のギャップを同定する。
近似性を定量化するために, 定常確率変数の近似としてARMAモデルを用いることを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:42:42 GMT)
Data Augmentation Integrating Dialogue Flow and Style to Adapt Spoken Dialogue Systems to Low-Resource User Groups [1.8] 本研究では,音声対話システム(SDS)が,対話行動の異なるユーザと対話する場合に直面する課題について考察する。
限られたリソースを持つユーザグループのSDS性能を向上させるための新しいデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:33:04 GMT)
Constructing a High Temporal Resolution Global Lakes Dataset via Swin-Unet with Applications to Area Prediction [1.8] 湖は、水の供給、生物多様性の生息地、炭素の隔離など、様々な貴重な生態系を提供している。
最近開発されたGlobal Lakes Area Database (GLAKES)は、世界中で340万以上の湖を地図化している。
本稿では,1990年から2021年までの全世界で152,567の湖沼に対して,二年紀のデライン化と面積測定が可能な拡張型湖沼データベースGLAKES-Additionalを紹介した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:17:07 GMT)
Quantum Machine Learning Algorithms for Anomaly Detection: a Survey [1.7] 量子コンピューティングに関わる重要な概念を要約し、量子スピードアップという形式的な概念を導入する。
このサーベイは、量子機械学習に基づく異常検出の構造化マップを提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:55:25 GMT)
Approximate Estimation of High-dimension Execution Skill for Dynamic Agents in Continuous Domains [1.7] 多くの現実世界の継続的なアクションドメインでは、人間のエージェントはどのアクションを試すかを決め、そのアクションを最大限に実行しなければならない。
これらの領域における人間のパフォーマンスは、意思決定を支援するためにAIを使用することによって改善される可能性がある。
人間のエージェントが試みるべきアクションを正しく推論するAIの要件のひとつは、その人間の実行エラーの正しいモデルである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:27:09 GMT)
Approximation of the Proximal Operator of the $\ell_\infty$ Norm Using a Neural Network [1.7] ニューラルネットワークを用いて,$textbfprox_alphacdot||infty(mathbfx)$を近似する。
ネットワークの新たな側面は、特徴選択プロセスにより、様々な長さのベクトルを受け入れることができることである。
特徴選択を使用しない「バニラニューラルネットワーク」よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:12:30 GMT)
Periodic agent-state based Q-learning for POMDPs [1.7] 広く使われている代替手段は、観測履歴のモデルのない周期的に更新可能な機能であるエージェント状態を使用することである。
本稿では,エージェント状態に基づくQ-ラーニングの変種であるPA(エージェント状態に基づくQ-ラーニング)を提案する。
周期的マルコフ連鎖のアイデアと近似を組み合わせることで、PAが巡回極限に収束し、周期的ポリシーの近似誤差を特徴付けることを厳密に証明する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:16:36 GMT)
Tapping in a Remote Vehicle's onboard LLM to Complement the Ego Vehicle's Field-of-View [1.7] 本稿では,車載言語モデル(LLM)をタップすることで,エゴ車両の視野(FOV)と他の車両のFOVを補完する概念を提案する。
GPT-4V や GPT-4o など,ごく最近の LLM では,交通状況が極めて詳細に把握されているため,交通参加者の特定にも利用することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:38:34 GMT)
Federated Clustering: An Unsupervised Cluster-Wise Training for Decentralized Data Distributions [1.6] Federated Cluster-Wise Refinement(FedCRef)には、同様のデータ分散を備えたクラスタ上でモデルを協調的にトレーニングするクライアントが含まれている。
これらのグループでは、クライアントは、各データ分布を表す共有モデルを共同でトレーニングし、データの関連性を高めるために、ローカルクラスタを継続的に精錬する。
この反復的処理により,ネットワーク全体にわたる潜在的なデータ分布を同定し,それぞれにロバストな表現モデルを構築することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:05:44 GMT)
NLP for The Greek Language: A Longer Survey [1.6] さまざまな処理レイヤやコンテキストに応じて分類された関連する作業,リソース,ツールをリストアップし,簡単に議論する。
この調査は、ギリシャ語のNLPタスク、情報検索、知識管理に関心のある研究者や学生に有用である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:57:18 GMT)
Quantum metrological capability as a probe for quantum phase transition [1.6] 量子フィッシャー情報によって定量化された気象能力は、量子臨界点付近でユニークなピークを示す。
干渉計発生器の量子ゆらぎを抽出することにより、この探索を実現できることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:07:10 GMT)
Understanding the Skills Gap between Higher Education and Industry in the UK in Artificial Intelligence Sector [1.5] 本稿では、イギリスの大学がAIのコースを提供し、現実世界での学生の就職準備について検討する。
求人広告や大学カリキュラムから情報を収集するために、カスタムデータスクラップツールを使用することで、この研究は、どのスキル産業が求めているのかを正確に示す。
この研究は、AI領域の大学カリキュラムは、ほとんどの技術スキルではバランスがよく、データサイエンスと数学と統計学のスキルカテゴリーではギャップがあることを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:28:58 GMT)
Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5] この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:51:01 GMT)
SenPa-MAE: Sensor Parameter Aware Masked Autoencoder for Multi-Satellite Self-Supervised Pretraining [1.5] SenPa-MAEは、観察されたマルチスペクトル信号のセンサーパラメータを画像埋め込みに符号化する。
SenPa-MAEは、非マッチングスペクトルまたは幾何学的センサー特性を持つ異なる衛星の画像で事前訓練することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:53:30 GMT)
Public Health in Disaster: Emotional Health and Life Incidents Extraction during Hurricane Harvey [1.4] 嵐に関連する40万件の公開ツイートのデータセットを収集しました。
BERTベースのモデルを用いて、各ツイートに関連する感情を予測した。
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)を統合して分析をさらに改良した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:31:20 GMT)
Evaluating the Efficacy of Foundational Models: Advancing Benchmarking Practices to Enhance Fine-Tuning Decision-Making [1.4] 本研究は,サイバーセキュリティ,医療,金融など多種多様な分野にわたる言語モデル(LLM)を評価する。
その結果,モデルサイズと推論に用いるプロンプトの種類は応答長と品質に大きく影響した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:17:58 GMT)
Observation of the Symmetry-Protected Signature of 3-body Interactions [1.3] 本研究では,未知の2体相互作用が存在するにもかかわらず,3体相互作用を検出するための効率的な手法を開発し,実証する。
この手法では、ユニタリ進化を探索し、システムサイズと線形にスケールする小さな部分空間において、その行列式を測定する必要がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:28:35 GMT)
DropKAN: Regularizing KANs by masking post-activations [1.2] コルモゴロフ・アルノルドネットワーク(KAN)における活性化関数重みの共適応を防止する正規化手法を提案する。
DropKANは、ドロップマスクをkan層に直接埋め込んで、Kansグラフ内のいくつかのアクティベーションの出力をランダムにマスキングすることで機能する。
最小限のコーディング作業を必要とするこの単純な手順は、正規化効果を持ち、一貫してkansのより優れた一般化につながることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:16:13 GMT)
Achieving the Tightest Relaxation of Sigmoids for Formal Verification [1.2] 本稿では,シグイド活性化関数の上下に調整可能な超平面を導出する。
双対空間において、これらのアフィン境界はシグイド活性化関数の非線形多様体の周りで滑らかに回転する。
このアプローチ、$alpha$-sigは、Sigoidアクティベーション関数の可能かつ要素的に凸緩和を形式的な検証フレームワークに柔軟に組み込むことを可能にする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:22:27 GMT)
RENAS: Prioritizing Co-Renaming Opportunities of Identifiers [1.2] この手法はJavaアプリケーションで同時に名前を変えなければならない関連する識別子を特定し、推奨するものである。
ReNASは、識別子間の関係と類似性に基づいて、候補をリネームするための優先度スコアを決定する。
ReNASは既存のリネーム推奨手法と比較してF1対策を0.11以上改善した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:08:10 GMT)
ComTraQ-MPC: Meta-Trained DQN-MPC Integration for Trajectory Tracking with Limited Active Localization Updates [1.1] 本稿では,DQN(Deep Q-Networks)とモデル予測制御(Model Predictive Control,MPC)を組み合わせた新しいフレームワークであるComTraQ-MPCを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:52:51 GMT)
Text-Driven Neural Collaborative Filtering Model for Paper Source Tracing [1.1] PST(Paper Source Tracing)タスクは、与えられた学術論文に対する重要な参照の識別を自動化することを目的としている。
このフレームワークでは、最終的な予測を生成するために、Neural Collaborative Filtering(NCF)モデルを採用している。
本手法は平均精度(MAP)測定値で0.37814のスコアを達成し,ベースラインモデルを上回っ,全参加チームで11位となった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:16:41 GMT)
Classification of Endoscopy and Video Capsule Images using CNN-Transformer Model [1.1] 本研究では、トランスフォーマーと畳み込みニューラルネットワーク(CNN)の利点を組み合わせて分類性能を向上させるハイブリッドモデルを提案する。
GastroVisionデータセットでは,精度,リコール,F1スコア,精度,マシューズ相関係数(MCC)が0.8320,0.8386,0.8324,0.8386,0.8191であった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:05:32 GMT)
Reconciling Methodological Paradigms: Employing Large Language Models as Novice Qualitative Research Assistants in Talent Management Research [1.1] 本研究では,RAGに基づくLarge Language Models (LLMs) を用いた面接文の解析手法を提案する。
この研究の斬新さは、初歩的な研究助手として機能するLSMによって強化された研究調査をストラテジー化することにある。
以上の結果から, LLM拡張RAGアプローチは, 手動で生成したトピックと比較して, 興味のあるトピックを抽出できることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:49:51 GMT)
Robust Topology Optimization Using Multi-Fidelity Variational Autoencoders [1.0] 強靭なトポロジー最適化(RTO)問題は、最高の平均性能を持つ設計を特定する。
計算効率を向上するニューラルネットワーク手法を提案する。
本手法の数値解析は,Lブラケット構造のロバスト設計における単一点負荷と複数点負荷について述べる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:03:31 GMT)
Detection of Intracranial Hemorrhage for Trauma Patients [1.0] 本稿では,Voxel-Complete IoU(VC-IoU)損失を新たに提案し,ネットワークが境界ボックスの3次元アスペクト比を学習できるようにする。
我々は、公開データセットを用いて脳出血の検出を広範囲に実験し、それをプライベートコホートで検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:03:59 GMT)
Response Style Characterization for Repeated Measures Using the Visual Analogue Scale [1.0] 視覚的アナログ尺度(VAS)は、人々の感情を正確に、かつ容易に評価できる能力から、スライダベースの尺度として人気を博している。
その重要性にもかかわらず、VASのレスポンススタイル(RS)を扱うことにはほとんど注意が払われていない。
我々は,様々な種類の繰り返し測定されたVASデータに対する新しいRP特性評価法を開発した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:32:55 GMT)
Honeyquest: Rapidly Measuring the Enticingness of Cyber Deception Techniques with Code-based Questionnaires [0.9] ハネトケンで敵を捕食すると、サイバー攻撃が遅くなり、妥協の強力な指標が生まれる。
私たちの研究は、以前に研究され、12の自己定義されたテクニックを、ハイレベルでマシン可読な仕様に翻訳します。
私たちのオープンソースツールであるHoneyquestは、研究者が実装することなく、騙しのテクニックの魅力を素早く評価できるツールです。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:45:41 GMT)
Hybrid Recurrent Models Support Emergent Descriptions for Hierarchical Planning and Control [0.9] リカレントスイッチング線形力学系(rSLDS)として知られるハイブリッド状態空間モデルのクラスは、意味のある振る舞い単位を発見する。
我々は、rSLDSによって形成されたリッチな表現は、計画と制御に有用な抽象化を提供することができると提案する。
本稿では,低レベル線形二乗制御器上に離散型MDPを配置する,アクティブ推論にインスパイアされた新しい階層型モデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:02:54 GMT)
PLUTUS: A Well Pre-trained Large Unified Transformer can Unveil Financial Time Series Regularities [0.8] 金融時系列モデリングは市場行動の理解と予測に不可欠である。
従来のモデルは、非線形性、非定常性、高ノイズレベルのために複雑なパターンを捉えるのに苦労している。
NLPにおける大きな言語モデルの成功に触発されて、$textbfPLUTUS$, a $textbfP$re-trained $textbfL$argeを紹介します。
PLUTUSは10億以上のパラメータを持つ最初のオープンソース、大規模、事前訓練された金融時系列モデルである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:59:16 GMT)
Multi-dimensional continuous time quantum walks related to the birth and death chains [0.8] 多次元の生死連鎖と連続時間量子ウォーク(CTQW)について検討する。
我々は,CTQWの遷移確率について,多次元の生死連鎖に関するCTQWについて,複数の次元間の時間スケールの独立性を求める。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:28:31 GMT)
Lowering Connectivity Requirements For Bivariate Bicycle Codes Using Morphing Circuits [0.8] モーフィング回路と呼ばれる新しいパリティチェック回路設計原理を導入する。
モーフィング回路を用いてアシラリー回転曲面コードに対して論理入力/出力回路を実行する方法を示す。
新しい符号は、回路レベルの均一なノイズの下で少なくともRef. [1]の符号と同様に動作する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:58:06 GMT)
The Limits of Quantum Information Scrambling [0.8] 量子情報スクランブル(quantum information scrambling、QI-scrambling)は、量子多体系の研究において重要な調査領域である。
この研究は、マリグラダの不等式を適用することにより、スクランブルレートの数学的上界と下界を導出する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:37:17 GMT)
Accelerometer-Based Multivariate Time-Series Dataset for Calf Behavior Classification [0.7] このデータセットは、アクセラレーション時系列から、事前に織り込まれたふくらはぎの振る舞いを分類するための、使用可能なデータセットである。
乳牛30頭には、生後1週間から13週間、ネックカラーに取り付けられた3D加速度センサーが装着された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:11:54 GMT)
Sparse Regression for Discovery of Constitutive Models from Oscillatory Shear Measurements [0.7] 我々はGiesekusとPhan-Thien Tanner CMを用いて合成実験データを生成する。
本稿では, 実験設計における影響, アルゴリズム改良の可能性, 部分的情報から推定されるCMの非特異性について論じる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:52:21 GMT)
Cervical Cancer Detection Using Multi-Branch Deep Learning Model [0.6] 本研究では,MHSA (Multi-Head Self-Attention) と畳み込みニューラルネットワーク (CNN) を用いた頚部癌の画像分類の自動化手法を提案する。
我々のモデルは98.522%の顕著な精度を達成し、他の医療画像認識タスクに適用可能であることを約束している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:44:48 GMT)
Learning material synthesis-process-structure-property relationship by data fusion: Bayesian Coregionalization N-Dimensional Piecewise Function Learning [0.6] 合成プロセス-構造-プロパティ relAtionship coreGionalized lEarner (SAGE) アルゴリズムを提案する。
マルチモーダルなコリージョン化を用いて、データソース間の知識をマージして、合成-プロセス-構造-プロパティ関係を学習する完全ベイズアルゴリズム。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:42:50 GMT)
Benchmarking bosonic and fermionic dynamics [0.6] ボソニックおよびフェルミオン量子デバイスのランダム化アナログベンチマークのための多用途フレームワークを提案する。
提案手法の効率を議論し,理論的性能保証を導出し,数値的な例でプロトコルを実証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:30 GMT)
Learning Realistic Joint Space Boundaries for Range of Motion Analysis of Healthy and Impaired Human Arms [0.6] 本研究では,現実的な解剖学的制約のある上層域の運動境界を,モーションキャプチャーデータから学習するためのデータ駆動手法を提案する。
また,健常腕と障害腕の比較において,能力・障害の定量的評価を行う指標(II)を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:21:43 GMT)
BAUST Lipi: A BdSL Dataset with Deep Learning Based Bangla Sign Language Recognition [0.5] 聴覚障害者コミュニティとのコミュニケーションを強化するために、手話の研究が盛んである。
重要な障壁の1つは、包括的なBangla手話データセットがないことである。
18,000個の画像からなる新しいBdSLデータセットを導入し,各画像のサイズを224×224ピクセルとする。
我々は、複数の畳み込み層、アクティベーション機能、ドロップアウト技術、LSTM層を統合するハイブリッド畳み込みニューラルネットワーク(CNN)モデルを考案した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:35:42 GMT)
Contrastive Learning for Lane Detection via cross-similarity [0.5] 道路シーンのレーンマークは、その複雑な性質が好ましくない条件に影響を受けやすいため、課題となる。
実世界のシナリオにおいて、車線検出モデルのレジリエンスを高めるために、CLLD(cross-similarity)による車線検出のためのコントラスト学習を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:11:20 GMT)
Vector Symbolic Open Source Information Discovery [0.4] 大規模な言語モデル(トランスフォーマー)はセマンティックデータやメタデータのアライメントを容易にするが、CJIIM設定では非効率である。
我々は,変換モデルのVSAとの新たな統合を実証し,前者の力と後者のコンパクトさと表現構造を組み合わせた。
この研究は、以前の低技術準備レベル(TRL)研究と将来の高技術実証と展開の間の橋渡しとして実施された。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:05:56 GMT)
Exact spectral gaps of random one-dimensional quantum circuits [0.4] 局所ランダム量子回路のスペクトルギャップは、回路のユニタリーのモーメントがハール確率分布のモーメントとどのように一致するかを決定する基本的な性質である。
関連するスペクトルギャップを正確に計算できることが示される。
我々は、最大70量子ビットのシステムのスペクトルギャップを数値計算し、それらをランダム回路とシンプレクティック回路のギャップと比較することによって、その結果を検証する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:23:42 GMT)
Quantum Artificial Intelligence: A Brief Survey [0.3] 量子人工知能(QAI)は、量子コンピューティングとAIの交差点である。
これまでにQAIで達成されたことを概観するとともに、今後の研究に向けたオープンな質問をいくつか紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:55:17 GMT)
Ethics of Software Programming with Generative AI: Is Programming without Generative AI always radical? [0.3] ソフトウェアコード生成におけるGenAIの変換能力を認めている。
GenAIは代替ではなく、ソフトウェアコードを書くための補完的なツールである、と仮定する。
厳格な倫理的ガイドラインを提唱する論文では、倫理的考慮が最重要である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:35:39 GMT)
deepmriprep: Voxel-based Morphometry (VBM) Preprocessing via Deep Neural Networks [0.3] VBM(Voxel-based Morphometry)は、神経画像研究において強力なアプローチとして登場した。
Deepmriprepはニューラルネットワークベースのパイプラインで、T1強調MR画像のVBM分析に必要なすべての前処理ステップを実行する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:51:09 GMT)
ZebraPose: Zebra Detection and Pose Estimation using only Synthetic Data [0.2] 3次元シミュレータで生成された合成データを用いて、ゼブラの検知と2次元ポーズ推定の両方に使用できる最初の合成データセットを得る。
複数の実世界および合成データセット上で検出と2次元ポーズ推定モデルを広範囲にトレーニングし、ベンチマークする。
これらの実験は、スクラッチから訓練されたモデルと合成データのみで、ゼブラの実際の画像に一貫して一般化できることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:28:37 GMT)
Unified Deep Learning Model for Global Prediction of Aboveground Biomass, Canopy Height and Cover from High-Resolution, Multi-Sensor Satellite Imagery [0.2] 地表面バイオマス密度 (AGBD) , キャノピー高さ (CH) , キャノピー被覆 (CC) の予測を統一する深層学習モデルと10mのマルチセンサ・マルチスペクトル画像を用いた新しい手法を提案する。
GEDI-L2/L4を世界数百万のサンプルで測定し、2023年と2016年から2023年までの期間に全世界に展開することで、モデルの有効性を検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 23:15:41 GMT)
Kotlin's Type System is (Also) Unsound [0.2] 音型システムの型チェッカーは、型エラー毎に警告を発することが期待されている。
2016年、Amin氏とTate氏は、JavaとScalaという2つの主要な産業言語に対して、最初の不健全な証明を提示した。
我々は、これまで未知の言語機能の組み合わせに依存していたKotlinの不健全性証明を提示する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:54:12 GMT)
Bosonic randomized benchmarking with passive transformations [0.2] 我々は,受動ガウス変換のためのRBプロトコルを開発し,これをボソニック受動RBと呼ぶ。
このプロトコルは、最近開発されたフィルタRBフレームワークに基づいており、ボゾン系に生じる指数関数的崩壊の多さを分離するように設計されている。
彼らはモード数で軽度のスケーリングを示し、ボソニックなパッシブRBが適度なモード数で実験的に実現可能であることを示唆している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:09:20 GMT)
Large Visual-Language Models Are Also Good Classifiers: A Study of In-Context Multimodal Fake News Detection [0.2] 本稿ではまず,CLIPモデルと比較し,LVLMとGPT4VのFND特性について検討する。
次に,標準文脈学習(ICL)をLVLMと統合し,FND性能の向上に言及する。
textbfIn-context textbfMultimodal textbfFake textbfNews textbfD
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:57:55 GMT)
Tensor tree learns hidden relational structures in data to construct generative models [0.1] テンソル木で表される量子波動関数振幅として対象分布関数を表現して生成モデルを構築するための一般的な方法を提案する。
提案手法は性能を向上し,対象データに隠れた関係構造を明らかにする。
i)ランダムパターン、(ii)QMNIST手書き桁、(iii)ベイズネットワーク、(iv)S&P500の株価変動パターンの4つの例を用いて、潜在的な実用的応用について説明する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:11:38 GMT)
LightMDETR: A Lightweight Approach for Low-Cost Open-Vocabulary Object Detection Training [0.1] 計算効率を向上させるために最適化されたMDETRである軽量MDETR(LightMDETR)を紹介する。
我々のアプローチでは、MDETRバックボーンを凍結し、画像とテキストのモダリティを表現するために唯一のコンポーネントであるDeep Fusion(DFE)をトレーニングする。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:27:53 GMT)
Is the Lecture Engaging for Learning? Lecture Voice Sentiment Analysis for Knowledge Graph-Supported Intelligent Lecturing Assistant (ILA) System [0.1] 本システムは,音声,コンテンツ,教育のリアルタイム分析を通じて,生徒の学習力を高めるためのインストラクターを支援するように設計されている。
講義音声感情分析のケーススタディとして,3000以上の1分間の講義音声クリップからなるトレーニングセットを開発した。
私たちの究極のゴールは、現代の人工知能技術を活用することで、インストラクターがより積極的に効果的に教えることを支援することです。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:22:27 GMT)
V-RoAst: A New Dataset for Visual Road Assessment [0.1] 道路交通事故は毎年何百万人もの死者を出し、経済に大きな影響を与えている。
本稿では,道路安全評価のための視覚言語モデル (VLM) を用いたアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:03:30 GMT)
LLaMEA: A Large Language Model Evolutionary Algorithm for Automatically Generating Metaheuristics [0.0] 本稿では,Large Language Model Evolutionary Algorithm (LLaMEA) フレームワークを紹介する。
一連の基準とタスク定義(検索空間)が与えられた後、LLaMEAは反復的にアルゴリズムを生成し、変更し、選択する。
我々は,このフレームワークを用いて,新しいブラックボックスメタヒューリスティック最適化アルゴリズムを自動生成する方法を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:06:09 GMT)
Wave-Mask/Mix: Exploring Wavelet-Based Augmentations for Time Series Forecasting [0.0] 本研究では、離散ウェーブレット変換(DWT)を用いて、時系列データの時間依存性を保ちながら周波数要素を調整する2つの拡張手法を提案する。
我々の知る限り、DWTを用いた多変量時系列に関する広範な実験を行った最初の研究である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:42:10 GMT)
Transfer Operator Learning with Fusion Frame [0.0] 本研究は、部分微分方程式(PDE)を解くための演算子学習モデルの伝達学習能力を向上する新しいフレームワークを提案する。
我々は,融合フレームとPOD-DeepONetを組み合わせた革新的なアーキテクチャを導入し,実験解析において様々なPDEに対して優れた性能を示す。
我々のフレームワークは、オペレーターラーニングモデルにおけるトランスファーラーニングの重要な課題に対処し、幅広い科学的・工学的応用において適応的で効率的なソリューションの道を開く。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:03:23 GMT)
Towards the Unmanned Aerial Vehicle Traffic Management Systems (UTMs): Security Risks and Challenges [0.0] 無人航空機システム交通管理(Unmanned Aircraft System Traffic Management, UTM)は、様々なモジュールから構成されるシステムである。
UTMは高い品質のサービスと専門化を必要とする最先端のシステムです。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:25:34 GMT)
Towards a theory of phase transitions in quantum control landscapes [0.0] 制御ランドスケープの位相遷移は、制御パラメータの変化に伴うコスト関数ランドスケープの急激な変化として発生する。
コスト関数に対するDyson, Magnus, 累積展開を開発することにより, CLPTの解析理論の基礎を築いた。
我々の研究は、CLPTの体系的理論への第一歩を提供し、汎用的な複合制御ランドスケープに統計場理論技術を利用するための道を開く。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:08:49 GMT)
Towards Foundation Models for the Industrial Forecasting of Chemical Kinetics [0.0] 本稿では,多層パーセプトロンミキサーアーキテクチャ(MLP-ミキサー)を用いて,固形化学反応の時系列をモデル化する手法を提案する。
本手法は化学力学のベンチマークモデルであるROBERシステムを用いて評価し,その性能を従来の数値手法と比較する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:43:09 GMT)
Topics in Algebra of Synchronous Games, Algebraic Graph Identities and Quantum NP-hardness Reductions [0.0] 同期ゲームとその関連ゲーム代数の対応性について検討する。
我々は、特定のモデルによる完璧な戦略の存在を確認するための計算ツールを構築している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:29:26 GMT)
The impact of labeling automotive AI as "trustworthy" or "reliable" on user evaluation and technology acceptance [0.0] 本研究は,AIを「信頼できる」あるいは「信頼できる」とラベル付けすることが,自動車AI技術のユーザ認識と受容に影響を及ぼすかどうかを考察する。
この研究は、一方的なオブジェクト間の設計を用いて、478人のオンライン参加者を巻き込み、信頼できるAIまたは信頼できるAIのガイドラインを提示した。
AIを「信頼できる」とラベル付けすることは、特定のシナリオにおける判断に大きな影響を与えなかったが、使用の容易さと人間のような信頼、特に善意が増した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:48:24 GMT)
The geometry of the Hermitian matrix space and the Schrieffer--Wolff transformation [0.0] 量子力学において、シュリーファー-ヴォルフ変換(Schrieffer--Wolff transformation)はハミルトニアンの摂動次元を減少させる近似法として知られている。
エルミート行列の空間における局所座標が、$k$-foldの縮退部分多様体の近くで誘導されることを証明した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:20:29 GMT)
The Ensemble Epanechnikov Mixture Filter [0.0] 我々は、エンサンブル・エパネチニコフ混合フィルタ(EnEMF)と呼ばれる手法を用いて、逐次フィルタリングシナリオに対する最適エパネチニコフ混合核密度推定手法を用いる。
また,EnEMFは40変量ローレンツ'96系における粒子毎の誤差を著しく低減することを示した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:50:59 GMT)
Stabilizer codes for Heisenberg-limited many-body Hamiltonian estimation [0.0] 雑音下での多体ハミルトニアン推定における安定化器量子誤差補正符号の性能について検討した。
本稿では,それぞれ$(nt)-1$,$(n2t)-1$,$(n3t)-1$のスケーリングを実現する安定化符号の3つのファミリを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:09 GMT)
Single-layer tensor network approach for three-dimensional quantum systems [0.0] これらのテンソルネットワークの多層構造を利用して、収縮を単純化する。
実験の結果を立方格子ハイゼンベルクモデルでベンチマークし, 結合次元 D = 7 に到達した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:42:39 GMT)
Security Assessment of Hierarchical Federated Deep Learning [0.0] 階層的連合学習(HFL)は、有望な分散ディープラーニングモデルトレーニングパラダイムであるが、敵の攻撃による重要なセキュリティ上の懸念がある。
本研究では,HFLの安全性を新たな手法を用いて検討し,敵の攻撃予測時間と訓練時間に対するレジリエンスに着目して評価する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:34:23 GMT)
Seamless Integration: Sampling Strategies in Federated Learning Systems [0.0] フェデレートラーニング(Federated Learning, FL)は、機械学習の分野におけるパラダイムシフトである。
新しいクライアントのシームレスな統合はFLシステムの維持と性能向上に不可欠である。
本稿では,システムのスケーラビリティと安定性を確保するための効果的なクライアント選択戦略とソリューションについて概説する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 09:04:25 GMT)
SWAP-less Implementation of Quantum Algorithms [0.0] 本稿では,接続性に制限のあるデバイスにアルゴリズムを実装するために,パリティ量子情報のフローを追跡するフォーマリズムを提案する。
我々は、エンタングゲートが量子状態を操作するだけでなく、量子情報の伝達にも活用できるという事実を活用している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:51:00 GMT)
SR+Codec: a Benchmark of Super-Resolution for Video Compression Bitrate Reduction [0.0] 圧縮ビデオのスケールアップのために,スーパーリゾリューションのキャパシティを解析するためのベンチマークを開発した。
我々のデータセットは5つの広く使われている圧縮標準に基づくビデオコーデックを用いていた。
いくつかのSRモデルと圧縮を組み合わせることで、品質を著しく損なうことなく動画を縮小できることがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:57:00 GMT)
Robust self-testing of the $m-$partite maximally entangled state and observables [0.0] 本研究では,Svetlichnyの不等式に対する最適量子違反に基づいて,状態と可観測性を証明し,簡便かつ効率的なセルフテストプロトコルを提案する。
この手法は、量子系の次元を仮定することができないスヴェットリニュ汎函数の最適量子値を導出するために、エレガントな2乗和法を利用する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:03:37 GMT)
Robust Image Classification: Defensive Strategies against FGSM and PGD Adversarial Attacks [0.0] 敵対的攻撃は、画像分類におけるディープラーニングモデルの堅牢性に重大な脅威をもたらす。
本稿では,ニューラルネットワークのレジリエンスを高めるために,これらの攻撃に対する防御機構を探索し,洗練する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:00:02 GMT)
Revisiting Min-Max Optimization Problem in Adversarial Training [0.0] 現実世界のコンピュータビジョンアプリケーションは、ディープニューラルネットワークのセキュリティを危険にさらす。
最近の研究では、畳み込みニューラルネットワークは敵の例に影響を受けやすいことが示されている。
敵攻撃に対する堅牢なディープニューラルネットワークを構築するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:31:19 GMT)
Reply to Comment on "No Black Holes from Light" [arXiv:2408.06714] [0.0] A. Loeb (arXiv:2408.06714) によるコメントが133, 041401 (2024) [arXiv:2405.02389] の結果にどう影響するかについて議論する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:03 GMT)
Radio U-Net: a convolutional neural network to detect diffuse radio sources in galaxy clusters and beyond [0.0] 拡散源の電波干渉画像は画像分割作業の課題を示す。
U-Netアーキテクチャに基づく完全畳み込みニューラルネットワークであるRadio U-Netを紹介する。
Radio U-Netは、ラジオサーベイで暗く拡張されたソースを検出するように設計されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:03:21 GMT)
Quantum chaos and complexity from string scattering amplitudes [0.0] クリロフ拡散複雑性は、既知のハミルトニアンの下での状態や作用素の拡散を定量化することでカオスを特徴づける。
この形式主義は、散乱と状態進化におけるカオスの概念を橋渡しし、異なる散乱過程を区別する枠組みを提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:02 GMT)
Quantum Technologies and AI -- Interview with Tommaso Calarco [0.0] 研究センターJ"ulich(ドイツ)のTommaso Calarco教授によるQuantum TechnologiesとAIに関するビデオインタビュー。
量子技術とAIに関するドイツ研究センターJ'ulichのTommaso Calarco教授へのインタビュー
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:26:01 GMT)
Proposal of an Electronic Auditing System Applied to the Brazilian Electronic Voting Machine [0.0] SELAはオープンハードウェアとソフトウェアを使用するように設計された。
監査プロセスのセキュリティは、フィンガープリントアルゴリズムの適用によって保証される。
著者らは、2002年のブラジル大統領選挙に向けてSELAのパイロット実装を推奨している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:03:06 GMT)
Probabilities of the Third Type: Statistical Relational Learning and Reasoning with Relative Frequencies [0.0] ドメイン内の状態の相対周波数への依存は、リレーショナルデータに対する確率的依存関係をモデル化する際によく見られる。
本稿では,相対周波数への連続的依存を統計的リレーショナル人工知能に明示的に組み込むフォーマリズムである機能持ち上げベイジアンネットワークを紹介する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:50:18 GMT)
Predicting Short Term Energy Demand in Smart Grid: A Deep Learning Approach for Integrating Renewable Energy Sources in Line with SDGs 7, 9, and 13 [0.0] スマートパワーグリッドにおけるエネルギー需要予測のためのディープラーニングモデルを提案する。
我々は、長期記憶ネットワークを使用して、エネルギー需要データにおける複雑なパターンや依存関係をキャプチャします。
提案モデルでは,平均絶対誤差 1.4% でエネルギー需要を正確に予測できる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:34:28 GMT)
Plasmon Mode Engineering with Electrons on Helium [0.0] 超流動ヘリウムの表面上に閉じ込められた電子のアンサンブルは、低次元電子物質の集団電荷ダイナミクスを研究・制御するためのパラダイムシステムである。
マイクロ波プラズモンモードをホストするハイブリッド型電子対ヘリウムマイクロチャネルデバイスについて実験を行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 22:56:25 GMT)
Panorama Tomosynthesis from Head CBCT with Simulated Projection Geometry [0.0] コーンビームCT (CBCT) とパノラマX線は, 歯科医療において最もよく用いられる画像モダリティである。
多様な頭部CBCTからパノラマX線を合成する方法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:07:49 GMT)
Optimal Superdense Coding Capacity in the Non-Markovian Regime [0.0] 超高密度符号化は量子情報処理において広く用いられる重要な技術である。
非マルコフ力学を用いて超高密度符号化プロトコルにおけるバックフロー情報の効果を評価するモデルを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:36:01 GMT)
OpenCap markerless motion capture estimation of lower extremity kinematics and dynamics in cycling [0.0] マーカレスモーションキャプチャは、従来のマーカーベースのシステムよりもいくつかの利点がある。
システムは人体のランドマークを直接検出することができ、手作業による処理やマーカーの配置に伴うエラーを減らすことができる。
本研究では,マーカーレスモーションキャプチャシステムであるOpenCapと,サイクリングバイオメカニクス評価における従来のマーカーベースシステムとの比較を行った。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:57:40 GMT)
Online SLA Decomposition: Enabling Real-Time Adaptation to Evolving Systems [0.0] ネットワークスライスが複数のドメインにまたがる場合、各ドメインはスライスに関連するエンド・ツー・エンド(E2E)サービス・レベル・アグリーメント(SLA)を守らなければならない。
これにより、E2E SLAを各ドメインの部分SLAに分解する必要があります。
本稿では,リスクモデルを動的に更新するオンライン学習分解フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:17:56 GMT)
Offline Model-Based Reinforcement Learning with Anti-Exploration [0.0] モースモデルに基づくオフラインRL(MoMo)を提案する。
MoMoは、価値過大評価に対抗するために、アンチ探索ボーナスを使用してオフラインで強化学習を行う。
後者は、テストされたD4RLデータセットの大部分で、モデルベースとモデルフリーのベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:29:21 GMT)
NutrifyAI: An AI-Powered System for Real-Time Food Detection, Nutritional Analysis, and Personalized Meal Recommendations [0.0] 本稿では,高度なコンピュータビジョン技術と栄養分析を組み合わせた包括的システムを提案する。
このシステムはモバイルプラットフォームとWebプラットフォームの両方向けに設計されており、Chart.jsを使ったデータの視覚化のような機能を備えている。
予備的な結果はシステムの有効性を示し、ユーザが食事に関する決定を下すための貴重なツールとなる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:18:53 GMT)
Number-operator-based inverse engineering technique in a two level system [0.0] 本稿では, トランスモン量子ビットを用いた量子コンピュータを用いて, 数値演算子を用いた逆エンジニアリング法(NOBIE)を実験的に実現した。
NOBIE法は、他の量子ビットとの相互作用や制御パルスに関連するノイズによらず、量子ビットの有効ハミルトニアンに対して試験されたとしても、ロバスト性を示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:30:08 GMT)
Novel Change Detection Framework in Remote Sensing Imagery Using Diffusion Models and Structural Similarity Index (SSIM) [0.0] 変化検出はリモートセンシングにおいて重要な課題であり、環境変化、都市の成長、災害影響のモニタリングを可能にする。
近年の機械学習、特に拡散モデルのような生成モデルの発展は、変化検出精度を高める新たな機会を提供する。
本稿では,安定拡散モデルの強度と構造類似度指数(SSIM)を組み合わせ,頑健で解釈可能な変化マップを作成する新しい変化検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:54:08 GMT)
Non-linear classification capability of quantum neural networks due to emergent quantum metastability [0.0] 量子ニューラルネットワークで有効な非線形性を実現することができることを示す。
分散多体量子スピンモデルにインスパイアされたアーキテクチャを持つ量子ニューラルネットワークを用いることで、このメカニズムが実際に非線形データ分類を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:01:07 GMT)
Multilevel CNNs for Parametric PDEs based on Adaptive Finite Elements [0.0] 高次元パラメータ依存偏微分方程式の多値性を利用するニューラルネットワークアーキテクチャが提案されている。
ネットワークは適応的に洗練された有限要素メッシュのデータで訓練される。
適応型マルチレベルスキームに対して完全収束と複雑性解析を行う。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:32:11 GMT)
Multifractal statistics of non-Hermitian skin effect on the Cayley tree [0.0] 木形状はケイリー木上の単粒子の皮膚状態の多フラクタル統計を誘導することを示す。
我々の研究は、ケイリーツリーにおける皮膚効果のユニークな特徴を明らかにし、障害のないオープン量子系において多重フラクタル性を誘導する新しいメカニズムを提供する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:27:28 GMT)
Model orthogonalization and Bayesian forecast mixing via Principal Component Analysis [0.0] 多くの場合、混合プロセスで使用されるモデルは類似している。
このような類似または冗長なモデルが存在することは、結果の誤解釈と予測性能の劣化をもたらす可能性がある。
提案するベイズモデル組合せフレームワークにモデル化を加えることで,予測精度が向上し,不確かさの定量化性能に優れることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:38:01 GMT)
Lorentz-covariance of Position Operator and its Eigenstates for a massive spin $1/2$ field [0.0] スピンが 1/2$ の大規模体に対する位置作用素の導出について述べる。
場位置作用素の固有値はローレンツ共変時空座標の空間成分である4$-ベクトルに対応する。
電場位置演算子は粒子と反粒子の双方に対して一粒子位置演算子として機能することを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 04:44:42 GMT)
Large Model Strategic Thinking, Small Model Efficiency: Transferring Theory of Mind in Large Language Models [0.0] 微調整による小型かつ高性能な特殊アルゴリズムの実現可能性について検討する。
まず,異なる社会的文脈と異なる社会的ジレンマのゲームを組み合わせて,その回答を記録し,Q&Aの微調整に使用する,20種類のシナリオを持つ大規模事前学習モデルを提案する。
微調整されたより小さな言語モデルは、より小さな事前訓練されたモデルとより大きな相対性の間の性能のギャップを一貫して橋渡しすることを発見した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:58:00 GMT)
Industry Perception of Security Challenges with Identity Access Management Solutions [0.0] 本研究は、受益者の視点から、IAMソリューションに関する現在の認識とセキュリティ問題の概要を明らかにすることを目的としている。
クラウドベースのIAMソリューションの主な課題は、デフォルト設定、サービスアカウントのような非Human Identitiesの非Human Identitiesの管理、粗悪な証明書管理、粗悪なAPI設定、限定的なログ分析である。
対照的に、オンプレミスソリューションの課題は、マルチファクタ認証、安全でないデフォルト設定、IAMソリューションを安全に管理するために必要なスキルセットの欠如、パスワードポリシーの貧弱化、未パッチの脆弱性、シングルサインの妥協などである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:19:58 GMT)
Improved constraints on exotic interactions between electron and proton in hydrogen [0.0] 原子分光法は、初等フェルミオン間のエキゾチックな力を運ぶ新しいボソンを探すために用いられる。
水素の2S$_1/2$電子レベルと最新の境界状態量子力学理論の超微細分裂の最近の精密測定と比較すると、制約は改善される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:03:33 GMT)
Implementation of Continuous-Time Quantum Walk on Sparse Graph [0.0] 連続時間量子ウォーク(CTQW)は、量子コンピューティングにおいて重要な役割を果たす。
CTQWを効率的に実装する方法は難しい問題である。
本稿では,スパースグラフ上でのCTQWの実装について検討する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 05:20:55 GMT)
Hybrid Semantic Search: Unveiling User Intent Beyond Keywords [0.0] 本稿では,ユーザの意図を理解する上で,従来のキーワードベースの検索の限界に対処する。
非意味的な検索エンジン、LLM(Large Language Models)、埋め込みモデルの強みを活用する新しいハイブリッド検索手法を導入する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:57:15 GMT)
Hibou: A Family of Foundational Vision Transformers for Pathology [0.0] コンピュータアルゴリズムによる解析のためにガラススライドを高解像度のデジタル画像に変換するデジタル病理学は、自動画像解析と大規模データ処理によって、診断精度、一貫性、効率を向上させることにより、分野に革命をもたらす。
本稿では,組織の種類や染色技術を表す100万枚以上のスライド画像(WSI)のプロプライエタリなデータセット上で,DINOv2フレームワークを用いてヒブーBとヒブーLの2つのモデル変異体を事前学習する。
我々の事前訓練されたモデルは、パッチレベルとスライドレベルの両方のベンチマークにおいて、既存のベンチマークを上回る優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:01:21 GMT)
Half Landau-Zener ramp to a quantum phase transition in a dissipative single spin sodel [0.0] バイアス場の傾斜によって駆動されるゼロ温度で, ボゾン浴に結合した単一スピンのダイナミクスについて検討した。
残留磁化とランプ速度のスケーリング則を導出する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:58:36 GMT)
Generative AI in Industrial Machine Vision -- A Review [0.0] 生成gls*AIはパターン認識能力を改善することによって有望な可能性を実証する。
機械ビジョンにおける生成gls*AIの応用は、データの多様性、計算要求、堅牢な検証方法の必要性により、まだ初期段階にある。
この概要は、研究者に現在の研究における様々な分野と応用についての洞察を提供することを目的としており、重要な進歩と将来の仕事の機会を明らかにすることを目的としている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:14:18 GMT)
Generalized Gleason and Kraus Theorems for hybrid classical-quantum probabilities [0.0] 本稿では,古典的および量子的確率測度に対して,従来の方法を簡単に一般化するハイブリッド古典量子確率測度に対する公理を提案する。
我々は、量子演算の完全正の仮定に類似したハイブリッド確率測度の変換の要件を定式化する。
これらの変換の明示的な表現は、古典的部分系と量子的部分系が相互作用しないとき、古典的部分系が離散的であるとき、または量子的部分系のヒルベルト空間が有限次元であるときに導かれる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 14:13:44 GMT)
Fredholm Integral Equations Neural Operator (FIE-NO) for Data-Driven Boundary Value Problems [0.0] 本研究では,不規則な境界を持つ境界値問題(BVP)を解くための物理誘導型演算子学習法(FIE-NO)を提案する。
提案手法は,BVPに対処する上で,優れた性能を示す。
我々の手法は、未知の方程式形式や複雑な境界形状を含む複数のシナリオにまたがって一般化することができる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 00:15:27 GMT)
Finite mathematics as the most general (fundamental) mathematics [0.0] 標数$p$の有限環に基づく量子理論は、標準量子論よりも一般である、なぜなら後者は形式的な極限$ptoinfty$における前者の退化の場合であるからである。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 19:27:55 GMT)
Extracting Signal out of Chaos: Advancements on MAGI for Bayesian Analysis of Dynamical Systems [0.0] 基本MAGI法における新しい手法改良であるPilot MAGIを導入する。
系が安定であるかカオスであるかを確率論的に分類するために、MAGIに基づく手法と力学系理論を組み合わせる方法を示す。
PMSPはカオス力学系においても正確な将来予測を出力できることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:47:06 GMT)
Experimentation, deployment and monitoring Machine Learning models: Approaches for applying MLOps [0.0] MLOpsの規律は、機械学習モデルのライフサイクルを自動化するソリューションとして現れます。
本稿では,MLOps技術とその最も多様な応用の理解に寄与する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:11:17 GMT)
Evaluation Framework for AI-driven Molecular Design of Multi-target Drugs: Brain Diseases as a Case Study [0.0] マルチターゲットドラッグディスカバリ(Multi-target Drug Discovery、MTDD)は、複雑な疾患に対する薬物発見のパラダイムである。
本稿では,MTDDシナリオにおける分子生成手法の評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:42:16 GMT)
Error threshold in active steering protocols for few-qubit systems [0.0] 振幅および位相雑音による誤差チャネルの存在下での弱測定量子ビットのアクティブステアリングプロトコルについて検討した。
エラーレートが十分に小さい場合、プロトコルは、高忠実で高純度な事前指定された純粋なターゲット状態に近づき、安定化する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 15:56:39 GMT)
Enhancing Startup Success Predictions in Venture Capital: A GraphRAG Augmented Multivariate Time Series Method [0.0] 本稿では,GrahphRAG拡張時系列モデルを用いた新しい手法を提案する。
実験の結果,我々のモデルはスタートアップの成功予測において,過去のモデルよりも大幅に優れていたことがわかった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:18:55 GMT)
Enhanced Shadow Tomography of Molecular Excited States from Enforcing $N$-representability Conditions by Semidefinite Programming [0.0] 本稿では,2電子還元密度行列 (2-RDM) 上の物理制約と古典的影トモグラフィーを組み合わせることで,励起状態の処理を行うアルゴリズムを提案する。
この手法は、(i)シャドウトモグラフィと呼ばれるランダムサンプリング手法により量子状態を近似することにより、量子コンピュータ上の多電子2-RDMの測定数を減少させる。
我々はH$_4$鎖の励起状態エネルギーと2-RDMを計算し、円錐交差を介してガウシェ-1,3-ブタジエンからビシクロブタンへの光励起反応経路の臨界点を解析した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 17:27:48 GMT)
Eigenstate correlations, the eigenstate thermalization hypothesis, and quantum information dynamics in chaotic many-body quantum systems [0.0] 空間的に拡張されたシステムに特有の固有状態と、絡み合いのダイナミクスと演算子の拡散を特徴付ける相関について考察する。
量子情報のスクランブルに関連する相関は、固有状態熱化仮説(ETH)によって確立された標準枠組みの外にある
我々はこれらの相関関係を捉える最も単純な相関関数を確立し、長距離および低エネルギーで普遍的であると期待される振る舞いの特徴について議論する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:35:37 GMT)
Does quantum information require additional structure? [0.0] 直接観測されていない関係の量子空間の仮説を導入する。
我々は、Chyli'nskiの量子リレーショナル連続空間のアイデアを提示する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:39:20 GMT)
Dirac Equation with Space Contributions Embedded in a Quantum-Corrected Gravitational Field [0.0] ディラック方程式は、最近提案された一般化重力相互作用(ケプラーあるいはクーロン)と共に考慮される
この定式化におけるクーロンポテンシャルのいくつかの既知の一般化について、あるフン函数の観点から論じる。
量子補正されたクーロン項に対する方程式の解法は、既知の完全あるいは準コンパクトな非摂動解析技術を用いて不可能である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:13:45 GMT)
Dimension-free uniform concentration bound for logistic regression [0.0] 制約付きロジスティック回帰の次元リスク関数に束縛された新規な一様濃度を与える。
我々の境界は、ラデマッハ複雑性論とマクダイアルメイドの不等式によって導かれる条件よりも大きな数の一様法則に対して、より穏やかな条件をもたらす。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:14:25 GMT)
Converting nonlocality into contextuality [0.0] ペレス-メルミン正方形とグリーンベルガー-ホルン-ゼーリンガー-メルミン構成の量子論理構造について検討する。
解析により、2つのスピン-1/2粒子を含む4次元系における古典的および量子的予測の類似の完全矛盾が明らかになった。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:07:36 GMT)
Connection between coherent states and some integrals and integral representations [0.0] 本稿では、コヒーレント状態の形式主義と、特殊関数を含む積分と積分表現の分野との間の興味深い数学的フィードバックを示す。
これは、メイヤーの G- によって表される異なる函数の積分や積分表現を計算し、また超幾何学的一般化函数を計算するための簡単かつ高速な方法によって実現される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 11:31:15 GMT)
Cloud Kitchen: Using Planning-based Composite AI to Optimize Food Delivery Processes [0.0] 本稿では,食品デリバリーを行うレストランの意思決定ツールとして,Cloud Kitchenプラットフォームを提案する。
プラットフォームには、レストランやシミュレーターと通信するためのインターフェースを提供するTechnology-Specific Bridge (TSB) が含まれている。
当社のプラットフォームによる意思決定は,現実の過去のデータセットを用いて,納品の遅れを減らすことで,顧客満足度を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:38:36 GMT)
Character Complexity: A Novel Measure for Quantum Circuit Analysis [0.0] 本稿では,グループ理論の概念を実用的な量子コンピューティングの課題にブリッジする新しい尺度であるキャラクタ複雑度を紹介する。
キャラクタ複雑性のいくつかの重要な性質を証明し、量子回路の古典的シミュラビリティへの驚くべき接続を確立する。
本稿では、量子回路の構造に関する直感的な洞察を提供する、文字複雑性の革新的な可視化手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:40:55 GMT)
Calculating the energy profile of an enzymatic reaction on a quantum computer [0.0] 量子コンピューティングは、量子化学計算を可能にするための有望な道を提供する。
最近の研究は、ノイズ中間量子(NISQ)デバイスのためのアルゴリズムの開発とスケーリングに向けられている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:01 GMT)
CELLM: An Efficient Communication in Large Language Models Training for Federated Learning [0.0] 本論文は,フェデレートラーニング(FL)における大規模言語モデル(LLM)の効率的な学習手法の開発を目的とする。
まず,ローランク適応(LoRA)を用いて局所モデルトレーニングの計算負荷を削減する。
第2に、コミュニケーションコストを大幅に削減するために、トレーニング全体を通してスパース更新を通信します。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:42:25 GMT)
Bounding the systematic error in quantum error mitigation due to model violation [0.0] 本研究では,エラーモデルの不正確さがエラー軽減に与える影響について,上界を効率的に計算する手法を開発した。
我々のプロトコルは追加の実験を必要とせず、代わりにエラーモデルとエラー学習データの比較に頼っている。
推定上界は、通常、ランダム回路上での誤差軽減の最悪の観測性能に近いことが示される。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:27:00 GMT)
Binocular Model: A deep learning solution for online melt pool temperature analysis using dual-wavelength Imaging Pyrometry [0.0] 金属添加物製造(AM)において, メルトプール(MP)の温度監視は, 部品品質, プロセス安定性, 欠陥防止, プロセス全体の最適化の確保に不可欠である。
従来の手法は収束が遅く、データを実行可能な洞察に変換するために広範囲な手作業を必要とする。
本稿では,手作業によるデータ処理依存を減らすことを目的とした人工知能(AI)ベースのソリューションを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:26:09 GMT)
Beyond the parametric approximation: pump depletion, entanglement and squeezing in macroscopic down-conversion [0.0] ダウンコンバージョンハミルトニアンにおけるポンプモードのダイナミクスについて検討する。
本研究では, ポンプモードの劣化, 絡み合い, スクイーズ等の特性を実験的に検討した。
また,ポンプの光子数統計値と信号/イドラーモードを用いて,これらのモードの一般的な挙動を実験的な時間スケールで解析する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:04:43 GMT)
Apparent delay of the Kibble-Zurek mechanism in quenched open systems [0.0] クエンチ時間における新しい中間状態である$tau_q$を報告し、キブル・ズレック機構(KZM)の通常の妥当性を分離する。
これは、システムが断熱的な体制に入るように見えるため、$tau_q$による遷移時間のゆるいスケーリングに現れます。
この中間状態は、システムが衝動状態において凍結するのを防ぐ散逸によって出現する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 21:33:49 GMT)
An analogue of the Pöschl-Teller anharmonic oscillator on an $N$-dimensional sphere [0.0] 半径$R$のN$次元(Ngeqslant2$)超球面上のシュル「オーディンガー粒子を考える。
この粒子は、電位$V(theta)=2momega_12R2tan2(theta/2)+2momega_22R2cot2(theta/2)$、$0leqslantthetaleqslantpi$によって特徴づけられる力の作用を受ける。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 13:51:45 GMT)
An Open Source Python Library for Anonymizing Sensitive Data [0.0] 本稿では,感性のある表データの匿名化のためのPythonライブラリの実装について述べる。
このフレームワークは、ユーザが所定のデータセットに適用可能な、幅広い匿名化メソッドを提供する。
このライブラリは、統合と継続的開発のためのベストプラクティスに従って実装されている。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:01:57 GMT)
Amplified Squeezed States: Analyzing Loss and Phase Noise [0.0] 圧縮状態の位相感度増幅は、高い検出損失を軽減する技術である。
ケーススタディでは、位相感受性増幅の利点が示されている。
このスキームは提案された重力波検出器と互換性があり、量子系における応用と一致している。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 01:25:22 GMT)
Accelerated training of deep learning surrogate models for surface displacement and flow, with application to MCMC-based history matching of CO2 storage operations [0.0] 本研究では,CO2飽和度,圧力,表面変位を予測し,炭素貯蔵操作の履歴マッチングに用いるための新しいサロゲートモデリングフレームワークを提案する。
ここでのトレーニングには、多数の安価なフローオンリーのシミュレーションと、結合された実行回数のはるかに少ない組み合わせが含まれる。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 10:31:52 GMT)
A universal neutral-atom quantum computer with individual optical addressing and non-destructive readout [0.0] 量子コンピュータは、変換処理能力の約束を果たすために、大規模でフォールトトレラントな演算を実現する必要がある。
ここでは、シャットリングではなく、光スイッチング時間によってゲートレートが制限される普遍的な中性原子量子コンピュータを示す。
我々は、99.35(4)%のCZ忠実度と、99.902(8)%の局所的な単一量子ビットRZゲート忠実度を達成する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 03:30:44 GMT)
A toolbox for calculating objective image properties in aesthetics research [0.0] 「美学ツールボックス」では、現代研究でよく見られる量的画像特性の集合を正確に計算することができる。
性質としては、光度と色統計、フーリエスペクトル特性、フラクタル性、自己相似性、対称性、異なるエントロピー測度とCNNに基づく分散がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 07:49:43 GMT)
A numerical study of the spatial coherence of light in collective spontaneous emission [0.0] 空間コヒーレンス(空間コヒーレンス)は、原子と光との集合(協調)結合の結果確立される。
観測されたコヒーレンスの鍵となるフィギュア・オブ・メリットは、N/(L/lambda)である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 16:09:07 GMT)
A dissipation-induced superradiant transition in a strontium cavity-QED system [0.0] キャビティ量子電磁力学(QED)では、エミッタと共振器が結合し、量子光-物質相互作用の精密な研究を可能にする。
ここでは、超低温8,8$Sr原子のアンサンブルを用いて、CRFモデルで予測される連続超ラジカル相転移の観測を行う。
我々の観測は、量子状態を生成するために予測された駆動散逸系のより細かい制御への第一歩である。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 18:00:00 GMT)
A Tutorial on Explainable Image Classification for Dementia Stages Using Convolutional Neural Network and Gradient-weighted Class Activation Mapping [0.0] 本稿では、畳み込みニューラルネットワーク(CNN)とグラディエント重み付きクラス活性化マッピング(Grad-CAM)を用いて、4つの進行性認知症ステージをオープンMRI脳画像に基づいて分類する。
提案したCNNアーキテクチャは、テストデータセットの99%以上の精度を実現する。
Grad-CAMに基づく可視化は、非常に高精度な説明を試みており、医師に有用な情報を提供する可能性がある。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 06:23:20 GMT)
A Full DAG Score-Based Algorithm for Learning Causal Bayesian Networks with Latent Confounders [0.0] 因果ベイズネットワーク(Causal Bayesian Network, CBN)は、変数間の因果関係を符号化する一般的なグラフィカル確率モデルである。
本稿では,DAGの空間を探索し,潜在する共同設立者の存在を識別できる,初めての完全スコアに基づく構造学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 20:25:56 GMT)
A Fast and Computationally Inexpensive Method For Image Translation of 3D Volume Patient Data [0.0] 本稿では,SynthRAD Grand Challengeデータセット上で,SEM法を用いてCycleGANを訓練した。
モデル性能は,PSNR,SSIM,MAE,MSEなどの定量的性能指標を用いて質的,定量的に評価した。
本稿では,FQGA(Fast Paired Image-to- Image Translation Quarter-Generator Adversary)モデルを提案する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 08:46:37 GMT)
A Comparison of Large Language Model and Human Performance on Random Number Generation Tasks [0.0] ランダム数生成タスク(RNGT)は、人間が予測可能なパターンを欠くシーケンスをどのように生成するかを調べる心理学で用いられる。
本研究では,人間の生成したテキストに基づいて学習した大規模言語モデルであるChatGPT-3.5が,ランダム数列を生成する際の認知バイアスを示すかどうかを検証した。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 02:05:46 GMT)
$p$SVM: Soft-margin SVMs with $p$-norm Hinge Loss [0.0] ヒンジ損失に基づくサポートベクトルマシン(SVM)は、様々なバイナリ分類タスクに広く議論され、適用されてきた。
本稿では,$p$SVMの特性,性能,トレーニングアルゴリズムについて検討する。
論文参考訳(メタデータ) (Tue, 20 Aug 2024 12:00:00 GMT)