Deep Instruction Tuning for Segment Anything Model [68.8] Segment Anything Model (SAM) はマルチメディアとコンピュータビジョンの分野で研究ホットスポットとなっている。
SAMは、異なるタイプのセグメンテーションプロンプトをサポートすることができるが、テキストで指示されたタスクでは、はるかに悪化する。
SAMのための2つの簡易かつ効果的なディープ・インストラクション・チューニング(DIT)手法を提案し,その1つはエンドツーエンドであり、もう1つはレイヤワイズである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:05:43 GMT)
A Taxation Perspective for Fair Re-ranking [61.9] 本稿では,2項目間の実用性の違いに基づいて税率を上昇させる,税率という新たな公正な再格付け手法を提案する。
我々のモデルである税ランクは、公正な優遇措置として優れた税率政策を提供し、理論的には、精度損失よりも連続性と制御性の両方を実証している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:21:29 GMT)
DressCode: Autoregressively Sewing and Generating Garments from Text Guidance [61.5] 初心者向けデザインの民主化を目的とした,テキスト駆動型3D衣料生成フレームワークDressCodeを紹介した。
筆者らはまず,テキストコンディショニングとクロスアテンションを統合したGPTアーキテクチャであるSewingGPTを紹介した。
大規模言語モデルを活用することにより,本フレームワークは自然言語インタラクションによりCGフレンドリーな衣服を生成する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:32:52 GMT)
Spatio-Temporal Side Tuning Pre-trained Foundation Models for Video-based Pedestrian Attribute Recognition [58.8] 既存の歩行者認識アルゴリズム(PAR)は主に静的画像に基づいて開発されている。
本稿では,時間的情報を完全に活用できるビデオフレームを用いて,人間の属性を理解することを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:43:32 GMT)
CharacterFactory: Sampling Consistent Characters with GANs for Diffusion Models [58.4] CharacterFactoryは、GANの潜伏空間で一貫したアイデンティティを持つ新しい文字をサンプリングできるフレームワークである。
モデルはトレーニングに10分しかかからず、推論中に無限の文字をエンドツーエンドにサンプリングすることができる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:24:15 GMT)
DM-Align: Leveraging the Power of Natural Language Instructions to Make Changes to Images [55.5] 本稿では,画像のどの部分を変更するか,保存するかを明確に推論することで,画像エディタのテキストベースの制御を強化する新しいモデルを提案する。
元のソースイメージの記述と必要な更新を反映する命令と入力イメージとの間の単語アライメントに依存する。
Bisonデータセットのサブセットと、Dreamと呼ばれる自己定義データセットで評価される。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 22:45:47 GMT)
ForensicsForest Family: A Series of Multi-scale Hierarchical Cascade Forests for Detecting GAN-generated Faces [53.7] 我々は,GAN生成顔を検出するために,EmforensicsForest Familyと呼ばれる簡易かつ効果的な森林法について述べる。
ForenscisForestは、新しく提案された多層階層のカスケード林である。
Hybrid ForensicsForestはCNNレイヤをモデルに統合する。
Divide-and-Conquer ForensicsForestは、トレーニングサンプリングの一部のみを使用して、森林モデルを構築することができる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:19:58 GMT)
Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.2] 本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。
セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。
最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:40:36 GMT)
CRISPR-GPT: An LLM Agent for Automated Design of Gene-Editing Experiments [51.4] 大規模言語モデル(LLM)は様々なタスクにおいて有望であるが、しばしば特定の知識が欠如し、生物学的設計の問題を正確に解くのに苦労する。
本研究では,CRISPRに基づく遺伝子編集実験の設計プロセスを自動化するために,ドメイン知識と外部ツールを付加したLCMエージェントであるCRISPR-GPTを紹介する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 22:59:17 GMT)
Neural Étendue Expander for Ultra-Wide-Angle High-Fidelity Holographic Display [51.4] 現代のホログラフィックディスプレイは、表示領域と回折光の最大固体角度の積である低い「エンテンダ」を有する。
自然画像データセットから学習したニューラルな「固有拡大器」を提案する。
ニューラルネットワーク拡張器を用いて,64$times$ 'etendue expansion of natural image in full color, and expand the FOV by a magnitude of horizontal and vertically。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:00:29 GMT)
FDCE-Net: Underwater Image Enhancement with Embedding Frequency and Dual Color Encoder [49.8] 水中画像は、低明度、色の変化、ぼやけた詳細、吸光光によるノイズ、水や懸濁粒子による散乱などの様々な問題に悩まされることが多い。
従来の水中画像強調法(UIE)は主に空間領域の強調に焦点を当てており、画像固有の周波数領域情報を無視している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:16:34 GMT)
Exploring Few-Shot Adaptation for Activity Recognition on Diverse Domains [46.3] ドメイン適応は、さまざまな環境における正確で堅牢なパフォーマンスを保証するために、アクティビティ認識に不可欠である。
本研究では,FewShot Domain Adaptation for Activity Recognition (FSDA-AR) に焦点をあてる。
より多様で困難な領域への適応を考慮した5つの確立されたデータセットを用いた新しいFSDA-ARを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:02:45 GMT)
VidCoM: Fast Video Comprehension through Large Language Models with Multimodal Tools [44.8] textbfVidCoMは、Large Language Models (LLM)を活用して、軽量なビジュアルツールを使用して動画を推論する高速適応フレームワークである。
InsOVERアルゴリズムは、言語命令の分解とビデオイベントの間の効率的なハンガリー語マッチングに基づいて、対応するビデオイベントを特定する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:41:37 GMT)
Towards Activated Muscle Group Estimation in the Wild [44.7] 本稿では,ビデオによる活動筋群推定(AMGE)の新しい課題に取り組む。
我々は135の異なる活動と20のラベル付き筋群を持つ15Kビデオクリップを特徴とする筋マップデータセットを提供する。
このデータセットはYouTubeのビデオで構築されており、特にハイインテンシティ・インターバルトレーニング(HIIT)をターゲットとしている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:36:50 GMT)
Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data [43.5] 大規模言語モデル(LLM)は多くの自然言語処理が可能であるが、完璧には程遠い。
本稿では、文脈情報に基づいて、健康に関する推測を行うLLMの能力について検討する。
本研究は,4つの公衆衛生データセットを用いた12種類のLCMの包括的評価と微調整技術について述べる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:20:26 GMT)
Verco: Learning Coordinated Verbal Communication for Multi-agent Reinforcement Learning [42.3] 本稿では,大規模言語モデルをエージェントに組み込むマルチエージェント強化学習アルゴリズムを提案する。
フレームワークにはメッセージモジュールとアクションモジュールがある。
オーバークッキングゲームで行った実験は,既存の手法の学習効率と性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 05:10:33 GMT)
GMValuator: Similarity-based Data Valuation for Generative Models [41.8] 生成モデル評価器(GMValuator, Generative Model Valuator, GMValuator, GMValuator)を導入した。
GMValuatorは、その有効性を示すために、様々なデータセットや生成アーキテクチャで広く評価されている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 05:45:34 GMT)
MRScore: Evaluating Radiology Report Generation with LLM-based Reward System [39.5] 本稿では,Large Language Models (LLMs) を利用した放射線学レポート生成のための自動評価指標 MRScore を紹介する。
この課題に対処するため,我々は放射線学者と共同で,放射線学報告評価のためのLCMをガイドするフレームワークを開発し,ヒト分析との整合性を確保した。
実験では,MSScoreが人間の判断と高い相関性を示し,従来の指標と比較して,モデル選択における優れた性能を示した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 04:42:45 GMT)
RFL-CDNet: Towards Accurate Change Detection via Richer Feature Learning [39.4] RFL-CDNetは、よりリッチな特徴学習を利用して変更検出性能を向上させる新しいフレームワークである。
C2FGモジュールは、以前の粗いスケールからのサイド予測を現在の微細スケールの予測にシームレスに統合することを目的としている。
LFモジュールは各ステージと各空間位置の寄与が独立であると仮定し、複数の予測を融合させる学習可能なモジュールを設計する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:07:07 GMT)
Accurate and fast anomaly detection in industrial processes and IoT environments [38.7] 本稿では,産業用およびIoT用環境であるSAnDにおける異常検出のための,新しい,シンプルで広く適用可能な半教師付き手順を提案する。
SAnDは5つのステップから構成されており、それぞれよく知られた統計ツール、すなわち、スムージングフィルタ、分散インフレーション係数、マハラノビス距離、しきい値選択アルゴリズム、特徴重要度技術を利用している。
我々は、SAnDは有効であり、広く適用可能であり、異常検出と実行時の両方において既存のアプローチより優れていると結論付けている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:29:42 GMT)
The Common Core Ontologies [37.7] Common Core Ontology (CCO)は、Basic Ontology Formalを拡張する中間レベルのスイートとして設計されている。
この論文は、中級オントロジースイートに拡張されたドキュメントを提供するためのステップである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:23:02 GMT)
Instance-free Text to Point Cloud Localization with Relative Position Awareness [37.2] テキスト・ツー・ポイント・クラウド クロスモーダル・ローカライゼーションは、未来のロボットと人間のコラボレーションにとって重要な視覚言語タスクである。
既存のアプローチの2つの重要な制限に対処する: 1) 地中実例への依存を入力とし、2) 潜在事例間の相対的な位置を無視する。
提案モデルは,テキストセル検索のための粗いステージと位置推定のための微細なステージを含む,2段階のパイプラインに従う。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:46:49 GMT)
A Survey of Deep Learning Library Testing Methods [33.6] ディープラーニング(DL)ライブラリは、基礎となる最適化と計算を行う。
DLライブラリはバグに免疫がなく、ユーザの個人資産や安全性に深刻な脅威をもたらす可能性がある。
本稿では,各種DLライブラリに関する試験研究の概要について述べる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 11:42:13 GMT)
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models [33.6] 我々は,DeepSeek-Coder-Base-v1.5 7Bの事前トレーニングを継続するDeepSeekMath 7Bを紹介した。
DeepSeekMath 7Bは、競争レベルのMATHベンチマークで51.7%のスコアを獲得した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:25:53 GMT)
From Linear to Linearizable Optimization: A Novel Framework with Applications to Stationary and Non-stationary DR-submodular Optimization [33.4] 一般的なメタアルゴリズムは、凹凸/四角形関数を四角形設定を最適化するものに変換する。
新しいプロジェクションアルゴリズムは、Follow The Perturbed Leaderフレームワークを使って導出される。
特に,本論文では,既存の最先端結果と比較して,これらの設定を少ない仮定で達成している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:19:30 GMT)
Is Mamba Effective for Time Series Forecasting? [30.9] 時系列予測のための,S-Mamba(S-Mamba)というマンバモデルを提案する。
具体的には,各変数の時間点を線形層を介して自律的にトークン化する。
13の公開データセットの実験では、S-Mambaは計算オーバーヘッドを低く保ち、主要な性能を達成している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:39:09 GMT)
Dynamic Against Dynamic: An Open-set Self-learning Framework [29.9] オープンセット認識では、既存のメソッドは既知のクラスを使用して静的に固定された決定境界を学習し、未知のクラスを拒否する。
本稿では,オープンセットの自己学習フレームワークが対応する,動的に変化するオープンセット世界に対する動的手法という,動的アイデアに対する新しい動的手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:40:33 GMT)
Matching Patients to Clinical Trials with Large Language Models [29.3] 本稿では,患者間マッチングを支援するLLMフレームワークTrialGPTを紹介する。
患者注記が与えられた場合、TrialGPTは基準に基づいて患者の適性を予測する。
公用コホート184例を対象に,TrialGPTの試験レベル予測性能について検討した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 19:21:54 GMT)
Cauchy-Schwarz Divergence Information Bottleneck for Regression [27.8] 情報ボトルネック(IB)アプローチは、ディープニューラルネットワークの一般化、堅牢性、説明可能性を改善するために人気がある。
我々は、コーシー=シュワルツ分岐の好ましい性質を利用して、深いニューラルネットワークでIBをパラメータ化する新しい方法を開発した。
我々は6つの実世界の回帰タスクにおいて、他の人気のある深いIBアプローチよりも優れた性能を示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 16:13:05 GMT)
Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference [23.2] Mixture-of-Experts (MoE)は、計算要求を比例的にスケールアップすることなく、モデルサイズをスケールすることができる。
プレゲートMOEは、スパース専門家活性化の動的性質を緩和する新しいプレゲート機能を用いている。
我々は、Pre-gated MoEが、同じレベルのモデル品質を維持しながら、パフォーマンスを改善し、GPUメモリ消費を減らすことを実証した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:11:44 GMT)
Sub-Adjacent Transformer: Improving Time Series Anomaly Detection with Reconstruction Error from Sub-Adjacent Neighborhoods [22.5] 教師なし時系列異常検出のための新しいアテンション機構を備えたサブアジャセント変換器を提案する。
サブアジャセント領域に注意を集中させることで、異常の再構築をより困難にしている。
Sub-Adjacent Transformerは、6つの実世界の異常検出ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:08:17 GMT)
CUE-Net: Violence Detection Video Analytics with Spatial Cropping, Enhanced UniformerV2 and Modified Efficient Additive Attention [21.4] 本稿では,ビデオ監視における暴力自動検出のための新しいアーキテクチャであるCUE-Netを紹介する。
CUE-Netはローカルとグローバル両方の時間的特徴に着目し、RWF-2000およびRLVSデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:09:40 GMT)
Application of Deep Learning for Factor Timing in Asset Management [21.2] より柔軟なモデルは、目に見えない期間の係数プレミアムのばらつきを説明するのにより良いパフォーマンスを持つ。
ニューラルネットワークのような柔軟なモデルでは、予測に基づく最適な重み付けは不安定である傾向がある。
我々は、過去の最適再バランス方式によるリバランス頻度の傾きが、取引コストの削減に役立つことを検証した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 21:57:17 GMT)
Towards Measuring and Modeling "Culture" in LLMs: A Survey [21.1] いずれの研究でも、複雑で多面的な概念である「文化」は定義されていない。
これらの側面を文化のプロキシと呼び、人口統計学、意味学、言語-文化的相互作用の3つの側面にまたがってそれらを整理する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:08:24 GMT)
Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities [20.4] 大規模な言語モデル(LLM)の言語間連続的な事前学習は、最初は英語コーパスで訓練され、大量の英語リソースを活用でき、事前学習のコストを削減できる。
我々はLlama 2の語彙を日本語の文字に拡張し、大規模な日本語Webコーパスで継続事前学習を行うことにより、日本語能力を高めるLLMであるSwallowを構築した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:07:55 GMT)
Building a Large Japanese Web Corpus for Large Language Models [20.4] 本研究では,Common Crawlアーカイブからテキストを抽出し,精錬することにより,大規模なWebコーパスを構築する。
約312億文字(約1億7300万ページ)からなる。
コーパスの品質を確認するため,Llama 2 7B, 13B, 70B, Mistral 7B v0.1, Mixtral 8x7BをベースLLMとして継続トレーニングを行った。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:02:45 GMT)
Self-Supervised Learning for Large-Scale Preventive Security Constrained DC Optimal Power Flow [20.1] SCOPF(Security-Constrained Optimal Power Flow)は、電力グリッドの安定性において重要な役割を果たすが、システムが成長するにつれてますます複雑になる。
本稿では,大規模SCOPF問題に対する準最適解を生成するための,自己教師付きエンドツーエンドのPDL-SCOPFについて紹介する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:36:55 GMT)
Pre-training on High Definition X-ray Images: An Experimental Study [19.5] 大規模データセット上で,X線を用いた事前学習基礎ビジョンモデルとして,最初の高精細(1280$times$1280)を提案する。
我々のモデルはマスク処理後にトークンを(高いレートで)入力として利用するマスク付きオートエンコーダフレームワークに従っている。
我々は,X線レポート生成と疾患認識を含む2つの下流課題に対するモデルの有効性を検証した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:29:53 GMT)
Bounding the Expected Robustness of Graph Neural Networks Subject to Node Feature Attacks [19.0] グラフニューラルネットワーク(GNN)は、様々なグラフ表現学習タスクにおいて最先端のパフォーマンスを実証している。
最近の研究では、敵の攻撃に対する脆弱性が明らかにされている。
我々は、GCORN(Graph Convolutional Orthonormal Robust Networks)と呼ばれる、GNNの攻撃非依存的でより堅牢な変種を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:57:35 GMT)
Confidence Intervals for Error Rates in 1:1 Matching Tasks: Critical Statistical Analysis and Recommendations [16.9] 本稿では,1:1のマッチングタスクにおいて,誤り率に対する信頼区間を構築する手法について検討する。
サンプルサイズ,エラー率,データ依存度によって,範囲と間隔幅がどの程度異なるかを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:05:18 GMT)
Co-learning-aided Multi-modal-deep-learning Framework of Passive DOA Estimators for a Heterogeneous Hybrid Massive MIMO Receiver [16.8] 完全デジタル(FD) 大規模なマルチインプット多重出力(MIMO)アンテナアレイは、データ伝送と到着方向(DOA)測定に広く応用されている。
計算複雑性と回路コストの2つの大きな課題に直面している。
この2つの問題は、ハイブリッドアナログデジタル構造(HAD)によってうまく対処できる。
しかし、HADの位相曖昧性の問題があるため、その低効率性や高レイテンシにつながる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:34:36 GMT)
Application of a Dense Fusion Attention Network in Fault Diagnosis of Centrifugal Fan [15.4] 本稿では,従来の密集カスケード操作ではなく,分散注意モジュールを密接な接続に埋め込む方法について論じる。
提案した高密度融合は,ネットワーク診断プロセスの可視化に焦点を当て,モデル診断の解釈可能性を高める。
実験の結果,ネットワークの診断性能は,他の先進的な故障診断モデルよりも高いことがわかった。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 01:49:46 GMT)
Hybrid 3D Human Pose Estimation with Monocular Video and Sparse IMUs [15.0] モノクロビデオからの時間的3Dポーズ推定は、人間中心のコンピュータビジョンにおいて難しい課題である。
情報ソースを補完するために慣性センサが導入された。
物理的に合理的な3Dポーズを生成するために、異種センサデータを統合することは依然として困難である。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:02:42 GMT)
How the Training Procedure Impacts the Performance of Deep Learning-based Vulnerability Patching [14.8] 本稿では、脆弱性パッチ作成のための自己教師付きおよび教師付き事前訓練の既存のソリューションを比較した。
データ収集のコストは高いが、DLベースの脆弱性パッチングを大幅に改善することを発見した。
この教師付き事前訓練モデルの上にプロンプトチューニングを適用すると、性能が著しく向上することはない。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:08:42 GMT)
Are Watermarks Bugs for Deepfake Detectors? Rethinking Proactive Forensics [14.6] 現在の透かしモデルは、もともと本物の画像のために考案されたもので、偽造画像に直接適用した場合、デプロイされたディープフェイク検出器に害を与える可能性があると我々は主張する。
本稿では,能動的法医学を代表としてAdvMarkを提案し,受動検出器の対角的脆弱性を有効に活用する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 11:20:49 GMT)
Quality Estimation with $k$-nearest Neighbors and Automatic Evaluation for Model-specific Quality Estimation [14.4] 我々は, MTモデルのトレーニングデータから, $k$-nearest 隣人を用いて情報を抽出する,$k$NN-QE と呼ばれるモデル固有で教師なしQE手法を提案する。
モデル固有のQEのパフォーマンスの測定は、MT出力の品質スコアを提供するため、簡単ではない。
そこで本研究では,人為的な基準値ではなく,基準基準値からの品質スコアをゴールドスタンダードとして活用する自動評価手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 23:52:51 GMT)
GPT for Games: A Scoping Review (2020-2023) [12.8] 本稿では,ゲームにおけるGPTの可能性を探るため,55項目のスコーピングレビューを紹介する。
現在のゲーム研究におけるGPTの主な応用は,プロシージャコンテンツ生成,混合開始型ゲームデザイン,混合開始型ゲームプレイ,ゲームプレイ,ゲームユーザリサーチの5つである。
このレビューは、ゲームにおける革新的なGPTアプリケーションのための技術の現状を説明し、ゲーム開発を充実させ、最先端のAIイノベーションでプレイヤー体験を強化することを約束することで、基礎を固めることを目的としている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:26:18 GMT)
Automating Zero-Shot Patch Porting for Hard Forks [12.6] 本稿では,機能的にハードフォーク用のパッチを自動的に移植する大規模言語モデル (LLM) を提案する。
PPatHFは131 (42.3%)のパッチを正しく移植し、開発者がパッチを移植するのに必要な手作業の57%を自動化する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:40:39 GMT)
Applying Unsupervised Semantic Segmentation to High-Resolution UAV Imagery for Enhanced Road Scene Parsing [12.6] 新規な教師なし道路解析フレームワークについて紹介する。
提案手法は,手動のアノテーションを使わずに,開発データセット上で89.96%のmIoUの平均インターセクションを実現する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:38:40 GMT)
Make the Most of Your Data: Changing the Training Data Distribution to Improve In-distribution Generalization Performance [12.5] 我々は、勾配降下(GD)の誘導バイアスとシャープネス認識最小化(SAM)について検討する。
本研究では,(S)GD を用いたトレーニングにおいて,トレーニングデータ分布を変更することで,元のデータ分布の一般化性能を効果的に向上することを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:30:50 GMT)
Testing and Understanding Erroneous Planning in LLM Agents through Synthesized User Inputs [12.4] 大規模言語モデル(LLM)は、幅広いタスクを解くのに有効であることを示した。
LLMは、特にタスクが複雑で長期計画を必要とする場合、誤った計画を立てる傾向がある。
提案するPDoctorは,LLMエージェントをテストし,それらの誤った計画を理解するための新しいアプローチである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:56:45 GMT)
FRAME: A Modular Framework for Autonomous Map-merging: Advancements in the Field [12.2] 本稿では,エゴセントリックなマルチロボット探査における3次元点雲マップの融合について述べる。
提案手法は、最先端の場所認識と学習記述子を利用して、地図間の重複を効率的に検出する。
提案手法の有効性は,ロボット探査の複数のフィールドミッションを通じて実証された。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:54:15 GMT)
Interaction Event Forecasting in Multi-Relational Recursive HyperGraphs: A Temporal Point Process Approach [12.1] 本研究は,マルチリレーショナル再帰的ハイパーグラフにおける高次相互作用事象の予測問題に対処する。
提案したモデルであるtextitRelational Recursive Hyperedge Temporal Point Process (RRHyperTPP) は,歴史的相互作用パターンに基づいて動的ノード表現を学習するエンコーダを使用する。
我々は,従来のインタラクション予測手法よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:46:54 GMT)
Recall, Retrieve and Reason: Towards Better In-Context Relation Extraction [11.5] 関係抽出(RE)は、テキストで言及されたエンティティ間の関係を特定することを目的としている。
大規模言語モデル(LLM)は、様々なタスクにおいて、コンテキスト内学習能力を印象的に示している。
LLMは、ほとんどの教師付き細調整RE法と比較して性能が劣る。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:12:52 GMT)
UniScene: Multi-Camera Unified Pre-training via 3D Scene Reconstruction for Autonomous Driving [11.5] 我々は、UniSceneと呼ばれる、最初のマルチカメラ統合事前学習フレームワークを提案する。
我々は3次元シーンの一般的な表現としてOccupancyを使用し、そのモデルが周囲の世界の幾何学的先行を把握できるようにする。
UniSceneは、マルチカメラ3Dオブジェクト検出において、mAPが約2.0%、NDSが約2.0%、セマンティックシーン完了時のmIoUが3%向上した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:16:13 GMT)
Evaluating the Application of ChatGPT in Outpatient Triage Guidance: A Comparative Study [11.4] 医療における人工知能の統合は、運用効率と健康結果を高めるための変革的な可能性を示している。
ChatGPTのような大規模言語モデル(LLM)は、医療的意思決定をサポートする能力を示している。
本研究の目的は,ChatGPTが提示する応答の整合性を評価することである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 04:12:02 GMT)
Vision-based Discovery of Nonlinear Dynamics for 3D Moving Target [11.1] 本稿では,カメラセットが記録した生のビデオを通して,3次元移動目標に対する非線形力学の制御方程式を自動的に発見するための視覚的アプローチを提案する。
このフレームワークは、例えばビデオ内のノイズ、データ不足の原因となるターゲットの不正確な追跡など、測定データに関連する課題を効果的に処理することができる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 11:13:55 GMT)
CHAI: Clustered Head Attention for Efficient LLM Inference [11.1] クラスタ型ヘッドアテンション(CHAI)は、K,Vキャッシュを最大21.4%、推論時間遅延を最大1.73倍まで、微調整を必要とせずに削減することができる。
我々は,K,Vキャッシュを最大21.4%,推論時間遅延を最大1.73倍,微調整を必要とせずに,メモリ要求を最大で1.73倍削減できることを示した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 22:45:39 GMT)
Neural Temporal Point Process for Forecasting Higher Order and Directional Interactions [10.8] 本稿では,ハイパーエッジイベント予測のための,ディープニューラルネットワークに基づくテキスト指向ハイパーNodeテンポラルポイントプロセスを提案する。
提案手法は,イベントが観測されるノードを最初に予測することで,探索空間を縮小する。
これらに基づいて、候補のハイパーエッジを生成し、それをハイパーエッジ予測器が使用して、基底の真理を識別する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:12:34 GMT)
From Optimization to Generalization: Fair Federated Learning against Quality Shift via Inter-Client Sharpness Matching [10.7] フェデレートラーニングは、分散化された医療データでディープニューラルネットワークをトレーニングするための重要なアプローチとして認識されている。
実際には、様々な施設で一貫した画像品質を確保することは困難である。
この画像品質の不均衡は、フェデレートされたモデルが高品質な画像に対して固有のバイアスを生じさせる可能性がある。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:05:41 GMT)
Implementation of Big AI Models for Wireless Networks with Collaborative Edge Computing [10.5] 大きなAIモデルのトレーニングは、エッジデバイスに重大な課題をもたらす。
従来のアプローチでは、トレーニングデータを集約して、集中的なトレーニングのためにリモートクラウドに送信するのが一般的だった。
我々は、信頼されたエッジデバイス群をリソースプールとしてオーケストレーションする新しいトレーニングメカニズムである協調エッジトレーニングを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:09:39 GMT)
Attacking Bayes: On the Adversarial Robustness of Bayesian Neural Networks [10.3] 我々は,最先端のBNN推論手法と予測パイプラインを破ることが可能であるか検討する。
我々は、最先端の近似推論手法で訓練されたBNNや、ハミルトン・モンテカルロで訓練されたBNNでさえ、敵の攻撃に非常に敏感であることがわかった。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 01:34:46 GMT)
From Languages to Geographies: Towards Evaluating Cultural Bias in Hate Speech Datasets [10.3] ヘイトスピーチデータセットは伝統的に言語によって開発されてきた。
HSデータセットにおける文化バイアスを,言語と地理の2つの関係する文化的プロキシを利用して評価する。
英語、アラビア語、スペイン語のHSデータセットは、地理的に文化的に強い偏見を示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:10:10 GMT)
Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models [10.0] 大規模言語モデル(LLM)は、様々な言語タスクで顕著な成功を収めてきたが、幻覚や時間的ミスアライメントに悩まされている。
従来のtextitRetrieve-then-Read の代わりに,新しい textitDistill-Retrieve-Read フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:11:42 GMT)
Critical Review for One-class Classification: recent advances and the reality behind them [10.0] 本稿は,一級分類におけるプロミネント戦略を,その発端から現在の進歩まで合成する。
この記事は、一級実験を統括する画像異常検出アルゴリズム(AD)について、最先端(SOTA)を批判する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:04:30 GMT)
BiLO: Bilevel Local Operator Learning for PDE inverse problems [10.0] 偏微分方程式(PDE)の逆問題に対する新しいニューラルネットワークに基づく解法を提案する。
上層部ではPDEパラメータに関してデータ損失を最小限に抑える。
低レベルでは、ニューラルネットワークをトレーニングし、与えられたPDEパラメータの集合の近傍でPDEソリューション演算子を局所的に近似する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:06:41 GMT)
Meta In-Context Learning Makes Large Language Models Better Zero and Few-Shot Relation Extractors [9.9] textscMicre (textbfMeta textbfIn-textbfContext learning of LLMs for textbfRelation textbfExtraction)は、ゼロおよび少数ショット関係抽出のための新しいメタトレーニングフレームワークである。
textscMicreは、ターゲットREデータセットの推論中に関係ラベル名を介して関係意味知識を転送可能であることを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:06:39 GMT)
Error analysis for finite element operator learning methods for solving parametric second-order elliptic PDEs [9.7] 古典的有限要素近似に基づくデータ依存のない演算子学習法の理論解析を行う。
本手法の収束における有限要素行列の条件数の役割に対処する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 11:25:58 GMT)
How LLMs Aid in UML Modeling: An Exploratory Study with Novice Analysts [9.5] GPT-3, Large Language Models (LLMs) は、ソフトウェア工学の分野における研究者、実践者、教育者の目を引いている。
本稿では、LLMが初心者アナリストに対して、ユースケースモデル、クラス図、シーケンス図という3種類の典型的なモデルを作成するのにどのように役立つかを検討する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:38:20 GMT)
LLMParser: An Exploratory Study on Using Large Language Models for Log Parsing [8.6] ログ解析にLarge Language Models (LLMs) を用いることの可能性を検討した。
例えば、Flan-T5-baseはLLaMA-7Bに匹敵する結果を短時間で達成する。
また,他のシステムからのログを用いて事前学習したLLMを用いることで,解析精度が向上するとは限らない。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:34:29 GMT)
Open-Set 3D Semantic Instance Maps for Vision Language Navigation -- O3D-SIM [8.5] 人間は周囲のメンタルマップを作るのに優れています。
インスタンスレベルの情報と環境の意味的理解を持つことは、言語誘導タスクのパフォーマンスを著しく向上させる。
パイプラインの堅牢性を高めながら、このインスタンスレベルのアプローチを3Dに拡張します。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:20:46 GMT)
On Quantum Algorithms for Efficient Solutions of General Classes of Structured Markov Processes [8.3] 構造化マルコフ過程の定常分布を計算するための最初の量子アルゴリズムを考案する。
構造化マルコフ過程によって動機づけられたものの、我々の量子アルゴリズムはより大規模な数値計算問題に対処するために利用される可能性がある。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:06:16 GMT)
Empirical Analysis of Dialogue Relation Extraction with Large Language Models [7.8] 対話関係抽出における様々な大言語モデル(LLM)の機能について検討する。
LLMは既存のDRE手法の2つの問題を著しく軽減する。
LLMはフルショットと数ショットの両方の設定で、競争力や優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:55:41 GMT)
HeLM: Highlighted Evidence augmented Language Model for Enhanced Table-to-Text Generation [7.7] LLaMA2モデル上でパラメータ効率の良い微調整を行う。
我々のアプローチは、テーブル固有の行データを強調することにより、推論情報を入力に注入することである。
FetaQAデータセットとQTSummデータセットの両方で、我々のアプローチは最先端の結果を得た。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:51:11 GMT)
Charaterization of dim light response in DVS pixel: Discontinuity of event triggering time [7.6] 典型的なダイナミック・ビジョン・センサ(DVS)回路を解析し、イベントトリガー時間の不連続性があることを見出した。
この不連続性は光強度の変化速度にのみ依存していると指摘する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:55:53 GMT)
Automatic Build Repair for Test Cases using Incompatible Java Versions [7.5] 依存性の最小化を行うことで、Javaプロジェクトのテストケースを修復するアプローチを導入します。
既存の最先端技術とは異なり、我々の手法はソースレベルで動作し、コンパイル時のエラーを修正できる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:55:52 GMT)
Enhancing Pre-Trained Generative Language Models with Question Attended Span Extraction on Machine Reading Comprehension [6.6] 学習前生成言語モデル(PLM)の微調整段階で統合されたQASEは,その性能を著しく向上させる。
QASEモジュールの有効性は、さまざまなデータセットで厳格にテストされており、一貫して最先端(SOTA)の結果を達成または超えている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 19:42:51 GMT)
CATS: Contextually-Aware Thresholding for Sparsity in Large Language Models [6.4] 大規模言語モデル(LLM)は、劇的に高度なAIアプリケーションを持っているが、その膨大な推論コストのため、そのデプロイメントは難しいままである。
本稿では,基本LLMの活性化と推論コストの低減を両立させる新しいフレームワーク,CATS(Contextually Aware Thresholding for Sparsity)を提案する。
提案手法は,Mistral-7BやLlama2-7Bなどの各種ベースモデルに適用可能であり,下流タスク性能において既存のスペーサー化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:01:02 GMT)
The Simpler The Better: An Entropy-Based Importance Metric To Reduce Neural Networks' Depth [5.9] 本稿では,大規模モデルによって伝達される事前知識を活用する効率戦略を提案する。
本稿では,過度にパラメータ化された深層ニューラルネットワークの深さを低減するために,エントロピー・バサード・インシデンス・mEtRic (EASIER) を利用する手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:28:25 GMT)
Privacy-Preserving Aggregation for Decentralized Learning with Byzantine-Robustness [5.7] Byzantineクライアントは、任意のモデル更新を他のクライアントにブロードキャストすることで、学習プロセスを意図的に破壊する。
本稿では,ビザンチンの脅威に対するDLのセキュリティとプライバシを高めるために設計された,新しいDLプロトコルであるSecureDLを紹介する。
実験の結果,悪意者による攻撃においてもSecureDLは有効であることがわかった。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:17:36 GMT)
SCorP: Statistics-Informed Dense Correspondence Prediction Directly from Unsegmented Medical Images [5.5] SCorPは,非分割画像から直接表面上の対応を予測できる新しいフレームワークである。
提案モデルでは,対応予測タスクの監督を取り除き,トレーニングフェーズと推論フェーズを合理化する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:56:58 GMT)
FisheyeDetNet: 360° Surround view Fisheye Camera based Object Detection System for Autonomous Driving [5.0] 物体検出は自律走行における成熟した問題であり、歩行者検出は最初に展開されたアルゴリズムの1つである。
標準的なバウンディングボックスの表現は、特に周辺部において大きな放射歪みのため、魚眼カメラでは失敗する。
我々は、回転する有界箱、楕円、ポリゴンを極弧/角表現として設計し、これらの表現を分析するためにインスタンスセグメンテーションmIOUメートル法を定義する。
提案したモデルであるPhiteeyeDetNetは他より優れており、自動走行用Valeo fisheye around-viewデータセットのmAPスコアは49.5 %である。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:02:35 GMT)
Towards Universal Performance Modeling for Machine Learning Training on Multi-GPU Platforms [5.0] 我々は,コンピュータシステム上での機械学習(ML)ワークロードのトレーニングパフォーマンスを特徴付けるパイプラインを開発し,予測する。
私たちのパイプラインは、TransformerベースのNLPモデルなど、他のタイプのMLワークロードに一般化されています。
最速の埋め込みテーブルシャーディング構成を素早く選択するような洞察を生成することができる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:59:21 GMT)
Exploring AIGC Video Quality: A Focus on Visual Harmony, Video-Text Consistency and Domain Distribution Gap [4.9] 我々は,AIGC映像品質の評価を,視覚調和,映像テキストの整合性,領域分布ギャップの3次元に分類した。
各次元に対して、AIGCビデオの総合的な品質評価を提供するための特定のモジュールを設計する。
本研究は,異なるテキスト・ツー・ビデオ・モデルにより生成される映像の視覚的品質,流動性,スタイルの有意な変化を明らかにする。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:10:55 GMT)
Recontextualized Knowledge and Narrative Coalitions on Telegram [4.9] 共謀文の特徴は、先行知識を再テクスチュアライズすることで権力とアイデンティティを交渉することである。
この章では、Pushshift Telegramデータセットから、公開メッセージングチャネルにおける事前知識へのリンクを実証的に分析する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 10:19:25 GMT)
MMA-UNet: A Multi-Modal Asymmetric UNet Architecture for Infrared and Visible Image Fusion [4.8] MMIF(Multi-modal Image fusion)は、様々なモダリティから有用な情報を同じ表現空間にマッピングする。
既存の融合アルゴリズムは、対称的にマルチモーダル画像を融合する傾向があり、浅い情報や偏りが単一モーダルに対して失われる。
本研究では,異なるモードにおける情報の空間分布の差異を解析し,同一ネットワーク内の符号化特徴が同時に深層特徴空間アライメントを実現するには困難であることを証明した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 01:35:21 GMT)
Primal Dual Alternating Proximal Gradient Algorithms for Nonsmooth Nonconvex Minimax Problems with Coupled Linear Constraints [4.7] 非近位ミニマックス問題は近年、機械学習、信号処理など多くの分野に注目が集まっている。
そこで本稿では,非平滑な非畳み込みミニマックス問題の解法としてDAPアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 05:00:33 GMT)
Exploring Intrinsic Properties of Medical Images for Self-Supervised Binary Semantic Segmentation [4.6] ダイナミック・セルフアダプティブ・セマンティック(MedSASS)を応用した医用画像の紹介
MedSASSは、医療画像のセグメンテーションに適した、専用のセルフ教師付きフレームワークである。
MedSASSを4つの多様な医療データセットにまたがる既存の最先端手法に対して評価した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:04:11 GMT)
Likelihood Based Inference in Fully and Partially Observed Exponential Family Graphical Models with Intractable Normalizing Constants [4.5] マルコフ確率場を符号化する確率的グラフィカルモデルは、生成的モデリングの基本的な構成要素である。
本稿では,これらのモデルの全確率に基づく解析が,計算効率のよい方法で実現可能であることを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:58:22 GMT)
PRISM: Patient Records Interpretation for Semantic Clinical Trial Matching using Large Language Models [4.4] 本報告では,実世界のERHを用いた臨床治験の大規模評価について述べる。
本研究は, LLMsが適切な臨床試験で患者に正確に適合する能力を示すものである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:10:21 GMT)
Counterfactual Explanations of Black-box Machine Learning Models using Causal Discovery with Applications to Credit Rating [4.2] いくつかのXAIモデルは、予測モデルのインプット・アウトプット関係と特徴間の依存関係を調べることによって、モデルを説明するために因果関係を考慮する。
これらのモデルの大半は、因果グラフが知られていると仮定して、反事実確率に基づく説明に基づいている。
本研究では、因果グラフが知られている制約を緩和する新しいXAIフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 03:11:26 GMT)
Uncertainty quantification for iterative algorithms in linear models with application to early stopping [4.2] 本稿では,高次元線形回帰問題における反復アルゴリズムから得られた繰り返し$hbb1,dots,hbbT$について検討する。
解析および提案した推定器は、GD(Gradient Descent)、GD(GD)およびFast Iterative Soft-Thresholding(FISTA)などの加速変種に適用できる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 10:20:41 GMT)
Shared learning of powertrain control policies for vehicle fleets [3.9] 深部強化学習(DRL)は、燃料経済やその他のパフォーマンス指標を最適化するパワートレイン制御ポリシーを現場で学習することを目的としている。
本稿では, 蒸留グループ政策を用いて, 車両群間で共有学習を行うための新しい枠組みを提案する。
ベースラインに比べて燃料経済は平均8.5%改善している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:01:05 GMT)
Reliable Student: Addressing Noise in Semi-Supervised 3D Object Detection [3.6] 半教師付き3Dオブジェクト検出は、ラベル付きデータに制限がある場合に、有望な擬似ラベル手法の恩恵を受けることができる。
最近のアプローチでは、トレーニング中のノイズの多い擬似ラベルの影響を見落としている。
本稿では,2つの相補的手法を取り入れた信頼性学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:38:45 GMT)
VANER: Leveraging Large Language Model for Versatile and Adaptive Biomedical Named Entity Recognition [3.5] 大型言語モデル(LLM)は、様々な種類のエンティティを抽出できるモデルを訓練するために使用することができる。
本稿では,オープンソースのLLM LLaMA2をバックボーンモデルとして利用し,異なるタイプのエンティティとデータセットを区別するための具体的な命令を設計する。
我々のモデルVANERは、パラメータの小さな分割で訓練され、従来のLLMモデルよりも大幅に優れており、LLMをベースとしたモデルとして初めて、従来の最先端のBioNERシステムの大部分を上回りました。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:00:39 GMT)
A Survey of Third-Party Library Security Research in Application Software [3.3] サードパーティのライブラリが広く使われるようになると、関連するセキュリティリスクと潜在的な脆弱性がますます顕在化している。
悪意のある攻撃者は、これらの脆弱性を利用してシステムに侵入したり、不正な操作を行ったり、機密情報を盗んだりすることができる。
ソフトウェアにおけるサードパーティのライブラリの研究は、この増大するセキュリティ問題に対処する上で、最重要課題となる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 16:35:02 GMT)
I Have an Attention Bridge to Sell You: Generalization Capabilities of Modular Translation Architectures [3.1] モジュール性は翻訳品質にどう影響するか、そしてモジュールアーキテクチャが様々な評価シナリオでいかに一般化するかについて検討する。
与えられた計算予算に対して、非モジュラーアーキテクチャは、我々が研究しているすべてのモジュラー設計と常に同等か好適である。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:10:51 GMT)
Exploring the efficacy of a hybrid approach with modal decomposition over fully deep learning models for flow dynamics forecasting [2.9] 時系列予測の流体力学問題への応用について検討する。
目的は過去の情報のみを用いて流れのダイナミクスを予測することである。
我々は、学習に大量のデータを必要としないディープラーニングに基づくモデルに焦点をあてる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:43:02 GMT)
A Method of Moments Embedding Constraint and its Application to Semi-Supervised Learning [2.8] 線形+ソフトマックス最終層を持つ非ネイティブなディープラーニングモデルには問題がある。
ラテント空間は条件付き確率$p(Y|X)$だけを予測するが、完全関節分布$p(Y,X)$は予測しない。
このことは、幻覚、不明瞭なバイアス、大規模なデータセットへの依存など、多くの問題に影響を及ぼす過信モデルをさらに悪化させる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:41:32 GMT)
Deep Learning for Low-Latency, Quantum-Ready RF Sensing [2.5] 近年の研究では、無線周波数(RF)信号のソフトウェア処理を強化するためにディープラーニングを適用することが期待されている。
本稿では,RF信号分類のための量子可読機械学習手法の実装について述べる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:22:12 GMT)
Automating Customer Needs Analysis: A Comparative Study of Large Language Models in the Travel Industry [2.4] 大規模言語モデル(LLM)は、大量のテキストデータから貴重な洞察を抽出するための強力なツールとして登場した。
本研究では,TripAdvisor 投稿から旅行客のニーズを抽出するための LLM の比較分析を行った。
特にMistral 7Bは,大規模クローズドモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:28:10 GMT)
Towards Cross Domain Generalization of Hamiltonian Representation via Meta Learning [2.3] 本研究では、ハミルトン力学の分野におけるクロス領域の一般化を目標とすることで、大きな前進を試みている。
我々は,グラフニューラルネットワーク(GNN)を用いてシステムをモデル化し,メタ学習アルゴリズムを用いて,システムの分布を通じて経験を得られるようにした。
メタ訓練モデルが、異なる物理領域間で一貫した一般化されたハミルトン表現をキャプチャすることを示した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:32:28 GMT)
Maximizing Patch Coverage for Testing of Highly-Configurable Software without Exploding Build Times [2.3] Linuxカーネルメンテナは自動継続的インテグレーションテストを採用している。
現在のアプローチでは、全文のカバレッジを最大化する設定ファイルを使用するか、ランダムに生成された複数の設定ファイルを使用する。
高速な構成ファイルを自動的に修復するkrepairを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:55:46 GMT)
DF-SLAM: Neural Feature Rendering Based on Dictionary Factors Representation for High-Fidelity Dense Visual SLAM System [2.3] DF-SLAMと呼ばれる高忠実度ニューラル暗黙的視覚的局所化マッピングシステムを提案する。
本研究では,シーンの形状と外観情報を基本因子と係数因子の組み合わせとして符号化し,シーン表現に辞書因子を用いる。
また,本手法では,シーンマップのサイズに敏感であり,大規模なシーンに適している。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:19:23 GMT)
Postselection technique for optical Quantum Key Distribution with improved de Finetti reductions [2.0] 我々は,光量子鍵分布プロトコルにポストセレクション手法を厳格に適用するために,複数のステップを踏襲する。
本稿では, ポストセレクション法を厳密な数学的基礎の上に配置し, ポストセレクション法における技術的欠陥を修正した。
提案手法の適用性は,デ・フィネッティ・リダクション(デ・フィネッティ・リダクション,デ・フィネッティ・リダクション,デ・フィネッティ・リダクション)を用いて拡張する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:40:51 GMT)
A Comparative Analysis of Large Language Models for Code Documentation Generation [1.9] 本論文は, GPT-3.5, GPT-4, Bard, Llama2, Starchat などのモデルについて, 精度, 完全性, 妥当性, 可読性, 可読性, タイムテイクなどのパラメータについて検討した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:15:40 GMT)
InfoSec.pptx: A Longitudinal Study of Speakers, Topics, and Sponsors at Security Conferences in Academia and Industry [1.9] セキュリティ会議は、新たな攻撃や最先端の防衛に関する知識を共有するための重要な場所である。
この研究は、最も権威ある学術・産業会議における講演者、スポンサー、トピックを特徴づけるものである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 19:39:50 GMT)
Random Walk on Pixel Manifolds for Anomaly Segmentation of Complex Driving Scenes [1.4] 我々はRWPM(Random Walk on Pixel Manifolds)と呼ばれる新しい手法を提案する。
RWPMはランダムウォークを用いて画素間の固有の関係を明らかにし、画素埋め込みを洗練させる。
実験の結果、RWPMは既存の異常セグメンテーション法の性能を一貫して改善していることがわかった。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:16:45 GMT)
PhishGuard: A Convolutional Neural Network Based Model for Detecting Phishing URLs with Explainability Analysis [1.1] フィッシングURLの識別は、この問題に対処する最善の方法だ。
フィッシングURLの検出を自動化するために,機械学習と深層学習の手法が提案されている。
本稿では,1次元畳み込みニューラルネットワーク(CNN)を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:13:49 GMT)
An Attention-Based Deep Learning Architecture for Real-Time Monocular Visual Odometry: Applications to GPS-free Drone Navigation [1.0] 視覚計測の研究は進歩しており、GPSのないナビゲーションの問題を解決する可能性がある。
近年、ディープニューラルネットワーク(DNN)を用いた研究により、性能が向上している。
本稿では,無人機のための一眼一眼視計測モデルを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 01:22:45 GMT)
Segmentation Quality and Volumetric Accuracy in Medical Imaging [0.9] 現在の医療画像のセグメンテーションは、デファクト標準として領域ベース(Dice, F1スコア)と境界ベース(ハウスドルフ距離、表面距離)のメトリクスに依存している。
これらの指標は広く使用されているが、特にボリューム合意に関する統一的な解釈は欠如している。
本稿では,相対体積予測誤差(vpe)を用いて,セグメンテーションタスクから導出される体積予測の精度を直接評価する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:49:39 GMT)
Two-level adiabatic transition probability for small avoided crossings generated by tangential intersections [0.9] 2レベル回避交差の遷移確率の挙動は、2つのパラメータ(断熱およびエネルギーギャップパラメータ)がゼロとなる極限の下で研究される。
主な結果は、遷移確率の拡大だけでなく、いくつかの避けられた交差によって引き起こされる量子干渉も解明する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 04:41:10 GMT)
Heart Disease Detection using Quantum Computing and Partitioned Random Forest Methods [0.8] 心臓病の早期発見は、心臓死亡率と死亡率を低下させる。
近年の研究では、5キュービット以上の心臓疾患を予測するために量子コンピューティング手法が用いられている。
本研究では,クリーブランドとスタットログという2つのオープンソースデータセットを用いて量子ネットワークを適用した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:07:23 GMT)
How Platform Exchange and Safeguards Matter: The Case of Sexual Risk in Airbnb and Couchsurfing [0.8] Airbnbが交渉のあった取引所と機関の安全を規定することは、リスクを3つのメカニズムを通じて減らすと私は主張する。
相互交換と保護の欠如に焦点を当てたCouchsurfingは、オンプラットフォームとオフプラットフォームの両方で、ユーザーにとって性的なプレカリティを高めている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 17:03:26 GMT)
Implicit Multi-Spectral Transformer: An Lightweight and Effective Visible to Infrared Image Translation Model [0.7] コンピュータビジョンでは、可視光画像は低照度条件において低コントラストを示すことが多く、重要な課題である。
近年のディープラーニング,特にGAN(Generative Adversarial Networks)の展開は,可視光画像から赤外線画像への変換を促進している。
可視光画像から高忠実度赤外線画像へ効率よく変換するエンド・ツー・エンド・エンド・トランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:39:45 GMT)
On the Rashomon ratio of infinite hypothesis sets [0.5] 羅生門比は、与えられた損失より少ない分類器の比率を測定する。
大規模な羅生門比は、分類器の選択が家族のランダムな部分集合の中で最良の経験的精度を持つことを保証するが、それは一般化性を向上させる可能性が高いため、経験的損失があまり増加しないことを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 01:34:51 GMT)
Explainable machine learning to enable high-throughput electrical conductivity optimization and discovery of doped conjugated polymers [0.4] ドープポリマー材料の電気伝導度測定に伴うワークフローを高速化する機械学習(ML)手法を提案する。
分類モデルは、導電率25〜100S/cmの試料を正確に分類し、最大で100%の精度を達成する。
高導電率試料のサブセットについては, 回帰モデルを用いて導電率を予測し, 印象的なR2値 0.984 を得た。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 05:13:59 GMT)
Un análisis bibliométrico de la producción científica acerca del agrupamiento de trayectorias GPS [0.3] GPS軌道のクラスタリングアルゴリズムや手法は、科学コミュニティの一部で注目されているため、常に進化している。
本研究の目的は, バイオロメトリによる「GPS軌道」を取り巻く科学的生産の分析である。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:39:13 GMT)
Using LLMs in Software Requirements Specifications: An Empirical Evaluation [0.3] ソフトウェア要件仕様のドラフト作成におけるGPT-4とCodeLlamaの性能を評価する。
この結果から,LSMはエントリーレベルのソフトウェア技術者の出力品質と一致し,SRSを生成できることが示唆された。
LLMは、生産性を向上させるために、ソフトウェアエンジニアによって有利に使用できると結論付けています。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:37:00 GMT)
Feature graphs for interpretable unsupervised tree ensembles: centrality, interaction, and application in disease subtyping [0.2] 特徴の選択は、モデルの解釈可能性を高める上で重要な役割を担います。
決定木を集約することで得られる精度は、解釈可能性の犠牲となる。
この研究では、教師なしランダムな森林から特徴グラフを構築するための新しい手法を紹介した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:47:37 GMT)
Non-Spatial Hash Chemistry as a Minimalistic Open-Ended Evolutionary System [0.2] 本稿では,粒子の空間的近接をマルチセットの形で明示的に表現するHash Chemistryの非空間的変種を提案する。
数値シミュレーションの結果, 模擬実体の最大サイズと平均サイズは, 原モデルよりも有意に増大した。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 23:29:55 GMT)
Softmax Attention with Constant Cost per Token [0.0] スケールされたドット積とペアワイズクエリキーの類似性を定量化する代わりに、指数関数のスケールされたドット積の対数で定量化する。
我々の修正は、対応する特徴関数が無限次元である指数カーネル特徴写像に注意を向ける。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 19:03:14 GMT)
Simultaneous action of a single photon at two remote places [0.0] ピンホールの後に回折された1つの量子粒子は、原則として半球の画像スクリーン上の2つまたは複数の場所で作用を発生させることができる。
これは2つの空間的に離れた空洞からなるカスケード量子系において、それぞれキュービットに結合されると考えられている。
2つのキャビティに単一光子パルスを発生させると、2つの遠隔量子ビットが同時に励起され、続く2つの単一光子検出イベントが発生することを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:44:31 GMT)
Results about sets of desirable gamble sets [0.0] 望ましいギャンブル集合のコヒーレントな集合は、不確実性の下でのエージェントの意見と選択の選好を表現するモデルとして用いられる。
所望のギャンブル集合のコヒーレント集合は、所望のギャンブル集合のコヒーレント集合の適切なフィルタによって表現できることを示す。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 14:29:13 GMT)
ResBit: Residual Bit Vector for Categorical Values [0.0] ワンホットベクトルは次元の線形増加に悩まされ、計算とメモリの課題が引き起こされる。
分類データを密に表現する手法であるResidual Bit Vectors (ResBit)を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 10:23:27 GMT)
Relay Mining: Incentivizing Full Non-Validating Nodes Servicing All RPC Types [0.0] リレーマイニング(Relay Mining)は、クライアントからサーバへのリモートプロシージャコール(RPC)のボリュームを推定し、証明する。
デジタル署名、コミット・アンド・リベラルスキーム、Sparse Merkle Sum Tries (SMSTs)を活用して、作業の量を証明する。
分散台帳上のネイティブ暗号は、アプリケーションを制限するために使われ、過剰使用を非インセンティブ化する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:06:00 GMT)
Quantum resistant multi-signature scheme with optimal communication round: A Blockchain-based approach [0.0] 我々は、ラジムと呼ばれる格子に基づく新しいマルチシグネチャスキームを提案する。これは、公開鍵を集約し、1ラウンドの通信だけを必要とし、量子コンピュータに耐性を持つ。
ラジムでは、集合公開鍵サイズと最終署名サイズはそれぞれ標準署名の公開鍵サイズと最終署名サイズを検証することと等価であり、署名者の数とは独立である。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:05:44 GMT)
Processing HSV Colored Medical Images and Adapting Color Thresholds for Computational Image Analysis: a Practical Introduction to an open-source tool [0.0] 我々は,HSVカラーの医療画像の異なる色閾値を適応するオープンソースツールを開発した。
コード行に付随するステップバイステップの命令を提供します。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 12:29:12 GMT)
Personalized Federated Learning via Sequential Layer Expansion in Representation Learning [0.0] フェデレーション学習は、個々のクライアントデバイス上で分散トレーニングを行い、中央サーバでモデルウェイトのみを共有することによって、クライアントのプライバシを保証する。
本稿では,ディープラーニングモデル全体をより密に分割した部分に分割し,適切なスケジューリング手法を適用した表現学習に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 06:37:19 GMT)
Optimal quantum sensing of the nonlinear bosonic interactions using Fock states [0.0] バイリニア相互作用を超える個々の量子を持つプロセスは、ボゾン系を持つ量子技術にとって不可欠である。
非自明な粒子状のフォック状態を用いて、基礎的かつ実験的に利用可能な三線相互作用を検知するための、非自明だが最適戦略を導出する。
これは、閉じ込められたイオンと超伝導回路を用いたボソニック実験において、そのような非線形過程の使用に関連する非線形力学の解明されていない側面を明らかにすることができる。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 13:53:11 GMT)
MediFact at MEDIQA-M3G 2024: Medical Question Answering in Dermatology with Multimodal Learning [0.0] 本稿では,オープンエンド医療質問応答(QA)のための弱教師付き学習アプローチを提案することによって,従来の手法の限界に対処する。
本システムは,VGG16-CNN-SVMモデルを用いて,利用可能なMEDIQA-M3G画像を利用する。
この研究は、医療QA研究を前進させ、臨床意思決定支援システムへの道を切り開き、最終的に医療提供を改善する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:03:47 GMT)
MediFact at MEDIQA-CORR 2024: Why AI Needs a Human Touch [0.0] MEDIQA-CORR 2024共有タスクに提案する新しい手法を提案する。
本手法は,臨床テキストデータからコンテキスト関連情報を抽出することを強調する。
ドメインの専門知識を統合し、意味のある情報抽出を優先順位付けすることで、私たちのアプローチは、医療にAIを適用する上で、人間中心の戦略の重要性を強調します。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 20:28:38 GMT)
Intrusion Tolerance for Networked Systems through Two-Level Feedback Control [0.0] サービスレプリカを2段階最適制御問題とするシステムの侵入耐性を定式化する。
ローカルレベルではノードコントローラが侵入回復を行い、グローバルレベルではシステムコントローラが複製係数を管理する。
この定式化に基づいて、侵入耐性システムのための新しい制御アーキテクチャであるTOLERANCEを設計する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:19:24 GMT)
Enhancing Breast Cancer Diagnosis in Mammography: Evaluation and Integration of Convolutional Neural Networks and Explainable AI [0.0] 本研究では,畳み込みニューラルネットワーク(CNN)と説明可能な人工知能(XAI)を組み合わせて乳がんの診断を高度化するための統合フレームワークを提案する。
この方法論は、データセットの制限に対処するために、精巧なデータ前処理パイプラインと高度なデータ拡張技術を含んでいる。
本研究の焦点は,モデル予測の解釈におけるXAIの有効性を評価することである。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 08:24:37 GMT)
Disentangling transitions in topological order induced by boundary decoherence [0.0] 本稿では,二分割境界上でのデコヒーレンスを考慮したトポロジカル秩序の絡み合い構造について検討する。
境界デコヒーレンスにより, 混合状態の長距離絡み合いが破壊され, 不安定な遷移が引き起こされる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 00:15:54 GMT)
Detection of Conspiracy Theories Beyond Keyword Bias in German-Language Telegram Using Large Language Models [0.0] この研究は、ドイツのテレグラムメッセージにおける陰謀論を検出するという課題に対処する。
BERT型モデルを用いた教師付き微調整手法とプロンプトベース手法の比較を行った。
教師付き微調整では、正のクラスに対して$sim! 0.8$のF1スコアを報告します。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 19:17:31 GMT)
Denoising: from classical methods to deep CNNs [0.0] フーリエ解析やウェーブレットベースなどの古典的手法を概観し、ニューラルネットワークの出現まで直面した課題を強調した。
本稿では,確率密度の真の学習の前提条件について論じ,数学的研究から普遍構造の含意にまで及ぶ洞察を提供する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 09:29:38 GMT)
Data Selection: A General Principle for Building Small Interpretable Models [0.0] 精度の高い小型モデルを構築するための効果的で一般的な戦略を示す実証的な証拠を提示する。
本稿では,クラスター説明木の構築,(2)プロトタイプに基づく分類,(3)ランダムフォレストを用いた分類の課題に適用する。
ランダムフォレストを含む最終作業では、モデルサイズが木の数と最大深さの2つ以上の要素からなる場合であっても、この戦略が有効であることが示されている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 07:42:45 GMT)
DTization: A New Method for Supervised Feature Scaling [0.0] フィーチャースケーリングは、機械学習アルゴリズムのパフォーマンスを改善するデータ前処理技術の1つである。
我々は、決定木とロバストなスケーラを用いて、教師付き機能スケーリングを行うDTizationという新しい機能スケーリング手法を提示した。
その結果,従来の機能スケーリング手法と比較して,優れたパフォーマンス向上が得られた。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:25:03 GMT)
Control randomisation approach for policy gradient and application to reinforcement learning in optimal switching [0.0] 本稿では,連続時間強化学習に適した政策勾配法に関する総合的な枠組みを提案する。
これは制御問題とランダム化問題の間の接続に基づいており、マルコフ的連続時間制御問題の様々なクラスにまたがる応用を可能にする。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:41:06 GMT)
Constrained Hamiltonian dynamics for electrons in magnetic field and additional forces besides the Lorentz force acting on electrons [0.0] 量子力学から生じる制約や条件を含む磁場中の電子に作用する力を考察する。
ローレンツ力以外の重要な力として、電子速度場運動エネルギーの勾配、化学ポテンシャルの勾配、位相的に保護されたループ電流を生成する力などが存在することが示されている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 22:06:45 GMT)
CBMAP: Clustering-based manifold approximation and projection for dimensionality reduction [0.0] データ次元を減少させるために次元性低減法が用いられる。
本研究は,次元削減のためのクラスタリングに基づくアプローチであるCBMAPを紹介する。
CBMAPは、大域的構造と局所的構造の両方を保存することを目的としており、低次元空間のクラスターが高次元空間のクラスタと密接に類似していることを保証する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 15:44:21 GMT)
Adversarial Examples: Generation Proposal in the Context of Facial Recognition Systems [0.0] 本稿では,攻撃者の視点から新たな手法を導入することで,顔認証システムが敵の例に提示する脆弱性について検討する。
我々は、最先端のシステムに対して、ドッジ攻撃と偽装攻撃の両方に適した敵の例を作成する可能性を分析することを目的としている。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 02:35:15 GMT)
Advancing Healthcare Automation: Multi-Agent Systems for Medical Necessity Justification [0.0] 本稿では,Swarm-Structured Multi-Agent Systems (MAS) の医療応用について検討する。
我々は、これらのエージェントに対する様々なプロンプト戦略の影響を体系的に研究し、異なる大規模言語モデル(LLM)をベンチマークする。
これらのエージェントがどのように説明可能性を提供し、システム内の信頼と透明性を高めるかを検討する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 18:40:05 GMT)
A Formal Specification of a Data Model for Malaria Surveillance in the Developing World [0.0] 世界は、マラリアなどの長寿疾患の診断をデジタル化し、より効率的な治療と管理を行うことが不可欠であると信じている。
本稿では,デジタルデータ収集システムのアーキテクチャとマラリア認識のためのデータ収集方法を提案する。
論文参考訳(メタデータ) (Sat, 27 Apr 2024 10:22:28 GMT)