Ask Questions with Double Hints: Visual Question Generation with Answer-awareness and Region-reference [107.5] 本稿では,応答認識と領域参照を用いた視覚的質問生成のための新しい学習パラダイムを提案する。
我々は、追加の人間のアノテーションを導入することなく、視覚的ヒントを自己学習する簡単な手法を開発した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:07:32 GMT)
Intent3D: 3D Object Detection in RGB-D Scans Based on Human Intention [86.4] RGB-Dを用いた3次元物体検出における新たな課題として,「背中を支えたいもの」などの人間の意図に基づく3次元対象物検出がある。
ScanNetデータセットの1,042のシーンから209のきめ細かいクラスに関連付けられた44,990の意図的テキストからなる新しいIntent3Dデータセットを紹介した。
我々はまた、この意図に基づく検出問題に対処するために設計された、我々のユニークなアプローチであるIntentNetを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:23:45 GMT)
Solving for X and Beyond: Can Large Language Models Solve Complex Math Problems with More-Than-Two Unknowns? [57.8] 大規模言語モデル (LLM) は数学問題の解法において顕著な性能を示した。
本稿では,複数の未知の問題を組み込むことで,これらの制約に対処する新しいベンチマークであるBeyondXを紹介する。
BeyondXに関する実証的な研究によると、数学のタスクに特化して調整された既存のLLMの性能は、未知の数が増えるにつれて著しく低下する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 17:01:04 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9] 本研究は、応答スタイルをプレゼンテーションスタイルとコンポジションスタイルに分解する。
SCAR(Style Consistency-Aware Response Ranking)を紹介する。
SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:29:54 GMT)
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.1] ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:18:37 GMT)
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.5] 本研究では, 吸収拡散の具体的なスコアを, クリーンデータの条件付き確率として表すことができることを示す。
時間に依存しない条件付き確率を特徴付ける時間条件のない専用拡散モデルを提案する。
5つのゼロショット言語モデルベンチマークにおける拡散モデル間のSOTA性能を実現する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:40:08 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2] 分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:58:14 GMT)
Distilling Reasoning Ability from Large Language Models with Adaptive Thinking [54.0] 思考の微調整(cot-finetuning)の連鎖は、小さな言語モデル(SLM)を特定のタスクに対するパフォーマンス向上の推論能力で実現することを目的としている。
既存のコトファインタニング法の多くは事前に考えられたメカニズムを採用しており、SLMは答えを出す前に理性を生成することができる。
このメカニズムにより、SLMは複雑な質問を分析して考えることができるが、答えの正しさは論理的に小さな誤りに非常に敏感になる。
理性よりも先に回答を生成するための頑健な後思考機構を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 17:41:04 GMT)
Population fluctuation mechanism of the super-thermal photon statistic of LEDs with collective effects [49.2] エミッター数の変動は、線形状態にある小さなLEDの超熱光子統計に繋がる。
2階相関関数 g に対する簡単な解析式が見つかる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:01:10 GMT)
A Joint Cross-Attention Model for Audio-Visual Fusion in Dimensional Emotion Recognition [46.4] ビデオから抽出した顔と声の融合に基づく次元的感情認識に焦点を当てた。
本稿では, 相補的関係に依拠し, 有意な特徴を抽出する連係関係モデルを提案する。
提案したA-V融合モデルにより,最先端の手法より優れたコスト効率のソリューションが提供される。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:49:19 GMT)
Do Vision and Language Models Share Concepts? A Vector Space Alignment Study [45.9] 「大規模事前訓練言語モデル(LM)は、発話を世界と結びつける能力が欠如していると言われている。」
LMの4つのファミリと3つの視覚モデルアーキテクチャを比較検討した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:27:55 GMT)
PRANCE: Joint Token-Optimization and Structural Channel-Pruning for Adaptive ViT Inference [44.8] PRANCEはVision Transformer圧縮フレームワークで、アクティベートされたチャネルを共同で最適化し、入力の特性に基づいてトークンを削減する。
本稿では,ViTの推論過程を逐次決定プロセスとしてモデル化する,新しい「結果と結果」学習機構を提案する。
我々のフレームワークは、プルーニング、マージング、プルーニングマージングといった様々なトークン最適化手法と互換性があることが示されている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:04:27 GMT)
Dissolving Is Amplifying: Towards Fine-Grained Anomaly Detection [43.0] DIAは医療画像の微細な異常検出フレームワークである。
生成拡散モデルを用いて拡散を専用特徴認識デノイザとして利用する。
第2に、医用画像の意味的に意味のある表現を学習するために、コントラスト学習に基づくテキスト増幅フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 23:33:31 GMT)
SAM-Med3D-MoE: Towards a Non-Forgetting Segment Anything Model via Mixture of Experts for 3D Medical Image Segmentation [37.0] Supervised Finetuning (SFT) は、タスク固有の下流タスクに基礎モデルを適用する効果的な方法として機能する。
本稿では,タスク固有の微調整モデルと基礎モデルとをシームレスに統合する新しいフレームワークSAM-Med3D-MoEを提案する。
実験では, SAM-Med3D-MoEの有効性を実証し, 平均Dice性能は15種類のクラスで53から56.4に向上した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 03:03:45 GMT)
Granular Privacy Control for Geolocation with Vision Language Models [36.3] GPTGeoChatと呼ばれる新しいベンチマークを開発し、ユーザとの位置情報対話を適度に行うビジョン言語モデルの能力をテストする。
我々は,室内アノテータとGPT-4v間の1,000の画像位置情報の会話を収集する。
位置情報が多すぎるかどうかを判断することで,GPT-4vの位置情報会話を適度に行う様々なVLMの能力を評価する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 04:06:55 GMT)
RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models [35.6] 本稿では,検索した文脈の選択を通じて事実性リスクを制御する戦略を提案する。
3つの医療用VQAデータセットに対するRULEの有効性を実証し、実際の精度で平均20.8%の改善を実現した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 16:45:07 GMT)
BlessemFlood21: Advancing Flood Analysis with a High-Resolution Georeferenced Dataset for Humanitarian Aid Support [34.9] 我々はBlessemFlood21データセットを導入し、効率的な洪水検知ツールの研究を刺激する。
この画像は、2021年のエルフトシュタット=ブレセム洪水で取得され、高解像度でジオレファレンスなRGB-NIR画像で構成された。
得られたRGBデータセットでは、画像に詳細な水面を補足し、半教師付きヒト・イン・ザ・ループ技術を用いて取得する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:58:43 GMT)
OmChat: A Recipe to Train Multimodal Language Models with Strong Long Context and Video Understanding [34.2] OmChatは、長いコンテキストとビデオ理解タスクをうまく扱うように設計されたモデルである。
ダイナミックな視覚符号化プロセスを使用して、様々な解像度の画像を効果的に処理し、さまざまな画質の細部をキャプチャする。
OmChatは、最大512Kのコンテキスト長をサポートすることで、複数の画像やビデオを含むタスクにおいて、有望なパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:16:10 GMT)
Visual Mamba: A Survey and New Outlooks [33.9] 最近の選択的構造化状態空間モデルであるMambaは、ロングシーケンスモデリングにおいて優れている。
2024年1月以降、マンバは多様なコンピュータビジョンタスクに積極的に適用されてきた。
本稿では,200以上の論文を分析し,マンバの視覚的アプローチを概観する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:34:04 GMT)
Lifelike Agility and Play in Quadrupedal Robots using Reinforcement Learning and Generative Pre-trained Models [28.5] そこで本研究では,ロボットに事前学習可能で,再利用可能で,拡張可能な,原始的,環境的,戦略的レベルの知識を構築するための階層的枠組みを提案する。
原始的なモジュールは、動物の動きデータから知識を要約し、言語と画像理解における大きな事前学習モデルに触発されて、ロボットが本物の動物のように振る舞うことを刺激する運動制御信号を生成するための深い生成モデルを導入する。
トレーニングされた階層型コントローラを、社内で開発された四足歩行ロボットMAXロボットに適用し、動物を模倣し、複雑な障害物を横切り、設計上の挑戦的なマルチエージェント・チェイスタグゲームで遊ぶ。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:59:12 GMT)
Releasing Malevolence from Benevolence: The Menace of Benign Data on Machine Unlearning [28.4] 大量の実データや合成データに基づいてトレーニングされた機械学習モデルは、様々な領域で優れた予測性能を達成する。
プライバシの懸念に対処するため、モデルから特定のデータサンプルを削除するために、機械学習が提案されている。
本研究では,データ配信情報を少量の良質なデータ集合に抽出するために,Unlearning Usability Attackを導入する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:42:28 GMT)
MoE-LLaVA: Mixture of Experts for Large Vision-Language Models [27.9] 本稿では,LVLMのための簡易かつ効果的なトレーニング戦略であるMoE-Tuningを提案する。
MoE-LLaVAはMoEベースのスパースLVLMアーキテクチャであり、ルータを通じてトップkの専門家のみをユニークに活性化する。
様々な視覚的理解と物体幻覚のベンチマークにおいて,MoE-LLaVAの顕著な性能を示す実験を行った。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 13:46:02 GMT)
CBM: Curriculum by Masking [27.3] Curriculum by Masking (CBM)は、物体の認識と検出のための最先端のカリキュラム学習戦略である。
CBMはパッチ(トークン)マスキングによって、簡単にハードなトレーニングスケジュールを作成する。
我々はCBMとカリキュラムベースの教育制度を比較した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 21:35:18 GMT)
Communication and Control Co-Design in 6G: Sequential Decision-Making with LLMs [23.2] 本稿では,6世代無線ネットワークにおける制御システムについて考察する。
マルコフ決定過程として,コミュニケーションの逐次的共同設計決定と離散時間地平線制御を定式化する。
提案するフレームワークは,大規模言語モデルを強化学習の要素に統合する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:49:46 GMT)
Pix2Code: Learning to Compose Neural Visual Concepts as Programs [23.1] プログラム合成を視覚的リレーショナル推論に拡張するフレームワークPix2Codeを提案する。
Pix2Codeの表現は人間の解釈可能であり、性能向上のために容易に修正可能であることを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:07:57 GMT)
MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge Aggregation [22.6] 大規模言語モデル(LLM)は、特に医学分野で価値のある自然言語理解と生成の進歩を示す。
従来のアプローチでは後者のタスクを無視するか、少数のタスクに集中していたため、一般化が失われる。
このパイプラインは、ナレッジアグリゲータとノイズアグリゲータを使用して、最初の段階で多様な知識を符号化し、有害情報をフィルタリングする。
MedCare (1.8B, 7B, 14B) の様々なモデルサイズは、いずれも類似のモデルサイズを持つ既存のモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:47:37 GMT)
Personalized Federated Domain-Incremental Learning based on Adaptive Knowledge Matching [22.2] 適応型知識マッチングに基づくパーソナライズFDILアプローチ(pFedDIL)を提案する。
pFedDILでは、各クライアントが適切な漸進的なタスク学習戦略を利用できる。
pFedDILは、すべてのタスクの平均精度において、最先端のメソッドよりも14.35%高い性能を示すことを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:57:22 GMT)
Automatically Analyzing Performance Issues in Android Apps: How Far Are We? [21.5] パフォーマンスは、あらゆるモバイルアプリケーションのスムーズな操作を保証する上で重要な役割を果たす。
現在のツールは機能に制限があり、パフォーマンス上の問題のうち17.50%しかカバーしていない。
既存のデータセットは問題の27.50%しか含んでおらず、サイズは非常に限られている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:43:40 GMT)
Towards Auto-Building of Embedded FPGA-based Soft Sensors for Wastewater Flow Estimation [19.8] リソース制限型IoTデバイス上でのDeep Learning (DL)ベースのソフトセンサによるフロー推定は,信頼性とエネルギー効率の面で有望であることを示す。
本研究は, プロトタイプIoTデバイスを用いた排水流量推定のためのエンド・ツー・エンドの自動解法を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:10:27 GMT)
An Automated Approach to Collecting and Labeling Time Series Data for Event Detection Using Elastic Node Hardware [18.2] 本稿では,センサデータをIoTデバイス上で直接ラベル付けする新しい組込みシステムを提案する。
本稿では,各種センサデータのキャプチャとラベル付けを効率化する,特殊なラベル付けセンサを備えたハードウェアとソフトウェアの統合ソリューションを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:19:16 GMT)
SurgicalGaussian: Deformable 3D Gaussians for High-Fidelity Surgical Scene Reconstruction [17.1] 内視鏡的ビデオにおける変形性組織の動的再構成は、ロボット支援手術の鍵となる技術である。
NeRFは、シーン内のオブジェクトの複雑な詳細をキャプチャするのに苦労します。
我々のネットワークは、レンダリング品質、レンダリング速度、GPU使用率など、多くの面で既存の手法よりも優れています。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:31:30 GMT)
DDOS: The Drone Depth and Obstacle Segmentation Dataset [16.9] Drone Depth and Obstacle(DDOS)データセットは、セマンティックセグメンテーションと深さ推定のための包括的なトレーニングサンプルを提供するために作成された。
具体的には、細い構造物の識別を強化するために設計されたDDOSによって、ドローンは幅広い気象条件をナビゲートすることができる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 22:07:10 GMT)
Algorithmic Language Models with Neurally Compiled Libraries [16.3] 大規模言語モデルには真のアルゴリズム能力がない。
本稿では,基本的な操作と高度な微分可能プログラムのライブラリによるLLMの拡張を提案する。
微分可能なコンピュータを用いたLLaMA3の拡張可能性について検討する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 00:27:05 GMT)
WindowMixer: Intra-Window and Inter-Window Modeling for Time Series Forecasting [15.6] 時系列予測は、経済予測、天気予報、交通流分析、公衆衛生監視といった分野において重要である。
従来の手法はポイントツーポイントの関係をモデル化し、複雑な時間パターンをキャプチャする能力を制限する。
全MLPフレームワーク上に構築された WindowMixer モデルを紹介する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:14:20 GMT)
Robust Skin Color Driven Privacy Preserving Face Recognition via Function Secret Sharing [15.2] 顔画像からの純肌色パッチを付加情報として活用し、補助肌色特徴抽出器と顔認識モデルを訓練する。
我々のソリューションは、ブラックボックス攻撃およびGANに基づく画像復元に対して堅牢である。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 10:51:35 GMT)
A Study of Test-time Contrastive Concepts for Open-world, Open-vocabulary Semantic Segmentation [14.9] 最近のVLMは、大量の画像とテキストのペアで事前訓練されており、オープン語彙のセマンティックセマンティックセグメンテーションへの道を開いた。
ここでは、テキストのプロンプトとその他何も考慮し、単一の概念をセグメント化するより難しいシナリオを考えます。
一般的な"背景"テキストとは対照的に,クエリ固有のテストタイムのコントラッシブテキストの概念を生成するさまざまな方法について検討する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:18:43 GMT)
AI Safety in Generative AI Large Language Models: A Survey [14.7] 生成的AI能力を示す大規模言語モデル(LLM)は、採用とイノベーションの加速に直面している。
生成AI(GAI)は、これらのモデルに関連するリスクと安全性に関する懸念を必然的に高める。
本稿では,コンピュータ科学者の視点からAI安全研究の最新の動向について報告する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:00:18 GMT)
Towards Context-Aware Emotion Recognition Debiasing from a Causal Demystification Perspective via De-confounded Training [14.5] 文脈認識感情認識(CAER)は、対象者の感情を認識するための貴重な意味的手がかりを提供する。
現在のアプローチは、コンテキストから知覚的に重要な表現を抽出する洗練された構造を設計することに集中している。
共同設立者を非難するためのCCIM(Contextual Causal Intervention Module)を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 05:29:02 GMT)
High-Quality and Full Bandwidth Seismic Signal Synthesis using Operational GANs [13.9] そこで我々は,下層センサから取得した信号を変換することで,新しい,高品質,全帯域地震信号合成を提案する。
我々は,新しい損失関数を持つOp-GAN (Operational Generative Adversarial Networks) を用いた。
提案手法は,Simulated Ground Motion (SimGM) ベンチマークデータセット上で広範囲に評価されている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:07:23 GMT)
A Survey of Datasets for Information Diffusion Tasks [13.5] 情報拡散タスクとデータセットの系統分類を「5Wモデル」フレームワークに基づいて調査する。
まず、情報拡散タスクを定義とデータセット分析により10のサブタスクに分類する。
また、情報拡散タスクの公開データセットリポジトリと利用可能なリンクを収集し、比較する。
論文参考訳(メタデータ) (Sat, 06 Jul 2024 19:38:41 GMT)
Lucy: Think and Reason to Solve Text-to-SQL [12.5] 大規模言語モデル(LLM)は、自然言語でデータベースをクエリするユーザを支援するために大きな進歩を遂げた。
LLMは、多くの標準ベンチマークで最先端の結果を提供するが、大規模エンタープライズデータベースに適用した場合、その性能は著しく低下する。
本稿では,質問理解におけるLLMのパワーと,複雑なデータベース制約を扱う自動推論手法を組み合わせた新しい解を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 18:56:42 GMT)
Facial Identity Anonymization via Intrinsic and Extrinsic Attention Distraction [12.1] 本研究は,本質的および外生的アイデンティティの注意をそらすことによって,新たな顔の匿名化手法を提案する。
当社のアプローチでは,顔の外観や形状を柔軟かつ直感的に操作することで,多様な結果が得られる。
ユーザに対して、パーソナライズされた匿名化の実行を指示するためにも使用できる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:38:33 GMT)
ExioML: Eco-economic dataset for Machine Learning in Global Sectoral Sustainability [11.9] 本稿では,サステナビリティ分析用に設計された最初の機械学習ベンチマークデータセットであるExioMLを紹介する。
セクターサステナビリティを評価し,データセットのユーザビリティを実証するために,温室効果ガスのレグレッションタスクを実施した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:25:10 GMT)
Consistency and Discrepancy-Based Contrastive Tripartite Graph Learning for Recommendations [11.8] Tripartiteのグラフベースのレコメンダシステムは、ユーザグループやアイテムバンドルといったユニークな組み合わせを推奨することで、従来のモデルから切り離される。
本稿では,三部グラフに基づく推薦のための一貫性と離散性に基づくグラフコントラスト学習手法を提案する。
論文参考訳(メタデータ) (Sat, 06 Jul 2024 16:22:23 GMT)
Balance of Number of Embedding and their Dimensions in Vector Quantization [11.6] 本研究では,Vector Quantized Variational Autoencoder (VQ-VAE)アーキテクチャにおけるコードブックサイズと埋め込み寸法のバランスについて検討した。
本稿では,Gumbel-Softmax機構を基盤とした適応的動的量子化手法を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 03:07:31 GMT)
Investigating Cultural Alignment of Large Language Models [10.7] LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:23:56 GMT)
Beyond the Federation: Topology-aware Federated Learning for Generalization to Unseen Clients [10.4] フェデレートラーニングは、分散センシティブなデータに取り組むために広く利用されている。
Topology-Aware Federated Learning (TFL)は、オフ・オブ・フェデレーション(OOF)データに対して堅牢なモデルをトレーニングする。
クライアントトポロジ学習(Client Topology Learning)とクライアントトポロジ学習(Learning on Client Topology)という2つの重要なモジュールからなるTFLの新しい最適化問題を定式化する。
様々な実世界のデータセットに対する実証的な評価は、TFLの優れたOOF堅牢性とスケーラビリティを検証する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 03:57:05 GMT)
FedTSA: A Cluster-based Two-Stage Aggregation Method for Model-heterogeneous Federated Learning [10.3] FedTSAは、フェデレートラーニング(FL)におけるシステム不均一性に適したクラスタベースの2段階アグリゲーション手法である
我々は,FedTSAがベースラインを上回り,モデル性能に影響を及ぼす様々な要因を探索することを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:59:55 GMT)
SCSA: Exploring the Synergistic Effects Between Spatial and Channel Attention [10.2] 我々は,新しい空間・チャネル同期型アテンションモジュール (SCSA) を提案する。
SCSAは,共有型マルチセマンティック空間注意 (SMSA) とプログレッシブチャネルワイド自己注意 (PCSA) の2つの部分から構成される。
以上の結果から,提案したSCSAは現状の注目に勝るだけでなく,様々なタスクシナリオにまたがる一般化能力の向上も示している。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 16:34:25 GMT)
T-CorresNet: Template Guided 3D Point Cloud Completion with Correspondence Pooling Query Generation Strategy [9.5] ポイントクラウドは、自律運転や製造業など、様々な実用用途で一般的に使用されている。
本稿では,球面テンプレートを用いた点雲補完手法を提案する。
実験の結果、T-CorresNetはいくつかのベンチマークで最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:00:44 GMT)
Combining Neuroevolution with the Search for Novelty to Improve the Generation of Test Inputs for Games [9.5] ゲームが従来の自動ホワイトボックステストジェネレータに挑戦するとき、Neatestは、ゲームをすることでソースコードを動作させるニューラルネットワークからなるテストスイートを生成する。
本研究は,探索中の新しい行動を促進することで,フィットネスランドスケープの課題に対処できるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:36:44 GMT)
Is it safe to cross? Interpretable Risk Assessment with GPT-4V for Safety-Aware Street Crossing [8.5] 本稿では,大規模なマルチモーダルモデル(LMM)を活用し,複雑な交差点シーンを解釈する革新的な手法を提案する。
安全スコアとシーン記述を自然言語で生成することにより,視覚障害者の安全意思決定を支援する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:36:23 GMT)
Data Poisoning Attacks in Intelligent Transportation Systems: A Survey [8.3] 本稿では、ITSに対するデータ中毒攻撃モデルに焦点を当てる。
我々は、このような攻撃のステージングを可能にする中毒攻撃やアプリケーションシナリオに脆弱な主要なITSデータソースを特定します。
我々の研究は、ITSアプリケーションに対するデータ中毒攻撃の脅威をよりよく理解するためのガイドラインとして機能し、また、信頼に値するITSの今後の発展を展望する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 01:02:22 GMT)
A Joint Approach to Local Updating and Gradient Compression for Efficient Asynchronous Federated Learning [8.1] 局所的な更新と勾配圧縮を相乗化する新しい手法を提案する。
画像分類と音声認識の実験により、FedLuckは通信消費を56%削減し、訓練時間は平均55%削減した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 16:19:06 GMT)
A PRISMA-Driven Bibliometric Analysis of the Scientific Literature on Assurance Case Patterns [7.9] 保証ケースはシステム障害を防ぐために使用できる。
それらは構造化された議論であり、様々な安全クリティカルなシステムの要求を議論し、中継することができる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 05:00:49 GMT)
Visual representations in the human brain are aligned with large language models [7.8] 大規模言語モデル(LLM)は,脳が自然界から抽出した複雑な視覚情報をモデル化するのに有用であることを示す。
次に、画像入力をLLM表現に変換するために、ディープニューラルネットワークモデルを訓練する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 05:26:33 GMT)
Rethinking the Effectiveness of Graph Classification Datasets in Benchmarks for Assessing GNNs [7.4] 本稿では,単純な手法とGNN間の性能差を調べるための,公正なベンチマークフレームワークに基づく経験的プロトコルを提案する。
また,データセットの複雑性とモデル性能を両立させることにより,データセットの有効性を定量化する新しい指標を提案する。
我々の発見は、ベンチマークデータセットの現在の理解に光を当て、新しいプラットフォームは、グラフ分類ベンチマークの将来的な進化を後押しする可能性がある。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:33:23 GMT)
Idiographic Personality Gaussian Process for Psychological Assessment [7.4] 本稿では,長期間にわたる議論に対処するため,ガウス過程のコリージョン化モデルに基づく新しい測定フレームワークを開発する。
本稿では,個体群間の共有形質構造と,個体群に対する「イディオグラフィー」偏差を両立する中間モデルであるIPGP(idiographic personality Gaussian process)の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 06:09:04 GMT)
Harnessing the Power of LLMs: Automating Unit Test Generation for High-Performance Computing [7.3] ユニットテストは、品質を保証するために、ソフトウェア工学において不可欠です。
並列処理や高性能計算ソフトウェア、特に科学応用では広く使われていない。
本稿では,このようなソフトウェアを対象としたユニットテストの自動生成手法を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 22:45:55 GMT)
Directly Estimating Mixed-State Entanglement with Bell Measurement Assistance [7.3] 絡み合いは量子物理学と情報処理において基本的な役割を果たす。
我々は,数ショットシナリオにおける混合状態絡み合いの非バイアス推定器を開発し,フォトニックシステムにおけるランダムなユニタリ進化を用いて直接推定する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 05:38:46 GMT)
Dy-mer: An Explainable DNA Sequence Representation Scheme using Sparse Recovery [6.7] textbfDy-merはスパースリカバリに基づく説明可能で堅牢な表現スキームである。
DNAプロモーターの分類における最先端のパフォーマンスを達成し、textbf13%の精度向上をもたらす。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:08:31 GMT)
A Principled Framework for Evaluating on Typologically Diverse Languages [6.7] 本稿では,多種多様言語を選択するための言語サンプリングフレームワークを提案する。
我々の体系的手法は、NLPの従来の方法よりも、型論的に多様な言語選択を一貫して取り出すことがわかった。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:31:02 GMT)
Vortex under Ripplet: An Empirical Study of RAG-enabled Applications [6.6] 検索拡張生成(RAG)によって強化された大規模言語モデル(LLM)は、様々なアプリケーションシナリオにおいて効果的なソリューションを提供する。
RAG強化LPMを組み込んだ100のオープンソースアプリケーションとその問題レポートを手作業で検討した。
アプリケーションの98%以上には、ソフトウェア機能、効率、セキュリティを害する複数の統合欠陥が含まれていることが分かりました。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 17:25:11 GMT)
BadCLM: Backdoor Attack in Clinical Language Models for Electronic Health Records [6.5] 革新的注意に基づくバックドア攻撃手法BadCLM(Bad Clinical Language Models)について紹介する。
このテクニックは、モデル内にバックドアをこっそり埋め込んで、事前に定義されたトリガーが入力に存在しているときに、正確に機能しながら誤った予測を発生させる。
我々は,MIMIC IIIデータセットを用いた院内死亡予測タスクを通じてBadCLMの有効性を実証し,モデル整合性を損なう可能性を示した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 23:56:43 GMT)
Cross-Lingual Word Alignment for ASEAN Languages with Contrastive Learning [5.5] 言語間単語アライメントは、自然言語処理タスクにおいて重要な役割を果たす。
近年,BiLSTMを用いたエンコーダデコーダモデルを提案する。
本稿では,BiLSTMに基づくエンコーダデコーダフレームワークにコントラスト学習を取り入れることを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 11:56:41 GMT)
The Solution for Language-Enhanced Image New Category Discovery [5.5] 本稿では,CLIPのトレーニングプロセスの反転とPseudo Visual Promptsの概念の導入を提案する。
これらのプロンプトは各対象カテゴリに対して行われ、大規模で低コストな文データに基づいて事前訓練される。
次に、コントラスト学習を用いて、記憶された視覚情報をテキストラベルに転送し、その視覚表現能力を高める。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:09:29 GMT)
Tackling Structural Hallucination in Image Translation with Local Diffusion [5.1] 本稿では,複数の局所拡散プロセスによる幻覚を緩和する学習自由拡散フレームワークを提案する。
本手法は,実世界の医療・自然画像データセットの40%と25%の誤診を減らし,ベースラインモデルに対する幻覚を定量的かつ質的に緩和する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 23:15:17 GMT)
Applicability of Large Language Models and Generative Models for Legal Case Judgement Summarization [5.1] 近年,抽象的な要約モデルやLarge Language Model (LLM) などの生成モデルが広く普及している。
本稿では,判例判断要約におけるそのようなモデルの適用性について検討する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 04:49:40 GMT)
Understanding Political Communication and Political Communicators on Twitch [5.0] 本研究は3つの主要な疑問に対処することでTwitchの政治を探求する。
政治ストリーマーを特定するために、Twitch APIを活用し、機械学習のテクニックを監督し、574の政治ストリーマーを特定しました。
「政治ストリームの内容分析にトピックモデリングを用い、政治トピックの幅広いカテゴリと文脈固有の表紙を含むコミュニケーションのユニークなパターンを明らかにした。」
この研究は、新しいソーシャルメディア技術が政治コミュニケーションにどのように影響するか、特に若年層の間での理解に寄与する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 21:10:24 GMT)
Enhance the Robustness of Text-Centric Multimodal Alignments [5.0] 本研究では、欠落したエントリ、ノイズ、欠落したモダリティの存在下でのマルチモーダル表現の品質とロバスト性を評価する。
本稿では,従来の手法に比べて頑健性に優れたテキスト中心型手法を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 10:12:29 GMT)
Code Less, Align More: Efficient LLM Fine-tuning for Code Generation with Data Pruning [5.0] 各種クラスタリングとプルーニングのメトリクスを統合して、生成されたコードの正確性や機能を損なうことなく、トレーニングデータを選択的に削減する手法を提案する。
実験により,これらのプルーニング戦略は,必要な計算資源を削減するだけでなく,全体的な品質コード生成を向上することが示された。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 10:30:43 GMT)
Privacy or Transparency? Negotiated Smartphone Access as a Signifier of Trust in Romantic Relationships [5.0] 個人がスマートフォンアクセスをロマンチックなパートナーと共有することについて、関係性への信頼の関数としてどう考えるかを検討する。
ロマンチックな文脈で望ましいスマートフォンアクセスのレベルについてはほとんどコンセンサスがないことが分かっています。
私たちは、個人がこれらの境界を越えて、パートナーのプライバシーを侵害し、信頼を裏切ることに気付きました。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 00:52:34 GMT)
Synthetic Data Aided Federated Learning Using Foundation Models [4.7] ファウンデーションモデル(DPSDA-FL)を用いたFederated Learningを支援する微分プライベートデータを提案する。
実験の結果,DPSDA-FLは,非IID問題のあるFLにおいて,クラスリコールとクラス分類精度を最大26%, 9%向上できることがわかった。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 20:31:43 GMT)
Sparse identification of quasipotentials via a combined data-driven method [4.6] 我々は、ニューラルネットワークとスパース回帰アルゴリズムという2つのデータ駆動手法を組み合わせて機械学習を活用し、擬ポテンシャル関数の記号表現を得る。
提案手法は, 未知の正準ポテンシャルモデルと, ナノメカニカル共振器のダイナミックスに対して, 擬似準ポテンシャル方程式を求めるものである。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 11:27:52 GMT)
Modified Bat Algorithm: A Newly Proposed Approach for Solving Complex and Real-World Problems [4.3] Bat Algorithm (BA) は、複雑な問題空間を効率的に探索し、準最適解を見つけるために設計されたメタヒューリスティック検索アルゴリズムである。
本稿では,修正バットアルゴリズム (MBA) を,元BAで観測された局所最適限界に対処するための拡張として提案する。
MBAは、現在の最適解の周波数と速度を取り入れ、最適解への収束速度を向上し、局所的最適進入を防止する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:25:07 GMT)
The Solution for the 5th GCAIAC Zero-shot Referring Expression Comprehension Challenge [3.9] 本稿では,ゼロショット参照表現理解タスクの解法を提案する。
提案手法は,Aリーダーボードで84.825,Bリーダーボードで71.460,第1位を確保した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:31:33 GMT)
Fuzzy Recurrent Stochastic Configuration Networks for Industrial Data Analytics [3.9] 本稿では,ファジィリカレント構成ネットワーク(F-RSCN)と呼ばれる新しいニューロファジィモデルを提案する。
提案したF-RSCNは,複数の貯留層によって構成され,各貯留層は高木・スゲノ・カン(TSK)ファジィ則に関連付けられている。
TSKファジィ推論システムをRCCNに統合することにより、F-RSCNは強力なファジィ推論能力を有し、学習と一般化の両面での音響性能を実現することができる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 01:40:31 GMT)
The Role of Depth, Width, and Tree Size in Expressiveness of Deep Forest [3.9] 本稿では,多層林を用いた深層林アルゴリズムを提案する。
citetzhou 2019deepはさらに、多層森林を用いた深い森林アルゴリズムを提案し、様々なタスクにおいてランダム森林よりも優れている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:32:54 GMT)
Biomanufacturing Harvest Optimization with Small Data [3.8] 発酵過程におけるタンパク質の蓄積と不純物濃度を特徴付けるモデルを導入する。
業界における一般的な課題は、非常に限られた量のデータしか利用できないことだ。
本研究では, 発酵プロセスの収穫決定(すなわち, 発酵を止めて生産報酬を回収するタイミング)について, モデルリスク下で検討する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 21:16:59 GMT)
FOSP: Fine-tuning Offline Safe Policy through World Models [3.8] モデルに基づく強化学習(RL)は、高次元タスクを扱う訓練効率と能力を示した。
しかしながら、以前の作業は、実際のデプロイメントにおけるオンライン探索のために、依然として安全上の課題を生じさせている。
本稿では、オフラインで訓練されたポリシーを微調整することで、視覚に基づくロボットタスクの展開段階における安全性をさらに向上することを目的とする。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 03:22:57 GMT)
Slice-Consistent 3D Volumetric Brain CT-to-MRI Translation with 2D Brownian Bridge Diffusion Model [3.4] 神経画像では、一般的に、脳のCTはMRIよりも費用効率が高く、アクセスしやすい。
医用画像・画像翻訳(I2I)は有望な解決策である。
本研究は,2次元 DM のみに基づく高品質な3次元医療用 I2I を実現する最初の試みである。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:13:36 GMT)
The Solution for the AIGC Inference Performance Optimization Competition [3.3] ChatGPTは、人間レベルの会話能力を示し、2022年末までに1億人の月間ユーザーを惹きつけ、広く普及している。
本稿では、Ernieモデルの高性能推論の最適化、GPUアクセラレーションの強調、Paddle推論フレームワークの活用に焦点を当てる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:54:45 GMT)
TwinDiffusion: Enhancing Coherence and Efficiency in Panoramic Image Generation with Diffusion Models [3.2] 拡散モデルは、多種多様な高品質なコンテンツを生成する効果的なツールとして登場した。
目に見えるシームや一貫性のない遷移といった課題に直面している。
これらの課題に対処する最適化されたフレームワークであるTwinDiffusionを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 11:16:46 GMT)
Exploring Sound Change Over Time: A Review of Computational and Human Perception [2.9] 我々は,手法やタスクの観点から,人間の知覚と計算を対比した先駆的なレビューを提供する。
全体として、計算手法はコンピュータ駆動モデルに頼り、語源的データセットの歴史的音響変化を知覚する。
人間のアプローチは、録音コーパスにおける継続的な音の変化を知覚するためにリスナー駆動モデルを使用する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:44:59 GMT)
The Solution for the sequential task continual learning track of the 2nd Greater Bay Area International Algorithm Competition [2.8] 本研究では,第2回グレーターベイエリア国際アルゴリズムコンペティションの連続的なタスク継続学習トラックのための連続学習アルゴリズムを開発する。
この方法は、ネットワークの畳み込み層と線形層内の各タスクの独立パラメータ部分空間を学習し、最初のタスク後にバッチ正規化層を凍結する。
我々のアプローチでは、コアネットワークの拡張や外部補助ネットワークやデータの使用は必要とせず、タスクインクリメンタルとドメインインクリメンタルの両方でうまく機能します。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:21:29 GMT)
Multitask-based Evaluation of Open-Source LLM on Software Vulnerability [2.8] 本稿では,公開データセットを用いて対話型大規模言語モデル(LLM)を定量的に評価するためのパイプラインを提案する。
我々は,4つの共通ソフトウェア脆弱性タスクをカバーするBig-Vulを用いて,LLMの広範な技術的評価を行う。
既存の最先端のアプローチと事前訓練された言語モデル(LM)は、ソフトウェア脆弱性検出において、LLMよりも一般的に優れていることがわかった。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 18:23:48 GMT)
Embedding Digital Signature into CSV Files Using Data Hiding [2.7] 本稿では,データ隠蔽技術を用いてデジタル署名をCSVファイルに埋め込む手法を提案する。
実験の結果、512ビットのシグネチャを実際のオープンデータCSVファイルに埋め込むことができた。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 04:56:22 GMT)
Keeping Users Engaged During Repeated Administration of the Same Questionnaire: Using Large Language Models to Reliably Diversify Questions [2.7] 仮想エージェント管理アンケートの繰り返し使用は、応答性疲労を引き起こす可能性がある。
本研究では,大規模言語モデル (LLM) を用いて多様なアンケートモデルを作成することを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 22:38:36 GMT)
Bridging Modality Gap for Visual Grounding with Effecitve Cross-modal Distillation [2.1] 現在の視覚的接地法は、視覚的特徴と言語的特徴を得るために、訓練済みの視覚的および言語的バックボーンを独立して利用する。
この問題は、現在の視覚的接地法で使用されるシングルモーダルトレーニングバックボーン間のドメインギャップから生じる。
本稿では,視覚的グラウンド化作業の指針となるマルチモーダル事前学習モデルを蒸留する,視覚的グラウンド化のためのエンパワーディング事前学習モデルを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 16:33:34 GMT)
A typology of quantum algorithms [2.0] 約130個の量子アルゴリズムを分類することで、現在の量子アルゴリズムの風景を描く。
主な目的は、アルゴリズムのトレンドを明らかにすること、NISQ時代の実装に期待できるフィールドを特定すること、量子優位性を支える重要なアルゴリズムプリミティブを特定することである。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 20:41:05 GMT)
Teaching Research Design in Software Engineering [2.0] 経験的ソフトウェア工学(ESE)は、新しい技術を採用する際の実践を伝える知識を批判的に評価し提供することを目的とした競争力として登場した。
この章では、ESEにおけるソフトウェアエンジニアと研究者の教育に不可欠な研究設計の基礎的スキルについて教えている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 21:06:13 GMT)
Conditional Neural Expert Processes for Learning Movement Primitives from Demonstration [1.9] 条件付きニューラルネットワークプロセス(CNEP)は、異なるモードから異なる専門家ネットワークにデモを割り当てることを学ぶ。
CNEPは、軌道がどのモードに属するかの監督を必要としない。
本システムは,オンラインコンディショニング機構を用いて,環境変化へのオンザフライ適応が可能なシステムである。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:40:54 GMT)
Towards Interpretable Sequence Continuation: Analyzing Shared Circuits in Large Language Models [1.8] 本研究の目的は、トランスフォーマーモデルをアルゴリズム機能を実装する人間可読表現にリバースエンジニアリングすることである。
GPT-2 SmallとLlama-2-7Bの両方のキーサブ回路を回路解釈可能性解析により同定する。
このサブ回路は、インターバル回路、スペイン語の数字と月数継続、自然言語の単語問題など、様々な数学的なプロンプトに影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:14:03 GMT)
A Novel Bifurcation Method for Observation Perturbation Attacks on Reinforcement Learning Agents: Load Altering Attacks on a Cyber Physical Power System [1.8] 本研究は,分岐層を用いたグループ差分ロジッツ損失を用いた連続制御のための新しい攻撃手法を提案する。
現実的なスマートエネルギー環境における強力な勾配に基づく攻撃の影響を実証する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 20:55:24 GMT)
Quantum algorithm for partial differential equations of non-conservative systems with spatially varying parameters [1.7] 偏微分方程式(PDE)は熱伝達、流体流、電磁波などの様々な物理現象をモデル化するために重要である。
コンピュータ支援工学(CAE)では、製品性能の向上と開発コストの削減のために、細部分解能と大規模計算モデルを扱う能力が不可欠である。
空間的に異なるパラメータを持つ非保守系の2階線形PDEを解く量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:23:04 GMT)
Large Language Model Enhanced Clustering for News Event Detection [1.7] 本稿では,大規模言語モデル(LLM)とクラスタリング解析を組み合わせたイベント検出フレームワークを提案する。
このフレームワークは、事前検出タスクと後検出タスクの両方を通じてイベントクラスタリングを強化する。
本稿では,クラスタリング結果の有効性とロバスト性を評価するための新しいクラスタ安定性評価指標(CSAI)を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:19:08 GMT)
Measurement of microwave photon correlations at millikelvin with a thermal detector [1.4] マイクロ波光子は、量子コンピューティングのための多くの有望なプラットフォームにおいて、量子情報の重要なキャリアである。
ミリケルビンの光子統計を直接測定するナノボロメータを用いた計測手法を提案する。
この技術は、マイクロ波光子による量子力学の基礎的なテストに役立ち、量子情報プロセッサのスケーラブルな読み出しソリューションとして機能する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 18:15:08 GMT)
The Reachability Problem for Neural-Network Control Systems [1.4] 本稿では、ReLUアクティベーションを備えたフィードフォワードニューラルネットワークによってコントローラが実装されるシステムについて考察する。
到達可能性問題は、一連の初期状態が与えられた場合、一連の目標状態に到達できるかどうかを問う。
3つの入力と出力を持つ自明な植物や固定深度ニューラルネットワークでさえ、この問題は決定不可能であることを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:46:26 GMT)
The strong-coupling quantum thermodynamics of quantum Brownian motion based on the exact solution of its reduced density matrix [1.2] 我々は、その還元密度行列の正確な解から、量子ブラウン運動の量子熱力学を導出する。
還元ハミルトニアンと還元されたブラウン運動の分割函数は、著しく再正規化されなければならない。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 01:25:29 GMT)
Bayesian geoacoustic inversion using mixture density network [1.0] 本稿では,重要な測地統計を導出することにより,古典的ベイズ測地学の逆転フレームワークを拡張した。
パラメータ空間全体にネットワークを直接トレーニングし、モデルのパラメータの多次元PDDを取得する。
その結果,ネットワークは信頼性の高い予測を行い,未知のデータに対して高い一般化性能を示すことがわかった。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:29:20 GMT)
Observation of Space-Dependent Rotational Doppler Shifts with a Single Ion Probe [1.0] 本研究では,2つの共伝播渦レーザービームによって励起される単一トラップイオンを用いた回転ドップラー効果の実験を行った。
ビームを横切る1つのイオンを決定論的に配置することで、この現象の詳細な特徴付けを行う。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 13:47:49 GMT)
Enhancing Language Learning through Technology: Introducing a New English-Azerbaijani (Arabic Script) Parallel Corpus [0.9] 本稿では,英語・アゼルバイジャン語の並列コーパスについて紹介する。
これは、低リソース言語のための言語学習と機械翻訳の技術的ギャップを埋めるように設計されている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 21:23:20 GMT)
Helios: An extremely low power event-based gesture recognition for always-on smart eyewear [0.8] 本報告では,スマートアイウェアの日中使用を目的とした,非常に低消費電力でリアルタイムなイベントベースの手ジェスチャー認識システムであるHeliosを紹介する。
Heliosは微妙なマイクロジェスチャーやピンチなど7種類のジェスチャーを91%の精度で認識できる。
また、60ミリ秒という極めて低いレイテンシで、20ユーザにわたるリアルタイムパフォーマンスを実演しています。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 23:16:41 GMT)
Collectively induced transparency and absorption in waveguide QED with Bragg atom arrays [0.5] 非均一周波数の導波路結合ブラッグ原子アレイにおける集合量子現象について検討した。
自由空間散逸のない原子では、サブラジアント状態と超ラジアント状態の間の破壊的な量子干渉によって集合的に誘導される透明性が生じる。
我々は、光子輸送に対する自由空間散逸の影響を研究することにより、集合的に誘導された吸収(CIA)を見いだした。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:30:54 GMT)
Parameterized Dynamic Logic -- Towards A Cyclic Logical Framework for General Program Specification and Verification [0.2] 本稿では,パラメータ化された動的論理型形式である$DL_p$を提案する。
$DL_p$は、異なる動的論理理論を包含する柔軟な検証フレームワークを提供する。
ケーススタディは、$DL_p$が異なるタイプのプログラムモデルについて推論するためにどのように機能するかを示している。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:01:54 GMT)
qlty: handling large tensors in scientific imaging [0.1] 本稿では,テンソル管理手法を用いて課題に対処するツールキットであるqltyを紹介する。
qltyは、大規模な空間データのサブサンプリング、クリーニング、縫合のための堅牢な方法を提供する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:01:24 GMT)
A Domain Adaptation Model for Carotid Ultrasound: Image Harmonization, Noise Reduction, and Impact on Cardiovascular Risk Markers [0.1] 超音波画像における画像から画像への変換のためのGANに基づくモデルを提案する。
耳下腺超音波画像のテクスチャパターンとノイズの低減について解剖学的に検討した。
その結果、ドメイン適応は両方のタスクで達成された。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 19:44:00 GMT)
Stochastic modeling of superconducting qudits in the dispersive regime [0.1] この研究は、オープン量子系における分散二次測定のモデル化に焦点をあてる。
トランスモン型キュートレットを用いた実験結果を用いて,本モデルの有効性を検証した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:11:10 GMT)
Effective-LDAM: An Effective Loss Function To Mitigate Data Imbalance for Robust Chest X-Ray Disease Classification [0.0] E-LDAM(Effective-Label Distribution Aware Margin)と呼ばれるアルゴリズム中心のアプローチを提案する。
E-LDAMは,各クラスで有効なサンプル数を用いて,広く採用されているラベル分布認識マージン(LDAM)損失関数のマージンを変更する。
実験の結果,E-LDAM法の有効性が示され,マイノリティクラスでは97.81%という顕著なリコールスコアが得られた。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 04:24:07 GMT)
The Low-Degree Hardness of Finding Large Independent Sets in Sparse Random Hypergraphs [0.0] 低次アルゴリズムのクラスは、密度$left(fraclog d(r-1)dright)1/(r-1)$の独立した集合を見つけることができるが、それ以上は見つからない。
グラフケースは広く研究されているが、この研究はランダムなハイパーグラフ上の最適化問題の統計的-計算的ギャップを考える最初のものである。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:41:13 GMT)
Resource Constrained U-Net for Extraction of Retinal Vascular Trees [0.0] 本稿では,ヒト眼底写真に対する血管内皮マスク抽出のためのU-Net構造の改良の有効性を示す。
限られた計算資源とトレーニングデータに対して、提案したモデルは、最先端の手法と比較してわずかに性能が劣る。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 03:15:00 GMT)
Recent Advancements and Challenges of Turkic Central Asian Language Processing [0.0] 本稿は、中央アジアの言語、すなわちカザフ語、ウズベク語、キルギス語、トルクメン語のNLP球体に焦点を当てる。
これは、言語言語の言語特性、既に開発された技術の現在のカバレッジとパフォーマンス、ラベル付きおよびラベルなしデータの各言語での可用性について、より広範に高レベルな概要を提供する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:58:26 GMT)
Quantumness of gravitational cat states in correlated dephasing channels [0.0] 本研究では, 負のデファスチャネルにおける重力猫状態の量子性について検討する。
重力物理学と量子情報処理の両方に重要な新機能が報告されている。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 17:02:17 GMT)
Linear Attention Based Deep Nonlocal Means Filtering for Multiplicative Noise Removal [0.0] 乗法ノイズはレーダー画像、医療画像、その他の重要な分野の画像に広く存在している。
我々は、ディープラーニングを用いた非局所平均アルゴリズムを線形化し、線形アテンション機構に基づく深部非局所平均フィルタリング(LDNLM)を提案する。
実乗法と模擬乗法の両方の実験により、LDNLMは最先端の手法よりも競争力が高いことが示された。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 14:22:07 GMT)
Large language models are good medical coders, if provided with tools [0.0] 本研究は,ICD-10-CM自動医療符号化のための2段階リトリーブ・ランクシステムを提案する。
両方のシステムを100の単一長期医療条件のデータセットで評価する。
Retrieve-Rank システムは正しい ICD-10-CM 符号の予測において100%の精度を達成した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 06:58:51 GMT)
JDT3D: Addressing the Gaps in LiDAR-Based Tracking-by-Attention [0.0] 自動走行のための3Dトラッキングベンチマークにおいて、トラッキング・バイ・検出(TBD)法は最先端のパフォーマンスを達成する。
一方、トラッキング・バイ・アテンション(TBA)法は、TBD法より優れている可能性がある。
本研究は,LiDARを用いたジョイント検出器とJDT3Dを用いたTBD法におけるTBA法の性能低下について検討する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:29:29 GMT)
Impact of Network Topology on Byzantine Resilience in Decentralized Federated Learning [0.0] 本研究では、複雑な大規模ネットワーク構造における最先端のビザンチン-ロバスト凝集法の効果について検討する。
最先端のビザンツのロバスト・アグリゲーション戦略は、大規模な非完全連結ネットワークではレジリエントではないことが判明した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 17:47:44 GMT)
Identifying Intensity of the Structure and Content in Tweets and the Discriminative Power of Attributes in Context with Referential Translation Machines [0.0] 我々は、属性と英語の2つの単語の類似性を識別するために、レファレンシャル翻訳機械(RTM)を用いる。
RTMは、英語、アラビア語、スペイン語のツイートの構造と内容の強さを予測するためにも使われる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 18:58:10 GMT)
How do you know that? Teaching Generative Language Models to Reference Answers to Biomedical Questions [0.0] 大規模言語モデル(LLM)が最近,ユーザの質問に対するオンライン回答の主要なソースになっている。
雄弁な答えを提供する能力があるにもかかわらず、その正確さと信頼性は重大な課題となる。
本稿では, バイオメディカル検索強化生成システム(RAG)を導入し, 生成した応答の信頼性を高める。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:10:05 GMT)
Form Forge: Latent Space Exploration of Architectural Forms via Explicit Latent Variable Manipulation [0.0] Form Forgeは、アーキテクチャ形式の潜在空間をインタラクティブに探索するクリエイティブシステムのプロトタイプである。
このシステムはFranois BlanciakのSITELESS: 1001 Building Formsにインスパイアされた。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 13:46:23 GMT)
Entanglement marker for lifetime of time crystal in transmon-modulated open Dicke model [0.0] 平均場近似が有効である半古典的極限でシステムを研究する。
2量子ビットでも一過性DTCを示すことが観察された。
この長期的絡み合い値と一過性DMCの寿命との間には強い正の相関が認められた。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 20:21:12 GMT)
Conditional Semi-Supervised Data Augmentation for Spam Message Detection with Low Resource Data [0.0] 本研究では,データの可用性に欠けるスパム検出モデルに対して,条件付き半教師付きデータ拡張を提案する。
トレーニングデータを拡張するために、ラベルのないデータをデータ拡張に活用する。
潜在変数は、最終分類器の入力としてラベル付きおよびラベルなしのデータから得ることができる。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:51:24 GMT)
Calorie Burn Estimation in Community Parks Through DLICP: A Mathematical Modelling Approach [0.0] 本研究は,ディープラーニング技術,特に顔認識技術を組み合わせた革新的なアプローチであるDLICP(Deep Learning Integrated Community Parks)を紹介する。
DLICPは、顔認識ソフトウェアを備えたカメラを使用して、公園のユーザーを正確に識別し追跡する。
本研究は、インテリジェントなスマートパークシステムの開発に大きく貢献し、消費カロリーのリアルタイム更新とパーソナライズされたフィットネストラッキングを可能にした。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 07:45:05 GMT)
BrainMetDetect: Predicting Primary Tumor from Brain Metastasis MRI Data Using Radiomic Features and Machine Learning Algorithms [0.0] 脳転移 (BM) はがん患者に一般的であり, 腫瘍部位の決定は治療に重要である。
本研究は, 放射能特徴と高度な機械学習アルゴリズムを用いて, BM MRIデータから一次腫瘍部位を予測することを目的とする。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 11:34:00 GMT)
Automatic Prediction of the Performance of Every Parser [0.0] 機械翻訳性能予測システム(MTPPS)を用いた新しい性能予測(PPP)モデルを提案する。
この新しいシステムであるMTPPS-PPPは、任意の言語の性能を予測することができ、テキストを理解する際の文法的難易度を推定するのに有用である。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 15:49:24 GMT)
Aortic root landmark localization with optimal transport loss for heatmap regression [0.0] 粗い画像からの高精度な一段階ランドマーク定位法を提案する。
仙台高瀬井病院で収集した3次元CT画像データセットに本手法を適用した。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 02:01:48 GMT)
Advancing Healthcare Automation: Multi-Agent System for Medical Necessity Justification [0.0] 本稿では,LLMエージェントを利用したマルチエージェントシステム(MAS)の優先オーソライゼーションタスクの自動化について検討する。
GPT-4のチェックリストは,証拠による項目レベルの判断の精度が86.2%,総合的なチェックリスト判定の精度が95.6%であることを示す。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 09:29:16 GMT)
Advancing Algorithmic Approaches to Probabilistic Argumentation under the Constellation Approach [0.0] 完全拡張である引数の集合の確率を計算する複雑なタスクのアルゴリズムを開発する。
実験的評価は我々のアプローチの可能性を示唆している。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 12:08:38 GMT)
Achieving Tool Calling Functionality in LLMs Using Only Prompt Engineering Without Fine-Tuning [0.0] 現在、ローカルにデプロイされたオープンソースの大規模言語モデル(LLM)と、いくつかの商用モデルインターフェースは、安定したツール呼び出し機能をサポートしていない。
本稿では, プロンプトエンジニアリングといくつかの巧妙なコード設計のみを用いて, LLMが安定したツール呼び出し機能を実現する方法を提案する。
論文参考訳(メタデータ) (Sat, 6 Jul 2024 08:29:12 GMT)