Benchmarking Generation and Evaluation Capabilities of Large Language Models for Instruction Controllable Summarization [132.3] 命令制御可能なテキスト要約の大規模言語モデル(LLM)をベンチマークする。
本研究は,LLMにおいて,命令制御可能なテキスト要約が依然として困難な課題であることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:35:18 GMT)
OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text [112.6] 我々は100億規模の画像テキストインターリーブデータセットであるOmniCorpusを紹介する。
私たちのデータセットは、優れたデータ品質を維持しながら、15倍のスケールを持っています。
これが将来のマルチモーダルモデル研究に確かなデータ基盤を提供することを期待しています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:54:51 GMT)
Compositional Structures in Neural Embedding and Interaction Decompositions [101.4] ニューラルネットワークにおけるベクトル埋め込みにおける線形代数構造間の基本的な対応について述べる。
相互作用分解」の観点から構成構造の特徴づけを導入する。
モデルの表現の中にそのような構造が存在するためには、必要かつ十分な条件を確立する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:39:50 GMT)
SciEx: Benchmarking Large Language Models on Scientific Exams with Human Expert Grading and Automatic Grading [100.0] LLM(Large Language Models)の一般的な用途は、科学的トピックに関するタスクを実行することである。
そこで本稿では,大学生のこのような課題に対する評価方法に着想を得たSciExを提案する。
我々は,新しいベンチマークを用いて,最先端のLLMの性能評価を行った。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:17:49 GMT)
Can large language models explore in-context? [87.5] 単純なマルチアームバンディット環境において,エージェントとして大規模言語モデルをデプロイする。
モデルが実質的な介入なしには、探索にしっかりと関わっていないことが分かっています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:52:49 GMT)
Robotic Control via Embodied Chain-of-Thought Reasoning [86.7] 学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:19:34 GMT)
PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines [86.4] 予測時間ネットワークの総合評価に適したベンチマークであるPredBenchを紹介する。
このベンチマークでは、広く採用されている12のメソッドと、複数のアプリケーションドメインにまたがる多様なデータセットを統合する。
その多次元評価フレームワークは、総合的なメトリクスセットで分析を広げる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:55:16 GMT)
SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs [81.2] SceneGraphLocはシーングラフ内の各ノード(つまりオブジェクトインスタンスを表す)に対する固定サイズの埋め込みを学習する。
画像を利用する場合、SceneGraphLocは、大規模な画像データベースに依存する最先端技術に近いパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:00:03 GMT)
Jailbreaking as a Reward Misspecification Problem [80.5] 本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。
本稿では,報酬の誤特定の程度を定量化するための指標ReGapを紹介し,有害なバックドアプロンプトを検出する上での有効性とロバスト性を示す。
ReMissは、様々な目標に整列したLDMに対して対向的なプロンプトを生成する自動レッドチームリングシステムである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:15:45 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6] 人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:48:00 GMT)
Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors [78.5] 大規模言語モデル(LLM)は、高品質なパーソナライズされた教育を全員に拡大する機会を提供する。
LLMは、学生のエラーを正確に検知し、これらのエラーに対するフィードバックを調整するのに苦労する。
教師が学生の誤りを識別し、それに基づいて回答をカスタマイズする現実世界の教育実践に触発され、我々は学生ソリューションの検証に焦点をあてる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:11:40 GMT)
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends [78.3] LVLM(Large Vision-Language Models)は、多モーダルな理解と推論タスクにまたがる顕著な能力を示す。
LVLMの脆弱性は比較的過小評価されており、日々の使用において潜在的なセキュリティリスクを生じさせる。
本稿では,既存のLVLM攻撃の様々な形態について概説する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:58:05 GMT)
Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.9] そこで本研究では,モデルパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。
本手法は,Mixtral-8x7BとMixtral-8x22Bの2種類のMoEモデルを用いて評価を行った。
本手法は,様々な自然言語タスクにおいて,他のモデルプルーニング手法よりも優れる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:25:02 GMT)
Long-term drought prediction using deep neural networks based on geospatial weather data [75.4] 農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
私たちは、体系的なエンドツーエンドアプローチを採用するエンドツーエンドアプローチを導入することで、干ばつデータに取り組みます。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:05:50 GMT)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.6] 非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:44:33 GMT)
Bias and Fairness in Large Language Models: A Survey [73.9] 本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:29:57 GMT)
Towards Robust Temporal Reasoning of Large Language Models via a Multi-Hop QA Dataset and Pseudo-Instruction Tuning [73.5] 大規模言語モデル(LLM)には時間的知識の概念を理解することが不可欠である。
本稿では,複数質問応答と複数ホップの時間的推論に焦点をあてた複雑な時間的質問応答データセットであるComplex-TRを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:37:14 GMT)
Vision-Language Models as a Source of Rewards [68.5] 強化学習エージェントの報酬源として市販の視覚言語モデル(VLM)の有効性を検討する。
様々な言語目標の視覚的達成に対する報酬は、CLIPファミリーのモデルから導き出すことができ、様々な言語目標を達成するためのRLエージェントの訓練に使用されることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:14:32 GMT)
Inference Optimization of Foundation Models on AI Accelerators [68.2] トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:24:34 GMT)
On scalable oversight with weak LLMs judging strong LLMs [67.9] 我々は、2つのAIが1人の裁判官を納得させようとする議論、すなわち1人のAIが1人の裁判官を説得し、質問をする。
大規模言語モデル(LLM)をAIエージェントと人間の判断のためのスタンドインの両方として使用し、判断モデルがエージェントモデルよりも弱いと判断する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:38:12 GMT)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.8] 我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:42:30 GMT)
Refuse Whenever You Feel Unsafe: Improving Safety in LLMs via Decoupled Refusal Training [67.3] 本研究では,Large Language Models (LLMs) の安全性チューニングにおける重要なギャップについて考察する。
我々は,LLMに対して,いかなる応答位置においても有害なプロンプトへのコンプライアンスを拒否する権限を与える新しいアプローチであるDecoupled Refusal Training(DeRTa)を導入する。
DeRTaは、(1)安全応答の開始に有害な応答のセグメントを付加することにより、安全でないコンテンツを認識・回避するようモデルに訓練する、(1)有害応答前フィックスによる最大限の類似度推定、(2)有害応答の開始を通して潜在的害から安全拒絶へ継続的に移行する能力を持つ強化遷移最適化(RTO)という2つの新しいコンポーネントを組み込んでいる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:36:33 GMT)
EnvGen: Generating and Adapting Environments via LLMs for Training Embodied Agents [65.4] トレーニング環境を適応的に作成するフレームワークであるEnvGenを提案する。
我々は、LLM生成環境とLLM生成環境を混合した小さなRLエージェントを訓練する。
我々は、EnvGenで訓練された小さなRLエージェントが、GPT-4エージェントを含むSOTAメソッドより優れており、長い水平タスクをかなり高速に学習できることを発見した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:39:19 GMT)
HiFi-123: Towards High-fidelity One Image to 3D Content Generation [64.8] HiFi-123は高忠実で多視点で一貫した3D生成のために設計された手法である。
本稿では,拡散型ゼロショットノベルビュー合成法の忠実度を大幅に向上する参照ガイド型新規ビュー拡張(RGNV)技術を提案する。
また,新たにRGSD(Reference-Guided State Distillation)を施行した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:55:26 GMT)
Alternate Diverse Teaching for Semi-supervised Medical Image Segmentation [62.0] そこで我々は,教師-学生の枠組みにおける多様な教育手法であるAD-MTを提案する。
一人の生徒モデルと2つの訓練不可能な教師モデルがあり、それは定期的に、ランダムに、別の方法で、モーメントを更新する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:23:31 GMT)
One for All: Towards Training One Graph Model for All Classification Tasks [61.7] 様々なグラフタスクの統一モデルは、主にグラフ学習領域に固有の課題のために、まだ探索されていない。
上記の課題に対処するために単一のグラフモデルを使用できる最初の汎用フレームワークである textbfOne for All (OFA) を提案する。
OFAは様々なタスクでうまく機能し、グラフ上の最初の汎用のクロスドメイン分類モデルとなる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:01:32 GMT)
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering [59.1] ビジュアルテキストレンダリングは、テキストから画像生成モデルにとって根本的な課題である。
文字認識のBYT5エンコーダを微調整することで、一連のカスタマイズされたテキストエンコーダ、Glyph-ByT5を作成します。
本稿では,Glyph-ByT5をSDXLに統合する方法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:39:31 GMT)
Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.0] コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。
POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。
本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:19:19 GMT)
Dynamic neural network with memristive CIM and CAM for 2D and 3D vision [57.6] 本稿では,memristor を用いた意味記憶に基づく動的ニューラルネットワーク (DNN) を提案する。
ネットワークは、受信したデータとセマンティックベクターとして格納された過去の経験を関連付ける。
MNISTとModelNetのデータセットから画像と3Dポイントを分類するために、ResNetとPointNet++の40nmのmemristorマクロを用いて、我々の共同設計を検証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:55:57 GMT)
Divide and Fuse: Body Part Mesh Recovery from Partially Visible Human Images [57.5] ディバイドとフューズ」戦略は、人体部分を融合する前に独立して再構築する。
Human Part Parametric Models (HPPM) は、いくつかの形状とグローバルな位置パラメータからメッシュを独立に再構築する。
特別に設計された融合モジュールは、一部しか見えない場合でも、再建された部品をシームレスに統合する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:29:11 GMT)
Revisit Human-Scene Interaction via Space Occupancy [55.7] HSI(Human-Scene Interaction)の生成は、さまざまな下流タスクに不可欠な課題である。
本研究では,シーンとのインタラクションが,抽象的な物理的視点からシーンの空間占有と本質的に相互作用していることを論じる。
純粋な動きシーケンスを、見えないシーン占有と相互作用する人間の記録として扱うことで、動きのみのデータを大規模にペア化された人間-占有相互作用データベースに集約することができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:25:13 GMT)
HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6] 3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。
高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。
私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:01:32 GMT)
SSIP: automated surgery with quantum LDPC codes [55.2] クビットCSSコード間の手術を自動化するための,オープンソースの軽量PythonパッケージであるSSIP(Identifying Pushouts)による安全手術について述べる。
ボンネットの下では、鎖複体の圏における普遍構成によって支配される$mathbbF$上の線型代数を実行する。
高い符号距離を犠牲にすることなく,手術によって様々な論理的測定を安価に行うことができることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:50:01 GMT)
A Benchmark Environment for Offline Reinforcement Learning in Racing Games [54.8] オフライン強化学習(英語: Offline Reinforcement Learning、ORL)は、従来の強化学習(RL)の高サンプリング複雑さを減らすための有望なアプローチである。
本稿では,ORL研究のための新しい環境であるOfflineManiaを紹介する。
TrackManiaシリーズにインスパイアされ、Unity 3Dゲームエンジンで開発された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:44:03 GMT)
A Perspective on Foundation Models for the Electric Power Grid [53.0] ファンデーションモデル(FM)がニュースの見出しを支配している。
多様なグリッドデータやトポロジからFMを学習することで、トランスフォーメーション能力が解放されるのではないか、と私たちは主張する。
本稿では,グラフニューラルネットワークに基づく電力グリッドFMの概念,すなわちGridFMについて論じる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:09:47 GMT)
NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.8] 3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:30:00 GMT)
MetaFood CVPR 2024 Challenge on Physically Informed 3D Food Reconstruction: Methods and Results [52.1] 私たちはMetaFood Workshopを主催し、物理的にインフォームドされた3Dフードレコンストラクションへの挑戦を行っている。
本課題は,2次元画像から,視認性チェッカーボードをサイズ基準として,食品の容積正確な3次元モデルを再構築することに焦点を当てる。
この課題で開発されたソリューションは、3D食品の復元において有望な成果を達成し、食事評価と栄養モニタリングのための部分推定の改善に有意な可能性を秘めている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:15:48 GMT)
A Fair Ranking and New Model for Panoptic Scene Graph Generation [51.8] Decoupled SceneFormer(DSFormer)は、既存のすべてのシーングラフモデルよりも優れた2段階モデルである。
基本設計原則として、DSFormerは被写体とオブジェクトマスクを直接特徴空間にエンコードする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:28:08 GMT)
Infinite Motion: Extended Motion Generation via Long Text Instructions [51.6] 『無限運動』は、長文を長文から拡張運動生成に活用する新しいアプローチである。
我々のモデルの主な革新は、任意の長さのテキストを入力として受け入れることである。
テキストのタイムスタンプ設計を取り入れ、生成されたシーケンス内のローカルセグメントの正確な編集を可能にする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:12:05 GMT)
Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.5] 本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:13:43 GMT)
Pre-training Point Cloud Compact Model with Partial-aware Reconstruction [51.4] 本稿では, 部分認識型textbfReconstruction を用いた, Point-CPR という事前学習型クラウド圧縮モデルを提案する。
我々のモデルは様々なタスクにおいて強い性能を示し、特にパラメータの2%しか持たない主要なMPMベースモデルであるPointGPT-Bを上回っている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:18:14 GMT)
What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0] 本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:10:16 GMT)
Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations [50.7] 本研究では,人間の会話の動的な性質を模倣する新しいテキストbf-by-Step Dialogue Paradigm (Stephanie)を提案する。
デュアルラーニング戦略と,さらに分割した後編集手法を用いて,高品質なステップバイステップ対話データセットを作成した。
従来の単段階対話のパラダイムと比較して,その効果を評価するために,自動評価と人的評価を行った。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:15:10 GMT)
PriRoAgg: Achieving Robust Model Aggregation with Minimum Privacy Leakage for Federated Learning [49.9] フェデレートラーニング(FL)は、大規模分散ユーザデータを活用する可能性から、最近大きな勢いを増している。
送信されたモデル更新は、センシティブなユーザ情報をリークする可能性があり、ローカルなトレーニングプロセスの集中的な制御の欠如は、モデル更新に対する悪意のある操作の影響を受けやすいグローバルモデルを残します。
我々は、Lagrange符号化計算と分散ゼロ知識証明を利用した汎用フレームワークPriRoAggを開発し、集約されたプライバシを満たすとともに、幅広いロバストな集約アルゴリズムを実行する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:18:08 GMT)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles [49.2] 本研究では,自然言語で表現を指定した発話ヘッドを生成可能なフレームワークであるTalkCLIPを提案する。
テキストから表現へのマッピングをモデル化するために,まず,テキストとビデオのペアによる発話ヘッドデータセットを構築した。
自然言語による記述を表現表現に投影するCLIPベースのスタイルエンコーダを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:55:40 GMT)
Adaptive Human Trajectory Prediction via Latent Corridors [49.1] シーン固有の適応軌道予測の問題を定式化する。
本稿では,潜伏回廊と呼ばれる即時チューニングにインスパイアされた新しい適応手法を提案する。
0.1%の追加モデルパラメータでは、MOTシンスシミュレーションデータの改善が23.9%、MOTおよびワイルドトラックにおけるADEが16.4%となる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:30:42 GMT)
Empowering Few-Shot Relation Extraction with The Integration of Traditional RE Methods and Large Language Models [48.8] Few-Shot Relation extract (FSRE)は自然言語処理(NLP)の研究者にアピールする
大規模言語モデル(LLM)の近年の出現により、多くの研究者が文脈学習(ICL)を通じてFSREを探求している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:31:11 GMT)
Towards More Trustworthy and Interpretable LLMs for Code through Syntax-Grounded Explanations [48.1] ASTrustは、モデル信頼度とプログラミング言語の構文構造の関係に基づく説明を生成する。
ASTからの構文構造のシーケンス, 熱マップ, グラフに基づく可視化を重畳した, モデル信頼度スコアを自動可視化する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:38:28 GMT)
Internet of Federated Digital Twins (IoFDT): Connecting Twins Beyond Borders for Society 5.0 [47.6] デジタルツイン(DT)の概念は将来の産業に革命をもたらすことが期待されており、将来のスマート社会、すなわち社会5.0のビジョンの中心に位置する。
本稿では,異なる社会5.0 サービスを表す DT を全体統合した,インターネット・オブ・フェデレーション・デジタル・ツインズ (IoFDT) の新たな概念を思い起こさせる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:49:41 GMT)
A Neural Rewriting System to Solve Algorithmic Problems [47.1] ネストされた数学的公式を解くための一般的な手順を学習するために設計されたモジュラーアーキテクチャを提案する。
シンボリック人工知能の古典的なフレームワークである書き換えシステムに触発され、アーキテクチャには3つの専門的で対話的なモジュールが含まれます。
我々は、系統的な一般化に特化した最近のモデルであるNeural Data Routerと、先進的なプロンプト戦略で探索された最先端の大規模言語モデル(GPT-4)とを比較した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:42:45 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1] 本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。
我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。
室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:32:19 GMT)
A Spatio-temporal Aligned SUNet Model for Low-light Video Enhancement [44.2] STA-SUNetモデルは、新しい完全に登録されたデータセット(BVI)に基づいて訓練される
3つのテストデータセット上で、他のさまざまなモデルに対して比較的分析されている。
極端に低照度な条件下では特に有効であり、非常に良好な視覚化結果をもたらす。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:05:46 GMT)
ImageFlowNet: Forecasting Multiscale Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1] ImageFlowNetは、共同埋め込み空間におけるマルチスケール表現を進化させる潜在空間フローフィールドを学習する新しいフレームワークである。
我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:28:55 GMT)
SpreadsheetLLM: Encoding Spreadsheets for Large Language Models [44.1] SpreadsheetLLMは、スプレッドシート上の大きな言語モデル(LLM)を解き放つために設計された効率的な符号化手法である。
LLMのスプレッドシートを効果的に圧縮する革新的な符号化フレームワークである SheetCompressor を開発した。
SheetCompressor による微調整 LLM の圧縮率は平均 25 倍であるが、最先端の 78.9% の F1 スコアを達成し、既存のモデルでは 12.3% を上回っている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:34:21 GMT)
Domain-adaptive Video Deblurring via Test-time Blurring [43.4] 未確認領域におけるデブロアリングモデルに対するテスト時間微調整を実現するために, ぼかしモデルに基づくドメイン適応方式を提案する。
そこで本手法では, 対象領域の劣化モデルを校正するために, ドメイン適応型トレーニングペアを生成することができる。
提案手法は,最先端の映像復号化手法を大幅に改善し,実世界の映像復号化データセットに対して最大7.54dBの性能向上を実現する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:28:01 GMT)
Robustness of Explainable Artificial Intelligence in Industrial Process Modelling [43.4] 我々は,地中真実シミュレーションと感度解析に基づいて,現在のXAI手法を評価する。
モデル化された産業プロセスの真の感度を正確に予測する能力において,XAI法とXAI法の違いを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:46:26 GMT)
Molecule Language Model with Augmented Pairs and Expertise Transfer [43.3] AMOLE は,(1) 構造的類似性を保った分子文対を増大させ,2) 分子間の専門知識を伝達する。
様々な下流タスクに関する大規模な実験は、コンプレッション分子におけるAMOLEの優位性とその説明を実証している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:09:10 GMT)
SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers [43.2] SPIQAは、科学研究論文の文脈内で複雑な図形や表を解釈するために設計されたデータセットである。
データセット作成には自動および手動のキュレーションを使用します。
SPIQAは270Kの質問をトレーニング、検証、3つの異なる評価分割に分割する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:37:59 GMT)
Deep Learning Safety Concerns in Automated Driving Perception [43.0] 本稿では、クロスファンクショナルなチームが共同で関心事に対処できるようにするとともに、理解を深めるための追加の分類を紹介します。
近年のディープラーニング分野の進歩と認識のためのディープニューラルネットワーク(DNN)の性能向上により、自動走行(AD)システムへの需要が高まっている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:46:08 GMT)
PAIL: Performance based Adversarial Imitation Learning Engine for Carbon Neutral Optimization [42.9] 既存のDeep Reinforcement Learning (DRL) 手法では、それぞれのアクションが最終的な持続可能な開発目標に与える影響を評価するために、事前に定義された報酬関数が必要である。
本研究では,PAIL(Performance Based Adversarial Learning)エンジンを提案する。
これは、事前に定義されたアクション報酬を伴わずに、炭素中立性のための最適な操作ポリシーを取得するための新しい方法である。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:06:01 GMT)
From MIDI to Rich Tablatures: an Automatic Generative System incorporating Lead Guitarists' Fingering and Stylistic choices [42.4] 簡単なMIDIメロディから,指や調音,表現技術に富んだタブを生成できるシステムを提案する。
提案手法の質と高い構成性はいくつかの影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:18:24 GMT)
Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.1] 本稿では,クラス増分学習シナリオに特化して,ベイズ学習駆動型コントラスト損失(BLCL)を持つプロトタイプネットワークを提案する。
提案手法は,ベイズ学習手法を用いて,クロスエントロピーとコントラスト損失関数のバランスを動的に適用する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:14:33 GMT)
Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments [42.1] 本稿では,大規模言語モデルの深い言語理解と強化学習エージェントの適応行動実行能力を組み合わせた階層型フレームワークを提案する。
IGLUではエージェントが構造を構築するように指示され、Crafterではエージェントがタスクを実行し、言語コマンドに従って周辺環境のオブジェクトと対話する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:19:36 GMT)
Multi-Token Joint Speculative Decoding for Accelerating Large Language Model Inference [41.9] 大規模言語モデル (LLM) は様々なタスクにおいてそのパワーを実証しているが、その推論にはかなりの時間とエネルギーコストがかかる。
投機的復号法は、より小さなモデルを用いて1つのトークン列を提案し、その後ターゲットの大モデルによってバッチで検証される。
自己回帰復号法と比較すると、投機的復号法は同じ数のトークンを生成し、大きなモデルの実行量は少ない。
投機的復号化よりも出力の難易度と効率性が良いアルゴリズムは、実際より有用である。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:29:54 GMT)
From Easy to Hard: Learning Curricular Shape-aware Features for Robust Panoptic Scene Graph Generation [41.9] パノプティック・シーングラフ生成(PSG)は、パノプティック・セグメンテーション・マスクに基づく総合的なグラフ構造表現を作成することを目的としている。
そこで本研究では,PSG のためのモデルに依存しない shApe-aware feature (CAFE) 学習戦略を提案する。
本稿では,人間の認識からインスピレーションを得た形状認識機能を,使い易い方法で統合することを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:48:33 GMT)
GAVEL: Generating Games Via Evolution and Language Models [40.9] 我々は,Ludiiゲーム記述言語における新規ゲームの生成について検討する。
我々は、コードとして表現されたゲームやメカニクスをインテリジェントに変更し、再結合するモデルを訓練する。
生成されたゲームのサンプルは、Ludiiポータルからオンラインでプレイすることができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:08:44 GMT)
Improving Alignment and Robustness with Circuit Breakers [40.5] 本稿では,「サーキットブレーカー」による有害な出力に応答するモデルを中断する手法を提案する。
トレーニングの拒絶と敵のトレーニングの代替として、サーキットブレーキングは有害なアウトプットの原因となる表現を直接制御する。
我々は、我々のアプローチをAIエージェントに拡張し、攻撃されているときの有害な行動の率を大幅に低下させることを実証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:51:07 GMT)
Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing [39.9] 大きな言語モデル(LLM)は大きなブレークスルーを達成したが、生成された非倫理的コンテンツは潜在的なリスクをもたらしている。
LLMの価値アライメントを測定することは、その規制と責任あるデプロイメントにとって不可欠である。
本稿では,LLMの根底にある道徳的基盤を動的に探索する新しい生成的進化テスト手法であるGAAを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:47:21 GMT)
HPC: Hierarchical Progressive Coding Framework for Volumetric Video [39.4] ニューラルレージアンスフィールド(NeRF)に基づくボリュームビデオは、様々な3Dアプリケーションに対して大きな可能性を秘めている。
現在のNeRF圧縮は、ビデオ品質を調整できる柔軟性に欠けており、様々なネットワークやデバイス能力のための単一のモデル内である。
単一モデルを用いて可変性を実現する新しい階層型プログレッシブビデオ符号化フレームワークであるHPCを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:34:24 GMT)
PersonificationNet: Making customized subject act like a person [39.4] 本稿では,マンガのキャラクターやぬいぐるみなどの特定の主題を制御し,参照した人物のイメージと同じポーズをすることができるペルソナライズネットを提案する。
第1に、カスタマイズされたブランチは、特定対象の外観を模倣し、第2に、ポーズ条件ブランチは、人から変種インスタンスへ身体構造情報を転送し、最後に、推測段階において、人と特定対象の間の構造ギャップを橋渡しする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:27:07 GMT)
FrePolad: Frequency-Rectified Point Latent Diffusion for Point Cloud Generation [39.3] FrePoladは、生成タスクのポイントクラウド濃度において、高品質、多様性、柔軟性を同時に達成します。
FrePoladは、潜伏した形状分布上の条件として点のサンプリングを定式化することにより、変動点雲の濃度をサポートする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:29:11 GMT)
Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach [39.0] 時間的データを用いた収穫分断の現在の手法は、データに依存するか、監督の欠如を補うために非常に高度に設計されている。
衛星画像時間(SITS)の教師付き画素分割と教師なし画素分割のためのデータセットと手法を提示・比較する。
我々は,このシンプルかつ高解釈可能な手法が,低データ方式で最高の性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:04:31 GMT)
GOFA: A Generative One-For-All Model for Joint Graph Language Modeling [38.3] この問題を解決するために,新たに生成グラフ言語モデルGOFAを提案する。
GOFAは、新たに提案されたグラフレベルの次単語予測、質問応答、構造的タスクに基づいて事前訓練されている。
モデルは様々な下流タスクに基づいて評価され、ゼロショットシナリオにおける構造的および文脈的問題を解く強力な能力を示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:23:51 GMT)
Open-Canopy: A Country-Scale Benchmark for Canopy Height Estimation at Very High Resolution [38.0] 超高解像度(1.5m)キャノピー高さ推定のための最初のオープンアクセスおよびカントリースケールのベンチマークであるOpen-Canopyを紹介する。
また、異なる年に撮影された2つの画像間の天蓋の高さ変化検出のための最初のベンチマークであるOpen-Canopy-$Delta$を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:16:24 GMT)
Instant 3D Human Avatar Generation using Image Diffusion Models [37.5] AvatarPopUpは、異なる入力モードから高速で高品質な3Dアバターを生成する方法である。
われわれのアプローチでは、わずか2秒で3Dモデルを生成することができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:23:26 GMT)
ShapeLLM: Universal 3D Object Understanding for Embodied Interaction [37.0] 本稿では,3次元マルチモーダル大言語モデル(LLM)を具体化して構築したShapeLLMについて述べる。
ShapeLLMはReConをReCon++に拡張することで改良された3Dエンコーダの上に構築されている。
ShapeLLMは、構築された命令追従データに基づいてトレーニングされ、新しい人為的なベンチマークである3D MM-Vetでテストされる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:36:15 GMT)
Refusing Safe Prompts for Multi-modal Large Language Models [36.3] 安全プロンプトに対する拒絶を誘導する最初の手法であるMLLM-Refusalを紹介する。
本稿では,MLLM-Refusalを制約付き最適化問題として定式化し,その解法を提案する。
4つのデータセットにわたる4つのMLLMに対してMLLM-Refusalを評価する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:18:05 GMT)
Enhanced quantum state transfer via feedforward cancellation of optical phase noise [36.1] 超低温RbCs分子のSTIRAP状態伝達におけるレーザー位相ノイズを抑制するための光フィードフォワード法を実装した。
使用可能なレーザー強度のみに制限された98.7(1)%の転送効率を著しく向上させる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:35:08 GMT)
TCAN: Animating Human Images with Temporally Consistent Pose Guidance using Diffusion Models [36.0] TCANはポーズ駆動の人間の画像アニメーション手法であり、誤ったポーズに頑健で、時間とともに一貫性がある。
ControlNetを凍結に保つために、LoRAをUNet層に適応させ、ポーズと外観の特徴の間に潜伏した空間を調整できるようにします。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:02:13 GMT)
RIO-CPD: A Riemannian Geometric Method for Correlation-aware Online Change Point Detection [35.9] Rio-CPDは非パラメトリック相関対応オンライン変更点検出フレームワークである。
Rio-CPDは検出精度と効率において既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:42:51 GMT)
3DReact: Geometric deep learning for chemical reactions [35.4] 反応物質と生成物の3次元構造から反応特性を予測する3DReactについて述べる。
反応特性予測の既存のモデルと比較して、3DReactは原子マッピング情報を利用する柔軟なフレームワークを提供する。
異なるデータセット、原子をマッピングするレシエーション、およびジオメトリと外挿タスクの両方にわたって、体系的にうまく機能する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:15:23 GMT)
Token-Supervised Value Models for Enhancing Mathematical Reasoning Capabilities of Large Language Models [35.3] 大規模言語モデル(LLM)は、ステップバイステップの推論チェーンを通じて、数学における顕著な問題解決能力を実証している。
それらは、その後の推論チェーンの品質や、自己回帰的なトークン・バイ・トーケン生成の性質による最終回答に影響を及ぼすエラーの推論に影響を受けやすい。
近年の研究では、推論経路の生成を導くために外部検証器の採用が提案されているが、既存の研究はステップバイステップラベルで訓練されたモデルを利用している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:16:50 GMT)
On the Role of Discrete Tokenization in Visual Representation Learning [35.1] マスク付き画像モデリング (MIM) は, 対照的な学習手法とともに人気を博している。
個別のトークンは 再建の標的だが この選択の理論的基盤は 未解明のままだ
離散トークン化がモデルの一般化能力にどのように影響するかを包括的に理論的に理解する。
我々は,MIMフレームワーク内の離散トークンの有効性を評価するために,TCASという新しいメトリクスを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:25:31 GMT)
Stability and decay of subradiant patterns in a quantum gas with photon-mediated interactions [34.8] 2つの光学キャビティのモード交差位置にあるボース・アインシュタイン凝縮体におけるサブ放射率について検討した。
1つのキャビティモードへの放出を抑制する 準安定密度構造 静止した超放射能格子への緩和を防ぎます
我々は、これらのダイナミクスを量子平均場モデルで再現し、他の長距離相互作用系で予測される準定常状態と準定常状態の特性を共有することを示唆する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:47:07 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7] 大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。
LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。
PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。
PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:04:50 GMT)
CEIPA: Counterfactual Explainable Incremental Prompt Attack Analysis on Large Language Models [32.0] 本研究は,大規模言語モデル(LLM)における安全性とプライバシ対策の推進的必要性に光を当てるものである。
本稿では,攻撃効果を定量的に測定するために,特定の方法でプロンプトを誘導する新しい手法であるCEIPAを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:26:14 GMT)
Constructing Concept-based Models to Mitigate Spurious Correlations with Minimal Human Effort [32.0] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、人間の理解可能な概念を通じて、モデルの振る舞いを開示し、導くための原則的な方法を提供する。
本稿では,これらのバイアスに無害でありながら事前学習モデルを活用するために設計された新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その解釈可能性を維持しつつ,素粒子相関によるモデル依存の低減効果を示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:07:28 GMT)
Needle in the Haystack for Memory Based Large Language Models [31.9] 現在の大規模言語モデル(LLM)は、単純な事実検索タスクではよく機能しない。
動的に適応可能な外部メモリをLCMに結合することでこの問題を軽減することができるか検討する。
テキストサンプルのエピソードを高速に書き書きできるLarimarの外部メモリは、テスト時に、トレーニング中に見られるものよりもはるかに長いコンテキストを扱うために使用できることを示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:20:34 GMT)
Neural Poisson Solver: A Universal and Continuous Framework for Natural Signal Blending [31.5] Inlicit Neural Representation (INR) は視覚信号の表現法として人気がある。
InRによって表現される視覚信号を混合するプラグイン・アンド・プレイフレームワークであるNeural Poisson Solverを紹介する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:19:07 GMT)
Physical Layer Aspects of Quantum Communications: A Survey [31.4] 量子通信システムは、分散量子コンピューティング、分散量子センシング、およびいくつかの暗号プロトコルの形式で独自のアプリケーションをサポートする。
これらの通信システムの主要なイネーブルは、未知の量子状態を高速かつ忠実に転送できる効率的なインフラである。
古典的世界と量子的世界の間には根本的な違いがあるが、量子通信システムでも有益であることが証明される普遍的なコミュニケーション概念が存在する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:16:47 GMT)
Revealing the Dark Secrets of Extremely Large Kernel ConvNets on Robustness [31.3] 近年、一部の大規模なカーネル・コンブネットは、性能と効率性で復活している。
大規模なカーネルネットワークがロバストなのか、そのロバスト性に起因するのかはまだ不明である。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:55:20 GMT)
Deep Bag-of-Words Model: An Efficient and Interpretable Relevance Architecture for Chinese E-Commerce [31.1] 我々は,中国のeコマースにおける効率的かつ解釈可能な関連アーキテクチャであるディープバグ・オブ・ワード(DeepBoW)モデルを提案する。
提案手法は,単語重対の集合であるスパースBoW表現に問合せと積を符号化することである。
関連スコアは、クエリと製品とのスパースBoW表現間の一致した単語の蓄積によって測定される。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:18:05 GMT)
FedVAE: Trajectory privacy preserving based on Federated Variational AutoEncoder [30.8] 位置情報ベースのサービス(LBS)は、位置情報に合わせてパーソナライズされたサービスを提供するために、軌跡データを活用する。
この課題に対処するため、データセット内の個人情報を保護するために、K匿名性や差分プライバシーといったプライバシ保護手法が提案されている。
本稿では,個人情報の機密性を保ち,元の特徴構造を保ちつつ,新たなトラジェクトリデータセットを効果的に生成するフェデレート変分オートエンコーダ(FedVAE)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:10:59 GMT)
On the Need of a Modeling Language for Distribution Shifts: Illustrations on Tabular Datasets [30.5] 5つのデータセットと6万のメソッド構成にまたがる自然なシフトを含む実験的なテストベッドを構築します。
ML文献のX$(co)シフトに重きを置いているのとは対照的に、Y|X$-shiftsはテストベッドでもっとも一般的です。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:54:37 GMT)
FedsLLM: Federated Split Learning for Large Language Models over Communication Networks [30.5] 本稿では,低ランク適応技術 (LoRA) と分割学習フレームワークを組み合わせることで,大規模言語モデル (FedsLLM) のためのフェデレーション分割学習を提案する。
提案アルゴリズムは、最適化されていないシナリオと比較して平均47.63%遅延を削減する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:23:54 GMT)
GraspXL: Generating Grasping Motions for Diverse Objects at Scale [30.1] 政策学習フレームワークGraspXLにおいて,複数の動作目標に対して手物体の把握動作の発生を統一する。
58個のオブジェクトでトレーニングされたポリシーは、成功率82.2%の500万以上の未確認オブジェクトに対して、多様な把握動作を堅牢に合成することができる。
私たちのフレームワークは、さまざまな手元にデプロイでき、再構築または生成されたオブジェクトで作業できます。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:48:07 GMT)
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task [29.7] 多くの研究者がテキスト・トゥ・ビデオ(T2V)生成タスクに力を注いでいる。
本稿では,T2Vタスクのための高効率な時空間並列訓練パラダイム Mobius を提案する。
Mobiusは24%のGPUメモリと12%のトレーニング時間を節約し、T2Vの微調整タスクを大幅に改善する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:03:17 GMT)
OneActor: Consistent Character Generation via Cluster-Conditioned Guidance [29.4] 我々はOneActorと呼ばれる新しいワンショットチューニングパラダイムを提案する。
プロンプトのみによって駆動される一貫した主題生成を効率よく行う。
提案手法は多目的生成が可能であり, 一般的な拡散拡張と互換性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:03:00 GMT)
A Novel Paradigm for Neural Computation: X-Net with Learnable Neurons and Adaptable Structure [29.1] X-Netは、回帰タスクや分類タスクにおいて、ニューロンよりも同等またはそれ以上の性能を達成できることを示す。
X-Netは、科学者が数学や物理学の新しい法則を発見するのを助けることが示されている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:21:00 GMT)
MUSCLE: A Model Update Strategy for Compatible LLM Evolution [29.0] 大規模言語モデル(LLM)は、データやアーキテクチャの変更によって頻繁に更新され、パフォーマンスが向上する。
ユーザは、対話している特定の機械学習モデルの機能と能力のメンタルモデルを構築することが多い。
モデル更新における不整合の数を最小限に抑えるためのトレーニング戦略を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:12:48 GMT)
BoBa: Boosting Backdoor Detection through Data Distribution Inference in Federated Learning [26.7] フェデレーテッド・ラーニングは、その分散した性質のため、毒殺の被害を受けやすい。
本稿では,この問題を解決するために,分布認識型異常検出機構であるBoBaを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:38:42 GMT)
Whose wife is it anyway? Assessing bias against same-gender relationships in machine translation [26.7] 機械翻訳は、しばしばバイアスのあるデータやアルゴリズムに悩まされる。
MTシステムにおける同性関係に対するバイアスの程度について検討する。
3つの一般的なMTサービスは、同じ性別のエンティティ間の関係に関する文を正確に翻訳することができないことが分かりました。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:48:09 GMT)
Multi-Modal Dataset Creation for Federated~Learning with DICOM Structured Reports [26.2] フェデレーショントレーニングは、多種多様なデータストレージオプション、一貫性のない命名方式、さまざまなアノテーション手順、ラベル品質の相違により、しばしば異種データセットによって妨げられる。
これは、均一なデータ表現とフィルタリングオプションを含むデータセット調和が最重要となる、新興のマルチモーダル学習パラダイムにおいて特に顕著である。
我々は、マルチモーダルデータセットの組み立てプロセスを簡単にする、データ統合と対話型フィルタリング機能のためのオープンプラットフォームを開発した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:34:10 GMT)
DeCE: Deceptive Cross-Entropy Loss Designed for Defending Backdoor Attacks [26.2] 本稿では,コード言語モデルのセキュリティを高めるために,汎用的で効果的な損失関数DeCE(Deceptive Cross-Entropy)を提案する。
さまざまなコード合成データセット,モデル,有毒比による実験は,DeCEの適用性と有効性を示している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:18:38 GMT)
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control [25.2] オフライン強化学習を2段階最適化問題として定式化する。
まず、報酬のない行動データセットに関する表現的生成ポリシーを事前訓練し、次にこれらのポリシーを微調整して、Q値のようなタスク固有のアノテーションと整合させる。
この戦略により、多種多様な行動データを活用し、一般化を強化し、最小限のアノテーションを使って下流タスクへの迅速な適応を可能にする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:32:36 GMT)
Watermarking Text Data on Large Language Models for Dataset Copyright [25.2] ディープモデルは、下流のNLPタスクに有用な普遍言語表現を学習することができる。
ディープラーニングはさまざまなプライバシ攻撃にも脆弱だが、トレーニングデータセットには多くの機密情報が存在している。
バックドアベースのメンバシップ推論手法であるTextMarkerを用いて,新しい透かし手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:29:56 GMT)
Pedagogical Alignment of Large Language Models [24.4] 本稿では,Large Language Models (LLM) の新たな概念について紹介する。
LLMは足場ツールとして機能し、複雑な問題を管理可能なサブプロブレムに分解し、建設的なフィードバックとヒントを通じて最終回答へと導く。
本研究では、アライメントのレンズを通してタスクを観察することで物語を再解釈し、RLHF法がいかに優れた代替手段として自然に現れるかを実証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:02:03 GMT)
Look Around and Learn: Self-Training Object Detection by Exploration [23.6] エージェントは、事前訓練されたオフザシェルフ検出器を使用して環境を探索し、オブジェクトを検出し、擬似ラベルを関連付ける。
同じオブジェクトの擬似ラベルが、異なる視点で一貫性を持っていなければならないと仮定することで、ハードサンプルをマイニングするためにLook Aroundという探索ポリシーを学びます。
我々は現在の最先端の統一されたベンチマークを実装し、既存の探索政策や知覚メカニズムと比較する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:54:33 GMT)
Debiased Noise Editing on Foundation Models for Fair Medical Image Classification [23.6] 本研究は,ブラックボックス内での医療画像のバイアス問題に対処する。
本稿では,DNEノイズを発生させるD(ebiased)N(oise)E(diting)戦略を提案する。
われわれのパイプライン全体は、様々な医療状況にまたがって適用可能な公平な画像編集を可能にする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:55:42 GMT)
Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models [23.5] Adamは、他のタスクよりも大きなマージンで、大きな言語モデルでの勾配勾配よりも優れていることが示されている。
この性能ギャップの重要な要因は、言語タスクで見られる重み付きクラス不均衡であることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:10:32 GMT)
Investigating the Interplay of Prioritized Replay and Generalization [23.2] 過去のデータを再利用し、サンプル効率を向上させるため、強化学習では、経験の再生は至るところで行われている。
1つの例外は優先順位付き体験再生(PER)であり、サンプリングはTDエラーに比例して行われる。
我々はPERの様々なバリエーションを調査し、PERがいつ役に立つかを理解する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:56:24 GMT)
What Makes a Good Explanation?: A Harmonized View of Properties of Explanations [22.8] 解釈可能性(Interpretability)は、機械学習(ML)モデルの側面を検証する手段を提供する。
異なる文脈は異なる性質を持つ説明を必要とする。
説明の性質に関しては標準化の欠如がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:34:29 GMT)
Accelerating the inference of string generation-based chemical reaction models for industrial applications [22.7] 本稿では,自動回帰SMILESジェネレータの投機的復号化による推論を高速化する手法を提案する。
反応予測と1段階の逆合成では3倍高速な推算が可能であり,精度は低下しない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:55:59 GMT)
A Mathematical Framework, a Taxonomy of Modeling Paradigms, and a Suite of Learning Techniques for Neural-Symbolic Systems [22.4] 本稿では,ニューラル・シンボリックエネルギーベースモデル(NeSy-EBMs)を紹介する。
我々はNeSy-EBMを用いて,システムのニューラルシンボリックインタフェースと推論機能に着目したモデリングパラダイムの分類法を開発した。
我々はまた、スケーラビリティと表現性のために設計されたオープンソースのNeSy-EBMライブラリNeuPSL(NeuPSL)についても紹介する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:26:21 GMT)
Bora: Biomedical Generalist Video Generation Model [20.6] 本稿では,テキスト誘導型バイオメディカルビデオ生成のための最初のモデルであるBoraを紹介する。
新たに確立された医用ビデオコーパスを用いて、モデルアライメントとインストラクションチューニングによって微調整を行う。
Boraは、4つの異なるバイオメディカルドメインにわたる高品質なビデオデータを生成することができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:00:25 GMT)
Your Diffusion Model is Secretly a Noise Classifier and Benefits from Contrastive Training [20.5] 拡散モデルはデータをノイズ化することを学び、訓練されたデノイザを使用してデータ分布から新しいサンプルを生成する。
サンプルに追加される雑音のレベルを識別する,新たな自己教師型学習目標を提案する。
提案手法は逐次的および並列的な設定に有効であることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:03:50 GMT)
IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents [20.5] 本稿では,接地型自然言語命令の理解と実行が可能な対話型エージェントを開発する上での課題について述べる。
本研究では,Minecraftのような環境下で対話型接地言語命令を収集するためのスケーラブルなデータ収集ツールを提案する。
定性解析とエージェント性能比較のためのヒューマン・イン・ザ・ループ対話型評価プラットフォームを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:07:43 GMT)
BKDSNN: Enhancing the Performance of Learning-based Spiking Neural Networks Training with Blurred Knowledge Distillation [20.3] スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークを模倣し、離散スパイクを介して情報を伝達する。
本研究は,静的およびニューロモルフィックなデータセット上でSNNをトレーニングするための最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:17:24 GMT)
STD-LLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with LLMs [20.3] Spatial-underlineTemporal UnderlineData の空間的特性と時間的特性をアンダーラインLLMで理解するためのSTD-LLMを提案する。
STD-LLMは仮想ノードと同様に空間的および時間的トークン化器によって空間的時間的相関を理解する。
さまざまなデータセットの予測および計算タスクにわたって、強力なパフォーマンスと一般化能力を示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:48:16 GMT)
Continual Learning Optimizations for Auto-regressive Decoder of Multilingual ASR systems [20.1] 継続学習(CL)は、事前学習されたデータの性能を維持しながら、新しいデータで訓練済みモデルを微調整する。
自動回帰デコーダのMASRモデルにおける4つの最適化を提案する。
Common VoiceデータセットからWhisperを10の未確認言語に適応させる実験では、これらの最適化により、事前訓練された言語の平均単語誤り率(AWER)が、Experience Replayと比較して14.2%から12.4%に低下することが示されている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:07:04 GMT)
Don't Fear Peculiar Activation Functions: EUAF and Beyond [19.8] パラメトリック・プライマリ・ユニバーサル・アクティベーション・ファンクション(PEUAF)と呼ばれる新しい超表現的アクティベーション関数を提案する。
各種産業・画像データセットの系統的および包括的実験によるPEUAFの有効性を実証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:57:25 GMT)
Advancing Medical Image Segmentation with Mini-Net: A Lightweight Solution Tailored for Efficient Segmentation of Medical Images [19.6] Mini-Netは医療画像用に設計された軽量セグメンテーションネットワークである。
パラメータが38,000未満のMini-Netは、高周波数と低周波数の両方を効率的にキャプチャする。
DRIVE, STARE, ISIC-2016, ISIC-2018, MoNuSegなど,様々なデータセット上でMini-Netを評価する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:25:59 GMT)
Seq-to-Final: A Benchmark for Tuning from Sequential Distributions to a Final Time Point [18.8] 履歴データの活用は、最終期間中に限られたデータが利用できる最後の時点のモデルを学ぶために必要である。
本研究では,3種類の手法の有効性を評価するために,異なる順序の合成シフトを用いたベンチマークを構築した。
この結果から, ベンチマークのシーケンスに対して, 逐次構造を無視し, 最終時点に適応する手法は良好に動作することが示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:03:42 GMT)
Data Overfitting for On-Device Super-Resolution with Dynamic Algorithm and Compiler Co-Design [18.6] 本稿では,Content-Awareデータ処理パイプラインが支援する動的ディープニューラルネットワークを提案する。
本手法は,市販携帯電話上でのPSNRとリアルタイム性能(33FPS)の向上を実現する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:39:05 GMT)
Uplifting Range-View-based 3D Semantic Segmentation in Real-Time with Multi-Sensor Fusion [18.4] Range-View(RV)ベースの3Dポイントクラウドセグメンテーションは、そのコンパクトなデータ形式のために広く採用されている。
しかし、RVベースの手法は、隠蔽された点に対して堅牢なセグメンテーションを提供するには不十分である。
我々は新しいLiDARとカメラレンジビューに基づく3Dポイントクラウドセマンティックセマンティックセマンティック手法(LaCRange)を提案する。
提案手法は,リアルタイム性に加えて,nuScenesベンチマークの最先端結果も実現している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:41:57 GMT)
Benchmarking Language Model Creativity: A Case Study on Code Generation [17.6] 創造性は少なくとも2つの重要な特徴から成り立っている: 啓発的思考(与えられた目標を達成するための目的性)と啓示的思考(新しい環境や制約への適応性) citeprunco 2003 クリティカル
2つの特徴を取り入れたLCM創造性を定量化する枠組みを提案する。
これは、(1)デニアル・プロンプティング(Denial Prompting)は、従来のソリューションに新たな制約を漸進的に課すことによって、LLMが与えられた問題に対してより創造的な解決策を導き出すよう促す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:55:22 GMT)
Open (Clinical) LLMs are Sensitive to Instruction Phrasings [17.5] 大規模言語モデル(LLM)は、自然言語命令が与えられた幅広いタスクを実行できるが、そのような命令がどのようにフレーズ化されるかには敏感である。
このことは実際的な疑問を提起する: 臨床NLPタスクで提供される指示の自然変化に対して、命令調整型LLMはどの程度堅牢か?
本研究は,7つのLDMの自然的(非敵的)指示句に対する感受性を定量化するため,様々なタスクを通じて医師からのプロンプトを収集する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:00:44 GMT)
Towards Chapter-to-Chapter Context-Aware Literary Translation via Large Language Models [17.0] 既存の文書レベルの翻訳データセットにおける談話現象は少ない。
既存の文書レベルのコーパスや文脈対応機械翻訳手法は、文レベルのアライメントに関する非現実的な仮定に依存している。
本稿では,Ch2Ch(チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:18:22 GMT)
Towards Unified Task Embeddings Across Multiple Models: Bridging the Gap for Prompt-Based Large Language Models and Beyond [16.9] 本稿では,単一ベクトル空間内において,より小さな言語モデルや多様なプロンプトを持つ大規模言語モデルを含む,様々なモデルからのタスク埋め込みである統合タスク埋め込み(FUTE)フレームワークを提案する。
このような一様性は、異なるモデル間の類似性の比較と分析を可能にし、マルチモデルシナリオにおける既存のタスク埋め込みメソッドの範囲と有用性を広げる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:39:28 GMT)
Conformity, Confabulation, and Impersonation: Persona Inconstancy in Multi-Agent LLM Collaboration [16.8] マルチエージェントAIシステムは、科学的および実践的な応用において、集合的な意思決定をシミュレートするために使用することができる。
我々は、AIエージェントが割り当てられたペルソナを確実に採用し、人間のインタラクションを模倣する能力を評価する。
以上の結果から,マルチエージェントによる議論は,多様な視点を反映した集団的意思決定を促進することが示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:50:25 GMT)
Security Matrix for Multimodal Agents on Mobile Devices: A Systematic and Proof of Concept Study [16.6] マルチモーダル大規模言語モデルの推論能力の急速な進歩は、モバイルデバイス上での自律エージェントシステムの開発をきっかけにしている。
ヒトと機械の相互作用効率が向上したにもかかわらず、MLLMベースの移動エージェントシステムのセキュリティリスクは体系的に研究されていない。
本稿では,MLLMシステムの設計におけるセキュリティ意識の必要性を強調し,今後の攻撃・防御手法の研究の道を開く。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:30:05 GMT)
Factorized Fusion Shrinkage for Dynamic Relational Data [16.5] 本稿では,すべての分解因子がグループ単位の核融合構造に対して動的に縮小される因子化核融合収縮モデルについて考察する。
提案手法は、推定された動的潜在因子の比較とクラスタリングにおいて、多くの好ましい特性を享受する。
本稿では、最適後部推論と計算スケーラビリティのバランスをとる構造的平均場変動推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:25:05 GMT)
The topology of data hides in quantum thermal states [16.3] 量子熱状態の蒸留によるトポロジカルデータ解析(TDA)を行うための量子プロトコルを提供する。
量子熱状態生成アルゴリズムを活用するために,量子TDAをリアルタイムから仮想画像に変換する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:26:16 GMT)
Region Attention Transformer for Medical Image Restoration [16.3] 領域ベースマルチヘッド自己注意機構(R-MSA)を利用した新しい領域注意変換器(RAT)を提案する。
RATは、ロバストなセグメンション・アシング・モデル(SAM)を用いて、入力画像を非重複セマンティック領域に分割する
この領域はより柔軟で解釈可能であり、類似のセマンティック領域のピクセルのみが互いに補完し、無関係な領域からの干渉を排除している。
PET画像合成,CT画像デノイング,病理画像超解像など,様々な医用画像復元作業におけるRATの有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:52:05 GMT)
KUNPENG: An Embodied Large Model for Intelligent Maritime [16.2] KUNPENGは、スマートオーシャン構築において、インテリジェントな海洋のモデルとして初めて具現化された大型モデルである。
総合的な海上作業評価において、KUNPENGは優れた性能を示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:16:22 GMT)
MaPPing Your Model: Assessing the Impact of Adversarial Attacks on LLM-based Programming Assistants [14.9] 本稿では,攻撃者がプログラムタスクのプロンプトに少量のテキストを付加するMalicious Programming Prompt(MaPP)攻撃を紹介する。
我々の迅速な戦略は、LSMが他の方法で正しいコードを書き続けながら脆弱性を追加する可能性があることを示しています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:30:35 GMT)
Unifying Sequences, Structures, and Descriptions for Any-to-Any Protein Generation with the Large Multimodal Model HelixProtX [14.9] 我々は,大規模マルチモーダルモデル上に構築されたHelixProtXを導入し,タンパク質の任意のモダリティ生成をサポートする。
HelixProtXは、さまざまなタンパク質関連のタスクにおいて、常に優れた精度を達成し、既存の最先端モデルよりも優れています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:03:02 GMT)
PCR-99: A Practical Method for Point Cloud Registration with 99% Outliers [14.5] 本稿では,未知のスケールと極端外周比の両方を扱える点雲登録法を提案する。
速度を著しく向上させる2つの新しいメカニズムを持つ決定論的3点サンプリング手法を用いる。
提案手法は, 最大98%の外れ値比で, 最先端技術に匹敵する性能を達成できることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:15:40 GMT)
FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision [14.4] 注意は、大きな言語モデルと長いコンテキストアプリケーションのボトルネックです。
我々はGPUに注意を向ける3つの主要な技術を開発した。
提案手法であるFlashAttention-3は,FP16が最大740 TFLOPs/s(75%利用)に達し,FP8が1.2 PFLOPs/sに到達して,H100 GPU上で1.5-2.0$timesの高速化を実現していることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:15:02 GMT)
Novel clustered federated learning based on local loss [14.4] 本稿では,学習におけるデータ分布を評価するための新しい指標LCFLを提案する。
学習要件と整合し、プライバシー上の懸念に正確に対応し、より正確な分類を提供する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:37:05 GMT)
On-the-Fly Guidance Training for Medical Image Registration [14.3] 本研究は,既存の学習ベース画像登録モデルを改善するための新しいトレーニングフレームワークであるOn-the-Fly Guidance(OFG)を紹介する。
本手法では,ラベル付きデータを必要としない登録モデルをトレーニングするための教師付き手法を提案する。
提案手法は,複数のベンチマークデータセットおよび先行モデルでテストされ,性能が大幅に向上した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:49:05 GMT)
Exploring State Space and Reasoning by Elimination in Tsetlin Machine [14.2] Tsetlin Machine(TM)は機械学習(ML)において大きな注目を集めている。
TMは、単語の埋め込みを構築し、節を使ってターゲット語を記述するために使われる。
これらの節の記述能力を高めるために,節の定式化におけるReasoning by Elimination(RbE)の概念を検討した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:58:01 GMT)
Hamilton-Jacobi Reachability in Reinforcement Learning: A Survey [14.1] ハミルトン・ヤコビ到達可能集合は安全性を検証する効果的なツールとなっている。
HJリーチビリティの近似は、学習された制御ポリシーの安全性の向上や、性能の報奨に使用される。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:04:39 GMT)
A Chatbot for Asylum-Seeking Migrants in Europe [14.1] ACMEは、移民が適用可能な最も高い保護レベルを特定するのを支援することを目的としている。
このことは、亡命申請者を支援する領土委員会、裁判所、人道団体の負担を減らすことで、より持続可能な移住に寄与した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:53:40 GMT)
TensorTEE: Unifying Heterogeneous TEE Granularity for Efficient Secure Collaborative Tensor Computing [14.0] 既存の異種TEE設計は、CPUとNPU間のメモリの粒度が微妙で異なるため、協調コンピューティングでは非効率である。
安全な協調計算のための統合テンソル・グラニュラリティ異種TEEを提案する。
その結果、TEEは、既存の作業と比べて、Large Language Model(LLM)トレーニングワークロードのパフォーマンスを4.0倍改善していることがわかった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:35:18 GMT)
Less is More: Pseudo-Label Filtering for Continual Test-Time Adaptation [13.5] 連続的テスト時間適応(CTTA)は、ソースデータにアクセスすることなく、テストフェーズ中に対象ドメインのシーケンスに事前訓練されたモデルを適用することを目的としている。
既存の方法は、すべてのサンプルに対して擬似ラベルを構築し、自己学習を通じてモデルを更新することに依存している。
擬似ラベルの品質を向上させるために擬似ラベルフィルタ(PLF)を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:15:22 GMT)
WSESeg: Introducing a Dataset for the Segmentation of Winter Sports Equipment with a Baseline for Interactive Segmentation [13.4] 冬期スポーツ機器の10種類のカテゴリを対象とした,インスタンスセグメンテーションマスクを含む新しいデータセットを提案する。
我々は、これらのデータセット上でインタラクティブなセグメンテーション実験を行い、より効率的なラベリングの可能性を探る。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:20:12 GMT)
Domain-Hierarchy Adaptation via Chain of Iterative Reasoning for Few-shot Hierarchical Text Classification [13.3] 我々は,PLMの知識を非構造化の方法で下流階層に適応させるために,HTCの問題を数ショット設定で研究する。
階層的条件付き反復ランダムフィールド (HierICRF) という単純な手法を用いて、最もドメインが混在する方向を探索する。
HierICRFによるプロンプトは、平均的なMicro-F1の28.80%から1.50%、Macro-F1の36.29%から1.5%で、HTCのパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:21:57 GMT)
Leveraging large language models for nano synthesis mechanism explanation: solid foundations or mere conjectures? [12.9] 我々は,金ナノ粒子合成のメカニズムに着目した775個の多重選択質問からなるベンチマークを開発した。
そこで我々は,評価基準である信頼度に基づくスコア(cスコア)を提案し,出力ロジットを探索し,正解の正確な確率を導出する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:05:59 GMT)
Leveraging Computer Vision in the Intensive Care Unit (ICU) for Examining Visitation and Mobility [12.3] 我々は、奥行き画像に基づく最先端の非侵襲型コンピュータビジョンシステムを活用し、ICU訪問と患者の移動性を特徴付ける。
患者視力低下と訪問の増加に伴うデリリウムの出現との関連を見いだした。
ICU患者に対する非侵襲的自律システムの有用性と可能性について検討した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:43:01 GMT)
Bridging the Gap Between Information Seeking and Product Search Systems: Q&A Recommendation for E-commerce [12.3] 我々は,製品検索に関連する質問応答(Q&A)ペアを推薦し,購入決定を支援することを提案する。
我々は、この新興分野における今後の研究を促進するための課題、オープンな課題、そして解決策を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:22:17 GMT)
Federated Learning and AI Regulation in the European Union: Who is Responsible? -- An Interdisciplinary Analysis [12.1] 欧州連合人工知能法は、機械学習アプリケーションの開発とデプロイにおいて、明確な利害関係者の責任を委任する。
Federated Learningは、データサイロを越えた生成AIモデルのトレーニングを可能にし、データセキュリティを改善しながら、モデルパラメータのみを共有する。
私たちの仕事は、双方の役割を明確にすることに貢献し、責任をサーバオペレータにシフトするための戦略を説明し、オープンな技術的課題を指摘します。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:37:53 GMT)
Complexity of Digital Quantum Simulation in the Low-Energy Subspace: Applications and a Lower Bound [12.0] シミュレーションの誤差は、様々なデジタル量子シミュレーションアルゴリズムや量子システムにおいて、ハミルトニアンの有効な低エネルギーノルムに依存することを示す。
低エネルギー部分空間におけるスピンモデルをシミュレートするために、qDRIFTやランダムな置換のようなランダム化された積公式はより小さなトロッター数を必要とすることを証明した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:49:27 GMT)
Weakly-supervised Autism Severity Assessment in Long Videos [12.0] 自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、社会的コミュニケーションと相互作用の課題を特徴とする多様な神経生物学的条件のコレクションである。
長い、トリミングされていないビデオにおける非定型的な行動パターンは、ASDを持つ子供のバイオマーカーとして機能する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:45:25 GMT)
Any-Property-Conditional Molecule Generation with Self-Criticism using Spanning Trees [12.0] Spanning Tree-based Graph Generation (STGG)は有効な分子の生成を保証するための有望なアプローチである。
本研究では,STGGをマルチプロパティ条件生成に拡張する。
この結果から,STGG+は分布内および分布外条件生成における最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:32:44 GMT)
GNN with Model-based RL for Multi-agent Systems [11.9] マルチエージェントシステム(MAS)は、マシンインテリジェンスと高度な応用を探索する上で重要な役割を果たしている。
モデルベース強化学習を用いた状態空間グラフニューラルネットワークを用いて,特定のMASミッションに対処する"GNN for MBRL"モデルを提案する。
具体的には,まずGNNモデルを用いて,複数のエージェントの将来の状態や軌道を予測し,次にCEM(Cross-Entropy Method)最適化モデル予測制御を適用して,エゴエージェント計画動作を支援し,特定のMASタスクの達成に成功した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:21:35 GMT)
HUP-3D: A 3D multi-view synthetic dataset for assisted-egocentric hand-ultrasound pose estimation [11.9] HUP-3Dは手動超音波プローブポーズ推定のための3次元マルチビュー合成データセットである。
私たちのデータセットは31万以上の動きで構成されています。
我々のアプローチには、画像レンダリングの概念、様々な手や腕のテクスチャによる多様性の向上が含まれる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:25:42 GMT)
Mitigating Entity-Level Hallucination in Large Language Models [11.9] 本稿では,大規模言語モデル(LLM)における幻覚の検出・緩和手法として,幻覚検出(DRAD)に基づく動的検索拡張を提案する。
実験の結果,LDMにおける幻覚の検出と緩和の両面において,DRADは優れた性能を示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:47:34 GMT)
TAPFixer: Automatic Detection and Repair of Home Automation Vulnerabilities based on Negated-property Reasoning [11.8] 本稿では,HAシステムにおけるルール間相互作用の脆弱性を自動的に検出し,修復する新しいフレームワークであるTAPFixerを提案する。
HAプロファイルからTAPルールを抽出し、物理的および遅延特性を持つオートマトンモデルに変換し、さまざまな正しさ特性を持つモデルチェックを実行する。
次に、新しいネゲートプロパティ推論アルゴリズムを使用して、ネゲートプロパティに基づいたモデル抽象化と改善、モデルチェックを通じてパッチを自動的に推論する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:43:26 GMT)
milliFlow: Scene Flow Estimation on mmWave Radar Point Cloud for Human Motion Sensing [11.5] mmWaveレーダーはプライバシーにやさしい機能のために人気を博している。
我々はmmWave点雲の相補的な動き情報としてシーンフローを推定する新しい深層学習手法である MilliFlow を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:56:07 GMT)
Machine Apophenia: The Kaleidoscopic Generation of Architectural Images [11.5] 本研究では,建築設計における生成人工知能の適用について検討する。
本稿では,複数のニューラルネットワークを組み合わせて,教師なしかつ修正されていないユニークなアーキテクチャイメージのストリームを生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:11:19 GMT)
Generative AI in Higher Education: Seeing ChatGPT Through Universities' Policies, Resources, and Guidelines [11.5] 本研究は、GenAIの利用に関して、米国トップクラスの大学が確立した学術政策とガイドラインを分析した。
その結果,これらの大学の大部分は,GenAIに対するオープンだが慎重なアプローチを採用していることが示唆された。
発見は、教育実践における教育者に4つの実践的意味を与える。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:21:46 GMT)
PID: Physics-Informed Diffusion Model for Infrared Image Generation [11.4] 赤外線イメージング技術は、低視認性条件下での信頼性の高いセンシング能力に大きな注目を集めている。
既存の画像翻訳法の多くは、赤外線画像は、基礎となる物理法則を無視して、スタイリスティックなバリエーションとして扱う。
物理法則に従う赤外線画像にRGB画像を変換するための物理情報拡散(PID)モデルを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:32:30 GMT)
Enhancing Emotion Recognition in Incomplete Data: A Novel Cross-Modal Alignment, Reconstruction, and Refinement Framework [11.3] 本稿では、CM-ARR(Cross-Modal Alignment, Reconstruction and Refinement)フレームワークを提案する。
このフレームワークは、欠落したモダリティを扱うために、クロスモーダルアライメント、再構築、改善フェーズに従事します。
IEMOCAPおよびMSP-IMPROVデータセットの実験により、CM-ARRの欠落と完全モダリティの両方の条件下での優れた性能が確認された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:44:42 GMT)
Soft Prompts Go Hard: Steering Visual Language Models with Hidden Meta-Instructions [10.9] 画像上で動作する言語モデルに,新たなタイプの間接的インジェクション脆弱性を導入する。
ソフトプロンプトとして機能する画像を生成することによってメタ命令を生成する方法について説明する。
誤情報やスピンを含むこれらの攻撃のリスクについて,複数の視覚言語モデルに対して有効性を評価する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:40:13 GMT)
AI-based Drone Assisted Human Rescue in Disaster Environments: Challenges and Opportunities [10.8] 無人航空機(UAV)は、災害時の捜索救助任務のために頻繁に配備される。
大規模なドローンは、孤立した災害で立ち往生している人々に必須の物資を届けるために使われる場合もある。
聴覚システムは、動物の鳴き声や風など、自然に発生する人間の叫び声と音を区別しなければならない。
この課題に対処するためには、人工知能(AI)を使用して音の周波数を分析し、一般的なオーディオシグネチャを識別する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:34:34 GMT)
Context Embeddings for Efficient Answer Generation in RAG [10.7] 提案するCOCOMは,コンテキストの長いコンテキストを少数のコンテキスト埋め込みに短縮する,効果的なコンテキスト圧縮手法である。
提案手法では,最大5.69ドルの高速化を実現しつつ,既存の効率的な文脈圧縮手法と比較して高い性能を実現している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:30:44 GMT)
A Comprehensive Review of Community Detection in Graphs [10.7] 複雑なネットワークの研究は、我々のコミュニティ構造に対する理解を著しく前進させてきた。
グラフ内のコミュニティを検出することは、社会学、生物学、計算機科学の応用において難しい問題である。
本稿では, グラフにおけるコミュニティ検出の話題について概説し, 様々なコミュニティ検出手法の徹底的な解説を行う。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:55:47 GMT)
Establishing a Baseline for Gaze-driven Authentication Performance in VR: A Breadth-First Investigation on a Very Large Dataset [10.6] 本稿では,9202人の視線記録のデータセットを用いて,視線駆動型認証性能のベースラインを確立する。
我々の主要な発見は、最先端の機械学習アーキテクチャと十分に大きなトレーニングデータセットによって駆動される場合、視線認証はFIDO標準で必要とされるように正確であることを示している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:05:17 GMT)
RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton [10.5] 動作学習から視覚的特徴抽出を分離する革新的なアプローチであるRoboUniViewを提案する。
我々はまず、アクセスしやすいデータに基づいて事前学習することで、多視点ビューから統一されたビュー表現を学び、その後、この統合されたビュー表現からアクションを導出し、ロボット操作を制御する。
CALVINベンチマークの最先端性能を達成し、D$が93.0%から96.2%に、ABC$が92.2%から94.2%に、D$が93.0%から96.2%に向上した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:57:43 GMT)
Local Optima in Diversity Optimization: Non-trivial Offspring Population is Essential [10.5] 例えば$k$-vertexのカバー問題があり、これは通常の単目的最適化と多様性最適化の重大な違いを浮き彫りにしている。
さらに、$(mu + lambda)$ EA with $lambda ge mu$は、$k$-vertexのカバーで、事実上多様な集団を見つけることができることも示しています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:27:47 GMT)
Pronunciation Assessment with Multi-modal Large Language Models [10.4] 大規模言語モデル(LLM)に基づくスコアリングシステムを提案する。
音声エンコーダは、まず学習者の音声を文脈的特徴にマッピングする。
アダプタ層は、これらの機能を潜在空間に埋め込まれたテキストに合わせるように変換する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:16:14 GMT)
Identification and Estimation of the Bi-Directional MR with Some Invalid Instruments [10.3] 両方向メンデルランダム化(MR)における純粋観測データから因果効果を推定する難題について考察する。
本稿ではまず,観測データから双方向MRの同定を理論的に検討する。
我々は,有効なIV集合を発見し,興味の因果効果を推定するクラスタ融合的手法を開発した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:15:58 GMT)
Towards Adaptive Pseudo-label Learning for Semi-Supervised Temporal Action Localization [10.2] 既存の手法はしばしば厳密な条件に基づいて擬似ラベルをフィルタリングし、最適でない擬似ラベルのランク付けと選択につながる。
擬似ラベル選択を容易にするための適応擬似ラベル学習フレームワークを提案する。
本手法は,各種半教師付き環境下での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:36:55 GMT)
WateRF: Robust Watermarks in Radiance Fields for Protection of Copyrights [10.1] 我々はNeRFの両表現に利用できる革新的な透かし手法を提案する。
これは、NeRFを微調整してバイナリメッセージをレンダリングプロセスに埋め込むことによって実現される。
提案手法は,2次元レンダリング画像に埋め込まれた透かしの容量,可視性,堅牢性の3つの異なる側面で評価する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:35:19 GMT)
3M-Health: Multimodal Multi-Teacher Knowledge Distillation for Mental Health Detection [9.5] メンタルヘルス分類のためのマルチモーダル・マルチティーラー知識蒸留モデルを提案する。
多様な特徴を統合するための単純な結合にしばしば依存する従来のアプローチとは異なり、我々のモデルは様々な性質の入力を適切に表現するという課題に対処する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:22:45 GMT)
Enhancing Few-Shot Stock Trend Prediction with Large Language Models [9.4] 既存の手法は主に、広範囲な注釈付きデータに基づいてトレーニングされた教師付きモデルによる株価トレンドの予測に重点を置いている。
本稿では,ラベル付きデータの不足を克服するために,Large Language Models (LLM) を数ショットで使用することを提案する。
S&P500は66.59%、CSI-100は62.17%、HK株価予測は61.17%である。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:43:11 GMT)
Accuracy is Not All You Need [9.4] 複数の圧縮技術、モデル、データセットにまたがるメトリクスの詳細な調査を行います。
本研究では, 圧縮モデルがエンドユーザーに対して可視である場合, 精度が類似している場合でも, ベースラインモデルとは大きく異なることを示す。
我々は、KL-Divergence と flips という2つの指標を提案し、それらがよく相関していることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:19:02 GMT)
ViewFormer: Exploring Spatiotemporal Modeling for Multi-View 3D Occupancy Perception via View-Guided Transformers [9.3] 3Dの占有は、前景と背景を物理的空間で区別することなく、全体のシーンをグリッドマップに表現する。
本稿では,効果的な多視点特徴集約のための学習優先視点アテンション機構を提案する。
既存の高品質データセットの上に構築されたベンチマークであるFlowOcc3Dを紹介します。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:43:20 GMT)
Depth Information Assisted Collaborative Mutual Promotion Network for Single Image Dehazing [9.2] 単一画像のデハジングを実現するために,デュアルタスク協調促進フレームワークを提案する。
このフレームワークは、デュアルタスク相互作用機構による深度推定とデハジングを統合している。
提案手法は,最先端手法よりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:45:53 GMT)
Automata-based constraints for language model decoding [9.1] LMは、いくつかの形式言語で文字列を生成することがしばしば期待されている。
チューニングにはかなりのリソースが必要で、一般的でない、あるいはタスク固有のフォーマットでは実用的ではない。
我々はこれらの問題をオートマトン理論を適用して解決する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:02:43 GMT)
Implicit meta-learning may lead language models to trust more reliable sources [9.1] 合成微調整データセットにおける有用性の指標としてランダム文字列(タグ)を導入する。
このデータセットの微調整は暗黙的メタラーニング(IML)につながる
私たちは、将来のAIシステムの能力、リスク、制御可能性について、私たちの結果が示唆するものを反映しています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:03:25 GMT)
A Survey on Deep Learning Hardware Accelerators for Heterogeneous HPC Platforms [9.0] この調査は、ディープラーニングアクセラレータの設計における最新の進歩を要約し、分類する。
それは、GPUやTPUベースのアクセラレータだけでなく、設計固有のハードウェアアクセラレータも含む、ディープラーニングアクセラレーションをサポートするための最も高度なアプローチを強調している。
この調査では、新たなメモリ技術とコンピューティングパラダイムに基づいたアクセラレータについても説明している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:50:59 GMT)
Exploring Knowledge Transfer in Evolutionary Many-task Optimization: A Complex Network Perspective [9.0] 本稿では,EMATO内のタスク間の知識伝達のダイナミクスを解析するために,複雑なネットワークを利用する新しいフレームワークを提案する。
その結果,これらのネットワークは多様であり,ネットワーク密度は異なるタスクセットに適応し,コミュニティ構造を指向したグラフ特性を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:49:04 GMT)
Conversational Assistants in Knowledge-Intensive Contexts: An Evaluation of LLM- versus Intent-based Systems [8.9] 言語モデル(LLM)により、会話アシスタント(CA)はより柔軟で人間的な方法で会話できる。
LLMは、インテントベースのシステムよりも優れたユーザエクスペリエンス、タスク完了率、ユーザビリティ、認識パフォーマンスを示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:31:14 GMT)
A Novel Quantum Realization of Jet Clustering in High-Energy Physics Experiments [8.8] 高エネルギー粒子衝突ではクォークとグルーオンが生成され、すぐにジェットとして知られる衝突粒子噴霧を形成する。
正確なジェット・クラスタリングは、起源のクォークやグルーオンの情報を保持するために重要である。
この研究は、ジェットクラスタリングに革命をもたらす量子コンピューティングの可能性を強調した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:26:22 GMT)
UserBoost: Generating User-specific Synthetic Data for Faster Enrolment into Behavioural Biometric Systems [8.8] 実データと合成データを併用することで,生体認証システムにエンロールするために必要な実データポイント数を削減できることを示す。
実世界のシステムにおいて,学習における合成ジェスチャーを用いることで,分類能力の向上が期待できることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:10:07 GMT)
Diagnosing and Re-learning for Balanced Multimodal Learning [8.8] 本稿では,不均衡なマルチモーダル学習問題を克服するための診断・再学習手法を提案する。
各モードの学習状態は、その一様表現空間の分離性に基づいて推定される。
このように、少ない情報モダリティの過度な強調は避けられる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:12:03 GMT)
Real Face Video Animation Platform [8.8] リアルな人間の顔から漫画的な顔へのリアルタイムな変換を可能にする顔アニメーションプラットフォームを提案する。
ユーザーは本物の顔のビデオや画像を入力し、好きな漫画のスタイルを選択することができる。
システムは自動的に顔の特徴を分析し、必要な事前処理を実行し、適切なモデルを実行して表現力のあるアニメスタイルの顔を生成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:17:41 GMT)
Neural-based Video Compression on Solar Dynamics Observatory Images [8.7] NASAのソーラー・ダイナミクス・オブザーバトリー(SDO)ミッションは、太陽の日常活動を監視するために膨大なデータを収集する。
データ圧縮は、限られたテレメトリレートによって引き起こされる課題に対処する上で重要な役割を果たす。
本稿では,SDOの画像データ収集における圧縮率の高いニューラルビデオ圧縮手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:24:25 GMT)
DART: An Automated End-to-End Object Detection Pipeline with Data Diversification, Open-Vocabulary Bounding Box Annotation, Pseudo-Label Review, and Model Training [8.7] 本稿では,オブジェクト検出のためのエンドツーエンド自動パイプラインであるDARTについて述べる。
DARTは、多様なシナリオに優れながら、人間のラベル付けと広範なデータ収集の必要性を排除する。
現在のDARTの実装により、平均精度(AP)は0.064から0.832に大幅に向上した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:16:44 GMT)
Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks [8.7] そこで本研究では,最も基本的な構文操作を生音声から直接,教師なしの方法でモデル化できることを提案する。
本稿では,各単語の音響記録を訓練した畳み込みニューラルネットワーク(CNN)が,2、3単語で出力を発生させる現象について紹介する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:30:23 GMT)
Fast and Robust Phase Retrieval via Deep Expectation-Consistent Approximation [8.7] 本稿では,予測整合近似とDeep Denoising Networkを組み合わせたDeepECprを提案する。
DeepECprは、最近の拡散法にインスパイアされた新しい減衰スキームを含んでいる。
PSNRとSSIMでは5倍のデノイザコールで改善が見られた。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:12:50 GMT)
Boundary State Generation for Testing and Improvement of Autonomous Driving Systems [8.7] 本稿では,自律運転システム(ADS)テストのための新しいテストジェネレータであるGENBOについて述べる。
このような境界条件を用いて、初期トレーニングデータセットを拡張し、テスト中のDNNモデルを再訓練する。
評価結果から,再学習モデルでは,元のDNNモデルに対して,異なる評価トラックに対して平均で最大3倍の成功率を示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:02:19 GMT)
The Minimum Information about CLinical Artificial Intelligence Checklist for Generative Modeling Research (MI-CLAIM-GEN) [8.6] 新しい生成モデルは、専門的なトレーニングデータをほとんど、あるいは全く持たずに有用な出力を生成することができる。
新しいチェックリストは、非生成的(予測的)AIモデルと比較して、トレーニング、評価、解釈可能性、および新しい生成モデルの違いに対処することを目的としている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:46:33 GMT)
Data organization limits the predictability of binary classification [8.5] 実データセット上でのバイナリ分類性能の理論的上限は理論的に達成可能であることを示す。
本分析により,2値分類データにおける性能の上限値とクラス重複レベルとの詳細な関係が明らかになった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:04:47 GMT)
A Survey on Symbolic Knowledge Distillation of Large Language Models [8.2] 大規模言語モデルにおける記号的知識蒸留の出現と臨界領域に焦点を当てた調査。
知識の深みを理解可能なフォーマットで維持することを含む、中核的な課題について説明する。
この分野で開発された様々なアプローチや技法を精査する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:18:19 GMT)
Evaluating AI Evaluation: Perils and Prospects [8.1] 本稿では,これらのシステムに対する評価手法が根本的に不適切であることを主張する。
AIシステムを評価するためには改革が必要であり、インスピレーションを得るために認知科学に目を向けるべきである、と私は主張する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:37:13 GMT)
HETOCompiler: An MLIR-based crypTOgraphic Compilation Framework for HEterogeneous Devices [8.1] HETOCompilerは、異種システム用に設計された新しい暗号コンパイルフレームワークである。
HETOCompilerは、暗号プリミティブと異種コンピューティングモデルのための構文とセマンティクスを抽象化する。
実験の結果、既存のOpenSSLライブラリよりも大幅にパフォーマンスが向上した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:12:51 GMT)
Equivariant vs. Invariant Layers: A Comparison of Backbone and Pooling for Point Cloud Classification [7.8] 3つのベンチマークポイントクラウド分類データセット上で、置換同変バックボーンと置換不変大域プールの相互作用について検討した。
以上の結果から,トランスポートベースやアテンションベースといった複雑なプーリング手法は,単純なバックボーンの性能を大幅に向上させる可能性が示唆された。
プール層の選択は、バックボーンの幅と深さを調整するよりも、モデルの性能に顕著な影響を与える可能性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:40:41 GMT)
Segmenting Medical Images with Limited Data [7.8] データ効率医療セグメンタ(DEMS)と呼ばれる半教師付き一貫性に基づくアプローチを提案する。
DEMSはエンコーダ・デコーダアーキテクチャを備え、開発されているオンライン自動拡張器(OAA)と残留ロバストネス強化(RRE)ブロックを組み込んでいる。
極端なデータ不足のシナリオ下では、私たちのDEMSは、それぞれU-Netとトップパフォーマンスの最先端手法と比較して、ダイススコアが16.85%と10.37%向上しました。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:41:18 GMT)
Guidelines for Augmentation Selection in Contrastive Learning for Time Series Classification [7.7] 我々は、トレンドや季節といったデータセットの特徴に基づいて、拡張を選択するための原則的な枠組みを確立する。
次に、12の合成データセットと6つの実世界のデータセットにまたがる8つの異なる拡張の有効性を評価する。
提案手法は,時系列データセットの有効拡張を正確に識別する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:13:16 GMT)
Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.5] 本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。
また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:13:48 GMT)
Does Incomplete Syntax Influence Korean Language Model? Focusing on Word Order and Case Markers [7.3] 語順やケースマーカーなどの構文要素は自然言語処理において基本的なものである。
本研究は,韓国語モデルがこの柔軟性を正確に捉えることができるかどうかを考察する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:33:41 GMT)
Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space [7.1] 既存の手法は、画質と透かしの堅牢性のジレンマに直面している。
画像品質の優れた透かしは通常、ぼやけやJPEG圧縮のような攻撃に対して弱い堅牢性を持つ。
進行訓練戦略を用いた潜時透かしを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:41:44 GMT)
TelecomGPT: A Framework to Build Telecom-Specfic Large Language Models [7.0] 大きな言語モデル(LLM)は、第6世代(6G)通信ネットワークに革命をもたらす可能性がある。
本稿では,汎用LLMを通信用LLMに適応させるパイプラインを提案する。
既存の評価ベンチマークを拡張し、Telecom Math Modeling、Telecom Open QnA、Telecom Code Tasksという3つの新しいベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:51:02 GMT)
BiSHop: Bi-Directional Cellular Learning for Tabular Data with Generalized Sparse Modern Hopfield Model [6.9] BiSHopは、深層表型学習の2つの大きな課題に対処する。
BiSHopはデュアルコンポーネントのアプローチを採用し、列ワイドと行ワイドの両方のデータを逐次処理する。
We show BiSHop comes over current SOTA method with significantly less HPO run。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:45:41 GMT)
ECG Signal Denoising Using Multi-scale Patch Embedding and Transformers [6.9] 本稿では,1次元畳み込み層と変圧器アーキテクチャを組み合わせた深層学習手法を提案する。
次に、この埋め込みをトランスネットワークの入力として使用し、ECG信号をデノナイズするトランスの能力を高める。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:13:52 GMT)
Phase Diagram of the Schwinger Model by Adiabatic Preparation of States on a Quantum Simulator [6.2] 我々は、状態の断熱的準備を通じて量子デバイス上の量子物理系の位相構造を研究することが可能であると主張している。
そこで我々は新しい手法を導入し、Swingerモデルに適用し、トポロジカルな$theta$-termの存在下でテストに成功した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:44:49 GMT)
Logical Characterizations of Recurrent Graph Neural Networks with Reals and Floats [6.2] 本稿では,2つのシナリオにおいて,繰り返しグラフニューラルネットワーク(GNN)の正確な論理的特徴について述べる。
フロートに対して、繰り返しGNNと一致する形式主義は数えられるルールベースのモーダル論理であり、実数に対しては適切な無限のモーダル論理を用いる。
キャラクタリゼーションを適用することで、モナディック二階述語論理で定義可能なグラフ特性と比較して、無限論理と規則論理は等しく表現力があることが証明できる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:34:58 GMT)
Exploring Generative AI Policies in Higher Education: A Comparative Perspective from China, Japan, Mongolia, and the USA [6.1] 本研究は,中国,日本,モンゴル,米国の4カ国における生成AIに関する国家政策の比較分析を行った。
全4カ国が高等教育における生成AIに対する肯定的な態度を示す一方で、日本とアメリカは人間中心のアプローチを優先している。
中国とモンゴルは国家の安全に関する懸念を優先し、そのガイドラインは特に教育に合わせたものではなく、社会水準に重点を置いている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:44:09 GMT)
GRAMMAR: Grounded and Modular Methodology for Assessment of Closed-Domain Retrieval-Augmented Language Model [6.1] Retrieval-augmented Generation (RAG) システムは、ドメイン固有の知識ベースを問うために、様々な産業で活発に研究され、展開されている。
これらのシステムを評価することは、ドメイン固有のクエリが不足し、それに対応する基底真理が不足しているため、ユニークな課題である。
GRAMMARは,1)リレーショナルデータベースとLCMを利用して,スケーラブルな問合せ対を効率よく生成するデータ生成プロセス,2)知識ギャップと堅牢性を区別し,欠陥モジュールの識別を可能にする評価フレームワークである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:16:30 GMT)
Scalability of Bayesian Network Structure Elicitation with Large Language Models: a Novel Methodology and Comparative Analysis [5.9] 本稿では,異なる経験を持つ複数のLLMに基づいて,ベイズネットワーク (BN) 構造解析手法を提案する。
異なる大きさのBNを多種多様かつ広く知られていないBNに対して,本手法を1つの代替手法と比較し,その拡張性について検討する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:52:13 GMT)
Attribution Methods in Asset Pricing: Do They Account for Risk? [5.9] 本稿では、資産価格ドメインの知識から導かれるいくつかの公理を提示し、研究する。
シャプリー値と積分勾配は、ほとんどの公理を保存するが、どちらも全ての公理を満たすことはできない。
分析的および実証的な例を用いて、帰属法がいかにリスクを反映し、いつ使用すべきでないかを実証する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:16:54 GMT)
EVOLVE: Predicting User Evolution and Network Dynamics in Social Media Using Fine-Tuned GPT-like Model [5.6] 本研究では,ソーシャルメディア上での利用者の生活の進化を予測的に理解する手法を提案する。
GPTライクなデコーダのみのモデルを微調整し、オンラインソーシャルメディアにおけるユーザの進化の将来の段階を予測する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:20:57 GMT)
Heterogeneous Subgraph Network with Prompt Learning for Interpretable Depression Detection on Social Media [5.6] ソーシャルメディアにおける早期うつ病検出に関する既存の研究は、解釈可能性に欠けていた。
本稿では,プロンプト学習を用いた異種サブグラフネットワークを利用した新しい手法を提案する。
提案手法はソーシャルメディア上での抑うつ検出の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:20:59 GMT)
On the Design and Security of Collective Remote Attestation Protocols [5.0] Collective Remote Attestation (CRA)は、(異種)ネットワークにおいて、侵入されたデバイスを効率的に識別することを目的としたセキュリティサービスである。
ここ数年、CRAプロトコルの提案が大幅に増加し、様々なネットワークトポロジによってガイドされた様々な設計が示されている。
CRAプロトコルを体系的に比較可能な統合フレームワークであるCatを提示する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:06:49 GMT)
SlideGCD: Slide-based Graph Collaborative Training with Knowledge Distillation for Whole Slide Image Classification [5.0] 最近の研究は、スライド間の相関を無視した1つのWSIの内部コンテキスト情報に主に焦点を当てている。
本稿では,既存のマルチインスタンス学習(MIL)手法をバックボーンとして考慮し,ノード分類問題としてWSI分類タスクをフォークする汎用的なWSI解析パイプラインSlideGCDを提案する。
2つのTCGAベンチマークデータセットで、これまでの4つの最先端MILメソッドのSlideGCDによる一貫したパフォーマンス向上が観察された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:32:13 GMT)
FD-SOS: Vision-Language Open-Set Detectors for Bone Fenestration and Dehiscence Detection from Intraoral Images [5.0] FD-SOSは、口腔内画像からFDを検出するための新しいオープンセットオブジェクト検出器である。
CCDN( Conditional contrastive denoising)とTMA(orth-specific matching assignment)の2つの新しい構成要素がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:29:25 GMT)
A Deployable Quantum Access Points Selection Algorithm for Large-Scale Localization [5.0] 本稿では,大規模ローカライゼーションシステムのための量子APs選択アルゴリズムを提案する。
環境中で利用可能なAPの14%未満を選択することで、我々の量子アルゴリズムはAPの集合全体を利用するのと同じフロアローカライズ精度を達成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:59:37 GMT)
Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text [4.9] WhosAIは、与えられた入力テキストが人間かAIによって生成されたかを予測するために設計された3重ネットワークコントラスト学習フレームワークである。
提案するフレームワークは,チューリングテストとオーサリングの両タスクにおいて,優れた結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:44:56 GMT)
SAT Encoding of Partial Ordering Models for Graph Coloring Problems [4.8] グラフ着色問題と帯域幅着色問題に対する部分順序付けベースLPモデルの新たなSAT符号化を提案する。
広く研究されているGCPでは、新しいSATエンコーディングとDIMACSベンチマークセットの最先端アプローチを実験的に比較する。
理論解析により,部分順序付きSATとILPの定式化は古典的代入ベースモデルよりも大幅に小さいことがわかった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:08:05 GMT)
Flow-Based Generative Emulation of Grids of Stellar Evolutionary Models [4.7] 恒星進化モデルの格子をエミュレートするフローベース生成手法を提案する。
様々な進化軌道やアイソクロンを連続的な入力パラメータにわたってエミュレートする能力を示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:54:17 GMT)
Lite-SAM Is Actually What You Need for Segment Everything [4.7] Lite-SAMはSegEveryタスクの効率的なエンドツーエンドソリューションである。
Lite-SAMは4つの主要コンポーネントで構成されている: 合理化されたCNN-Transformerハイブリッドエンコーダ(LiteViT)、自動プロンプトプロポーザルネットワーク(AutoPPN)。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:28:46 GMT)
Random Inverse Problems Over Graphs: Decentralized Online Learning [4.6] ネットワークグラフ上の分散ランダム逆問題とオンライン計測のフレームワークを構築した。
無限ヒルベルト空間におけるL2-漸近安定理論を開発する。
非定常および非独立オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:17:04 GMT)
Revealing the True Cost of Locally Differentially Private Protocols: An Auditing Perspective [4.5] 本稿では,ローカルな差分秘密機構のプライバシー損失を実証的に推定する LDP-Auditor フレームワークについて紹介する。
我々は、異なるエンコーディングや摂動機能の影響など、プライバシー監査に影響を与える要因を幅広く検討する。
LDP-Auditorフレームワークは,現在最先端のLPP Pythonパッケージにバグが発見されている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:49:48 GMT)
Integrating White and Black Box Techniques for Interpretable Machine Learning [4.5] 機械学習アルゴリズム設計では、アルゴリズムの解釈可能性と性能の間にトレードオフが存在する。
本稿では,高解釈可能な分類器を用いて,より簡単な入力を分類するアンサンブル分類器の設計を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:58:04 GMT)
Exploring Data Management Challenges and Solutions in Agile Software Development: A Literature Review and Practitioner Survey [4.5] ソフトウェア製品とその開発に関連するデータを管理することは、ソフトウェアプロジェクトやアジャイルチームにとって大きな課題となる。
課題には、さまざまなソースからのデータを統合し、継続的な変更と適応の観点からデータ品質を保証することが含まれる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:33:59 GMT)
Traffic signal optimization in large-scale urban road networks: an adaptive-predictive controller using Ising models [4.4] 本稿では,スケーラビリティと最適性の両方を保証するAMPICという制御手法を提案する。
提案手法では,車両流の予測モデルを明確に考慮し,各制御区間における最適制御問題の解法としてモデル予測制御を用いる。
その結果,AMPICは従来の制御方式よりも待ち時間が少なく,より高速な走行が可能であった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:55:44 GMT)
Introducing GPU-acceleration into the Python-based Simulations of Chemistry Framework [4.4] 我々はPySCFのメソッドのGPUアクセラレーションを提供するモジュールであるGPU4PySCFの最初のバージョンを紹介する。
ベンチマーク計算は、PySCFのマルチスレッドCPUHartree-Fockコードに対して、2桁の大幅な高速化を示している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:50:19 GMT)
Feasibility Study on Active Learning of Smart Surrogates for Scientific Simulations [4.4] 深層ニューラルネットワーク(DNN)のサロゲートトレーニングにアクティブラーニングを組み込むことの可能性を検討する。
これにより、インテリジェントで客観的なトレーニングシミュレーションの選択が可能になり、広範なシミュレーションデータを生成する必要がなくなる。
その結果、スマートサロゲートのための高性能コンピューティング基盤の開発の基礎となった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:10:53 GMT)
ConRebSeg: A Segmentation Dataset for Reinforced Concrete Construction [4.3] 鉄筋コンクリート施工のためのセグメンテーションラベル付き14,805枚のRGB画像のデータセットを提供する。
データ可用性とラベルの不整合がモデルの性能に与える影響について検討する。
我々は,建設業界における自律ロボットシステムの開発を促進するために,クラウドソースによるデータセットを提唱する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:53:15 GMT)
DANIEL: A fast Document Attention Network for Information Extraction and Labelling of handwritten documents [4.3] 手書き文書理解のための完全なエンドツーエンドアーキテクチャであるDANIEL(Document Attention Network for Information extract and Labelling)を紹介する。
DANIELは全ページ文書上でレイアウト認識、手書き認識、名前付きエンティティ認識を行う。
複数の言語、レイアウト、タスクを同時に学習できる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:09:56 GMT)
On Exact Bit-level Reversible Transformers Without Changing Architectures [4.3] 推論手順のアーキテクチャを変更することなく、正確なビットレベルの可逆変換器を提案する。
BDIA変換器は、$gamma$パラメータの正規化効果により、元の変換器よりも優れている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:42:58 GMT)
Movie Recommendation with Poster Attention via Multi-modal Transformer Feature Fusion [4.2] 本研究では,各映画のポスターの特徴を抽出し,マルチモーダルな映画レコメンデーションシステムを提案する。
概念実証モデルの効率は、MovieLens 100Kと1Mデータセットの標準ベンチマーク問題によって検証される。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:44:51 GMT)
Towards Practical and Useful Automated Program Repair for Debugging [4.2] PracAPRは統合開発環境(IDE)で動作する対話型修復システムである
PracAPRはテストスイートやプログラムの再実行を必要としない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:19:54 GMT)
Streaming quantum state purification [4.2] 量子状態浄化(Quantum state purification)は、未知の純粋な量子状態のほぼ純粋なコピーを復元する作業である。
この基本的なタスクは、ノイズの多いチャネル上の量子通信や不完全なデバイスによる量子計算に応用できる。
任意の次元のクォーディットのスワップテストに基づいて効率的な浄化手順を導出する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:28:06 GMT)
Vehicle-to-grid for car sharing -- A simulation study for 2030 [4.1] カーシェアリングシステムは、車両間グリッド(V2G)技術による補助サービスの提供を通じてグリッド安定性を高める上で重要な役割を果たす。
本研究では、スイスにおける全国規模のサービスのための将来のシナリオを設計し、カーシェアリングにおけるV2Gの可能性を分析する。
本研究は意思決定者に対してガイドラインを提供し,カーシェアリングの領域内での電力取引に関する規制強化の必要性を強調した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:55:01 GMT)
CLIP-PAE: Projection-Augmentation Embedding to Extract Relevant Features for a Disentangled, Interpretable, and Controllable Text-Guided Face Manipulation [4.1] 対照的に、CLIP(Contrastive Language- Image Pre-Training)は、画像とテキストを共同の潜在空間に埋め込むことでブリッジする。
共同空間における画像とテキストの埋め込みの相違により、最適化対象としてテキストの埋め込みを用いることで、結果の画像に望ましくないアーティファクトがしばしば導入される。
テキスト誘導画像操作の性能向上のための最適化ターゲットとして,CLIPプロジェクション拡張埋め込み(PAE)を導入する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:44:29 GMT)
Large Language Models for Integrating Social Determinant of Health Data: A Case Study on Heart Failure 30-Day Readmission Prediction [4.0] 健康の社会的決定因子(SDOH)は、健康の結果に重要な役割を果たす。
最近のオープンデータイニシアチブは、より包括的なSDOHのビューを構築する機会を提供する。
大規模言語モデル(LLM)は、構造化されたデータを自動的にアノテートすることを約束している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 21:14:06 GMT)
CAMP: Continuous and Adaptive Learning Model in Pathology [4.0] 病理画像分類のためのCAMPにおける連続的適応学習モデルを提案する。
CAMPは生成的、効率的、適応的な分類モデルであり、任意の分類タスクに継続的に適応することができる。
我々はCAMPを17の分類タスクに対して,1,171,526のパッチと11,811の病理スライドを含む22のデータセットで評価した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:45:37 GMT)
MonoSparse-CAM: Harnessing Monotonicity and Sparsity for Enhanced Tree Model Processing on CAMs [4.0] 本稿では,コンテンツ適応型メモリ(CAM)に基づく計算最適化技術であるMonoSparse-CAMを紹介する。
MonoSparse-CAMはTBMLモデルスパーシリティとCAMアレイ回路を効率よく利用し、処理性能を向上させる。
CAMベースのコンピューティングにおいて,効率的なデプロイメント最適化ソリューションとしてMonoSparse-CAMを提案するとともに,TBMLモデル構造が配列空間に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:34:59 GMT)
Combining Neural Networks and Symbolic Regression for Analytical Lyapunov Function Discovery [3.8] 非線形力学系に対する解析的リアプノフ関数を構成するために,CoNSAL (Combining Neural Network and regression for Analytical Lyapunov function)を提案する。
このフレームワークは、ニューラルネットワークを精密な分析形式に蒸留するためにシンボリックレグレッションを適用する、ニューラルリアプノフ関数とシンボリックレグレッション成分を含む。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:08:46 GMT)
Computational-Statistical Trade-off in Kernel Two-Sample Testing with Random Fourier Features [3.7] MMD(Maximum Mean Discrepancy)テストは、複雑で高次元のデータを扱う効果的なツールとして登場した。
MMD試験と同じ出力保証を準4次時間で達成できるかどうかは不明だ。
準4次時間内にMDD試験と同じミニマックス分離率が得られることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:08:01 GMT)
One Stone, Four Birds: A Comprehensive Solution for QA System Using Supervised Contrastive Learning [3.7] 本稿では,教師付きコントラスト学習(SCL)による質問応答システム(QA)の堅牢性と効率を高めるための,新しい総合的ソリューションを提案する。
ユーザ入力意図分類、ドメイン外入力検出、新しい意図発見、継続学習の4つの重要なタスクを定義した。
下流タスクに最小限のチューニングを加えることで、モデル効率を大幅に改善し、すべてのタスクにまたがる新しい最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:01:51 GMT)
Beyond Euclid: An Illustrated Guide to Modern Machine Learning with Geometric, Topological, and Algebraic Structures [3.5] 現代の機械学習は、本質的に非ユークリッド的なリッチな構造化されたデータに遭遇する。
そのような非ユークリッドデータから知識を抽出するには、より広範な数学的視点が必要である。
我々は最近の進歩を直感的な統合フレームワークに統合するグラフィカルな分類法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:48:36 GMT)
Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.5] 海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している
海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。
既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:48:53 GMT)
Time-Frequency Analysis of Variable-Length WiFi CSI Signals for Person Re-Identification [3.4] 人物再識別(ReID)は、セキュリティ検出や数え方において重要な役割を果たす。
本文では, 歩行者の特徴を識別するための基礎として, WiFi信号のマルチパス伝搬特性を活用する, WiFiチャネル状態情報(CSI)を用いた手法を紹介する。
本稿では、WiFi信号の周波数領域における時間領域の振幅と位相を解析し、可変長データを処理できる2ストリームネットワーク構造を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:10:47 GMT)
The Two Sides of the Coin: Hallucination Generation and Detection with LLMs as Evaluators for LLMs [3.4] 本研究は,CLEF ELOQUENT HalluciGen共有タスクへの参加を示す。
目的は、幻覚コンテンツの生成と検出の両方のための評価器を開発することである。
Llama 3, Gemma, GPT-3.5 Turbo, GPT-4の4つのLLMの能力について検討した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:34:46 GMT)
Are They the Same Picture? Adapting Concept Bottleneck Models for Human-AI Collaboration in Image Retrieval [3.2] textttCHAIRを使えば、人間が中間概念を修正できる。
本手法は,外部介入を伴わずに,画像検索指標の類似モデルよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:59:32 GMT)
Development of Cognitive Intelligence in Pre-trained Language Models [3.2] 近年の研究では、大規模事前学習言語モデルにおける創発的認知能力の証拠が示されている。
PLMの発達軌跡は、人間の認知発達に対する最大限の調整の窓を一貫して示している。
この窓のあと、トレーニングは損失を減らすという工学的な目標に役立っているように見えるが、人間の認知との整合性を高めるという科学的目標ではない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:47:31 GMT)
Enhancing Training Efficiency Using Packing with Flash Attention [3.1] Hugging Face SFTトレーナーは、最大シーケンス長までの複数のトレーニング例を組み合わせるためにパッキングを使用するオプションを提供する。
私たちは、各例の適切な注意マスクで、パッキングとFlashアテンションを有効化し、分析し、このトレーニングパラダイムの利点を示します。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:10:37 GMT)
Spectroscopy of elementary excitations from quench dynamics in a dipolar XY Rydberg simulator [3.0] 我々は、ライドバーグ量子シミュレータを用いて、クエンチ分光と呼ばれる新しいタイプの分光法を実証する。
本稿では,スピン-1/2双極子XYモデルの二次元シミュレーションについて述べる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:51:17 GMT)
Comparing supervised learning dynamics: Deep neural networks match human data efficiency but show a generalisation lag [3.0] 近年の研究では、画像分類分野における人間とディープニューラルネットワーク(DNN)の行動比較が数多く行われている。
本稿では、人間の観察者および様々な古典的かつ最先端のDNNにおける学習力学の詳細な研究について報告する。
学習プロセス全体にわたって、十分に学習された表現が、これまで見つからなかったテストデータにどのように一般化できるかを評価し、比較する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 12:47:19 GMT)
Alistair: Efficient On-device Budgeting for Differentially-Private Ad-Measurement Systems [3.0] 本稿では、既存のプライバシー保護広告計測APIを強化する取り組みについて述べる。
Google、Apple、Meta、Mozillaのデザインを分析し、より厳格で効率的な差分プライバシー(DP)予算コンポーネントでそれらを強化します。
当社のアプローチはAlistairと呼ばれ、明確に定義されたDP保証を強制し、広告主がより正確なプライベートな測定クエリを実行できるようにする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:59:41 GMT)
Tree Ensembles for Contextual Bandits [3.0] 木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。
本フレームワークでは,アッパー信頼境界法とトンプソンサンプリング法という,広範に使用されている帯域幅法を標準法と設定法の両方で統合する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:40:08 GMT)
How Chinese are Chinese Language Models? The Puzzling Lack of Language Policy in China's LLMs [2.9] 18言語で中国語企業によって事前訓練された6つのオープンソース多言語LPMを評価した。
実験の結果,中国における多言語でのLLMのパフォーマンスは国際LLMと区別できないことがわかった。
われわれは、中国のLLM開発において、言語多様性のいずれに対しても、一貫した政策の兆候は見つからない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:21:40 GMT)
AI-Enhanced Intensive Care Unit: Revolutionizing Patient Care with Pervasive Sensing [2.9] 集中治療室 (ICU) は、重篤な患者が集中治療や監視を受ける特別な病院空間である。
包括的モニタリングは、患者の状態、特に明度、究極的にはケアの質を評価する上で必須である。
現在、表情、姿勢、移動といった細部を含む視力評価は散発的に捉えられるか、全く捉えられていない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:30:28 GMT)
Combining Federated Learning and Control: A Survey [2.9] この調査は、(非線形)制御アプリケーションにおける適応性、スケーラビリティ、一般化、プライバシを高めるために、フェデレートラーニング(FL)とコントロールを組み合わせる概要を提供する。
FLは、データプライバシを保持しながら、分散デバイス間の協調学習を可能にする、モデルトレーニングに対する分散アプローチを提供する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:29:17 GMT)
Privacy-Preserving Collaborative Genomic Research: A Real-Life Deployment and Vision [2.8] 本稿ではLynx.MDと共同で開発されたゲノム研究のためのプライバシ保護フレームワークを提案する。
このフレームワークは、重要なサイバーセキュリティとプライバシの課題に対処し、プライバシ保護によるゲノムデータの共有と分析を可能にする。
Lynx.MD内でのフレームワークの実装には、ゲノムデータをバイナリ形式に符号化し、制御された摂動技術を通じてノイズを適用することが含まれる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:43:13 GMT)
Fair Federated Data Clustering through Personalization: Bridging the Gap between Diverse Data Distributions [2.8] フェデレーションクラスタリングにおけるパーソナライズの概念を導入し、より低いクラスタリングコストとクライアント間の均一なコストのバランスを達成することを目的とする。
サーバとクライアント間の1ラウンドの通信でこれらの目標に対処するp-FClusを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:35:33 GMT)
Maximum expectation of observables with restricted purity states [2.8] 実用的な量子情報処理(QIP)の評価は、ノイズによって課される限界を理解せずに部分的に行われている。
我々は、ノイズの多い量子状態の準備、検証、観察を行うための推定の必要性を満たす。
ノイズの多いシステムは、ノイズのないシステムよりも常に高い基底状態エネルギーを与えます。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:48:25 GMT)
On Suppressing Range of Adaptive Stepsizes of Adam to Improve Generalisation Performance [2.7] 我々はAdamの適応段差の範囲を抑えるために階層統計を利用する。
結果のアルゴリズムはSET-Adamと呼ばれ、SETは3つの操作の簡単な表記法である。
SET-Adamは、ImageNet上でResNet18をトレーニングするためにAdamやAdaBeliefよりも高い検証精度を生成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:46:14 GMT)
GPC: Generative and General Pathology Image Classifier [2.7] 本稿では,GPCと呼ばれるタスク依存型画像分類器を提案する。
GPCは、病理画像を高次元の特徴空間にマッピングし、テキストとして関連するクラスラベルを生成する。
我々は,4つの病理画像分類タスクに対して,GPCを6つのデータセットで評価した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:54:31 GMT)
Semi-Supervised Learning for Deep Causal Generative Models [2.6] 我々は、変数間の因果関係を利用して、利用可能なすべてのデータの使用を最大化する半教師付き深い因果生成モデルを開発する。
因果推論の手法を利用して、欠落した値を推測し、現実的な反事実を生成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:13:41 GMT)
Topological Transitions in a Kerr Nonlinear Oscillator [2.6] カー非線形発振器(KNO)は一対の定常固有状態、対向位相のコヒーレント状態をサポートする。
断熱的固有状態の進化は、3つの物理的観測物全てを測定するために用いられる。
位相遷移は、最初のチャーン数のジャンプによって明らかにされる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:58:54 GMT)
Under the Hood of Tabular Data Generation Models: the Strong Impact of Hyperparameter Tuning [2.5] 本研究では,モデル統合評価の実践的ニーズに対処する。
高速な最適化を実現するために,各モデルに対する探索空間の削減を提案する。
ほとんどのモデルでは、データセット固有の大規模チューニングによって、オリジナルの構成よりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:16:33 GMT)
High-Performance Silicon Photonic Single-Sideband Modulators for Cold Atom Interferometry [2.5] 光パルス原子干渉計(LPAI)は光パルス原子干渉計(LPAI)の中で最も複雑で困難なシステムである
LPAIレーザーの主な機能は、低温原子生成、状態準備、状態選択検出を行い、光パルスシーケンスのためのコヒーレントな2光子過程を生成することである。
高性能シリコンフォトニックキャリアシングルサイドバンド(SC-SSB)変調器を1560nmで実証し,LPAI内で動的に周波数シフトを行う。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:07:07 GMT)
FAD-SAR: A Novel Fishing Activity Detection System via Synthetic Aperture Radar Images Based on Deep Learning Method [2.4] 本稿では,深層学習に基づく漁業活動検知システムを提案する。
6つの古典的オブジェクト検出モデルを使用して、xView3データセットに実装されている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:38:19 GMT)
GenerateCT: Text-Conditional Generation of 3D Chest CT Volumes [2.4] GenerateCTは、フリーフォームの医療用テキストプロンプトに条件付けされた3D医療用画像を生成するための最初のアプローチである。
GenerateCTを最先端のメソッドと比較し、すべての主要な指標でその優位性を実証した。
GenerateCTは、任意のサイズの合成トレーニングデータセットのスケーリングを可能にする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:28:05 GMT)
Deep Attention Driven Reinforcement Learning (DAD-RL) for Autonomous Vehicle Decision-Making in Dynamic Environment [2.4] AV中心の時間的注意符号化(STAE)機構を導入し,周囲の車両との動的相互作用を学習する。
マップとルートのコンテキストを理解するために,コンテキストマップの抽出にコンテキストエンコーダを用いる。
得られたモデルは、Soft Actor Critic (SAC)アルゴリズムを用いて訓練される。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:34:44 GMT)
DISTINQT: A Distributed Privacy Aware Learning Framework for QoS Prediction for Future Mobile and Wireless Networks [2.1] 5Gと6G以上のネットワークは、あるレベルのQuality of Service(QoS)に依存してスムーズな運用を行う、新しくて挑戦的なユースケースとアプリケーションをサポートすることが期待されている。
タイムリーな方法での予測は、特に車両通信の場合のように、安全クリティカルな応用において非常に重要である。
DisTINQTは、予測のための新しいマルチヘッド入力対応分散学習フレームワークである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:27:57 GMT)
Robustness of LLMs to Perturbations in Text [2.1] 大規模言語モデル(LLM)は素晴らしいパフォーマンスを示していますが、現実のデータでは避けられないノイズを処理できますか?
この研究は、LLMのテキストのモルフォロジー変化に対するレジリエンスを調査することによって、この重要な問題に取り組む。
以上の結果から, LLM は, 一般の信念とは対照的に, 文中での騒々しい摂動に対して静かであることが明らかとなった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:50:17 GMT)
A Taxonomy and Comparative Analysis of IPv4 ID Selection Correctness, Security, and Performance [1.9] よりセキュアなインターネットへの戦いは、ネットワークプロトコルの最も基本的な部分を含む、多くの面で争われている。
本稿では,25年間のIPID利用履歴とそれに対応するIPID選択方法の変更を分類する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:44:41 GMT)
STENCIL: Submodular Mutual Information Based Weak Supervision for Cold-Start Active Learning [1.9] STENCILは、クラス不均衡のコールドスタート設定において、一般的なアクティブな学習手法に対して、複数のテキスト分類データセットに対して10%-18%の精度で、レアクラスのF-1スコアを17%-40%の精度で改善する。
STENCILは、クラス不均衡のコールドスタート設定において、一般的なアクティブな学習方法よりも、複数のテキスト分類データセットに対して10%-18%、レアクラスのF-1スコアを17%-40%の精度で改善することを示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:44:39 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に定義されたフレームワークを使用して構築すれば、この標準を満たすようにモデルをトレーニングできることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:34:01 GMT)
AI-Driven Guided Response for Security Operation Centers with Microsoft Copilot for Security [1.8] Copilot Guided Response (CGR)は、業界規模のMLアーキテクチャで、セキュリティアナリストを3つの重要なタスクにガイドする。
CGRはMicrosoft Defender XDR製品に統合され、世界中でデプロイされ、数百万のレコメンデーションを生成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:10:01 GMT)
Agricultural Recommendation System based on Deep Learning: A Multivariate Weather Forecasting Approach [1.8] 本稿では,天気予報モデルを用いたコンテキスト型作物推薦システムを提案する。
提案された気象モデルでは、バングラデシュの任意の場所で降雨、気温、湿度、日差しを予測でき、平均 R-Squared 値は 0.9824 である。
このシステムは、洪水や干ばつが生ずる地域に対する知識に基づく作物の提案にも長けている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:02:45 GMT)
Toward Automatic Group Membership Annotation for Group Fairness Evaluation [1.7] 本研究では,グループフェアネス評価のためのグループメンバーシップの自動アノテートに言語モデルを活用する方法について検討する。
GPT や Mistral といった最先端の大規模言語モデルよりも,BERT ベースのモデルの方が優れた結果が得られた。
提案手法は,人間の努力を大幅に減らし,フェアネスを意識した研究のフロンティアをより多くのデータセットに拡張する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:19:02 GMT)
A Look Into News Avoidance Through AWRS: An Avoidance-Aware Recommender System [1.6] AWRS(Avoidance-Aware Recommender System)を紹介する。
このフレームワークは、ニュース記事の回避がユーザの好みに関する重要な情報を伝えるという前提に基づいて、ニュースを推薦する際の回避意識を取り入れている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:16:03 GMT)
Machine Learning in High Volume Media Manufacturing [1.4] 大量生産環境でのエラーや失敗は、時間とお金の損失をもたらす可能性がある。
ここではルールベースの決定と機械学習モデルを組み合わせた新しいプログラムを開発する。
現在の最先端技術を用いて、我々はこのプログラムを大規模に展開し、製造環境からの需要の増加に対処する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:34:54 GMT)
Beyond static AI evaluations: advancing human interaction evaluations for LLM harms and risks [1.3] ヒューマンインタラクション評価」は、人間-モデルインタラクションの評価に焦点を当てている。
安全に焦点を当てた3段階のHIE設計フレームワークを提案する。
我々は,HIEのコスト,複製性,非表現性に関する懸念に対処するための具体的な勧告で締めくくっている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:59:53 GMT)
Optimal Defender Strategies for CAGE-2 using Causal Modeling and Tree Search [1.3] 本稿では,CAGE-2の形式的(因果的)モデルと,証明可能な最適なディフェンダー戦略を生成する手法を提案する。
C-POMCPは、有効性に関して最先端の性能を達成し、最も近い競合手法よりも計算時間で2桁効率が良い。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:34:55 GMT)
D2S: Representing sparse descriptors and 3D coordinates for camera relocalization [1.3] 複雑な局所記述子とそのシーン座標を表現するための学習に基づくアプローチを提案する。
その単純さと費用対効果が特徴である。
本手法は,屋内および屋外環境におけるシーン座標回帰における最先端CNN手法よりも優れる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:10:55 GMT)
Vision language models are blind [1.2] 視覚機能を備えた大規模言語モデル(VLM)は、数え切れないほどの画像テキストアプリケーションを動かしている。
BlindTestは、人間の目で見やすい7つの視覚タスクのスイートです。
4つの最先端のVLMは平均してベンチマークで56.20%しか正確ではなく、ニューソネットが最も正確である(73.77%)。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:55:18 GMT)
MEMO: Dataset and Methods for Robust Multimodal Retinal Image Registration with Large or Small Vessel Density Differences [1.2] セグメンテーションに基づくディープラーニングフレームワーク(VDD-Reg)と新しい評価指標(MSD)を提案する。
VDD-Regはコンテナセグメンテーションモジュールと登録モジュールで構成される。
我々は,VDD-Regが,VD差とVD差が大きい場合に,ベースライン法を定量的に,質的に上回ることを示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:15:55 GMT)
Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda [1.2] この記事では、偏見とプロパガンダに完全に注記された12万のFacebook投稿の多言語コーパスを提示する。
コーパスは、イスラエルのガザ戦争をフレーミングするために、FigNews 2024 Shared Task on News Media Narrativesの一部として作成された。
5つの言語(アラビア語、ヘブライ語、英語、フランス語、ヒンディー語)に12,000のポストがあり、それぞれ2,400のポストがある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:04:09 GMT)
Predictable and Performant Reactive Synthesis Modulo Theories via Functional Synthesis [1.2] 本稿では,古典的リアクティブハンドル(命題)を仕様言語として,時間論理仕様から正しいコントローラを生成する方法を示す。
また,制御器が常に最小の安全値を提供するために出力を最適化できるという意味で応答が可能であることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:23:27 GMT)
Acoustic Analogue for Quantum Field Theory with a Source term [1.2] 古典音源に結合したスカラー場に対する非相対論的流体類似モデルを提案する。
一般的なアナログ重力モデルは、音響計量と結合されたフォノン場を含む。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 05:36:33 GMT)
A Neural Matrix Decomposition Recommender System Model based on the Multimodal Large Language Model [1.1] 本稿では,BoNMFと呼ばれる多モーダル大規模言語モデルに基づくニューラルネットワーク行列分解推薦システムモデルを提案する。
ユーザとアイテムの潜在的な特性をキャプチャし、ユーザとアイテムIDからなる低次元行列と対話した後、ニューラルネットワークは結果を出力する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 02:58:07 GMT)
Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network [1.1] 競合するマルチアームバンディット問題に対処するフォトニクスに基づく意思決定アルゴリズムを提案する。
シミュレーションにより,光結合型レーザーのカオス振動とクラスタ同期,分散結合調整,探索と利用の効率向上が示された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:38:47 GMT)
Music Proofreading with RefinPaint: Where and How to Modify Compositions given Context [1.1] RefinPaintはサンプリングプロセスを改善するイテレーティブなテクニックである。
フィードバックモデルを使用して、より弱い音楽要素を特定することでこれを実現します。
実験結果から,RefinPaintの有効性が示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:52:27 GMT)
Detecting Visual Cues in the Intensive Care Unit and Association with Patient Clinical Status [1.0] ICUの既存の患者評価は散発的であり、手動で管理されている。
我々はデータ不均衡問題に対処する新しい「マスケッド損失計算」手法を開発した。
634,054フレームのAU推論を行い,顔面AUと臨床的に重要な患者状況との関連性について検討した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:05:24 GMT)
The Emperor is Now Clothed: A Secure Governance Framework for Web User Authentication through Password Managers [1.0] パスワードマネージャとWebアプリケーション間のインタラクションを促進する既存のアプローチは、適切な機能を提供し、重要な攻撃に対する緩和戦略を提供していない。
本稿では,パスワードマネージャとWebアプリケーション間のインタラクションを仲介するブラウザベースのガバナンスフレームワークであるBerytusを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:52:09 GMT)
Towards Personalised Patient Risk Prediction Using Temporal Hospital Data Trajectories [1.0] 本研究では,集中治療単位患者を滞在中の観察データの軌跡によってグループ化するパイプラインを提案する。
ICUステークの最初の4時間のみのデータにパイプラインを適用すると、患者の大多数が、滞在期間全体を考慮した場合と同じクラスタに割り当てられる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:53:26 GMT)
ResumeAtlas: Revisiting Resume Classification with Large-Scale Datasets and Large Language Models [0.9] 様々な情報源から13,389人の履歴書を収集した。
我々は BERT や Gemma1.1 2B などの大規模言語モデル (LLM) を分類に用いた。
その結果,従来の機械学習手法よりも大幅に改善された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:19:28 GMT)
Identifying macro conditional independencies and macro total effects in summary causal graphs with latent confounding [0.9] 要約因果グラフのマクロトータル効果を同定するために,do-calculusは健全かつ完全であることを示す。
また, マイクロコンディショナル・インディペンデンシーとマイクロトータル・エフェクトを考慮した場合, これらの結果は成立しないことを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:51:13 GMT)
Accelerating Electron Dynamics Simulations through Machine Learned Time Propagators [0.9] 本稿では,リアルタイムTDDFTに基づく電子動力学シミュレーションを高速化する新しい手法を提案する。
物理インフォームド制約と高分解能トレーニングデータを活用することにより,精度と計算速度が向上する。
この方法は、レーザー照射された分子や材料のリアルタイム・オンザフライモデリングを可能にする可能性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:29:48 GMT)
PersonaRAG: Enhancing Retrieval-Augmented Generation Systems with User-Centric Agents [0.9] 本稿では,リアルタイムなユーザデータとインタラクションに基づく検索と生成にユーザ中心のエージェントを取り入れた新しいフレームワークであるPersonaRAGを紹介する。
その結果,ユーザ適応型情報検索システムにおける有望な方向性が示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:18:00 GMT)
Clustering Time-Evolving Networks Using the Dynamic Graph Laplacian [0.9] 既存のスペクトルクラスタリングアルゴリズムを一般化し、クラスタの時間的進化を捉える。
動的グラフ Laplacian は、有向グラフと無向グラフの時間経過に伴うクラスタ構造進化の明確な解釈を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:31:54 GMT)
MLOps: A Multiple Case Study in Industry 4.0 [0.8] MLOpsは、MLモデルを確実かつ効率的に開発、テスト、デプロイ、管理するために使用されるプロセス、ツール、組織構造を指す。
本研究は,企業4.0のシナリオを4つ説明し,その実装と,多数のプロジェクトで直面した課題について,関連する知見を提供する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:17:26 GMT)
MSEval: A Dataset for Material Selection in Conceptual Design to Evaluate Algorithmic Models [0.8] MSEvalは,多種多様な設計要領と基準にまたがって,専門家による資料評価からなる新しいデータセットである。
このデータは、概念設計のための材料選択の文脈における機械学習モデルの評価と修正を容易にするためのベンチマークとして機能するように設計されている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:27:33 GMT)
Overcoming Catastrophic Forgetting in Tabular Data Classification: A Pseudorehearsal-based approach [0.8] 継続学習(CL)は、以前取得した知識を忘れずに、データ分散の進化に適応する上で重要な課題となる。
本稿では,データ分類問題における破滅的忘れの現象に対処するために,Tarbular-data Rehearsal-based Incremental Lifelong Learning framework (TRIL3) という新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:04:06 GMT)
The Effectiveness of Curvature-Based Rewiring and the Role of Hyperparameters in GNNs Revisited [0.7] グラフニューラルネットワーク(GNN)におけるメッセージパッシングは支配的なパラダイムである
近年、データと計算グラフから入力グラフを切断し、メッセージパッシングを行うグラフリウィリング技術に力を入れている。
オーバーシャッシングは合成データセットで実証されているが、この研究では、曲率ベースのリワイアリングが現実のデータセットにもたらすパフォーマンス向上を再評価する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:03:58 GMT)
Evaluating the Adversarial Robustness of Semantic Segmentation: Trying Harder Pays Off [0.7] 対人摂動に対する感度の良好な近似は、現在満足していると見なされているものよりもはるかに多くの労力を要すると我々は主張する。
我々は新たな攻撃を提案し、文学で利用可能な最強の攻撃と組み合わせる。
我々の結果は、異なるモデルが異なる攻撃に対して脆弱であることが多いため、多様な強力な攻撃が必要であることも示している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:32:53 GMT)
Controlization Schemes Based on Orthogonal Arrays [0.6] 量子シミュレーションと量子多体系の学習において、重要なサブルーチンは制御されたハミルトン時間進化を実装している。
制御されていない進化へのブラックボックスアクセスのみを与えられた場合、例えば $mathrmctrl(e-iHt) = |0ranglelangle 0|otimes I + |1ranglelangle 1 |otimes e-iHt$ は非自明である。
最近の論文では、未知変換のためのアルゴリズムの設計における制御方式を導入している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:04:19 GMT)
FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313 [0.6] Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。
本稿では,任意の遺伝子型チップとゲノム領域にまたがって一般化可能なクライアント側インプットモデルをサポートする,新しい遺伝子型インプットパイプラインのベースラインを紹介する。
本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:28:13 GMT)
SfM on-the-fly: Get better 3D from What You Capture [0.6] Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。
この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 07:21:33 GMT)
Application of Artificial Intelligence in Supporting Healthcare Professionals and Caregivers in Treatment of Autistic Children [0.6] 本稿では、自閉症スペクトラム障害(ASD)管理における医療従事者と介護者の能力を高める人工知能の可能性について検討する。
自閉症児と非自閉症児の日常活動における顔および身体の表情を解析するための高度なアルゴリズムを開発した。
本研究は, ASDの診断, 治療, 包括的管理を改善するためのAIの変革的可能性を強調する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:34:40 GMT)
The $μ\mathcal{G}$ Language for Programming Graph Neural Networks [0.5] $mumathcalG$は、グラフニューラルネットワーク仕様のためのドメイン固有言語である。
我々は、最も人気のあるグラフニューラルネットワークモデルを定義するために、$mumathcalG$をどのように使用できるかを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:27:43 GMT)
HiPPO-Prophecy: State-Space Models can Provably Learn Dynamical Systems in Context [0.5] 本研究では、状態空間モデル(SSM)の文脈内学習能力について検討する。
我々はSSMの新たな重み構造を導入し、任意の力学系の次の状態を予測できるようにした。
我々は、連続SSMが任意の入力信号の微分を近似できることを示すために、HiPPOフレームワークを拡張した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:56:11 GMT)
Early Classification of Time Series: Taxonomy and Benchmark [0.5] この文書は原則に基づく分類から始まり、非常に広範な実験の結果を報告する。
評価を整理するための次元を定義し、非常に広範な実験の結果を報告する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:16:16 GMT)
Mixing Artificial and Natural Intelligence: From Statistical Mechanics to AI and Back to Turbulence [0.5] この論文は、科学研究におけるAIの役割を反映しており、特に乱流研究に焦点を当てている。
これは、ディープニューラルネットワークの革新的利用を通じて、ラグランジアンモデルによる乱流の減少にAIが与える大きな影響を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 20:25:55 GMT)
Adaptive Deep Iris Feature Extractor at Arbitrary Resolutions [0.5] 分解能劣化は、高解像度画像で訓練されたディープラーニングモデルの認識性能を低下させる。
我々のフレームワークには、異なる分解能劣化に特化した分解能専門家モジュールが含まれています。
低解像度の専門家は、両方の専門家が共通のアイデンティティの特徴を抽出できるように、高解像度の専門家からの知識蒸留によって訓練される。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:15:45 GMT)
Experimental verifiable multi-client blind quantum computing on a Qline architecture [0.5] 分散アーキテクチャにおける2サイクル検証可能なブラインド量子コンピューティングプロトコルの最初の実験的実装を提供する。
その結果,大規模ネットワークにおけるマルチテナント分散量子計算の検証の新たな視点が示された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:48:58 GMT)
Photogrammetry for Digital Twinning Industry 4.0 (I4) Systems [0.4] デジタルツイン(Digital Twins、DT)は、物理プロセスの振る舞いを再現するためにソフトウェアシステムを活用する変換技術である。
本稿では,「物理過程」の正確な視覚表現を実現するために,フォトグラムメトリーと3次元走査技術の利用を探求することを目的とする。
その結果, コンシューマグレードデバイスを用いたフォトグラメトリは, スマート製造のためのDTを作成する上で, 効率的かつコスト効率のよいアプローチであることが示唆された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:51:19 GMT)
Deep-TEMPEST: Using Deep Learning to Eavesdrop on HDMI from its Unintended Electromagnetic Emanations [0.3] 本稿では,ケーブルやコネクタから無意識に放出される電磁波を分析して,デジタルビデオディスプレイの盗聴問題に対処する。
アナログケース(VGA)と比較して、デジタルケースは10ビットの符号化により、観測された信号と画素の強度の間の帯域幅と非線形マッピングがはるかに大きくなるため、難しい。
提案手法は、問題を逆問題として再キャストし、深層学習モジュールを訓練し、観測された電磁波を表示された画像にマッピングする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 23:07:37 GMT)
Applications of artificial intelligence in the analysis of histopathology images of gliomas: a review [0.3] 本稿では,ヒトグリオーマの全スライディング組織像に対するAIベースの手法を提案する83の公開研究について検討する。
現在の研究の焦点は、成人型びまん性グリオーマのヘマトキシリンおよびエオシン染色組織分画の評価である。
これまでのところ、AIベースの手法は有望な成果を上げているが、実際の臨床環境ではまだ使われていない。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:16:55 GMT)
StyleSplat: 3D Object Style Transfer with Gaussian Splatting [0.3] スタイル転送は、さまざまな芸術スタイルで3Dアセットを強化し、創造的な表現を変革する。
本稿では,3次元ガウス表現シーンにおける3次元オブジェクトのスタイリング手法であるStyleSplatを紹介する。
様々な3Dシーンやスタイルにまたがって有効性を示し、3D生成における制御とカスタマイズの強化を示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:55:08 GMT)
Tracking Patterns in Toxicity and Antisocial Behavior Over User Lifetimes on Large Social Media Platforms [0.3] われわれはRedditとWikipediaの5億件近いコメントで14年間にわたって毒性を分析している。
Reddit上で最も有毒な行動は、最もアクティブなユーザーによって集計され、最も有毒な行動は、最もアクティブでないユーザーによって集計され、Wikipedia上で最も有毒な行動であることがわかった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:45:02 GMT)
Let Me DeCode You: Decoder Conditioning with Tabular Data [0.2] 本稿では,ラベルから派生した特徴をモデル条件付けに利用し,デコーダを動的にリコンストラクションするDeCodeを提案する。
DeCodeは3次元ラベル形状特徴の学習数値表現による条件付埋め込みの導入による3次元セグメンテーション性能の向上に重点を置いている。
以上の結果から,DeCode は従来の非条件モデルよりも高い性能を示し,計算コストの低減による精度の向上を実現している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:14:33 GMT)
CLIPping the Limits: Finding the Sweet Spot for Relevant Images in Automated Driving Systems Perception Testing [0.1] ニューラルネットワークを用いて、自然言語のプロンプトと類似性に応じてデータセット内の画像をソートする。
私たちの焦点は、偽陽性と偽陰性を平等に防止することにあります。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:10:30 GMT)
A Scale-Invariant Diagnostic Approach Towards Understanding Dynamics of Deep Neural Networks [0.1] 本稿では、textitFractal Geometry を用いたスケール不変手法を導入し、コネクショナリストシステムの非線形力学を解析・説明する。
我々はフラクタル次元とテクストローネスを定量化し、それらの力学を深く理解し、テクスト固有の説明の質を高める。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:54:05 GMT)
State space representations of the Roesser type for convolutional layers [0.1] 2次元畳み込み層に対するRoesser型の状態空間表現を提供する。
また、拡張、ストライド、N-D畳み込みのための状態空間表現も構築する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:08:15 GMT)
Weight Block Sparsity: Training, Compilation, and AI Engine Accelerators [0.0] Deep Neural Networks(DNN)が開発、トレーニング、利用され、高度なデバイスと限られたデバイスの両方に負担がかかっている。
私たちのソリューションは、ハードウェアに親しみやすい構造化された空間であるエムの重みブロック間隔を実装することです。
本稿では,Resnet50,Inception V3,VGG16を用いて,AIE2構成セット(AMD Versal FPGA)の正確かつ完全なコード生成による性能評価を行う。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 17:37:49 GMT)
VS-PINN: A fast and efficient training of physics-informed neural networks using variable-scaling methods for solving PDEs with stiff behavior [0.0] 本稿では,変数スケーリング手法を用いたPINNのトレーニング手法を提案する。
提案手法の有効性を実証し,PINNのトレーニング効率と性能を大幅に向上させることができることを確認した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:08:09 GMT)
Using quantum computers to identify prime numbers via entanglement dynamics [0.0] 本稿では, フォールトトレラントコンピュータにおけるこの理論概念の実装を可能にする決定論的アルゴリズムについて概説する。
本アルゴリズムで用いられる対角ユニタリ演算は,従来報告されていた一般対角ユニタリの指数的複雑性と対照的に,次数が2次であることが証明された。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:47:13 GMT)
Unscrambling of single-particle wave functions in systems localized through disorder and monitoring [0.0] 本研究では,局所粒子を正確に特徴付ける自由フェルミオン波動関数のスレーター行列式を求めるプロセスを開発する。
その結果, 単一粒子波動関数を応用して, 観測された自由フェルミオンや乱れモデルなどのシステムにおける局在化遷移特性について, 貴重な知見を得ることが可能となった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 19:12:07 GMT)
Unexplainability of Artificial Intelligence Judgments in Kant's Perspective [0.0] 本稿は,AI判断が人間の判断の特性の観点から理解できない形態を示すものであることを論じる。
物理述語を含まない概念は、視覚を通して関数が示されるときの説明が簡単でないことを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:39:55 GMT)
Tunable frequency conversion in doped photonic crystal fiber pumped near degeneracy [0.0] 将来の量子ネットワークは、異なる波長帯域間で光的に符号化された量子情報をコヒーレントに転送する能力に依存する。
ゲルマニウムドープコアを用いたフォトニック結晶ファイバを1550nm, テレコムCバンド920nmでグループ速度マッチングする。
この繊維の大きな長さは、波長920nmの波長間のナノメートルスケールの周波数シフトを最大79.4%内部変換効率で達成するために用いられる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:48:21 GMT)
Transforming Movie Recommendations with Advanced Machine Learning: A Study of NMF, SVD,and K-Means Clustering [0.0] 本研究では,様々な機械学習技術を用いて,ロバストな映画レコメンデーションシステムを開発する。
主な目的は、パーソナライズされた映画レコメンデーションを提供することでユーザーエクスペリエンスを向上させることである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 01:26:33 GMT)
Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0] 抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。
我々のTop-MLモデルは、広く使われている2つのAntiCP 2.0ベンチマークデータセットで検証され、最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:04:54 GMT)
The generalized uncertainty principle within the ordinary framework of quantum mechanics [0.0] 量子力学における基底座標と運動量交換関係の適切な変形は、小さなスケールにおける重力の影響を考慮に入れている。
平方運動量項の導入は、粒子位置の最小不確実性をプランク長に制限する一般化された不確実性原理をもたらす。
位置と運動量作用素の変形代数は、通常の量子力学の枠組みに組み込むことができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:37:51 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0] 本研究は、認知バイアスの是正と人間とAIの相互作用における影響の認識における会話型人工知能(CAI)の有効性を評価する。
この研究は、典型的なユーザとボットの相互作用をシミュレートする臨床ベースの仮想ケースシナリオを用いた構造化手法を用いている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:44:55 GMT)
Tensor networks for black hole interiors: non-isometries, quantum extremal surfaces, and wormholes [0.0] 双曲テンソルネットワークを用いてブラックホール内部のホログラフマップを構築する。
地平線の背後にある非等方性と量子超曲面の関係について検討する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:19:15 GMT)
Tensor networks enable the calculation of turbulence probability distributions [0.0] 乱流PDFを"テンソルネットワーク" (TN) と呼ばれる極めて圧縮された形式にパラメータ化することで, 次元問題を克服する方法を示す。
我々はそれぞれ$mathcalO(106)$と$mathcalO(103)$でメモリと計算コストの削減を実現している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:06:57 GMT)
Synthetic Cancer -- Augmenting Worms with LLMs [0.0] 大規模言語モデル(LLM)を2つの重要なプロセスに応用した,新しいタイプのメタモルフィックマルウェアを提案する。
第一に、LSMは、アンチマルウェアプログラムによるシグネチャベースの検出を避けるために、自動コード書き換えに使用される。
マルウェアはLLMを利用して電子メールの返信をソーシャルにエンジニアリングし、受信者にマルウェアの実行を促す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:40:10 GMT)
Static Analysis of Logic Programs via Boolean Networks [0.0] 「静的情報から論理プログラムの安定モデルについて何が言えるか」が研究され、多くの場面で有用であることが証明されている。
提案されたコネクションは、既存の結果をBooleanネットワークの静的解析の豊富な歴史に導いてくれる。
新しく得られた洞察は、ASP.NETの分野で多くの問題を解決する可能性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:07:05 GMT)
Spectroscopy of Single CdSe Magic-Sized Nanocrystals [0.0] マジックサイズNC(MSNC)は個別のステップで成長し、単一のサイズと形状(すなわち単分散性)を提供する可能性がある。
室温で測定されたCdSe MSNCの発光スペクトルは、最先端の量子ドットよりも広いことが報告されている。
以上の結果から,CdSe MSNCは粒子-粒子間変動を示すが,最大寄与は単一粒子線幅による。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:26:10 GMT)
Single system based generation of certified randomness using Leggett-Garg inequality [0.0] 我々は、Leggett-Garg不平等違反を利用して、半デバイス非依存の量子乱数生成のための安全なスキームを理論的に定式化し、実験的に示す。
9,19,118ドルの真に予測不可能なビットを確実に生成します。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:29:01 GMT)
Simulating (2+1)D SU(2) Yang-Mills Lattice Gauge Theory at finite density with tensor networks [0.0] 2次元の非アベリア格子ゲージ理論を数値シミュレーションする。
ハミルトンの定式化における SU(2) ヤン・ミルズモデルに焦点をあてる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:57:01 GMT)
SideSeeing: A multimodal dataset and collection of tools for sidewalk assessment [0.0] 構築された環境を評価するためのツールとデータセットを提供する新しいイニシアティブであるSideSeeingを紹介する。
本稿では,胸部装着型モバイルデバイスから撮影した同期映像とセンサデータを統合する新しいデータセットを提案する。
データセットは、9つの病院の周囲12kmをカバーする3時間のコンテンツを含み、325,000のビデオフレームと対応するセンサーデータを含んでいる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:38:29 GMT)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0] 私たちは戦略的思考と意思決定を評価するために、Tic-Tac-Toe、Connect Four、Battleshipといったゲームを使用しています。
標準ベンチマークに習熟しているにもかかわらず、GPT-3.5とGPT-4のプレイ能力と、事前トレーニングなしで完全に観察可能なゲームについて推論する能力は、ごくわずかである。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:17:26 GMT)
Setting up the Data Printer with Improved English to Ukrainian Machine Translation [0.0] ウクライナ語と英語の文の3M対のノイズの多い並列データセットを用いた翻訳システムを構築するためのレシピを提案する。
我々のデコーダのみのモデルであるDragomanは、FLORESデベロップメントセットのアーティファクトエンコーダ-デコーダモデルの性能を上回りました。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:06:15 GMT)
Private Blockchain-based Procurement and Asset Management System with QR Code [0.0] 開発システムは、サプライオフィスの調達プロセスにプライベートブロックチェーン技術を統合することを目的としている。
調達プロセスには、キャンバス、購入、商品の配送、検査、在庫、廃棄が含まれる。
調査では、サプライオフィスで調達と資産管理システムを備えたプライベートブロックチェーンベースのテクノロジの使用を推奨している。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:27:36 GMT)
Predicting and Understanding Human Action Decisions: Insights from Large Language Models and Cognitive Instance-Based Learning [0.0] 大きな言語モデル(LLM)は、様々なタスクにまたがってその能力を実証している。
本稿では,LLMの推論と生成能力を利用して,2つの逐次意思決定タスクにおける人間の行動を予測する。
我々は,LLMの性能を,人間の経験的意思決定を模倣した認知的インスタンスベース学習モデルと比較した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:13:06 GMT)
Predicting Winning Captions for Weekly New Yorker Comics [0.0] 本稿では,ニューヨーク・カートゥーン・カートゥーン・キャプション・コンテスト(New Yorker Cartoon Caption Contest, New Yorker Cartoon Caption Contest)において,入賞者の機知とユーモアをエミュレートしたキャプションを生成することを目的とした,ニューヨーカーの漫画へのイメージキャプション技術の適用について検討する。
本稿では,ニューヨーカーの漫画キャプションコンテストのキャプションを生成するために,視覚変換器エンコーダデコーダモデルを用いた新しいベースラインを提案する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 00:45:00 GMT)
Parameter inference from a non-stationary unknown process [0.0] 非定常系は、二酸化炭素濃度の変化による気候パターンから、上昇する神経調節によって引き起こされる脳のダイナミクスまで、世界中で見られる。
非定常過程を解析する手法が必要であるが、実際に使用されるほとんどの時系列解析手法は、定常性の仮定を単純化する。
非定常系の解析における重要な問題は、私たちが参照する問題クラスである。
非定常未知プロセス(PINUP)からの推論 観測時系列が与えられた場合、時系列の非定常性を推進するパラメータを推測する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 04:44:29 GMT)
On the estimation of the number of components in multivariate functional principal component analysis [0.0] 保持する主成分の数の選定を検討するため, 広範囲なシミュレーションを行った。
本研究では,各単変量機能特徴に対する分散説明しきい値のパーセンテージを用いた従来の手法は信頼性が低いことを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 16:53:56 GMT)
On the Problem of Defining Charge Operators for the Dirac Quantum Field [0.0] 3次元物理空間における領域の電荷量を表す演算子$Q_A$について尋ねる。
Q_A$ の自然な公式はあるが、ここで説明するように、それを数学的に正確な定義にすることは困難である。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 09:44:31 GMT)
Modelling the Human Intuition to Complete the Missing Information in Images for Convolutional Neural Networks [0.0] 実験心理学は、人間の心の状態に依存する多くの種類の直観を明らかにする。
視覚認知タスクにおいて、行方不明情報を完成させるのに有用な視覚的直観に焦点を当てる。
本研究では、直観をモデル化し、この形式を組み込んで畳み込みニューラルネットワークの性能向上を図る。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:05:27 GMT)
Measuring the Angular Momentum of a Neutron Using Earth's Rotation [0.0] 地球回転と軌道角運動量(OAM)のカップリングは、スピンエコー干渉計を用いて発生した絡み合った中性子で観測される。
測定された結合は理論の5%以内であり、不確実性は7.2%である。
検出されたビームの逆OAMは4098 + 295 hbar A-1で、以前の中性子実験より5桁低い。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:45:13 GMT)
Interpretation of wave function by coherent ensembles of trajectories [0.0] 量子力学における波動関数のアンサンブル解釈を改訂する。
時空における量子軌道のアンサンブルのコヒーレンス(自動一致)を導入する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:10:04 GMT)
GPT-4 Generated Narratives of Life Events using a Structured Narrative Prompt: A Validation Study [0.0] 我々は,OpenAIのGPT-4を用いて,ゼロショット構造化された物語プロンプトを用いて24,000の物語を生成する。
このデータセットから、2,880の物語を手動で分類し、出生、死亡、雇用、解雇の妥当性を評価する。
我々は分析を拡張し、残りの21,120の物語の分類を予測する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:46:47 GMT)
Exploring the role of criticality in the quantum Otto cycle fueled by the anisotropic quantum Rabi-Stark model [0.0] 熱エンジン、冷蔵庫、ヒーター、加速器を含む量子熱機械は、量子熱力学の最前線である。
本稿では,理想シナリオと有限時間シナリオの両方で動作する量子オットーエンジンについて検討する。
量子熱機関に焦点をあてることで、これらの相転移がAQRSMベースのエンジンの効率とパワーを批判的に調節することを明らかにする。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 06:36:57 GMT)
Exploring the Effectiveness of Methods for Persona Extraction [0.0] 本稿では,対話参加者に関する情報を抽出し,そのパフォーマンスをロシア語で評価する手法について検討する。
このタスクのモデルをトレーニングするために、Multi-Session Chatデータセットは複数の翻訳モデルを使用してロシア語に翻訳された。
抽出モデルの有効性を評価するために,Fスコアの概念に基づく計量を示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:30:10 GMT)
Exploring Richer and More Accurate Information via Frequency Selection for Image Restoration [0.0] 空間および周波数領域の知識をシームレスに統合するマルチスケール周波数選択ネットワーク(MSFSNet)を導入する。
我々のMSFSNetは最先端のアルゴリズムに匹敵する性能を達成する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 03:10:08 GMT)
Exploring Factors Affecting Student Learning Satisfaction during COVID-19 in South Korea [0.0] 本研究は,パンデミックにおける学生の学習嗜好と満足度に関連するいくつかの側面を理解することを目的とした。
収集したデータには、学生の性別、専攻、学習時の満足度、モチベーションレベル、パフォーマンス、感情状態、学習環境が含まれていた。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:28:11 GMT)
Experimental photon addition and subtraction in multi-mode and entangled optical fields [0.0] 複数光子の付加と減算を1つの実験装置を用いて相互に比較する。
空間分解能の高い強化CCDカメラで検出された密な空間相関を持つ双発ビームを用いる。
最大3個の光子が加えられ、非古典的および非ガウス的状態に到達する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 13:52:46 GMT)
Exactly-solved model of light-scattering errors in quantum simulations with metastable trapped-ion qubits [0.0] 準安定原子量子ビットのイジング力学における光散乱モデルの解析を行った。
メタスタブルレベルが40$Ca$+$イオンである実験のシミュレーションにおける基本誤差の影響を解析する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:24:06 GMT)
Estimation Sample Complexity of a Class of Nonlinear Continuous-time Systems [0.0] 本稿では, 大規模非線形系のパラメータ推定法について述べる。
正規化線形回帰を用いて力学を直接反転させることにより未知パラメータを解く手法は、微分フィルタと正規化最小二乗の新たな設計と解析のアイデアに基づいている。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:35:47 GMT)
Enhancing Depressive Post Detection in Bangla: A Comparative Study of TF-IDF, BERT and FastText Embeddings [0.0] 本研究は,バングラにおける抑うつ的なソーシャルメディア投稿を識別する手法を提案する。
ドメインの専門家によって注釈付けされたこの研究で使用されるデータセットには、抑うつ的ポストと非抑うつ的ポストの両方が含まれている。
クラス不均衡の問題に対処するために,マイノリティクラスに対するランダムなオーバーサンプリングを利用した。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 11:40:17 GMT)
Distinct citation distributions complicate research evaluations. A single indicator that universally reveals research efficiency cannot be formulated [0.0] サイズに依存しないトップパーセンタイルに基づく指標は、地域出版物のグローバルなランクが権力法に適合するときに正確である。
最も引用されていない論文の偏差は、国で頻繁に見られ、高い影響因子を持つ全てのジャーナルで発生します。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 10:16:21 GMT)
Dissipative variational quantum algorithms for Gibbs state preparation [0.0] 本稿では、変分量子回路の本質的な部分として、qubit RESETやゲートなどの散逸演算を組み込むことにより、散逸型変分量子アルゴリズム(D-VQA)を導入する。
このようなアルゴリズムは、広範囲の量子多体ハミルトンと温度でギブス状態を作ることができ、コヒーレントノイズと非コヒーレントノイズの両方による誤差を著しく低減することができる。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:48:46 GMT)
DisQ: A Markov Decision Process Based Language for Quantum Distributed Systems [0.0] 本研究では,分散バージョンへの量子アルゴリズムの書き直しを容易にするフレームワークとしてDisQを提案する。
DisQはChemical Abstract Machine(CHAM)とMarkov Decision Processs(MDP)の概念を組み合わせることで、量子的並列性と分散挙動を明確に区別することを目的としている。
分散バージョンに等価な書き直しを示すために、量子加算やショアのアルゴリズムなどのいくつかのケーススタディを示す。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:26:22 GMT)
Diagnosing quantum transport from wave function snapshots [0.0] スピン鎖の非平衡量子力学を波動関数スナップショットのデータセットに主成分分析(PCA)を用いて研究する。
スピンやエネルギー輸送の異なるいくつかの相互作用するスピン鎖の研究により、データ情報の拡散はスピンやエネルギーの量子輸送の根底にあるものと同じ動的指数に従っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 08:40:32 GMT)
Deep Generative Models for Detector Signature Simulation: A Taxonomic Review [0.0] 粒子物理学検出器からの信号は衝突の物理を符号化する低レベル物体(エネルギー沈降や軌道など)である。
検出器におけるそれらの完全なシミュレーションは、計算と記憶集約的なタスクである。
我々は,検出器シグネチャのシミュレーションについて,既存の文献の包括的かつ徹底的な分類学的レビューを行う。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:11:43 GMT)
Criticality-amplified quantum probing of a spontaneous collapse model [0.0] 自然崩壊モデルは動的ウェーブパレットの低減を考慮に入れた設計である。
このような経験的モデルの自由なパラメータの計量的上界を導出するイット量子探索手法を導入する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 14:37:58 GMT)
Conceptual and formal groundwork for the study of resource dependence relations [0.0] 資源理論は状態に対して事前順序を課し、一方の状態が他方の状態より上である場合、第一の状態が自由操作によって第二の状態に変換される。
リソースフルネスの異なる概念の間には、非自明な依存関係が存在する可能性がある。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 22:56:35 GMT)
Chebyshev approximation and composition of functions in matrix product states for quantum-inspired numerical analysis [0.0] 解析的かつ高度に微分可能な関数をMPSチェビシェフ補間子として表現するために,反復的なチェビシェフ展開とクレショー評価を用いるアルゴリズムを提案する。
これは高微分可能な函数に対する急速な収束を示し、理論的な予測と整合し、多次元のシナリオに効率的に一般化する。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 18:00:06 GMT)
CFaults: Model-Based Diagnosis for Fault Localization in C Programs with Multiple Test Cases [0.0] 本稿では,複数の障害を持つCプログラムに対して,新しい障害局所化手法を提案する。
CFaultsは、複数の観察でモデルベース診断(MBD)を活用し、失敗したすべてのテストケースを統一されたMaxSAT公式に集約する。
C プログラムのベンチマークセット TCAS と C-Pack-IPAs の実験結果から,CFaults は他の FBFL の手法よりも高速であることがわかった。
論文参考訳(メタデータ) (Fri, 12 Jul 2024 15:14:49 GMT)