Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.0] 本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:34:13 GMT)
Open Problems in Technical AI Governance [93.9] テクニカルAIガバナンス(Technical AI Governance)は、AIの効果的なガバナンスを支援するための技術分析とツールである。
本論文は、AIガバナンスへの貢献を目指す技術研究者や研究資金提供者のためのリソースとして意図されている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:13:56 GMT)
Q-Sparse: All Large Language Models can be Fully Sparsely-Activated [93.5] Q-Sparseは、スパースアクティベートされた大規模言語モデル(LLM)を訓練するための、シンプルで効果的なアプローチである。
Q-Sparse は LLM における活性化の完全な分散を可能にし、推論においてかなりの効率向上をもたらす。
バッチトレーニングと推論のためのBlock Q-Sparseも導入しています。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:57:26 GMT)
Diffusion Models as Data Mining Tools [87.8] 本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:14:31 GMT)
Modeling and Driving Human Body Soundfields through Acoustic Primitives [79.4] 本研究では,人体が生成する全3次元音場をレンダリングし,高品質な空間オーディオ生成を実現するフレームワークを提案する。
我々は,3次元空間の任意の点において,全音響シーンを効率よく,正確にレンダリングできることを実証した。
我々の音響プリミティブは、従来の手法に比べて、音場表現が桁違い小さくなり、近接場レンダリングの欠陥を克服する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:25:07 GMT)
Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data [76.9] 大規模言語モデルにおける一般化と記憶の相互作用について検討する。
各種のオープンソースLLMとその事前学習コーパスを用いて、モデルのサイズが大きくなるにつれて、タスク関連$n$-gramのペアデータの重要性が増すのを観察する。
その結果,LLMの能力は,十分なタスク関連事前学習データによる記憶と一般化の微妙なバランスから生じるという仮説を支持した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:24:40 GMT)
POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.7] 主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。
このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:37:21 GMT)
On the Design and Analysis of LLM-Based Algorithms [74.7] 大規模言語モデル(LLM)はアルゴリズムのサブルーチンとして使用される。
LLMは素晴らしい経験的成功を収めた。
我々のフレームワークはLLMベースのアルゴリズムの進歩を約束している。
LLMアルゴリズムのさらなる研究を促進するため、ソースコードはhttps://github.com/modelscope/agentscope/tree/main/examples/paper_llm_based_algorithmで公開しています。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:39:07 GMT)
Consent in Crisis: The Rapid Decline of the AI Data Commons [74.7] 汎用人工知能(AI)システムは、大量の公開Webデータに基づいて構築されている。
我々は,AIトレーニングコーパスに基づくWebドメインに対する同意プロトコルの大規模かつ長期的監査を行う。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:50:18 GMT)
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5] Plucker座標に基づく制御ネットライクなコンディショニング機構を用いた3次元カメラ制御のためのトランスフォーマー映像を試作する。
我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:43:10 GMT)
Read and Reap the Rewards: Learning to Play Atari with the Help of Instruction Manuals [69.8] Read and Rewardは、Atariゲーム開発者がリリースしたマニュアルを読むことで、Atariゲーム上のRLアルゴリズムを高速化する。
各種RLアルゴリズムは,設計支援による性能向上とトレーニング速度の向上を実現している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 20:16:44 GMT)
FINEMATCH: Aspect-based Fine-grained Image and Text Mismatch Detection and Correction [67.0] 我々は新しいアスペクトベースのきめ細かいテキストと画像マッチングベンチマークであるFineMatchを提案する。
FineMatchはテキストと画像のミスマッチの検出と修正に焦点を当てている。
FineMatchで訓練されたモデルは、きめ細かいテキストや画像のミスマッチを検出する能力の向上を示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:32:40 GMT)
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception [64.8] 本稿では,様々な知覚タスクの表現を調和させる新しい統一表現RepVFを提案する。
RepVFは、ベクトル場を通じてシーン内の異なるターゲットの構造を特徴付け、シングルヘッドでマルチタスクの学習モデルを可能にする。
RepVF 上に構築された RFTR は,タスク間の固有性を利用したネットワークである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:46:44 GMT)
A Comprehensive Review of Few-shot Action Recognition [64.5] アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:53:32 GMT)
Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.7] グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 08:11:10 GMT)
DifFace: Blind Face Restoration with Diffused Error Contraction [62.5] DifFaceは、複雑な損失設計なしで、目に見えない複雑な劣化にもっと優しく対処できる。
現在の最先端の手法よりも優れており、特に深刻な劣化の場合には優れている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:04:32 GMT)
Improving Context-Aware Preference Modeling for Language Models [62.3] 本稿では、まず、文脈を選択し、選択した文脈に対する嗜好を評価することによって、不特定性を解決する2段階の選好モデリング手法について考察する。
我々は、文脈条件付き嗜好データセットと実験に貢献し、文脈特化選好を評価する言語モデルの能力について検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:05:17 GMT)
I Need Help! Evaluating LLM's Ability to Ask for Users' Support: A Case Study on Text-to-SQL Generation [60.0] 性能改善とユーザ負担のトレードオフを評価する指標を提案する。
実験の結果、外部からのフィードバックがなければ、多くのLCMは追加的なサポートの必要性を認識するのに苦労していることがわかった。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:12:29 GMT)
From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems [59.4] 大規模言語モデル (LLM) は、物理世界の意思決定問題を解くことができる。
このモデルの下で、LLM Plannerは、プロンプトを介して言語ベースのサブゴールを反復的に生成することにより、部分的に観測可能なマルコフ決定プロセス(POMDP)をナビゲートする。
我々は,事前学習したLLMプランナーが,文脈内学習を通じてベイズ的集計模倣学習(BAIL)を効果的に行うことを証明した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:00:22 GMT)
$\infty$-Brush: Controllable Large Image Synthesis with Diffusion Models in Infinite Dimensions [58.4] 無限次元における新しい条件拡散モデル、制御可能な大画像合成のための$infty$-Brushを導入する。
我々の知る限り、$infty$-Brushは関数空間における最初の条件拡散モデルであり、最大4096times4096$ピクセルの任意の解像度で画像を制御できる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 00:04:49 GMT)
LongVLM: Efficient Long Video Understanding via Large Language Models [55.8] LongVLMはビデオ理解のためのシンプルだが強力なビデオLLMである。
ローカル情報とグローバル情報の両方を含むビデオ表現をエンコードする。
我々のモデルは、長いビデオ理解のためのより正確な応答を生成する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:17:00 GMT)
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit [55.7] 鍵圧縮技術である量子化は、大きな言語モデルを圧縮し、加速することにより、これらの要求を効果的に軽減することができる。
本稿では,プラグアンドプレイ圧縮ツールキットであるLLMCについて,量子化の影響を公平かつ体系的に検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:29:51 GMT)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.3] 大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。
本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。
本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:19:58 GMT)
Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.2] Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:42:24 GMT)
DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control [53.8] 人間の命令によって多様なタスクに熟練した汎用的なインテリジェントホームアシストエージェントを構築することは、AI研究の長期的青写真である。
本研究では,具体的エージェントに対する原始的移動操作,すなわち指示された動詞と名詞のペアに基づいて,ナビゲートと対話の仕方について検討する。
本研究では、文脈化されたシーンモデリングと効率的な制御における非自明な進歩を特徴とするdisCOを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:39:28 GMT)
EvaSurf: Efficient View-Aware Implicit Textured Surface Reconstruction on Mobile Devices [53.3] モバイル端末に暗黙的テクスチャを付加したtextbfSurf$ace 再構成手法を提案する。
提案手法は,合成と実世界の両方のデータセット上で,高品質な外観と正確なメッシュを再構築することができる。
我々の方法は1つのGPUを使ってたった1~2時間でトレーニングでき、40FPS(Frames per second)以上のモバイルデバイス上で実行することができる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 02:28:09 GMT)
Generalizable Implicit Motion Modeling for Video Frame Interpolation [52.0] フローベースビデオフレーム補間(VFI)における動きの重要性
General Implicit Motion Modeling (IMM)は、モーションモデリングVFIの新規かつ効果的なアプローチである。
我々のGIMMは、既存のフローベースのVFIワークとスムーズに統合できます。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:34:55 GMT)
Overview of AI-Debater 2023: The Challenges of Argument Generation Tasks [51.7] 第2023回中国影響コンピューティング会議(CCAC 2023)におけるAI-Debater 2023チャレンジの結果を提示する。
合計で32のチームがチャレンジに登録し、そこから11の応募をもらいました。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:13:54 GMT)
All Against Some: Efficient Integration of Large Language Models for Message Passing in Graph Neural Networks [51.2] 事前訓練された知識と強力なセマンティック理解能力を持つ大規模言語モデル(LLM)は、最近、視覚とテキストデータを使用してアプリケーションに恩恵をもたらす顕著な能力を示している。
E-LLaGNNは、グラフから限られたノード数を増やして、グラフ学習のメッセージパッシング手順を強化するオンデマンドLLMサービスを備えたフレームワークである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:09:42 GMT)
AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.1] 本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。
これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:28:16 GMT)
Modular Sentence Encoders: Separating Language Specialization from Cross-Lingual Alignment [50.8] 文埋め込みの言語間アライメントの訓練は、個々の言語の意味空間の最適な単言語構造を歪ませる。
我々は、言語間の負の干渉を避けるために、言語固有の文エンコーダを訓練する。
次に、英語以外のすべてのモノリンガルエンコーダを英語エンコーダにアライメントし、その上にクロスリンガルアライメントアダプタをトレーニングする。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:56:39 GMT)
Two Trades is not Baffled: Condensing Graph via Crafting Rational Gradient Matching [50.3] 大規模グラフの学習はグラフ表現学習において顕著な成果を上げてきたが、そのコストと記憶力の増大が懸念されている。
そこで我々は,textbfCraftextbfTing textbfRationatextbf (textbfCTRL) という新しいグラフ手法を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:44:37 GMT)
PruningBench: A Comprehensive Benchmark of Structural Pruning [50.2] textitPruningBenchと呼ばれる、構造的プルーニングのための最初の包括的なベンチマークを提示する。
PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。
将来の刈り取り方法の実装を容易にするための実装が容易なインターフェースを提供し、その後の研究者が自身の作業をリーダボードに組み込めるようにします。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:56:31 GMT)
CrossDehaze: Scaling Up Image Dehazing with Cross-Data Vision Alignment and Augmentation [47.4] 画像デハジングの課題に対処するために,先行と深層学習に基づく手法が提案されている。
本稿では,既存のデハージング手法を改善するために,内部および外部データ拡張の新しい手法を提案する。
提案手法は, 実際のヘイズフリー画像に最も近いデハズド画像のデハズ化やデハズド画像の生成において, 他の先進的手法よりも著しく優れている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:00:20 GMT)
Progressive Multi-Modality Learning for Inverse Protein Folding [47.1] マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:56:00 GMT)
Blind Image Deconvolution by Generative-based Kernel Prior and Initializer via Latent Encoding [46.4] ブラインド画像符号化は、画像処理の分野では古典的だが難しい問題である。
近年の深部画像先行法(DBID)の進歩は,a世代的アプローチを示す一連の手法を動機づけている。
本稿では、事前モデリングをよりよく検討する新しい前世代的アプローチと、カーネルを曖昧にするための生成的アプローチを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:23:56 GMT)
CORT: Class-Oriented Real-time Tracking for Embedded Systems [46.3] 本研究は,マルチクラスオブジェクトトラッキングに対する新しいアプローチを提案する。
トラッキング性能をペナルティ化することなく、より小さく予測可能な実行時間を実現することができる。
提案手法は,異なるタイプの複数の対象を持つ複雑な都市シナリオにおいて評価された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:12:17 GMT)
An encryption algorithm using a generalization of the Markovski algorithm and a system of orthogonal operations based on T-quasigroups [45.7] より正確には、中間準群に基づくT-準群に基づくこのアルゴリズムの実装を提案する。
本稿では,T-準群に基づくアルゴリズムの実装について述べる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:38:07 GMT)
Temporal Residual Jacobians For Rig-free Motion Transfer [45.6] データ駆動型モーショントランスファーを実現するための新しい表現としてResidual Temporal Jacobiansを紹介した。
我々の手法は、リギングや中間形状へのアクセスを前提とせず、幾何学的かつ時間的に一貫した動きを発生させ、長い動き列の転送に利用できる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:29:22 GMT)
Efficient Causal Graph Discovery Using Large Language Models [42.7] 提案するフレームワークはBFS (Broadth-first Search) アプローチを用いており,クエリの線形数のみを使用することができる。
提案フレームワークは,時間とデータ効率の向上に加えて,様々なサイズの実世界の因果グラフに対して,最先端の結果を達成している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:51:58 GMT)
Trust No Bot: Discovering Personal Disclosures in Human-LLM Conversations in the Wild [40.6] 人間とチャットボットのインタラクションにおける個人の開示を測定することで、ユーザのAIリテラシーをよりよく理解することができる。
我々は、実際のユーザが商用のGPTモデルに対して行った個人情報を詳細に分析する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 00:47:32 GMT)
Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.3] Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。
我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。
本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:59:53 GMT)
Step-by-Step Reasoning to Solve Grid Puzzles: Where do LLMs Falter? [36.1] 複雑度が異なる274のグリッドベースパズルからなる評価データセットであるGridPuzzleを開発した。
第2に, GPT-4, Claude-3, Gemini, Mistral, Llama-2 など LLM の推論鎖を手動で解析した新しい誤り分類法を提案する。
第3に、大規模主観的評価のためのLLMベースのフレームワーク(すなわち、誤りを特定する)と客観的な指標であるPuzzleEvalを開発し、推論連鎖の正しさを評価する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:43:07 GMT)
What Radio Waves Tell Us about Sleep [34.7] 本研究では、睡眠中の人から反射される電波からの睡眠と夜間呼吸を受動的にモニタリングする高度な機械学習アルゴリズムを開発した。
睡眠時無呼吸(AUROC=0.88)を検知し,睡眠時無呼吸を検知した。
このモデルは、睡眠段階と、神経、精神医学、循環器、免疫疾患を含む様々な疾患の間の情報的相互作用を明らかにする。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:38:37 GMT)
Diff-Reg v1: Diffusion Matching Model for Registration Problem [34.6] 既存の手法では、幾何学的あるいは意味的な特徴を利用して潜在的な対応を生成する。
従来はシングルパス予測に頼っていた手法は、複雑なシナリオにおいて局所的なミニマと競合する可能性がある。
本稿では,ロバスト対応推定のための拡散マッチングモデルを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:03:20 GMT)
Text-based Talking Video Editing with Cascaded Conditional Diffusion [31.2] テキストベースのトーキングヘッドビデオ編集は、音声ビデオのセグメントを効率的に挿入、削除、置換することを目的としている。
これまでの作業では、会話ビデオのトレーニングデータの数分と、カスタマイズされた会話ビデオ編集のための高価なテストタイムの最適化が必要だった。
本稿では,音声から高密度ランドマーク運動,動画への動きの2段階からなる,効率的なケースケード条件拡散に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:55:19 GMT)
Evaluating Large Language Models' Ability Using a Psychiatric Screening Tool Based on Metaphor and Sarcasm Scenarios [31.1] アスペルガー症候群(Asperger syndrome)と呼ばれるこの症状を持つ子供たちは、皮肉を理解できないことが知られている。
本研究では,近年の大規模言語モデルにおけるニュアンスド・ヒューマン・コミュニケーションの理解を評価するために標準化されたテストを用いた。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:57:15 GMT)
Automated Patient Positioning with Learned 3D Hand Gestures [29.9] 本稿では,カメラを用いて手の動きを自動的に検出する自動位置決めシステムを提案する。
我々のアプローチは、技術者のジェスチャーを認識し解釈するための、新しい多段階パイプラインに依存している。
以上の結果から,本システムでは,最小限の技術介入で,正確かつ正確な患者の位置決めが可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:32:24 GMT)
Differential Privacy of Cross-Attention with Provable Guarantee [29.3] クロスアテンションのプライバシセキュリティに対処するために,新たな差分プライバシ(DP)データ構造を設計する。
我々の結果は、ユーザが意図的にクロスアテンションシステムに攻撃できる適応的なクエリに対して堅牢である。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:02:27 GMT)
Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL [29.0] ソフトQ-ラーニングを利用した最適なプロンプトを見つけることを目的としたRLPromptを提案する。
結果は有望な結果を示す一方で,プロンプトが不自然に現れることがしばしばあり,その解釈可能性を妨げることが確認されている。
この制限をスパルス・ツァリスエントロピー正規化(英語版)を用いて解決する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:10:19 GMT)
Efficient Active Learning Halfspaces with Tsybakov Noise: A Non-convex Optimization Approach [28.5] 本稿では,効率的な能動学習を計算的にラベル付けする問題について検討する。
本稿では, 近似値の証明を行う。
構造化された未ラベルデータセットの1階定常光点。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 00:01:06 GMT)
Is Behavior Cloning All You Need? Understanding Horizon in Imitation Learning [26.5] シミュレーション学習(Imitation Learning, IL)は、実演から学ぶことによって、連続的な意思決定タスクにおいて専門家の行動を模倣することを目的としている。
オンライン行動クローニング(英語版) (BC) は、問題の地平線に好ましくない二次的依存を伴うサンプルの複雑さを引き起こすと考えられている。
累積ペイオフの範囲が制御されるたびに、オフラインILにおいて水平非依存のサンプル複雑性を実現することができることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 23:31:56 GMT)
WiFaKey: Generating Cryptographic Keys from Face in the Wild [25.1] 生体計測からユニークな暗号鍵を導出することは、生体計測と誤り訂正符号の間に既存のノイズギャップがあるため、難しい課題である。
本研究では,制約のない設定で顔から暗号鍵を生成するために,WiFaKeyという新しいバイオメトリック暗号システムを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 08:31:06 GMT)
Exploring the Use of Abusive Generative AI Models on Civitai [22.5] 本稿では,AIGCソーシャルプラットフォームとして最大規模のCivitaiを用いて,乱用コンテンツの生成について検討する。
87Kモデルと2M画像を含む包括的データセットを構築した。
これらのプラットフォームをよりよく管理するためのモデレーション戦略について議論する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:59:42 GMT)
Meta-GPS++: Enhancing Graph Meta-Learning with Contrastive Learning and Self-Training [22.5] そこで我々はMeta-GPS++と呼ばれる少数ショットノード分類のための新しいフレームワークを提案する。
まず,同好および異好のグラフ上での識別ノード表現を効率よく学習する手法を採用する。
また、ラベルのないノードから貴重な情報を抽出するために自己学習を適用する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:05:12 GMT)
Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models [21.5] ビデオ異常検出は、セキュリティ監視や自動運転といったアプリケーションには不可欠である。
既存のVADメソッドは、検出の背後にある根拠をほとんど示さず、現実世界のデプロイメントに対する公衆の信頼を妨げる。
本稿では,大言語モデルを用いたVADのためのルールベースの推論フレームワークであるAnomalyRulerを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:56:47 GMT)
HRNet: Differentially Private Hierarchical and Multi-Resolution Network for Human Mobility Data Synthesization [19.0] 我々は,現実的な人間の移動データを合成するための新しい深層生成モデルである階層・多解ネットワーク(HRNet)を紹介した。
まず、差分プライバシーの下で人間の移動データを学習する際の重要な困難を識別する。
HRNetは、階層的なロケーションエンコーディング機構、複数解像度にわたるマルチタスク学習、プライベート事前トレーニングの3つのコンポーネントを統合している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:06:26 GMT)
Symbol Preference Aware Generative Models for Recovering Variable Names from Stripped Binary [18.1] 逆コンパイルにおける顕著な課題は、変数名を復元することである。
本稿では,モデルバイアスと潜在的幻覚を緩和しながら生成モデルの強みを利用する新しい手法を提案する。
我々は、事前訓練された生成モデルCodeGemma-2BとCodeLlama-7BのプロトタイプGenNmを構築した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:44:17 GMT)
Operationalizing a Threat Model for Red-Teaming Large Language Models (LLMs) [17.7] Red-teamingは、大規模言語モデル(LLM)の脆弱性を特定するテクニックである。
本稿では,LLM に対するリピート攻撃に関する詳細な脅威モデルを提案し,知識の体系化(SoK)を提供する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:05:04 GMT)
Seal: Advancing Speech Language Models to be Few-Shot Learners [17.0] 本稿では,音声モデルの略語であるシールモデルを紹介する。
フリーズ言語モデルデコーダでフリーズ音声学習者をブリッジするプロジェクタを訓練するために、Kulback-Leibler分散損失を行う新しいアライメント手法が組み込まれている。
結果のSealモデルは、2つの音声理解タスクで数ショットのエンコーダとして頑健な性能を示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:28:12 GMT)
Technical report: Improving the properties of molecules generated by LIMO [16.7] 分子表現、デコーダモデル、代理モデルトレーニングスキームのアブレーティブな研究を行う。
実験により,GroupSELFIESを用いた自己回帰トランスフォーマーデコーダが,ランダム生成タスクの最適平均特性を達成することが示唆された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:30:38 GMT)
Dynamic Pricing and Learning with Long-term Reference Effects [16.1] 本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:14:42 GMT)
ClinicalAgent: Clinical Trial Multi-Agent System with Large Language Model-based Reasoning [16.0] 大規模言語モデル(LLM)とマルチエージェントシステムは、自然言語処理において顕著な能力を示しているが、臨床試験では課題に直面している。
臨床用マルチエージェントシステムである臨床エージェントシステム(ClinicalAgent)について紹介する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:52:16 GMT)
On Simultaneous Information and Energy Transmission through Quantum Channels [15.4] 本稿では,キャパシティ・パワー関数の量子古典的類似点を紹介する。
我々は、ノイズチャネルを介して古典情報を伝達するための古典情報理論で結果を一般化する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 08:15:01 GMT)
Intelligent Artistic Typography: A Comprehensive Review of Artistic Text Design and Generation [15.4] アーティスティックテキスト生成は、可読性を維持しながら、テキストの美的品質を増幅することを目的としている。
芸術的なテキストスタイリングは、影、輪郭、色、光、テクスチャなど、テキスト上のテキスト効果に重点を置いている。
Stylistizationは文字の変形に焦点を当て、テキスト内の意味的理解を模倣することで視覚的表現を強化する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:45:09 GMT)
Lightweight Countermeasures Against Static Power Side-Channel Attacks [14.0] 本稿では,静的パワーサイドチャネル攻撃(PSCA)に対する新たな防御戦略を提案する。
PSCAは暗号セキュリティにとって重要な脅威である。
商用28nmノードを用いた実験結果から,攻撃に要する労力の大幅な増加が示唆された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:23:24 GMT)
Dual High-Order Total Variation Model for Underwater Image Restoration [13.8] 水中画像の高画質化と復元(UIER)は,水中画像の画質向上のための重要な手段である。
拡張水中画像形成モデル(UIFM)に基づく効果的な変分フレームワークを提案する。
提案フレームワークでは,重み係数に基づく色補正とカラーバランスを組み合わせることで,減衰した色チャネルを補償し,色キャストを除去する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:06:37 GMT)
PASSION: Towards Effective Incomplete Multi-Modal Medical Image Segmentation with Imbalanced Missing Rates [12.8] 不均衡な欠落率下での不完全なマルチモーダル医用画像分割のためのPreference-Aware Self-diStillations (PASSION)を提案する。
PASSIONは、異なるバックボーン間で一貫したパフォーマンス改善のためのプラグイン・アンド・プレイモジュールとして機能することが検証されている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:53:20 GMT)
Improving EEG Classification Through Randomly Reassembling Original and Generated Data with Transformer-based Diffusion Models [12.7] 本稿では,トランスフォーマーを用いた拡散確率モデルと生成データに基づくデータ拡張手法を提案する。
脳波信号の特徴として,信号の事前処理を行う定数要素スケーリング手法を提案する。
提案手法は,生成したデータを時間領域の原データでランダムに再集合し,ビジナルデータを取得する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:58:14 GMT)
FairViT: Fair Vision Transformer via Adaptive Masking [12.6] Vision Transformer (ViT) は優れた性能を発揮し、様々なコンピュータビジョンタスクにおいて有望な可能性を実証している。
しかし、ほとんどの ViT ベースの作品は公平性を考慮しておらず、CNN 指向の debiased アルゴリズムを直接 ViT に適用できるかどうかは不明である。
提案するFairViTは,新しい正確かつ公平なViTフレームワークである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 08:10:37 GMT)
Data Sharing for Mean Estimation Among Heterogeneous Strategic Agents [11.4] 通常の分布からサンプルを収集することにより,$m$エージェントがベクトル$muinmathbbRd$を推定する協調学習問題について検討する。
独自の作業を行う代わりに、エージェントはコストの安いデータを収集し、それと引き換えに他のデータと共有することができる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:45:40 GMT)
Improving Citation Text Generation: Overcoming Limitations in Length Control [10.6] 引用テキスト生成の鍵となる課題は、生成されたテキストの長さがターゲットの長さとしばしば異なり、生成の質が低下することである。
本研究では,科学的引用文の長さ予測の限界について詳細な研究を行い,所望の長さの推定値の利用について検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:10:37 GMT)
CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting [10.3] 群集密度予測タスクは,過去の群集密度マップから今後,群集密度マップがどのように変化するかを予測することを目的としている。
過去の群衆密度マップは、歩行者のミス検出のため、しばしば不完全である。
本稿では,クラウド密度予測(CrowdMAC)のためのMAsked crowd density Completionフレームワークを提案する。
CrowdMACは、部分的に隠された過去の群衆密度マップから、将来の群衆密度マップを予測するために同時に訓練されている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 02:18:43 GMT)
A Tale of Single-channel Electroencephalogram: Devices, Datasets, Signal Processing, Applications, and Future Directions [10.2] 単一チャネル脳波(英: Single- Channel Electroencephalogram、EEG)は、脳活動を監視するための費用効率が高く、快適で非侵襲的な方法である。
本稿では,開発動向,デバイス,データセット,信号処理方法,最近の応用,今後の方向性について論じる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:36:17 GMT)
ActionDiffusion: An Action-aware Diffusion Model for Procedure Planning in Instructional Videos [10.2] ActionDiffusionは、講義ビデオにおけるプロシージャ計画のための新しい拡散モデルである。
本手法は,行動間の時間的依存関係の学習と拡散過程における行動計画の認知を統一する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:55:05 GMT)
Recent Advances in Generative AI and Large Language Models: Current Status, Challenges, and Perspectives [10.2] 生成人工知能(AI)と大規模言語モデル(LLM)の出現は、自然言語処理(NLP)の新しい時代を象徴している。
本稿では,これらの最先端技術の現状を概観し,その顕著な進歩と広範囲な応用を実証する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:48:35 GMT)
Do Generative AI Models Output Harm while Representing Non-Western Cultures: Evidence from A Community-Centered Approach [8.8] 本研究では,生成人工知能(GAI)モデル,特にテキスト・ツー・イメージ・ジェネレータ(T2Is)が非西洋文化の表現に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:01:37 GMT)
Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.8] 本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。
本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:34:20 GMT)
Strongly Isomorphic Neural Optimal Transport Across Incomparable Spaces [7.5] 本稿ではGromov-Monge問題の基本的性質の1つに根ざした新しいニューラルな定式化について述べる。
学習可能なOTマップを2つのコンポーネントに分解することで、この特性を運用する。
我々のフレームワークは、様々な空間にわたるOTマップを学習するための有望なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:27:11 GMT)
BiasAlert: A Plug-and-play Tool for Social Bias Detection in LLMs [7.3] BiasAlertは、LLM(Large Language Models)のオープンテキスト世代における社会的バイアスを検出するために設計されたプラグアンドプレイツールである。
外部の人間の知識と固有の推論能力を統合し、バイアスを確実に検出する。
大規模な実験により、BiasAlertはGPT4-as-A-Judgeのような最先端の手法でバイアスを検出するのに優れていた。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:59:46 GMT)
RGB2Point: 3D Point Cloud Generation from Single RGB Images [7.0] RGB2Pointは、Transformerをベースにした3Dポイントクラウド生成のための、未提示のシングルビューRGBイメージである。
本実装では,SOTA拡散モデルよりも15,133倍高速に結果を生成する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:06:33 GMT)
Latent Conditional Diffusion-based Data Augmentation for Continuous-Time Dynamic Graph Model [6.9] 連続時間動的グラフ(CTDG)は、現実世界の関係を正確にモデル化する。
既存のCTDGモデルは、ノイズと限られた歴史的データから生じる課題に直面する。
我々はCTDGに適した遅延拡散に基づくグラフデータ拡張法であるCondaを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:44:09 GMT)
Fusion of Movement and Naive Predictions for Point Forecasting in Univariate Random Walks [6.9] 方法はランダムウォークの変種定義から導かれ、将来の値に対するランダムなエラー項は、方向記号で乗算された正のランダムなエラーとして表現される。
0.55のような中程度の運動予測精度で、ナイーブ予測を確実に上回る。
正確な点予測が難しいが、正確な運動予測が可能である場合、特に有利である。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:52:02 GMT)
Political Leanings in Web3 Betting: Decoding the Interplay of Political and Profitable Motives [6.5] 我々は、Web3予測市場における賭けに基づく政治的傾きを測定するために、PBLS(Political Betting Leaning Score)を構築した。
我々は4,500のイベントと8,500の市場にわたる15,000以上のアドレスを合成し、彼らの政治的傾きの強さと方向性を米国が捉えている。
本研究は,分散市場における意思決定の理解に寄与し,Web3予測環境における行動分析の強化に寄与する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:17:19 GMT)
FMamba: Mamba based on Fast-attention for Multivariate Time-series Forecasting [6.2] 多変量時系列予測(MTSF)のためのFMambaという新しいフレームワークを導入する。
技術的には、まず、埋め込み層を介して入力変数の時間的特徴を抽出し、次に高速アテンションモジュールを介して入力変数間の依存関係を計算する。
多層パーセプトロンブロック(MLP-block)を通して入力特徴を選択的に扱い、変数の時間的依存関係を抽出する。
最後に、FMambaは、線形層であるプロジェクターを通して予測結果を得る。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:14:05 GMT)
Simulation of integrated nonlinear quantum optics: from nonlinear interferometer to temporal walk-off compensator [6.1] 本稿では, 断熱導波路, 材料異方性, 線形光学部品, 光子損失, 検出器などの様々な特徴を正確にモデル化できる非線形量子フォトニクスシミュレーションフレームワークを提案する。
提案手法は,光子対波源のスクイーズパラメータと量子周波数変換器の変換効率を,ポンプ出力に頼らずに向上させることができることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:15:26 GMT)
CoCoG-2: Controllable generation of visual stimuli for understanding human concept representation [6.1] 本稿では,生成した視覚刺激を類似性判定タスクに統合するCoCoG-2という新しいフレームワークを提案する。
CoCoG-2は、トレーニング不要誘導アルゴリズムを使用して、生成の柔軟性を向上させる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:52:32 GMT)
ECRTime: Ensemble Integration of Classification and Retrieval for Time Series Classification [6.1] 112のUCRデータセットに対する実験結果から、ECRは既存のディープラーニングベースの手法と比較して最先端(ソータ)であることが示された。
ECRTimeは、現在最も正確なディープラーニング分類器であるInceptionTimeを精度で上回っている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:17:23 GMT)
Economy Watchers Survey provides Datasets and Tasks for Japanese Financial Domain [5.9] 中央政府機関が発行する資料を用いて,2つの大規模データセットを構築した。
データセットは3つの日本の金融NLPタスクを提供する。
私たちのデータセットは包括的で最新のように設計されており、自動更新フレームワークを活用しています。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 02:35:14 GMT)
Bag of Tricks to Boost Adversarial Transferability [5.8] ホワイトボックス設定で生成された逆例は、しばしば異なるモデル間で低い転送可能性を示す。
そこで本研究では,既存の敵攻撃の微妙な変化が攻撃性能に大きく影響することを発見した。
既存の敵攻撃の綿密な研究に基づいて、敵の移動性を高めるためのトリックの袋を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:11:22 GMT)
Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities [5.6] MRIの脳病変のモデルは通常、特定の疾患のために開発され、事前に定義されたMRIモダリティのセットでデータに基づいて訓練される。
それぞれのモデルでは、MRIの異なるデータを使って疾患を分類することはできないし、他の種類の疾患も分類できない。
我々は、フェデレートラーニングフレームワークが、トレーニング中に見られるすべての疾患の分類において非常に有望な、単一のモデルをトレーニングできることを示します。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:09:46 GMT)
OTCE: Hybrid SSM and Attention with Cross Domain Mixture of Experts to construct Observer-Thinker-Conceiver-Expresser [5.4] 我々は、より生体模倣的なアイデアを持つ新しいアーキテクチャ、Observer-Thinker-Conceiver-Expresser (OTCE)を提案する。
OTCEは、有名な中規模のオープンソース言語モデルと、小規模の言語モデリングタスクで競合することができる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:35:45 GMT)
Gaussian Stochastic Weight Averaging for Bayesian Low-Rank Adaptation of Large Language Models [5.4] 細調整された大規模言語モデル(LLM)は、しばしば過剰な自信とキャリブレーションに悩まされる。
本稿では,Low-Rank Adaptation (LoRA) とGaussian Weight Averaging (SWAG) を組み合わせた簡単な組み合わせを提案する。
本手法は,配電系統における配電系統の性能向上を反映して,配電系統の配電系統変更に対するロバスト性が高いことを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 04:36:27 GMT)
Differentiating Through Integer Linear Programs with Quadratic Regularization and Davis-Yin Splitting [5.2] 問題となるのがリニアプログラム(ILP)である場合について検討する。
結果のスキームが最近導入されたヤコビ自由バックプロパゲーション(JFB)と互換性があることを証明する。
提案手法は, 最短経路問題とクナップサック問題という2つの代表的なICPに対する実験により, 前方パス上のこの組み合わせDYS, 後方パス上のJFBが, 既存のスキームよりも高次元問題に対してより効果的にスケールするスキームを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:49:12 GMT)
RoIPoly: Vectorized Building Outline Extraction Using Vertex and Logit Embeddings [5.1] 航空画像や衛星画像から建物概要を抽出する新しいクエリベースの手法を提案する。
クエリとして各ポリゴンを定式化し、潜在的ビルディングの最も関連性の高い領域に対してクエリの注意を拘束する。
本手法は,2次元フロアプラン再構築データセットであるStructured3Dを用いて,ベクトル化建物アウトライン抽出データセット(CrowdAI)と2次元フロアプラン再構築データセット(Structured3D)について評価する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:12:51 GMT)
Applicability of Large Language Models and Generative Models for Legal Case Judgement Summarization [5.1] 近年,抽象的な要約モデルやLarge Language Model (LLM) などの生成モデルが広く普及している。
本稿では,判例判断要約におけるそのようなモデルの適用性について検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:50:41 GMT)
TrustRate: A Decentralized Platform for Hijack-Resistant Anonymous Reviews [4.8] 私たちはTrustRateを紹介します。これは、真正、匿名、改ざん防止レビューのための、エンドツーエンドの分散、ハイジャック耐性プラットフォームです。
数千のノード規模のプロトタイプの実装と評価により、当社のプラットフォームの有効性と性能を実証する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:59:25 GMT)
TraveLLM: Could you plan my new public transit route in face of a network disruption? [4.6] 我々は,大規模言語モデル(LLM)に依存するディスラプションに直面して公共交通機関のルーティングを計画するプロトタイプTraveLLMを開発した。
各種のテストケースは、さまざまな気象条件、緊急イベント、新しい交通サービスの導入など、さまざまなシナリオで設計されている。
比較分析により, LLM, 特に GPT-4 がナビゲーション計画に有効であることが示された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:25:34 GMT)
Gauges and Accelerated Optimization over Smooth and/or Strongly Convex Sets [4.5] 我々は、滑らかかつ/または強い凸集合上で定義される実現可能性および制約付き最適化問題を考察する。
これらの設定において,新しい拡張性,プロジェクションフリー,アクセラレーションファーストオーダー手法を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:09:10 GMT)
Subgraph Clustering and Atom Learning for Improved Image Classification [4.5] 本稿では,特徴抽出のための畳み込みニューラルネットワーク(CNN)と構造モデリングのためのグラフニューラルネットワーク(GNN)の長所を融合した,新しいハイブリッド画像分類モデルであるグラフサブグラフネットワーク(GSN)を提案する。
GSNはk平均クラスタリングを使用してグラフノードをクラスタにグループ化し、サブグラフの作成を容易にする。
これらの部分グラフを使用して、辞書学習のための代表原子を学習し、スパースでクラス区別可能な特徴の識別を可能にする。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:32:00 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3] 大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。
LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。
本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 14:50:34 GMT)
Unveiling the Decision-Making Process in Reinforcement Learning with Genetic Programming [4.2] 不理解性は、現実世界で(深い)強化学習を使用するための選択肢ではない。
我々は、すでに訓練されたエージェントの意思決定プロセスの説明を生成するための遺伝的プログラミングフレームワークを提案する。
私たちは性能に匹敵するが、ハードウェアリソースや計算時間を大幅に削減する必要があることを示しています。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 00:45:03 GMT)
Post-Measurement Pairing Quantum Key Distribution with Local Optical Frequency Standard [4.2] 測定後偶然のペアリングにより、ユーザのレーザーの差分位相を追跡する必要がなくなる。
セットアップのリピータライクな動作を確認し,504km以上のファイバで15.94ビット/秒の有限サイズセキュアキーレート(SKR)を達成する。
我々の研究は、局所周波数標準による効率的なミューティユーザ量子ネットワークへの道を開くものである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:26:05 GMT)
Self-supervised transformer-based pre-training method with General Plant Infection dataset [4.0] 本研究では、コントラスト学習とマスクド画像モデリング(MIM)を組み合わせた高度なネットワークアーキテクチャを提案する。
提案するネットワークアーキテクチャは,植物害虫や病原体認識タスクに対処し,優れた検出精度を実現する。
私たちのコードとデータセットは、植物害虫の研究と病気の認識を促進するために公開されます。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:48:35 GMT)
Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base [3.9] ゴールデン・レトリバーは、広大な産業知識基地を効率的に航行するように設計されている。
Golden-Retrieverは、ドキュメント検索の前に、リフレクションベースの質問強化ステップを組み込む。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:10:46 GMT)
Universal Medical Imaging Model for Domain Generalization with Data Privacy [2.9] 本稿では,複数の局所モデルからグローバルモデルへ知識を伝達するフェデレート学習手法を提案する。
主な目的は、幅広い医療画像タスクを実行できるグローバルモデルを訓練することである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:24:15 GMT)
From Ad Identifiers to Global Privacy Control: The Status Quo and Future of Opting Out of Ad Tracking on Android [2.8] 2013年以降、Googleはユーザーがシステム設定でAndroidの広告追跡を制限することを許可している。
アプリはGPC(Global Privacy Control)の下で広告追跡からオプトアウトを尊重しなければならない
分析の結果,AndroidシステムレベルのオプトアウトとGPC信号の両方が広告追跡を制限することは滅多にないことがわかった。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:06:23 GMT)
Not Only Rewards But Also Constraints: Applications on Legged Robot Locomotion [2.7] 本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。
学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:50:22 GMT)
Out of spuriousity: Improving robustness to spurious correlations without group annotations [2.6] 本稿では,突発的相関に依存しない完全トレーニングネットワークからサブネットワークを抽出する手法を提案する。
提案手法の最悪のグループ性能の増加は、完全に訓練された高密度ネットワークにサブネットワークが存在するという仮説の強化に寄与する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 20:24:14 GMT)
Base and Exponent Prediction in Mathematical Expressions using Multi-Output CNN [2.4] 本研究は、多出力畳み込みニューラルネットワーク(CNN)を用いた数学的表現の画像から基底と指数の両方を予測するための単純化された効果的なアプローチを提案する。
このモデルは、実世界の条件をシミュレートするために、ランダムノイズ、フォントサイズの変化、およびブラーインテンシティを組み込んだ、指数式を含む10,900の合成画像に基づいて訓練される。
実験結果から,モデルがベースおよび指数値の予測において高い精度を達成し,ノイズや入力画像の変化に対するこのアプローチの有効性が証明された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:23:40 GMT)
Enhancing Skin Disease Classification Leveraging Transformer-based Deep Learning Architectures and Explainable AI [2.3] 皮膚疾患は世界の人口の3分の1以上に影響を与えるが、その影響は過小評価されることが多い。
深層学習技術は皮膚疾患の特定を含む様々なタスクに多くの可能性を示してきた。
この研究では、31のクラスを持つ皮膚疾患データセットを使用し、Vision Transformers、Swin Transformers、DivoV2のすべてのバージョンと比較した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:38:00 GMT)
Deep Learning CT Image Restoration using System Blur and Noise Models [2.3] 本稿では,劣化した画像入力とシステムの曖昧さとノイズを両立させ,モデリングとディープラーニングのアプローチを組み合わせる手法を提案する。
その結果,システムボケと雑音特性を表す補助入力を用いた深層学習モデルの有効性が示された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:17:35 GMT)
Efficient Intrusion Detection: Combining $χ^2$ Feature Selection with CNN-BiLSTM on the UNSW-NB15 Dataset [2.2] 侵入検知システム(IDS)は、従来のコンピュータシステムにおけるサイバー攻撃の検出と防止に重要な役割を果たしてきた。
Internet of Things(IoT)デバイスで利用可能な限られた計算リソースは、従来のコンピューティングベースのIDSをデプロイする上での課題である。
本稿では、軽量畳み込みニューラルネットワーク(CNN)と双方向長短期記憶(BiLSTM)を組み合わせた効果的なIDSモデルを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:41:16 GMT)
Characterizing Encrypted Application Traffic through Cellular Radio Interface Protocol [2.2] 5G無線通信が,ユーザのアプリケーションをリアルタイムに正確に推測するためのサイドチャネルとなることを示す。
オンラインショッピング、音声/ビデオ会議、ビデオストリーミング、Over-The-Top(OTT)メディアプラットフォームという4つの異なるカテゴリのアプリケーションについて検討する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:33:09 GMT)
Stochastic optimization with arbitrary recurrent data sampling [2.1] 最も一般的に使われているデータサンプリングアルゴリズムは、軽度な仮定の下にある。
特定のクラスの繰り返し最適化アルゴリズムに対して、他のプロパティは不要であることを示す。
我々は,データセットをカバーするサンプリングアルゴリズムを選択することで,収束を加速できることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:56:48 GMT)
Latent Pollution Model: The Hidden Carbon Footprint in 3D Image Synthesis [2.1] 本研究では,2次元および3次元潜伏拡散モデル(LDM)のトレーニングおよびデータ生成段階における炭素排出量を解析した。
2Dモデルと3Dモデルのトレーニングは、それぞれ10kmと90kmの走行に匹敵する。
実験の場所は最大94回まで二酸化炭素排出量を増加させ、年末までも最大50%の排出量に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 14:44:44 GMT)
Adversarial Sparse Teacher: Defense Against Distillation-Based Model Stealing Attacks Using Adversarial Examples [2.0] 対人スパース教師 (AST) は蒸留モデル盗難攻撃に対する堅牢な防御方法である。
提案手法は, 逆例を用いて教師モデルを訓練し, スパースロジット応答を生成し, 出力分布のエントロピーを増大させる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:46:07 GMT)
Mapping the Technological Future: A Topic, Sentiment, and Emotion Analysis in Social Media Discourse [2.0] 本研究は、2021年から2023年までの150万ツイートに対する感情と感情の分析とともにBERTopicをモデル化する。
予想されるテクノロジー主導の未来を特定し、400人の主要な世論指導者(KOL)が伝達する感情を捉えている。
肯定的な感情は、肯定的な予感が支配的であり、否定的な感情よりも有意に優れていた。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 18:15:30 GMT)
Requiem for a drone: a machine-learning based framework for stealthy attacks against unmanned autonomous vehicles [2.0] ソフトウェアのみのブラックボックスアプローチであるRequiemを紹介します。
レキエムは、無人航空機(UAV)などの目標システムをミッションパラメータから著しく逸脱させる。
本システムは,搭載型異常検知器による検出を回避しつつ,センサ値を変更することでこれを実現している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:58:14 GMT)
Structure Your Data: Towards Semantic Graph Counterfactuals [1.9] 概念に基づく対実的説明(CE)は、モデル予測にどの高レベルな意味的特徴が寄与するかを理解するための代替シナリオを考える説明である。
本研究では,入力データに付随する意味グラフに基づくCEを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:23:05 GMT)
Automatic Generation of Fashion Images using Prompting in Generative Machine Learning Models [1.9] 本研究では、2つの異なる大言語モデルと、ファッション画像作成のための安定拡散モデルを用いて、カスタマイズされたファッション記述を生成する手法について検討する。
AI駆動のファッションクリエイティビティにおける適応性を強調して、ゼロショットや少数ショット学習といったテクニックの促進に重点を置いています。
評価は、CLIPscoreのような定量的メトリクスと質的な人間の判断を組み合わせることで、創造性、コヒーレンス、さまざまなスタイルの美的魅力を強調します。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:37:51 GMT)
Inferring Ingrained Remote Information in AC Power Flows Using Neuromorphic Modality Regime [1.9] 我々は、エッジプロセッサとしてスパイキングニューラルネットワーク(SNN)を用いて、交流電力流中のリモート情報を推定する。
我々は、電力変換器のスイッチングのための変調パルスを得るために、遅延駆動型非教師なしヘビアン学習ルールを利用する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 14:20:22 GMT)
PolyR-CNN: R-CNN for end-to-end polygonal building outline extraction [1.7] PolyR-CNNは、リモートセンシング画像から直接ベクトル化されたビルディングポリゴンとバウンディングボックスを予測するための効率的で完全に統合されたアプローチである。
また,PolyR-CNNは最先端手法と比較して競争精度が高いことを示す。
CrowdAIデータセットで実施された実験によると、PolyR-CNNは平均精度79.2(AP)を達成した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 15:48:54 GMT)
On Context-aware Detection of Cherry-picking in News Reporting [1.4] 対象とするニュース記事における重要文の欠落を識別し,チェリーピックされた文を検出する新しい手法を提案する。
評価モデルでは,F-1スコアが89%,重要な文が検出できる。
その結果,文の重要度を評価する際に,他の物語から外部知識を取り入れることの有効性が示された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 20:38:55 GMT)
EEGMamba: Bidirectional State Space Models with Mixture of Experts for EEG Classification [1.4] 我々はEEGMambaというユニバーサルEEG分類ネットワークを導入する。
Spatio-Temporal-Adaptive (ST-Adaptive)モジュール、Bidirectional Mamba、Mixture of Experts (MoE)をシームレスに統合し、複数のタスクの統一フレームワークに統合する。
我々は,8つの公開EEGデータセット上で実験を行い,実験結果から4種類のタスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:15:47 GMT)
An Explainable Fast Deep Neural Network for Emotion Recognition [1.3] 本研究では、映像解析による感情分類の枠組みにおける二元的ディープニューラルアーキテクチャの説明可能性手法について検討する。
我々は、感情的な感覚の中で重要な顔のランドマークの動きを理解するために、革新的な説明可能な人工知能アルゴリズムを採用している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 12:59:08 GMT)
Comments on Friedman's Method for Class Distribution Estimation [1.3] クラス分布推定の目的は、クラスラベルの観測を伴わないテストデータセットにおいて、事前クラス確率の値を決定することである。
クラス分布推定のための線形方程式系を設計するための一般的な枠組みの文脈において、フリードマンの手法の特性と、Friedman(文献ではDeBias法と呼ばれる)によって言及された別のアプローチについて論じる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:59:08 GMT)
Simultaneous Verification of Genuine Multipartite Nonlocality and Full Network Nonlocality [1.3] 1つの実験で2種類の非局所性を同時に検証する手法を提案する。
単一ネットワークベルの不等式に違反して高忠実度フォトニック量子ネットワークにおける非局所性の両方を観測する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:17:23 GMT)
L2O-$g^{\dagger}$: Learning to Optimize Parameterized Quantum Circuits with Fubini-Study Metric Tensor [1.1] We propose L2O-$gdagger$, a $textitquantum-aware$ learned that leverage the Fubin-Study metric and long short-term memory network。
L2O-$gdagger$ は以前の L2O 一般化と比較して分布が強いことを示す。
我々の小説『textitquantum-aware$ learn, L2O-$gdagger$』は、VQAの課題に対処する上での進歩を示している。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:52:27 GMT)
CourseAssist: Pedagogically Appropriate AI Tutor for Computer Science Education [1.1] このポスターでは、コンピュータサイエンス教育用に作られた新しいLLMベースのチューターシステムであるCourseAssistを紹介している。
一般的なLLMシステムとは異なり、CourseAssistは検索強化生成、ユーザ意図分類、質問分解を使用して、AI応答を特定のコース材料や学習目標と整合させる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 01:21:02 GMT)
Investigating the use of Snowballing on Gray Literature Reviews [0.9] そこで本研究では,Snowballing (SB) によるQ&Aサイトへのアプローチについて検討する。
レビューのための新しい有効な議論を見つけるために、2つのSBアプローチを適用する方法に関するガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:53:19 GMT)
Conversational Rubert for Detecting Competitive Interruptions in ASR-Transcribed Dialogues [0.6] 割り込みを自動的に分類するシステムは、コールセンター、特に顧客満足度モニタリングとエージェントモニタリングのタスクで利用することができる。
我々は、ASRで書き起こされた顧客サポート電話対話からなる社内データセットをロシア語で作成し、テキストベースの割り込み分類モデルを開発した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:25:53 GMT)
Bayesian identification of nonseparable Hamiltonians with multiplicative noise using deep learning and reduced-order modeling [0.6] 本稿では,非分離型ハミルトニアン系を学習するための構造保存型ベイズ的アプローチを提案する。
本研究では,ハイ次元システムに対するベイズ同定のコスト効率向上のための新しいアルゴリズムを開発した。
訓練目的としてベイズ後部を使用すれば,ハミルトン平均二乗誤差の724倍の改善が得られることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:04:54 GMT)
A Semantic Framework for Neuro-Symbolic Computing [0.4] 我々は、知識ベースを符号化できるコンポーネントと条件を規定する意味的エンコーディングの形式的定義を提供する。
この定義により、多くのニューロシンボリックアプローチが説明できる。
これは、既存のニューロシンボリックシステムの全ファミリーのセマンティックエンコーディングのより広い文脈に配置することで、将来のニューロシンボリックエンコーディングへのガイダンスを提供することが期待されている。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:42:36 GMT)
Physics-informed active learning with simultaneous weak-form latent space dynamics identification [0.3] 非線形力学(WENDy)の弱形式推定をgLaに導入する。
オートエンコーダとWENDyは同時に訓練され、高次元データの潜時空間のダイナミクスを発見する。
WgLa は gLa よりも桁違いに優れ,相対誤差は 1-7% である。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:21:42 GMT)
Data Augmentation in Graph Neural Networks: The Role of Generated Synthetic Graphs [0.2] 本研究では,データ拡張のための生成グラフについて検討する。
生成したグラフを実グラフと組み合わせることのパフォーマンスを比較し、生成したグラフの量が異なることがグラフ分類タスクに与える影響を調べる。
その結果,グラフデータの拡張,一貫性のあるラベルの確保,分類性能の向上など,新たなアプローチが導入された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:05:26 GMT)
CBCTLiTS: A Synthetic, Paired CBCT/CT Dataset For Segmentation And Style Transfer [0.2] CBCTLiTS(CBCTLiTS)は,高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・
CBCTデータは5つの異なる品質レベルで提供され、視覚的品質の高い多数の投影から、厳密なアーティファクトを持つ少数の投影まで到達する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:47:20 GMT)
Evaluation of deep learning models for Australian climate extremes: prediction of streamflow and floods [0.2] 近年、洪水のような気候の極端は、オーストラリアにとって重要な環境と経済の危険を生み出している。
ディープラーニングの手法は、短時間の地平線上で、小規模から中規模の極端な事象を予測することを約束している。
大規模な急激な洪水に対処するアンサンブルベースの機械学習アプローチを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 23:45:04 GMT)
Text Style Transfer: An Introductory Overview [0.2] テキストスタイル転送(TST)は、スタイルに依存しないコンテンツを保存しながらテキストスタイルの属性を操作する自然言語生成において重要なタスクである。
TSTを対象とする属性は、丁寧さ、著者シップ、攻撃的言語の緩和、感情の修正、テキストの形式調整など、多岐にわたる可能性がある。
本稿では,その課題,既存アプローチ,データセット,評価尺度,サブタスク,アプリケーションについて概説する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:54:55 GMT)
Enhancing Profitability and Investor Confidence through Interpretable AI Models for Investment Decisions [0.1] 本稿では、SHAPに基づく説明可能性技術を利用して投資提案を予測するための解釈可能な意思決定モデルを提案する。
提案されたソリューションは、予測されたレコメンデーションに影響を与える要因に関する貴重な洞察を提供するだけでなく、さまざまなタイプの投資家にも影響を及ぼす。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 16:16:55 GMT)
Virtual Z gates and symmetric gate compilation [0.0] オープンな量子システム設定において,コンパイル方法が重要な結果をもたらすことを示す。
仮想Z回転に関して対称なコンパイルを選択することが重要であることを実験的に示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:07:08 GMT)
Tomographic entanglement indicators in a coupled oscillator model [0.0] 我々は、同じ自然周波数の2つの結合線形高調波発振器からなる単純なモデルにおける絡み合いについて検討した。
標準エンタングルメント測度(サブシステム線形エントロピーとサブシステムフォン・ノイマンエントロピー)といくつかのトモグラフィエンタングルメント測度を計算する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:04:02 GMT)
To Be, Or Not To Be?: Regulating Impossible AI in the United States [0.0] 論文は、Impossible AIの3つの例を、開発、展開、批判、政府の規制を通じて追跡している。
我々は,これらのシステムの基本的不確実性を中心とし,クリティハイプに対する注意を喚起する機能優先アプローチを推し進める。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 08:37:13 GMT)
The Missing Curve Detectors of InceptionV1: Applying Sparse Autoencoders to InceptionV1 Early Vision [0.0] スパースオートエンコーダ(SAE)に関する最近の研究は、ニューラルネットワークから解釈可能な特徴を抽出する上で有望であることを示している。
本稿では、よく研究された畳み込みニューラルネットワークであるInceptionV1の初期の視覚層にSAEを適用する。
以上の結果から,SAEは個々のニューロンから明らかでない新しい解釈可能な特徴を発見できることが示された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:32:28 GMT)
Quadratic Formulation of Mutual Information for Sensor Placement Optimization using Ising and Quantum Annealing Machines [0.0] 我々は,センサの配置を複数の候補位置から決定する問題に対処し,最小限のセンサ数で情報取得を最大化することを目的とする。
選択したセンサ位置のデータと他データとの相互情報(MI)を目的関数として定義した。
例として,センサ配置の3つの候補に対する目的関数の最適解を,量子アニールマシンを用いて計算した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 04:46:02 GMT)
Preictal Period Optimization for Deep Learning-Based Epileptic Seizure Prediction [0.0] 我々は頭皮脳波(EEG)信号を用いた発作予測のための競合的深層学習モデルを開発した。
オープンアクセス型CHB-MITデータセットを対象とした19名の小児患者を対象に,本モデルを訓練・評価した。
各患者のOPPを用いて、平均感度は99.31%、特異性は95.34%、AUCは99.35%、F1-スコアは97.46%と正しく同定された。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:49:14 GMT)
Phase estimation via number-conserving operation inside the SU(1,1) interferometer [0.0] ホモダイン検出による位相測定の精度向上のための理論的手法を提案する。
本稿では,数保存操作が位相感度,量子フィッシャー情報,量子クレーマー・ラオ境界に与える影響を,理想的・光子損失の両方のシナリオで解析する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 05:34:43 GMT)
PERCORE: A Deep Learning-Based Framework for Persian Spelling Correction with Phonetic Analysis [0.0] 本研究では,ディープラーニング技術と音声解析をシームレスに統合したペルシャ語スペル訂正システムを提案する。
提案手法は,文脈分析と音韻的洞察を効果的に組み合わせ,非単語と実単語の綴り誤りを正確に補正する。
広帯域データセットの徹底的な評価により,既存手法と比較してシステムの性能が向上することを確認した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:41:04 GMT)
Non-Reference Quality Assessment for Medical Imaging: Application to Synthetic Brain MRIs [0.0] 本研究では,3次元ResNetをトレーニングすることで脳MRI品質を評価するための,ディープラーニングに基づく新しい非参照手法を提案する。
このネットワークは、MRIスキャンでよく見られる6つの異なるアーティファクトで品質を推定するように設計されている。
その結果、歪みを正確に推定し、複数の視点から画質を反映する性能が向上した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 22:05:30 GMT)
Korean Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0] 韓国のレストランレビューに対するアスペクトベース感性分析(ABSA)の調査は特に欠落している。
韓国語などの低リソース言語におけるABSAの直感的で効果的なフレームワークを提案する。
英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 09:32:01 GMT)
Intelligence Analysis of Language Models [0.0] 本研究では,Large Language Models (LLMs) の Abstraction and Reasoning Corpus (ARC) データセットに対する有効性を検証する。
このデータセットは、抽象推論能力をテストするための代表的なベンチマークとして機能する。
モデル性能向上におけるChain-of-Thought(CoT)手法の適用性を検討した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:48:16 GMT)
Integrated BIM and Machine Learning System for Circularity Prediction of Construction Demolition Waste [0.0] 本研究では,機械学習(ML)を用いた可変モデリング(VM)による分解定量化を推し進める。
2280のプロジェクトの解体データセットは、MLモデリングに利用された。
本研究は, 建物解体からリサイクル・埋立処分資材の量を予測するシステムを開発した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:32:46 GMT)
Implementing Fairness: the view from a FairDream [0.0] 私たちはAIモデルをトレーニングし、不平等を検出して修正するために、独自の公正パッケージFairDreamを開発します。
本実験は,FairDreamの特性として,真理を条件としたフェアネスの目標を達成できることを実証した。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 06:06:24 GMT)
Hyperdimensional Computing for Node Classification and Link Prediction [0.0] 超次元表現を用いたグラフ上のトランスダクティブ学習法を提案する。
提案手法は, ランダム投影を用いたデータサンプルを高次元空間に符号化する。
ディープラーニングの手法が必要とするような,高価な反復的なトレーニングの必要性を回避します。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 03:46:13 GMT)
Gibbs Sampling of Continuous Potentials on a Quantum Computer [0.0] 周期的実数値関数からギブスをサンプリングする量子アルゴリズムを構築した。
我々のアルゴリズムは、関数の量子オラクルに対するゼロエスオーダークエリを生成する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:35:17 GMT)
Enhancing Wildfire Forecasting Through Multisource Spatio-Temporal Data, Deep Learning, Ensemble Models and Transfer Learning [0.0] 本稿では,衛星データアルゴリズムとディープラーニング技術の適用を含むマルチソースアンサンブルデータの統合を通じて,山火事予測の新しいアプローチを提案する。
主な焦点は、山火事の予測において、人的活動における気象シーケンスの重要性と、特定の気象パラメータを理解することである。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 02:00:13 GMT)
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels [0.0] 海洋の破片は、鳥類、魚、その他の動物の生命に重大な生態学的脅威をもたらす。
伝統的に残骸の堆積を評価する方法には、労働集約的かつ高価な手作業による調査が含まれる。
本研究では,ドローンが捉えた空中画像を利用して遠隔地ゴミ調査を行うフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:06:27 GMT)
Data Efficient Contrastive Learning in Histopathology using Active Sampling [0.0] ディープラーニングアルゴリズムは、デジタル病理学において堅牢な定量的分析を提供することができる。
これらのアルゴリズムは大量の注釈付きトレーニングデータを必要とする。
アドホックなプリテキストタスクを用いて特徴を学習するための自己教師付き手法が提案されている。
そこで本研究では,小規模なプロキシネットワークを用いたトレーニングセットから情報的メンバを積極的に抽出する手法を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 23:29:28 GMT)
Complementarity relationship between coherence and path distinguishability in an interferometer based on induced coherence [0.0] 我々は、2つの干渉光子の間の一階のコヒーレンスをリンクする相補性関係を導出する。
導出された関係は、単一光子系を超え、生成される光子-流速に対して有効であることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 13:21:09 GMT)
Classification and magic magnetic-field directions for spin-orbit-coupled double quantum dots [0.0] スピンベースの量子コンピューティングの基本的な構築ブロックは、スピン軌道結合が著しい二重量子ドットで実証されている。
スピン軌道結合された二重量子ドットは、g$テンソルの多次元空間の分割に従って6つのクラスに分類できることを示す。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 11:39:42 GMT)
ChatGPT and post-test probability [0.0] われわれはChatGPTにベイズ規則の医学的診断方法の例を挙げる。
医療変数名の導入は,ChatGPTが犯す誤りの数の増加につながることを示す。
感度と特異性に関する最近の解説を踏まえて,本研究の結果について論じる。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 00:54:58 GMT)
Can VLMs be used on videos for action recognition? LLMs are Visual Reasoning Coordinators [0.0] 本稿では,大規模言語モデル (LLM) が,自然言語通信によって複数の視覚言語モデル (VLM) を効率的にコーディネートする方法を示す。
本研究は,同手法が行動認識のための監視ビデオに適用できるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 10:26:28 GMT)
Automatic Real-word Error Correction in Persian Text [0.0] 本稿では,ペルシャ語テキストにおける高精度かつ効率的な実単語誤り訂正のための最先端手法を提案する。
我々は,誤り検出と訂正の有効性を高めるために,意味解析,特徴選択,高度な分類器を用いる。
本手法は,検出段階で96.6%,補正時に99.1%の精度でF測定を行う。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 07:50:52 GMT)
Asynchronous Telegate and Teledata Protocols for Distributed Quantum Computing [0.0] 分散量子演算のコストは、絡み合った光子と古典情報の分散によるレイテンシが高い。
本稿では,非同期な古典通信を実現するために,テレゲートプロトコルとテレデータプロトコルの拡張を提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 21:36:53 GMT)
Alternative Methods to SHAP Derived from Properties of Kernels: A Note on Theoretical Analysis [0.0] 本研究では,LIME のカーネルにおける AFA (Additive Feature Attribution) の一般的および分析的表現を導出する。
我々は、カーネルの適切な性質を持つ新しいAFAや、協調ゲーム理論におけるLS前核と一致するいくつかの新しいAFAを提案する。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 17:02:21 GMT)
A study on general visual categorization of objects into animal and plant groups using global shape descriptors with a focus on category-specific deficits [0.0] 動物と植物の一般的な分類は、テクスチャ情報を処理せずに視覚的に識別可能であることを示す。
結果は教師なし学習機構と教師なし学習機構の両方を用いて評価される。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 19:55:22 GMT)
A Measure for Level of Autonomy Based on Observable System Behavior [0.0] 観測可能な行動を用いて自律性のレベルを予測するための潜在的尺度を提案する。
また,提案手法を取り入れたアルゴリズムを提案する。
この測定とアルゴリズムは、実行時に自律システムを比較する方法に興味のある研究者や実践者にとって重要である。
論文参考訳(メタデータ) (Sat, 20 Jul 2024 20:34:20 GMT)