データストリーム環境におけるオンライン学習アルゴリズムの研究

数据流环境下在线学习算法研究

基本信息

  • 批准号:
    11J03668
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

実用的な機械学習をRAM容量を超える数10GB単位のデータに対して適用する場合はメモリスワップにより効率が著しく低下する問題があった。そこで我々は特にサポートベクターマシン(SVM)の機械学習において、現在汎用的に利用可能なマルチコアプロセッサおよびメモリ階層構造の特長を利用し、RAM容量を超えるデータを用いたSVM学習を高速に行うアルゴリズム、StreamSVMを提案した。提案アルゴリズムはDual Cached Loopsという提案スキームの上で動作する。Dual Cached Loopsは2つのスレッドが非同期的に動作する。Reading threadとよばれるスレッドはハードディスク(HDD)に連続アクセスし、繰り返しデータをHDDからRAMへ読み込む。一方のTraining ThreadとよばれるスレッドはRAMに転送されたデータにのみアクセスするため、HDDからの読み込みのオーバーヘッドを被ることなく、かつ途中で停止することなくデータアクセスが可能である。RAMへのアクセスはHDDからの読み込みに比べ高速であるため、Readingthreadが一度データを読み込む間に何回もデータにアクセスすることが可能であり、高速なパラメータ更新が可能となる。評価実験により、提案手法は既存手法に比べて非常に高速に学習が可能であることを確認した。さらに、この提案スキームを用いて他の機械学習の問題であるロジスティック回帰やサポートベクター回帰に対するアルゴリズムを開発した。また、複数のモデルを同時に学習する手法も開発することができた。これによってストリームデータをHDDに記憶させながら、それらを無駄にすることなく、またオンライン学習アルゴリズムの効率の良さを保ちながらバッチ学習を行うことができる。このアルゴリズムおよび方法論によって、当初の目的であったデータストリーム環境における制限を克服しながら今までの方法と匹敵する高い精度を達成することが可能になったと言える。
The memory capacity of the machine is over 10GB, and the memory rate is low. In this paper, we propose a new method for machine learning of SVM (Support Vector Machine), which is widely used to make use of the advantages of hierarchical structure, RAM capacity and SVM learning. The proposal is for Dual Cached Loops. Dual Cached Loops is not synchronized. Reading thread: read thread A Training Thread may be sent to RAM, HDD, or stopped in the middle of the road. RAM access to HDD is possible at high speed, Readingthread is possible. The evaluation method is faster than the existing method, so it is possible to confirm it. In this paper, the author proposes to use the machine learning problem to solve the problem. The number of people who are interested in learning This is a good way to keep track of HDD memory and learning. The goal is to overcome the constraints of this methodology and achieve high accuracy.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Linear support vector machines via dual cached loops
  • DOI:
    10.1145/2339530.2339559
  • 发表时间:
    2012-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shin Matsushima;S. Vishwanathan;Alex Smola
  • 通讯作者:
    Shin Matsushima;S. Vishwanathan;Alex Smola
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松島 慎其他文献

松島 慎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松島 慎', 18)}}的其他基金

Large-scale sparse learning using asynchronous architecture for interpretable model
使用异步架构进行可解释模型的大规模稀疏学习
  • 批准号:
    23K11213
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ビッグデータ解析のための非同期的な分散型最適化法
大数据分析的异步分布式优化方法
  • 批准号:
    13J09586
  • 财政年份:
    2013
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
  • 批准号:
    24K15796
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
  • 批准号:
    24K13948
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
  • 批准号:
    24K13518
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
  • 批准号:
    24K15093
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多次元イベント時間データ解析の推測理論と方法・機械学習の開発
多维事件时间数据分析的推理理论和方法/机器学习的发展
  • 批准号:
    24K14853
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
速度ポテンシャルエネルギー整形法と機械学習を用いた宇宙機制御理論の開発
利用速度势能整形方法和机器学习发展航天器控制理论
  • 批准号:
    23K20946
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ユビキタス機械学習社会におけるプライバシ保護基盤
无处不在的机器学习社会中的隐私保护基础设施
  • 批准号:
    23K21695
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
正則化機能強化による超ロバスト推定法の開拓と一般化:信号処理・機械学習への応用
通过加强正则化功能开发和推广超鲁棒估计方法:在信号处理和机器学习中的应用
  • 批准号:
    23K22762
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
攻撃に耐性を持つ機械学習モデルによる設計工程ハードウェアトロイ検知
使用抗攻击的机器学习模型在设计过程中检测硬件木马
  • 批准号:
    23K24816
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了