効率のよいデータマイニングシステムに関する研究

高效数据挖掘系统研究

基本信息

  • 批准号:
    09780284
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

本研究では、スーパーマーケット等のセールスデータベースから、有用な情報の一つとして、同時によく買われる商品の集合を見つける問題の複雑さについて考察を行った。その結果、以下の(1)〜(5)の結果を得た。(1) 同時によく買われる商品の集合を全て(厳密に言えばそのような集合の要素数の最大値も)求めることは一般にはデータベースサイズの多項式時間では(P=NPでない限り)不可能である。すなわち、大規模データベースに対しては実現的な時間では不可能である。(2) 「同時によく買われる」の代わりに、「それらの商品が独立に買われる率と比べてはるかに同時によく買われる」[文献1]及び「それらの商品が別々に買われる(つまりそれらの商品の一部を購入して、残りを購入しない場合が多い)ことが少ない」[文献2]という基準も提案されている。しかし、それらの基準を用いてもやはり上記(1)と同様に有用な情報をデータベースから現実的時間で求めることは不可能であることを示した。(3) 「疎なデータベース」というデータベースのクラスを提案した。これは、直観的には消費がその場で行われるような(例:野球場や映画館等の売店など)データベースのクラスである。そして、疎なデータベースから、効率よく(1)や(2)の集合を求めるアルゴリズムを提案した。(4) 「周期性を持つデータベース」というセールスデータベースのクラスを提案した。これは、例えばデータベースを年単位に区切った場合、前年同月のデータが今年同月のデータに類似する(例:10月には{さんま、大根}という組み合わせが年に関わらずよく売れる)というデータベースである。そして、そのクラスに属するデータベースから、効率よく(1)や(2)の集合を求めるアルゴリズムを提案した。(5) 与えられたデータベースが上記(4)の周期性を持つデータベースであるか否か効率よく判定するアルゴリズムを提案した。[文献1]S.Brin.R. Motwani,J.D.Ullman and S.Tsur:“Dynamic Itemset Counting and Implementation Rules for Marcket Bascket Data,"Proc.SIGMOD,1997,pp.255-264.[文献2]C.Charu,C.Aggarwal and S.Yu Philip:“A New Framework For Itemset Generation."PODS,1998.pp.18-24
The purpose of this research is to provide useful information for the purpose of this research.して、At the same time, I buy われる products and collect them. The results of the following are the results of (1)~(5). (1) At the same time, I want to buy all the items in the collection.ることはGeneral にはデータベースサイズのPolynomial time では (P=NP でないlimit り) impossible である.すなわち, large-scale データベースに対しては実 appeared な时ではimpossibleである. (2) 「によくbuy われる」の generation わりに、「それらの品が independently にbuy われる rateと比べてはるかに at the same time によくbuy われる」[Document 1] and び「それらの品が々にbuyわれる(つまりそれらの品の一一を买して、 residualりを买しない occasionが多い)ことが小ない》[Document 2]というBenchmarkもProposalされている.しかし、それらの精品を用いてもやはり上记(1)与様に用なinformationをデータベースからNow the time of the day is not possible. (3) 「疎なデータベース」というデータベースのクラスをProposalした.これは, the には consumption of the direct view がその场で行われるような (example: wild Stadium, cinema, etc. の売店など)データベースのクラスである.そして、疎なデータベースから、efficiencyよく(1)や(2)のassembleをask for めるアルゴリズムをproposal した. (4) 「Periodic をhold つデータベース」というセールスデータベースのクラスを proposal した.これは, example えばデータベースを年単区区った occasion, the same month the year before last, のデータがthis year, the same month のデータにsimilar する( Example: October には{さんま、大根}という组み合わせが年に关わらずよく売れる)というデータベースである.そして、そのクラスに genus するデータベースから、efficiency よく(1)や(2)のassembleをquestめるアルゴリズムをproposalした. (5) The periodic のられたデータベースが mentioned above (4) is the つデータベースであるかNoかefficiencyよくJudgmentするアルゴリズムをProposalした. [Document 1] S.Brin.R. Motwani, J.D.Ullman and S.Tsur: "Dynamic Itemset Counting and Implementation Rules for Marcket Bascket Data," Proc.SIGMOD, 1997, pp.255-264. [Document 2] C. Charu, C. Aggarwal and S. Yu Philip: "A New Framework For Itemset Generation."PODS,1998.pp.18-24

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
権 娟大: "効率良く頻出集合をデータマイニング可能なデータベースクラスについて" 電子情報通信学会技術研究報告. COMP98-9. 1-8 (1998)
Kwon, Chang-dae:“关于可以有效地挖掘频繁集的数据库类”IEICE 技术研究报告 1-8 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
野中康太郎: "頻出集合のインクリメンタルなデータマイニング" 電子情報通信学会技術研究報告. COMP98-39. 9-16 (1998)
Kotaro Nonaka:“频繁集的增量数据挖掘”IEICE COMP98-39 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
巽 知厳: "データマイニングにおける頻出集合問題の計算複雑さ" 電子情報通信学会技術研究報告. COMP97-67. 57-64 (1997)
Tomogon Tatsumi:“数据挖掘中频繁集合问题的计算复杂性”IEICE COMP97-67 (1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
巽 知厳, 中西隆一, 伊藤 実, 関 浩之: "データマイニングにおける頻出集合問題の計算複雑さ" 電子情報通信学会技術研究報告. COMP97-67. (1997)
Tomogon Tatsumi、Ryuichi Nakanishi、Minoru Ito、Hiroyuki Seki:“数据挖掘中频繁集合问题的计算复杂性”IEICE COMP97-67。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
権 娟大, 中西隆一, 伊藤 実, 中西通雄: "効率良く頻出集合をデータマイニング可能なデータベースクラスについて" 電子情報通信学会技術研究報告. (発表予定). (1998)
Chodai Kwon、Ryuichi Nakanishi、Minoru Ito、Michio Nakanishi:“关于可以有效地数据挖掘频繁集的数据库类”IEICE 技术研究报告(即将出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中西 隆一其他文献

中西 隆一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('中西 隆一', 18)}}的其他基金

多重文脈自由文法ベースの構文解析システムに関する研究
基于多上下文无关语法的句法分析系统研究
  • 批准号:
    08780275
  • 财政年份:
    1996
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了