データベースから近似的な規則を抽出する高速アルゴリズムの研究
数据库近似规则提取高速算法研究
基本信息
- 批准号:12780286
- 负责人:
- 金额:$ 1.15万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では最大合意問題とよばれる規則獲得の問題を発展させ,例からの規則抽出一般に適用する枠組みを提案した.そして効率のよい近似アルゴリズムを設計するための理論構築を行い,さらに実用性を確かめるためのプロトタイピングを行った.具体的には,エントロピー関数など様々な評価関数を使用できるよう拡張した.アプリケーション面では特に,ネットワーク上のウェブのソースファイル,SGMLファイルなど,従来のデータマイニング手法が苦手とする弱構造の大規模データベースヘの応用を行った.まず最大合意問題の評価関数をより一般に拡張し,例の分類精度をエントロピー,Giniインデックスなどを使って評価する方法を考察した.そして高速なアルゴリズムを設計し,さらにその実装評価を行った.現実の要求に近づけた状況で,メモリやディスクスペースを効果的に使用する技術とアルゴリズムとの親和性を,実験的にも検証した.特に,弱い構造,あるいは疑構造しか仮定できないテキストデータベースに対して,レコードの構造や登録項目(アイテム)をあらかじめ固定して想定する必要のない,入力に対して動的にレコードの処理や登録項目の抽出を行うシステムを構築した.その成果として,現実のテキストデータベースなどを対象とした知識抽出システムのプロトタイピングを行い,最大合意問題に基づくシステムの能力と実用上の問題点を明らかにした.
This paper presents a proposal for the development of the optimal problem of rule extraction, such as the general application of rule extraction. The design of the system is based on the theory of the system, and the system is based on the theory of the system. The specific number of customs is used in the evaluation of customs. The large-scale design of the weak structure is carried out by the weak structure of the large scale design of the weak structure. The evaluation method of the most desirable problem is investigated in general and classification accuracy of the example. The design of high-speed high Now the requirements are close to the situation, the use of technology, the compatibility of technology, the implementation of the test In particular, weak structure, such as structure, fixed structure, entry structure. The results of the study show that the problem of knowledge extraction and application is the most desirable problem in the study of knowledge extraction and application.
项目成果
期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
安部 潤一郎, 藤野 亮一, 下薗 真一, 有村 博紀, 有川 節夫: "テキストデータからの高速データマイニング--探索的文書ブラウジングとウェブデータヘの応用--"人工知能学会誌. 15(4). 618-628 (2000)
Junichiro Abe、Ryoichi Fujino、Shinichi Shimozono、Hiroki Arimura、Setsuo Arikawa:“文本数据的高速数据挖掘——探索性文档浏览和网络数据应用——”日本人工智能学会杂志 15(4)。 618-628(2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
T.Akutsu,H.Arimura,S.Shimozono: "On Approximation Algorithms for Local Multiple Alignment"Proc.of the Fourth Annual, International Conference on Computational Molecular Biology (RECOMB 2000). 1-7 (2000)
T.Akutsu、H.Arimura、S.Shimozono:“关于局部多重比对的近似算法”第四届国际计算分子生物学会议年度报告(RECOMB 2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
N.Kubo,S.Shimozono,K.Muramoto: "A Simple and Quick Approximation Algorithm for Traveling Salesman Problem in the Plane"Proc.of the 11th Interrational Conference on Algorithm and Computation. 216-227 (2000)
N.Kubo,S.Shimozono,K.Muramoto:“飞机上旅行商问题的简单快速近似算法”第 11 届国际算法与计算会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Shimozono, H.Arimura, S.Arikawa: "Efficient discoverly of optimal word-association patterns in large text databases"New Generation Computing. 18. 49-61 (2000)
S.Shimozono、H.Arimura、S.Arikawa:“在大型文本数据库中有效发现最佳单词关联模式”新一代计算。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
H.Arimura, J.Abe, H.Sakamoto, S.Arikawa, R.Fujino, S.Shimozono: "Text Data Mining : Discovery of Important Keywords in the Cyberspace"Kyoto International Conference on Digital Libraries 2000. 121-126 (2000)
H.Arimura, J.Abe, H.Sakamoto, S.Arikawa, R.Fujino, S.Shimozono:“文本数据挖掘:网络空间中重要关键词的发现”京都国际数字图书馆会议 2000. 121-126 (2000
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
下薗 真一其他文献
SQL による評価関数の外部定義が可能な最適時間割作成システム
允许使用 SQL 外部定义评估函数的最佳时间表创建系统
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
里中 政儀;下薗 真一 - 通讯作者:
下薗 真一
幾何点列近似照合を用いたタンパク質二次構造近似検索の実現
利用几何点序列近似匹配实现蛋白质二级结构近似搜索
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
畑瀬 卓司;大橋 健士郎;下薗 真一 - 通讯作者:
下薗 真一
下薗 真一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('下薗 真一', 18)}}的其他基金
最適作業時間割問題のカスタマイザブルCADシステム
可定制的 CAD 系统解决最佳工作时间表问题
- 批准号:
16700147 - 财政年份:2004
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
近似圧縮アルゴリズムによるテキストデータ処理の高速化
使用近似压缩算法加速文本数据处理
- 批准号:
08780373 - 财政年份:1996
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
近似圧縮アルゴリズムによるテキストデータ処理の高速化
使用近似压缩算法加速文本数据处理
- 批准号:
07780341 - 财政年份:1995
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)