A Study on Information Acquisition and Extraction from Dynamic Information Sources Based on Knowledge Discovery and Learning
基于知识发现与学习的动态信息源信息获取与提取研究
基本信息
- 批准号:15300027
- 负责人:
- 金额:$ 10.5万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In this research project, we studied information extraction from information sources in the web environment and user-friendly data operation facilities based on knowledge discovery and machine learning techniques. The research results can be summarized as follows.1.Extraction of information from hidden web sites is important. We developed a scheme to extract new topic contents form hidden web sites including document databases.2.We developed some new information analysis methods. In particular, new methods for topic detection from text steams, outlier detection, and correlation analysis were developed.3.We studied information extraction from the web using classification techniques. In particular, a system for web information retrieval was developed which utilizes existing taxonomy hierarchies. We also developed a new web information extraction method which combines database-oriented focused crawling and information extraction from web pages.4.Basic schemes for information sharing in distributed environments were studied.5.We developed a knowledge discovery technique for rule mining from transaction databases containing noise.6.We developed a smart facility which automatically generates XML queries based on data manipulation examples given by a user.7.Basic schemes to map binary data in original information sources into XML views were developed.8. We studied system architecture which can integrate a variety of information extracted from different information sources taking properties of original sources into consideration.
本研究以知识发现与机器学习技术为基础,探讨在网路环境下,如何从资讯来源中撷取资讯,并提供使用者友善的资料操作工具。本文的研究成果可以概括为以下几个方面:1.从隐藏网站中提取信息是一个重要的研究课题。提出了一种从隐藏网站(包括文档数据库)中提取新主题内容的方案。2.提出了一些新的信息分析方法。特别是在文本流中的主题检测、离群点检测和相关性分析等方面提出了新的方法。3.研究了基于分类技术的Web信息抽取。特别是,网络信息检索系统的开发,利用现有的分类层次结构。我们还开发了一种新的Web信息抽取方法,4.研究了分布式环境下信息共享的基本方案; 5.提出了一种从含有噪声的事务数据库中进行规则挖掘的知识发现技术; 6.提出了一种基于数据操作实例的XML查询自动生成的智能工具7.开发了将原始信息源中的二进制数据映射到XML视图的基本方案.我们研究的系统架构,可以集成从不同的信息源提取的各种信息,同时考虑到原始源的属性。
项目成果
期刊论文数量(194)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
連続的問合せを用いたテキストストリームに対する類似検索
使用连续查询对文本流进行相似性搜索
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:井ノ口馨;斎藤喜人;Yousuke Watanabe;Akiyoshi Nakamizo;Jianwei Zhang;Masafumi Hamamoto;山田真一;Sophoin KHY;町田陽二;山田真一;濱本雅史;飯田敏成;町田陽二;山田真一;町田陽二;濱本雅史;Sophoin KHY;濱本雅史;渡辺陽介;山田真一;町田陽二;品川徳秀;Biplab Kumer Sarker;Masafumi Hamamoto;Takanori Mouri;Cui Zhu;Jia-Yu Pan;Cui Zhu;Norihide Shinagawa;渡辺陽介
- 通讯作者:渡辺陽介
塚本祐一: "索引付けされた移動軌跡データからの効率的な移動統計量抽出法"日本データベース学会Letters. 2-1. 27-30 (2003)
Yuichi Tsukamoto:“从索引运动轨迹数据中提取有效的运动统计数据”,日本数据库协会 27-30 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
毛利隆軌: "プロービングによるテキストデータベースからの新規トピック文書抽出"日本データベース学会Letters. 2-1. 107-110 (2003)
Takaki Mori:“通过探测从文本数据库中提取新主题文档”日本数据库协会 107-110 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
渡辺陽介: "問合せ最適化機構を備えたデータストリーム統合システムの開発"DEWS2004. (Web出版). (2004)
Yosuke Watanabe:“具有查询优化机制的数据流集成系统的开发”DEWS2004(网络出版)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KITAGAWA Hiroyuki其他文献
KITAGAWA Hiroyuki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KITAGAWA Hiroyuki', 18)}}的其他基金
Development of liquid-phase growth using a sliding boat for preparation of Bi2Te3-based thermoelectric materials
滑动船液相生长制备 Bi2Te3 基热电材料的进展
- 批准号:
24560884 - 财政年份:2012
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A proposal of new isotope geothermometer from lake sediments
新型湖泊沉积物同位素地温计的提案
- 批准号:
23651013 - 财政年份:2011
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
A Highly Adaptable and Reliable Stream Data Management Framework to Support Large-scale Ubiquitous Information Applications
支持大规模泛在信息应用的高适应性、高可靠性的流数据管理框架
- 批准号:
21240005 - 财政年份:2009
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Atmospheric radiocarbon variation during the past 50 ka by the high-resolution analysis of heaven lake sediment
天湖沉积物高分辨率分析近50 ka大气放射性碳变化
- 批准号:
20310007 - 财政年份:2008
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of liquid-phase growth process for Bi_2Te_3-based Thermoelectric Materials
Bi_2Te_3基热电材料液相生长工艺开发
- 批准号:
20760494 - 财政年份:2008
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Sampling of varve sediment from volcanic craters in NE China for extending ^<14>C calibration curve
中国东北火山口火山沉积物采样用于扩展^<14>C校准曲线
- 批准号:
18403002 - 财政年份:2006
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of a Real-time Real World Information Management Framework based on Highly-Functional Distributed Stream Processing
基于高性能分布式流处理的实时现实世界信息管理框架的开发
- 批准号:
18200005 - 财政年份:2006
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Characteristic of East Asia climatic changes and its synchronization with global climatic changes
东亚气候变化特征及其与全球气候变化的同步性
- 批准号:
16310008 - 财政年份:2004
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Cosomogenic isotope production and global carbon cycles during the past 10,000 years
过去一万年的同位素产生和全球碳循环
- 批准号:
13490013 - 财政年份:2001
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Dynamic Similarity Search on Semistractured Multimedia Databases Using Multiple Similarity Measures
使用多种相似性度量对半结构化多媒体数据库进行动态相似性搜索
- 批准号:
12480067 - 财政年份:2000
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
Towards knowledge discovery from imperfect and evolving data
从不完美和不断发展的数据中发现知识
- 批准号:
DP240103070 - 财政年份:2024
- 资助金额:
$ 10.5万 - 项目类别:
Discovery Projects
Travel: Student Support for the 2023 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2023)
旅行:2023 年 ACM SIGKDD 知识发现和数据挖掘会议 (KDD 2023) 的学生支持
- 批准号:
2323492 - 财政年份:2023
- 资助金额:
$ 10.5万 - 项目类别:
Standard Grant
CAREER: Statistically-Sound Knowledge Discovery from Data
职业:从数据中发现统计上合理的知识
- 批准号:
2238693 - 财政年份:2023
- 资助金额:
$ 10.5万 - 项目类别:
Continuing Grant
Collaborative Research: III: Medium: Knowledge discovery from highly heterogeneous, sparse and private data in biomedical informatics
合作研究:III:中:生物医学信息学中高度异构、稀疏和私有数据的知识发现
- 批准号:
2312862 - 财政年份:2023
- 资助金额:
$ 10.5万 - 项目类别:
Standard Grant
Study on knowledge discovery methods based on matrix factorization
基于矩阵分解的知识发现方法研究
- 批准号:
23K11229 - 财政年份:2023
- 资助金额:
$ 10.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collaborative Research: III: Medium: Knowledge discovery from highly heterogeneous, sparse and private data in biomedical informatics
合作研究:III:中:生物医学信息学中高度异构、稀疏和私有数据的知识发现
- 批准号:
2312863 - 财政年份:2023
- 资助金额:
$ 10.5万 - 项目类别:
Standard Grant
Semantic integration of protein epitopes and functional features for infectious and autoimmune disease knowledge discovery
用于传染病和自身免疫性疾病知识发现的蛋白质表位和功能特征的语义整合
- 批准号:
10442059 - 财政年份:2022
- 资助金额:
$ 10.5万 - 项目类别:
Supporting Knowledge Discovery in Life Sciences
支持生命科学领域的知识发现
- 批准号:
RGPIN-2017-06487 - 财政年份:2022
- 资助金额:
$ 10.5万 - 项目类别:
Discovery Grants Program - Individual
Semantic integration of protein epitopes and functional features for infectious and autoimmune disease knowledge discovery
用于传染病和自身免疫性疾病知识发现的蛋白质表位和功能特征的语义整合
- 批准号:
10596633 - 财政年份:2022
- 资助金额:
$ 10.5万 - 项目类别:
NSF Student Travel Grant for the 2022 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2022)
NSF 学生旅费资助 2022 年 ACM SIGKDD 知识发现和数据挖掘会议 (KDD 2022)
- 批准号:
2223561 - 财政年份:2022
- 资助金额:
$ 10.5万 - 项目类别:
Standard Grant