From text mining to knowledge extraction

从文本挖掘到知识提取

基本信息

  • 批准号:
    105365-2006
  • 负责人:
  • 金额:
    $ 1.82万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2007
  • 资助国家:
    加拿大
  • 起止时间:
    2007-01-01 至 2008-12-31
  • 项目状态:
    已结题

项目摘要

The Semantic Web promises a wealth of ready-to-use information to the world. Companies like Google recently engaged in such an endeavour to provide more than just textual information to its users, but some semantic content as well. Since it is a colossal work to manually encode that information into some formal knowledge representation format, automatic information extraction from text becomes therefore relevant for that purpose. Extracting information is too context sensitive to be applicable on the Web per se. Therefore, concise domains, like corporate Intranets, may prove to offer more realistic application grounds. Also, since queries to such corporate libraries are usually goal (or task) oriented, as opposed to general browsing queries, it may be useful for the query-answering system to benefit from a classification of the texts that compose these libraries. When manually built, these classifications are also too costly to be achieved. Consequently, in that context where documents are (partly) classified with regard to precise subject matters, this research program proposes: 1) to study the integration of various feature selection algorithms into the knowledge extraction process, based on some of our previous work in feature selection, text classification and knowledge extraction, 2) to study the impact of automatic ontology construction tools on the knowledge extraction process itself, 3) to propose some probabilistic assessment algorithm for the relevance of the extracted knowledge structures pertaining to recall and precision, and 4) to propose some knowledge indexing schema that would speed up the look up time needed to filter out the irrelevant documents from the relevant ones.
语义网向全世界承诺提供大量现成可用的信息。像谷歌这样的公司最近致力于向用户提供不仅仅是文本信息,还有一些语义内容。由于将这些信息手动编码为某种正式的知识表示格式是一项巨大的工作,因此从文本中自动提取信息变得与此相关。提取信息对上下文太敏感,不能应用于Web本身。因此,简洁的域,如企业内部网,可能会证明提供更现实的应用基础。此外,由于对这样的公司库的查询通常是面向目标(或任务)的,与一般的浏览查询相反,查询-应答系统受益于组成这些库的文本的分类可能是有用的。当手动构建时,这些分类也太昂贵而无法实现。因此,在这种情况下,文件是(部分)分类方面的确切主题,这项研究计划提出:1)研究将各种特征选择算法集成到知识提取过程中,基于我们以前在特征选择、文本分类和知识提取方面的一些工作,2)研究了本体自动构建工具对知识抽取过程本身的影响; 3)提出了一些概率评估算法,用于评估抽取的知识结构与查全率和查准率的相关性; 4)提出了一种知识索引模式,以加快从相关文档中过滤掉不相关文档所需的查找时间。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mineau, Guy其他文献

Complexity minimization in rule-based category learning: Revising the catalog of Boolean concepts and evidence for non-minimal rules
  • DOI:
    10.1016/j.jmp.2006.12.001
  • 发表时间:
    2007-04-01
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Lafond, Daniel;Lacouture, Yves;Mineau, Guy
  • 通讯作者:
    Mineau, Guy

Mineau, Guy的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mineau, Guy', 18)}}的其他基金

From text mining to knowledge extraction
从文本挖掘到知识提取
  • 批准号:
    105365-2006
  • 财政年份:
    2010
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
From text mining to knowledge extraction
从文本挖掘到知识提取
  • 批准号:
    105365-2006
  • 财政年份:
    2009
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
From text mining to knowledge extraction
从文本挖掘到知识提取
  • 批准号:
    105365-2006
  • 财政年份:
    2008
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
From text mining to knowledge extraction
从文本挖掘到知识提取
  • 批准号:
    105365-2006
  • 财政年份:
    2006
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive distributed KDD methodologies
自适应分布式 KDD 方法
  • 批准号:
    105365-2002
  • 财政年份:
    2005
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
A computation cluster for distributed data mining
用于分布式数据挖掘的计算集群
  • 批准号:
    300396-2004
  • 财政年份:
    2004
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Research Tools and Instruments - Category 1 (<$150,000)
Adaptive distributed KDD methodologies
自适应分布式 KDD 方法
  • 批准号:
    105365-2002
  • 财政年份:
    2004
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive distributed KDD methodologies
自适应分布式 KDD 方法
  • 批准号:
    105365-2002
  • 财政年份:
    2003
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive distributed KDD methodologies
自适应分布式 KDD 方法
  • 批准号:
    105365-2002
  • 财政年份:
    2002
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Methodological knowledge representation and indexing in large size industrial applications
大型工业应用中的方法论知识表示和索引
  • 批准号:
    105365-1998
  • 财政年份:
    2001
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

基于Genome mining技术研究抑制表皮葡萄球菌生物膜形成的次级代谢产物
  • 批准号:
    21242003
  • 批准年份:
    2012
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目
在我们的门前发掘化石——利用中国即将开展的巡天来研究银河系的演化
  • 批准号:
    11043005
  • 批准年份:
    2010
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目
高维稀疏数据聚类研究
  • 批准号:
    70771007
  • 批准年份:
    2007
  • 资助金额:
    16.0 万元
  • 项目类别:
    面上项目
林火行为的动态模拟信息系统
  • 批准号:
    30371171
  • 批准年份:
    2003
  • 资助金额:
    17.0 万元
  • 项目类别:
    面上项目

相似海外基金

Learning Precision Medicine for Rare Diseases Empowered by Knowledge-driven Data Mining
通过知识驱动的数据挖掘学习罕见疾病的精准医学
  • 批准号:
    10732934
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Annotating dark ion-channel functions using evolutionary features, machine learning and knowledge graph mining
使用进化特征、机器学习和知识图挖掘注释暗离子通道函数
  • 批准号:
    10457684
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Integrated Health Sciences Facility Core
综合健康科学设施核心
  • 批准号:
    10689676
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Use of NLP to Extract Risk Indicators for Immunologic Disease from the Text of EHRs (UNIITE)
使用 NLP 从 EHR 文本中提取免疫疾病的风险指标 (UNIITE)
  • 批准号:
    10615338
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Identifying and Promoting Quality Low Back Pain Care by Chiropractors
识别并促进脊椎按摩师提供优质的腰痛护理
  • 批准号:
    10525747
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Identifying and Promoting Quality Low Back Pain Care by Chiropractors
识别并促进脊椎按摩师提供优质的腰痛护理
  • 批准号:
    10672977
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Integrated Health Sciences Facility Core
综合健康科学设施核心
  • 批准号:
    10393299
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
Domain-Knowledge Informed Deep Learning for Early Detection of Pancreatic Cancer
基于领域知识的深度学习用于胰腺癌的早期检测
  • 批准号:
    10458067
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
Knowledge Base and Portal
知识库和门户
  • 批准号:
    10676276
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
Knowledge discovery and machine learning to elucidate the mechanisms of HIV activity and interaction with substance use disorder
知识发现和机器学习阐明艾滋病毒活动及其与药物滥用障碍相互作用的机制
  • 批准号:
    10671033
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了