Adding Domain Knowledge to Inductive Learning Methods for Classifying Texts

将领域知识添加到归纳学习方法中以对文本进行分类

基本信息

  • 批准号:
    9987869
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2000
  • 资助国家:
    美国
  • 起止时间:
    2000-09-01 至 2004-08-31
  • 项目状态:
    已结题

项目摘要

The objective of this research is to investigate the integration of background knowledge into a machine learning approach for automatically indexing text documents. Case-Based Reasoning models for utilizing past experiences have been developed for domains where the cases are text. The prohibitive cost of manually indexing cases has hindered the development and maintenance of large systems for applications in the law, ethics, or help-desk settings. New methods that learn a text classifier from a small collection of annotated case summaries, which will classify large numbers of cases automatically, can help overcome this knowledge-acquisition bottleneck. Text learning algorithms used elsewhere are not applicable because they require large training sets. Here, background knowledge about the domain and a linguistic analysis of the examples is employed to develop a better representation of the examples, which will allow learning algorithms to better generalize from small collections of text cases. The project will also yield a better understanding of what makes a good text representation for learning and classification, and the effects of adding background knowledge and natural language processing tools. The experiments are based on a relatively small collection in a well-defined domain, in which the PI and his group have accumulated significant expertise. This unique background allows a more thorough analysis of the experimental results than generally performed. The classifier is evaluated both on a set of marked-up summaries and the corresponding full-length documents. Further experiments explore the use of unseen and unlabeled cases, and explain the observed behavior. The results and the analysis of the experiments will enable researchers in other domains to improve the representation of text cases. Thus, the research results will not only be relevant for case-based reasoning and machine learning, but also for information retrieval and other text-based applications.
本研究的目的是探讨背景知识的整合到机器学习方法自动索引文本文档。基于案例的推理模型,利用过去的经验已经开发的领域的情况下,文本。人工编制案件索引的高昂费用阻碍了大型系统在法律、道德或服务台环境中的应用的开发和维护。新的方法,从一个小集合的注释的情况下,自动分类大量的情况下,学习文本分类器,可以帮助克服这种知识获取瓶颈。其他地方使用的文本学习算法不适用,因为它们需要大量的训练集。在这里,关于域的背景知识和示例的语言分析被用来开发示例的更好的表示,这将允许学习算法更好地从文本案例的小集合中概括。该项目还将更好地理解什么是学习和分类的良好文本表示,以及添加背景知识和自然语言处理工具的效果。这些实验是基于一个定义明确的领域中相对较小的集合,PI和他的团队在这个领域积累了大量的专业知识。这种独特的背景允许比通常执行的实验结果更彻底的分析。该分类器的评估上的一组标记的摘要和相应的全长文档。进一步的实验探索使用看不见的和未标记的情况下,并解释观察到的行为。实验的结果和分析将有助于其他领域的研究者改进文本案例的表示。因此,研究结果不仅将是相关的基于案例的推理和机器学习,而且对信息检索和其他基于文本的应用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kevin Ashley其他文献

Sampling and analysis issues relating to the ACGIH notice of intended change for the beryllium threshold limit value.
与 ACGIH 铍阈限值预期变更通知相关的采样和分析问题。
How to Improve the Explanatory Power of an Intelligent Textbook: a Case Study in Legal Writing
如何提高智能教材的解释力:以法律写作为例

Kevin Ashley的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kevin Ashley', 18)}}的其他基金

FAI: Using AI to Increase Fairness by Improving Access to Justice
FAI:利用人工智能改善诉诸司法的机会来提高公平性
  • 批准号:
    2040490
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
DIP: Teaching Writing and Argumentation with AI-Supported Diagramming and Peer Review
DIP:利用人工智能支持的图表和同行评审来教授写作和论证
  • 批准号:
    1122504
  • 财政年份:
    2011
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
EAGER: Modeling Interpretive Argument with Case Analogies and Rules in Ill-Defined Domains
EAGER:在定义不明确的领域中通过案例类比和规则对解释性论证进行建模
  • 批准号:
    1049414
  • 财政年份:
    2010
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Hypothesis Formation and Testing in an Interpretive Domain: a Model and Intelligent Tutoring System
解释领域的假设形成和检验:模型和智能辅导系统
  • 批准号:
    0412830
  • 财政年份:
    2004
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
CRCD: Collaborative Case-Based Learning in Engineering Ethics
CRCD:工程伦理中基于案例的协作学习
  • 批准号:
    0203307
  • 财政年份:
    2002
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: Practical Ethical Instruction with Expert-Analyzed Cases
合作研究:实践道德指导与专家分析案例
  • 批准号:
    9617071
  • 财政年份:
    1997
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adding Domain Knowledge to Inductive Learning Methods for Classifying Texts
将领域知识添加到归纳学习方法中以对文本进行分类
  • 批准号:
    9619713
  • 财政年份:
    1997
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Learning and Intelligent Systems: Modeling Learning to Reason with Cases in Engineering Ethics: A Test Domain for Intelligent Assistance
学习与智能系统:利用工程伦理案例对学习进行推理建模:智能辅助的测试领域
  • 批准号:
    9720341
  • 财政年份:
    1997
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Presidential Young Investigator Award
总统青年研究员奖
  • 批准号:
    9058441
  • 财政年份:
    1990
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

拟连续domain范畴的若干问题研究
  • 批准号:
    12301583
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
格值蕴涵算子与Domain理论中的若干问题
  • 批准号:
    12331016
  • 批准年份:
    2023
  • 资助金额:
    193.00 万元
  • 项目类别:
    重点项目
Domain理论中概率幂构造的若干问题研究
  • 批准号:
    12371457
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
To空间上Domain理论中若干问题研究
  • 批准号:
    12261040
  • 批准年份:
    2022
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
面向Jung-Tix问题的Domain理论与量化序理论研究
  • 批准号:
    12231007
  • 批准年份:
    2022
  • 资助金额:
    235 万元
  • 项目类别:
    重点项目
C2 DOMAIN PROTEIN 1 (C2DP1)基因家族在植物开花调控中的功能研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
第四届Domain理论与拓扑学青年学者论坛
  • 批准号:
    12242110
  • 批准年份:
    2022
  • 资助金额:
    5.00 万元
  • 项目类别:
    专项项目
Domain理论中的收敛性与K-有界Sober空间范畴
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
广义Domain结构的表示理论研究
  • 批准号:
    12171149
  • 批准年份:
    2021
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Non-Hausdorff拓扑和Domain理论中若干问题研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目

相似海外基金

CAREER: Continual Learning with Evolving Memory, Soft Supervision, and Cross-Domain Knowledge - Foundational Theory and Advanced Algorithms
职业:利用进化记忆、软监督和跨领域知识进行持续学习——基础理论和高级算法
  • 批准号:
    2338506
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
CRII: III: Towards Reasoning Augmented Searching for Domain-Specific Knowledge Screening
CRII:III:针对特定领域知识筛选的推理增强搜索
  • 批准号:
    2245907
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Excellence in Research: Harnessing Big Data and Domain Knowledge to Advance Deep Learning for Interpretable Cell Quantitation
卓越的研究:利用大数据和领域知识推进深度学习以实现可解释的细胞定量
  • 批准号:
    2302274
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Proto-OKN Theme 1: Creating A Cross-Domain Knowledge Graph to Integrate Health and Justice for Rural Resilience
Proto-OKN 主题 1:创建跨领域知识图谱,将健康与正义结合起来,促进农村复原力
  • 批准号:
    2333836
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Cooperative Agreement
EAGER: III: Learning with less data: Capitalizing on formal pedagogies and human performance to incorporate domain knowledge into deep learning models
EAGER:III:用更少的数据学习:利用正规教学法和人类表现将领域知识纳入深度学习模型
  • 批准号:
    2228910
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Taming "untamed" generative AIs by developing compound optimization support tools that enable the interactive use of domain knowledge in medicinal chemistry
通过开发化合物优化支持工具来驯服“未驯服的”生成人工智能,这些工具能够交互式地使用药物化学领域的知识
  • 批准号:
    22K12258
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A unifying framework for integrating domain knowledge into machine learning algorithms for multidisciplinary industrial applications
将领域知识集成到多学科工业应用的机器学习算法中的统一框架
  • 批准号:
    RGPIN-2020-05422
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Discovery Grants Program - Individual
Revisiting the Knowledge Framework of Mental Disorder: Domain Pluralism and Interactive Model
重温精神障碍的知识框架:领域多元化与交互模型
  • 批准号:
    22K00268
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Smart deep learning by incorporating remote sensing domain knowledge in vegetation characterization
将遥感领域知识融入植被表征中的智能深度学习
  • 批准号:
    RGPIN-2021-03624
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Discovery Grants Program - Individual
Curriculum Model Development for the Promotion Effectiveness of Mathematical Knowledge and Expansion of Quantitative Concepts in the Measurement Domain
数学知识提升有效性和测量领域定量概念扩展的课程模型开发
  • 批准号:
    22K02509
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了