CAREER: Data-Driven Document Generation

职业:数据驱动文档生成

基本信息

  • 批准号:
    2037519
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-07-01 至 2025-01-31
  • 项目状态:
    未结题

项目摘要

Increasingly, machine-generated language is being used in everyday interactions, from consumer applications such as intelligent assistants to accessibility tools for simplifying complex documents. This CAREER project seeks to improve methods for text generation to ensure they work consistently when producing documents longer than a few sentences. The investigator will study machine learning-based methods for text generation that aim to ensure that document structure is consistent, that people and places are referred to appropriately, and that factual information is correctly expressed. The award will additionally support the development of open-source tools to make it easier for others to use and extend these approaches for a variety of text generation application. This research will be integrated into education through new methods for university teaching of machine learning, mentoring for underrepresented students in computer science, and outreach to primary-school students who may not have been exposed to artificial intelligence and data science as an area of study. The focus of this project is on data-driven natural language generation with deep learning. In recent years, the field has made progress on using new machine learning methods to learn to generate text based on human examples; however, this work is still far from human level particularly when generating document-level text. This project will develop new machine learning methods using deep generative models. These include learning and controlling document structure with deep hidden Markov models, content determination through generative reference and alignment, and aggregating content into text through bottom-up selection. Each of these combines research into machine learning methods with natural language analysis. The goal of the project is to develop an open-source implementation of a text generation methods that allow users to easily target new domains and assess the fidelity and coherence of their system.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
机器生成语言越来越多地用于日常交互,从智能助理等消费者应用程序到简化复杂文档的辅助工具。这个CAREER项目旨在改进文本生成的方法,以确保在生成超过几句话的文档时,它们能够始终如一地工作。研究人员将研究基于机器学习的文本生成方法,旨在确保文档结构一致,人员和地点被适当引用,以及事实信息被正确表达。该奖项还将支持开源工具的开发,使其他人更容易使用和扩展这些方法用于各种文本生成应用程序。这项研究将通过大学机器学习教学的新方法,为计算机科学中代表性不足的学生提供指导,以及向可能没有接触过人工智能和数据科学作为研究领域的小学生提供服务,从而融入教育。该项目的重点是通过深度学习生成数据驱动的自然语言。近年来,该领域在使用新的机器学习方法来学习基于人类示例生成文本方面取得了进展;然而,这项工作仍然远远没有达到人类水平,特别是在生成文档级文本时。该项目将使用深度生成模型开发新的机器学习方法。这些包括使用深度隐马尔可夫模型学习和控制文档结构,通过生成参考和对齐确定内容,以及通过自下而上选择将内容聚合为文本。每一个都将机器学习方法的研究与自然语言分析相结合。该项目的目标是开发一个文本生成方法的开源实现,使用户能够轻松地定位新的域并评估其系统的保真度和一致性。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Symbolic Planning and Code Generation for Grounded Dialogue
扎根对话的符号规划和代码生成
  • DOI:
    10.18653/v1/2023.emnlp-main.460
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chiu, Justin;Zhao, Wenting;Chen, Derek;Vaduguru, Saujas;Rush, Alexander;Fried, Daniel
  • 通讯作者:
    Fried, Daniel
Model Criticism for Long-Form Text Generation
长文本生成的模型批评
  • DOI:
    10.18653/v1/2022.emnlp-main.815
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Deng, Yuntian;Kuleshov, Volodymyr;Rush, Alexander
  • 通讯作者:
    Rush, Alexander
Scaling Hidden Markov Language Models
  • DOI:
    10.18653/v1/2020.emnlp-main.103
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Justin T Chiu;Alexander M. Rush
  • 通讯作者:
    Justin T Chiu;Alexander M. Rush
Posterior Control of Blackbox Generation
  • DOI:
    10.18653/v1/2020.acl-main.243
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    4.2
  • 作者:
    Xiang Lisa Li;Alexander M. Rush
  • 通讯作者:
    Xiang Lisa Li;Alexander M. Rush
Sequence-level Mixed Sample Data Augmentation
  • DOI:
    10.18653/v1/2020.emnlp-main.447
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Demi Guo;Yoon Kim;Alexander M. Rush
  • 通讯作者:
    Demi Guo;Yoon Kim;Alexander M. Rush
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alexander Rush其他文献

Simple and Effective Masked Diffusion Language Models
简单有效的掩蔽扩散语言模型
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Sahoo;Marianne Arriola;Yair Schiff;Aaron Gokaslan;Edgar Marroquin;Justin T Chiu;Alexander Rush;Volodymyr Kuleshov
  • 通讯作者:
    Volodymyr Kuleshov

Alexander Rush的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alexander Rush', 18)}}的其他基金

Conference: Pushing Towards Open-Source AI
会议:推动开源人工智能
  • 批准号:
    2335774
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Data-Driven Document Generation
职业:数据驱动文档生成
  • 批准号:
    1845664
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Data-Driven Hardware and Software Techniques to Enable Sustainable Data Center Services
职业:数据驱动的硬件和软件技术,以实现可持续的数据中心服务
  • 批准号:
    2340042
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: A Universal Framework for Safety-Aware Data-Driven Control and Estimation
职业:安全意识数据驱动控制和估计的通用框架
  • 批准号:
    2340089
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Design of Cellular Mechanical Metamaterials under Uncertainty with Physics-Informed and Data-Driven Machine Learning
职业:利用物理信息和数据驱动的机器学习在不确定性下设计细胞机械超材料
  • 批准号:
    2236947
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Data-driven Multiscale Modeling of Complex Traffic Systems Utilizing Networked Driving Simulators
职业:利用网络驾驶模拟器对复杂交通系统进行数据驱动的多尺度建模
  • 批准号:
    2238359
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Data-driven design of graphene oxide for environmental applications enabled by natural language processing and machine learning techniques
职业:通过自然语言处理和机器学习技术实现氧化石墨烯环境应用的数据驱动设计
  • 批准号:
    2238415
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Machine Learning for Data-Driven Fault-Tolerant Control of Complex Systems
职业:用于复杂系统数据驱动容错控制的机器学习
  • 批准号:
    2426614
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: A Holistic Developer-Centered Approach to Enhance Privacy for Data-Driven Applications
职业:以开发人员为中心的整体方法来增强数据驱动应用程序的隐私
  • 批准号:
    2238047
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Data-Driven Systematic Hierarchical Modeling
职业:数据驱动的系统分层建模
  • 批准号:
    2410514
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Building long-term climate resilience in 21st-century regional urban land systems through integrated data-driven research and education
职业:通过综合数据驱动的研究和教育,在 21 世纪区域城市土地系统中建立长期的气候适应能力
  • 批准号:
    2239859
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Data-driven dynamic adaptive optimization for next generation power system operation
职业:数据驱动的下一代电力系统运行的动态自适应优化
  • 批准号:
    2316675
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了