CAREER: Long Document Summarization with Question-Summary Hierarchy and User Preference Control
职业:具有问题摘要层次结构和用户偏好控制的长文档摘要
基本信息
- 批准号:2046016
- 负责人:
- 金额:$ 54.76万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-07-01 至 2026-06-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
In an era when long documents are produced at an overwhelming speed, a reader may not have time even to skim over a document to decide which topics deserve a detailed look. The goal of this CAREER project is to build text summarization systems that can understand and aggregate information from long documents, so as to allow users to explore their content with summaries that are generated in styles they prefer. The summarization tools will make long documents more accessible and comprehensible, easing the knowledge learning experience of the general public. Researchers and practitioners can also use the tools to summarize long documents relevant to their work, and educators can incorporate them in their classes to bolster students' reading and writing skills. The project also broadens the investigator’s efforts of engaging young students in immersive research opportunities, allowing them to participate in the design and implementation of advanced summarization systems. This project develops a new summarization framework for long documents in which article-level abstractive summaries provide an overview, and a question-summary hierarchy presents different levels of details. The technical contributions of this project are three-fold. First, the quadratic time complexity of state-of-the-art summarization (e.g., Transformer) is reduced by using adaptively predicted sparse attentions and augmented with a knowledge encoder. Second, an open-ended question generation model fills automatically learned question templates to produce concrete questions that are coherent within the question-summary hierarchy. Third, summaries are tailored to user-specified styles via iterative adjustments during generation, reflecting important advice in plain-language guidelines. This project experiments with new datasets collected from government reports, since their length, topic diversity, and formulaic verbiage embody many common challenges for long document summarization. New evaluation methods are also designed, with cloze questions to target common erroneous generations, and with model confidence metrics to pinpoint errors without using references.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在一个长文档以压倒性的速度产生的时代,读者可能甚至没有时间浏览文档以决定哪些主题值得详细查看。这个CAREER项目的目标是构建文本摘要系统,可以理解和聚合长文档中的信息,以便允许用户使用以他们喜欢的风格生成的摘要来探索他们的内容。摘要工具将使长文档更容易访问和理解,减轻公众的知识学习体验。研究人员和从业人员还可以使用这些工具来总结与他们的工作相关的长文档,教育工作者可以将它们纳入课堂,以提高学生的阅读和写作技能。该项目还扩大了研究人员的努力,让年轻学生参与沉浸式研究的机会,让他们参与先进的摘要系统的设计和实施。这个项目为长文档开发了一个新的摘要框架,其中文章级摘要提供了一个概述,问题摘要层次结构提供了不同层次的细节。该项目的技术贡献有三个方面。首先,现有技术的摘要的二次时间复杂度(例如,Transformer)通过使用自适应预测稀疏注意力来减少,并使用知识编码器来增强。第二,开放式问题生成模型填充自动学习的问题模板,以生成在问题摘要层次结构内连贯的具体问题。第三,摘要通过生成过程中的迭代调整来适应用户指定的样式,反映了简明语言指南中的重要建议。该项目实验了从政府报告中收集的新数据集,因为它们的长度,主题多样性和公式化的措辞体现了长文档摘要的许多常见挑战。新的评估方法也被设计,完形填空问题针对常见的错误世代,并与模型的信心指标,以查明错误,而不使用reference.This奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BOLT: Fast Energy-based Controlled Text Generation with Tunable Biases
- DOI:10.48550/arxiv.2305.12018
- 发表时间:2023-05
- 期刊:
- 影响因子:0
- 作者:Xin Liu;Muhammad Khalifa;Lu Wang
- 通讯作者:Xin Liu;Muhammad Khalifa;Lu Wang
Time-aware Prompting for Text Generation
- DOI:10.48550/arxiv.2211.02162
- 发表时间:2022-11
- 期刊:
- 影响因子:0
- 作者:Shuyang Cao;Lu Wang
- 通讯作者:Shuyang Cao;Lu Wang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Lu Wang其他文献
REGγ controls Th17 cell differentiation and autoimmune inflammation by regulating dendritic cells
REGγ 通过调节树突状细胞来控制 Th17 细胞分化和自身免疫炎症
- DOI:
10.1038/s41423-019-0287-0 - 发表时间:
2019-09 - 期刊:
- 影响因子:24.1
- 作者:
Lei Zhou;Liangfang Yao;Qing Zhang;Wei Xie;Xiaoshuang Wang;Huihui Zhang;Jinjin Xu;Qingxia Lin;Qing Li;Yang Xuan;Lei Ji;Lu Wang;Weicang Wang;Weichao Wang;Tingting Shi;Lei Fang;Biao Zheng;Lei Li;Shuang Liu;Bianhong Zhang;Xiaotao Li - 通讯作者:
Xiaotao Li
Microstructure and thermal conductivity of wire-arc sprayed FeCrNbBSiC amorphous coating
线弧喷涂FeCrNbBSiC非晶涂层的显微组织与导热系数
- DOI:
10.1016/j.jallcom.2019.02.275 - 发表时间:
2019-06 - 期刊:
- 影响因子:6.2
- 作者:
Haihua Yao;Zheng Zhou;Yunfei Xue;zhenlu Zhou;Zhen Tan;Dingyong He;Benpeng Wang;Lu Wang - 通讯作者:
Lu Wang
Identification of two candidate innate immune genes by transcriptional profiling and RNA interference in mouse mammary gland epithelial cells stimulated with lipopolysaccharide
通过脂多糖刺激的小鼠乳腺上皮细胞中的转录谱和 RNA 干扰鉴定两个候选先天免疫基因
- DOI:
10.1080/08923973.2016.1222618 - 发表时间:
2016-08 - 期刊:
- 影响因子:3.3
- 作者:
Yu-kun Wang;Jiang Feng;Yu-hao Wei;Lu Wang - 通讯作者:
Lu Wang
Metal carbonates-induced solution-free dehydrogenation of alkaline earth metal hydrides at room temperature
金属碳酸盐诱导的碱土金属氢化物室温无溶液脱氢
- DOI:
10.1016/j.jssc.2020.121485 - 发表时间:
2020-09 - 期刊:
- 影响因子:3.3
- 作者:
Song Zhang;Lu Wang;Yun-Long Tai;Yun-Lei Teng;Juan Zhao;Wei Zhu;Bao-Xia Dong - 通讯作者:
Bao-Xia Dong
Protective Effect of Ginsenoside Rg1 on Hematopoietic Stem/Progenitor Cells through Attenuating Oxidative Stress and the Wnt/-Catenin Signaling Pathway in a Mouse Model of D-Galactose-induced Aging
人参皂苷 Rg1 通过减轻 D-半乳糖诱导衰老小鼠模型中的氧化应激和 Wnt/-Catenin 信号通路对造血干细胞/祖细胞的保护作用
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:5.6
- 作者:
Jing Li;Dachuan Cai;Xin Yao;Yanyan Zhang;Linbo Chen;Pengwei Jing;Lu Wang;Yaping Wang - 通讯作者:
Yaping Wang
Lu Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Lu Wang', 18)}}的其他基金
Conference: Doctoral Consortium at Student Research Workshop at the Annual Meeting of the Association for Computational Linguistics
会议:计算语言学协会年会学生研究研讨会上的博士联盟
- 批准号:
2307288 - 财政年份:2023
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Argument Graph Supported Multi-Level Approach for Argumentative Writing Assistance
论证图支持多层次的议论文写作辅助方法
- 批准号:
2302564 - 财政年份:2023
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
CRII:SCH: Interactive Explainable Deep Survival Analysis
CRII:SCH:交互式可解释深度生存分析
- 批准号:
2245739 - 财政年份:2023
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Collaborative Research: From User Reviews to User-Centered Generative Design: Automated Methods for Augmented Designer Performance
协作研究:从用户评论到以用户为中心的生成设计:增强设计师性能的自动化方法
- 批准号:
2050130 - 财政年份:2021
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
- 批准号:
2105576 - 财政年份:2021
- 资助金额:
$ 54.76万 - 项目类别:
Continuing Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
- 批准号:
2146997 - 财政年份:2021
- 资助金额:
$ 54.76万 - 项目类别:
Continuing Grant
Collaborative Research: III: Small: Entity- and Event-driven Media Bias Detection
协作研究:III:小型:实体和事件驱动的媒体偏差检测
- 批准号:
2127747 - 财政年份:2021
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Evaluation of Hypothermic Oxygenated Perfusion Ex-Vivo Heart Perfusion to Expand the Donor Pool and Improve Transplant Outcomes
评估低温氧合灌注离体心脏灌注以扩大供体库并改善移植结果
- 批准号:
MR/V002074/1 - 财政年份:2020
- 资助金额:
$ 54.76万 - 项目类别:
Fellowship
RI: Small: Collaborative Research: Computational Methods for Argument Mining: Extraction, Aggregation, and Generation
RI:小型:协作研究:参数挖掘的计算方法:提取、聚合和生成
- 批准号:
2100885 - 财政年份:2020
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
相似国自然基金
基于Relm-β核转位激活EndMT促进肺动脉高压研究肺心汤预防 Long COVID 机制
- 批准号:2025JJ90008
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
维生素D调控巨噬细胞极化在改善“Long COVID”中作用和机制的分子流行病学研究
- 批准号:82373643
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
long non-coding RNA(lncRNA)-activatedby TGF-β(lncRNA-ATB)通过成纤维细胞影响糖尿病创面愈合的机制研究
- 批准号:LQ23H150003
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
Long-TSLP和Short-TSLP佐剂对新冠重组蛋白疫苗免疫应答的影响与作用机制
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
水稻LONG PANICLE1基因调控穗长的分子机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
long-TSLP诱导的M2型巨噬细胞调控肺成纤维细胞线粒体融合在哮喘气道重塑中的作用和机制
- 批准号:81970032
- 批准年份:2019
- 资助金额:55.0 万元
- 项目类别:面上项目
LONG8及其互作蛋白LGIP1调控水稻籽粒大小的分子机理研究
- 批准号:31871219
- 批准年份:2018
- 资助金额:59.0 万元
- 项目类别:面上项目
拟南芥微管结合蛋白Long Seed1调控种子大小的分子机制研究
- 批准号:31770205
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
long-TSLP和short-TSLP调控肺成纤维细胞有氧糖酵解在哮喘气道重塑中的作用和机制研究
- 批准号:81700034
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
哮喘气道上皮来源long-TSLP/short-TSLP失衡对气道重塑中成纤维细胞活化的分子机制研究
- 批准号:81670026
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Material Simulation-driven Electrolyte Designs in Intermediate-temperature Na-K / S Batteries for Long-duration Energy Storage
合作研究:用于长期储能的中温Na-K / S电池中材料模拟驱动的电解质设计
- 批准号:
2341994 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Long-Term Nature Reserve Human Interaction
长期自然保护区人类互动
- 批准号:
2345184 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Continuing Grant
ALPACA - Advancing the Long-range Prediction, Attribution, and forecast Calibration of AMOC and its climate impacts
APACA - 推进 AMOC 及其气候影响的长期预测、归因和预报校准
- 批准号:
2406511 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
I-Corps: Translation Potential of Mechanically Compliant Fracture Fixation Plates for Long Bone Fractures
I-Corps:用于长骨骨折的机械顺应性骨折固定板的平移潜力
- 批准号:
2410029 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
EAGER: ANT LIA: Persist or Perish: Records of Microbial Survival and Long-term Persistence from the West Antarctic Ice Sheet
EAGER:ANT LIA:生存或灭亡:南极西部冰盖微生物生存和长期存在的记录
- 批准号:
2427241 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Long COVIDの睡眠障害の実態調査と認知行動療法の効果
长新冠引起的睡眠障碍调查及认知行为治疗效果
- 批准号:
24K06537 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ERI: Data-Driven Analysis and Dynamic Modeling of Residential Power Demand Behavior: Using Long-Term Real-World Data from Rural Electric Systems
ERI:住宅电力需求行为的数据驱动分析和动态建模:使用农村电力系统的长期真实数据
- 批准号:
2301411 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
LTREB: Collaborative Research: Long-term changes in peatland C fluxes and the interactive role of altered hydrology, vegetation, and redox supply in a changing climate
LTREB:合作研究:泥炭地碳通量的长期变化以及气候变化中水文、植被和氧化还原供应变化的相互作用
- 批准号:
2411998 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Continuing Grant
NSF-NSERC: Fairness Fundamentals: Geometry-inspired Algorithms and Long-term Implications
NSF-NSERC:公平基础:几何启发的算法和长期影响
- 批准号:
2342253 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant
Doctoral Dissertation Research: Human long term adaptation to prehistoric ENSO-driven flooding
博士论文研究:人类对史前 ENSO 驱动洪水的长期适应
- 批准号:
2347965 - 财政年份:2024
- 资助金额:
$ 54.76万 - 项目类别:
Standard Grant