DILiGENt: Domain-Independent Language Generation

DILiGENt:与领域无关的语言生成

基本信息

  • 批准号:
    EP/M005429/1
  • 负责人:
  • 金额:
    $ 57.8万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2015
  • 资助国家:
    英国
  • 起止时间:
    2015 至 无数据
  • 项目状态:
    已结题

项目摘要

We propose a two year project to develop a novel data-driven methodology to rapidly create high quality NLG systems for new domains, by combining recent advances in three domains: (1) advances in statistical models for NLG, (2) crowdsourcing methods for natural language data collection, which have shown first promising results in related fields, such as Machine Translation, and (3) recently developed imitation learning algorithms for structured prediction. The project team combines expertise of two leading research groups in these areas:At Heriot-Watt University, we recently demonstrated the potential for data-driven statistical NLG in limited domains. In order to make this framework domain-independent we will leverage recent machine learning models, developed by researchers at the University College London. These models learn by imitating the actions a human expert would perform to generate NL utterances, which we collect via a tightly integrated crowdsourcing procedure. The outcome of this work is a framework which will allow the rapid development of NLG systems for new domains, and thus accelerate the impact NLG technology has on the market. We will showcase this framework on a dataset provided by the BBC, where we address the problem of generating weather reports for over 20,000 individual locations. Currently, the BBC website features only 10 reports written by meteorologists. Each of these reports covers a rather large area of the country (e.g. East of England), and thus of little interest to their users who are usually interested in the weather in a particular location (e.g. Norwich).In a second, more ambitious step, we will explore how this framework scales to more complex interactive dialogue settings, where generation has to account for discourse phenomena, such as long-distance discourse relations or syntactic coordination. This will be evaluated in a shared task challenge for generation in interactive systems, hosted by Heriot-Watt University.In sum, this project will further our understanding of domain-independent language generation, as well as deliver substantial and novel resources to support future research in this area (in the forms of code and data), and practical implementations of NLG systems in a wide-range of domains, from weather reports to natural language interfaces.
我们提出了一个为期两年的项目,通过结合三个领域的最新进展,开发一种新的数据驱动的方法,为新的领域快速创建高质量的NLG系统:(1)NLG统计模型的进展,(2)自然语言数据收集的众包方法,在相关领域,如机器翻译,首次显示出有希望的结果,以及(3)最近开发的用于结构化预测的模仿学习算法。该项目团队结合了两个领先研究小组在这些领域的专业知识:在赫里奥特-瓦特大学,我们最近展示了数据驱动的统计NLG在有限领域的潜力。为了使这个框架独立于领域,我们将利用由伦敦大学学院的研究人员开发的最新机器学习模型。这些模型通过模仿人类专家生成自然语言话语的行为来学习,我们通过紧密集成的众包程序收集这些话语。这项工作的结果是一个框架,它将允许NLG系统针对新领域的快速开发,从而加速NLG技术对市场的影响。我们将在英国广播公司提供的数据集上展示这个框架,在那里我们解决了为20,000多个单独地点生成天气报告的问题。目前,BBC网站上只有10篇由气象学家撰写的报告。这些报告中的每一个都覆盖了英国相当大的区域(例如英格兰东部),因此通常对特定地点(例如诺里奇)天气感兴趣的用户并不感兴趣。在第二个更雄心勃勃的步骤中,我们将探索该框架如何扩展到更复杂的交互对话环境,其中生成必须考虑话语现象,如长距离话语关系或句法协调。这将在Heriot-Watt大学主办的交互式系统生成的共享任务挑战中进行评估。总而言之,该项目将加深我们对独立于领域的语言生成的理解,并提供大量和新颖的资源,以支持这一领域的未来研究(以代码和数据的形式),以及NLG系统在从天气预报到自然语言界面等广泛领域的实际实施。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A review of evaluation techniques for social dialogue systems
A Crowd-based Evaluation of Abuse Response Strategies in Conversational Agents
  • DOI:
    10.18653/v1/w19-5942
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. C. Curry;Verena Rieser
  • 通讯作者:
    A. C. Curry;Verena Rieser
Sheffield at E2E: structured prediction approaches to end-to-end language generation
谢菲尔德在 E2E:端到端语言生成的结构化预测方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chen M
  • 通讯作者:
    Chen M
The REAL Corpus: A Crowd-Sourced Corpus of Human Generated and Evaluated Spatial References to Real-World Urban Scenes
真实语料库:人类生成和评估的现实世界城市场景空间参考的众包语料库
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bartie Ph
  • 通讯作者:
    Bartie Ph
Alexa, Google, Siri: What are Your Pronouns? Gender and Anthropomorphism in the Design and Perception of Conversational Assistants
  • DOI:
    10.18653/v1/2021.gebnlp-1.4
  • 发表时间:
    2021-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gavin Abercrombie;A. C. Curry;Mugdha Pandya;Verena Rieser
  • 通讯作者:
    Gavin Abercrombie;A. C. Curry;Mugdha Pandya;Verena Rieser
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Verena Rieser其他文献

A Game-Based Setup for Data Collection and Task-Based Evaluation of Uncertain Information Presentation
基于游戏的数据收集设置和基于任务的不确定信息呈现评估
An Arabic Twitter Corpus for Subjectivity and Sentiment Analysis
用于主观性和情感分析的阿拉伯语 Twitter 语料库
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eshrag A. Refaee;Verena Rieser
  • 通讯作者:
    Verena Rieser
Consistency is Key: Disentangling Label Variation in Natural Language Processing with Intra-Annotator Agreement
一致性是关键:通过注释者内部协议消除自然语言处理中的标签变化
  • DOI:
    10.48550/arxiv.2301.10684
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gavin Abercrombie;Verena Rieser;Dirk Hovy
  • 通讯作者:
    Dirk Hovy
What happens if you treat ordinal ratings as interval data? Human evaluations in NLP are even more under-powered than you think
如果将序数评级视为区间数据会发生什么?
  • DOI:
    10.18653/v1/2021.emnlp-main.703
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David M. Howcroft;Verena Rieser
  • 通讯作者:
    Verena Rieser
”I Like You, as a Friend”: Voice Assistants’ Response Strategies to Sexual Harassment and Their Relation to Gender
“我喜欢你,作为朋友”:语音助手对性骚扰的应对策略及其与性别的关系
  • DOI:
    10.31234/osf.io/wys34
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    L. M. Leisten;Verena Rieser
  • 通讯作者:
    Verena Rieser

Verena Rieser的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Verena Rieser', 18)}}的其他基金

Equally Safe Online
在线同样安全
  • 批准号:
    EP/W025493/1
  • 财政年份:
    2022
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Research Grant
Designing Conversational Assistants to Reduce Gender Bias
设计对话助理以减少性别偏见
  • 批准号:
    EP/T023767/1
  • 财政年份:
    2020
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Research Grant
MaDrIgAL: MultiDimensional Interaction management and Adaptive Learning
MaDrIgAL:多维交互管理和自适应学习
  • 批准号:
    EP/N017536/1
  • 财政年份:
    2016
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Research Grant
Nonparametric Learning for Situated Data-to-Text Generation: Helping People to Understand Uncertain Data
用于情景数据到文本生成的非参数学习:帮助人们理解不确定数据
  • 批准号:
    EP/L026775/1
  • 财政年份:
    2014
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Research Grant

相似国自然基金

拟连续domain范畴的若干问题研究
  • 批准号:
    12301583
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
格值蕴涵算子与Domain理论中的若干问题
  • 批准号:
    12331016
  • 批准年份:
    2023
  • 资助金额:
    193.00 万元
  • 项目类别:
    重点项目
Domain理论中概率幂构造的若干问题研究
  • 批准号:
    12371457
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
To空间上Domain理论中若干问题研究
  • 批准号:
    12261040
  • 批准年份:
    2022
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
面向Jung-Tix问题的Domain理论与量化序理论研究
  • 批准号:
    12231007
  • 批准年份:
    2022
  • 资助金额:
    235 万元
  • 项目类别:
    重点项目
C2 DOMAIN PROTEIN 1 (C2DP1)基因家族在植物开花调控中的功能研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
第四届Domain理论与拓扑学青年学者论坛
  • 批准号:
    12242110
  • 批准年份:
    2022
  • 资助金额:
    5.00 万元
  • 项目类别:
    专项项目
Domain理论中的收敛性与K-有界Sober空间范畴
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
广义Domain结构的表示理论研究
  • 批准号:
    12171149
  • 批准年份:
    2021
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
拓扑空间的概率幂domain及相关问题研究
  • 批准号:
    12001385
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Design of ferroelectric domain structure for independent control of piezoelectricity and electricity
压电电独立控制的铁电畴结构设计
  • 批准号:
    21H01616
  • 财政年份:
    2021
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
High-Performance Domain-Independent Heuristic Search
高性能领域独立启发式搜索
  • 批准号:
    46246-2012
  • 财政年份:
    2016
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Discovery Grants Program - Individual
Structural characterisation of a carbohydrate binding domain of the human cation-independent mannose 6-phosphate/ IGF2 receptor.
人阳离子非依赖性甘露糖 6-磷酸/IGF2 受体碳水化合物结合域的结构表征。
  • 批准号:
    1798462
  • 财政年份:
    2016
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Studentship
High-Performance Domain-Independent Heuristic Search
高性能领域独立启发式搜索
  • 批准号:
    46246-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Discovery Grants Program - Individual
High-Performance Domain-Independent Heuristic Search
高性能领域独立启发式搜索
  • 批准号:
    46246-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Discovery Grants Program - Individual
High-Performance Domain-Independent Heuristic Search
高性能领域独立启发式搜索
  • 批准号:
    46246-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Discovery Grants Program - Individual
High-Performance Domain-Independent Heuristic Search
高性能领域独立启发式搜索
  • 批准号:
    46246-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Discovery Grants Program - Individual
VTracker: domain-independent and domain-aware XML-document differencing
VTracker:域独立且域感知的 XML 文档差异
  • 批准号:
    430464-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Idea to Innovation
CT-ISG: Collaborative Research: Trustworthy Enforcement of Domain-Independent Run-Time Policies
CT-ISG:协作研究:域独立运行时策略的可信执行
  • 批准号:
    0716216
  • 财政年份:
    2007
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Continuing Grant
CT-ISG: Collaborative Research: Trustworthy Enforcement of Domain-independent Run-time Policies
CT-ISG:协作研究:域独立运行时策略的可信执行
  • 批准号:
    0716343
  • 财政年份:
    2007
  • 资助金额:
    $ 57.8万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了