Microtext Processing

缩微文本处理

基本信息

  • 批准号:
    371717-2013
  • 负责人:
  • 金额:
    $ 1.09万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2017
  • 资助国家:
    加拿大
  • 起止时间:
    2017-01-01 至 2018-12-31
  • 项目状态:
    已结题

项目摘要

The term "microtext" describes a type of text document that is very short (typically one sentence or less), is written in an informal manner and unedited for quality, and includes some metadata. Microtexts have become omnipresent in today's world, and include online user comments, Facebook newsfeeds and Tweets, and search queries. By their very nature, microtexts are a very different challenge from traditional Natural Language Processing (NLP). Their short length hinders NLP methodologies that rely on word frequencies and statistics, and the abundance of spelling mistakes, typos, and unconventional abbreviations make standard linguistic resources unhelpful. Microtext processing should be seen as a new branch of NLP.This proposal brings together four parallel five-year microtext research programs. The first aims to develop microtext understanding algorithms specialized to the task of query understanding and answering using corporate knowledge bases. The second aims to develop microtext understanding algorithms specialized to the task of very precise event detection in Twitter. The third aims to develop microtext understanding algorithms specialized to the task of mining microblog discussions, specifically in the context of retrieving software development information. And the fourth aims to develop a "military Watson" that can monitor military chat and inform officers of crucial international events occurring. All four projects are done in collaboration with external research and industrial partners. Moreover, they all feed into a single unifying long-term objective: to pioneer and develop the new field of microtext processing, and create a core of microtext expertise. The development of microtext processing will be the next major milestone in Semantic Web and Web 2.0 development. The amount of microtext generated today is absolutely massive: for example, there are 4.7 billion web queries asked on Google and 340 million Tweets posted every day. Web users actively seek out and embrace new microtext technology. The strategic importance of this research for the Canadian economy cannot be overstated, and our multiple partner companies and organizations will benefit directly from our results.
术语“缩微文本”描述了一种非常短(通常是一句话或更少)的文本文档,以非正式方式编写且未经质量编辑,并且包含一些元数据。缩微文本在当今世界已变得无处不在,包括在线用户评论、Facebook 新闻和推文以及搜索查询。就其本质而言,缩微文本是与传统自然语言处理 (NLP) 截然不同的挑战。它们的长度较短阻碍了依赖词频和统计的 NLP 方法,并且大量的拼写错误、拼写错误和非常规缩写使标准语言资源毫无帮助。缩微文本处理应该被视为自然语言处理的一个新分支。该提案汇集了四个并行的五年缩微文本研究项目。第一个目标是开发专门用于使用企业知识库进行查询理解和回答任务的缩微文本理解算法。第二个目标是开发专门用于 Twitter 中非常精确的事件检测任务的缩微文本理解算法。第三个目标是开发专门用于挖掘微博讨论任务的微文本理解算法,特别是在检索软件开发信息的背景下。第四个目标是开发一个“军事沃森”,可以监控军事聊天并向军官通报正在发生的重要国际事件。所有四个项目都是与外部研究和工业合作伙伴合作完成的。此外,它们都致力于实现一个统一的长期目标:开拓和开发缩微文本处理的新领域,并创建缩微文本专业知识的核心。缩微文本处理的发展将成为语义网和Web 2.0 发展的下一个重要里程碑。如今生成的缩微文本数量绝对是巨大的:例如,每天在 Google 上提出的网络查询量为 47 亿次,发布的推文数量为 3.4 亿条。网络用户积极寻求并接受新的缩微文本技术。这项研究对加拿大经济的战略重要性怎么强调都不为过,我们的多个合作伙伴公司和组织将直接从我们的研究结果中受益。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Khoury, Richard其他文献

Semantic understanding of general linguistic items by means of fuzzy set theory
  • DOI:
    10.1109/tfuzz.2006.889817
  • 发表时间:
    2007-10-01
  • 期刊:
  • 影响因子:
    11.9
  • 作者:
    Khoury, Richard;Karray, Fakhri;Basir, Otman
  • 通讯作者:
    Basir, Otman
MeaningBERT: assessing meaning preservation between sentences.
  • DOI:
    10.3389/frai.2023.1223924
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    4
  • 作者:
    Beauchemin, David;Saggion, Horacio;Khoury, Richard
  • 通讯作者:
    Khoury, Richard
Understanding the Influence of Web-Based Information, Misinformation, Disinformation, and Reinformation on COVID-19 Vaccine Acceptance: Protocol for a Multicomponent Study.
  • DOI:
    10.2196/41012
  • 发表时间:
    2022-10-17
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    Dube, Eve;MacDonald, Shannon E.;Manca, Terra;Bettinger, Julie A.;Driedger, S. Michelle;Graham, Janice;Greyson, Devon;MacDonald, Noni E.;Meyer, Samantha;Roch, Genevieve;Vivion, Maryline;Aylsworth, Laura;Witteman, Holly O.;Gelinas-Gascon, Felix;Sathler Guimaraes, Lucas Marques;Hakim, Hina;Gagnon, Dominique;Bechard, Benoit;Gramaccia, Julie A.;Khoury, Richard;Tremblay, Sebastien
  • 通讯作者:
    Tremblay, Sebastien
Hierarchical classification in text mining for sentiment analysis of online news
  • DOI:
    10.1007/s00500-015-1812-4
  • 发表时间:
    2016-09-01
  • 期刊:
  • 影响因子:
    4.1
  • 作者:
    Li, Jinyan;Fong, Simon;Khoury, Richard
  • 通讯作者:
    Khoury, Richard
Exploiting non-taxonomic relations for measuring semantic similarity and relatedness in WordNet
  • DOI:
    10.1016/j.knosys.2020.106565
  • 发表时间:
    2021-01-05
  • 期刊:
  • 影响因子:
    8.8
  • 作者:
    AlMousa, Mohannad;Benlamri, Rachid;Khoury, Richard
  • 通讯作者:
    Khoury, Richard

Khoury, Richard的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Khoury, Richard', 18)}}的其他基金

Nanoblog processing
纳米博客处理
  • 批准号:
    RGPIN-2021-02599
  • 财政年份:
    2022
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Discovery Grants Program - Individual
Nanoblog processing
纳米博客处理
  • 批准号:
    RGPIN-2021-02599
  • 财政年份:
    2021
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Discovery Grants Program - Individual
Virage numérique de la presse québécoise
魁北克新闻数字
  • 批准号:
    561115-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Alliance Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
  • 批准号:
    537198-2018
  • 财政年份:
    2021
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
  • 批准号:
    537198-2018
  • 财政年份:
    2020
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
  • 批准号:
    537198-2018
  • 财政年份:
    2019
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Collaborative Research and Development Grants
Assistant intelligent de recherche incrémentale
增量研究助理智能
  • 批准号:
    514185-2017
  • 财政年份:
    2018
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Collaborative Research and Development Grants
Conversational interface for smart city platform
智慧城市平台对话界面
  • 批准号:
    518068-2017
  • 财政年份:
    2017
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Engage Grants Program
Insurance consumer information data lake
保险消费者信息数据湖
  • 批准号:
    520480-2017
  • 财政年份:
    2017
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Engage Plus Grants Program
Assistant intelligent de recherche incrémentale
增量研究助理智能
  • 批准号:
    514185-2017
  • 财政年份:
    2017
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Collaborative Research and Development Grants

相似国自然基金

Sirt1通过调控Gli3 processing维持SHH信号促进髓母细胞瘤的发展及机制研究
  • 批准号:
    82373900
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
靶向Gli3 processing调控Shh信号通路的新型抑制剂治疗儿童髓母细胞瘤及相关作用机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Scene Processing With Machine Learnable and Semantically Parametrized Representations RENEWAL
使用机器学习和语义参数化表示进行场景处理 RENEWAL
  • 批准号:
    MR/Y033884/1
  • 财政年份:
    2025
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Fellowship
Doctoral Dissertation Research: Aspect and Event Cognition in the Acquisition and Processing of a Second Language
博士论文研究:第二语言习得和处理中的方面和事件认知
  • 批准号:
    2337763
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
Conference: 2024 Protein Processing, Trafficking and Secretion GRC/GRS
会议:2024 蛋白质加工、运输和分泌 GRC/GRS
  • 批准号:
    2419301
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
REU Site: Recent Advances in Natural Language Processing
REU 网站:自然语言处理的最新进展
  • 批准号:
    2349452
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
CAREER: Understanding Processing-Structure-Property Relationships in Co-Axial Wire-Feed, Powder-Feed Laser Directed Energy Deposition
职业:了解同轴送丝、送粉激光定向能量沉积中的加工-结构-性能关系
  • 批准号:
    2338951
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
Neuronal mechanisms for social information processing.
社会信息处理的神经机制。
  • 批准号:
    BB/Z514780/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Fellowship
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
  • 批准号:
    EP/Y004167/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Research Grant
Sensory processing during sleep
睡眠期间的感觉处理
  • 批准号:
    EP/Y032071/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Research Grant
Participant Support for 2024 Gordon Research Conference on Plasma Processing Science (GRC-PPS); Andover, New Hampshire; 21-26 July 2024
2024 年戈登等离子体加工科学研究会议 (GRC-PPS) 的参与者支持;
  • 批准号:
    2414674
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
  • 批准号:
    2402804
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了