Visual text analytics for total recall information retrieval in large noisy text datasets
用于大型噪声文本数据集中的总召回信息检索的视觉文本分析
基本信息
- 批准号:499941-2016
- 负责人:
- 金额:$ 9.57万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Collaborative Research and Development Grants
- 财政年份:2017
- 资助国家:加拿大
- 起止时间:2017-01-01 至 2018-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The search paradigm for finding information of interest in massive text corpora is well established, and exemplified by the success of Web search engines. The next frontier is the support of sense-making out of medium to large scale text corpora by the domain expert and analyst, who is trying to untap the tacit knowledge hidden in the text. In contrast to Web search, where the user's information need is satisfied by a few high-quality results, the domain analyst typically needs to find all relevant documents related to a topic of interest. Furthermore the domain analyst's information need is often much too complex to be easy to express in a small number of query terms. These requirements are very different from those of a web search engine. This project aims towards algorithms and systems that will address such requirements, in the context of use cases of significant practical interest including: reports on factory worker incidents and on aviation incidents; court decisions in the common law legal system; medical research literature for generation of systematic reviews; and prior art patent search. Key challenges include: vocabulary mismatch, where the queries of the user contain a vocabulary that is different from that used in the relevant documents; design of interactive mechanisms and visualizations to support the interactive nature of and incorporate human feedback into the retrieval process. The impact of the proposed research will be improvement of safety in a variety of domains where incidents are recorded and studied to obtain insights on how to prevent future incidents, such as in factories, aviation, hospitals and old-age homes.
在大量文本语料库中查找感兴趣的信息的搜索范式已经很好地建立起来,Web搜索引擎的成功就是一个例子。下一个前沿是由领域专家和分析人员从中大型文本语料库中支持意义制造,他们试图挖掘隐藏在文本中的隐性知识。在Web搜索中,用户的信息需要通过一些高质量的结果来满足,与此相反,域分析人员通常需要找到与感兴趣的主题相关的所有相关文档。此外,领域分析人员的信息需求往往过于复杂,难以用少量的查询术语来表达。这些要求与网络搜索引擎的要求非常不同。该项目旨在开发能够满足这些要求的算法和系统,在具有重大实际意义的用例背景下,包括:工厂工人事件和航空事件的报告;普通法法律体系中的法院判决;生成系统评价的医学研究文献;以及现有技术专利检索。主要的挑战包括:词汇表不匹配,即用户的查询包含的词汇表与相关文档中使用的词汇表不同;交互机制和可视化的设计,以支持交互的本质,并将人类反馈整合到检索过程中。拟议研究的影响将是改善各种领域的安全,这些领域记录和研究事件,以获得如何预防未来事件的见解,例如工厂、航空、医院和养老院。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Milios, Evangelos其他文献
Information retrieval by semantic similarity
- DOI:
10.4018/jswis.2006070104 - 发表时间:
2006-07-01 - 期刊:
- 影响因子:3.2
- 作者:
Hliaoutakis, Angelos;Varelas, Giannis;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Causal graph extraction from news: a comparative study of time-series causality learning techniques.
- DOI:
10.7717/peerj-cs.1066 - 发表时间:
2022 - 期刊:
- 影响因子:3.8
- 作者:
Maisonnave, Mariano;Delbianco, Fernando;Tohme, Fernando;Milios, Evangelos;Maguitman, Ana G. - 通讯作者:
Maguitman, Ana G.
Improving the performance of focused web crawlers
- DOI:
10.1016/j.datak.2009.04.002 - 发表时间:
2009-10-01 - 期刊:
- 影响因子:2.5
- 作者:
Batsakis, Sotiris;Petrakis, Euripides G. M.;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Topic-based web site summarization
- DOI:
10.1108/17440081011090220 - 发表时间:
2010-01-01 - 期刊:
- 影响因子:1.6
- 作者:
Zhang, Yongzheng;Milios, Evangelos;Zincir-Heywood, Nur - 通讯作者:
Zincir-Heywood, Nur
Statistical learning for OCR error correction
- DOI:
10.1016/j.ipm.2018.06.001 - 发表时间:
2018-11-01 - 期刊:
- 影响因子:8.6
- 作者:
Mei, Jie;Islam, Aminul;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Milios, Evangelos的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Milios, Evangelos', 18)}}的其他基金
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2022
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2021
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
How is Canadians' mental health affected by COVID-19: visual analytics of social media text
COVID-19 对加拿大人的心理健康有何影响:社交媒体文本的可视化分析
- 批准号:
554657-2020 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Alliance Grants
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2019
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Semantic search using deep networks****
使用深度网络进行语义搜索****
- 批准号:
531051-2018 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2017
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Trajectory-based localization using WiFi signal strength
使用 WiFi 信号强度进行基于轨迹的定位
- 批准号:
507295-2016 - 财政年份:2016
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
Automation and Evaluation of Business Intelligence
商业智能的自动化和评估
- 批准号:
492547-2015 - 财政年份:2016
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
相似国自然基金
J-TEXT托卡马克上边界湍流与撕裂模相互作用的实验研究
- 批准号:12375223
- 批准年份:2023
- 资助金额:54 万元
- 项目类别:面上项目
J-TEXT装置外加三维磁场主动调控偏滤器脱靶的实验研究
- 批准号:12305243
- 批准年份:2023
- 资助金额:20 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克装置上多模式磁扰动对逃逸电流影响研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克上边界湍流特性对高密度运行影响的实验研究
- 批准号:11905080
- 批准年份:2019
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
关于J-TEXT托卡马克上微撕裂模电磁湍流及其输运的实验研究
- 批准号:11605067
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
基于J-TEXT远红外偏振干涉仪的相干散射与密度扰动的实验研究
- 批准号:11575067
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
J-TEXT上外加磁扰动抑制等离子体破裂下逃逸电子产生的实验研究
- 批准号:11275079
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
J-TEXT托卡马克等离子体粒子输运的密度调制实验研究
- 批准号:11105056
- 批准年份:2011
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
How is Canadians' mental health affected by COVID-19: visual analytics of social media text
COVID-19 对加拿大人的心理健康有何影响:社交媒体文本的可视化分析
- 批准号:
554657-2020 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Alliance Grants
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2019
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Recommendations and Interventions for and Changes in the Ocular Health and visual Function of Veterans with Traumatic Brain Injury
针对患有脑外伤的退伍军人的眼部健康和视觉功能的建议和干预措施以及变化
- 批准号:
9685043 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Recommendations and Interventions for and Changes in the Ocular Health and visual Function of Veterans with Traumatic Brain Injury
针对脑外伤退伍军人眼部健康和视觉功能的建议、干预措施和变化
- 批准号:
10186520 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Visual Analytics of Online Streaming Text
在线流文本的可视化分析
- 批准号:
392087235 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Research Grants
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




