Visual text analytics for total recall information retrieval in large noisy text datasets
用于大型噪声文本数据集中的总召回信息检索的视觉文本分析
基本信息
- 批准号:499941-2016
- 负责人:
- 金额:$ 9.57万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Collaborative Research and Development Grants
- 财政年份:2017
- 资助国家:加拿大
- 起止时间:2017-01-01 至 2018-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The search paradigm for finding information of interest in massive text corpora is well established, and exemplified by the success of Web search engines. The next frontier is the support of sense-making out of medium to large scale text corpora by the domain expert and analyst, who is trying to untap the tacit knowledge hidden in the text. In contrast to Web search, where the user's information need is satisfied by a few high-quality results, the domain analyst typically needs to find all relevant documents related to a topic of interest. Furthermore the domain analyst's information need is often much too complex to be easy to express in a small number of query terms. These requirements are very different from those of a web search engine. This project aims towards algorithms and systems that will address such requirements, in the context of use cases of significant practical interest including: reports on factory worker incidents and on aviation incidents; court decisions in the common law legal system; medical research literature for generation of systematic reviews; and prior art patent search. Key challenges include: vocabulary mismatch, where the queries of the user contain a vocabulary that is different from that used in the relevant documents; design of interactive mechanisms and visualizations to support the interactive nature of and incorporate human feedback into the retrieval process. The impact of the proposed research will be improvement of safety in a variety of domains where incidents are recorded and studied to obtain insights on how to prevent future incidents, such as in factories, aviation, hospitals and old-age homes.
在海量文本语料库中查找感兴趣信息的搜索范式已经建立,并以Web搜索引擎的成功为例。下一个前沿是支持领域专家和分析师从中到大规模的文本语料库中提取意义,他们试图挖掘隐藏在文本中的隐性知识。与Web搜索相比,用户的信息需求由一些高质量的结果来满足,领域分析师通常需要找到与感兴趣的主题相关的所有相关文档。此外,领域分析师的信息需求往往过于复杂,很难用少量的查询词来表达。这些要求与Web搜索引擎的要求非常不同。该项目的目标是在具有重大实际意义的用例的背景下解决这些要求的算法和系统,包括:工厂工人事故和航空事故报告;普通法法律的体系中的法院判决;用于生成系统评价的医学研究文献;以及现有技术专利检索。主要挑战包括:词汇不匹配,用户的查询包含与相关文档中使用的词汇不同的词汇;设计交互机制和可视化,以支持检索过程的交互性,并将人类反馈纳入检索过程。拟议研究的影响将是改善各种领域的安全性,记录和研究事故,以了解如何防止未来的事故,如工厂,航空,医院和养老院。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Milios, Evangelos其他文献
Information retrieval by semantic similarity
- DOI:
10.4018/jswis.2006070104 - 发表时间:
2006-07-01 - 期刊:
- 影响因子:3.2
- 作者:
Hliaoutakis, Angelos;Varelas, Giannis;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Causal graph extraction from news: a comparative study of time-series causality learning techniques.
- DOI:
10.7717/peerj-cs.1066 - 发表时间:
2022 - 期刊:
- 影响因子:3.8
- 作者:
Maisonnave, Mariano;Delbianco, Fernando;Tohme, Fernando;Milios, Evangelos;Maguitman, Ana G. - 通讯作者:
Maguitman, Ana G.
Improving the performance of focused web crawlers
- DOI:
10.1016/j.datak.2009.04.002 - 发表时间:
2009-10-01 - 期刊:
- 影响因子:2.5
- 作者:
Batsakis, Sotiris;Petrakis, Euripides G. M.;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Statistical learning for OCR error correction
- DOI:
10.1016/j.ipm.2018.06.001 - 发表时间:
2018-11-01 - 期刊:
- 影响因子:8.6
- 作者:
Mei, Jie;Islam, Aminul;Milios, Evangelos - 通讯作者:
Milios, Evangelos
Topic-based web site summarization
- DOI:
10.1108/17440081011090220 - 发表时间:
2010-01-01 - 期刊:
- 影响因子:1.6
- 作者:
Zhang, Yongzheng;Milios, Evangelos;Zincir-Heywood, Nur - 通讯作者:
Zincir-Heywood, Nur
Milios, Evangelos的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Milios, Evangelos', 18)}}的其他基金
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2022
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2021
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
How is Canadians' mental health affected by COVID-19: visual analytics of social media text
COVID-19 对加拿大人的心理健康有何影响:社交媒体文本的可视化分析
- 批准号:
554657-2020 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Alliance Grants
Semantic Representations for Interactive Text Mining
交互式文本挖掘的语义表示
- 批准号:
RGPIN-2020-04834 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2019
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Semantic search using deep networks****
使用深度网络进行语义搜索****
- 批准号:
531051-2018 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Exploiting Semantic Analysis of Documents
利用文档语义分析
- 批准号:
RGPIN-2015-06183 - 财政年份:2017
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Trajectory-based localization using WiFi signal strength
使用 WiFi 信号强度进行基于轨迹的定位
- 批准号:
507295-2016 - 财政年份:2016
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
Automation and Evaluation of Business Intelligence
商业智能的自动化和评估
- 批准号:
492547-2015 - 财政年份:2016
- 资助金额:
$ 9.57万 - 项目类别:
Engage Grants Program
相似国自然基金
J-TEXT托卡马克上边界湍流与撕裂模相互作用的实验研究
- 批准号:12375223
- 批准年份:2023
- 资助金额:54 万元
- 项目类别:面上项目
J-TEXT装置外加三维磁场主动调控偏滤器脱靶的实验研究
- 批准号:12305243
- 批准年份:2023
- 资助金额:20 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克装置上多模式磁扰动对逃逸电流影响研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克上边界湍流特性对高密度运行影响的实验研究
- 批准号:11905080
- 批准年份:2019
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
关于J-TEXT托卡马克上微撕裂模电磁湍流及其输运的实验研究
- 批准号:11605067
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
基于J-TEXT远红外偏振干涉仪的相干散射与密度扰动的实验研究
- 批准号:11575067
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
J-TEXT上外加磁扰动抑制等离子体破裂下逃逸电子产生的实验研究
- 批准号:11275079
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
J-TEXT托卡马克等离子体粒子输运的密度调制实验研究
- 批准号:11105056
- 批准年份:2011
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
How is Canadians' mental health affected by COVID-19: visual analytics of social media text
COVID-19 对加拿大人的心理健康有何影响:社交媒体文本的可视化分析
- 批准号:
554657-2020 - 财政年份:2020
- 资助金额:
$ 9.57万 - 项目类别:
Alliance Grants
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2019
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual
Recommendations and Interventions for and Changes in the Ocular Health and visual Function of Veterans with Traumatic Brain Injury
针对患有脑外伤的退伍军人的眼部健康和视觉功能的建议和干预措施以及变化
- 批准号:
9685043 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Recommendations and Interventions for and Changes in the Ocular Health and visual Function of Veterans with Traumatic Brain Injury
针对脑外伤退伍军人眼部健康和视觉功能的建议、干预措施和变化
- 批准号:
10186520 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Visual Analytics of Online Streaming Text
在线流文本的可视化分析
- 批准号:
392087235 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Research Grants
Mixed-Initiative Visual Text Analytics: Data-driven Views and Analytic Guidance
混合主动视觉文本分析:数据驱动的视图和分析指导
- 批准号:
RGPIN-2015-03916 - 财政年份:2018
- 资助金额:
$ 9.57万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




