Exploiting machine learning to improve the proposal submission process
利用机器学习改进提案提交流程
基本信息
- 批准号:971579
- 负责人:
- 金额:$ 5.83万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Small Business Research Initiative
- 财政年份:2017
- 资助国家:英国
- 起止时间:2017 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The 3-month Phase 1 proposal describes the creation of a prototype system to assess proposals that are submitted to Innovate UK. The project has three main goals: matching proposals to assessors, identifying duplicates and resubmitted proposals and then identifying fraudulent behaviour. The system will use a combination of Natural Language Processing (NLP), machine learning and data analytics to understand the content of a proposal and the assign this to a relevant assessor. The system uses topic modelling to identify the key concepts of a proposal, while NLP extracts entities such as people, organisations and keywords to build a rich picture of the proposal content. The extracted data is then stored to a graph database and in JSON-LD. A similar approach is then taken to extract content from assessor’s profiles, resumes, authored articles, blog posts, tweets or journal papers to create a rich picture of an assessor’s knowledge and skills. The extracted content, topics, keywords and entities from the proposals and assessor’s material, is then stored in a structured manner in JSON-LD in Elasticsearch and a graph database (Neo4j). Search queries, social network analysis and text vector machine learning clustering techniques are then used to link assessors to proposals based upon the similarities of their skills and the proposal topics. The second aim of the proposal is to identify resubmissions, duplicate content and reworded proposals using techniques called document fingerprinting and Winnowing. These techniques break a document into chunks that can then be identified across a corpus of submitted proposals. These results are then clustered using a Neural Network machine learning approach. The final aim is to identify possible fraudulent behaviour, by assessing the people and organisations involved in the proposal against publicly gathered information gathered information. We propose to use NLP to extract the people, organisation and websites entities and then cross-reference this against data from Companies House and Gateway to Research APIs. Again, we will use a graph database with social network analysis and machine learning techniques to identify fraudulent proposals, for example multiple proposals that have been submitted under company subsidiary names.
为期3个月的第一阶段提案描述了一个原型系统的创建,以评估提交给Innovate UK的提案。该项目有三个主要目标:将提案与评估人员进行匹配,识别重复和重新提交的提案,然后识别欺诈行为。该系统将结合自然语言处理(NLP)、机器学习和数据分析来理解提案的内容,并将其分配给相关的评估人员。该系统使用主题建模来识别提案的关键概念,而NLP则提取人物、组织和关键字等实体来构建提案内容的丰富图片。然后将提取的数据存储到图形数据库和JSON-LD中。然后采用类似的方法从评估员的个人资料、简历、撰写的文章、博客文章、tweet或期刊论文中提取内容,以创建评估员知识和技能的丰富图片。从提案和评估者的材料中提取的内容、主题、关键字和实体,然后以结构化的方式存储在Elasticsearch中的JSON-LD和图形数据库(Neo4j)中。然后使用搜索查询、社交网络分析和文本向量机器学习聚类技术,根据评估人员的技能和提案主题的相似性将评估人员与提案联系起来。该提案的第二个目的是使用称为文件指纹和筛选的技术来识别重复提交、重复内容和改写的提案。这些技术将文档分解成块,然后可以在提交的提案语料库中识别这些块。然后使用神经网络机器学习方法对这些结果进行聚类。最终目的是通过评估参与提案的人员和组织对公开收集的信息收集的信息来识别可能的欺诈行为。我们建议使用NLP来提取人员、组织和网站实体,然后将其与来自Companies House和Gateway to Research api的数据进行交叉引用。同样,我们将使用带有社交网络分析和机器学习技术的图形数据库来识别欺诈性提案,例如以公司子公司名称提交的多个提案。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
- 批准号:
2879865 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
相似国自然基金
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
非标准随机调度模型的最优动态策略
- 批准号:71071056
- 批准年份:2010
- 资助金额:28.0 万元
- 项目类别:面上项目
微生物发酵过程的自组织建模与优化控制
- 批准号:60704036
- 批准年份:2007
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: Exploring and Exploiting Data-Centric Modeling for Fairness in Machine Learning
职业:探索和利用以数据为中心的建模以实现机器学习的公平性
- 批准号:
2239257 - 财政年份:2023
- 资助金额:
$ 5.83万 - 项目类别:
Continuing Grant
UKRI-RCN: Exploiting the dynamics of self-timed machine learning hardware (ESTEEM)
UKRI-RCN:利用自定时机器学习硬件(ESTEEM)的动态
- 批准号:
EP/X039943/1 - 财政年份:2023
- 资助金额:
$ 5.83万 - 项目类别:
Research Grant
Exploiting machine-learning to provide dynamical, microphysical, radiative and electrifying insight from observations of deep convective cloud
利用机器学习从深对流云的观测中提供动态、微观物理、辐射和令人兴奋的见解
- 批准号:
2888807 - 财政年份:2023
- 资助金额:
$ 5.83万 - 项目类别:
Studentship
Exploiting new approaches for selective inhibition of trypsins
开发选择性抑制胰蛋白酶的新方法
- 批准号:
10338695 - 财政年份:2022
- 资助金额:
$ 5.83万 - 项目类别:
Exploiting new approaches for selective inhibition of trypsins
开发选择性抑制胰蛋白酶的新方法
- 批准号:
10542402 - 财政年份:2022
- 资助金额:
$ 5.83万 - 项目类别:
Exploiting the Weighted Graph Laplacian for Power Systems: High-Degree Contingency, Machine Learning, Data Assimilation, and Parallel-in-Time Integration
利用电力系统的加权图拉普拉斯:高度偶然性、机器学习、数据同化和并行时间集成
- 批准号:
2229378 - 财政年份:2022
- 资助金额:
$ 5.83万 - 项目类别:
Standard Grant
Exploiting convergent evolution to design biomarker extraction tools for the prediction of therapeutic response in cancer
利用趋同进化设计生物标志物提取工具来预测癌症治疗反应
- 批准号:
10320353 - 财政年份:2021
- 资助金额:
$ 5.83万 - 项目类别:
Exploiting convergent evolution to design biomarker extraction tools for the prediction of therapeutic response in cancer
利用趋同进化设计生物标志物提取工具来预测癌症治疗反应
- 批准号:
10543422 - 财政年份:2021
- 资助金额:
$ 5.83万 - 项目类别:
Collaborative Research: CNS Core: Medium: Exploiting Synergies Between Machine-Learning Algorithms and Hardware Heterogeneity for High-Performance and Reliable Manycore Computing
合作研究:CNS Core:Medium:利用机器学习算法和硬件异构性之间的协同作用实现高性能和可靠的众核计算
- 批准号:
1955353 - 财政年份:2020
- 资助金额:
$ 5.83万 - 项目类别:
Continuing Grant
Collaborative Research: CNS Core: Medium: Exploiting Synergies Between Machine-Learning Algorithms and Hardware Heterogeneity for High-Performance and Reliable Manycore Computing
合作研究:CNS Core:Medium:利用机器学习算法和硬件异构性之间的协同作用实现高性能和可靠的众核计算
- 批准号:
1955196 - 财政年份:2020
- 资助金额:
$ 5.83万 - 项目类别:
Continuing Grant