Semi-supervised learning of deep hierarchical hidden representations

深层层次隐藏表示的半监督学习

基本信息

  • 批准号:
    1793885
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2016
  • 资助国家:
    英国
  • 起止时间:
    2016 至 无数据
  • 项目状态:
    已结题

项目摘要

Until the end of the 20th century, most of the computer programs were manuallyimplemented to perform repetitive tasks that could be automated, thus alleviating humanwork. However, at the end of the century, the field of Machine Learning emerged in order tocreate algorithms that could generate programs automatically by means of data andexamples. These methods together with an exponential growth of available data andcomputational power allowed the training deep hierarchical models. Nowadays, deephierarchical models are achieving and occasionally surpassing human performance on avariety of tasks like object recognition, automatic translation, speech recognition,autonomous transportation and medical applications.One of the main problems of the current state-of-the-art models is that they need fullyannotated data to solve any specific task. This type of problems is known as SupervisedLearning tasks. For this reason, one of the bottlenecks for training these models is thegeneration of good and large datasets, as they require lots of manual annotation.To solve this problem, the field of Semi-Supervised learning uses data that has not beenannotated in order to help the Supervised Learning part. For example, in problems wherelabels are scarce, it is possible to use unlabeled data to learn hierarchical hiddenrepresentations that can be used to improve the performance of Supervised models. Newmethods are still being investigated and this is one of the main topics of this Ph.D. Anotherproblem is that most of the current literature in Machine Learning assumes that dataavailable during the training of the models follows the same distribution as the future dataavailable during the deployment time. However, this assumption is only true in a fewcontrolled scenarios; for example in a closed factory. On the contrary, most of the real casescenarios evolve and change with new objects, words or patterns. For this reason, it isimportant to provide Machine Learning models with the ability to notify when new patternsappear, thus avoiding possible mistakes.This Ph.D. proposes to address this problem by means of Semi-Supervised Learningtechniques. Using new techniques we want to enhance existent models by giving them theability to discern between known and unknown patterns. In such a way that models are ableto manifest the confidence on their predictions. This is important in order to make confidentpredictions given familiar patterns while being able to ask for further inspection otherwise.In conclusion, there is an increasing popularity of machine learning models that learn deephierarchical hidden representations of the data. These models are being applied in a widerange of problems, some of which have important implications. However, they need largeamounts of annotated data and are not able to output confidence values in their predictions.For that reason, the topic of this Ph.D. is to improve models using unlabeled data, makethem aware of new situations, and able to avoid uninformed decisions.
直到世纪末,大多数计算机程序都是手工实现的,用于执行可以自动化的重复性任务,从而减轻了人类的工作。然而,在世纪末,机器学习领域出现了,以创建可以通过数据和示例自动生成程序的算法。这些方法与可用数据和计算能力的指数增长一起允许训练深度层次模型。如今,深度层次模型在物体识别、自动翻译、语音识别、自主交通和医疗应用等各种任务上的表现已经达到甚至超过人类。当前最先进的模型的主要问题之一是,它们需要完全注释的数据来解决任何特定的任务。这种类型的问题被称为监督学习任务。因此,训练这些模型的瓶颈之一是生成好的和大的数据集,因为它们需要大量的手动注释。为了解决这个问题,半监督学习领域使用未被注释的数据来帮助监督学习部分。例如,在标签稀缺的问题中,可以使用未标记的数据来学习可用于提高监督模型性能的分层hiddenrepresentation。新的方法仍在研究中,这是这个博士的主要课题之一。另一个问题是,目前机器学习领域的大多数文献都假设模型训练期间可用的数据与部署期间可用的未来数据遵循相同的分布。然而,这种假设仅在少数受控场景中成立;例如在封闭的工厂中。相反,大多数真实的案例都随着新的对象、词语或模式而演变和变化。因此,重要的是为机器学习模型提供新模式出现时通知的能力,从而避免可能的错误。提出通过半监督学习技术来解决这个问题。使用新技术,我们希望通过赋予现有模型识别已知和未知模式的能力来增强它们。以这样一种方式,模型能够表现出对他们预测的信心。这一点很重要,因为它可以在给定熟悉模式的情况下做出自信的预测,同时还可以要求进一步的检查。总之,机器学习模型越来越受欢迎,这些模型可以学习数据的深层隐藏表示。这些模型被应用于广泛的问题,其中一些具有重要的意义。然而,他们需要大量的注释数据,并且无法在预测中输出置信度值。是使用未标记的数据来改进模型,使它们意识到新的情况,并能够避免不知情的决策。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Background Check: A General Technique to Build More Reliable and Versatile Classifiers
  • DOI:
    10.1109/icdm.2016.0150
  • 发表时间:
    2016-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Miquel Perello-Nieto;Telmo de Menezes e Silva Filho;Meelis Kull;Peter A. Flach
  • 通讯作者:
    Miquel Perello-Nieto;Telmo de Menezes e Silva Filho;Meelis Kull;Peter A. Flach
Beyond temperature scaling: Obtaining well-calibrated multiclass probabilities with Dirichlet calibration
  • DOI:
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Meelis Kull;Miquel Perello-Nieto;Markus Kängsepp;Telmo de Menezes e Silva Filho;Hao Song;Peter A. Flach-
  • 通讯作者:
    Meelis Kull;Miquel Perello-Nieto;Markus Kängsepp;Telmo de Menezes e Silva Filho;Hao Song;Peter A. Flach-
Recycling weak labels for multiclass classification
回收弱标签进行多类分类
  • DOI:
    10.1016/j.neucom.2020.03.002
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Perello-Nieto M
  • 通讯作者:
    Perello-Nieto M
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

基于指点触控行为的身份认证与监控方法研究
  • 批准号:
    61175039
  • 批准年份:
    2011
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目

相似海外基金

SHF: Small: Semi-supervised Learning for Design and Quality Assurance of Integrated Circuits
SHF:小型:集成电路设计和质量保证的半监督学习
  • 批准号:
    2334380
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
A Novel Approach to Semi-Supervised Statistical Machine Learning
半监督统计机器学习的新方法
  • 批准号:
    DP230101671
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Discovery Projects
Towards Open-world Semi-supervised learning
走向开放世界的半监督学习
  • 批准号:
    2766068
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Studentship
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
  • 批准号:
    10463080
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Clustering and semi-supervised learning on large heterogeneous graphs: Mathematical formulations and numerical optimization algorithms
大型异构图上的聚类和半监督学习:数学公式和数值优化算法
  • 批准号:
    569398-2022
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Development of Semi-Supervised Learning Method using Compressed Video for Real-Time Animal Behavior Analysis
使用压缩视频进行实时动物行为分析的半监督学习方法的开发
  • 批准号:
    22H03637
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
  • 批准号:
    10745272
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Semi-supervised Approaches to Denoising Electronic Health Records Data for Risk Prediction
用于风险预测的电子健康记录数据去噪半监督方法
  • 批准号:
    10453558
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Novel semi-supervised Bayesian learning for impurity detection in oligonucleotide drugs
用于寡核苷酸药物杂质检测的新型半监督贝叶斯学习
  • 批准号:
    2597535
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Studentship
Semi-supervised Approaches to Denoising Electronic Health Records Data for Risk Prediction
用于风险预测的电子健康记录数据去噪半监督方法
  • 批准号:
    10185327
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了