Web Scale Trustworthy Data for Machine Learning

用于机器学习的网络规模可信数据

基本信息

  • 批准号:
    10065617
  • 负责人:
  • 金额:
    $ 3.51万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Collaborative R&D
  • 财政年份:
    2023
  • 资助国家:
    英国
  • 起止时间:
    2023 至 无数据
  • 项目状态:
    已结题

项目摘要

Large Language Models are today mostly English-language-based and trained on large-scale datasets, for which crawled web text data is the biggest element. Mojeek is an international web search engine, with an independent technology stack, and a growing search index of over 6.5 billion webpages. The Mojeek index is updated daily and data is available through the API. Our API has been used by FAIR and others to develop AI solutions including chatbots. In this project we will build a consortium of researchers and companies, for a large Phase 2 project which will enable easy and rapid access to large-scale data for training of machine learning models. We will conduct R&D, develop the Mojeek API, and work on industry use cases in chatbots and online safety. We will develop methodologies and software that will enable the extraction of trusted sources of data, thus accelerating the development of responsible AI solutions, and notably by SMEs.
如今,大型语言模型大多以英语为基础,并在大规模数据集上进行训练,其中爬行的网络文本数据是最大的元素。Mojeek是一个国际网络搜索引擎,拥有独立的技术堆栈,并拥有超过65亿网页的不断增长的搜索索引。Mojeek指数每天更新,数据可通过API获得。我们的API已经被FAIL和其他公司用来开发包括聊天机器人在内的人工智能解决方案。在这个项目中,我们将为一个大型的第二阶段项目建立一个由研究人员和公司组成的联合体,该项目将使我们能够轻松快速地访问用于训练机器学习模型的大规模数据。我们将进行研发,开发Mojeek API,并致力于聊天机器人和网络安全方面的行业用例。我们将开发能够提取可信数据源的方法和软件,从而加快开发负责任的人工智能解决方案,特别是中小企业。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Studentship

相似国自然基金

基于热量传递的传统固态发酵过程缩小(Scale-down)机理及调控
  • 批准号:
    22108101
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于Multi-Scale模型的轴流血泵瞬变流及空化机理研究
  • 批准号:
    31600794
  • 批准年份:
    2016
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
针对Scale-Free网络的紧凑路由研究
  • 批准号:
    60673168
  • 批准年份:
    2006
  • 资助金额:
    25.0 万元
  • 项目类别:
    面上项目

相似海外基金

Renewal application: How do ecological trade-offs drive ectomycorrhizal fungal community assembly? Fine- scale processes with large-scale implications
更新应用:生态权衡如何驱动外生菌根真菌群落组装?
  • 批准号:
    MR/Y011503/1
  • 财政年份:
    2025
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Fellowship
Traversing the Gray Zone with Scale-aware Turbulence Closures
通过尺度感知的湍流闭合穿越灰色区域
  • 批准号:
    2337399
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Collaborative Research: NCS-FR: Individual variability in auditory learning characterized using multi-scale and multi-modal physiology and neuromodulation
合作研究:NCS-FR:利用多尺度、多模式生理学和神经调节表征听觉学习的个体差异
  • 批准号:
    2409652
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Collaborative Research: RUI: Continental-Scale Study of Jura-Cretaceous Basins and Melanges along the Backbone of the North American Cordillera-A Test of Mesozoic Subduction Models
合作研究:RUI:北美科迪勒拉山脊沿线汝拉-白垩纪盆地和混杂岩的大陆尺度研究——中生代俯冲模型的检验
  • 批准号:
    2346565
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
CRII: OAC: A Compressor-Assisted Collective Communication Framework for GPU-Based Large-Scale Deep Learning
CRII:OAC:基于 GPU 的大规模深度学习的压缩器辅助集体通信框架
  • 批准号:
    2348465
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Investigating Multi-Scale Dynamical Processes Amplifying Storm Surges
研究放大​​风暴潮的多尺度动力学过程
  • 批准号:
    2342516
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Collaborative Research: RUI: Continental-Scale Study of Jura-Cretaceous Basins and Melanges along the Backbone of the North American Cordillera-A Test of Mesozoic Subduction Models
合作研究:RUI:北美科迪勒拉山脊沿线汝拉-白垩纪盆地和混杂岩的大陆尺度研究——中生代俯冲模型的检验
  • 批准号:
    2346564
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403312
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Continuous, Large-scale Manufacturing of Functionalized Silver Nanowire Transparent Conducting Films
功能化银纳米线透明导电薄膜的连续大规模制造
  • 批准号:
    2422696
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
Collaborative Research: MRA: A functional model of soil organic matter composition at continental scale
合作研究:MRA:大陆尺度土壤有机质组成的功能模型
  • 批准号:
    2307253
  • 财政年份:
    2024
  • 资助金额:
    $ 3.51万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了