SEI+II(BIO): BioTagger - Biological Entity Tagging Using Online Resources and Machine Learning

SEI II(BIO):BioTagger - 使用在线资源和机器学习进行生物实体标记

基本信息

  • 批准号:
    0430743
  • 负责人:
  • 金额:
    $ 82.31万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2004
  • 资助国家:
    美国
  • 起止时间:
    2004-09-01 至 2006-08-31
  • 项目状态:
    已结题

项目摘要

As the pace of biological research increases, computers are being used to manage the explosive amount of biological information. Much of information relevant to biological research is recorded either as coded data in biological databases or as free text in journal articles and in annotation fields of biological databases. Natural language processing tools have shown to have the potential to decrease the difficulty of managing information in biomedical free text.This project aims to use online resources (e.g., genetic databases, free-text corpora or machine readable dictionaries) and machine learning techniques for the construction of a biological entity tagging system that associates terms mentioned in text with entries in databases. Biological entity tagging is extremely challenging because of novelty, synonymy and ambiguity associated with terms representing biological entities in text. The project includes the construction of a biological entity dictionary and the acquisition of disambiguation knowledge using online resources. It also includes the development of dictionary lookup method and the employment of machine learning techniques for resolving ambiguity, discovering novelty, and recognizing synonymy. The research will generate several deliverables and the enriched information on gene/protein names, bibliography, and other annotation fields will be integrated into UniProt/PIR databases, which is an ongoing international effort on protein databases.The project provides an opportunity of furthering the collaborations among Columbia University, Georgetown University Medical Center and University of Maryland at Baltimore County. The project also integrates educational and research activities by having graduate and undergraduate students involved in the overall project.
随着生物学研究步伐的加快,计算机正被用来管理爆炸性数量的生物信息。许多与生物学研究相关的信息要么以编码数据的形式记录在生物学数据库中,要么以自由文本的形式记录在期刊文章和生物学数据库的注释字段中。自然语言处理工具已被证明具有降低生物医学自由文本中信息管理难度的潜力。该项目旨在使用在线资源(例如,遗传数据库、自由文本语料库或机器可读词典)和用于构建生物实体标记系统的机器学习技术,所述生物实体标记系统将文本中提到的术语与数据库中的条目相关联。生物实体标注是极具挑战性的,因为新奇,同义词和模糊性与文本中代表生物实体的术语相关联。该项目包括构建生物实体词典和利用在线资源获取消歧知识。它还包括字典查找方法的开发和机器学习技术的应用,以解决歧义,发现新奇和识别同义词。该研究将产生若干成果,并将丰富的基因/蛋白质名称、参考文献和其他注释字段的信息整合到UniProt/PIR数据库中,这是一项正在进行的蛋白质数据库国际努力。该项目为进一步加强哥伦比亚大学、乔治敦大学医学中心和巴尔的摩县的马里兰州大学之间的合作提供了机会。该项目还通过让研究生和本科生参与整个项目来整合教育和研究活动。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hongfang Liu其他文献

Wonder at Chemotimelines 2024: MedTimeline: An End-to-End NLP System for Timeline Extraction from Clinical Narratives
惊叹于 Chemotimelines 2024:MedTimeline:用于从临床叙述中提取时间线的端到端 NLP 系统
Using Unstructured Data to Identify Readmitted Patients
使用非结构化数据识别重新入院的患者
Fungi corrosion of high-strength aluminum alloys with different microstructures caused by marine Aspergillus terreus under seawater drop
海水滴下海洋土曲霉对不同组织高强度铝合金的真菌腐蚀
  • DOI:
    10.1016/j.corsci.2023.110960
  • 发表时间:
    2023-03
  • 期刊:
  • 影响因子:
    8.3
  • 作者:
    Yuxuan Zhang;Haixian Liu;Zhengyu Jin;Huansheng Lai;Hongfang Liu;Hongwei Liu
  • 通讯作者:
    Hongwei Liu
BELMiner – Information extraction system to extract BEL relationships
BELMiner – 用于提取 BEL 关系的信息提取系统
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    R. K. Elayavilli;M. Rastegar;Hongfang Liu
  • 通讯作者:
    Hongfang Liu
An ensemble approach for chemical entity mention detection and indexing
化学实体提及检测和索引的集成方法
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dingcheng Li;Siddhartha R. Jonnalagadda;Ning Xia;Hongfang Liu
  • 通讯作者:
    Hongfang Liu

Hongfang Liu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hongfang Liu', 18)}}的其他基金

SEI+II(BIO): BioTagger - Biological Entity Tagging Using Online Resources and Machine Learning
SEI II(BIO):BioTagger - 使用在线资源和机器学习进行生物实体标记
  • 批准号:
    0639062
  • 财政年份:
    2006
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Continuing Grant

相似国自然基金

骨胶原(Bio-Oss Collagen)联合龈下喷砂+骨皮质切开术治疗 根分叉病变的临床疗效研究
  • 批准号:
    2024JJ9542
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于通用型 M13-Bio 噬菌体信号放大的动态 光散射免疫传感检测平台的建立及机制研究
  • 批准号:
    Q24C200014
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
智能双栅调控InSe Bio-FET可控构筑与原位细胞传感机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
2D/2D BiO2-x/graphyne异质结光热活化过硫酸盐降解水体中抗生素的机理研究
  • 批准号:
    LY23E080003
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Z型异质结“(金属氧化物MOx@薄层碳TC)/BiO1-xCl”的可控构筑及其光催化性能的研究
  • 批准号:
    22005126
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
BIO促进脂肪来源干细胞修复急性心肌梗死的作用及机制
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
6-BIO 抗肝脏衰老的作用与作用机制研究
  • 批准号:
    19ZR1438800
  • 批准年份:
    2019
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于MOFs热解构建薄层碳包覆的BiO1-xX基Z型异质结及其光催化水氧化苯制苯酚反应的研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
可回收MFe2O4/二维 (BiO)2CO3 复合纳米矿物材料光降解再生水中顽固型有机物机理
  • 批准号:
    41877481
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目

相似海外基金

Bio-MATSUPER: Development of high-performance supercapacitors based on bio-based carbon materials
Bio-MATSUPER:开发基于生物基碳材料的高性能超级电容器
  • 批准号:
    EP/Z001013/1
  • 财政年份:
    2025
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Fellowship
Biophilica - Analysis of bio-coatings as an alternative to PU-coatings for advanced product applications
Biophilica - 分析生物涂层作为先进产品应用的 PU 涂层的替代品
  • 批准号:
    10089592
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Collaborative R&D
Designing a bio-sensitive visualisation for saltmarsh conservation
设计用于盐沼保护的生物敏感可视化
  • 批准号:
    AH/Z50533X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Research Grant
HAIRCYCLE: a pilot study to explore and test regenerative, local, bio-based and circular models for human hair waste
HAIRCYCLE:一项试点研究,旨在探索和测试人类毛发废物的再生、局部、生物基和循环模型
  • 批准号:
    AH/Z50550X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Research Grant
Fair Game: valuing the bio-cultural heritage of fallow deer and their venison for food security, sustainable woodlands and biodiversity
公平游戏:重视小鹿及其鹿肉的生物文化遗产,以促进粮食安全、可持续林地和生物多样性
  • 批准号:
    AH/Z505675/1
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Research Grant
BRC-BIO: Establishing Astrangia poculata as a study system to understand how multi-partner symbiotic interactions affect pathogen response in cnidarians
BRC-BIO:建立 Astrangia poculata 作为研究系统,以了解多伙伴共生相互作用如何影响刺胞动物的病原体反应
  • 批准号:
    2312555
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Standard Grant
NSF/BIO-DFG: Biological Fe-S intermediates in the synthesis of nitrogenase metalloclusters
NSF/BIO-DFG:固氮酶金属簇合成中的生物 Fe-S 中间体
  • 批准号:
    2335999
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Standard Grant
CAREER: Secure Miniaturized Bio-Electronic Sensors for Real-Time In-Body Monitoring
职业:用于实时体内监测的安全微型生物电子传感器
  • 批准号:
    2338792
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Continuing Grant
FMRG: Bio: Enabling Technologies for Biomanufacturing Extracellular Vesicle-Based Therapeutics
FMRG:生物:基于细胞外囊泡的生物制造治疗的使能技术
  • 批准号:
    2328276
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Standard Grant
Convergence Accelerator Track M: Bio-Inspired Design of Robot Hands for Use-Driven Dexterity
融合加速器轨道 M:机器人手的仿生设计,实现使用驱动的灵活性
  • 批准号:
    2344109
  • 财政年份:
    2024
  • 资助金额:
    $ 82.31万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了