医学・生物学分野のテキスト処理のための知識体系の構築に関する研究

医学生物领域文本处理知识体系构建研究

基本信息

  • 批准号:
    00J60402
  • 负责人:
  • 金额:
    $ 1.54万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2002
  • 项目状态:
    已结题

项目摘要

高次の生物知識の抽出と体系化を行うためには、適切な意味タグが付与されたコーパスや最低限の専門用語を登録した辞書など言語リソースの整備が不可欠であるが、これまでに一般に公開された質の良いこれらのリソースは存在しない。そこで、本研究ではこういったリソースの整備を行い、ゲノム情報研究分野の共有資源として公開することを一つの目的としてきた。また、専門用語の自動認識や構文解析技術などの自然言語処理の基礎技術を用いると共に大規模コーパスからの学習を行うことで、これまでの自然言語処理研究の対象とされてきた新聞記事などの分野に比べて格段に難易度の高いゲノム・サイエンス分野のテキストに適用できるような、統合的なシステムの開発を行ってきた。最終年度にあたる本年度は、以下の項目を中心として研究を実施した。1.リソースの整備:現在公開しているタグ付コーパスのエラー、特に、タグ境界のエラーや改行エラー等の構造的なエラーを中心に修正し、公開した。また、品詞や構文木などの付加的な情報を加えていくことにより質的な向上を図ると共に、生体内でのイベントに関する情報を抽出することを目的として、テキスト中に出現するイベント情報の試験的なマークアップを開始した。2.オントロジーの拡張:タグ付コーパス中の専門用語を整理することにより分野の概念を再構築し、オントロジーの拡張を行った。また、コーパス中での言語現象を解析することにより、生体内でのイベントなど更に高次の知識概念の体系化を試みた。3.統合システムの構築:これまでに作成してきたリソースやツール、自然言語処理プログラム等を効率よく利用するためのインターフェースとして、総合システムをデザインした。
High-order "biological knowledge" extraction, "systematization" line, "cut" means that you should pay for the minimum level of information by using the words you need to sign up. You can tell the truth that you can't pay for the equipment. The purpose of this study is to achieve the goal of sharing resources and resources in the field of research and development. In this paper, we use the automatic information technology to analyze the natural language, the basic technology, the basic technology, the basic technology, In a unified system, financial institutions are engaged in the conduct of banking and banking activities. For the most recent year, the following project center will conduct research and implementation of the project. 1. Equipment: it is now open to the public to pay for the revision of the center, which has been made in the public domain, such as the level of employment, and so on. In the system, there is an increase in the amount of information that has been added to the system. In the system, there is an increase in the number of people in the system, and in the system, there is a change in the system. two。 Please tell me that you need to organize the concept of dividing the line in the middle of the day. The words in the paraphrase are similar to those in the analysis, and those in the body are more advanced in terms of knowledge, concepts, and systematization. 3. In a word, the rate is different, such as the use of information, and the use of information.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tomoko Ohta, et al.: "The GENIA Corpus : an Annotated Corpus in Molecular Biology Domain"Proc. of the 10th International Conference on Intelligent Systems for Molecular Biology (ISMB 2002) poster session. (2002)
Tomoko Ohta 等人:“GENIA 语料库:分子生物学领域的注释语料库”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toma Erjavec, et al.: "Stretching the TEI : Converting the Genia Corpus"Proc. of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03). (In press). (2003)
Toma Erjavec 等人:“拉伸 TEI:转换 Genia Corpus”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Tomoko Ohta, et al.: "GENIA Corpus : an Annotated Research Abstract Corpus in Molecular Biology Domain"Proc. of the Human Language Technology Conference. (In press). (2002)
Tomoko Ohta 等人:“GENIA 语料库:分子生物学领域带注释的研究摘要语料库”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Jin-Dong Kim, et al.: "Copus-Based Approach to Biological Entity Recognition"Proc. of the Second Meeting of the Special Interest Group on Text Data Mining of ISMB 2002. (2002)
Jin-Dong Kim 等人:“基于 Copus 的生物实体识别方法”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

大田 朋子其他文献

大田 朋子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
  • 批准号:
    24H00255
  • 财政年份:
    2024
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
SIEPH: Safe Information Extraction from Patient Histories
SIEPH:从患者病史中安全提取信息
  • 批准号:
    EP/X018237/1
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Research Grant
多様性・被覆性等を考慮した代表解集合を求める情報抽出機構に関する研究
考虑多样性、覆盖度等因素获取代表性解集的信息提取机制研究
  • 批准号:
    23K11115
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
進化情報と塩基エディターによる酵素大規模ライブラリーの作製と活性機能情報抽出
使用进化信息和碱基编辑器创建大规模酶库并提取活性功能信息
  • 批准号:
    23KK0269
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)
CAREER: Achieving Quality Information Extraction from Scientific Documents with Heterogeneous Weak Supervisions
职业:通过异构弱监督实现科学文档中的质量信息提取
  • 批准号:
    2237831
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Standard Grant
Speaking Webspeak: Maximising Information Extraction From Online Language Use, for Better Interpretation and Responses in Creative Systems
说网络语言:最大限度地从在线语言使用中提取信息,以更好地解释和响应创意系统
  • 批准号:
    2872640
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Studentship
Information extraction accumulating graph-formed knowledge with deep learning
通过深度学习积累图形化知识的信息提取
  • 批准号:
    22KJ2983
  • 财政年份:
    2023
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
人と計算機との対話による情報抽出ノウハウの学習支援システム
通过人与计算机对话进行信息提取技术的学习支持系统
  • 批准号:
    22K18010
  • 财政年份:
    2022
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CAREER: Information Extraction and Integration with Applications to Healthcare Question Answering
职业:信息提取和与医疗保健问答应用程序的集成
  • 批准号:
    2145202
  • 财政年份:
    2022
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了