複数の学術文献からの遺伝子に関する記述の抽出と集約に関する研究

从多个学术文献中提取和聚合基因描述的研究

基本信息

  • 批准号:
    06J11198
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2006
  • 资助国家:
    日本
  • 起止时间:
    2006 至 2007
  • 项目状态:
    已结题

项目摘要

本研究の目標は,生物学研究者が遺伝子に関する情報を効率よく収集・把握できるようなシステムを構築し,生物学研究に貢献することである.これを要約というアプローチから実現するため,全体を4つのサブゴールに分解し,平成18年度は次の3つのサブゴールに関して研究を行った.1,遺伝子に関する文献を網羅的に収集する方法.これは,ユーザが指定した遺伝子名を含む文献をデータベースから見つけ出し,その検索結果を返すというものである.本研究では,表記ゆれの大きな要因となっている略語現象に着目し,同じエンティティを指している略語とその定義を抽出する方法を提案した.英語の略語抽出では精度99%,再現率85-99%を達成し,略語抽出の既存手法の精度を大きく改善した.日本語の略語抽出においても,約90%のF尺度を達成する手法を提案した.2,文献を要約する際の視点の検討.遺伝子に関する記述を集約した要約に対して,ユーザ側からどのような要求・期待があるのかを明らかにするタスクである.実験科学学術論文のアブストラクトは,「目的」→「手法」→「結果」→「結論」という共通の談話構造で構成されるという従来研究の報告に基づき,本研究が対象とする文書集合であるMEDLINEのアブストラクト文を分析した.3,その視点に従って入力文書の情報を分類する方法.MEDLINEアブストラクトに含まれる各文が,2,で定義された視点を説明する文であるかどうかを判別する分類器を機械学習で獲得した.アブストラクトには典型的な流れがあるという観察に基づき,学習器として従来用いられていたSupport Vector Machine(SVM)に代え,Conditional Random Fields(CRF)を採用し,文単位での正解率が90%以上,アブストラクト単位での正解率が約60%と,既存手法よりも高い分類精度が得られることを確認した.
The purpose of this study is to collect and grasp information efficiently and effectively as a biological researcher.テムをConstruction, Biological Research にContribution することである. これを Offer というアプローチから実 Present するため,The whole を4つのサブゴールにDecompositionし,Heisei18は时の3つのサブゴールに关して researchを行った.1, The method of collecting documents and collecting documents. これは, The designated した缝子The name of the document is the document of the name. This study is the result of the search result.では, the symbol for ゆれの大きな is due to the abbreviation phenomenon of となっている, and the same as じエンティティを refers to しているThe definition and method of extracting abbreviation is a proposal. The accuracy of extracting abbreviation in English is 99%, and the reproduction rate is 85-9. 9%をachievedし, the accuracy of the existing technique of abbreviation extraction has been greatly improved, and the Japanese abbreviation extraction method has been improved, approx. 90% of the F standard is achieved, the method is proposed, and the document is proposed.するnarrativeをaggregationしたofferに対して,ユーザlateralからどのようなrequest・expectationがあるのかを明らかに"Purpose" → "Method" → "Result" → 「Conclusion」というCommon conversation structureでConstitutionされるという従 come to the research reportにbasisづき,This study is the imageとすDocument CollectionであるMEDLINEのアブストラクト文をAnalysisした.3,そのViewpointに従って入力How to classify documentsたViewpointをExplanationする文であるかどうかをDiscriminationするClassifierをMechanical learningでGetした.アブストラクトにはTypical な流れがあるという観看にbasedづき,Learning device として従来用いられていたSupport Vector Machine (SVM),Conditional Random Fields (CRF) is adopted, and the correct answer rate of the text is more than 90%. The correct answer rate is about 60%, and the classification accuracy of the existing method is high and the classification accuracy has been confirmed.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
位置履歴からのユーザ属性の推定
根据位置历史估计用户属性
Building an abbreviation dictionary using a term recognition approach
  • DOI:
    10.1093/bioinformatics/btl534
  • 发表时间:
    2006-12-15
  • 期刊:
  • 影响因子:
    5.8
  • 作者:
    Okazaki, Naoaki;Ananiadou, Sophia
  • 通讯作者:
    Ananiadou, Sophia
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

岡崎 直観其他文献

深層ニューラルネットワークによる知識の自動獲得や推論
使用深度神经网络自动知识获取和推理
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    R. Uchi (他40名;山本36番目);冨山 翔司,味曽野 雅史,鈴木 雅大,中山 浩太郎,松尾 豊;岡崎 直観
  • 通讯作者:
    岡崎 直観
利用物に関する知識のコーパスアノテーション
材料知识的语料库标注
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上村 明衣;折田 奈甫;岡崎 直観;乾 健太郎
  • 通讯作者:
    乾 健太郎
アラインメントに基づいた日中漢字の対応関係における解析
基于对齐的汉字与汉字对应关系分析
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    劉 瀟;綱川 隆司;岡崎 直観;辻井潤一
  • 通讯作者:
    辻井潤一
脳の性差形成と細胞死「細胞死研究総集編」第4章発生における細胞死(三浦正幸編集)
大脑中性别差异的形成与细胞死亡《细胞死亡研究汇编》第四章发育中的细胞死亡(三浦雅之编辑)
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    劉 瀟;綱川 隆司;岡崎 直観;辻井潤一;木村賢一
  • 通讯作者:
    木村賢一
近傍の事例を活用したニューラル言語生成
使用附近示例的神经语言生成
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mengsay Loem;Sho Takase;Masahiro Kaneko;and Naoaki Okazaki;Naoaki Okazaki;岡崎 直観
  • 通讯作者:
    岡崎 直観

岡崎 直観的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('岡崎 直観', 18)}}的其他基金

常識的知識を活用した言語理解・推論に基づく議論マイニングの新展開
基于语言理解和常识知识推理的论点挖掘新进展
  • 批准号:
    19H01118
  • 财政年份:
    2019
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了