技術文書中の画像と説明文の対応付けによる知識体系の構築

通过关联技术文档中的图像和解释性文本来构建知识体系

基本信息

  • 批准号:
    22K12154
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

幅広い分野の一連の手続きに関する知識をテキストから自動抽出し、それらを体系化することを目指している。2022年度は、(1)特許中の図表の自動分類、(2)自然言語文の構造解析、(3)多言語(日英中)上位下位関係の抽出に取り組んだ。(1)について、特許中に記載される図表画像の中からフローチャートを自動抽出することで、フローチャート画像とその説明文の11,188対から構成されるコーパスを構築した。このコーパスの有効性を確認するため、フローチャート画像からの説明文の自動生成を行った。説明文の生成では、フローチャート画像からGoogle Cloud Vision APIを用いて文字列を抽出し、この文字列から説明文を自動生成するために、Text-To-Text Transfer Transformer(T5)を用いて学習した。実験の結果、複雑な形状のフローチャートについては課題が残るものの、質の高い説明文が生成できることが確認できた。(2)について、米国特許を対象に、特許請求項から主要部、構成要素、手順に関する文字列を抽出する手法について検討した。抽出には、T5、Bi-LSTM-CRF、CRFを用いた。実験の結果、T5が最も優れており、特に再現率を大幅に改善できることがわかった。(3)について、リンク予測モデルによる日英中上位下位関係の自動抽出を行った。まず、GANを用いて上位下位関係にある用語を識別する。次に、前の手順で構築された上位下位関係のグラフに対し、ConvEとGraphSAGEを組み合わせたリンク予測を行い、本来であれば上位下位関係にあるべき欠落したエッジを予測する。提案手法の有効性を確認するために行った実験では、GANを用いた上位下位関係の識別およびConvEとGraphSAGEを組み合わせたリンク予測の両方において、提案手法が従来手法よりも優れていることがわかった。
The range of knowledge is divided into two categories: In 2022,(1) Automatic classification of language tables in licensed languages,(2) Structural analysis of natural language texts,(3) Extraction of superordinate and subordinate relations in multi-language (Japanese-English) (1)In addition, the icon in the watch image recorded in the license was automatically pulled out, and the 11,188 pairs of icons and explanatory texts were constructed. This is the first time I've ever seen a picture of myself. Text Generation: Text Extraction: Text Column Extraction: Text Column Automatic Generation: Text to Text Transfer Transformer (T5): Text to Text Transfer Transformer(T5). The result of the implementation, the shape of the complex, the quality of the explanation, the problem, the problem. (2)For example, if you want to select a text string, you can select a text string from the following list: T5, Bi-LSTM-CRF, CRF T5 is the best result, and the reproduction rate is greatly improved. (3)Automatic extraction of superior and subordinate relationships in Japanese GAN is used to identify subordinate terms. The next step is to construct a hierarchical relationship between the two groups, and to construct a hierarchical relationship between the two groups. The proposed method has the property of identifying the subordinate relationship between the two parties. The proposed method has the property of identifying the subordinate relationship between the two parties.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
リンク予測モデルによる多言語上位下位関係の自動抽出
使用链接预测模型自动提取多语言上级关系
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    何 其歓,杉村 博,田中 哲雄,松本一教;高橋英明;高橋英明;Yao Gong,福田悟志,難波英嗣
  • 通讯作者:
    Yao Gong,福田悟志,難波英嗣
特許中のフローチャート画像からの説明文の自動生成
从专利流程图图像自动生成解释性文本
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    難波英嗣,久保翔平;福田悟志
  • 通讯作者:
    福田悟志
Analyzing the Structure of U.S. Patents Using Patent Families
使用专利族分析美国专利的结构
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakamitsu;J.;Fukuda;S.;and Nanba;H.
  • 通讯作者:
    H.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

難波 英嗣其他文献

旅行者の購買行動プロセスに関連するツイートの自動抽出
自动提取旅客购买行为过程相关推文
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤村 雄偉;石野 亜耶;難波 英嗣;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
旅行者の感情に基づいた観光スポット推薦
基于游客情绪的旅游景点推荐
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    篠田 広人;柴田 有基;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
観光の形態に基づいた旅行ブログエントリの自動分類
根据旅游类型自动分类旅游博客条目
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴田 有基;篠田 広人;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
レファレンス事例の分析による論文検索に効果的な要素の調査
通过分析参考例子研究文章搜索的有效要素
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中野幸二;堀内 潤;石松亮一;今任稔彦;出口弘;鈴木彼方,陽品駒,加瀬敬唯,尾形哲也;難波 英嗣
  • 通讯作者:
    難波 英嗣
観光の形態に基づいた旅行プランの自動生成
根据旅游类型自动生成出行计划
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴田 有基;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸

難波 英嗣的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('難波 英嗣', 18)}}的其他基金

文書集合の構造化に基づく効率的な情報アクセス技術の開発
基于文档集结构化的高效信息访问技术的开发
  • 批准号:
    16700151
  • 财政年份:
    2004
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
論文間の参照情報を考慮した学術論文要約システムの開発
考虑论文之间参考信息的学术论文摘要系统的开发
  • 批准号:
    01J11226
  • 财政年份:
    2001
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

フローチャートで表現できない証明の読解力・表現力を養成する指導法
一种培养阅读和表达无法用流程图表达的证明的能力的教学方法。
  • 批准号:
    24K05951
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
早期の発達軌道から神経発達の診断を予測するためのフローチャートの作成
创建流程图以根据早期发育轨迹预测神经发育诊断
  • 批准号:
    23K09720
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
有事の医療現場にて日和見感染症抑止に絶大な効果を発揮するフローチャートの開発
开发在紧急医疗环境中预防机会性感染极其有效的流程图
  • 批准号:
    23K09484
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
2週間の排便日誌から排便パターンを分類する新しい看護アセスメント方法の確立
建立一种新的护理评估方法,根据两周排便日记对排便模式进行分类
  • 批准号:
    22K10679
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a foot care protocol by visiting nurses for the elderly in home care
通过拜访护士为家庭护理老年人制定足部护理方案
  • 批准号:
    20K10983
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of Integrated Development Environment with Teaching Support for Programming Learning
编程学习教学支持集成开发环境的开发
  • 批准号:
    20K12097
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日本語ライティングにおけるナラティブのGood Writing探究と評価法の開発
日语写作中叙事性好写作的探索及评价方法的发展
  • 批准号:
    19H01274
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
死後CT画像による死因診断基準の確立-肺所見を軸とした診断フローチャート作成
使用尸检CT图像建立死因诊断标准 - 创建以肺部检查结果为中心的诊断流程图
  • 批准号:
    19K08167
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Automatic Construction of Procedural Ontology and Its Application to Information Retrieval
程序本体自动构建及其在信息检索中的应用
  • 批准号:
    19K12101
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on establishment of response system in case of natural disaster among mountainous residential areas located in the eastern part of Yamanashi Prefecture
山梨县东部山区居民区自然灾害应对体系建立研究
  • 批准号:
    17K17422
  • 财政年份:
    2017
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了