コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発

开发成本敏感的纸张元信息提取器和网络物理纸张浏览器

基本信息

  • 批准号:
    22H03904
  • 负责人:
  • 金额:
    $ 10.82万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究は、学術論文の電子文書から様々なメタ情報をコストセンシティブに抽出する方法の確立と、抽出したメタ情報を論文閲覧支援に活用するサイバーフィジカル論文ブラウザの開発を目的とする。とりわけ論文メタ情報として参考文献の書誌情報や表を自動抽出して解析する方法を確立し、サイバー空間の関連情報を自動集約する機能などをもつ論文ブラウザを開発する。参考文献書誌情報抽出では、機械学習に基づく情報抽出器の精度と学習データの生成コストのトレードオフと、抽出誤りに対する人的修正コストを実用レベルで制御できるコストセンシティブな情報抽出の実現を目指す。さらに、学術論文から抽出した書誌情報、表の情報、専門用語などとサイバー空間の関連情報を知的に集約し、紙に印刷されたフィジカルな論文の読者に提供するためのサイバーフィジカル論文閲覧支援インタフェースを提案する。令和4年度は、学術論文の参考文献欄から書誌情報を抽出するために開発を進めてきたBidirectional Encoder Representations from Transformers(BERT)による参考文献書誌情報抽出器の抽出誤りの自動検出を試み、実験によりその検出の精度ならびに見込まれる修正コストなどを評価した。また、表中の数値データの自動グラフ変換を行うために、ニューラルネットワークを利用して、文書から表を検出しその構造を解析するエンドツーエンド表構造解析手法を開発した。さらに、論文ブラウザによる初学者の論文閲覧支援のために、引用意図に基づく引用箇所の補足情報の自動生成手法について検討した。これらの研究成果について国内研究会などで発表した。
This study aims to establish a method for extracting information from electronic documents, and to develop information from electronic documents. The function of automatic extraction and analysis of bibliographic information from references is established, and the function of automatic aggregation of spatial related information is developed. References Information Extraction and Mechanical Learning: Accuracy of Basic Information Extraction, Learning Error Generation, Error Extraction, and Human Correction For example, academic papers are extracted from books, tables and related information, and paper printers are provided with support for reading papers. In 2004, the Bidirectional Encoder Representatives from Transformers (BERT) in the Reference Column of Academic Papers was evaluated for the automatic detection of errors in the extraction of reference information, the accuracy of detection, and the correction of errors. The automatic conversion of data in the table is carried out. The structure analysis method of the table is developed. In addition, the paper support for beginners, the reference information, the automatic generation method of the reference information, etc. are discussed. The results of this research will be presented to the domestic research society.

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
文の類似度と Extractive QA による被引用文特定の一手法
一种利用句子相似度和提取 QA 识别引用句子的方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西海真祥;金澤輝一;上野史;太田学
  • 通讯作者:
    太田学
初学者の論文閲覧支援のための日本語論文からの専門用語抽出の一手法
一种从日语论文中提取技术术语的方法,辅助初学者阅读论文
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋春成;金澤輝一;上野史;太田学
  • 通讯作者:
    太田学
引用意図を利用した初学者向け学術論文閲覧支援方法の検討
检查使用引用意图支持初学者阅读学术论文的方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西海真祥;金澤輝一;上野史;太田学
  • 通讯作者:
    太田学
BERTによる参考文献書誌情報抽出の誤り検出の評価
使用 BERT 评估参考书目信息提取中的错误检测
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山竣平;金澤輝一;高須淳宏;上野史;太田学
  • 通讯作者:
    太田学
ニューラルネットワークによる日本語を含む表の構造解析の一手法
一种使用神经网络对包含日语的表格进行结构分析的方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    細谷亮太;金澤輝一;上野史;太田学
  • 通讯作者:
    太田学
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

太田 学其他文献

学校図書館法
学校图书馆法
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上 尚慶;太田 学;高須 淳宏;安達 淳;Atsuhiro Takasu and Manabu Ohta;平久江祐司
  • 通讯作者:
    平久江祐司
多元的デジタルアーカイブズのVR-ARインターフェイスデザイン手法
多维数字档案馆VR-AR界面设计方法
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石本 茜;太田 学;高須 淳宏;安達 淳;渡邉英徳,佐藤康満
  • 通讯作者:
    渡邉英徳,佐藤康満
CRFによる参考文献文字列からの書誌要素抽出の一手法
一种利用CRF从参考文献字符串中提取书目元素的方法
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    荒内 大貴;太田 学;高須 淳宏;安達 淳
  • 通讯作者:
    安達 淳
CRFによる論文文書画像の書誌要素推定における自動誤り検出
使用 CRF 进行文章文档图像的书目元素估计中的自动错误检测
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 諒平;太田 学;高須 淳宏
  • 通讯作者:
    高須 淳宏
学術論文からの実験情報抽出の一手法
一种从学术论文中提取实验信息的方法
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平井 久貴;新妻 弘崇;太田 学;高須 淳宏
  • 通讯作者:
    高須 淳宏

太田 学的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('太田 学', 18)}}的其他基金

コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用
基于随机自动机的模糊搜索模型在口语文本中的应用
  • 批准号:
    14780329
  • 财政年份:
    2002
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了