表題構造分析と内容提示項目に基づく技術文書からの表題自動生成に関する研究

基于标题结构分析和内容呈现项的技术文档自动标题生成研究

基本信息

  • 批准号:
    14780292
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究では,対象を技術系論文と新聞記事に絞り,原文を言い換えたり,合成したりすることによって,表題を自動生成する手法を考案する.技術論文の表題には,ある種の構文的構造が存在し,多くの場合は名詞句となることが多いといわれる.研究代表者は,研究・開発の内容を具体的かつ簡潔に表現しなければならないという表題の性質に着目し,表題中にはいくつかの内容提示項目(研究の目的や対象,方法)が必須情報として含まれるべきである仮定する.また,重要文抽出に基づく生成手法では内容提示項目が含まれない可能性が高い.そこで,本文を形態素レベルでとらえることで,より小さな単位から表題を生成することが有効であると考えた.平成15年度は,学術論文から表題を自動生成する方法を考案した.まず,タイトルを生成するためのベースとなる重要文抽出法を考案した.提案手法は,定型表現と手掛り語,TF-IDFにより重要文を抽出する.実験により,約73%の精度で重要文を抽出することを示した.次に,抽出された重要文から内容提示項目(目的,方法,長所,対象,動作,形態,主旨)をベースにタイトルを生成する手法を考案した.提案手法は,「形態」要素を起点にして,必要な内容提示項目を係り受け情報を基に獲得する.提案手法の有効性を確認するために,2000-2002年度の情報処理学会自然言語処理研究会報告359件の論文概要から40件を無作為に抽出して,自動生成したタイトルを以下の指標で評価した.(1)タイトルとして成立する;(2)タイトルして許容できる;(3)タイトルとして物足りない;(4)タイトルとして成立しない.結果として,(1)のみ精度は約32%であったが,(2)まで含めると約73%の精度でタイトルが生成できることを確認した.以上の研究成果は,国際会議や年次大会などで報告した.今後は,重要文に頼らないタイトル生成法へも拡張し,提案した技術をより明確にアピールできるタイトルの自動生成を実現する.
This research is aimed at the automatic generation of the title of a technical paper. The title of the technical paper is: The research representative shall specify the contents of the research and development, conciseness of presentation, nature of the title, purpose of the title, indication of contents (purpose of the research, object, method), and necessary information. Important text extraction is based on the method of generating content prompt items, and the possibility is high. This article is a morphological element. Heisei 15 years ago, academic paper table title automatic generation method test case. The important text extraction method is examined in the following ways: Proposal technique, stereotype performance, hand hanging,TF-IDF, important text extraction. The accuracy of this method is about 73%. Next, extract the important text content prompt items (purpose, method, length, object, action, form, theme), and create the method for the test case. Proposal method,"form" element starting point, necessary content prompt item, system, information base to obtain. 359 paper summaries of the 2000 -2002 Natural Speech Processing Research Conference of the Information Processing Society were selected from 40 papers without any work, and the following indicators were automatically generated for evaluation. (1)(2) The content of the material is sufficient;(3) The content of the material is sufficient;(4) The content of the material is sufficient;(5) The content of the material is sufficient. Results: (1) Accuracy is about 32%,(2) Accuracy is about 73%,(3) Accuracy is about 32%,(4) Accuracy is about 73%,(5) Accuracy is about 73%,(6) Accuracy is about 73%,(7) Accuracy is about 73%,(8) Accuracy is about 73%,(9) Accuracy is about 73%. The above research results are reported to the International Conference and Annual General Assembly. In the future, important text generation methods will be developed, and proposals will be made for clear text generation and automatic generation.

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
溝渕昭二, 安藤一秋: "暦法的な時間指示表現の意味表現形式"言語処理学会第10回年次大会発表論文集. 476-479 (2004)
Shoji Mizobuchi、Kazuaki Ando:“基于日历的时间指示表达式的语义表达形式”语言处理学会第十届年会记录476-479(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Ando, T.Yamasaki, N.Yamashita: "Internet-based Japanese Language Learning System for Handwriting Kanji Characters Beautifully"Proceedings of the International Conference on Computer in Education 2002(CD-ROM : ISBN 0-7695-1509-6). (2002)
K.Ando、T.Yamasaki、N.Yamashita:“基于互联网的日语学习系统,可漂亮地手写汉字”2002年国际计算机教育会议论文集(CD-ROM:ISBN 0-7695-1509-6)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
安藤一秋, 新居雅也, 溝渕昭二: "論文概要からのタイトル自動生成の試み"言語処理学会第10回年次大会発表論文集. 269-272 (2004)
Kazuaki Ando、Masaya Arai、Shoji Mizobuchi:“尝试从论文摘要中自动生成标题”语言处理学会第十届年会记录269-272(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kazuaki Ando, Masami Shishibori, Jun-ichi Aoe: "Analysis of Author's Keywords and Automatic Japanese Keyword Generation"Proceedings of the International Conference on Computer Processing of Oriental Languages 2003. 378-384 (2003)
Kazuaki Ando、Masami Shishibori、Jun-ichi Aoe:“作者关键词分析和自动日语关键词生成”2003 年东方语言计算机处理国际会议论文集。378-384 (2003)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.Shishibori, S.Tsuge, K.Ando, J.Aoe: "A Filtering Method Based on Multi-attribute Information"Proceedings of the International Conference on Information 2002. Vol.3. 160-165 (2002)
M.Shishibori、S.Tsuge、K.Ando、J.Aoe:“基于多属性信息的过滤方法”2002 年国际信息会议论文集。Vol.3。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

安藤 一秋其他文献

子供向け日本語換言コーパス構築のための文間類似度計算法の評価
儿童日语释义语料库构建的句间相似度计算方法评价
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西山 朋貴;安藤 一秋
  • 通讯作者:
    安藤 一秋
Webニュースからの課題作成支援に向けたNIEワークシートの分析
分析 NIE 工作表以支持从网络新闻创建作业
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西山 朋貴;安藤 一秋;國方 海秀,安藤 一秋
  • 通讯作者:
    國方 海秀,安藤 一秋
Google Web APIs を利用した英文作成支援ツール
使用 Google Web API 的英语写作支持工具
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    綱嶋 祐一;安藤 一秋
  • 通讯作者:
    安藤 一秋

安藤 一秋的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('安藤 一秋', 18)}}的其他基金

NIEを実践する小学校教師のためのNIEワークシート用の記事選択と問題検討の支援
支持小学教师练习 NIE 的 NIE 工作表的文章选择和问题考虑
  • 批准号:
    22K12294
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
WWWと自然言語処理技術・資源を活用した英文作成支援ツールの構築
利用WWW和自然语言处理技术/资源构建英语写作支持工具
  • 批准号:
    16700562
  • 财政年份:
    2004
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
効率的な多属性情報検索アルゴリズムの考案と応用
高效多属性信息检索算法的开发与应用
  • 批准号:
    98J01348
  • 财政年份:
    1998
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

談話構造を用いた教師なし文書要約生成
使用话语结构的无监督文档摘要生成
  • 批准号:
    20J10726
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
主観的な情報要求を反映した複数文書要約の自動評価に関する研究
反映主观信息请求的多文档摘要自动评价研究
  • 批准号:
    18700241
  • 财政年份:
    2006
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了