ニュース文の話題識別とその続報記事の自動抽出

新闻文本主题识别及后续文章自动提取

基本信息

  • 批准号:
    11780257
  • 负责人:
  • 金额:
    $ 0.32万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

本研究では言語的な特徴や機械学習を用いて英語ニュースの話題識別とその続報記事の自動抽出を行った.具体的には代名詞の照応処理と機械学習の1手法であるSupport Vector Machinesを用いてニュース文の話題識別と続報記事の自動抽出を行った.本研究でアピールする点,特に関連する研究との差異に注目した特長は以下の通りである.●話題識別や続報記事の抽出にはキーワードの頻度を調べることが重要であることが知られている.しかし実際にはキーワードは2回目からは代名詞に置き換えられる場合が多い.今まで代名詞の照応処理結果を使って話題識別,続報記事の自動抽出を行った研究はあまりなかったが,本研究では代名詞処理の結果を利用した話題識別,続報記事の自動抽出手法を提案した(論文1参照).●Support Vector Machines(SVM)は文書分類などで高精度の結果を得る事ができる手法であり,文書分類の研究で利用され始めている.本研究では続報記事の自動抽出にSVMを適用する手法を提案した(論文2参照).SVMを利用することにより続報記事の自動抽出の精度が上がることを実験により確認した.
This study is based on machine learning of language and automatic topic recognition and recording in English. Automatic extraction of を行った. Specific には pronouns and processing and machine learning の1 technique であるSupport Vector Machines uses topic recognition to automatically extract lines from newspaper notes. The main points of this study are the key points of the study, the special relevance of the study, and the differences of attention. The specialty is the following: topic recognition, extraction of notes, and topic identification.ドのfrequencyを动べることがimportantであることが知られている.しかし実间にはキーワードは2 Chapter からは pronoun に Put きchange えられる occasion が多い. Today まで pronoun のphoto 応 processing results を っ て topic recognition, 続报记事のautomatically extracted を行った Research In this study, the results of pronoun processing and the use of topic recognition and the automatic extraction of newspaper notes are proposed in this study (see paper 1).●Support Vector Machines (SVM) is a high-precision method for document classification, a method for document classification, and a research method for document classification. Proposal for automatic extraction of SVM application techniques (refer to paper 2). SVM utilizationることにより続の Automatically extract the accuracy of the report and が上がることを実験によりconfirmation した.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Y.Suzuki, F.Fukumoto and Y.Sekiguchi: "Segmentation and Event Detection of News Stories using Term Weighting"Proc. of the Pacific Association for Computational Linguistics (PACLING'99). 149-154 (1999)
Y.Suzuki、F.Fukumoto 和 Y.Sekiguchi:“使用术语权重进行新闻报道的分割和事件检测”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Y.Suzuki, F.Fukumoto and Y.Sekiguchi: "Correlating TV News Stories with a Newswire Article"Recherche d'Informations Assistee par Ordinateur Content-Based Multimedia Information Access (RIAO2000). (to appear). (2000)
Y.Suzuki、F.Fukumoto 和 Y.Sekiguchi:“将电视新闻故事与新闻专线文章相关联”Recherche dInformations Assistee par Ordinateur Content-Based Multimedia Information Access (RIAO2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Y.Suzuki and Y.Sekiguchi: "Correlating Newswire Article with TV News Story using Features of TV News"International Conference on Artificial and Computational Intelligence For Decision, Control and Automation In Engineering and Industrial Applications (ACI
Y.Suzuki 和 Y.Sekiguchi:“利用电视新闻的特征将新闻专线文章与电视新闻报道相关联”工程和工业应用中的决策、控制和自动化人工智能和计算智能国际会议 (ACI)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 良弥其他文献

鈴木 良弥的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 良弥', 18)}}的其他基金

複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類
使用多种语言处理任务的基于数据增强方法的多标签文档分类
  • 批准号:
    22K12146
  • 财政年份:
    2022
  • 资助金额:
    $ 0.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了