語義の曖昧性解消に基づく文書の自動分類とその分類名の自動生成

基于词义消歧的文档自动分类及分类名称自动生成

基本信息

  • 批准号:
    09780322
  • 负责人:
  • 金额:
    $ 1.47万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の自動分類に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである.・多義解消の精度を挙げるため,教師なし学習のアルゴリズムを適用することで動詞の意味を特徴付ける共起関係を自動的に抽出する手法を提案した(論文1参照)・従来より提案されている文書の自動分類の研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソーラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文2,3参照).実験では,78個の分野に属するWall Street Journal 4,453の文書に対し,Lewisらによって提案されたProportional assignment strategyによるBreakeven Pointsで0.75の正解率が得られた(論文2参照).
This study is based on the semantic ambiguity of the results of the interpretation of the interpretation of the results of the interpretation of the information on the application of the division. Specific documents and automatic classification of related proposals. This study focuses on the following characteristics of the differences in research: The precision of polysemy elimination is the most important factor in teacher's learning, and the method of automatic extraction of verb's meaning is the most important factor in teacher's learning.(a) The precision of polysemy elimination is the most important factor in teacher's learning, and the method of automatic extraction of verb's meaning is the most important factor in teacher's learning.(b) The frequency of polysemy elimination is the most important factor in teacher's learning.(c) Use of the information in the message. (a)(b) the accuracy of the inverse,(c) the problem of the inverse. In this study, we extract the important words of the document from the problem (see Papers 2 and 3). In fact, 78 of them belong to the Wall Street Journal 4,453, and the Breakeven Points of 0.75 are obtained from Lewis 'proposal for Proportional assignment strategy (refer to Paper 2).

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
福本文代,福本淳一,鈴木良弥: "“文脈依存の度合に基づくパラグラフの抽出"" 自然言語処理,言語処理学会. 4・2. 89-110 (1997)
Fumiyo Fukumoto、Junichi Fukumoto、Yoshiya Suzuki:“‘基于上下文依赖程度的段落提取’”自然语言处理,日本语言处理学会 4・2(1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
福本文代,鈴木良弥: "類推に基づく語の重み付け学習を用いた動詞の多義解消" 情報処理学会論文誌. 39,12. 3187-3199 (1998)
Fumiyo Fukumoto、Yoshiya Suzuki:“使用基于类比的单词加权学习来解决动词歧义”,日本信息处理学会杂志,39, 12. 3187-3199 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
福本文代,鈴木良弥: "語の重み付け学習を用いた文書の自動分類" 情報処理学会論文誌 採録決定,. (1999)
Fumiyo Fukumoto、Yoshiya Suzuki:“使用单词加权学习对文档进行自动分类”日本信息处理学会期刊录用决定,(1999 年)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
F.Fukumoto Y.Suzuki: "′An Empirical Approach to Text Categorization based on Term weight Learning′" Proc.of the 3rd Empirical Method in Natural Language Processing. 71-79 (1998)
F.Fukumoto Y.Suzuki:“基于术语权重学习的文本分类的经验方法”,第三届自然语言处理经验方法 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
F.Fukumoto, Y.Suzuki and J.Fukumoto: "“An Automatic Extracrion of Key Paragraph Based on Context Dependency"" 5th Applied Natural Language Processing(ANLP'97). 291-298 (1997)
F.Fukumoto、Y.Suzuki 和 J.Fukumoto:“基于上下文依赖性的关键段落自动提取”第 5 届应用自然语言处理(ANLP97)。291-298 (1997)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

福本 文代其他文献

知的情報検索のための大規模言語データの利用
利用大规模语言数据进行智能信息检索
witterを用いた絵文字の感性と感情ラベル付与
使用 witter 对表情符号进行敏感度和情感标记
否定の焦点コーパスの構築と自動検出器の試作
否定焦点语料库构建及原型自动检测器
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大槻諒;松吉俊;福本 文代
  • 通讯作者:
    福本 文代
距離学習に基づくリフレーミング辞書の構築
基于远程学习的重构词典的构建
音声想起時脳波(EEG)の音素認識に関する検討
语音回忆过程中利用脑电图(EEG)进行音素识别的研究
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    李 紀飛;郷 健太郎;木下 雄一朗;李 吉屹;福本 文代;山尾 元陽,入部 百合絵,田口 亮,桂田 浩一,新田 恒雄
  • 通讯作者:
    山尾 元陽,入部 百合絵,田口 亮,桂田 浩一,新田 恒雄

福本 文代的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('福本 文代', 18)}}的其他基金

分野依存語義,及びテキストの首尾一貫性に基づく暗黙的情動モデルの構築
基于场相关词义和文本连贯性的内隐情感模型构建
  • 批准号:
    24K15085
  • 财政年份:
    2024
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Multi-label short text classification based on domain specific-senses and its relation
基于领域特定意义的多标签短文本分类及其关系
  • 批准号:
    21K12026
  • 财政年份:
    2021
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コーパスに基づく語義の曖昧さ解消とテキスト要約への適用
基于语料库的词语消歧及其在文本摘要中的应用
  • 批准号:
    11780258
  • 财政年份:
    1999
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
辞書の語義文を利用したコーパスの自動細分類と文の対象分野同定への応用
利用词典中的意义句子对语料库进行自动子分类及其在句子目标领域识别中的应用
  • 批准号:
    08780342
  • 财政年份:
    1996
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
コーパスに基づく自然言語の曖昧性解消に関する研究
基于语料库的自然语言消歧研究
  • 批准号:
    07780312
  • 财政年份:
    1995
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了