言語データを用いた自然言語処理用シソ-ラスの自動構築に関する研究

利用语言数据自动构建自然语言处理词库的研究

基本信息

  • 批准号:
    06780301
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

シソ-ラスとは語あるいは概念を体系的に分類した意味分類のひとつであり,自然言語処理に用いる知識のなかでも重要なものである.従来,自然言語処理で用いられてきたシソ-ラスは人手で作られたものであり,収録されている語数も数万のものがほとんどである.人手でシソ-ラルを作成するには以下のような欠点がある.・作成コストが大きい・作成者の主観に影響される・大規模なものを作成するのが困難である最近,計算機を用いてこのようなシソ-ラスを自動的に構築する研究が注目を浴びてきており,大規模コーパスの整備にともない.次第に成果をあげてきている.計算機を用いる従来のシソ-ラス構築法として,名詞-動詞の共起データを用いる研究がなされてきた.しかし,この方法では,名詞と動詞の格の関係を考慮にいれていない.そこで本研究では,「名詞-格助詞-動詞」の共起データ(格助詞としてヲ,ニ,ガ,デの4つ)からなるコーパスから,動詞のベクトルの近さに基づく階層ベイジアン・クラスタリングをおこない,名詞シソ-ラスを自動構築した.その際、従来の手法に加え,助詞の格の違いを考慮にいれ,助詞の格ごとにシソ-ラスを作成する手法を提案した.実験の結果,格ごとにシソ-ラスを構築した方が格を考慮しない場合に比べて高い精度が得られることが明らかになり,本手法の有効性を示すことができた.また,名詞のクラスタリングをおこなうさいに,動詞を既存の動詞シソ-ラスの意味分類と置き換えることによって,クラスタリングの計算量をおさえる手法を考え,その有効性を検討した.実験では動詞シソ-ラスとしては分類語彙表を用いた.実験の結果,あらかじめ動詞をまとめることによって,出来上がるシソ-ラスの精度をあまり下げずに計算量を大幅に減らせることを示すことができた.
The classification of conceptual systems, the classification of meaning, the use of knowledge in natural speech processing. In the future, natural speech processing will be used to record tens of thousands of words. The following is a summary of the results of the survey: Recently, computers have been used for research on automatic construction of large-scale computer systems, and large-scale computer systems have been developed. The next step is to make sure that you're okay with it. Computer applications include the construction of systems and systems, and the study of the common use of nouns and verbs. The relationship between noun and verb is considered. In this study, we found that the initial words of "noun-case auxiliary-verb"(case auxiliary words,, 4) were automatically constructed. In addition to the above, the method of creating the auxiliary word is proposed. As a result of this, the method is effective in constructing a simple structure, taking into account the high accuracy of the method in the case where the method is effective in the case where the method is effective. The classification of the meaning of the existing verb, the transformation of the meaning of the noun, the calculation of the meaning of the verb, the method of the calculation of the meaning of the noun, the method of the calculation of the meaning of the verb. The verb As a result, the verb is greatly reduced.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

徳永 健伸其他文献

日本語空間名詞の分類
日语空间名词的分类

徳永 健伸的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('徳永 健伸', 18)}}的其他基金

コンピュータとの対話による言語学習者の生産語彙能力評定の自動化
通过与计算机交互自动评估语言学习者的生产性词汇技能
  • 批准号:
    21K18358
  • 财政年份:
    2021
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
関連する複数のテキストを対象とした要約生成技術に関する研究
多相关文本摘要生成技术研究
  • 批准号:
    09480062
  • 财政年份:
    1997
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
新聞記事の要約のためのテンプレートの自動抽出に関する研究
报纸文章摘要模板自动提取研究
  • 批准号:
    08780336
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
確率理論に基づく文書の自動分類に関する研究
基于概率论的文档自动分类研究
  • 批准号:
    07780309
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
推敲を考慮した自然言語生成のための文法の形式化に関する研究
考虑阐述的自然语言生成语法形式化研究
  • 批准号:
    05780280
  • 财政年份:
    1993
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
推敲に基づく日本語生成に関する研究
基于精化的日语生成研究
  • 批准号:
    03750264
  • 财政年份:
    1991
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
高品質機械翻訳のための日本語文生成に関する研究
高质量机器翻译的日语句子生成研究
  • 批准号:
    02750253
  • 财政年份:
    1990
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ディジタル図書館における連想型シソ-ラスの構築
数字图书馆联想词库的构建
  • 批准号:
    08780389
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
国語辞典を用いた動詞のシソ-ラスの作成
使用日语词典创建动词同义词库
  • 批准号:
    01633522
  • 财政年份:
    1989
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了