大規模日本語コーパスに基づく確率的オントロジーの構築

基于大规模日语语料库的概率本体构建

基本信息

  • 批准号:
    18700138
  • 负责人:
  • 金额:
    $ 2.24万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2006
  • 资助国家:
    日本
  • 起止时间:
    2006 至 2007
  • 项目状态:
    已结题

项目摘要

本研究の目的は、大規模言語コーパスに基づく係り受け頻度データを用いて、確率的オントロジーを構築した。本研究で構築する、確率的オントロジーとは、概念によって形成されるカテゴリーの階層構造と、概念のカテゴリーへの帰属確率(概念が与えられたときのカテゴリーの条件付確率)を付与したものである。新聞10年分(1993年〜2002年)の形容詞-名詞、名詞-"が"-動詞、名詞-"に"-動詞、名詞-"を"-動詞の係り受け頻度データを用いて、名詞に関する確率的オントロジーを構築した。まず、毎日新聞コーパス10年分(1993年〜2002年)から、形容詞-名詞、名詞-動詞に関する係り受け頻度データを、CaboCha(工藤、松本2002)を用いて抽出した。次に、抽出した係り受け頻度データに対し、潜在クラスが介在し、単語A(形容詞または動詞)と単語N(名詞)が共起するという仮定に基づく言語統計解析(Kameya、Sato 2005)を用いて潜在クラスの推定を行った。各名詞をP(名詞|潜在クラス)という確率で表現し、これらの言語統計解析結果に対して、ソフトクラスタリングモデルであるRoseモデル(1990)を用いることで、各階層におけるカテゴリーのセントロイドを推定することで、名詞の確率的階層構造を作成した。また、下位カテゴリーのセントロイドの上位カテゴリーへの帰属確率を計算することで、上位カテゴリーへの下位カテゴリーの帰属確率を求めた。さらに、心理学実験を行うことで、構築した確率的階層構造の妥当性の検証を行った。
The purpose of this study is to construct a large-scale speech system based on frequency and accuracy. This study constructs the hierarchy structure of the concept and the conditional accuracy rate of the concept. News 10 years (1993 ~ 2002) Adjective-noun, noun-""-verb, noun-""-verb system, frequency of use, noun related accuracy of the construction of the page. Daily News 10 years (1993 - 2002), Adjective-noun, Noun-verb relationship, Frequency of reception, CaboCha(Kudo, Matsumoto 2002) Second, the extraction of the system is the frequency of the reception, the potential of the reception, the identification of the reception, the reception, the identification of the reception, the identification, the reception, the reception Each noun P(noun| The results of statistical analysis of speech are used to construct a hierarchical structure of the accuracy of nouns. To calculate the accuracy rate of the upper and lower levels of communication, In this paper, the psychology of the implementation of this, the construction of the accuracy of the hierarchical structure and the validity of the test.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A method for the construction of a probabilistic hierarchical structiire based on a statistical analysis of a large-scale corpus
一种基于大规模语料库统计分析的概率层次结构构建方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Asuka Terai;Bin Liu;Masanori Nakagawa
  • 通讯作者:
    Masanori Nakagawa
Construction of a Probabilistic Hierarchical Structure based on aJapanese Corpus and a Japanese Thesaurus
基于日语语料库和日语词库的概率层次结构构建
Hierarchical Probabilistic Categorization of Japanese Words
日语单词的层次概率分类
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Asuka Terai;Bin Liu;Masanori Nakagawa
  • 通讯作者:
    Masanori Nakagawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

寺井 あすか其他文献

特集「圏論は認知科学に貢献できるか」の編集にあたって
关于编辑专题《范畴论能为认知科学做出贡献吗?》
  • DOI:
    10.11225/cs.2020.076
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0.2
  • 作者:
    達児 高橋;美慕 布山;寺井 あすか
  • 通讯作者:
    寺井 あすか
PIC板で補強したRCはりの補強効果に関する実験及び解析的研究
PIC板加固RC梁加固效果试验与分析研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    寺井 あすか;近添 淳一;吉本 隆明;定藤 規弘;地村 弘二;永松牧子,出水享,鶴田健,岡本賢治,宮本紘貫,松田浩
  • 通讯作者:
    永松牧子,出水享,鶴田健,岡本賢治,宮本紘貫,松田浩
概念融合による特徴創発に関連する神経基盤 Dynamic Neural Mechanisms Associated with Feature Emergence in Conceptual Blending
与概念混合中特征出现相关的动态神经机制
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    寺井 あすか;近添 淳一;吉本 隆明;定藤 規弘;地村 弘二
  • 通讯作者:
    地村 弘二

寺井 あすか的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('寺井 あすか', 18)}}的其他基金

マルチモーダルな比喩的思考による創造性支援の可能性
通过多模式隐喻思维支持创造力的可能性
  • 批准号:
    24K15073
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了