既存の電子化辞書と新聞記事コーパスを用いた並列知識獲得法の研究

利用现有电子词典和报纸文章语料库的并行知识获取方法研究

基本信息

  • 批准号:
    07780336
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

本年度は、次のことを行った。1.新聞記事コーパスと大規模な概念辞書を利用した単語の類似度計算法の開発2.上記手法を用いた格フレーム獲得システムの開発3.既存の格フレームを利用した格フレーム要素獲得システムの開発4.獲得した格フレームを評価するための並列構文解析システムの開発昨年度から続けている単語の類似度計算法についての改良と、それを利用した格フレーム獲得法の提案、ならびに、そのシステム開発を行った。この手法は、新聞記事などの電子化された文書データから、単文の集合を抽出し、それから文の類似度を計算し、ある閾値を超えて類似していると判定された文を、同じ集合に入れて分類する。そして、その集合を代表する構造を、格フレームとするものである。ある文1と文2の類似性を計算するために、それぞれの文中の対応する格要素間の類似度を概念辞書とコーパスから獲得したデータを利用して計算するが、この時、20万文以上の規模を持つ品詞や概念識別などが人手で付けられたEDRコーパスと、多数の人間が開発に関わって作成された40万概念以上の規模を持つEDR概念辞書を利用した。しかし、この規模でさえ、実際の解析において利用した文の解析に必要となる知識をカバーできず、それゆえ、解析精度が50〜60%程度にしかならないことが分かった。特に、慣用表現や抽象的な表現に対して解析が失敗する傾向があり、これらを知識に表すことの難しさからあらためて認識できた。上記の手法で利用した単文は、格要素が名詞単体+助詞の構造を持つもので、かつ、動詞が文の最後に来るもの(つまり、動詞が支配する格要素への連体修飾などを含まない文)であり、また、同じ名詞を含まないものに限っていたため、実際の文章中から抽出できる実験に使用する単文は、基となる文章の量に比べて非常に少なくなった。そのため、現在、格要素が複合名詞や、文や句を含む形のものや、連体修飾形を含む形、受身や使役形を扱って単文を抽出するシステムを開発するとともに、獲得した単文から、意味ネットワークを自動構成する方法も同時に開発している。
This year's annual meeting will be held in the first half of this year. 1. The new chronicle is based on the concept of large-scale modeling, which is based on the analogous algorithm of mathematical analogy. With the help of the above maneuver, you can get a good start by using the above method. The existing system makes use of the key elements of the system to obtain the opening of the information system 4. It is necessary to improve the performance of the algorithm in the last year, and to make use of the information to improve the algorithm in the last year. The method, the new record, the text, the text, the text. The collection of information represents the creation of information, and the collection of information represents the creation of information. Text 1, text 2, similarity calculation, document similarity calculation, similarity calculation, Most people use the EDR concept language to make use of the language above the 400000 concept. In this paper, we use the language to analyze the necessary knowledge and accuracy of 50%, 60% and 60% of the accuracy. In this way, you can use the abstract representation of the table to analyze the failure to know that you are not aware of your knowledge. In the last part of the book, the last word of the text is controlled by the last word of the text, the name of the text, the style of the grid, the name of the text, the name, the name, the The number of articles is much less than the number of articles. The current, current, grid elements are duplicated by the name, the text contains the shape, the link modifies the shape, and the body is used to cause the service to open the system, which means that the automatic implementation method is implemented at the same time.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Mine: "A Case Frame Acquisition Method with Electronic Dictionaries" RWC Technical Report(TR-95001). 1. 39-40 (1995)
T.Mine:“一种带有电子词典的案例框架采集方法”RWC技术报告(TR-95001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
実成他: "動詞の格フレーム要素の自動獲得法" 情報処理学会九州支部研究集会論文集. 1-10 (1995)
Jitsunari等:“动词格框架要素的自动获取方法”日本信息处理学会九州分会研究会议论文集1-10(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
峯他: "動詞語義の分類法" EDR電子化辞書利用シンポジウム論文集. 1. 89-96 (1995)
Mine 等人:“动词含义分类”EDR 电子词典利用研讨会论文集 1. 89-96 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中山他: "EDRコーパスを利用した動詞の語義分類" 電子情報通信学会「言語理解とコミュニケーション研究会」研究報告. 95-321. 23-30 (1995)
Nakayama 等人:“使用 EDR 语料库进行动词语义分类”IEICE“语言理解和交流研究组”研究报告 95-321(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

峯 恒憲其他文献

立ち直り支援をめぐる二つの隘路と矯正施設のリフレクティング
围绕康复支持和惩教设施反思的两个瓶颈
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小西宏樹;川谷卓哉;峯 恒憲;石原孝二;矢原隆行
  • 通讯作者:
    矢原隆行
Rubric-based Automated Japanese Short-answer Scoring and Support System Applied to QALab-3
基于Rubric的自动日语简答评分和支持系统应用于QALab-3
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    長井 孝幸;新谷 一朗;峯 恒憲;Tsunenori Ishioka and Kohei Yamaguchi and Tsunenori Mine
  • 通讯作者:
    Tsunenori Ishioka and Kohei Yamaguchi and Tsunenori Mine
機械学習モデル構築のためのデータ・処理共有フレームワークの提案,
提出用于构建机器学习模型的数据/处理共享框架,
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小西宏樹;川谷卓哉;峯 恒憲
  • 通讯作者:
    峯 恒憲
マルチエージェントシステムのための基盤ネットワーク構成手法
多Agent系统的基本网络配置方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 功作;雨宮 聡史;峯 恒憲;雨宮 真人
  • 通讯作者:
    雨宮 真人
路線バスプローブデータ解析によるバス遅延状況の調査と遅延要因の検討,
通过公交车探针数据分析调查公交车延误状况并研究延误原因,
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川谷 卓哉;峯 恒憲
  • 通讯作者:
    峯 恒憲

峯 恒憲的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('峯 恒憲', 18)}}的其他基金

定性的・定量的学習記録の組合わせ分析に基づく学習特性改善に関する研究
基于定性和定量学习记录结合分析的学习特征改善研究
  • 批准号:
    23K20734
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
大規模な人の位置情報とSNS情報に基づく地域イベント特定に向けたオントロジ―学習
基于大规模人物位置信息和SNS信息的局部事件识别的本体学习
  • 批准号:
    22KF0288
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
定性的・定量的学習記録の組合わせ分析に基づく学習特性改善に関する研究
基于定性和定量学习记录结合分析的学习特征改善研究
  • 批准号:
    21H00907
  • 财政年份:
    2021
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
電子メールでの質問・感想メッセージに対する自動応答システムに関する研究
通过电子邮件发送的问题和感想自动回复系统的研究
  • 批准号:
    13780291
  • 财政年份:
    2001
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
対話知識の共有・再利用化を考慮した日本語質問応答システムに関する研究
考虑对话知识共享与重用的日语问答系统研究
  • 批准号:
    11780281
  • 财政年份:
    1999
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書検索機能を持つ日本語質問応答システムの開発に関する研究
具有文档搜索功能的日语问答系统的开发研究
  • 批准号:
    09780347
  • 财政年份:
    1997
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
格情報を利用した並列意味解析法に関する研究
利用案例信息的并行语义分析研究
  • 批准号:
    06780329
  • 财政年份:
    1994
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了