Trial Construction of an Advanced Computer-readable Lexical Database Capable of Automatic Acquisition of Lexical Information

自动获取词汇信息的先进计算机可读词汇数据库的试建

基本信息

  • 批准号:
    07558274
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 1996
  • 项目状态:
    已结题

项目摘要

(1) Expansion of lexical data and classification of newspaper article data : Existing lexical data have been expanded using "Shin-Meikai Kokugo Jiten" (by Sanseido Publishing Co.) and EDR Electronic Dictionary (by Japan Electronic Dictionary Research Institute, Ltd.), and newspaper article data have been classified.(2) Determination of data structure for describing the semantic system : The data structure has been determined on the basis of the EDR Electronic Dictionary, and the data for the semantic system have been classified on a computer.(3) Design and implementation of the subsystem for automatic detection of unknown words : A program has been designed and implemented for the morphological and syntactic analysis of text, and for detecting unknown words.(4) Design and implementation of the subsystem for automatic inference on syntactic and semantic information of unknown words : The data structure has been determined and the program has been designed and implemented for the subsystem for automatic inference of systematic and semantic information of unknown words.(5) Implementation of the basic part of the advanced lexical database system and preliminary confirmation of its operation.(6) Determination of the detailed specifications for the lexical database system : A 40M byte main memory was adopted for the system.(7) Determination of the detailed specifications for the lexical data : The total numbern of lexical items are : 187,868 nouns, 645 pronouns, 10,620 verbs, 1,124 adjectives, 1,345 adverbs, and 144 others.(8) Construction of the advanced lexical database system : The system has been constructed using Arity/Prolog language, and currently occupies 142k bytes of memory.(9) Evaluation of the system : The performance of the system has been evaluated using the lexical data and the electronic texts from newspaper articles, and the results congirmed the basic validity of the current system.
(1)词汇数据的扩展和报纸文章数据的分类:已经使用“Shin-Meikai Kokugo Jiten”(由三生堂出版公司出版)扩展了现有的词汇数据。和EDR电子词典(由日本电子词典研究所有限公司提供),和报纸文章的数据都是保密的(2)确定描述语义系统的数据结构:数据结构是根据EDR电子词典确定的,语义系统的数据已在计算机上分类。(3)未登录词自动检测子系统的设计与实现:设计并实现了一个用于文本的词法和句法分析以及未登录词检测的程序。(4)未登录词句法语义信息自动推理子系统的设计与实现:确定了未登录词系统语义信息自动推理子系统的数据结构,设计并实现了未登录词系统语义信息自动推理子系统的程序。(5)高级词汇数据库系统基础部分的实现及其运行的初步验证。(6)词法数据库系统具体规格的确定:系统采用40 M字节内存。(7)词汇数据的详细规格确定:词汇项目总数为:名词187,868个,代词645个,动词10,620个,形容词1,124个,副词1,345个,其他144个。(8)高级词法数据库系统的构建:该系统采用Arity/Prolog语言构建,目前占用内存142 k字节。(9)系统评价:使用词汇数据和电子文本对系统进行了评价,结果证实了本系统的基本有效性。

项目成果

期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
KAMEDA,Hiroyuki, KUBOMURA,Chiaki and SAKURAI Tomoko: "Experimental Evaluation of Unknown Word Acquisition System" Proceedings of the 1996 Engineering Sciences Society Conference of IEICE. 326-327 (1996)
KAMEDA、Hiroyuki、KUBOMURA、Chiaki 和 SAKURAI Tomoko:“未知词获取系统的实验评估”IEICE 1996 年工程科学学会会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
亀田弘之: "高次辞書データベースのための語彙知識自動獲得システム" 公開シンポジウム「人文科学とデータベース」. 75-82 (1995)
Hiroyuki Kameda:“高级词典数据库的自动词汇知识获取系统”公共研讨会“人文与数据库”75-82(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
久保村千明: "未知語獲得アルゴリズムの評価" 電子情報通信学会技術研究報告. TL96-6. 21-30 (1996)
Chiaki Kubomura:“未知词获取算法的评估”IEICE 技术研究报告 TL96-6(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
藤崎博也: "キ-概念の抽出と未知語の処理に基づく情報検索方式の高度化" 情報処理学会第54回(平成9年前期)全国大会講演論文集. 3. 23-24 (1997)
Hiroya Fujisaki:“基于关键概念提取和未知词处理的信息检索方法的改进”日本信息处理学会第54届全国会议论文集(1997年上半年)3. 23-24(1997年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
KAMEDA,Hiroyuki: "Model of Thought Process in Unknown Word Acquisition by Machines" Technical Report of IEICE. TL95-10. 9-16 (1996)
KAMEDA、Hiroyuki:“机器未知词获取的思维过程模型”IEICE 技术报告。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

FUJISAKI Hiroya其他文献

FUJISAKI Hiroya的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('FUJISAKI Hiroya', 18)}}的其他基金

Automatic Estimation of Fundamental Frequency Contour Parameters and Automatic Acquisition of Generative rules
基频轮廓参数自动估计及生成规则自动获取
  • 批准号:
    11480090
  • 财政年份:
    1999
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B).
Construction of an Intelligent System for information Retrieval in an Environment of Information Network
信息网络环境下智能信息检索系统的构建
  • 批准号:
    09558041
  • 财政年份:
    1998
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A System for Rule Synthesis of Prosodic Features of Speech of Multiple Language Based on a Generative Model of Fundamental Frequency Contours
基于基频轮廓生成模型的多语言语音韵律特征规则综合系统
  • 批准号:
    08458090
  • 财政年份:
    1996
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
International Coordination of Speech Databases, Prosodic Labeling, and Speech Input/Output Systems Assessment
语音数据库、韵律标记和语音输入/输出系统评估的国际协调
  • 批准号:
    08044173
  • 财政年份:
    1996
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for international Scientific Research
International Standardization of Spoken Language Detabases
口语数据库国际标准化
  • 批准号:
    05044112
  • 财政年份:
    1993
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for international Scientific Research
Production of a Prototype Lexical Database Featuring High-speed, High-accuracy Access and Lexical Knowledge Acquisition
高速、高精度访问和词汇知识获取的原型词汇数据库的制作
  • 批准号:
    05558038
  • 财政年份:
    1993
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
A scheme for continuous speech recognition in a large context based on the human process of spoken language recognition
基于人类口语识别过程的大上下文连续语音识别方案
  • 批准号:
    03452164
  • 财政年份:
    1991
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Research on International Standardization of Spoken Language Database and Assessment Techniques for Speech Input/Output
口语数据库国际标准化及语音输入输出评估技术研究
  • 批准号:
    02044041
  • 财政年份:
    1990
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for international Scientific Research
Co-operative Research on Modeling of Language Acquisition and Concept Formation Process in Engineering
工程中语言习得和概念形成过程建模的合作研究
  • 批准号:
    01300004
  • 财政年份:
    1989
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
Research on Synthesis Method for Spoken Sentences from Knowledge Representation
知识表示的口语句子合成方法研究
  • 批准号:
    63420051
  • 财政年份:
    1988
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了