On the Chinese Character Full-text Retrieval System by WWW and its Implementation
论WWW汉字全文检索系统及其实现
基本信息
- 批准号:09610372
- 负责人:
- 金额:$ 1.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The aim of our study is to construct and make publicly available a Chinese character full-text retrieval system by using a personal computer with workstation and Windows environment. The documents employed in the study are : the Ryukyu Kahu Texts (Ryukyu Genealogy) (a private family document made by the Ryukyu government and an important record to study the structure and characters of the Ryukyu Kingdom) ; the Ryukyu-koku Hyojo-sho Monjo texts (The Ryukyu Kingdom Official Documents) (the documents made at the Hyojo-sho, the Ryukyu government supreme office for political and diplomatic decisions) ; the Oshima Hikkl and related Chinese documents.The following points were considered in constructing the database :1. The construction of Chinese character full-text database and the image input of the original texts ;2. The correlation of the text retrieval function (including KWIC display) and the image display function ;3. The implementation of the non-standard character (gaiji) input funct … More ion using the non-standard character input method (parts of Chinese characters and specific tags) and the character-string retrieval function ;4. The use of non-standard character font using e-Character (Unicode, 673 characters ; provided by Professor Tetsuya Katsumura, Institute for Research in Humanities, Kyoto University), and the creation of non-standard characters(288 characters) from parts of Chinese characters ;5. The construction of a database of non-standard character attributes (radicals, the number of strokes of a radical, the total number of strokes of a character, Unicode number, Dai-kanwa code number, Chinese pronunciation of a character, etc) ;6. The publication of a Chinese character full-text retrieval system on the internet, and the distribution of the database of non-standard character attributes and the non-standard character fonts (Gif form file) using the FTP function ;7. The storage and analysis of log files of a retrieval word and the implementation of various forms of statistical processing of documents.The results of this study are accessible on the internet in the form of our text database and the image database of historical materials (URL : http : //www. okinawa. oiu. ac. jp/) Less
本研究的目的是在工作站和Windows环境下的个人计算机上构建并公开提供一个中文全文检索系统。研究中使用的文献有:《琉球家谱》(琉球政府制作的私人家谱,是研究琉球王国结构和特征的重要记录);《琉球国孝宗文字稿》(在琉球政府的政治外交最高机关孝宗所制作的文件);大岛群岛及相关中文文件。在构建数据库时考虑了以下几点:1 .汉字全文数据库的构建及原文的图像输入;2 .文本检索功能(包括KWIC显示)与图像显示功能的相关性;3 .非标准字符(汉字)输入功能的实现,更多的使用了非标准字符输入法(部分汉字和特定标签)和字符串检索功能;4 .使用e-Character的非标准字符字体(Unicode, 673个字符;由京都大学人文研究所胜村哲也教授提供),以及从汉字的部分创建非标准字符(288个字符);5 .非标准字符属性(部首、部首笔画数、字符总笔画数、Unicode码、大字码、汉字汉字读音等)数据库的建设;6 .在互联网上发布了一个中文全文检索系统,利用FTP功能分发非标准字符属性数据库和非标准字符字体(Gif格式文件);对检索词的日志文件进行存储和分析,并对文档进行各种形式的统计处理。本研究的结果可在互联网上以我们的文本数据库和历史资料图像数据库(URL: http: //www)的形式获得。冲绳。oiu。ac. jp/)更少
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
桶谷 猪久夫: "歴史.史料検索システムにおける外字処理" 情報処理学会研究報告. Vo1.98 No.73. 55-62 (1998)
Ikuo Oketani:“历史资料检索系统中的历史字符处理”日本信息处理学会研究报告Vo1.98 No.73(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岩崎宏之・桶谷猪久夫他: "重点領域研究「沖縄の歴史情報」の課題と研究成果" 情報処理学会研究報告. Vo1.98 No.97. 65-72 (1998)
Hiroyuki Iwasaki、Ikuo Oketani等人:“优先领域研究‘冲绳的历史信息’的问题和研究结果”日本信息处理学会研究报告Vo1.98 No.97(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Ikuo Oketani: "On the Processing of the Non-Standard Characters in the Historical Document Retrieval System" Information Processing Society of Japan The Special Interest Groups of Computer and Humanities. Vol.98, No.73. 55-62 (1998)
Ikuo Oketani:《论历史文献检索系统中非标准字符的处理》日本信息处理学会计算机和人文学科特别兴趣小组。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
桶谷猪久夫: "WWWによる文書検索システムの実現法" 大阪国際女子大学紀要. 23号-1. 83-97 (1997)
Ikuo Oketani:“使用WWW实现文档检索系统的方法”大阪国际女子大学公告第23-1号(1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Ikuo Oketani: "The Ryukyu-related Document Retrieval System using the Internet" The Bulletin of Osaka International University for Women. No.24-1. 105-124 (1998)
Ikuo Oketani:“利用互联网的琉球相关文献检索系统”大阪国际女子大学学报。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
OKETANI Ikuo其他文献
OKETANI Ikuo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('OKETANI Ikuo', 18)}}的其他基金
A study of the Design and the Construction of the Full Text Coordinated Retrieval System of Japanese Historical Resources using Web
日本历史资源Web全文协同检索系统的设计与构建研究
- 批准号:
15320090 - 财政年份:2003
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
On the Implementation of an Internet-based Retrieval system in Oriental Historical Documents and the processing of Non-Standard Characters
论东方历史文献网络检索系统的实现及非规范字符的处理
- 批准号:
11551008 - 财政年份:1999
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)