Development of Data Mining Resources for Knowledge Discovery of Pre-Modern Japanese Concepts
开发用于前现代日本概念知识发现的数据挖掘资源
基本信息
- 批准号:16200018
- 负责人:
- 金额:$ 25.46万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We constructed the full text data of Chi part of Kojiruien (4,200 pages) attaching XML tags. The fourth proofed complete text data of volume I of Chi part is available with extended characters and the conversion table to Unicode. The volume II and III revised second and first, respectively ; besides, we digitized Kuzushi-ji yoorei jiten (Tokyodo Shoten), the standard dictionary for reading historical documents, to complement pre-modern terms.We developed a web-based system to browse Ten part text of Kojiruien and the full page images of whole Kojiruien (67,000 pages) with linking Kojiruien index (42,000 terms) and its phonetic index (64,000 entries). Through our research, electric information of basic pre-modern terms was developed. The Kojiruien index was converted into a thesaurus dictionary; we uploaded the thesaurus and a dictionary usable for Japanese morphological analysis to the website of our project. The web-based system of Kojiruien full text and page images are also opened at the International Research Center for Japanese Studies and the National Institute for Japanese Literature. In addition, we developed a Wiki-based prototype system and conducted a feasibility study of its effectiveness.As a case study of data mining for the Humanities, we conducted a data mining study to Renga Haikai database of the International Research Center for Japanese Studies. Through the investigation, we generated a collocation dictionary of pre-modern terms; by using the dictionary, we were successfully extracted a new finding on transition of hototogisu image in renga. Finally, we published the collocation dictionary of renga.
我们构建了附加XML标签的Kojiruien的Chi部分的全文数据(4,200页)。第四次校对的第一卷《赤》部分的全文数据可提供扩展字符和Unicode转换表。第二卷和第三卷分别经第二次和第一次修订;另外,我们把血之寺与光之天数字化了,(Tokyodo Shoten),用于阅读历史文献的标准词典,以补充前现代术语。我们开发了一个基于Web的系统,可以浏览Kojiruien的十部分文本和整个Kojiruien的整页图像(67,000页),链接Kojiruien索引(42,000个术语)和语音索引(64,000个条目)。通过我们的研究,开发了基本的前现代术语的电子信息。Kojiruien索引被转换为同义词词典;我们将同义词词典和可用于日语形态分析的词典上传到我们项目的网站。国际日本研究中心和国立日本文学研究所也开设了基于网络的Kojiruien全文和页面图像系统。此外,我们还开发了一个基于维基百科的原型系统,并对其有效性进行了可行性研究。作为人文学科数据挖掘的案例研究,我们对国际日本研究中心的莲贺海开数据库进行了数据挖掘研究。通过调查,我们生成了一个前现代术语的搭配词典,利用该词典,我们成功地提取了一个新的发现,即连贺中的光符符图像的转换。最后,我们出版了《仁加搭配词典》。
项目成果
期刊论文数量(42)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
"Mizu" to "mizuho" no onntorojii : "Mizuho" to "mizuho" no senkoo ishiki
“Mizu”到“mizuho”no onntorojii : “Mizuho”到“mizuho”no senkoo ishiki
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:M.Nishida;T.Kawahara;Mitsuru Aida
- 通讯作者:Mitsuru Aida
目録データベースの高次化によるデータマイニングを可能とするために-複数種のオントロジ辞書の利用・接合により検索効率の向上を試みる-
通过提高目录数据库的层次来实现数据挖掘 - 尝试通过使用和组合多种类型的本体词典来提高搜索效率 -
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:Hironori AOKI;Masaru UEDA;Takashi TOMII;相田 満
- 通讯作者:相田 満
Kojiruien (Ten-bu, Chi-bu) no zenbun nyuuryoku to Wiki ban no shikoo : Zen kindai no bunka gainen no zyoohoo shigenka
Kojiruien (Ten-bu, Chi-bu) no zenbun nyuuryoku to Wiki ban no shikoo : Zen kindai no nationka Gainen no zyoohoo shigenka
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Shoji Yamada;Monta Hayakawa;Mitsuru Aida
- 通讯作者:Mitsuru Aida
Haikai Renga DB yori chuushutsu shita rensoogoi nettwaaku no kaiseki.
Haikai Renga DB yori chuushutsushita rensoogoi nettwaaku no kaiseki。
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Shigeki Iwai;Shoji Yamada
- 通讯作者:Shoji Yamada
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
YAMADA Shoji其他文献
YAMADA Shoji的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('YAMADA Shoji', 18)}}的其他基金
Different effects of enantiomers of beta2-adrenergic agonist on muscle and bone.
β2-肾上腺素能激动剂对映体对肌肉和骨骼的不同影响。
- 批准号:
22592077 - 财政年份:2010
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Infrastructure Development for Historical Time-spatial Data Mning to Modern Japan
近代日本历史时空数据挖掘基础设施建设
- 批准号:
19200019 - 财政年份:2007
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Effect of VEGF's on osteockast formation and activation
VEGF 对骨细胞形成和激活的影响
- 批准号:
13671950 - 财政年份:2001
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Developing a Historical Document Analysis System Using Hand-written OCR Techomology
使用手写 OCR 技术开发历史文档分析系统
- 批准号:
11558045 - 财政年份:1999
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Knowlaedge information analysis of Historical Document Understanding
历史文献理解的知识信息分析
- 批准号:
11480082 - 财政年份:1999
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Effect of CFS-1 on osteoclast and its precursor cells
CFS-1对破骨细胞及其前体细胞的影响
- 批准号:
07672028 - 财政年份:1995
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A development of repetitious mechanical stress loading system for cultured cells.
培养细胞重复机械应力加载系统的开发。
- 批准号:
03557078 - 财政年份:1991
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Developmental Scientific Research (B)
Improvement of Characteristics of Complementary Elactrochromic Devices by the Use of Various Transition-Metal-Oxide Films
使用各种过渡金属氧化物薄膜改善互补电致变色器件的特性
- 批准号:
01550010 - 财政年份:1989
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
Basic research for sharing of "Kojiruien" and analysis of modern classical science
“小地灵园”共享的基础研究和现代古典科学的解析
- 批准号:
19K21640 - 财政年份:2019
- 资助金额:
$ 25.46万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)