オブジェクト指向設計による木版刷チベット文献のイメージ文字自動認識に関する研究

面向对象设计的木版印刷藏文文献图像字符自动识别研究

基本信息

  • 批准号:
    10111220
  • 负责人:
  • 金额:
    $ 0.45万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

本研究で認識対象として用いた文献は東北大学中央図書館に保存しているデルゲ版木版刷チベット文献である。これらの木版刷文献の多くは幅10cm程度で、長さはおよそ35cmから45cmと、A3版より長い文献献(Pecha Paper)である。このような文献をA3版のスキャナに置ける大きさまで縮小した文献上にチベット学研究者に1音節文字ごとにカラーの区切り線を挿入していただいた。この作業は、チベット文献を見ながら表音文字へ変換し、それをキーボードから入力する手間に比較すると、大変容易な作業であることが分かった。そこで、チベット学研究者らが挿入したその区切り線をコンピュータにより自動識別し1音節イメージ文字の生成実験を行い、当初の目標である95%程度の生成率を得ることに成功した。失敗した5%は、ほとんどが上下行からの繋がり文字である。このようにして生成されたオブジェクトイメージ文字の重ね合わせ法による認識実験を行うためには、同じ文字サイズに正規化する必要がある。1音節文字は子音1文字から4文字から構成されており、1文学から4文字までの文字幅情報に認識文字のクラス分けを試みた。1から4のクラスに、はっきりとクラス分けすことは出来なかったが、2、3のクラス分けが可能となった。また、切り出し時からの文字特徴情報をそれぞれ継承して属性として持たせるための文字特徴情報抽出を行った。辞書文字を作成した文字による認識実験(クローズ実験)では90%台の認識率を得ることができた。実用とするためには、オープン実験が重要であり、引き続いてオープン実験を現在、行っている。本研究の特徴は、文献文字の切り出しから認識実験までをオブジェクト指向設計法で一貫して行っている点である。本手法により、チベット学者らにとって、真に有効な木版刷チベット文献の文字認識システムの構築が可能となった。
This study is aimed at understanding the use of Chinese literature in the Central Library of Tohoku University. The width of the Paper is 10cm, the length is 35cm, the A3 edition is 45cm, and the paper is long. This article is published in the A3 edition of the Chinese Academy of Sciences. This work is easy to do. For example, if you want to create a text, you need to create a text that is automatically recognized by the researchers. Failure 5% It is necessary to formalize the same text service in order to realize the practical understanding of the six methods of combining the generated. 1 syllable characters 1 consonant characters 4 characters composition 1 literature 4 characters width information to recognize characters and try 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 10, 11, 12, 13, 14, 15, 16, 18, 19, 10, 11, 10, 12, 10, 11, 12, 10, 1 The text feature information is extracted from the text feature information. The dictionary text is created to understand the text, and the recognition rate is 90%. This is the first time I've ever seen you. The characteristics of this study are: the text of the literature is cut out from the understanding, the design method is pointed out, and the design method is consistent. This method is very useful for scholars to understand the characters of documents.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Masami Kojima et al.: "Automatic Tibetan Script Recognition by Computer" 7th Seminar of the International Association for Tibetan Studies. Volume1. 527-533 (1997)
小岛正美等:“计算机自动藏文识别”国际藏学学会第七届研讨会。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小島正美 他: "コンピュータによるチベット文献の自動認識" 日本西蔵学会々報. 43号. 31-38 (1998)
Masami Kojima 等:“计算机自动识别藏文文献”日本斋藏学会公报第 43 期 31-38(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Masami Kojima et al.: "Automatic Recognition of Tibetan Buddhist Text by Computer" 1999 EBTI,ECAI,SEER&PNC Joint Meeting. 予定 (1999)
Masami Kojima 等人:“计算机自动识别藏传佛教文本”1999 年 EBTI、ECAI、SEER&PNC 联合会议(1999 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小島 正美其他文献

地理情報システム(GIS)を用いた石川県における地域包括ケアシステムの実現可能性の検討
利用地理信息系统 (GIS) 检查石川县综合区域护理系统的可行性
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚本 陽子;中井 寿雄;小島 正美;寺西 敬子;山崎 智里;板谷 智也
  • 通讯作者:
    板谷 智也

小島 正美的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('小島 正美', 18)}}的其他基金

オブジェクト指向設計による木版刷チベット文献のイメージ文字自動認識に関する研究
面向对象设计的木版印刷藏文文献图像字符自动识别研究
  • 批准号:
    09204224
  • 财政年份:
    1997
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
オブジェクト指向設計による木版刷チベット文献の文字自動認識に関する研究
面向对象设计的木刻藏文文字自动识别研究
  • 批准号:
    07207222
  • 财政年份:
    1995
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
水晶体層間解析法による水晶体中生化学物質の分布研究
晶状体层间分析法研究晶状体中生化物质的分布
  • 批准号:
    03857233
  • 财政年份:
    1991
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
水晶体前皮質部の形態学的研究
晶状体前皮质的形态学研究
  • 批准号:
    63771424
  • 财政年份:
    1988
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
実験的糖白内障眼へのAldose Reductase阻害剤の眼内移行動態の研究
醛糖还原酶抑制剂在实验性糖性白内障眼内转运动力学研究
  • 批准号:
    62771398
  • 财政年份:
    1987
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

HERDS - Horse Domestication and Early Husbandry in Central Asian Steppes: Bone Remains to Document Uses and Breeding Practices in Pastoral Societies
牧群 - 中亚草原的马驯化和早期畜牧业:遗骨记录了牧区社会的使用和饲养实践
  • 批准号:
    EP/Y016521/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Fellowship
Interoperable applications suite to enhance European identity and document Security and fraud detection (EINSTEIN)
可互操作的应用程序套件可增强欧洲身份和文件安全以及欺诈检测 (EINSTEIN)
  • 批准号:
    10093453
  • 财政年份:
    2024
  • 资助金额:
    $ 0.45万
  • 项目类别:
    EU-Funded
Studies of speech, image and natural language processing for multimodal spoken document retrieval
多模态语音文档检索的语音、图像和自然语言处理研究
  • 批准号:
    23K11216
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research on Safe and Effective Methods to Document Feedback During Classroom Assessment
课堂评估过程中安全有效记录反馈的方法研究
  • 批准号:
    23K02088
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Grammatica of the same period when I finished the database of the old storehouse document of Shinobu Orikuchi and utilized the database
完成折口忍的旧仓库文献的数据库,活用该数据库的同时期的语法
  • 批准号:
    23K00319
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CRII:RI:Toward Socially-diverse Multi-document Summarization
CRII:RI:走向社会多元化的多文档摘要
  • 批准号:
    2246174
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Standard Grant
Genestorian: a web application to document and trace genetic modifications in model organism and cell line collections.
Genestorian:一个网络应用程序,用于记录和追踪模型生物和细胞系集合中的遗传修饰。
  • 批准号:
    EP/Y024591/1
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Fellowship
The Religious and Political Factors in the Process of 'Proclamation of Religious Tolerance for the Laos': An Analysis of the Sickles Document
《老挝宣布宗教宽容》过程中的宗教和政治因素:镰刀文件分析
  • 批准号:
    23K00071
  • 财政年份:
    2023
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Doctoral Dissertation Research: Biometric Identification Technologies and the Citizenship Document Validation Process
博士论文研究:生物识别技术和公民身份文件验证过程
  • 批准号:
    2149092
  • 财政年份:
    2022
  • 资助金额:
    $ 0.45万
  • 项目类别:
    Standard Grant
NHLBI GUIDANCE DOCUMENT SUPPORT
NHLBI 指导文件支持
  • 批准号:
    10881613
  • 财政年份:
    2022
  • 资助金额:
    $ 0.45万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了