古・中世ロシア文字のOCRによる認識のための実験的予備研究

古中世纪俄语文字OCR识别实验初步研究

基本信息

  • 批准号:
    15652016
  • 负责人:
  • 金额:
    $ 2.05万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2004
  • 项目状态:
    已结题

项目摘要

本プロジェクトの最終年度は、昨年度に引き続き、手書きの古ロシア古語文献のPCによる処理を試行した。今年度は、酒井純氏(岡崎女子短期大学経営実務科講師、コンピュータ言語学)を研究協力者として迎え研究を実施した。ロシア語文献に使用される文字は、チートロを用いた省略語を初め、単語上に省略された文字を山括弧付きで記すもの、文頭を飾る特殊な装飾文字、あるいは草書体に近いものまで、極めて多岐にわたる。結果として、研究室に設置されたPC、スキャナ等では、上述の様な特殊文字の、さらに手書き文字の処理には大きな限界があることが判明した。我が国では古文書のデジタル化が実現しているが、手書きの古ロシア古語文献の処理に関しては、大規模プロジェクトで行う必要がある。・マイクロフィッシュ、マイクロフィルムのスキャナによる読み込みについて:透過原稿ユニット付きのフラットベットスキャナを用いてスキャンを実施、及び専用の枠を作成してスキャニングしたが、枠の厚みによってスキャナのフォーカス(焦点)にずれが出てしまうため、画質の精度に問題が生じた。・スキャン画像の画質の調整について:OCRソフトでの認識率を上げるため、解像度、ガンマ値(=いわゆる明るさ)を調整する必要であった。また、画像によっては画像処理ソフトによってシャープネスをあげることでOCRの読み取り精度を上げることが可能であった。・読み取ったデータの文字認識(OCR)について:データがマイクロフィッシュ、マイクロフィルムであり、データが粗めのため、OCRでの認識率はあまり良くない。ただし、ロシア語については、ScanReaderを用いたため、他のソフトに比べて格段に認識率を上げることが可能となった。・データの保存について:Adobe Acrobatを用いて、pdf形式でデータを保存することにより、読み取った画像データと、OCRの結果である文字データを一括して保存した。また、この形式を用いることにすれば、多くのPDCパソコンで閲覧可能となる。・その他実際のデータはCD-Rに出来るため、保存性もよく、文字データを含むため、検索にも対応する。ただし、簡単な検索の場合は問題ないが、検索の利便性を考えて電子辞書形式や、ほぼすべてのパソコンで閲覧可能であり、そのままインターネット上に掲載することが可能なhtmlまたはxml形式にすることも今後検討する余地があると考えられる。
The final version of this book, the last year's version, and the handwritten version of the ancient language document, PC version, are on a trial basis. This year, Junji Sakai (Lecturer of Okazaki Women's Junior College, Department of Economic Affairs, Linguistics) is a research co-researcher. Japanese literature uses されるcharacters for は, チートロを uses いたellipse for を初め, and 単语上に ellipsis for されたcharacters for yamabrackets Pay きで记すもの, 文头を色るSpecial な decorative characters, あるいはcursive style にNearly いものまで, 极めて多岐にわたる. Result, laboratory setting, PC, スキャナ, etc., above-mentioned special The processing of the characters, the handwriting of the characters, the processing of the characters, the boundaries of the characters, the boundaries of the characters, and the clear meaning of the characters. My country's ancient documents are the same as the ancient ones. The processing of ancient language documents is necessary, and the large-scale processing is necessary.・マイクロフィッシュ、マイクロフィルムのスキャナによる読み込みについて:Through the original manuscript ユニット捍のフラットベットスキャナを用いてスキャンを実事, and び専用の枠を为してスキャニングしたが、枠の thickみによってスキャナのフォーカス(Focus)にずれが出てしまうため、The problem of image quality and accuracy is が生じた.・スキャャンimage quality adjustmentについて:OCRソフトでのknowledge rateをげるため、Resolution、ガンマ夤(=いわゆる明るさ)をAdjustment するNecessary であった.また、Image processingげることでOCRの読みtakingりPrecisionを上げることがpossibleであった.・読みtakeったデータのcharacter recognition (OCR)について:データがマイクロフィッシュ,マイクロフィルムであり, データがrough めのため, OCR でのknowledge rate はあまり好くない.ただし、ロシア语については、ScanReaderを用いたため、His のソフトに ratio is higher than the べて gedan に recognition rate.・データのsaveについて:Adobe Acrobat いて、pdf format でデータをSave することにより、読みTake the picture of the image and the result of the OCR and the text of the character and save it.また、この formを用いることにすれば、多くのPDCパソコンでRead覧Maybeとなる.・その実记のデータはCD-Rに出るため, preservation もよく, text データをincludes むため, 検SO にも対応する.ただし、Simple 単な検SO no occasion は problem ないが、検SO のconvenience をtestえてElectronic dictionary form や、ほぼすべてのパソコンでRead 覧possibleであり、そのままインターネット上に掲 contain することがpossibleなhtmlまたはThe xml format will be used in the future.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
日本語言い換え処理を利用した日本語-ウイグル語対訳辞書の拡充
利用日语释义处理扩展日维双语词典
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Muhtar;Mahsut etc.
  • 通讯作者:
    Mahsut etc.
An experiment on Japanese-Uighur machine translation and its evaluation
日维机器翻译实验及评价
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Muhtar;Mahsut etc.
  • 通讯作者:
    Mahsut etc.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

MUHTAR Mahsut其他文献

MUHTAR Mahsut的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Class Struggle in Ancient Greek Democracy
古希腊民主中的阶级斗争
  • 批准号:
    EP/Z000084/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Research Grant
Aristoteles Pezographos: The Writing Styles of Aristotle and their Contribution to the Evolution of Ancient Greek Prose
亚里士多德 Pezographos:亚里士多德的写作风格及其对古希腊散文演变的贡献
  • 批准号:
    EP/X025748/1
  • 财政年份:
    2023
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Research Grant
The differences in Ancient Greek and Latin motion verbs as a way to understand the conceptualisation of reality in the two cultures
古希腊语和拉丁语运动动词的差异是理解两种文化中现实概念化的一种方式
  • 批准号:
    2749398
  • 财政年份:
    2022
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Studentship
Cataloguing, Interpreting, and Curating the UK National Trust's Collections of Ancient Greek Vases
对英国国家信托基金会的古希腊花瓶收藏进行编目、解读和策展
  • 批准号:
    2744413
  • 财政年份:
    2022
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Studentship
Celestial Motherhood: A Gender Study of the Archaeoastronomy of Female Constellations in the ancient Greek world
天体母性:古希腊世界女性星座考古天文学的性别研究
  • 批准号:
    2736902
  • 财政年份:
    2022
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Studentship
The Virtual Reality Oracle (VRO): An Immersive Experience of the Ancient Greek Oracle at Dodona
虚拟现实神谕 (VRO):多多纳古希腊神谕的沉浸式体验
  • 批准号:
    AH/T004673/1
  • 财政年份:
    2020
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Research Grant
'The space where a thought would be': Anne Carson, women's writing and the reception of ancient Greek myth
“思想所在的空间”:安妮·卡森,女性写作和古希腊神话的接受
  • 批准号:
    2442597
  • 财政年份:
    2020
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Studentship
Fundamental Elements for a Polyphonic History of Religion of Ancient Greek Literature
古希腊文学复调宗教史的基本要素
  • 批准号:
    434158561
  • 财政年份:
    2020
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Heisenberg Grants
A Study on the Relation between Ancient Greek Geometrical Analysis and Plato's Philosophical Methods
古希腊几何分析与柏拉图哲学方法关系研究
  • 批准号:
    20K21948
  • 财政年份:
    2020
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Ancient Greek and Judaeo-Christian Traditions in Hobbes
霍布斯的古希腊和犹太基督教传统
  • 批准号:
    20K00117
  • 财政年份:
    2020
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了