数式OCR(光学式文字読取り装置)の基礎的研究

数学OCR(光学字符阅读器)基础研究

基本信息

  • 批准号:
    10874021
  • 负责人:
  • 金额:
    $ 1.47万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    1998
  • 资助国家:
    日本
  • 起止时间:
    1998 至 2000
  • 项目状态:
    已结题

项目摘要

数式を認識するOCRはまだ実用化されていない.主な理由として,1.数式は2次元的に配置され,構造を解析することが難しい.2.数式は積分記号,総和記号,根号記号など比較的大きな文字から2重,3重の添字など小さな文字まである.3.数式を多く扱う者が数学を専門にしているものに限り,OCRとして市場のニーズが余りない.以上の理由により,企業も数式認識の大切さは,理解出来てもなかなか本格的な研究をおこなってくれない.そこで,我々は大学に籍を置き,数学を専門にしている者と情報に関心のある本学の研究者を中心に研究をおこなってきた.過去3年間の研究成果として以下のようなものが考えられる.1.日本語の数学の教科書および学術雑誌において.日本語領域と数式領域を切り分けるエンジンが開発できた.2.英語の教科書および学術雑誌において,英語領域と数式領域を切り分けるエンジンの開発の目処ができた.3.行列,条件式などを除けば,複雑な数式でも構造を正確に解析することができるエンジンを開発することができた.数式の構造を解析するアルゴルズムは,解析を行う数式を総和記号,積分記号,根号記号など比較的大きな数学記号の前後の領域に分割し,これらの操作を再起的に行うトップダウン方式によった.数式構造を正確に解析する正解率は97%と高精度のエンジンを開発することができた.本研究で開発された数式認識を用いて,印刷された数式文書を自動点訳するソフトの実用化の目処がたってきた.なお,今後の課題としては,行列や条件式および左側添え字などに対応できる数式認識エンジンの開発が望まれる.
The number of OCR is recognized as the number of OCR operations. The main reason is: 1. The number formula is not the configuration of the second dimension, and the structure is difficult to analyze. 2. The number formula is not the integral symbol, the total sum symbol, the radical symbol. The big character of the comparison is not the second, the third, and the small character is not the small character. 3. The number formula is not the mathematics. The OCR is not the market. For the above reasons, the enterprise has a large number of ways to understand and understand the research of the original case. For example, I am interested in the study of mathematics. The research results of the past three years are as follows: 1. Japanese mathematics textbooks and academic journals. 2. English textbooks and academic journals, English fields and numerical fields, 3. Lines and columns, conditional expressions, division, complex numerical expressions, construction, correct analysis, development, etc. The structure of a mathematical expression is analyzed in a way that is different from the structure of a mathematical expression. The correct solution rate of the formula structure is 97%, and the high accuracy of the formula structure is 97%. This study explores the application of digital recognition, printing and digital instruments, and the application of digital recognition. In the future, the problem is that the column conditional expression is added to the left side of the word to understand the numerical expression and the development is expected.

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
能隅進一: "絞り込み法による数式文字認識とその日本語/数式領域切りだしへの応用"電子情報通信学会論文誌. 83. 895-906 (2000)
Shinichi Nosumi:“通过缩小方法进行数学字符识别及其在日语/数学领域提取中的应用”,电子、信息和通信工程师学会会刊 83. 895-906 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
白石正人: "WWWサーバにおける組織外アクセスとその最大コネクション数推定法"福岡教育大学紀要. 48. 100-114 (1999)
Masato Shiraishi:“WWW 服务器的外部访问和估计最大连接数的方法”,福冈教育大学公告 48. 100-114 (1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
白石正人: "WWWサーバにおける組織外アクセスとその最大コネクション数推定法"福岡教育大学紀要. 48. 103-114 (1999)
Masato Shiraishi:“WWW 服务器的外部访问和估计最大连接数的方法”,福冈教育大学公告 48. 103-114 (1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hideki,Kamimura: "Clustering by a Fuzzy Metric : Application to the Cluster Median Problem"Bulletin of Information and Cybernetics. 32. 11-21 (2000)
Hideki,Kamimura:“模糊度量的聚类:在聚类中值问题中的应用”信息与控制论公告。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
白石正人: "ベクトル空間モデルにおける基準単語間の類似度について"電気関係学会九州支部大会(第51回連合大会)講演論文集. 273 (1998)
白石正人:“关于向量空间模型中参考词之间的相似性”电气工程学会九州分会会议记录(第51届联盟会议)273(1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

玉利 文和其他文献

玉利 文和的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('玉利 文和', 18)}}的其他基金

最適な線形符号の代数的および幾何学的構成の研究
最优线性码的代数和几何构造研究
  • 批准号:
    08640293
  • 财政年份:
    1996
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Prime Labellingの研究
优质标签研究
  • 批准号:
    06640318
  • 财政年份:
    1994
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
最適線形コードの構成についての研究
最优线性码的构造研究
  • 批准号:
    58540112
  • 财政年份:
    1983
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
maximal t-linearly independent set の研究
最大t-线性独立集的研究
  • 批准号:
    X00210----374064
  • 财政年份:
    1978
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

確率モデルと機械学習による手書き数式認識の高度化と手書き文字列との自動分離の研究
使用概率模型和机器学习研究手写数学表达式识别的复杂性以及手写字符串的自动分离
  • 批准号:
    15J08654
  • 财政年份:
    2015
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了