Research on the digitization system of scientific documents
科技文献数字化系统研究
基本信息
- 批准号:14380182
- 负责人:
- 金额:$ 9.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.Throughout the research period, we build a ground-truthed database of page images of mathematical articles. Using the database, we developed and improved the math symbol recognition engine and the segmentation method of text areas and math expression areas. A part of the database is now open to public on our web site.2.To improve the math structure analysis method base on virtual link network developed in the previous research, we adjusted the cost of the links of the network in detail using the database above. On the other hand, we introduced a notion of "center band", calculated robustly against mis-recognition of characters, to stabilize considerably the structure analysis of math expressions.3.We developed a method to segment touched characters in math expressions using the matching of sub-patterns with other non-touched characters patterns in the same page. We also extended a framework used frequently to segment characters in text areas in a way adapted to math formulae images4.We developed a method to recognize complicated matrices including repeat symbols or area symbols, using variable block pattern elements.5.We investigated the method to detect bibliographic data and logical structure of math papers from the recognition results.6.We finally studied the recognition of commutative diagrams in math papers and graphs of elementary functions in the figures of math texts as well. These are however still on the state of trial research.7.A math document recognition software "Infty Reader" developed using the results of this research is available freely from the web site : http://www.inftyproject.org./
1.在整个研究过程中,我们建立了一个真实的数学文章页面图像数据库。利用该数据库,开发并改进了数学符号识别引擎以及文本区域和数学表达式区域的分割方法。数据库的一部分现已在我们的网站上向公众开放。为了改进前人研究中基于虚链路网络的数学结构分析方法,我们利用上述数据库对网络的链路成本进行了详细的调整。另一方面,我们引入了“中心带”的概念,对字符的错误识别进行了鲁棒计算,从而大大稳定了数学表达式的结构分析。本文提出了一种利用子模式与同一页面中其他非触摸字符模式的匹配来分割数学表达式中触摸字符的方法。我们还扩展了一个常用的框架,以适应数学公式图像的方式分割文本区域中的字符4。我们开发了一种方法来识别复杂的矩阵,包括重复符号或区域符号,使用可变块模式元素。我们研究了从识别结果中检测数学论文的书目数据和逻辑结构的方法。最后对数学论文中交换图的识别和数学课本中初等函数图的识别进行了研究。然而,这些仍处于试验研究阶段。利用本研究成果开发的数学文档识别软件“Infty Reader”可从网站http://www.inftyproject.org./免费获得
项目成果
期刊论文数量(29)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
金堀利洋, 西村博人, 藤本光史, 鈴木昌和: "数学の授業におけるインタラクティブなコンテンツを含んだ授業教材作成システム"電子情報通信学会技術研究報告. ET2003-80. 117-122 (2003)
Toshihiro Kanahori、Hiroto Nishimura、Mitsushi Fujimoto、Masakazu Suzuki:“包括数学课互动内容的课堂教材创建系统”IEICE 技术研究报告 117-122(2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Suzuki, F.Tamari, R.Fukuda, S.Uchida, T.Kanahori: "INFTY - An integrated OCR system for mathematical documents"Proceedings of the 2003 ACM Symposium on Document Engineering Ed C Vanoirbeek C Roinsin E Munson. 95-104 (2003)
M.Suzuki、F.Tamari、R.Fukuda、S.Uchida、T.Kanahori:“INFTY - 数学文档的集成 OCR 系统”2003 年 ACM 文档工程研讨会论文集 Ed C Vanoirbeek C Roinsin E Munson。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
内田誠一, 野村明弘, 鈴木昌和: "数学文書データベースの解析"電子情報通信学会技術研究報告. PRMU2003-48. 19-24 (2003)
Seiichi Uchida、Akihiro Nomura、Masakazu Suzuki:“数学文档数据库分析”PRMU2003-48(2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Extraction of Logical Structure from Articles in Mathematics
数学文章逻辑结构的提取
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:K.Nakagawa;A.Nomura;M.Suzuki
- 通讯作者:M.Suzuki
A.Nomura, K.Michishita: "Detection and Segmentation of Touching Characters in Mathematical Expressions"Proceedings of the 7th International Conference on Document Analysis and Recognition. (To appear). (2003)
A.Nomura、K.Michishita:“数学表达式中触摸字符的检测和分割”第七届国际文档分析与识别会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
SUZUKI Masakazu其他文献
ふくの鋳造技法-横浜ユーラシア文化館所蔵中国の青銅ふくについて-
袋笼铸造技术 - 关于横滨欧亚文化博物馆所藏的中国青铜袋袋 -
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
FUJIYOSHI Akio;NAKAGAWA Koji;SUZUKI Masakazu;三船温尚 - 通讯作者:
三船温尚
Responses of Water and Carbon Fluxes to Current, Near Future and Future Projected Climates at a Monsoonal Teak Plantation
季风柚木种植园水和碳通量对当前、近期和未来预计气候的响应
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
IGARASHI Yasunori;KUMAGAI Tomo'omi;WATANABE Satoshi;OKADA Yasuko;TAKEMI Tetsuya;KOTSUKI Shunji;YOSHIFUJI Natsuko;TANAKA Nobuaki;TANAKA Katsunori;SATO Takanori;SUZUKI Masakazu;TANTASIRIN Chatchai - 通讯作者:
TANTASIRIN Chatchai
近世民家に残存する中世掘立柱建物の技法―股柱と梁間一間型系棟持柱―
现代早期私人住宅中保留的中世纪挖柱建筑技术:胯柱和脊形脊柱
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
FUJIYOSHI Akio;NAKAGAWA Koji;SUZUKI Masakazu;三船温尚;古川聖;中尾七重 - 通讯作者:
中尾七重
『ワークショップと学び第2巻 : 場づくりとしてのまなび』, 学校を訪れるアーティスト
《工作坊与学习卷2:学习作为场所创造》,艺术家参观学校
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
FUJIYOSHI Akio;NAKAGAWA Koji;SUZUKI Masakazu;三船温尚;古川聖 - 通讯作者:
古川聖
SUZUKI Masakazu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('SUZUKI Masakazu', 18)}}的其他基金
Effects of thinning on water and carbon cycle in a Teak plantation in Thailand
间伐对泰国柚木种植园水和碳循环的影响
- 批准号:
24405031 - 财政年份:2012
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Practical methodology of regional renovation design utilizing the farm heritage in Fukushima Prefecture
利用福岛县农场遗产进行区域改造设计的实用方法
- 批准号:
24580037 - 财政年份:2012
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Characteristics of stream water chemistry in tropical lowland rainforest in Malaysian Borneo
马来西亚婆罗洲热带低地雨林溪流水化学特征
- 批准号:
21405021 - 财政年份:2009
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Studies on Regional Restoration Design and It's Medical Analogy
区域修复设计及其医学类比研究
- 批准号:
20240066 - 财政年份:2008
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Study on the evolutionary processes of hormone-dependent water movement
激素依赖性水运动的进化过程研究
- 批准号:
20570055 - 财政年份:2008
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Transcription factors involved in the gene transcription of calcium-regulating hormone
参与钙调节激素基因转录的转录因子
- 批准号:
18570058 - 财政年份:2006
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Study on Network Game Simulation of Urban Large Pak Re-development and Preference Characteristics of Park Planner
城市大型公园再开发网络博弈模拟及公园规划者偏好特征研究
- 批准号:
17380016 - 财政年份:2005
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
On Behavior Evolution of Legged Robot through Knowledge Array Network
基于知识阵列网络的腿式机器人行为演化
- 批准号:
14550245 - 财政年份:2002
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Evaluation of Forest influence on water resources and sediment discharge using a digitalized square-grid map
使用数字化方格图评估森林对水资源和泥沙排放的影响
- 批准号:
14360081 - 财政年份:2002
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Application Research of Meteorological Observation system for analyze relationships between terrestrial vegetation and atmosphere
气象观测系统分析陆地植被与大气关系的应用研究
- 批准号:
11556028 - 财政年份:1999
- 资助金额:
$ 9.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)