数式を含む文書の検索・利用基盤の構築に関する研究
数学公式文献检索与使用平台的构建研究
基本信息
- 批准号:21650023
- 负责人:
- 金额:$ 1.98万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Challenging Exploratory Research
- 财政年份:2009
- 资助国家:日本
- 起止时间:2009 至 2011
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、科学や教育のための数学知識共有基盤の構築を目的としている。具体的には、数式の構造を解析し、さらに数式と説明テキストを対応づけることにより、現在の検索エンジンでは限定的な扱いしかできない数式の高度な検索機能の実現を目指すものである。研究期間では、(1)MathMLやlatexなどの標準形式で表現された数式の検索、(2)数式の近くにある説明文の解析、(3)両者の活用による数式意味のコンピュータによる理解、の3つの要素技術を中心に、数式の異なる利用環境にあわせて、以下の2通りのアプローチによる研究開発を行った。第1は、数式を含む文書の理解支援環境の構築である。論文誌に掲載された科学技術論文を解析して、数式で使われている変数や関数の名前を抽出する手法を提案するとともに、数式の木構造に基づく類似数式検索を実現した。これに基づき、数式ごとに変数や関数の名前一覧を提示したり、他論文や外部の数式データベース上の類似数式を提示したりするシステムを開発した。情報処理分野の104論文を対象に変数・関数名抽出および数式検索の性能評価を行い、実際に支援環境を構築して理解支援における有用性を調べた。第2は、拡張キーワードを用いた数式検索機能の強化である。索引対象となる数式と同一段落にある説明文から、その数式を参照する名前や記述を抽出することで、通常の検索エンジンによる数式の検索機能を高める手法を提案し、wikipediaの数学カテゴリ文書に含まれるlatex形式の数式を用いて実験による評価を行った。以上に基づき本研究では、数式と周辺の説明テキストを組み合わせてアクセス支援に用いる枠組みを新たに提案し、有用性を示した。実験で作成したアノテーションや評価用データについては、今後整備して公開する予定である。
The purpose of this study is to build a common foundation for で で, science や, education <e:1> ため, and mathematical knowledge を, with the aim of と て て る る. Specific に は, several analytical し の を in structure, さ ら に number type と illustrate テ キ ス ト を 応 seaborne づ け る こ と に よ り, now の 検 cable エ ン ジ ン で は qualified な Cha い し か で き な い number type の height な 検 cable function is の be presently を refers す も の で あ る. During the study period で は, (1) MathML や latex な ど の standard form で performance さ れ た number type の 検 cable, (2) the number type の nearly く に あ る exposition の parsing, (3) struck の use に よ る number type means の コ ン ピ ュ ー タ に よ る understanding, 3 つ の に を の elements technology center, the number of type の different な る use environmental に あ わ せ て, の 2 below To study the development of を and った through アプロ アプロ and チによる. The first を, numerical expression を contains む document block understanding support environment <e:1> construction である. Paper tzu に first white jasmines load さ れ た を analytical science and technology thesis し て, several type で わ れ て い る - several や masato number の former を spare す る technique proposed を す る と と も に, several type の wooden structure に づ く similar number type 検 cable を be presently し た. こ れ に base づ き, several ご と に - several や masato number の former one 覧 を prompt し た り, he paper や external の デ ー タ ベ ー ス の on similar type を number し た り す る シ ス テ ム を open 発 し た. Intelligence 処 manage eset の 104 paper を like に seaborne - number, masato several spare お よ び 検 number type cable の performance evaluation 価 を い, be interstate に support environment を construct し て understanding support に お け る usefulness を adjustable べ た. The 2nd キ and 拡 sheets キ ワ ワ ドを ドを can be strengthened by 検 た numbers. Several type と indexes like と seaborne な る same paragraph に あ る exposition か ら, そ の を reference number type す る former や account を spare す る こ と で, usually の 検 cable エ ン ジ ン に よ る number type の 検 line function high を め る technique proposed を し, wikipedia の mathematical カ テ ゴ リ document contains に ま れ る latex form の number type を with い て be 験 に よ 価 る assessment Youdaoplaceholder0 lines った. Above に base づ き this study で は week, several と 辺 の illustrate テ キ ス ト を group み close わ せ て ア ク セ ス support に with い る 枠 group み を new た に proposal し, usefulness を shown し た. Be 験 で made し た ア ノ テ ー シ ョ ン や review 価 with デ ー タ に つ い て は, future development し て public す る designated で あ る.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
意味と構造を考慮した数式検索手法の提案
提出一种考虑意义和结构的公式搜索方法
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:横井啓介;Minh-Quoc Nghiem;松林優一郎;相澤彰子
- 通讯作者:相澤彰子
Contextual Analysis of Mathematical Expressions for Advanced Mathematical Search
- DOI:10.17562/pb-43-11
- 发表时间:2011-06
- 期刊:
- 影响因子:0
- 作者:Keisuke Yokoi;Minh-Quoc Nghiem;Yuichiroh Matsubayashi;Akiko Aizawa
- 通讯作者:Keisuke Yokoi;Minh-Quoc Nghiem;Yuichiroh Matsubayashi;Akiko Aizawa
数式構造と周辺テキストの両面を考慮した数式情報抽出
考虑公式结构和周围文本的公式信息提取
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:横井啓介;Minh-Quoc Nghiem;松林優一郎;相澤彰子
- 通讯作者:相澤彰子
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
相澤 彰子其他文献
和英著者キーワードからの多言語類語辞書自動構築の試み情報管理
尝试从日英作者关键词和信息管理中自动构建多语言同义词词典
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
高須 淳宏;相原 健郎;相澤 彰子 - 通讯作者:
相澤 彰子
On calculating word similarity using large text corpora
利用大文本语料库计算单词相似度
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Shunsuke;Tanaka;Naomi;Fujimura;相澤 彰子;Akiko Aizawa - 通讯作者:
Akiko Aizawa
自然言語処理と計算代数の接合による数学問題へのアプローチ(<特集>ロボットは東大に入れるか?)
结合自然语言处理和计算代数解决数学问题的方法(<特辑>机器人能考上东京大学吗?)
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
相澤 彰子;松崎 拓也;穴井 宏和 - 通讯作者:
穴井 宏和
相澤 彰子的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('相澤 彰子', 18)}}的其他基金
文書の階層的アラインメントによる分散型知識基盤の構築
通过文档的分层对齐构建分布式知识库
- 批准号:
24K03231 - 财政年份:2024
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Deepening linguistic analysis methods for understanding and utilizing real documents
深化理解和利用真实文档的语言分析方法
- 批准号:
22K19818 - 财政年份:2022
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Natural Language Interface Technology to Support Complex Tasks
支持复杂任务的自然语言接口技术
- 批准号:
21H03502 - 财政年份:2021
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
データベース照合に基づくテキスト・エンティティの同定に関する研究
基于数据库匹配的文本实体识别研究
- 批准号:
17650035 - 财政年份:2005
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Exploratory Research
高並列統計推論による探索問題へのアプローチ
使用高度并行的统计推断来处理搜索问题
- 批准号:
08750488 - 财政年份:1996
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
集合分割問題のためのヒューリスティック統計推論の提案と情報検索システムへの適用
集合划分问题的启发式统计推断的提出及其在信息检索系统中的应用
- 批准号:
07750468 - 财政年份:1995
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
超平面処理に基づく集団型探索アルゴリズムの研究
基于超平面处理的集体搜索算法研究
- 批准号:
06750425 - 财政年份:1994
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
遺伝的アルゴリズムの最適化問題への適用に関する基礎研究
遗传算法在优化问题中的应用基础研究
- 批准号:
05750385 - 财政年份:1993
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似国自然基金
基于集成学习的分布式XML数据流的挖掘模型与概念漂移挖掘方法研究
- 批准号:61773415
- 批准年份:2017
- 资助金额:64.0 万元
- 项目类别:面上项目
海量不确定XML数据查询关键技术研究
- 批准号:61602130
- 批准年份:2016
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
高扩展性XML关键字查询处理技术
- 批准号:61572421
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
基于事前约束的XML关键字查询处理技术
- 批准号:61472339
- 批准年份:2014
- 资助金额:80.0 万元
- 项目类别:面上项目
面向时空应用的大规模复杂模糊时空XML数据管理关键技术研究
- 批准号:61402087
- 批准年份:2014
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
模糊时空数据XML建模与查询关键技术研究
- 批准号:61370075
- 批准年份:2013
- 资助金额:73.0 万元
- 项目类别:面上项目
基于文本语境约束的XML商业报告多维分析模型研究
- 批准号:61303155
- 批准年份:2013
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
云计算环境下海量XML数据管理关键技术研究
- 批准号:61272181
- 批准年份:2012
- 资助金额:81.0 万元
- 项目类别:面上项目
面向XML数据的关键字查询算法辅助生成技术研究
- 批准号:61272124
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
不确定XML数据查询处理关键技术研究
- 批准号:61202083
- 批准年份:2012
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Word文書のXML解析と機械学習を用いた授業課題レポート作成者の識別
使用 Word 文档的 XML 分析和机器学习识别课堂作业报告创建者
- 批准号:
23K02723 - 财政年份:2023
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
『カダム全集』所収『阿毘達磨集論』注釈群のXML電子テキスト構築
噶当全集《阿提达磨文集》注释XML电子文本的构建
- 批准号:
21H04339 - 财政年份:2021
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
XML Validation with Parabix Technology
使用 Parabix 技术进行 XML 验证
- 批准号:
539782-2019 - 财政年份:2019
- 资助金额:
$ 1.98万 - 项目类别:
University Undergraduate Student Research Awards
Textual Analysis of Tibetan Commentarial Traditions on the Abhidharmasamuccaya Using XML
使用 XML 对《阿毗达摩萨摩伽耶》的藏族注释传统进行文本分析
- 批准号:
18H00610 - 财政年份:2018
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Automated Web-Service Testing: WSDL/XSD/XML Bypass Testing
自动化 Web 服务测试:WSDL/XSD/XML 绕过测试
- 批准号:
527599-2018 - 财政年份:2018
- 资助金额:
$ 1.98万 - 项目类别:
University Undergraduate Student Research Awards
Design and implementation of fragmentation-adaptive parallel and distributed XML query library
分段自适应并行分布式XML查询库的设计与实现
- 批准号:
17K00108 - 财政年份:2017
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
XML Access Control Based on Security Views
基于安全视图的XML访问控制
- 批准号:
DDG-2015-00050 - 财政年份:2016
- 资助金额:
$ 1.98万 - 项目类别:
Discovery Development Grant
XML Database for Magnetotelluric Transfer Functions
大地电磁传递函数 XML 数据库
- 批准号:
1463855 - 财政年份:2015
- 资助金额:
$ 1.98万 - 项目类别:
Standard Grant
XML Access Control Based on Security Views
基于安全视图的XML访问控制
- 批准号:
DDG-2015-00050 - 财政年份:2015
- 资助金额:
$ 1.98万 - 项目类别:
Discovery Development Grant
Updating and querying compressed XML documents
更新和查询压缩的 XML 文档
- 批准号:
21999-2010 - 财政年份:2014
- 资助金额:
$ 1.98万 - 项目类别:
Discovery Grants Program - Individual