文脈自由言語より広い言語に対する構文解析アルゴリズムとシステム開発
比上下文无关语言更广泛的语言的解析算法和系统开发
基本信息
- 批准号:12780248
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,文脈自由言語より広いクラスの言語に対する新しい構文解析法を考案した.大きく分けて,構文解析法に確率を導入しないで解析できる言語のクラス解析する方式(1.)と,確率を導入して構文解析木の生起確率や情報の抽出をおこなう方式(2.)の二つ手法を提案している.1.文脈自由言語より広い言語の構文解析アルゴリズムの展開文脈自由言語の部分クラスを構文解析する方法としてLR構文解析法が知られているが,そのLR構文解析の拡張として,文法規則の導出のとき,先読み文字列を非終端記号とし,導出する文法規則より右側の非終端記号列を部分木の親とする構文解析法(unrestricted LR(k)構文解析)を提案した.加えて,この構文解析法は,先読み文字列数k>1となるような複数個必要な文法でも,先読み文字をk=1に削減する文法規則の変換法ついて明らかにした.2.確率構文解析アルゴリズムの展開これまで構文解析木の生成確率には,文法規則の生起確率を利用していたが,構文解析木の高さ方向の情報を考慮していない.そのため,必ずしも精密な構文解析木の生起確率が求められてはいなかった.それに対し,本研究では,入力文字のLC親と1つ前の入力時に生成される生成規則の組み合わせを数え上げることによって,入力文字列や部分文字列から得られる構文解析木の生起確率をこれまでよりも精密に求めることができることを示した.日本電子化辞書研究所(EDR)の日本語コーパスを用いて,非文(構文解析木の存在しない入力)の構文解析の生起確率はすべての文で正しい生起確率を求めることができた.また,毎日新聞94年度版を利用して数値情報を抽出して,適合率83.2%,再現率74.8%を得た.
This study examines a new approach to textual analysis of context-free speech. The method of speech analysis (1.) (2) How to extract information from a tree by generating an accurate rate of introduction into the tree structure and analyzing the tree structure. 1. Context-free speech analysis of speech structure; 2. Context-free speech analysis of speech structure; 3. Context-free speech analysis of speech structure; 4. The syntax rules of the derivation are: Unrestricted LR(k) Text Parsing In addition, the text parsing method includes the following steps: firstly, setting the number of character strings k>1, firstly, setting the number of character strings k= 1, firstly, setting the number of character strings k> 1, secondly, setting the number of character strings k=1, thirdly, setting the number of character strings k> 1, thirdly, setting the number of character strings k> 1, For example, if you want to make a decision, you must make a decision. In this study, the initial rate of generation of the input character string and partial character string was calculated accurately. The Japanese Electronic Dictionary Research Institute (EDR) has been working on the accuracy rate of text analysis in Japanese and non-Japanese languages. Daily News '94 edition was selected with a suitability rate of 83.2% and a reproduction rate of 74.8%.
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
椎名広光: "条件付確率の変更による確率一般化LR構文解析の拡張"言語処理学会第6回年次大会論文誌. 203-206 (2000)
Hiromitsu Shiina:“通过改变条件概率扩展概率广义 LR 解析”语言处理学会第六届年会杂志 203-206(2000 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Hiromitsu Shiina: "Unrestricted LR(k) grammars and its parser, where k=0, 1"京都大学数理解析研究所講究録. 1205. 154-159 (2001)
Hiromitsu Shiina:“无限制 LR(k) 语法及其解析器,其中 k=0, 1”京都大学数学科学研究所 Kokyuroku。1205. 154-159 (2001)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
椎名広光: "The Unrestricted LR (k) Grammar and its Parser, where k=0,1"京都大学数理解析研究所講究禄. (2001)
Hiromitsu Shiina:“无限制 LR (k) 语法及其解析器,其中 k=0,1”京都大学数学科学研究所 Kokyuroku(2001 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
椎名広光: "上向パス上の文法記号列からなる縦方向リストを利用した構文解析木の生起確率計算法"言語処理学会第8回年次大会論文誌. (2002)
Hiromitsu Shiina:“使用向上路径上的语法符号字符串的垂直列表计算解析树出现的概率”语言处理学会第八届年会杂志(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
小林伸行: "新聞記事からの数値情報の抽出と数値化"情報処理学会第64回全国大会講演論文集. (2002)
Nobuyuki Kobayashi:“报纸文章中数字信息的提取和数字化”第 64 届日本信息处理学会全国会议记录(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
椎名 広光其他文献
字幕データ付き VOD 講義の単語頻度に対するカーネル密度推定による映像区間推定
使用核密度估计对带有字幕数据的 VOD 讲座的词频进行视频片段估计
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
小山登;小林伸行;椎名 広光;北川文 夫 - 通讯作者:
北川文 夫
椎名 広光的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('椎名 広光', 18)}}的其他基金
Development of Classroom Utterance Analysis System Using Advanced Algorithms
利用先进算法开发课堂话语分析系统
- 批准号:
23K11378 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
- 批准号:
23K25158 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
- 批准号:
24H00255 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
多様性・被覆性等を考慮した代表解集合を求める情報抽出機構に関する研究
考虑多样性、覆盖度等因素获取代表性解集的信息提取机制研究
- 批准号:
23K11115 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
進化情報と塩基エディターによる酵素大規模ライブラリーの作製と活性機能情報抽出
使用进化信息和碱基编辑器创建大规模酶库并提取活性功能信息
- 批准号:
23KK0269 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Fund for the Promotion of Joint International Research (Fostering Joint International Research)
人と計算機との対話による情報抽出ノウハウの学習支援システム
通过人与计算机对话进行信息提取技术的学习支持系统
- 批准号:
22K18010 - 财政年份:2022
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
- 批准号:
22H03904 - 财政年份:2022
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
情報量規準を用いた核融合プラズマデータの情報抽出とプラズマ物理との相補性
利用信息准则和等离子体物理学的互补性对聚变等离子体数据进行信息提取
- 批准号:
22K03582 - 财政年份:2022
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新たな医療知識の獲得に向けた医学系論文の文脈構造の解析と情報抽出への応用
医学论文上下文结构分析及其在信息提取中获取新医学知识的应用
- 批准号:
21K17815 - 财政年份:2021
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
情報抽出イメージングによる繊毛輸送メカニズムの理解
通过信息提取成像了解睫状体运输机制
- 批准号:
21K06163 - 财政年份:2021
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
観測点1点だけからの地震波動伝播の情報抽出:地震動即時予測の高度化に向けて
仅从一个观测点提取地震波传播信息:迈向实时地震运动预测的进步
- 批准号:
21K03689 - 财政年份:2021
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)