既存知能を利用した小規模コーパスからの知識獲得
使用现有智能从小型语料库中获取知识
基本信息
- 批准号:09780308
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は,小規模コーパスから言語処理に有用な知識を獲得することである.大規摸コーパスから有用な知識が得られることは解明されてきたが,実際に大規模コーパスを準備することは困難であり,小規模コーパスからどのように知識を抽出するかが現実的な問題としてある.本研究ではこの問題に対し,既存にある知識を併用することを試みている.基本的には既存の辞書やシソーラスが有用である.ただし,それらは人間が利用するために作られたものであり,機械処理には向いていない.そこでまず既存のシソーラス補強することを検討し,成果を論文誌に発表した.また研究を進めるにあたり,自然言語処理の様々な問題は語義選択問題に帰着されることがわかってきた.そこで,語義選択問題の中でも特に,応用が明確な文書校正に着目した研究を開始した.具体的には,同音異義語の誤り検出に対して決定リストの手法,平仮名列の誤り検出に対してN-gram手法といった統計的な手法を試みた.その結果,これらの誤り検出にもコーパスを利用した統計的な手法が効果的であることを確認した.さらに情報抽出で必要となる人名などの固有名詞抽出や複合語の単語分割にもコーパスからの規則抽出が有効であるので,既存知識として従来手法の規則ベースの手法を想定し,規則ベースの手法の誤りをコーパスから得られた知識を利用して修正することを試み,その有効性を確認した.
The purpose of this study is to obtain useful knowledge for speech processing on a small scale. The problem of knowledge extraction on a large scale is difficult to solve. This research aims to address this issue and try to use both existing and existing knowledge. The basic dictionary is available. For example, if you want to use the machine, you can use it. The results of the study are presented in the paper. Research progress, natural speech processing problems, semantic selection problems. The study of semantic selection problems begins with the use of explicit textual corrections. Specific, homonym error detection, determination of the method, level of error detection, N-gram method, statistical method, try. The results of this survey were confirmed by statistical methods. Information extraction is necessary, name extraction, proper noun extraction, compound word segmentation, rule extraction, existing knowledge extraction, rule extraction
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hiroyuki Shinnou: "Revision of Morphological Analysis Errors Through the Person Name Construction Model" ANLP-98. 399-407 (1998)
Hiroyuki Shinnou:“通过人名构建模型修正形态分析错误”ANLP-98。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
新納浩幸: "複合語からの証拠に重みをつけた決定リストによる同音異義語判別" 情報処理学会論文誌. 39.12. 3200-3205 (1998)
Hiroyuki Niino:“使用对复合词证据进行加权的决策列表进行同音词歧视”,《日本信息处理学会汇刊》39.12 3200-3205(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
新納浩幸: "コーパスを利用した分類語彙表の未登録語義の発見" 情報処理学会論文誌. 38.5. 965-961 (1997)
Hiroyuki Niino:“使用语料库发现分类词汇表中未注册的单词含义”,日本信息处理学会杂志 38.5(1997 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
新納浩幸: "平仮名N-gramによる平仮名の誤り検出とその修正" 言語処理学会第4回年次大会. C4-1(発表予定). (1998)
Hiroyuki Niino:“使用平假名 N-gram 进行平假名错误检测和纠正”,语言处理协会第四届年会 C4-1(待提交)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
池谷昌紀,新納浩幸: "文字ベースのHMMによる複合語単語分割の誤り修正" 言語処理学会第5回年次大会. C4-1, 発表予定. (1999)
Masanori Ikeya、Hiroyuki Niino:“使用基于字符的 HMM 进行复合分词中的错误校正”,语言处理协会第五届年会 C4-1,即将发表(1999 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
新納 浩幸其他文献
順方向多層 LSTM と分散表現を用いた教師あり学習による語義曖昧性解消
使用前向多层 LSTM 和分布式表示通过监督学习进行词义消歧
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
新納 浩幸;古宮 嘉那子;佐々木 稔 - 通讯作者:
佐々木 稔
All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築
使用 All-words WSD 和微调构建分类词典中单词含义的分布式表示
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
柳沼 大輝;古宮 嘉那子;新納 浩幸 - 通讯作者:
新納 浩幸
画像キャプション生成における複数形表現の統一
图像标题生成中复数表示的统一
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
鈴木類;古宮 嘉那子;浅原 正幸;佐々木 稔;新納 浩幸;西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔, - 通讯作者:
西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔,
新納 浩幸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('新納 浩幸', 18)}}的其他基金
常識推論タスク CommonGen のための文の非常識度合いの推定と常識的文への再生成
估计句子的荒谬程度并将其重新生成常识句子,用于常识推理任务 CommonGen
- 批准号:
23K11212 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
半教師有りクラスタリング手法を用いた語義別用例の収集
使用半监督聚类方法按词义收集示例
- 批准号:
19011001 - 财政年份:2007
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
情報抽出を目的とした定型パターンの自動構築に関する研究
信息抽取固定模式自动构建研究
- 批准号:
11780247 - 财政年份:1999
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
多義語を考慮した単語間の共起性の測定
考虑多义词测量单词之间的共现
- 批准号:
08780327 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
コーパスからの動詞句型慣用表現の自動抽出
从语料库中自动提取动词短语惯用表达
- 批准号:
07780302 - 财政年份:1995
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
中世イロハ引き日本語辞書における見出し掲出システムについての研究
中世纪日语词典标题显示系统研究
- 批准号:
24K03931 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
辞書サイト・アプリ開発に資する質の高い日本語例文バンクの構築とその応用研究
构建有助于词典网站/应用程序开发及其应用研究的高质量日语例句库
- 批准号:
23K20470 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
辞書式圧縮と圧縮情報処理の深化
字典压缩与压缩信息处理的深化
- 批准号:
24K02899 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
中日バイリンガル(Logographic Bilinguals)の心的辞書における音韻表象の解明
中日双语者心理词汇中语音表征的阐释(语标双语者)
- 批准号:
24K06615 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
専門語彙成長モデルの構築と多言語専門用語辞書拡張への応用
专业词汇增长模型构建及其在多语种专业术语词典扩充中的应用
- 批准号:
24H00736 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
医療用語のエンティティリンキングに向けた実践的医療用語辞書の開発
开发用于医学术语实体链接的实用医学术语词典
- 批准号:
23K28182 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
日本古辞書ポータルサイトの開発による公開研究資源の高度利用
通过开发古代日语词典门户网站,充分利用公共研究资源
- 批准号:
24K16080 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
幕末明治期における辞書体資料の受容に関する研究
江户末期和明治时期词典资料的接受研究
- 批准号:
24K16088 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
芸術・文化財情報流通のための多言語辞書データ開発の研究
艺术品文化财产信息发布多语言词典数据开发研究
- 批准号:
23K22017 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)














{{item.name}}会员




