日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
基本信息
- 批准号:02F00348
- 负责人:
- 金额:$ 0.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
「研究目的」日本語では「誰が何を」などの情報が往々にして表現されない。しかし、この情報は自動要約、質疑応答などの様々な言語処理アプリケーションの高度化に必要になる。特に、機械翻訳(日本語→英語)システム開発においては、それらの省略された情報(ゼロ代名詞)が英語で必須の情報であるため、その先行詞を同定する事は一つの大きな課題となっている。その解決策として、文法や文脈を考慮したアルゴリズムを考案したが、その実装と有用性評価が研究目的。「研究実績」新聞と雑誌のコーパス(言語データ)を分析した結果、さらに以下の改良点がみつかった。1.特殊構文に現れる省略一見省略がないように見える構文が2つある。「(Xに)山が見える」「(Xに)後継者ができた」のように「(Xは/に/が/で)Yが述語」の構文では、Xが省略されている。また、「(Xから)(Yに)電話があった。」の構文では、XとYが省略されている。新聞と雑誌のコーパスを分析した結果、12%の文がこの構文をとり、その内、X(またはY)が省略されるのは87%と頻度が高いことがわかった。よって、この2つの構文を他の文と見極める必要がある。動詞の意味属性が有益と考えられるが、他の要因も現在調査中。2.引用文引用文が文中に含まれる時、直接話法か間接話法かで先行詞が変化してしまう。3.省略の有無どこまでを省略(必須情報)とみなすか、厳格に見極めることは困難であるが必要である。4.表層に依存した手法の問題点自然言語は、人間が発するものであり必ず文法的に正しい文ではないこともある。また、複数の助詞が正しいとされる時があったり、反対に助詞が省略されていることもよくある。現手法は、表層(特に、助詞の種類)に依存し、表現されたものだけ頼りに文法で処理するため、このような問題への対処が不十分である。統計手法と兼ね合わせることに加え、何か、画期的な方法/視点が必要。今後の課題は、上記の点を考慮しアルゴリズムを改良することにある。そして、このアルゴリズムを実装したシステムを作り、種々のコーパスでその有用性をテストする。
"the purpose of the study is to show that there is something wrong with you in Japan." Don't talk about it, and talk about it. Special, machinery and equipment reversion (in Japan) to start the war, to omit the license (alias), to change the situation, and to make the same decision as soon as the accident is completed. The purpose of the study is to understand the usefulness of the decision, grammar, grammar, and grammar. The results of the research results are analyzed, and the improvement points are listed below. 1. The special text is omitted. Please refer to the article 2. After "(X"), the person who reads "(X") says "(X)," (), "(X)," (), "(X), (). No, no. "if you want to read the text, X
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Shigeko Nariyama: "Subject ellipsis in English"Journal of Pragmatics. Volume 36,Issue 2. 237-264 (2004)
成山茂子:《英语主语省略》语用学杂志。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Shigeko Nariyama: "Resolving incognito ellipsis : treatment for constructions that disguise ellipsis"In Proceedings of Machine Translation Summit IX. IX. 261-268 (2003)
Shigeko Nariyama:“解决隐身省略:对伪装省略的结构的处理”,机器翻译峰会 IX 会议记录。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
成山重子: "Markednessを使った省略の一考察"言語処理学会第9回年次大会 論文集. 9. 593-596 (2003)
Shigeko Naruyama:“利用标记进行省略的研究”语言处理学会第九届年会论文集 9. 593-596 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
成山重子: "機械翻訳から見た主語"月刊言語 特集「日本語の主語を捉える」. Vol.33.No.2. 76-82 (2004)
成山茂子:《机器翻译视角下的学科》月刊语言特刊《理解日语学科》Vol.33.No.2(2004)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Shigeko Nariyama: "A Japanese CALL program incorporating a machine translation system"In Proceedings of WorldCALL 2003. II. 163 (2003)
Shigeko Nariyama:“结合了机器翻译系统的日语 CALL 程序”,载于 WorldCALL 2003 年论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松本 裕治其他文献
ベクトルのスパース化を用いたk近傍法におけるハブの軽減
使用向量稀疏化的 k 最近邻方法中的集线器缓解
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
重藤 優太郎;新保 仁;松本 裕治 - 通讯作者:
松本 裕治
Novel trends in research data utilisation based on open science.
基于开放科学的研究数据利用的新趋势。
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
大村 舞;松本 裕治;奥村貴史;Yasunori Yamamoto and Atsuko Yamaguchi;Norio Kobayashi - 通讯作者:
Norio Kobayashi
決定木による「怒り」識別のための音響的特徴の検討と評価
使用决策树研究和评估“愤怒”识别的声学特征
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
尾関基行;中村裕一;大田友一;松本 裕治;飯田 仁 - 通讯作者:
飯田 仁
松本 裕治的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松本 裕治', 18)}}的其他基金
超分子ヒドロゲルの階層的ダイナミクスに基づくゾル-ゲル転移の制御
基于超分子水凝胶分级动力学的溶胶-凝胶转变控制
- 批准号:
15J04575 - 财政年份:2015
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
意見情報抽出のための深い文解析に関する研究
深度句子分析观点信息提取研究
- 批准号:
08F08367 - 财政年份:2008
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
- 批准号:
02F02348 - 财政年份:2002
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
利用者からの要求を考慮したテキストデータからの知識抽出
考虑用户请求从文本数据中提取知识
- 批准号:
13131207 - 财政年份:2001
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
08204207 - 财政年份:1996
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
07204204 - 财政年份:1995
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
06207205 - 财政年份:1994
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
04219205 - 财政年份:1992
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
03235205 - 财政年份:1991
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
02249203 - 财政年份:1990
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
- 批准号:
02F02348 - 财政年份:2002
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
日本語の代名詞およびゼロ代名詞の"被束縛変項"解釈と"怠慢の代名詞"解釈
日语代词和零代词解释为“束缚变量”和“忽略代词”
- 批准号:
03851086 - 财政年份:1991
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)