既存の言語資源からの大規模語彙的言い換え知識の自動抽出

从现有语言资源中自动提取大规模词汇释义知识

基本信息

项目摘要

語彙的言い換えは,入力文中の語句を同じ意味を持つ別の語句に置換する作業である.ただし,実際には,文脈に無関係に置換可能な言い換え対はほとんど存在しないため,与えられた言い換え対が置換可能かどうかを所与の文脈に照らして評価する機構が必要になる.本研究では,語彙的言い換えの方法として,同概念語への言い換えと国語辞典の語釈文への言い換えの二つを検討し,実験によって評価機構の有効性を経験的に評価した.初年度は,言い換え事例約1000件を分析し,言い換え後の文に対する適格性評価の項目と修正処理を分類・整理した.得られた知見は以下の通りである.(a)もっとも頻度が高かったのは活用の誤りだが,これの解決は難しくない.(b)次に多かったのは,動詞と格要素の共起が不適格なケースである.第2年度に解決を試みた.(c) (c)と同様に多かったのは,言い換え前の語が多義であり,誤った言い換え対を選択したケースである.しかし,これらの約半数は(b)と同様の方法で解決できることがわかった.(d)その他の問題は上の3種類に比べると頻度がかなり少なかった.以上の観察に基づいて,第2年度は,主として上記(b)の問題にとりくんだ.具体的には,20年分の新聞記事コーパスから<名詞,助詞,動詞>の共起事例を大量に収集し,それを正例の訓練データとした.また,評価対象とする名詞と動詞を頻度に基づいて制限し,この制限を満たす言い換え事例約5000件を人手で評価し,負例を収集した.解くべき問題は,こうして収集した大量の正例と少数の負例を訓練事例として,言い換え後の文に含まれる<名詞,助詞,動詞>の共起の適格性を判定することである.実験結果から,大量の正例から統計的に適確性を推定するモデルと,入力と負例との類似度に基づいて不適格性を推定するモデルを組み合わせることによって,精度の高い判別器が得られることがわかった.
The words in the sentence change, into the text of the sentence, the same meaning, hold different sentences, the replacement of the operation is not. In fact, the context has no relationship, the substitution is possible, the substitution is possible, and the context is necessary. This study is aimed at the discussion of the method of word conversion and the evaluation of the effectiveness of the evaluation mechanism. In the first year, about 1000 cases were analyzed, and the items of eligibility evaluation and correction were classified and sorted. I know what I'm doing. (a)The frequency is high, and the problem is solved. (b)The verb case elements are not suitable for the case. The 2nd year of the trial. (c)(c) To the same word, to the same word, to the same word. About half of the problems are solved in the same way. (d)There are three kinds of problems on the list. In the second year, the main problem of (b) is that the problem of (b) is not solved. Specific, 20 years of news records, a large number of examples, a large number of examples of training. About 5000 cases were evaluated and collected. A large number of positive examples and a small number of negative examples are training examples. A large number of positive examples were found to be statistically accurate, and a large number of negative examples were found to be statistically similar to each other.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
藤田篤, 乾健太郎: "語彙的言い換えに必要な知識の部品化"情報処理学会自然言語処理研究会予稿集. NL-149-5. 31-38 (2002)
Atsushi Fujita,Kentaro Inui:“词汇释义所需的知识的组件化”日本信息处理学会自然语言处理研究小组的会议记录 NL-149-5 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takahashi Tetsuro, Iwakura Tomoya, Iida Ryu, Fujita Atsushi, Inui Kentaro: "KURA : A transfer-based lexico-structural paraphrasing engine"Proceedings of the NLPRS-2001 Workshop on Automatic Paraphrasing : Theories and Applications. 89-98 (2001)
Takahashi Tetsuro、Iwakura Tomoya、Iida Ryu、Fujita Atsushi、Inui Kentaro:“KURA:基于迁移的词汇结构释义引擎”NLPRS-2001 自动释义研讨会论文集:理论与应用。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
藤田篤, 乾健太郎, 松本裕治: "平易な表現への言い換えに必要なテキスト修正処理"第65回情報処理学会全国大会予稿集,特別トラック. 1T6-4. 5-299-5-304 (2003)
Atsushi Fujita、Kentaro Inui、Yuji Matsumoto:“解释为简单表达式所需的文本校正处理”第 65 届日本信息处理学会全国会议记录,特别轨道 1T6-4(2003 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Inui Kentaro, Nogami Masaru: "A Paraphrase-Based Exploration of Cohesiveness Criteria"The 8th European Workshop on Natural Language Generation. 101-110 (2001)
Inui Kentaro、Nogami Masaru:“基于释义的衔接性标准探索”第八届欧洲自然语言生成研讨会。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

乾 健太郎其他文献

Wikipedia記事に対する拡張固有表現ラベルの多重付与
为维基百科文章多重分配扩展实体标签
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 正敏;松田 耕史;関根 聡;岡崎 直観;乾 健太郎
  • 通讯作者:
    乾 健太郎
人間同士の雑談における話題遷移モデリング
人类聊天中的主题转换建模
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岸波 洋介;赤間 怜奈;佐藤 志貴;徳久 良子;鈴木 潤;乾 健太郎
  • 通讯作者:
    乾 健太郎
日本語Wikificationコーパスの構築に向けて
致力于建立日语维基百科语料库
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Davaajav Jargalsaikhan;岡崎 直観;松田 耕史;乾 健太郎
  • 通讯作者:
    乾 健太郎
前面投影と背面投影の組み合わせによるステルス投影の広域化
正投与背投相结合的广域隐形投影
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 正敏;松田 耕史;大内 啓樹;鈴木 潤;乾 健太郎;Noriaki Kuwahara,Kiyoshi Yasuda;宮田章裕;野村柾貴,森﨑慶人,脇田 航;奥田慎一,橋本直己
  • 通讯作者:
    奥田慎一,橋本直己
ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析
对语言现象进行系统分析,以实现用户生成内容的高质量自动翻译
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤井 諒;三田 雅人;阿部 香央莉;塙 一晃;森下 睦;鈴木 潤;乾 健太郎
  • 通讯作者:
    乾 健太郎

乾 健太郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('乾 健太郎', 18)}}的其他基金

Computational Modeling of Argumentation Understanding
论证理解的计算建模
  • 批准号:
    22H00524
  • 财政年份:
    2022
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
経験マイニング : Web文書からの個人の経験の抽出と分類
经验挖掘:从网络文档中提取个人经验并进行分类
  • 批准号:
    19024057
  • 财政年份:
    2007
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
文書集合からの事態関係知識の自動獲得と深い言語理解への応用
从文档集中自动获取情境相关知识并应用于深度语言理解
  • 批准号:
    15680006
  • 财政年份:
    2003
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)
知覚神経による骨代謝調節に関する研究
感觉神经调节骨代谢的研究
  • 批准号:
    12770795
  • 财政年份:
    2000
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
骨延長法の骨成熟過程に対する非浸襲性低出力超音波の影響
无创低功率超声对骨延长法骨成熟过程的影响
  • 批准号:
    10770720
  • 财政年份:
    1998
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
タスク指向日本語対話システムにおける漸進的発話の生成方法に関する研究
任务导向日语对话系统中渐进式话语生成方法研究
  • 批准号:
    09780318
  • 财政年份:
    1997
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
タスク指向日本語対話システムにおけるあいづちの理解と生成に関する研究
面向任务的日语对话系统中Aizuchi的理解与生成研究
  • 批准号:
    08780335
  • 财政年份:
    1996
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了