大規模なコーパスを用いた機械学習による名詞句の項構造解析

使用大规模语料库使用机器学习对名词短语进行术语结构分析

基本信息

  • 批准号:
    08J09545
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2009
  • 项目状态:
    已结题

项目摘要

本年度は、本研究のベースとなった事態性名詞の述語項構造解析の研究に関して、構文パターンと既存の項構造解析モデルを組み合わせた手法をまとめた論文が出版された。しかしながら、年次計画1年目の後半に予定していた大規模なコーパスからリソースを自動構築する研究が理論面においても実践面においても発展を見せ、研究計画を変更したために、本研究の2年度目に予定していた名詞句の自動項構造解析は実施しなかった。以下では研究計画を変更したあとの研究について述べる。本年度の研究上の貢献は2つある。1つ目は、1年度目においてグラフ理論に基づく自然言語処理における半教師あり手法(ブートストラッピング)について行った研究をまとめ、発表したことである。グラフ理論的観点からブートストラッピングを解析した研究はこれまでになく、ブートストラッピングに内在する問題点を理論的に明らかにした一方、リンク解析で用いられている手法を自然言語処理にも適用し、語義曖昧性解消のタスクで高い性能が得られることを示した。さまざまなヒューリスティックを用いるブートストラッピングと比較して、使用時に決めなければならない変数の数が少ないため、扱いが容易であることも提案手法の利点の一つである。2つ目は、ヤフー研究所との共同研究により、検索クリックスルーログをコーパスとした意味カテゴリ辞書の自動構築の研究を行い、検索クリックスルーログが意味カテゴリの獲得に有用な情報抽出源であることを示した。また、日本最大規模のウェブデータを対象として、並列分散環境でも実行できるようなスケーラブルなアルゴリズムを提案し、有効性を示した。また、本年度は年次計画で予定していた統計的機械翻訳への応用に替え、3ヶ月アメリカ合衆国Apple Inc.に渡航し、統計的自然言語処理(統計的かな漢字変換)に関する研究を行った。
This year, this In the second half of the year, the second half of the annual plan is scheduled for the second half of the year. In the second half of the year, the second half of the annual plan is scheduled for the second half of the year. In the second half of the year, the second half of the annual plan is scheduled for the second half of the year. The following is a research project, which will be further reviewed. In this year's research, I will give you 2 awards. 1. In the first year of the year, there is a basic theory of natural language, a semi-pedagogical approach, a study and a table. This is the point of the theory. The point of the theory is that the point of the theory is the point of the theory. The point of the theory is the point of the theory. It is very easy to make sure that the method of making a proposal is more efficient than the number of times you use it. 2. The goal, the research institute, the joint research program, the research institute, the research institute, the research The largest scale in Japan is similar to the one in Japan, and there is an indication of the nature of the proposal for the decentralized environment. In this year's annual plan, the mechanical and mechanical replacement equipment for the statistics of this year's annual plan will be used as a substitute, and the Apple Inc of the United States will be available every 3 months. During the voyage, the statistics of the natural language theory (statistics of the word word) to study the behavior of the people.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ChaIME:大規模コーパスを用いた統計的かな漢字変換
ChaIME:使用大规模语料库统计假名-汉字转换
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小町守;森信介;徳永拓之
  • 通讯作者:
    徳永拓之
あいまいな日本語のかな漢字変換
不明确的日语假名汉字转换
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小町守;森信介;徳永拓之
  • 通讯作者:
    徳永拓之
名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
使用名词短语的词汇句法模式对情境名词进行项目结构分析
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Akihiro Tsukamoto;Ryoko Matsuba;Chinatsu Ishizaki;佐々見武志;小町守・飯田龍・乾健太郎・松本裕治
  • 通讯作者:
    小町守・飯田龍・乾健太郎・松本裕治
NAIST-NTT System Description for Patent Translation Task at NTCIR-7
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mamoru Komachi;M. Nagata;Yuji Matsumoto
  • 通讯作者:
    Mamoru Komachi;M. Nagata;Yuji Matsumoto
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小町 守其他文献

Mutual <I>k</I>-Nearest Neighbor Graph Construction in Graph-based Semi-Supervised Classification
基于图的半监督分类中的互<I>k</I>-最近邻图构建
確信度に基づく退院時サマリの分析
基于置信水平的出院总结分析
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安道 健一郎;奥村 貴史;小町 守;松本 裕治
  • 通讯作者:
    松本 裕治
事前学習モデルを用いた近代文語文のニューラル機械翻訳
使用预训练模型对现代文学文本进行神经机器翻译
  • DOI:
    10.20729/00216233
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    喜友名 朝視顕;平澤 寅庄;小町 守;小木曽 智信
  • 通讯作者:
    小木曽 智信
Generation of Diverse Corrected Sentences Considering the Degree of Correction
考虑纠正程度的多样化纠正句子的生成
  • DOI:
    10.5715/jnlp.28.428
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    甫立 健悟;金子 正弘;勝又 智;小町 守
  • 通讯作者:
    小町 守
歴史的日本語資料を対象とした形態素解析
日本历史资料的形态分析
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小木曽 智信;小町 守;松本 裕治
  • 通讯作者:
    松本 裕治

小町 守的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('小町 守', 18)}}的其他基金

深層学習による言語生成の評価データセットの構築と品質推定
使用深度学习构建评估数据集和语言生成质量评估
  • 批准号:
    23K24907
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Construction of an Evaluation Dataset and Quality Estimation for Neural Language Generation
神经语言生成评估数据集的构建和质量评估
  • 批准号:
    22H03651
  • 财政年份:
    2022
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
言語学習者の誤用に注目した単語と文の分散表現の獲得と分析
获取和分析单词和句子的分布式表示,重点关注语言学习者的误用
  • 批准号:
    19KK0286
  • 财政年份:
    2020
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (A))

相似海外基金

肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
  • 批准号:
    24K15796
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
  • 批准号:
    24K13948
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
  • 批准号:
    24K13518
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
  • 批准号:
    24K15093
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多次元イベント時間データ解析の推測理論と方法・機械学習の開発
多维事件时间数据分析的推理理论和方法/机器学习的发展
  • 批准号:
    24K14853
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
速度ポテンシャルエネルギー整形法と機械学習を用いた宇宙機制御理論の開発
利用速度势能整形方法和机器学习发展航天器控制理论
  • 批准号:
    23K20946
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ユビキタス機械学習社会におけるプライバシ保護基盤
无处不在的机器学习社会中的隐私保护基础设施
  • 批准号:
    23K21695
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
正則化機能強化による超ロバスト推定法の開拓と一般化:信号処理・機械学習への応用
通过加强正则化功能开发和推广超鲁棒估计方法:在信号处理和机器学习中的应用
  • 批准号:
    23K22762
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
攻撃に耐性を持つ機械学習モデルによる設計工程ハードウェアトロイ検知
使用抗攻击的机器学习模型在设计过程中检测硬件木马
  • 批准号:
    23K24816
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了