確率的生成モデルにおけるノンパラメトリックベイズ学習と自然言語処理への応用

随机生成模型中的非参数贝叶斯学习及其在自然语言处理中的应用

基本信息

  • 批准号:
    08J07036
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2011
  • 项目状态:
    已结题

项目摘要

本年度は主に3つの成果を上げることができた.これらの成果は,論文誌(1),国際会議(2)において発表を行った.1.離散的な隠れ状態をもつ文書の確率的生成モデルにおいて、単語の出現分布がPower-lawの性質をもつモデルを提案した提案モデルは、Power-lawの性質が内在するデータにおいては,既存モデルであるLatent Dirichlet Allocation (LDa)よりも未知のデータに対する予測性能が大幅に高いことが実験的に示すことができた.2.LDAにおける高速な決定論的逐次学習手法を提案した.本手法は,決定論的なオンライン学習アルゴリズムで,1度処理したデータは捨ててしまうので過去のデータを保持する必要がない.また,収束も早く,並列実行する必要もない手法である.3.Succinct Data structureを利用した圧縮半構造データマイニングアルゴリズムを提案した.XMLを中心として近年,木構造型の半構造データが大量に増加している.このようなデータに対してFREQTと呼ばれる高速に頻出するパターンを抽出するアルゴリズムが提案されている.本研究では,木構造データを情報論的下限まで圧縮した状態で,FREQTアルゴリズムを適用することが可能なアルゴリズムを提案した.
This year は three つ に を の results げ る こ と が で き た. こ れ ら は の results, paper (1), (2) international conference に お い て 発 table line を っ た. 1. State government discrete な れ を も つ documents の probabilistic generation モ デ ル に お い て が, 単 の appear distribution Power - law の nature を も つ モ デ ル を proposal し た proposal モ デ ル は, the Power - law の nature が inner す る デ ー タ に お い て は, existing モ デ ル で あ る Latent Dirichlet Allocation (LDa) よ り も unknown の デ ー タ に す seaborne る に substantially higher to measure performance が い こ と が be 験 に す in こ と が で き た. 2. LDa に お け る high-speed な determinism of successive learning technique proposed を し た. This gimmick は, deterministic な オ ン ラ イ ン learning ア ル ゴ リ ズ ム で, 1 degree 処 Richard し た デ ー タ は shed て て し ま う の で past の デ ー タ を keep す る necessary が な い. ま た, 収 beam も く early, parallel line be す る necessary も な い gimmick で あ る. 3. Succinct Data Structure を using し た 圧 shrink half structure デ ー タ マ イ ニ ン グ ア ル ゴ リ ズ ム を proposal し た. XML を center と し て in recent years, wooden modelling の half structure デ ー タ が large に raised plus し て い る. こ の よ う な デ ー タ に し seaborne て FREQT と shout ば れ る high-speed に mount す る パ タ ー ン を spare す る ア ル ゴ リ ズ ム が proposal Youdaoplaceholder0 されて る. This study で は, wooden structure デ ー タ を intelligence theory of the lower limit of ま で 圧 shrinkage し で た status, FREQT ア ル ゴ リ ズ ム を applicable す る こ と が may な ア ル ゴ リ ズ ム を proposal し た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Knowledge Discovery of Semantic Relationships between Words Using Nonparametric Bayesian Graph Model
利用非参数贝叶斯图模型进行词间语义关系的知识发现
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakano;T.;Marshall;B. A.;Kennedy;M.;Spencer;H. G.;佐藤一誠
  • 通讯作者:
    佐藤一誠
Topic models with power-law using Pitman-Yor process
Succinct Semi-structured Data Mining Based on FREQT
基于FREQT的简洁半结构化数据挖掘
Quantum Annealing for Variational Bayes Inference
  • DOI:
  • 发表时间:
    2009-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Issei Sato;Kenichi Kurihara;Shu Tanaka;Hiroshi Nakagawa;S. Miyashita
  • 通讯作者:
    Issei Sato;Kenichi Kurihara;Shu Tanaka;Hiroshi Nakagawa;S. Miyashita
Deterministic Single-Pass Algorithm for LDA
  • DOI:
  • 发表时间:
    2010-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Issei Sato;Kenichi Kurihara;Hiroshi Nakagawa
  • 通讯作者:
    Issei Sato;Kenichi Kurihara;Hiroshi Nakagawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 一誠其他文献

骨髄異形成症候群の形態学的分類におけるばらつきと標準化の必要性
骨髓增生异常综合征形态学分类的变异性和标准化的必要性
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 紀子;笹田 景子;舛田 博貴;石原 綾子;田中 洋子;高松 泰;矢冨 裕;勝田 和一郎;佐藤 一誠;松井 啓隆
  • 通讯作者:
    松井 啓隆
機械学習のための連続最適化
机器学习的持续优化
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 敬文;鈴木 大慈;竹内 一郎;佐藤 一誠
  • 通讯作者:
    佐藤 一誠
係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案
考虑依赖关系的文本挖掘半结构化挖掘方法的提出
RoboCup: a grand challenge toward 2050
RoboCup:迈向2050年的伟大挑战
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神嶌 敏弘;赤穂 昭太郎;佐藤 一誠;R. Fam and Y. Lepage;Itsuki Noda
  • 通讯作者:
    Itsuki Noda
情報の独立性を強化したトピックモデル
增强信息独立性的主题模型
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神嶌 敏弘;赤穂 昭太郎;佐藤 一誠
  • 通讯作者:
    佐藤 一誠

佐藤 一誠的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 一誠', 18)}}的其他基金

機械学習における予測の不確実性の定量化基盤の構築
为量化机器学习中的预测不确定性奠定基础
  • 批准号:
    23K20385
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層学習における認知的ヒューリスティックスの構成的理解
对深度学习中认知启发法的建设性理解
  • 批准号:
    24H00709
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Constructing mathematical foundation in interdisciplinary field of optics and machine learning
构建光学与机器学习跨学科领域的数学基础
  • 批准号:
    22K19787
  • 财政年份:
    2022
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Quantifying Prediction Uncertainty in Machine Learning
量化机器学习中的预测不确定性
  • 批准号:
    20H04239
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了