Model Selection for Ultra-high Dimensional and Non-linear Data

超高维和非线性数据的模型选择

基本信息

  • 批准号:
    21K17715
  • 负责人:
  • 金额:
    $ 3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

変数の数が標本サイズよりも非常に大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択について, 一般化線形モデルのもとで考察した. 具体的には, 一般化線形モデルにおける周辺尤度最大化基準にスパース性を誘導する正則化項を付加することで, シンプルながらも理論的に良い性質を持つ変数選択基準を提案した. 本研究で提案した手法はスクリーニングと呼ばれる変数選択の一種である. アルゴリズムそのものは線形回帰モデルで提案されたものとほぼ同じものであるが, 本研究ではその基準を, ロジスティック回帰モデルやポアソン回帰モデルのような, 一般化線形モデルに対しても同じように適用可能であることを示した. また, スクリーニングでは, 適当なしきい値を定め, 変数選択のスコアがそのしきい値よりも大きければ変数間に関連があると判断する. 本研究では, 上記のような手法の提案とともに, スコアの漸近分布に基づくしきい値の選択についても提案した. 一方, 昨年に引き続き, カーネル法に基づくスクリーニング手法についても現在論文化を目指している.
对于变量数量大得多的超高维数据分析,我们讨论了变量的选择,以有效选择与广义线性模型下的客观变量相关的解释变量。具体而言,通过在广义线性模型中最大化外围可能性的标准中添加正则化项,我们提出了一个具有简单但理论上良好属性的变量选择标准。本研究中提出的方法是一种称为筛选的变量选择。该算法本身与线性回归模型中提出的算法本身大致相同,但是在这项研究中,我们表明该标准可以应用于通用线性模型,例如逻辑回归模型和Poisson回归模型。此外,在筛选中,确定了适当的阈值,如果变量选择的得分大于该阈值,则确定变量之间存在关系。在这项研究中,以及上述方法的建议,我们还提出了基于得分的渐近分布的阈值选择。另一方面,在去年之后,我们目前的目标是开发基于内核方法的筛选方法的讨论文化。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
データサイエンスの歩き方
如何走入数据科学之路
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    滋賀大学データサイエンス学部;長崎大学情報データ科学部
  • 通讯作者:
    長崎大学情報データ科学部
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

梅津 佑太其他文献

スパース回帰分析とパターン認識
稀疏回归分析和模式识别
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    梅津 佑太;西井 龍映;上田 勇祐
  • 通讯作者:
    上田 勇祐
大規模計算時代の統計推論
大规模计算时代的统计推断
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bradley Efron;Trevor Hastie;藤澤 洋徳;井手 剛;井尻 善久;井手 剛;牛久 祥孝;梅津 佑太;大塚 琢馬;尾林 慶一;川野 秀一;田栗 正隆;竹内 孝;橋本 敦史;藤澤 洋徳;矢野 恵佑
  • 通讯作者:
    矢野 恵佑

梅津 佑太的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Devolopment and refinement of methods for data analysis by GLM
GLM 数据分析方法的开发和完善
  • 批准号:
    22K06404
  • 财政年份:
    2022
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
長期縦断研究による高齢者の口腔機能低下の要因の検討
通过长期纵向研究探讨老年人口腔功能衰退的原因
  • 批准号:
    21K17038
  • 财政年份:
    2021
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
変量効果分布の誤特定に対して頑健な一般化準線形混合効果モデルの開発
开发广义准线性混合效应模型,该模型对随机效应分布的错误指定具有鲁棒性
  • 批准号:
    20K19759
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
難民の移住国決定要因について:欧州への難民認定申請者は偽装した経済移民なのか
论难民移民国家的决定因素:欧洲寻求庇护者是否是变相的经济移民?
  • 批准号:
    20K01698
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on statistical inference for ultra-high dimensional semiparametric models
超高维半参数模型统计推断研究
  • 批准号:
    20K11705
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了