Study on fast and accurate classifier learning method from unlabeled big data

无标签大数据快速准确分类器学习方法研究

基本信息

  • 批准号:
    20K21815
  • 负责人:
  • 金额:
    $ 4.08万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-07-30 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

近年、ビッグデータから分類器や回帰式を学習するニーズが増しているが、データ収集の制約やコストから目的変数値が教師信号として得られ難いことが問題となっている。これに対し近年、目的変数値無し事例集合とその目的変数値の分布情報のみが与えられる場合に、正負例割合の異なる2つの事例集合から分類器を学習するUUC手法や、事例間の目的変数値の大小関係のみが知られた事例集合と目的変数値無し事例集合から回帰式を学習する非結合回帰手法が提案されている。何れも事例集合中の正負例の割合など目的変数値の分布が予め知られていることを前提としている。しかし、現実のビッグデータでは目的変数値の分布が知られていることは少なく、これらの手法を実適用する上で障害となっている。さらに、真の目的変数値が全く得られない条件で、如何に学習した分類器や回帰式の精度や不確実性を評価するかも問題である。そこで本研究では令和3年度までに、(1)目的変数値の分布が知られていないデータから目的変数値の分布を推定し、分類器や回帰式を学習する手法の研究、さらに(2)教師信号無しに学習した分類器や回帰式の精度・不確実性を評価する手法の研究に取り組んだ。しかしながら各々の研究項目についてコロナ禍の状況下で研究が十分進まず、(1)については目的変数値分布を用いないUUC手法の開発、(2)については分類器や回帰式のパラメータや目的変数値の事後分布推定手法の構築が積み残しとなった。令和4年度は、(1)について目的変数値の分布が得られなくても分類器を学習可能な条件を探求し、それに基づくUUC分類器学習原理と学習アルゴリズムの開発を行った。(2)については対象問題に関する事前知識を反映したモデルを補助情報として用いることで、モデルパラメータや目的変数値の事後分布を推定可能な原理とアルゴリズムを開発した。
In recent years, ビ ッ グ デ ー タ か ら を learning classifier や 帰 back type す る ニ ー ズ が raised し て い る が, デ ー タ 収 set の restrict や コ ス ト か ら purpose - the numerical signal と が teachers し て must ら れ difficult い こ と が problem と な っ て い る. こ れ に し seaborne in recent years, purpose - no し the numerical examples collection と そ の purpose - the numerical の distributed intelligence の み が and え ら れ に る occasions, positive and negative cases cut の different な る 2 つ の case collection か ら classifier を learning す る UUC や, case の purpose - between the numerical の size masato is の み が know ら れ た case set no し と purpose - several numerical examples か ら 帰 type を back Learn the する non-associative return to 帰 technique が proposal されて る る. What れ も case collection の positive and negative cases の cut close な ど purpose - the numerical の distribution が to know め ら れ て い る こ と を premise と し て い る. し か し, now be の ビ ッ グ デ ー タ で は purpose - the numerical の distributing が know ら れ て い る こ と は less な く, こ れ ら の gimmick を be applicable す る on で handicap of と な っ て い る. さ ら に, true の purpose - all of the numerical が く be ら れ な で い conditions, how to learn に し た classifier や back 帰 の や precision uncertain be sex を review 価 す る か も problem で あ る. そ こ で this study で は make and 3 year ま で に, (1) the purpose - the numerical の distributing が know ら れ て い な い デ ー タ か ら purpose - the numerical distribution of の を presumption し, classifier や back 帰 を learning す る technique research, さ の ら に (2) signal without し に learning し た classifier や 帰 type back の precision, uncertain be sex を review 価 す る gimmick の research group take り に ん だ . し か し な が ら each 々 の research project に つ い て コ ロ ナ disaster study で の situations very into ま が ず, (1) に つ い て は purpose - the numerical distribution を with い な い UUC gimmick の 発, (2) に つ い て は classifier や 帰 type back の パ ラ メ ー タ や purpose - the numerical の presumption distribution technique の afterwards build が product み residual し と な っ た. Make annual は, (1) and 4 に つ い て purpose - the numerical の distribution が must ら れ な く て も classifier を learning conditions may な を explore し, そ れ に base づ く UUC classifier learning principle と ア ル ゴ リ ズ ム の open 発 を line っ た. (2) に つ い て は like problem seaborne に masato す る prior knowledge を reflect し た モ デ ル を subsidies intelligence と し て in い る こ と で, モ デ ル パ ラ メ ー タ や purpose - after the numerical の distribution を presumption principle may な と ア ル ゴ リ ズ ム を open 発 し た.

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Isolation Distributional Kernel: A New Tool for Kernel based Anomaly Detection
アンサンブル最近傍距離を用いたラベル無しデータからの分類器学習
使用集成最近邻距离从未标记数据中学习分类器
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松本 瑞季;鷲尾 隆
  • 通讯作者:
    鷲尾 隆
Isolation kernel: the X factor in efficient and effective large scale online kernel learning
  • DOI:
    10.1007/s10618-021-00785-1
  • 发表时间:
    2019-07
  • 期刊:
  • 影响因子:
    4.8
  • 作者:
    K. Ting;Jonathan R. Wells;T. Washio
  • 通讯作者:
    K. Ting;Jonathan R. Wells;T. Washio
Class Prior Probability Estimation Using Density Ratio from Unlabeled and Contaminated Positive Datasets
使用未标记和污染的阳性数据集的密度比进行类先验概率估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takemoto Ayumi;Iwaki Sunao;Duo Zhoumao;Yasumuro Shinobu;Kumada Takatsune;伊東亮太,小川奈美,鳴海拓志,廣瀬通孝;関本大勢・本吉勇;Takeshi Yoshida and Eitaro Shinya
  • 通讯作者:
    Takeshi Yoshida and Eitaro Shinya
Nanjing University(中国)
南京大学(中国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鷲尾 隆其他文献

因果関係モデリングにおけるデータマイニング・グラフマイニング技術の活用
数据挖掘和图挖掘技术在因果关系建模中的应用
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Higuchi;A. Foronda;C. Ohta;M. Yoshimoto;Y. Okada;Masato Tsukada;Kouki Miyoshi;西尾佳祐,岩井儀雄,長原一,谷内田正彦;鷲尾 隆
  • 通讯作者:
    鷲尾 隆
離散構造データからの完全探索による知識発見
通过离散结构化数据的完整搜索来发现知识
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Toshiko Wakaki;Hiroyuki Itakura;Masaki Tamura;Hiroshi Motoda;Takashi Washio;鷲尾 隆
  • 通讯作者:
    鷲尾 隆
ポートフォリオ最適投資配分比率の発見手法
寻找最优组合投资配置比例的方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大西 智之;鷲尾 隆
  • 通讯作者:
    鷲尾 隆
健康情報分析のためのOLAPシステムの考察
OLAP系统用于健康信息分析的思考
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    猪口 明博;高林 健登;鷲尾 隆;紀ノ定 保臣
  • 通讯作者:
    紀ノ定 保臣
近傍法と形式概念解析を用いた階層的構造の学習
使用邻域方法和形式概念分析学习层次结构
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    米田友花;杉山 麿人;鷲尾 隆
  • 通讯作者:
    鷲尾 隆

鷲尾 隆的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鷲尾 隆', 18)}}的其他基金

Development of Deep Machine Learning Method for Generalized State Space Models Using Prior Knowledge Constraints and Weak Learning
使用先验知识约束和弱学习的广义状态空间模型深度机器学习方法的开发
  • 批准号:
    23H00471
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
不完全データからの大規模半正定行列推定手法の探究と量子情報計算実験推定への応用
不完全数据大规模正半定矩阵估计方法探索及其在量子信息计算实验估计中的应用
  • 批准号:
    21650029
  • 财政年份:
    2009
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
大規模次元観測時系列からのダイナミクス知識体系化と理解支援手法の開発
大维观测时间序列动力学知识体系化及理解支持方法的发展
  • 批准号:
    19024048
  • 财政年份:
    2007
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模次元時系列の知識発掘・モデル化原理確立と商業ユビキタスデータによる検証
大规模维度时间序列的知识挖掘和建模原理建立,并利用商业普适数据进行验证
  • 批准号:
    18049052
  • 财政年份:
    2006
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
数値相関ルール高速完全探索手法の開発と薬品処方規則発見への適用評価
使用数值相关规则的高速完整搜索方法的开发及其在药物处方规则发现中的应用评估
  • 批准号:
    17650042
  • 财政年份:
    2005
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
多様な形式データからの特徴抽出に基づく一元的検索手法の開発
基于不同格式数据特征提取的统一搜索方法的开发
  • 批准号:
    14658102
  • 财政年份:
    2002
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

小児がん及びヒト多能性幹細胞に対する畳込ニューラルネットワークによる分類器の創成
使用卷积神经网络创建儿童癌症和人类多能干细胞分类器
  • 批准号:
    23K20315
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
3D Methodology for Interpreting Disease-Associated Genomic Variation in RAG2
解释 RAG2 中疾病相关基因组变异的 3D 方法
  • 批准号:
    10724152
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Developing computational methods to identify of endogenous substrates of E3 ubiquitin ligases and molecular glue degraders
开发计算方法来鉴定 E3 泛素连接酶和分子胶降解剂的内源底物
  • 批准号:
    10678199
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Advanced machine learning to empower ultra-sensitive liquid biopsy in melanoma and non-small cell lung cancer
先进的机器学习使黑色素瘤和非小细胞肺癌的超灵敏液体活检成为可能
  • 批准号:
    10591304
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Multi-Omics Predictors of Oral HPV Outcomes among PLWH
PLWH 口腔 HPV 结果的多组学预测
  • 批准号:
    10557585
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Wearable alert system for detecting postoperative hypotension
用于检测术后低血压的可穿戴警报系统
  • 批准号:
    10760370
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Fair risk profiles and predictive models for outcomes of obstructive sleep apnea through electronic medical record data
通过电子病历数据对阻塞性睡眠呼吸暂停结果进行公平的风险概况和预测模型
  • 批准号:
    10678108
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Development and Pre-Clinical Validation of Quantitative Imaging of Cell State Kinetics (QuICK) for Functional Precision Oncology
用于功能性精准肿瘤学的细胞状态动力学定量成像 (QuICK) 的开发和临床前验证
  • 批准号:
    10737379
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
The Role of Prenatal Cannabis Exposure in Reward-related Neural Circuitry and Psychotic-like Experiences in Youth
产前大麻暴露在青少年奖励相关神经回路和精神病样经历中的作用
  • 批准号:
    10752372
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Zero-User-Adjustment Learning Classifier System for Optimal Performance
零用户调整学习分类器系统以获得最佳性能
  • 批准号:
    23KJ0993
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了