Construction of efficient machine learning models using domain knowledge

使用领域知识构建高效的机器学习模型

基本信息

  • 批准号:
    20K11960
  • 负责人:
  • 金额:
    $ 2.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究の目的は,大量の教師データだけに頼らず,ドメイン知識やノウハウを活用することで,少ない教師データから精度の高い機械学習モデルを構築することである。現在,機械学習による高精度な予測,分類を実現するためには,教師データと呼ばれる正解ラベル付けされたデータが大量に必要となるが,実問題への適用では,「十分なデータが用意できない」,「教師データを人手で作成する工数が膨大」などの理由で機械学習モデルを構築できないケースが多数存在する。そこで,ドメイン知識を活用することで,データ不足を補う方法について,実験と検証を進めた。今年度は特に,少ない教師データから精度の高い機械学習モデルを構築するための転移学習手法やData Augmentation手法,特徴量ベクトル空間の分析を中心に研究を進めた。転移学習とは,ある課題で学習したこと(学習済みモデル)を別の課題において活用することで,効率的に教師あり学習を行う方法である。ある特定のタスク(課題)に対して,有効に機能する別タスク,異なるデータセットによる学習の有効性,学習済みモデルについて実験・検証を重ね,その有効性を検証した。また,Data Augmentationは教師データを増やす手法である。画像処理では類似画像が作り易く,有効性が高いためによく利用されるが,自然言語処理では,課題が多い。日本語特有のドメイン知識を用いたData Augmentation手法について検証を行った。応用課題としては,マーケティングなど市場調査において重要となるSNSからの意見抽出,市場環境を把握するための自然言語処理において,検証を行い,学会発表を行った。
The purpose of this study is to reduce the number of teachers who are involved in the construction of high precision mechanical learning systems. Now, machine learning in high-precision prediction, classification and implementation of the reasons, teachers and call for positive solutions to pay for a large number of necessary, and the application of the problem,"ten points of intention,""teachers and manual production of the number of expansion," the reason for machine learning, construction and most of the existence. This is the best way to improve your knowledge. This year, the number of teachers, the accuracy of high mechanical learning, the construction of mobile learning techniques, Data Augmentation techniques, the analysis of feature space, the center of research progress. Transfer learning is a topic for learning and a method for learning. For specific topics, there are functions, differences, learning effectiveness, learning effectiveness, testing effectiveness, and testing effectiveness. Also, Data Augmentation is an enhanced way for teachers to communicate digitally. Portrait processing is similar to portrait processing. There are many problems in natural speech processing. Japanese language unique to the knowledge of the use of Data Augmentation techniques to test the line Use the topic to answer questions, market research, SNS, opinion extraction, market environment, natural speech processing, verification, and learning to perform.

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BERT を用いたフィルタリングによる Twitter からの教師データ作成手法
通过使用 BERT 过滤从 Twitter 创建训练数据的方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金澤滉典;櫻井義尚
  • 通讯作者:
    櫻井義尚
動物園の来場者予測におけるSNSデータの貢献
SNS 数据对动物园游客预测的贡献
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木耀司;櫻井義尚
  • 通讯作者:
    櫻井義尚
キャラクターの顔領域の情報を用いたイラスト作者推定
使用人物面部区域信息进行插图作者估计
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笠松慎之介;櫻井義尚
  • 通讯作者:
    櫻井義尚
日本語処理における英語のための自然言語処理data augmentation手法の有用性検証
验证自然语言处理数据增强方法在日语处理中对英语的有用性
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    仲宗根太朗;櫻井義尚
  • 通讯作者:
    櫻井義尚
複数蒸留モデルのパラメータ探索と最適なモデルの提示
多重精馏模型的参数搜索及最优模型的呈现
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    船田毅;櫻井義尚
  • 通讯作者:
    櫻井義尚
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

櫻井 義尚其他文献

櫻井 義尚的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

深層転移学習と継続学習を組み合わせた筋電ベースヒューマンインタフェースの開発
结合深度迁移学习和持续学习的基于肌电的人机界面的开发
  • 批准号:
    23K28135
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
情報幾何学に基づく転移学習の解析と深化
基于信息几何的迁移学习分析与深化
  • 批准号:
    23K24909
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
実験科学研究の効率化のための能動学習と転移学習手法の開発
发展主动学习和迁移学习方法,提高实验科学研究效率
  • 批准号:
    24K20836
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
体育授業における転移学習実現につながる走・泳運動の技能獲得を目指した牽引法の開発
开发旨在获得跑步和游泳技能的牵引方法,从而在体育课上进行迁移学习
  • 批准号:
    24K14576
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
転移学習を用いた外挿的予測の実現と材料研究への応用
利用迁移学习实现外推预测及其在材料研究中的应用
  • 批准号:
    23K19980
  • 财政年份:
    2023
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
転移学習と知識グラフを用いたナレッジ活用型AIによる離農予測モデルの開発
使用基于知识的人工智能(利用迁移学习和知识图)开发农场废弃预测模型
  • 批准号:
    22K14959
  • 财政年份:
    2022
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
転移学習を用いた唾液腺癌の組織学的悪性度の再分類の試み
尝试使用迁移学习对唾液腺癌的组织学分级进行重新分类
  • 批准号:
    22K10210
  • 财政年份:
    2022
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Wi-Fiチャンネル状態情報に基づくコンテキスト認識のための転移学習技術
基于Wi-Fi信道状态信息的上下文识别的迁移学习技术
  • 批准号:
    21H03428
  • 财政年份:
    2021
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
オミクスの転移学習に基づく難治胃がんの精密医療の確立
基于组学迁移学习的难治性胃癌精准医疗建立
  • 批准号:
    19K22892
  • 财政年份:
    2019
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
転移学習付き遺伝的ネットワークプログラミングとその応用に関する研究
迁移学习遗传网络编程及其应用研究
  • 批准号:
    26730132
  • 财政年份:
    2014
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了