大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発

利用机器学习开发复制技术,提高大规模企业财务数据的全面性

基本信息

  • 批准号:
    22K04609
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2026-03-31
  • 项目状态:
    未结题

项目摘要

本研究ではビッグデータ科学におけるデータの不完全性(研究に必要なデータがしばしば欠けている)・非代表性(母集団からのランダムサンプルではない)・多ノイズ性(様々なノイズが含まれていてクリーニングが容易でない)・センシティブ(個人情報ななどど取り扱いが難しいデータがある)などの問題解決を図るため、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発する。この目的を達成するために、財務ビッグデータの欠損値の統計性の調査によってデータの網羅性を明らかにし、機械学習を用いた欠損値補完モデルを構築しモデルの精度を高め、欠損を補完したデータの整合性を網羅性の高いデータの統計性で確認し、最終的には欠損値補完モデルのライブラリおよび作成したレプリカデータの公開を行う。令和4年度は欠損値の統計性の調査するために現在保有している財務ビッグデータでるORBISの2016年版と2021年版を結合し、全企業毎に決算年に関する通年データとなるようにデータの整備を行った。そのうえで欠損値の統計性の調査を行いデータの網羅性を調査した結果、欠損値の統計性の国による違いを明らかにした。また同時に、決定木系の回帰モデルの一つであるCatBoostアルゴリズムの機械学習を用いた欠損値補完モデルの構築を行い。さらに構築したモデルを用いて財務諸表の売上と利益に関する欠損値の補間を実行し、補完後の分布の性質を調査し、結果を学術論文として発表した。
This research is incomplete due to the scientific nature of the research (research is necessary and necessary) and non Representative (parent set団からのランダムサンプルではない)多ノイズ性(様々なノイズが恾れていてクリーニングがEASY でない)・センシティブ(Personal information ななどど取り扱いがDIFFICULT しいデータがある) などのProblem Solving を図るため、Corporate financial management is possible with いて interpolation and external interpolation.このObjective achieved するために、Financial ビッグデータのLoss のStatistical のinvestigation によってデータのNetwork を明らかにし, Mechanical learning を Use いたlack value to make up for モデルをconstruct しモデルのprecisionを高め、undoubted をcompleted したデータのintegration をnetworking の高いデータのstatistical confirmationし、most The final shortcomings are made up for the shortcomings of the モデルのライブラリおよび and the したレプリカデータのOpen を行う. Statistical survey of debt losses in 2017 and 2017 The 6-year version and the 2021 version are combined, and the company-wide annual final accounting year is closed and the year is completed.そのうえで怤のstatistical survey を行いデータのNetwork をsurvey した results, owed loss のstatistical の国によるviolation いを明らかにした.またsimultaneously, determine the wood type's return to モデルの一つであるCatBoost アルゴリズムのMechanical LearningをUse いた's missing value to complete the モデルのconstructed を行い.さらにconstructs the したモデルを Uses the いてFinancial statements の売上 と interest に す る owed loss 値 tweenを実行し, the completed distribution of the properties of を investigation し, the results of the academic paper と し 発 table し た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
GPT-2による環境や個人属性に依存した移動軌跡の時空間情報生成
使用GPT-2根据环境和个人属性生成运动轨迹的时空信息
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    水野貴之;堀込 泰三;藤本祥二;石川温
  • 通讯作者:
    石川温
Neural probabilistic modeling of individual daily trajectories
个人日常轨迹的神经概率建模
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takayuki Mizuno;Shouji Fujimoto;and Atushi Ishikawa
  • 通讯作者:
    and Atushi Ishikawa
Copula-Based Synthetic Data Generation in Firm-Size Variables
公司规模变量中基于 Copula 的综合数据生成
  • DOI:
    10.1007/s12626-022-00128-6
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shouji Fujimoto;Atushi Ishikawa;and Takayuki Mizuno
  • 通讯作者:
    and Takayuki Mizuno
Interpolation of non-random missing values in financial statements' big data using CatBoost
  • DOI:
    10.1007/s42001-022-00165-9
  • 发表时间:
    2022-05-26
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Fujimoto,Shouji;Mizuno,Takayuki;Ishikawa,Atushi
  • 通讯作者:
    Ishikawa,Atushi
Employee Number Dependence in Labor Productivity Distribution
劳动生产率分布中的员工人数依赖性
  • DOI:
    10.1007/s12626-022-00121-z
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Atushi Ishikawa;Takayuki Mizuno;and Shouji Fujimoto
  • 通讯作者:
    and Shouji Fujimoto
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

藤本 祥二其他文献

Twitterデータによる都市の移民コミュニティ統合力の測定
使用 Twitter 数据衡量城市整合移民社区的能力
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 温;藤本 祥二;水野 貴之
  • 通讯作者:
    水野 貴之
企業活動停止率と非ジブラ則の関係
企业停业率与非吉布拉法的关系
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 温;藤本 祥二;水野 貴之;渡辺 努
  • 通讯作者:
    渡辺 努
ビッグデータを用いた特許の出願数と会社業績の関係
利用大数据分析专利申请数量与公司绩效的关系
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤本 祥二;石川 温;水野 貴之;渡辺 努
  • 通讯作者:
    渡辺 努
労働生産性及びその成長率分布に観られる統計的性質
劳动生产率及其增长率分布的统计特性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 温;藤本 祥二;水野 貴之
  • 通讯作者:
    水野 貴之
深層学習を用いた企業データ名寄せアルゴリズムの開発
利用深度学习开发企业数据名称匹配算法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤本 祥二;石川 温;水野 貴之
  • 通讯作者:
    水野 貴之

藤本 祥二的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

機械学習アルゴリズムを用いた敗血症性凝固線溶障害の早期予測モデルの開発
使用机器学习算法开发脓毒性凝血和纤溶性疾病的早期预测模型
  • 批准号:
    24K12133
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
アニーリングと機械学習の融合による説明可能AI基盤の研究
结合退火和机器学习研究可解释的人工智能基础设施
  • 批准号:
    24KJ1081
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
機械学習による滑走路の離着陸容量の短期的予測手法に関する研究
基于机器学习的跑道起降能力短期预测方法研究
  • 批准号:
    24K07722
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
機械学習を用いた波形解析による高速中性子エネルギー測定法の技術開拓
利用机器学习进行波形分析的快中子能量测量方法的技术开发
  • 批准号:
    24K08298
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
調理シミュレーションと機械学習の融合および非接触計測による加熱制御システムの構築
结合烹饪模拟与机器学习和非接触测量构建加热控制系统
  • 批准号:
    24K05572
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
  • 批准号:
    24K15796
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
  • 批准号:
    24K13948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
  • 批准号:
    24K13518
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
  • 批准号:
    24K15093
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了