大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発
利用机器学习开发复制技术,提高大规模企业财务数据的全面性
基本信息
- 批准号:22K04609
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2026-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究ではビッグデータ科学におけるデータの不完全性(研究に必要なデータがしばしば欠けている)・非代表性(母集団からのランダムサンプルではない)・多ノイズ性(様々なノイズが含まれていてクリーニングが容易でない)・センシティブ(個人情報ななどど取り扱いが難しいデータがある)などの問題解決を図るため、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発する。この目的を達成するために、財務ビッグデータの欠損値の統計性の調査によってデータの網羅性を明らかにし、機械学習を用いた欠損値補完モデルを構築しモデルの精度を高め、欠損を補完したデータの整合性を網羅性の高いデータの統計性で確認し、最終的には欠損値補完モデルのライブラリおよび作成したレプリカデータの公開を行う。令和4年度は欠損値の統計性の調査するために現在保有している財務ビッグデータでるORBISの2016年版と2021年版を結合し、全企業毎に決算年に関する通年データとなるようにデータの整備を行った。そのうえで欠損値の統計性の調査を行いデータの網羅性を調査した結果、欠損値の統計性の国による違いを明らかにした。また同時に、決定木系の回帰モデルの一つであるCatBoostアルゴリズムの機械学習を用いた欠損値補完モデルの構築を行い。さらに構築したモデルを用いて財務諸表の売上と利益に関する欠損値の補間を実行し、補完後の分布の性質を調査し、結果を学術論文として発表した。
This study is based on the incomplete nature of science.(Necessary data for research are not available)·Non-representativeness (Parent Group)·Multi-purpose (including easy access to information)·Multi-purpose (personal information)·Problem solving, corporate finance, internal and external development. This goal is achieved through statistical investigation of the deficit value of the financial system, systematic investigation of the deficit value, mechanical learning, completion of the deficit value, construction of the deficit value, high accuracy of the deficit value, integration of the deficit value, statistical confirmation of the deficit value, and final completion of the deficit value. The statistical survey of the loss value of the company in 2016 and the 2021 edition of ORBIS is now maintained, and the annual financial report of the whole company is related to the annual maintenance. The results of statistical surveys of undervalued data and undervalued data are clear. At the same time, determine the system's return to the circuit of a set of parameters, such as CatBoost, mechanical learning, and the use of missing values to complete the circuit of construction. The research results of the research on the structure and application of financial statements and the research on the distribution of short-term losses are presented.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
GPT-2による環境や個人属性に依存した移動軌跡の時空間情報生成
使用GPT-2根据环境和个人属性生成运动轨迹的时空信息
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:水野貴之;堀込 泰三;藤本祥二;石川温
- 通讯作者:石川温
Neural probabilistic modeling of individual daily trajectories
个人日常轨迹的神经概率建模
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Takayuki Mizuno;Shouji Fujimoto;and Atushi Ishikawa
- 通讯作者:and Atushi Ishikawa
Copula-Based Synthetic Data Generation in Firm-Size Variables
公司规模变量中基于 Copula 的综合数据生成
- DOI:10.1007/s12626-022-00128-6
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Shouji Fujimoto;Atushi Ishikawa;and Takayuki Mizuno
- 通讯作者:and Takayuki Mizuno
Interpolation of non-random missing values in financial statements' big data using CatBoost
- DOI:10.1007/s42001-022-00165-9
- 发表时间:2022-05-26
- 期刊:
- 影响因子:3.2
- 作者:Fujimoto,Shouji;Mizuno,Takayuki;Ishikawa,Atushi
- 通讯作者:Ishikawa,Atushi
Employee Number Dependence in Labor Productivity Distribution
劳动生产率分布中的员工人数依赖性
- DOI:10.1007/s12626-022-00121-z
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Atushi Ishikawa;Takayuki Mizuno;and Shouji Fujimoto
- 通讯作者:and Shouji Fujimoto
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
藤本 祥二其他文献
Twitterデータによる都市の移民コミュニティ統合力の測定
使用 Twitter 数据衡量城市整合移民社区的能力
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
石川 温;藤本 祥二;水野 貴之 - 通讯作者:
水野 貴之
ビッグデータを用いた特許の出願数と会社業績の関係
利用大数据分析专利申请数量与公司绩效的关系
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
藤本 祥二;石川 温;水野 貴之;渡辺 努 - 通讯作者:
渡辺 努
藤本 祥二的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
機械学習アルゴリズムを用いた敗血症性凝固線溶障害の早期予測モデルの開発
使用机器学习算法开发脓毒性凝血和纤溶性疾病的早期预测模型
- 批准号:
24K12133 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アニーリングと機械学習の融合による説明可能AI基盤の研究
结合退火和机器学习研究可解释的人工智能基础设施
- 批准号:
24KJ1081 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
機械学習による滑走路の離着陸容量の短期的予測手法に関する研究
基于机器学习的跑道起降能力短期预测方法研究
- 批准号:
24K07722 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習を用いた波形解析による高速中性子エネルギー測定法の技術開拓
利用机器学习进行波形分析的快中子能量测量方法的技术开发
- 批准号:
24K08298 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
調理シミュレーションと機械学習の融合および非接触計測による加熱制御システムの構築
结合烹饪模拟与机器学习和非接触测量构建加热控制系统
- 批准号:
24K05572 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
- 批准号:
24K15796 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
- 批准号:
24K13948 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
- 批准号:
24K13518 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
- 批准号:
24K15093 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
- 批准号:
24K15095 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




