A Study on Statistical Interpretation Methods for Machine Learning Results Using Shapley Values

使用 Shapley 值对机器学习结果进行统计解释方法的研究

基本信息

  • 批准号:
    20K11938
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

近年、深層学習をはじめとする機械学習技術が注目され導入が進められつつあるが、なぜそのような結果が得られたかの説明・解釈性が強く求められている。本研究では、予測器の入力と出力の関係に注目してブラックボックス的な機械学習結果を解釈する手法を開発する。開発手法では、経済学の分野で用いられている「複数人が協同した場合の利益の公平分配方法であるシャプレー値」を応用することで、数千にもおよぶ各説明変数が出力に及ぼす影響を線形和の形で適切に分離し、線形モデル等を前提として構築されている仮説検定や信頼区間といった統計学的な解釈手法をブラックボックスモデルに適用できるようにすることを目的とする。本年度は、説明変数間に相関がある場合において、シャプレー値による機械学習結果の解釈がどのように変わるかの検討を実施した。まず、シャプレー値によって機械学習モデルをどれだけ正確に解釈できたかという説明性を定量的に評価する手法を提案した。続いて、シャプレー値の定義に立ち戻って、説明変数に相関がある場合における貢献度の定量化を実施した。この結果、相関があっても、機械学習モデルの説明性は低下しないが、説明変数の貢献を正しく分配できないことを定量的に示した。そして、説明変数同士の相関がない場合においては、各説明変数のシャプレー値の分散(標準偏差)が大きい順に、説明変数を選択していくことで、使用できる説明変数の数が制限された場合における説明性を最大化できることを証明した。これまで各変数の重要性を表す指標としてシャプレー値の絶対値の和が広く用いられてきたが、理論的な裏付けはなかった。変数重要度としてシャプレー値の分散を用いることで、説明性を最大化できるという理論的な裏付けを示せた。
In recent years, deep learning has attracted much attention and machine learning technology has been introduced and introduced.るが、なぜそのような Result がget られたかのExplanation・solved 釈性がstrongくquest められている. This study focuses on the relationship between the input force and the output force of the predictor and the results of mechanical learning and the method of solving the problem. A method of fair distribution of benefits in situations where a plurality of people collaborate and collaborate.であるシャプレー値」を応用することで、千にもおよぶ Each explains the value, output, and influence line The shape and shape are appropriate, the separation is the same, the linear shape is the same as the premise and the structure is the same as the interval of the letter.ったStatistical analysis method is applicable to the purpose of とする. This year's は、Explain the number of relevant occasions があるにおいて、シャプレー値によるMechanical learning resultsの解釈がどのように変わるかの検问を実Shiした.まず、シャプレー値によってMechanical learningモデルをどれだけcorrectにThe explanation of the problem is the explanation of the quantitative method and the proposal of the method.続いて、シャプレーつのDefinitionに立ち戻って、Explanation valueにrelatedがあるoccasionにおけるContribution degreeのquantificationを実事した.このResults, Correlation があっても, Mechanical learning モデルの Explainability is low しないが, Explanatory value のContribution をpositive しくDistribution できないことをQuantitative に Show した.そして、Explanation of the correlation of the same number of values ​​がないoccasionにおいては、Each explanation of the value of the value のシャプレー値のdispersion (standard deviation)が大きい顺に、Explanation変数を选択していくことで、UseできるExplanation of the value of the valueのnumがlimitされたoccasionにおけるExplanatoryをMaximizeできることをproveした.これまでImportance table of each value すすINDICATOR夤の和が広く用いられてきたが, theoretical な里发けはなかった. Numerical importance and dispersion are used, and explanatory maximization and maximization are used in the theory of dispersion and dispersion.

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
患者状態把握を目的とした機械学習と共起有向グラフによる診療プロセス解析
使用机器学习和共现有向图进行医疗流程分析以了解患者状况
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山下 貴範;若田 好史;中熊 英貴;野原 康伸;岡田 美保子;中島 直樹;副島 秀久
  • 通讯作者:
    副島 秀久
Developing a Learning Health System for Delirium using XAI
使用 XAI 开发 Deliium 学习健康系统
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Koutarou Matsumoto;Yasunobu Nohara;Mikako Sakaguchi;Yohei Takayama;Hidehisa Soejima and Naoki Nakashima
  • 通讯作者:
    Hidehisa Soejima and Naoki Nakashima
交互作用を考慮したSHAPによる機械学習モデルの解釈
考虑交互作用,使用 SHAP 解释机器学习模型
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野原 康伸;井口 登與志;野尻 千夏;中島 直樹
  • 通讯作者:
    中島 直樹
Predictors of Intracerebral Hematoma Enlargement Using Brain CT Images in Emergency Medical Care
在紧急医疗护理中使用脑部 CT 图像预测脑内血肿扩大
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kazunori Oka;Takumi Hirahara;Yasunobu Nohara;Sozo Inoue;Koichi Arimura;Syoji Kobashi and Koji Iihara
  • 通讯作者:
    Syoji Kobashi and Koji Iihara
Stroke Prognostic Scores and Data-Driven Prediction of Clinical Outcomes After Acute Ischemic Stroke
  • DOI:
    10.1161/strokeaha.119.027300
  • 发表时间:
    2020-05-01
  • 期刊:
  • 影响因子:
    8.3
  • 作者:
    Matsumoto, Koutarou;Nohara, Yasunobu;Kamouchi, Masahiro
  • 通讯作者:
    Kamouchi, Masahiro
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

野原 康伸其他文献

並列化時間周期有限要素法を用いた回転機の磁界解析
使用并行时间周期有限元法对旋转电机进行磁场分析
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 創造;林田 興祐;中村 優斗;野原 康伸;中島 直樹;高橋康人
  • 通讯作者:
    高橋康人
Finding Nursing in the Room from Accelerometers and Audio on Mobile Sensors
通过移动传感器上的加速度计和音频查找房间内的护理情况
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 優斗;井上 創造;野原 康伸;中島 直樹
  • 通讯作者:
    中島 直樹
ブルームフィルタを用いた高速RFID識別方式
使用布隆过滤器的高速RFID识别方法
正規化最大尤度(NML)を用いた変化点同定についての理論解析
使用归一化最大似然 (NML) 识别变点的理论分析
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 優斗;井上 創造;野原 康伸;中島 直樹;宮口航平・山西健司
  • 通讯作者:
    宮口航平・山西健司
1歳半児が示す自他の知識・知覚状態の差異への感受性 ー三人称的視点からの検討ー
一岁半儿童对自我与他人的知识和知觉状态差异的敏感性——第三人称视角考察——
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 創造;上田 修功;野原 康伸;中島 直樹;Tetsu Iwata;孟憲巍・宇土祐亮・橋彌和秀
  • 通讯作者:
    孟憲巍・宇土祐亮・橋彌和秀

野原 康伸的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('野原 康伸', 18)}}的其他基金

構造化医療データを活用した大規模言語モデルの検証改良とモデル出力根拠説明法の開発
利用结构化医学数据改进大规模语言模型的验证以及模型输出基础解释方法的开发
  • 批准号:
    24K15166
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

大規模言語モデルと言語の代数系の同型構成による内部表現解釈手法の構築
利用大规模语言模型与语言代数系统同构构建内部表征解释方法
  • 批准号:
    24KJ1202
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
バーチャル環境の時空間的アーカイブの編集と追体験を通じた過去の再解釈手法の開発
开发一种通过编辑和重温虚拟环境的时空档案来重新解释过去的方法
  • 批准号:
    24K20812
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
都市空間における「ゆらぎ」を内包した複層的オーセンティシティの解釈手法の開発
开发一种解释多层真实性的方法,其中包括城市空间的“波动”
  • 批准号:
    20K04828
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了