ロバスト統計を用いた異常値の影響を受けないシステム同定法の構築
利用鲁棒统计构建不受异常值影响的系统识别方法
基本信息
- 批准号:19K04448
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では観測に異常値が含まれるデータからシステムを推定するアルゴリズムを開発することが目的である.計画4年目にあたる2022年度は以下の3つの課題に取り組んだ.(1) システム同定のための非線形モデルとして本研究はポートハミルトン系に着目し,ポートハミルトン系のための強化学習法を提案した.強化学習は試行錯誤により報酬を最大化する制御則を獲得するアルゴリズムである.ポートハミルトン系のための強化学習は,未知パラメータを含むポートハミルトン系に対して制御則を学習する方法である.従来提案されていたポートハミルトン系のための強化学習に対して自然勾配法を導入することにより,従来よりも高速に学習が可能なアルゴリズムを提案した.(2) ポートハミルトン系のための強化学習はこれまで確率的方策が用いられてきたが,制御入力に含まれるノイズがシステムの意図しない動作を引き起こす可能性がある.本研究では確率的方策を決定論的方策に置きかえることにより制御入力にノイズが入らないようにし,決定論的方策を勾配法により学習するアルゴリズムを提案した.(3) 強化学習は報酬を最大化するアルゴリズムであるが,実問題を考えると報酬の観測に外れ値が混入する場合がある.外れ値の影響を抑えた推定を行う方法としてベータダイバージェンスを用いたロバスト推定が提案されている.ベータダイバージェンスを用いたロバスト推定は重み関数を用いることにより外れ値の影響を抑えた推定を行うことができる.本研究ではポートハミルトン系のための強化学習において,報酬の観測に外れ値が含まれる問題に対してベータダイバージェンスを用いたロバストなパラメータ更新則を提案した.
This study で は 観 に abnormal numerical measuring が containing ま れ る デ ー タ か ら シ ス テ ム を presumption す る ア ル ゴ リ ズ ム を open 発 す る こ と が purpose で あ る. For the 4th year of the plan, にあたる for the year 2022, the following <s:1> 3 に に projects に will be selected from the んだ group. (1) シ ス テ ム with fixed の た め の nonlinear モ デ ル と し て in this study は ポ ー ト ハ ミ ル ト ン に the mesh し, ポ ー ト ハ ミ ル ト ン is の た め の reinforcement learning method proposed を し た. Reinforcement learning によ trial error によ payoff を maximization する rules を obtain するア ゴリズムである ゴリズムである. ポ ー ト ハ ミ ル ト ン is の た め の reinforcement learning は, unknown パ ラ メ ー タ を containing む ポ ー ト ハ ミ ル ト ン department に し seaborne て suppression is を learning す る method で あ る. 従 proposals to さ れ て い た ポ ー ト ハ ミ ル ト ン is の た め の reinforcement learning に し seaborne て natural hook with method を import す る こ と に よ り, 従 to よ り も high-speed に learning が may な ア ル ゴ リ ズ ム を proposal し た. (2) ポ ー ト ハ ミ ル ト ン is の た め の reinforcement learning は こ れ ま で order of probabilistic が with い ら れ て き た が, suppression に into force including ま れ る ノ イ ズ が シ ス テ ム の meaning 図 し な い action packed を lead き こ す possibility が あ る. This study で は order of probabilistic を deterministic order に buy き か え る こ と に よ り suppression into force に ノ イ ズ が into ら な い よ う に し, deterministic order を hook match method に よ り learning す る ア ル ゴ リ ズ ム を proposal し た. (3) reinforcement learning は reward maximize を す る ア ル ゴ リ ズ ム で あ る が, be problem を exam え る と remuneration の 観 に outside れ numerical measuring が mixed with す る occasions が あ る. Presumption on outside れ numerical の influence を え suppression た を line う method と し て ベ ー タ ダ イ バ ー ジ ェ ン ス を with い た ロ バ ス ト constructive proposals が さ れ て い る. ベ ー タ ダ イ バ ー ジ ェ ン ス を with い た ロ バ ス ト presumption は heavy み masato number を with い る こ と に よ り outside れ numerical の influence を え suppression た presumed line を う こ と が で き る. This study で は ポ ー ト ハ ミ ル ト ン is の た め の reinforcement learning に お い て, remuneration の 観 に outside れ numerical measuring が containing ま れ る problem に し seaborne て ベ ー タ ダ イ バ ー ジ ェ ン ス を with い た ロ バ ス ト な パ ラ メ ー タ update is し を proposal た.
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ポートハミルトン系のための決定論的方策勾配強化学習法
端口-汉密尔顿系统的确定性策略梯度强化学习方法
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Beck Fabian;Sakamoto Noboru;Ott Christian;福永修一,小久保燎太
- 通讯作者:福永修一,小久保燎太
ポートハミルトン系のための陰的自然方策勾配強化学習法
汉密尔顿港系统的隐式自然策略梯度强化学习方法
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:芦田 樹;市原 裕之;福永修一,岩本有生
- 通讯作者:福永修一,岩本有生
ベータダイバージェンスを用いたポートハミルトン系のためのロバスト自然方策勾配強化学習法
使用 Beta 散度的 Port-Hamilton 系统的鲁棒自然策略梯度强化学习方法
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:M. Suzuki;Y. Takizawa and M. Hirata;福永修一,小久保燎太
- 通讯作者:福永修一,小久保燎太
自然勾配を用いたポートハミルトン系のための強化学習の高速化
使用自然梯度加速汉密尔顿港系统的强化学习
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:石川昌明;辻晃弘,鷹羽浄嗣,大橋あすか;福永修一,岩本有生
- 通讯作者:福永修一,岩本有生
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
福永 修一其他文献
福永 修一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('福永 修一', 18)}}的其他基金
投薬制御のためのプライバシ保護機能をもつ安全強化学習法の構築
一种具有隐私保护功能的用药控制安全强化学习方法的构建
- 批准号:
24K07555 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
機械学習アルゴリズムを用いた敗血症性凝固線溶障害の早期予測モデルの開発
使用机器学习算法开发脓毒性凝血和纤溶性疾病的早期预测模型
- 批准号:
24K12133 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アニーリングと機械学習の融合による説明可能AI基盤の研究
结合退火和机器学习研究可解释的人工智能基础设施
- 批准号:
24KJ1081 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
機械学習による滑走路の離着陸容量の短期的予測手法に関する研究
基于机器学习的跑道起降能力短期预测方法研究
- 批准号:
24K07722 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習を用いた波形解析による高速中性子エネルギー測定法の技術開拓
利用机器学习进行波形分析的快中子能量测量方法的技术开发
- 批准号:
24K08298 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
調理シミュレーションと機械学習の融合および非接触計測による加熱制御システムの構築
结合烹饪模拟与机器学习和非接触测量构建加热控制系统
- 批准号:
24K05572 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
- 批准号:
24K15796 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
- 批准号:
24K13948 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
- 批准号:
24K13518 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
- 批准号:
24K15093 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
- 批准号:
24K15095 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)