強化学習エージェントのための生態学的ニッチ固有の制約構造を活用した状態分割法
利用生态位特定约束结构的强化学习代理的状态划分方法
基本信息
- 批准号:15700159
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
近年,ニューラルネットや強化学習,進化計算のような学習機構を取り入れた自律移動ロボットに関する研究が盛んである.しかしながら,現状では,たとえ高性能な学習機構を取り入れていても,地面のすべりや背景といった環境特有の情報,エージェントのアクチュエータやセンサの特性といった生態学的ニッチ固有の制約構造を巧く活用しないとロボットは全く機能しない.本研究では,自律的に知覚・行動を行う強化学習エージェントに対して与えられた生態学的ニッチ固有の制約構造を活用するための状態分割法を提案しその有用性を示した.提案手法では,知覚-行動-知覚という系列について,状態分割の整合性を検査し,矛盾が検出されるたびにさらなる分割を生じることによりその矛盾解消を試みる.すなわち,ある時刻における知覚入力に対して状態を割り当てるような状態分割器を考える.そして,行動を行った結果として生じる知覚入力を状態分割器に与え,状態を得る.系列をエージェントが行動するたびに蓄えていき,矛盾検出とその解消を行う.提案手法では、階層的な情報処理による状態分割を行うメカニズムを有し、階層は情報の縮約を、上位層は階層で縮約を行ったニューロンが発火した際に、次時刻ではどのような知覚変化を引き起こすかを予測している。この予測の精度にもとづいて状態分割を構成している。本年度は、この研究課題で新たに提案を行った上記の状態分割法について、車の山登り問題へ適用した研究について2004年7月にブダペストで行われたIJCNN04にて成果発表を行った。また状態だけではなく行動の分節化を行うようなアルゴリズムの拡張について検討した。
In recent years, there has been a great deal of research and development in the field of science and technology, and the institutions of science and technology have been enrolled in the field of self-regulation. The equipment, etc. In this study, self-disciplined knowledge practice reinforces the inherent rules and regulations of medical science and health science. The proposed method of state division is useful. The modus operandi of the proposal is not correct, the series of knowledge-action-knowledge strategies, the status division, the integration strategy, the conflict resolution, the resolution of the contradiction and the resolution of the contradiction. Please make sure that you are aware of the status of the splitter at all times. The operation results show that the students are aware of the status of the separator and the status of the splitter. A series of actions have resulted in the accumulation of conflicts and conflicts in the resolution of conflicts. The modus operandi of the proposal, the information of the proposal, the agreement of the proposal, the negotiation of the proposal, the transaction of the proposal, the negotiation of the agreement, the negotiation of the In order to improve the precision, the state of the state is divided into several parts. This year, we proposed a new proposal for this year's research project. This year, we proposed that the state division method and the mountain climbing problem should be studied in July 2004. in July 2004, we would like to make a report on the IJCNN04 results table. The status of the operation is related to the division of the bank, and the bank.
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hisashi HANDA: "State Space Construction of Reinforcement Learning Agents Based upon Anticipated Sensory Changes"International Joint Conference on Neural Networks. (採録決定). (2004)
Hisashi HANDA:“基于预期感官变化的强化学习代理的状态空间构建”神经网络国际联合会议(已接受)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
半田 久志其他文献
Heritage Creation in Chittagong Through the challenges of Adaptive Reuse of PK Sen Sattala
吉大港遗产创建应对 PK Sen Sattala 适应性再利用的挑战
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子 - 通讯作者:
Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子
Panam Nagar 歴史地区におけるレンガの実測と元素分析 バングラデシュにおける歴史的建造物の評価と保存方法に関する基礎的研究(その3)
帕南纳加尔历史街区砖块实测与元素分析 孟加拉国历史建筑评价与保护方法基础研究(三)
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子;土屋潤,下田千晴,谷正和,井上朝雄,麻生美希,Md. Huda Faisal;土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠 - 通讯作者:
土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠
鉄骨考古学によるイギリス植民地時代の建築年代特定に関する研究 その6Panam Nagar の歴史的建造物の年代特定
利用钢铁考古学研究英国殖民建筑年代测定第 6 部分:帕南纳加尔历史建筑年代测定
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴 - 通讯作者:
真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴
Precancerous nature of intestinal metaplasia with accelerated DNA methylation along with altered epigenomic landscape
肠化生的癌前性质伴随着 DNA 甲基化加速以及表观基因组景观的改变
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
玉井 龍成;米田 頼晃;印牧 奨真;樫田 博史;工藤 正俊;半田 久志;米田頼晃 半田久志 工藤正俊;長谷川翔;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi - 通讯作者:
Chihiro Takeuchi
不便益ー手間をかけるシステムのデザイン(第6章博物館の学びを支える手がかりのデザイン)
不便——设计一个耗时的系统(第6章:设计支持博物馆学习的线索)
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘 - 通讯作者:
白川 智弘
半田 久志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('半田 久志', 18)}}的其他基金
機械学習を援用した進化計算による有機薄膜太陽電池に適した化合物の探索
使用机器学习的进化计算来搜索适合有机薄膜太阳能电池的化合物
- 批准号:
23K11254 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Evolutionary Search of Structured Data by Using Deep Graph Kernels
使用深度图内核进行结构化数据的进化搜索
- 批准号:
20K12000 - 财政年份:2020
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)