Development a general-purpose imperfect information game AI that surpasses humans
开发超越人类的通用不完美信息游戏AI
基本信息
- 批准号:22K12339
- 负责人:
- 金额:$ 2.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2027-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
不完全情報ゲーム研究の題材として、ガイスターを中心に開発を行った。まず、モンテカルロ木探索の代表的な手法であるUCT探索の実装と研究を行った。完全情報ゲームの探索方法を不完全情報ゲームに用いると戦略融合の影響を受ける。既存手法では戦略融合の悪影響を受けやすいが、他の方法はこれまで検討されていない。そこで、探索内部で不完全情報を扱う仕組みを新たにいくつか提案し、対戦実験によりその性能を明らかにした。また、近年ガイスター研究で成果を上げた、方策勾配法を用いた評価方法を探索に用いる手法が開発されていないので、UCT探索に方策勾配法で求まる行動確率を用いる手法をいくつか提案し、対戦実験によってそれらの性能を評価した。実験結果から、優勝したAI を上回る強さが確認できた。ガイスター以外の不完全情報ゲーム研究では、AlphaZeroを不完全情報ゲームのChinese dark chess(CDC)とEinStein Wurfelt Nicht!(EWN)に適用し、パラメータ設定が学習に与える影響を調べた。具体的には局面を全列挙するlookup tableを用いたAlphaZeroに、完全解析された2×4 CDCと3×3 EWNと3×4 EWNを学習させ、その結果を理論勝率と最適戦略と比較した。実験の結果から、最善手を学習できるパラメータ設定の範囲が広いことがわかった。2×4 CDCの結果に基づき、通常のサイズの4×8 CDCの学習を試した。この手法を用いたAIが2022年7月に開催されたComputer Olympiad CDC大会で優勝した。また、人間を超えることを考えると、人間がどうプレイするかを調べることも重要であると考え、多腕バンディット問題と格闘ゲームとポケモン対戦において、認知バイアスと読み合いに関連する研究も行った。
该开发集中在Geister上,作为研究不完整信息游戏的主题。首先,我们实施并研究了UCT搜索,这是一种搜索蒙特卡洛树的典型方法。使用在不完整的信息游戏中探索完整信息游戏的方法将受到策略融合的影响。现有方法容易受到战略融合的不利影响,但到目前为止尚未探索其他方法。因此,我们提出了几种新的机制来处理搜索中不完整的信息,并通过战斗实验揭示了其性能。此外,由于使用测量梯度方法使用评估方法开发了搜索方法,该方法近年来已经在Geister研究中实现了,因此我们使用通过测量梯度方法确定的UCT搜索的行为概率提出了几种方法,并通过战斗实验评估了其性能。实验结果证实,它比获胜的AI强。在研究Geister以外的不完整信息游戏的研究中,Alphazero被应用于不完整的信息游戏中国黑暗国际象棋(CDC)和Einstein Wurfelt Nicht! (EWN)检查参数设置对学习的影响。具体而言,使用列出所有方面的查找表的Alphazero经过全面分析的2×4 CDC,3×3 EWN和3×4 EWN训练,并将结果与理论上的获胜率和最佳策略进行了比较。实验结果表明,参数设置范围很广,可以使您学习最佳的动作。根据2x4 CDC的结果,我们尝试学习正常大小为4x8 CDC。 AI使用此技术赢得了2022年7月举行的计算机奥林匹克疾病预防疾护锦标赛。此外,考虑到人类的玩法,研究人类的玩法以及与多武器强盗问题中的认知偏见和阅读有关的研究很重要,与多武器强盗问题,与游戏进行了打击和宠物游戏。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
格闘ゲーム初心者のための読み合い理解支援システム
格斗游戏初学者的相互阅读理解支持系统
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:青木 蓮樹 ; 橋本 剛;坂本 洸,シュエ ジュウシュエン,池田 心;酒見 真,シュエ ジュウシュエン,池田 心
- 通讯作者:酒見 真,シュエ ジュウシュエン,池田 心
不完全情報同時手番ゲームにおいて人間のような読み合いを演出するAIプレイヤ
一种在不完全信息的同步移动游戏中产生类似人类阅读理解能力的人工智能玩家
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Hsueh Chu-Hsuan;Chen Jr-Chang;小西 健太郎,池田 心,シュエ ジュウシュエン
- 通讯作者:小西 健太郎,池田 心,シュエ ジュウシュエン
Analyses of Tabular AlphaZero on Strongly-Solved Stochastic Games
- DOI:10.1109/access.2023.3246638
- 发表时间:2023
- 期刊:
- 影响因子:3.9
- 作者:Chu-Hsuan Hsueh;Kokolo Ikeda;I-Chen Wu;Jr-Chang Chen;T. Hsu
- 通讯作者:Chu-Hsuan Hsueh;Kokolo Ikeda;I-Chen Wu;Jr-Chang Chen;T. Hsu
CLAP_CDC wins Chinese dark chess tournament
CLAP_CDC夺得中国暗棋锦标赛冠军
- DOI:10.3233/icg-230220
- 发表时间:2023
- 期刊:
- 影响因子:0.4
- 作者:Hsueh Chu-Hsuan;Chen Jr-Chang
- 通讯作者:Chen Jr-Chang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
橋本 剛其他文献
グルコース識別機能を有するボロン酸型アゾプローブ/シクロデキストリン複合体の設計と機能評価
具有葡萄糖识别功能的硼酸型偶氮探针/环糊精复合物的设计及功能评价
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
新福千枝;佐々木彰;小澤りみ子;橋本 剛;鈴木巌;早下隆士 - 通讯作者:
早下隆士
超分子サイエンス第3節-1「クラウンエーテルによる分子認識と超分子形成」
超分子科学第3-1节“冠醚的分子识别和超分子形成”
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
橋本 剛;早下隆士(分担執筆) - 通讯作者:
早下隆士(分担執筆)
シクロデキストリン複合体を用いる超分子センシング
使用环糊精复合物的超分子传感
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
早下 隆士;藤田 なつみ;新福 千枝;小澤 りみ子;橋本 剛 - 通讯作者:
橋本 剛
ドーパミン認識機能を有する多点認識型アゾプローブ/シクロデキストリン複合体センサーの開発と評価
具有多巴胺识别功能的多点识别型偶氮探针/环糊精复合传感器的研制与评价
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
小柳津翔太;佐藤冬樹;橋本 剛;早下隆士 - 通讯作者:
早下隆士
糖質コルチコイド受容体拮抗薬ミフェプリストン単独の脂肪細胞分化促進作用
糖皮质激素受体拮抗剂米非司酮单用促进脂肪细胞分化的作用
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
橋本 剛;平野 勝也 - 通讯作者:
平野 勝也
橋本 剛的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('橋本 剛', 18)}}的其他基金
伝統的な民家・集落に学ぶ暑熱環境適応策としての屋外・半屋外空間デザイン手法の構築
借鉴传统民居和村落,构建适应炎热环境的户外/半户外空间设计方法
- 批准号:
23K21836 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
加齢に伴うインスリン抵抗性発症におけるトロンビン受容体PAR1の役割解明
阐明凝血酶受体 PAR1 在与衰老相关的胰岛素抵抗发展中的作用
- 批准号:
23K10890 - 财政年份:2023
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Help-seeking styles as availability of social resources
求助方式作为社会资源的可用性
- 批准号:
22K03020 - 财政年份:2022
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
伝統的な民家・集落に学ぶ暑熱環境適応策としての屋外・半屋外空間デザイン手法の構築
借鉴传统民居和村落,构建适应炎热环境的户外/半户外空间设计方法
- 批准号:
21H03756 - 财政年份:2021
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
The dark side of help-seeking
寻求帮助的阴暗面
- 批准号:
19K03190 - 财政年份:2019
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
名人に勝つコンピュータ将棋の開発
开发打败高手的电脑将棋
- 批准号:
18800017 - 财政年份:2006
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Young Scientists (Start-up)
伝統集落における緑化デザインの環境調節効果と景観特性
传统村落绿化设计的环境控制效果及景观特征
- 批准号:
18860016 - 财政年份:2006
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Young Scientists (Start-up)
ルテニウム錯体を反応場とするニトリルとケトンの新規反応に関する研究
以钌配合物为反应位点的腈与酮新反应研究
- 批准号:
15750056 - 财政年份:2003
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
名人レベルのコンピュータ将棋の開発および進化のゲーム理論への応用
大师级计算机将棋的开发以及进化论在博弈论中的应用
- 批准号:
02J02267 - 财政年份:2002
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
精神的健康に影響を及ぼす対人関係の否定的側面の規定因および媒介因の検討
检查影响心理健康的人际关系消极方面的决定因素和中介因素
- 批准号:
98J03310 - 财政年份:1998
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
Progress support programs that respect game players' intentions and values
尊重游戏玩家意图和价值观的进步支持计划
- 批准号:
20K12121 - 财政年份:2020
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
How to Coach Human Players using Computer Go Program
如何使用计算机围棋程序指导人类棋手
- 批准号:
17K00506 - 财政年份:2017
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a general purpose game AI that improves humanly
开发可提高人类素质的通用游戏人工智能
- 批准号:
17K00514 - 财政年份:2017
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)