将棋人工知能に関するディープマインド社の大規模実験とその知識獲得過程の検証

DeepMind大规模将棋人工智能实验及其知识获取过程验证

基本信息

  • 批准号:
    20K12120
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

Silver らは 2019 年、囲碁・将棋などの知識を自己対局形式により獲得する人工知能プレイヤの強化学習アルゴリズム AlphaZero とその実験結果をサイエンス誌で発表した。本研究では、この先行研究の将棋における大規模実験の追試を市場に出回っているハードウエアを用いて行い、強化学習過程や生成された人工知能の性能を観測し、AlphaZero が将棋知識を獲得する過程を分析する。申請者は追実験を行うため、グラフィックス・プロセッシング・ユニット (GPU) を活用した自己対局生成の計算効率を追求した。NVIDIA 社の一個15万円程度の GPU (GeForce RTX 2080) を用いて、日産1万局程度の効率を達成した。現在申請者が参加している追実験のプロジェクトでは、市販ハードウエアのみを用いて構築された追実装は、AlphaZero の将棋の実験に準じた性能を獲得している (山下宏、保木邦仁、小林祐樹、AobaZero の高速化と現在の状況、コンピュータ将棋協会誌、vol. 32, pp. 72-86, 2021)。申請者は現在、計算機実験を行う環境整備に取り組み、性能評価を行うための実装について検討中である。本研究の成果物であるプログラムコードは、GitHub リポジトリ「AobaZero」(https://github.com/kobanium/aobazero) にて公開している。インターネットの検索エンジンにて、二つのキーワード「将棋」と「AobaZero」で検索すると、これが多数の Web ページで紹介されていることが分かる。
Silver らは 2019, 囲碁・ Shogi などのknowledge をown 対 game form によりReceived するartificial intelligence プレイヤのreinforcement learning アルゴリズム AlphaZeroとその実験RESULTSをサイエンス志で発 tableした. This study is a preliminary study of shogi and a large-scale trial of the market.エアを用いて行い、Reinforcement learning process やGenerationされたArtificial intelligence のPerformance を観testし、AlphaZero The process of acquiring shogi knowledge is analyzed. Applicant: は殟験を行うため、グラフィックス・プロセッシング・ユニット (GPU) We pursue the computational efficiency of our own game creation by making full use of it. NVIDIA has developed a 150,000 yen-level GPU (GeForce RTX 2080) that has achieved efficiency of 10,000 rounds per day. Applicants are now participating in the している Chase 実験のプロジェクトでは, the market vendor ハードウエアのみをbuild with いてされた Chase 実装は, and AlphaZeroの実験に正じたperformanceを取している (Hiroshi Yamashita, Kunihito Hogi, Yuki Kobayashi, AobaZero's high speed and current situation, Journal of the Shogi Association, vol. 32, pp. 72-86, 2021). Applicants are currently in charge of computer maintenance, environment maintenance, and performance evaluation. The results of this research are available on GitHub "AobaZero" (https://github.com/kobanium/aobazero). Webされていることが分かる.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
GitHub リポジトリ「AobaZero」
GitHub 存储库“AobaZero”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

保木 邦仁其他文献

Distributed computing of df-pn search using pseudo-random number
使用伪随机数的 df-pn 搜索的分布式计算
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    保木 邦仁;伊藤 毅志
  • 通讯作者:
    伊藤 毅志
エラーレートを用いた麻雀プレイヤの実力推定
利用错误率评估麻将玩家的能力
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久米洋輝;栗田萌;保木 邦仁
  • 通讯作者:
    保木 邦仁
個性を持った将棋プログラムを目指してー強くするという目標を達成した後にー
以独特的将棋计划为目标~在达到变强的目标后~
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松原 仁;保木 邦仁;伊藤 毅志;山下 宏;金子 知適
  • 通讯作者:
    金子 知適

保木 邦仁的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('保木 邦仁', 18)}}的其他基金

エンタテイメントゲームの最適戦略探求へ向けた新たな挑戦
探索娱乐游戏最优策略的新挑战
  • 批准号:
    24K15244
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
鏡像異性体の量子制御に関する理論的研究
对映体量子调控的理论研究
  • 批准号:
    00J06254
  • 财政年份:
    2000
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

The Impact of Immersive Theatrical Experience and Shogi Proficiency on Mindreading
沉浸式戏剧体验和将棋水平对读心术的影响
  • 批准号:
    23K02882
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Shogi and Literature database
将棋和文学数据库
  • 批准号:
    22K13043
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
古代日本の大型将棋に関する研究
日本古代大型将棋研究
  • 批准号:
    20K20689
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
The evaluation of the qualitative similarity of Dai-Shogi variants by using Machine Learning techniques
使用机器学习技术评估大将棋变体的定性相似性
  • 批准号:
    19K12719
  • 财政年份:
    2019
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Shogi feedback support system using spoken dialogue
使用口头对话的将棋反馈支持系统
  • 批准号:
    19K20341
  • 财政年份:
    2019
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Neural substrate underlying move generation in expert shogi (Japanese chess) players and its individual characteristic
将棋(日本象棋)专家棋手的走法生成背后的神经基质及其个体特征
  • 批准号:
    18K12007
  • 财政年份:
    2018
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人間とコンピュータの思考の関係に基づく将棋解説文の自動生成モデルの獲得
基于人机思维关系的将棋解说自动生成模型
  • 批准号:
    17J07068
  • 财政年份:
    2017
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
The evaluation of the qualitative similarity of Dai-Shogi variants by using computer self-play experiment
利用计算机自对弈实验评估大将棋变体的定性相似度
  • 批准号:
    15K00507
  • 财政年份:
    2015
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Digital Archive of Positions for Shogi
将棋棋局数字档案
  • 批准号:
    25540169
  • 财政年份:
    2013
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Development of Shogi opening algorithm that exceeds the Meijin
开发超越名人的将棋开局算法
  • 批准号:
    24500192
  • 财政年份:
    2012
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了