確率的言語モデルによる教育理論の共通知識基盤構築

使用概率语言模型构建教育理论的公共知识库

基本信息

  • 批准号:
    21K02759
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

2022年度は以下の研究をおこなった。(1) 教育研究コーパス構築 昨年度に引き続き、教育に関する日本語の学術研究論文、科研費の研究課題情報、オープン教材(Open Educational Resources)、書籍情報を収集して、必要な前処理をおこない、テキストデータ(コーパス)の構築をおこなった。前処理には論文PDF等のレイアウト検出およびテキスト抽出、文字の正規化処理、必要な字句訂正が含まれる。(2) 図表からの情報の抽出 昨年度に引き続き、論文PDFから図表(画像を含む)を抽出した上で、そこから変数のテキスト情報を抽出するソフトウェアの開発をおこなった。(3) キーワードの抽出 昨年度に引き続き、各リソースからキーワードを抽出するソフトウェアを開発した。キーワードの同義語を検出するプログラムの開発をおこなった。既存のキーワード抽出手法にはそれぞれ特徴があるため、採用を一つに限らず利用することにした。また、キーワードの集計および視覚化をおこなった。(4) 概念および変数の抽出のための言語モデル構築 学術論文等を入力として、用いられる概念および変数名を抽出するための言語モデルを、BERT系のPretained Modelのファインチューニングによって構築を実験中である。(5) ChatGPTの評価 本研究における昨年度に発表されたChatGPTの評価と本研究課題における可用性について評価をおこなった。ChatGPT/GPT-4は極めて優秀な大規模言語モデルベースのサービスであるが、本研究課題における専門用語(概念)抽出タスクでは精度が十分ではなく、一方で埋め込みベクトル(embeddings)を本研究の成果と組み合わせることは有用であると評価している。
The following research will be conducted in 2022. (1) Educational research project construction, academic research papers of the previous year's academic research papers on Japanese language, research project information on scientific research funds, and textbooks (Open Educational Resources), collection of book information, necessary pre-processing, and construction of をおこなった. Pre-processing includes extracting the paper PDF, etc., extracting the text, normalizing the text, and correcting the necessary words and sentences. (2) Extraction of the information from the 図表からのinformation. Extraction of the にHIき続き of the previous year and thesis PDF から図 list (portraits included)した上で、そこから剉数のテキストinformationをdraw out するソフトウェアの开発をおこなった. (3) キーワードのdrawing: Last year's に cited き続き, each リソースからキーワードをdrawing するソフトウェアを开発した. Synonyms for キーワードのを検出するプログラムの开発をおこなった. The existing extraction technique is the にはそれぞれ特徴があるため, and the を一つにlimited らずutilization することにした is used.また、キーワードの集および看覚化をおこなった. (4) The concept is drawn out and the language is constructed Academic papers, etc. として, using いられるconcepts および変numerous names をdrawing out するための语 モデルを, BERT department のPretained Modelのファインチューニングによってbuildsを実験中である. (5) ChatGPT's evaluation of this research topic last year's review of ChatGPT's usability of this research topic. ChatGPT/GPT-4 is an excellent large-scale speech language, and this research topic is a word (concept) extracted from a large-scale language. The accuracy is very high, and the embedding of one side is very accurate. s) The results of this research are combined and used to make useful comments.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
教育データの利用に関する諸問題
与教育数据使用相关的问题
  • DOI:
    10.15077/jsetstudy.2021.1_135
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金子真隆;北本卓也;野田健夫;武田 俊之
  • 通讯作者:
    武田 俊之
キーワードの分析によるオンライン授業に関する研究動向の探索
通过关键词分析探讨在线课堂研究趋势
教育におけるエビデンス概念の整理
组织教育中的证据概念
  • DOI:
    10.15077/jsetstudy.2021.3_48
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ryo Funabashi;Kohei Nabetani;Takeo Noda;Masataka Kaneko;Hironori Egi;武田 俊之
  • 通讯作者:
    武田 俊之
教育理論の共通知識基盤構築に向けて
建立教育理论的共同知识库
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    波多野和彦・中村佐里・三尾忠男;和田敦彦・三尾忠男・堀正士・雪嶋宏一・村上正行・岸麿貴子;武田俊之
  • 通讯作者:
    武田俊之
教育研究の共通知識基盤構築を目指した言語資源の利用
利用语言资源为教育研究建立共同知识库
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤慈;青木幹太;井上友子;星野浩司;Keiichi Takahashi;永田浩一,仙石祐;武田俊之
  • 通讯作者:
    武田俊之
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

武田 俊之其他文献

ラーニング・アナリティクスと教育データ
学习分析和教育数据
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山智喜;他152名;武田 俊之
  • 通讯作者:
    武田 俊之
教育データ分析のアナリシスパターンの検討
教育数据分析的分析模式的考虑
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山智喜;他152名;武田 俊之;武田 俊之
  • 通讯作者:
    武田 俊之
教育システムと「倫理的に配慮されたデザイン」
教育系统和“有道德意识的设计”
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山智喜;他152名;武田 俊之;武田 俊之;武田 俊之
  • 通讯作者:
    武田 俊之
Ruby on Railsの初学者のつまずき要因の分析支援ツール
Ruby on Rails 初学者的绊脚石分析支持工具

武田 俊之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了