医学用語における語構成要素の構造化と学習難易度に関する研究
医学术语的词成分结构及学习难度研究
基本信息
- 批准号:20K12552
- 负责人:
- 金额:$ 1.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は看護師を目指す学習者(外国人を含む)が、効率的に医学用語を理解するために、医学用語に様々な情報を付与して構造化することと、その構造化データに基づいて造語力、学習頻度、説明力の観点から学習難易度を設定し、その有効性を検証することである。これまで、看護教科書のデータを収集し、医学用語の抽出、医学用語の語構成要素について分析を行ってきた。分析対象とする医学用語については、既存の一般辞書と医療用語辞書に掲載されている用語を比較することで、出現頻度に基づいて整理を行った。本年度は医学用語を出現頻度、教科書における出現位置、文の中での役割、複合語内での位置をもとに構造化データを作成することと、その構造化データをもとに学習難易度を設定し、その有効性を検証することを目指した。看護教科書から抽出した単語の内、頻度が30以上の単語、頻度30以下だが既存辞書や国家試験の索引に出現していた単語 6753 語を使用した。データは 3 種類あり、収集したデータを正規化したもの、格助詞との接続の頻度の部分をtf-idf 化しその他を正規化したものを用いて、機械学習で難易度について分類実験を行った。難易度については次の4段階を設定した。1:一般的な辞書に含まれる医学用語、2:出現頻度は低いが重要な用語、3:看護の辞書でよく使用される基本的な用語、4:難易度1-3の単語が誤構成要素となり複数結合している用語。分類にはSVMとランダムフォレストで分類器を作成して実験を行った。分類に使った素性は格助詞や語構成要素の出現位置などを使用した。出現頻度が高い用語である難易度1と3については分類精度は良かったが、看護教科書だけでは出現パターンを多く収集することができず、出現頻度が低い難易度2と4についてはあまり良い分類結果にならなかった。
Purpose this study の は see junior &senior を refers す learners (foreigners を む) が, sharper rate に medical terminology を understand す る た め に, medical terminology に others 々 な intelligence を give し て structured す る こ と と, そ の structured デ ー タ に base づ い て build language, learning frequency, that forces の 観 point か ら learning difficulty level を set し, そ の have sharper sex を 検 card す る こ と Youdaoplaceholder0. こ れ ま で, nursing textbooks の デ ー タ を 収 し, medical terms の spare, medical language の language elements に つ い て line analysis を っ て き た. Analysis as seaborne と す る medical term に つ い て は, existing の general dictionaries と medical language dictionaries に first white jasmines load さ れ て い る language を compare す る こ と で frequency, に base づ い て finishing line を っ た. This year は medical term frequency を, textbooks に お け る present location, wen の で の で within the language of cutting, the composite の position を も と に structured デ ー タ を made す る こ と と, そ の structured デ ー タ を も と に learning difficulty level を set し, そ の have sharper sex を 検 card す る こ と を refers し た. Nursing textbooks か ら spare し た の 単 language, frequency が within more than 30 の 単, frequency below 30 だ が existing dictionaries や national test の index に appear し て い た 単 language 6753 language use を し た. デ ー タ は 3 kinds あ り, 収 し た デ ー タ を regularized し た も の, auxiliary と の meet 続 の frequency part の を tf idf to し そ の he を regularized し た も の を with い て, degree of difficulty mechanical learning で に つ い て classification be 験 を line っ た. The difficulty level is に, に て, て, て, and the <s:1> 4-level を setting is た た. 1: general な contains dictionaries に ま れ る medical terms, 2: a low frequency は い が important な expressions, 3: care の dictionaries で よ く use さ れ る basic な expressions, 4: difficulty level 1-3 の が mistakenly 単 language elements と な り plural combination し て い る expressions. The に とラ SVMとラ ダムフォレストで ダムフォレストで ダムフォレストで classifier を is made into a <s:1> て experiment を row った. The classification に makes った the natural <s:1> case particle や the constituent elements of the <s:1> appear in the position な <s:1> を を use た た. High frequency が い language で あ る difficulty level 1 と 3 に つ い て は good classification accuracy は か っ た だ が, nursing textbooks け で は appear パ タ ー ン を more く 収 set す る こ と が で き ず frequency, low が い difficulty level 2 と 4 に つ い て は あ ま い り good classification results に な ら な か っ た.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
内山 清子其他文献
内山 清子的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('内山 清子', 18)}}的其他基金
患者テキストの構造化と患者の症状言語化支援手法に関する研究
构建患者文本和描述患者症状的支持方法的研究
- 批准号:
24K15664 - 财政年份:2024
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Computing over Compressed Graph-Structured Data
压缩图结构数据的计算
- 批准号:
EP/X039447/1 - 财政年份:2024
- 资助金额:
$ 1.83万 - 项目类别:
Research Grant
地方議会における非構造化データと構造化データの有機的な連結に関する研究
地方议会非结构化数据与结构化数据有机联动研究
- 批准号:
23K21841 - 财政年份:2024
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Evaluating and Optimizing Care for Opioid Use Disorder using a Structured Data-Science Approach
使用结构化数据科学方法评估和优化阿片类药物使用障碍的护理
- 批准号:
10571088 - 财政年份:2023
- 资助金额:
$ 1.83万 - 项目类别:
パーキンソン病の非構造化データを用いたサブタイプ自動検出に関する研究
利用帕金森病非结构化数据自动检测亚型的研究
- 批准号:
23K06950 - 财政年份:2023
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CAREER: Resource Efficient Systems for Machine Learning on Structured Data
职业:结构化数据机器学习的资源高效系统
- 批准号:
2237306 - 财政年份:2023
- 资助金额:
$ 1.83万 - 项目类别:
Continuing Grant
On Optimal Transport-based Statistical Measures for Graph Structured Data and Applications
基于传输的最优图结构化数据统计方法及应用
- 批准号:
23K16939 - 财政年份:2023
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Machine learning for graph-structured data: Understanding complex biological systems
图结构数据的机器学习:理解复杂的生物系统
- 批准号:
RGPIN-2020-05341 - 财政年份:2022
- 资助金额:
$ 1.83万 - 项目类别:
Discovery Grants Program - Individual
Machine learning on biological structured data
生物结构化数据的机器学习
- 批准号:
559300-2021 - 财政年份:2022
- 资助金额:
$ 1.83万 - 项目类别:
Postgraduate Scholarships - Doctoral
Understanding and Improving Deep Learning for Structured Data
理解和改进结构化数据的深度学习
- 批准号:
RGPIN-2022-04636 - 财政年份:2022
- 资助金额:
$ 1.83万 - 项目类别:
Discovery Grants Program - Individual
Statistical Challenges and Methods in the Analysis of High Dimensional and Complex Structured Data
高维复杂结构化数据分析中的统计挑战和方法
- 批准号:
RGPIN-2018-05475 - 财政年份:2022
- 资助金额:
$ 1.83万 - 项目类别:
Discovery Grants Program - Individual