コホート間連携における調査票データクリーニングの自動化
群组间协作中问卷数据清理的自动化
基本信息
- 批准号:21K10465
- 负责人:
- 金额:$ 1.5万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
東北メディカル・メガバンク事業では、15万人の一般集団の検体やコホート情報を有し、申請者らは取得された調査票データ、生理学機能検査データを初めとした各種のデータについて、統計学・機械学習の技法を用いたエラー候補の検出を進めてきた。次世代医療の社会実装にむけての取組みが本格的に進む中、健常人ゲノムコホート・バイオバンクの必要性・重要性はますます高まっており、次のステップでは、既存のコホート研究との連携を推進し、健康・医療ビッグデータをさらに大規模化することが必須である。大規模なコホート連携のためには、調査票による生活習慣・環境曝露の測定法についても標準化されたデータ取得・信頼性確保の方法が必要となる。しかし、膨大なデータを全て人力で確認し、調査票原本に戻って修正の必要性を調べることは事実上不可能である。そこで本研究計画では、大規模なデータクリーニングにおいて、1) 集団からの外れ値を検出する際に既知の情報を利用して主成分分析(PCA)を拡張した統計的モデルを使用する、2) 検出されたエラー候補をその性質に基づいて分類・処理する、の二つの手法をあわせ用いることによってデータクリーニングを自動化し、データ取得方法と精度の違いによる統合困難化の回避を目的とする。令和4年度は、PCAを拡張した統計的モデルを用いた異常値検出の自動化アルゴリズムについて、目視検査との比較結果をもとにした調整を進めた。
Northeast メ デ ィ カ ル · メ ガ バ ン ク career で は, 150000 の general set 団 の 検 body や コ ホ ー ト intelligence を し, applicants ら は obtain さ れ た survey ticket デ ー タ, physiology function 検 デ ー タ を early め と し た various の デ ー タ に つ い て の, statistics, machine learning techniques を with い た エ ラ ー alternate の 検 out を into め て き た. Next generation medical の society be loaded に む け て の take group み が this lattice に into む, healthy human ゲ ノ ム コ ホ ー ト · バ イ オ バ ン ク の necessity, importance は ま す ま す high ま っ て お り, の ス テ ッ プ で は, existing の コ ホ ー ト research と の を link-up promote し, health, medical ビ ッ グ デ ー タ を さ ら に large scale す る こ と が must で あ る . Large-scale な コ ホ ー ト の link-up た め に は, investigation, ticket に よ る living habits, environmental exposure の measurement に つ い て も standardized さ れ た デ ー タ, obtained letter 頼 sex, ensure の way が necessary と な る. し か し, expands な デ ー タ を て all human で confirm し tickets, investigation, originally に 戻 っ て correction の necessity を adjustable べ る こ と は things be impossible on で あ る. そ こ で this research project で は, large-scale な デ ー タ ク リ ー ニ ン グ に お い て, 1) sets 団 か ら の outside れ numerical を 検 out す る interstate に already know の intelligence を using し て principal component analysis (PCA) を company, zhang し た statistics モ デ ル を use す る, 2) 検 out さ れ た エ ラ ー alternate を そ の nature に base づ い て classification, 処 Richard す る, の つ の gimmick を あ わ せ with い る こ と に よ っ て デ ー タ ク リ ー ニ ン グ を automation し, デ ー タ obtained method と precision の violations い に よ る hard integration in の avoid を purpose と す る. And 4 year は, PCA を company, zhang し た statistics モ デ ル を with い た abnormal numerical 検 の automation ア ル ゴ リ ズ ム に つ い て, visual 検 と の comparison results を も と に し た adjustment を into め た.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
牧野 悟士其他文献
牧野 悟士的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
被災高齢者の心的外傷後成長と認知機能:東日本大震災被災地における前向き研究
老年受灾者的创伤后成长和认知功能:东日本大地震受灾地区的前瞻性研究
- 批准号:
22K10564 - 财政年份:2022
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a Tool for Promoting Effective Transitions of Care at Hospital Discharge
开发促进出院护理有效过渡的工具
- 批准号:
21K10332 - 财政年份:2021
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
技術継承を可能にする分散協調型のデータクリーニング基盤の研究開発
研发可实现技术传承的分布式协同数据清洗平台
- 批准号:
19K20419 - 财政年份:2019
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Research on data understanding support through queries
通过查询支持数据理解的研究
- 批准号:
18K11315 - 财政年份:2018
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a new data cleaning method for questionnaires used in large cohorts
开发用于大群体调查问卷的新数据清理方法
- 批准号:
18K10099 - 财政年份:2018
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
糖尿病境界型が判明した人への意思決定支援ツールによる受診勧奨方法の開発と検証
开发和验证一种方法,鼓励诊断为边缘型糖尿病的患者使用决策支持工具进行体检
- 批准号:
18K17318 - 财政年份:2018
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Bidirectional Social System Design by Interaction of Real World and Simulations
现实世界与模拟交互的双向社会系统设计
- 批准号:
15H01785 - 财政年份:2015
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Model design and support tool development to improve the efficiency of dietary record surveys
模型设计和支持工具开发,提高膳食记录调查效率
- 批准号:
24501007 - 财政年份:2012
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
データベース照合に基づくテキスト・エンティティの同定に関する研究
基于数据库匹配的文本实体识别研究
- 批准号:
17650035 - 财政年份:2005
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Exploratory Research
Validation study of assays alternative to animal experiments from a statistical viewpoint
从统计学角度替代动物实验的分析方法的验证研究
- 批准号:
07680327 - 财政年份:1995
- 资助金额:
$ 1.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)