《CHIMA2023-吕旭东-医疗大数据从可及到可用.pdf》由会员分享,可在线阅读,更多相关《CHIMA2023-吕旭东-医疗大数据从可及到可用.pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、医疗大数据:从可及到可用吕旭东浙江大学二二三年五月CHIMA 2023医疗大数据医疗信息化发展庞大、宝贵的医疗大数据资源全球数据总量预计在2025 年增长到 180ZB 以上,其中大约 30%的数据量由医疗健康行业产生全球数据总量From Statista,RBC Capital MarketsCHIMA 2023医疗大数据的潜在价值医疗大数据角色、疾病、过程特异性信息集成视图病历数据检索、分析、挖掘用药、循证、指南、个性化诊疗决策支持技术创新DeepMind Health能辨识视觉疾病的机器学习系统沃森智能机器人听懂“医生”问题,提供最佳诊疗方案深度学习认知计算生成模型chatGPT强大的“
2、学习”+“交互”,将带来医学实践的范式转变CHIMA 2023医疗大数据的问题和挑战(十年前)CHIMA 2023解决方案:医疗大数据整合与治理国家十三五重点项目精准医学大数据处理与利用的标准化技术体系医院临床科研大数据平台-山西白求恩医院-301海南医院-中部战区总医院临床专病数据库平台-邵逸夫乳腺癌-北肿肺癌专病-301心血管专病企业生物医学大数据资源平台-臻和生物科技-美年大健康建立医学大数据平台,开展医学大数据资源建设,成为国内的热点CHIMA 2023医疗大数据的应用现状和问题CHIMA 2023问题的关键:学科间的鸿沟算法数据需求价值应用跨学科融合临床研究:我看到国外有对芳香化酶抑
3、制剂药物的研究论文,想利用本院数据看看该药物的使用对骨血安全性的影响如何?临床预测:我想基于本院数据做一个跟国外类似的乳腺癌术后治疗预后软件大数据应用案例(北肿-浙大联合):大量未能满足的应用需求(举例):NSCLC分期预测模型临床分期预测病理分期预测预测准确率为90%以上淋巴结转移预测模型文字报告预测CT影像预测预测准确率均大于80%平台支持:提高数据处理效率?平台支持:降低数据处理和算法应用门槛?CHIMA 2023平台建设思路:数据驱动+需求牵引针对“个体化需求”建立工作流,提供方便抽取、处理以及分析数据的能力CHIMA 2023整合数据处理与碎片化的分析工具,建立问题导向的一体化临床研
4、究数据分析平台科研数据库首页分析变量管理研究报告管理研究人群管理科研数据库首页分析变量管理研究报告管理研究人群管理统计分析管理统计分析管理一、面向临床研究的数据分析平台CHIMA 2023筛选病例研究设计数据准备统计分析报告撰写平台功能展示CHIMA 2023确定研究变量数据准备统计分析报告撰写研究设计平台功能展示CHIMA 2023将变量“性别”转换为标准变量“GENDER”,其中“0”转换为“男”,“1”转换为“女”,其它转换为“未说明”根据“近期随访日期”与“确诊时间”计算得到“survival time”数据准备统计分析报告撰写研究设计平台功能展示对需要转换的研究变量进行配置CHIMA
5、 2023对需要从文本中抽取的变量进行模型训练及一键部署选择待处理的文本样例逐条标注文本进行文本分类选择NLP模型训练部署NLP模型数据准备统计分析报告撰写研究设计平台功能展示CHIMA 2023数据质量评估规则参数配置自动质量评估,生成问题数据集问题数据处理研究设计统计分析报告撰写数据准备平台功能展示CHIMA 2023缺失检测及处理异常检测及处理根据所识别出的质量问题执行相应的数据处理,优化数据质量平台功能展示研究设计统计分析报告撰写数据准备CHIMA 2023自动化统计分析研究设计数据准备统计分析报告撰写平台功能展示CHIMA 2023研究设计数据准备统计分析报告撰写平台功能展示统计分析
6、图表输出CHIMA 2023报告整体预览及导出研究设计数据准备统计分析报告撰写平台功能展示CHIMA 2023案例研究目的:探讨不同象限乳腺癌的临床病理特征与预后情况研究对象的纳入标准为:(1)年龄18岁的女性患者;(2)经病理证实为单侧乳腺癌且具有完整的临床和病理资料并接受随访的患者;(3)接受手术治疗的患者研究对象的排除标准为:(1)男性患者;(2)双侧乳腺癌患者;(3)副乳腺癌患者;(4)临床资料、病理资料、随访情况不完整的患者研究设计使用目的数据使用需求研究对象纳排性别、生日、确诊时间、组织学分类、手术性质、肿块位置、肿块部位临床病理特征分析月经情况、肿块位置、肿块部位、手术方式、病灶