珀尔修斯
任何医疗保健数据都需要转换为通用格式,然后才能用于分析. OMOP公共数据模型(CDM)有助于将不同的数据源组织到相同的关系数据库设计中. 然而, 提取, 转换和加载(ETL)过程可能很困难,通常需要强大的技术知识和领域专业知识.
珀尔修斯是一个软件解决方案,通过提供灵活和易于使用的可视化环境来简化CDM转换. 将数据转换为OMOP格式不需要很强的技术知识. 通过易于理解的3步流程执行所需的转换:预处理, 映射和转换.
它是如何工作的
好处
透明度
视觉界面引导用户完成不同的操作
转换过程可以实时查看, 使其在发生错误时能够迅速作出反应
可以查看所有转换运行的摘要和状态
可重用性
类似字段的自动映射,防止用户每次都从头开始
CDM字段的自动生成字段值
用户可以利用内置的源到源和源到标准词汇表查找
可靠性
数据质量检查测试数据是否符合给定的要求
应用程序集成了在观察健康数据科学和信息学(OHDSI)社区使用的工具, 包括大白兔, Rabbit-in-a-Hat, Usagi, 雅典娜和数据质量仪表板
Time & 成本效益
减少花费在手工过程上的时间,例如编码和将源数据映射到目标系统
与传统的转换项目相比,更少的人需要参与这个过程
一般工作流程
预处理
预处理
导入数据资产(例如.g. 白兔扫描报告或扫描数据库)
合并源表
审核并确认数据
映射
映射
保存一个映射并打开一个现有的映射
为concept_id字段创建自定义查找
将源映射到目标表/字段
搜索新代码和OMOP标准概念之间的映射
设置转换和词汇表查找
定义创建时代的逻辑(DRUG_ERAs, CONDITION_ERAs,等等).)
定义分组访问occurrence / observation_period记录的逻辑
创建ETL规范文档
转换
转换
将源代码转换为CDM
查看转换的进度
视图转换运行结果
导出结果以供离线查看和进一步分析