-
输入层
- 理论上可以适配任意基于位点的下机结果
-
已经适配的下机实验数据
- fluidigm 96*96 芯片下机的 csv 文件
-
qPCR 平台
- 自定义的格式,Alleles.csv + 每个位点的 csv 格式结果
- ABI excel 下机文件
-
NGS
- vcf 格式文件
- annovar 程序输出的 tsv 格式文件
-
sanger
- 自定义的数据格式,一般用于位点验证
-
PHI
- genotrax 数据库
- 定义好的格式文件
- genopipe 提供 patien_data 模块处理 PHI
- 主要是下机的实验数据,其次还包括 PHI
-
质控层
- 控制下机数据的质控,只有通过质控的数据用于下游分析
-
批次质控
- 使用空白对照样本和回归测试对照样本
-
样本质控
- 性别位点
- 位点检出率
- 杂合度
-
位点质控
- MAF 检验
- 哈迪温伯格平衡检验
- 罕见位点验证
-
表型质控
- 表型结果分布检验
-
数据结构层
- SNP
-
GenoType
- Variant
- Sample
- Chip
- 将重要的数据概念进行抽象
-
算法层
- 将基因型转换成表型结果
- 依赖于知识库
- 部分算法依赖 PHI,如样本的性别和年龄
-
已经实现的算法
- LookUp,表查找方法
- CountRiskAllele,基于风险等位的个数
-
药物相关算法
- HaplotypeSimulation
- DrugMetabolism
- DrugEffectVote
-
位点加权风险算法
- MetabolicDisease
- RiskEstimation
- wGRS
- Haplotype_wGRS
- wGRS_Odds
- PrevalenceOdds
-
其他个性化的算法
- 用于饮食推荐的 DietRecommendation
- 乳腺癌算法
- 耳聋算法
-
知识库
- 定义每个表型的知识
- 每个表型一个文件
- 定义表型所使用的位点信息
- 指定需要调用的算法
- 作为重要的一部分整合在 genopipe 内部
- 已经定义 500+ 表型
-
渲染层
- 用于生成 pdf 报告
-
主样式层
- 定义了报告的内容结构
- 默认样式
-
子样式层
- 定义不同的样式替换主样式实现个性化
-
自定义产品
- 通过外部配置定义新产品
- 修改公司信息
- 定义产品要报道的表型
- 等等..
-
接口层
- json-rpc 的方式提供接口服务
- 注:genopipe 本身可以当成 python 包使用
- 依赖 genotrax2 的数据库系统
-
提供的服务包括
- 生成报告
- 获取指定样本指定表型的结果
- 获取指定产品的结果
- 等等..