目前进展

1) 用Rcpp改进算法,单独一个估参约,速度为之前的1/2,多组联合估参速度加快较明显,5组7h vs 1.2h

2) 完成simulation,确认EM结果

  • 如果用posterior更新pi,则得到的gama != simulated gama
  • 若只更新gama,则得到的average gama ≈ simulated gama

3) 用Optim 更新gama, 并利用后验概率更新pi0, gama最后收敛,annota effect size增大

  • cutoff: 相对误差<1e-5),于第47轮收敛,第一轮1.8,收敛值为2.5
  • 目前尚未确认多组annotation收敛的标准,以及多组注释是否要按这种方案得出posterior(13组一轮joint estimation 用时4.3h,平均一组跑47轮收敛)
  • 若用这种方案,则pi,gama的初始值对收敛值影响不大

4) 按贺老师的方案,同时估gama和一个scalar pi0,当只有一个annota的时候,gama初始值的设定对结果影响很大 https://yfu1116.github.io/project/2021-03-25-optim-multi-scalar-pi-gama/

下周计划

  • 分析4)的原因
  • 讨论2),3)存在的问题
  • 完成feature selection,分析各组功能注释之间关联性(heatmap)
  • Analysis funciton of risk genes
  • burden test for CHD data.