对你的问题,我的理解是对构建好的单倍体,下一步进行关联分析,在这个理解的基础上:
1.经验法:一般分析LD之前,要看一下marker之间的距离,
因为目前公共数据库已经有大部分人各个群体以及其他二倍体生物的LD值,可以通过marker间的距离,推出你的r^2与D是否足以构建单倍体。
然后针对你具体的群体,你需要计算你收集样本群体的LD进而构建单倍体。
2.对于连锁不平衡理解,可以如下解释
如果marker之间存在连锁不平衡,说明它们之间的序列没有突变,或者更清楚地说是IBD片段(来自同一祖先的片段)
目前的观点是在进化中,QTL效应越大其周围的片段突变率会越小,也就是后代在QTL附近出现纯合片段的可能性越高。
3.针对haplotype的关联分析,很多方法.
举个基础点的例子,认为haplotype是fixed effect(固定效应)
SNP1有allele:A1、A2和SNP2有allele:B1、B2
所以单倍体就是A1B1,A1B2,A2B1,A2B2
所以你就可以定义其maker score:1,2,3,4
4.BTW,如果DQA1与DQB1有连锁平衡(linkage equilibrium)?
那就不存在单倍体