紧急求助,关于用plink gwas做GWAS

用plink以及Haploview进行全基因组关联分析(GWAS)
&&&&由于图片格式不对无法插入到博客,所以只好先写在word里面,截图来看了
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。Lowerallelefrequencyrange,causalvariantUpperallelefrequencyrange,causalvariantLowerallelefrequencyrange,markerUpperallelefrequencyrange,markerMarker/causalvariantLD(D-prime)
Oddsratiofordisease,heterozygotecausalvariant
Oddsratiofordisease,homozyygotecausvalvariant,(or"mult")Forexample,
Implies5CVs,eachof5%MAFand2-foldmultiplicativeeffectsize(eachinlinkageequilibriumstill)butwith10additionalmarkers,eachof50%MAF,eachincompleteLDwithD’=0.5withtheirrespectiveCV(i.e.pairsofmarkersaresimulated).Thecommand
plink--simulateld.sim--simulate-tags--assoc
willthereforegenerateonly10SNPs,thatarethemarkersthattagtheCVs,i.e.notethefrequencyofthesevariantsisaround50%
SNPsnpsnpsnpsnpsnpBP12345
FU0...5005
CHISQ3...256
OR0...9685
Incontrast,therelatedcommand
plink--simulateld.sim--simulate-haps--assoc
willoutputboththecausalvariantandthemarker,withappendedtothemarkername:CHR
SNPsnpsnpMsnpsnpMsnpsnpMsnpsnpMsnpsnpM
A1DBDBDBDBDB
F0...650..4895
FU0.40....496
A2dAdAdAdAdA
CHISQ46.250.13.0.9
1.042e-110.e-08
0.0.e-090.e-06
OR2....40.9743
WARNINGAgain,pleasenotethatthisproceduredoesnotproduceanythinglikerealisticpatternsofLDasonewouldexpecttoobserveinwholegenomedatasets:rather,thissimplysimulatespairsofmarkers,forwhichthereisLDwithin,butnotbetween,pairs.
25.3Resimulatingasamplefromthesamepopulation
The--simulatecommandalsogeneratesthefileplink.simfreq.Thisrecords,foreachSNPofthetwosets,nullanddiseasefromthewgas.simexample,theactualallelefrequencychosenforthatparticularSNPwhensimulatingthedata.Forexample,
1null01null1
1.001.001.001.00
....0.970...001.001.001.001.00
Conveniently,thisinformationisoutputinthesameformatastheoriginalsimulationfile:notehowtheupperandlowerallelefrequencyrangeisconvergedtospecifyaparticularvalue,i.e.thefirstrowshowsarangeof0.5,i.e.effectivelyforcingtheallelefrequencyforthefirstSNPtobe0.1885.Thiscanbeuseful,astogenerateanewindependentdatasetfromthesamepopulationasthefirst,youwouldsimplyusetheplink.simfreqoutputfile,asinputforanew--simulatecommand,seebelow.
Puttingthistogether,onemightimaginesettingupasimplescreen/replicatesimulationdesign:firstwegeneratetheoriginalWGASscreeningdata
./plink--simulatewgas.sim--make-bed--outscreen
runourassociationtest
./plink--bfilescreen--assoc
andextractalistofsignificantSNPs(hereusingtheUnixgawkcommand,tofilteronthep-valuecolumn,9)
gawk’NR&1&&$9&1e-3print$2’plink.assoc&positives
andthengenerateandtestthesesameSNPsinanindependentsample
./plink--simulatescreen.simfreq--extractpositives--assoc--outreplication
etc.BylabelingtruediseaseSNPsandnullSNPssensiblyasabove,youcantellhowmanytruepositivesandfalsepositivesappearatthescreeningandthereplicationstages,e.g.usingUnixbashshellscriptingtosummariseresults:
s0=‘fgrepnullplink.assoc|gawk’$9&t’t=$t|wc-l‘
s1=‘fgrepdiseaseplink.assoc|gawk’$9&t’t=$t|wc-l‘
echo"Detected$s1truepositivesand$s0falsepositivesinscreening"
s0=‘fgrepnullreplication.assoc|gawk’$9&t’t=$t|wc-l‘
s1=‘fgrepdiseasereplication.assoc|gawk’$9&t’t=$t|wc-l‘
echo"Ofthese,$s1truepositivesand$s0falsepositivesreplicate"
25.4Simulatingaquantitativetrait
TosimulateaquantitativetraitbasedononeormoreunlinkedSNPs,usethecommand
plink--simulate-qtmyfile.sim--simulate-n1000
wheremyfile.simissimilarinformattothefiletakenbythestandard--simulateoption,exceptthetwofinalfieldsrepresenttheadditivegeneticvariance,andtheratioofdominancetoadditiveeffects,e.g.ifmyfile.simis
10qtl0.050.95
plink--simulate-qtmyfile.sim
willgeneratetenunlinkedQTLs,withallelefrequencybetween0.05and0.95forthetrait-increasingallele.Ineachcase,theeffectsizewillbecalculatedtogiveapopulationvarianceexplainedof0.01.Thefinal0indicatestheeffectsareadditive(1meanscompletedominance,-1meanscompleterecessive).Inthiscase,theoutputis
ReadingQTsimulationparametersfrom[sim1.sim]
WritingSNPpopulationfrequenciesto[plink.simfreq]
Read1setsofSNPs,specifying10SNPsintotal
SimulatingQTfor1000individuals
TotalQTLvarianceis0.1
Simulatingdiseasevariants(directassociation)
ThisliststhetotalpopulationvarianceexplainedbyallQTLs–inthiscase,0.1.Ifthevarianceexplainedisgreaterthan1,anerrormessagewillbereported.
Ifthe--assoccommandwerealsospecifiedalongwiththeabovecommand,standardQTassociationtestswouldbeperformedforeachsimulateSNP,e.g.plink.qassoc:
CHRSNPBPNMISSBETASER2TP1qtl80.13.1qtl560.1511qtl10.-3.
0.283.1qtl1qtl90.16321qtl40.23-4.1qtl70.633.1qtl10.551-2.360.018451qtl0.463.1qtl...showingR2(varianceexplained)valuesaround0.01,asexpected,withthesamplingvariationduetosampleof1000individuals(thedefaultsamplesize,if--simulate-nisnotspecified).
Theadditionalcommandssuchas--simulate-labeland--simulate-tags,etc,canbeusedwiththe--simulate-qtoption.
看过本文章的还看过。。。
plink使用方法_it计算机_专业资料。plink 是一套使用命令提示列的軟體,它有點...关于plink操作的说明 3页 1下载券
plink使用手册 293页 1下载券
plink a .........
plink使用_计算机软件及应用_it计算机_专业资料。plink 使用 d: cd d:program...plink使用方法 2页 免费 plink使用手册 293页 1下载券 plink 3页 免费 plink.........
plink-gplink-haploview-whole-genome-association-software-tutorial_生物学_自然科学_专业资料。plink haploview 使用手册 plink gplink haploview whole genome .........
tp-link 中文使用说明书_it计算机_专业资料。tp-link 中文使用说明书rev: .0 0 用户手册 tl-wa0g+ m无线接入器 选择知名品牌 品质更有.........
putty使用方法 51页 免费 关于plink操作的说明 3页 2财富值 gplink操作手册 5页 1财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点.........
tp-link路由器使用说明书_计算机硬件及网络_it计算机_专业资料。tp-link路由器使用说明书 tp-link 路由器安装设置完整教程【图文】 o 各种路由器的硬件安装,基本.........
t-plink路由器桥接方法_计算机硬件及网络_it计算机_专业资料。随着无线网络的...路由器桥接方法 上图所示为一小型企业无线网络,a、b、c 三个部门如果只使用 .........
tplink-wr700无线路由使... 2页 免费 tplink tl-wr703n使用说... 2页 免费 tplink路由器设置 11页 免费 tplink路由器设置方法 9页 免费喜欢.........
中国核基地——西域马兰_信息与通信_工程科技_专业资料。中国核基地——西域马兰 1967 年 6 月 17 日上午 9 时, 中国第一颗氢弹在新疆罗布泊爆炸, 据最后各项.........
马兰头为菊科植物马兰的全草或根,马兰头别名紫菊、阶前菊、鸡儿肠、马兰、竹 节草、马兰菊、蟛蜞菊、鱼鳅串、红梗菜等,马兰头有凉血止血、清热利湿、解毒 .........
新疆马兰基地_军事政治_人文社科_专业资料。新疆马兰基地 新疆马兰基地位于新疆......
马兰栽培技术_农学_农林牧渔_专业资料。马兰栽培技术马兰是一种历史悠久、民间食用多、开发潜力大的野生蔬菜。金华市长山良种场马兰生 产基地于 1998 年开发种植.........
马兰头药用价值_中医中药_医药卫生_专业资料。马兰头的功效: 马兰头为菊科植物马兰的全草或根, 马兰头别名紫菊、阶前菊、 鸡儿肠、 马兰、 竹节草、 马兰菊、.........
马兰,马兰_教育学_高等教育_教育专区。马兰,马兰 马兰,马兰 ——自然笔记 ▓......
马兰头的营养价值_中医中药_医药卫生_专业资料。马兰头的营养价值马兰头嫩茎叶含水分、钙、磷、铁、胡萝卜素、钾、维生素 b、 尼克酸等。 中医认为马兰头性味辛.........
马兰概况_林学_农林牧渔_专业资料。马兰矿矿井概况一、矿井基本概况(一)概况 马兰矿地处吕梁山东翼、汾水之滨,位于太原市城区西南 69 公里,古交市西南 16 公里.........
酸菜鱼的做法材料:草鱼 1 条、酸菜 1 袋、鸡蛋白(1 个)、食盐半勺、姜小块......
民俗美食之酸菜鱼 酸菜鱼的做法 ? 酸菜鱼菜名由来 ? 酸菜鱼简介 ? 目录 酸菜鱼简介酸菜鱼属四川菜系,以其特有的调味和独特的烹调 技法而著称。以鲜草鱼为主.........
家常酸菜鱼怎么做好吃_企业管理_经管营销_专业资料。家常酸菜鱼怎么做好吃酸菜鱼的做法: 1、鱼切成薄片,加适量料酒,姜粉、鸡蛋清,抓匀,腌 20 分钟左右。 2、.........
正宗酸菜鱼做法_哲学历史_人文社科_专业资料。正宗酸菜鱼做法(全程图)一、先是......
做好酸菜鱼的关键是什么_环境科学食品科学_工程科技_专业资料。酸菜鱼好吃却不好做,窍门在哪里,来看看吧。做好酸菜鱼的关键是什么—酸菜鱼资深美女 发表于 ........
把酸菜鱼做的好吃的4个关键 ryrxl 把酸菜鱼做的好吃的4个关键的原文
29069人看过 收藏更多分享到: 酸菜鱼属四川菜系,以鲜草鱼为主料,配.........
论:酸菜鱼的由来及营养价值_饮食_生活休闲。论:酸菜鱼的由来及营养价值 酸菜鱼的故事由来:酸菜鱼源于重庆江津的江村渔船。据传,一个住在深的山渔夫每天都会将.........
酸菜鱼的做法最正宗的做法,轻松做酸菜鱼(厚学网) 酸菜鱼的做法最正宗的做法一定有朋友不知道, 酸菜鱼是一道著名的川菜, 它的口味也 是以麻辣为主,让人吃了.........
难度:切墩(初级) 时间:10-30 分钟 主料长茄子 3 个 蒜适量 猪肉馅适量 鱼香茄子的做法 这道菜味道鲜美、柔软润香、鲜咸适口、营养也非常丰富。下饭更是一.........
鱼香茄子的功效_中医中药_医药卫生_专业资料。鱼香茄子的功效 ? 鱼香茄子是一道......
鱼香茄子做法及家常菜做法大全近日,《一道川菜炒出法国传奇》报道讲到,川菜在法国的红火,促进了法 国人了解中国文化。 现在越来越多的外国人爱上了川菜,鱼香茄子.........
鱼香茄子煲的做法(图)_农学_农林牧渔_专业资料。美味煲仔鱼香茄子煲的做法 材料......
鱼香茄子的做法_中医中药_医药卫生_专业资料。鱼香茄子的做法:将茄子切成滚刀块或......
鱼香茄子的做法大全鱼香茄子的家常做法怎么做鱼香茄子如何做鱼香茄子_中医中药_医药卫生_专业资料。鱼香茄子的做法大全鱼香茄子的家常做法怎么做鱼香茄子如何做鱼香茄子 .........
鱼香茄子家常做法_机械仪表_工程科技_专业资料。鱼香茄子家常做法 鱼香茄子家常做法 防治胃癌: 茄子含有龙葵碱, 能抑制消化系统肿瘤的增殖, 对于防治胃癌有一定.........& 记住密码
& plink计算LD值
查看: 5203|回复: 7
最后登录&注册时间&威望0 &活跃度22600 ℃&金币44 枚&积分47&精华0&帖子12&主题1&
我最近用plink计算LD的R2值,但是没有明显的衰减,离得很远的距离还是有很高的R2值。我的命令:plink --file mydata --r2 --ld-window-kb 3000 --ld-window-r2 0 请各位大侠帮忙啊!&&还有,计算的R2值有很多1,很远的距离也有一些1,请问这是什么原因呢?我作图的话是分区段求平均值,还是怎么弄?
最后登录&注册时间&威望0 &活跃度6575 ℃&金币14 枚&积分15&精华0&帖子4&主题0&
我觉得你首先需要把你的输入数据检查一遍吧。不知道你分析的是什么物种,但是较远距离内依然还有r2=1,应该是不多见的!一般来说,这类分析的目的主要反映LD是否随着物理距离的增加是否衰减,所以分段求其均值以便量化这种衰减关系。但是仅有这种LD的分析还是不够的。我觉得用HAPLOVIEW检测分析是否有HAPLOTYPE BLOCK也是必不可少的。
最后登录&注册时间&威望0 &活跃度22600 ℃&金币44 枚&积分47&精华0&帖子12&主题1&
谢谢您的回答,我做的是猪的,那些位点也是经过质控后的,我分段计算了,随着物理距离的增加,LD没有明显衰减。我问了一个老师(也是研究猪),他说他用plink算的也是这样,所以他就自己算了一遍,有衰减。难道是这个软件有问题?但是这应该不至于是软件的原因吧。
最后登录&注册时间&威望0 &活跃度6575 ℃&金币14 枚&积分15&精华0&帖子4&主题0&
我没有用过PLINK直接计算过一条染色体上上的多个MARKER的LD值,我用过Haploview做过!你可以再用Haploview 看下,如果你的样本量不是很大。HAPLOVIEW应该是相当快的。你是华中农大的吗!
最后登录&注册时间&威望0 &活跃度22600 ℃&金币44 枚&积分47&精华0&帖子12&主题1&
我是华中农大的。这个我也问了一些人,说分段计算,再拟合一下。总觉得不太准确。我也用Haploview做了,看到的R2值差不多。
最后登录&注册时间&威望0 &活跃度6575 ℃&金币14 枚&积分15&精华0&帖子4&主题0&
其实到现在不清楚的主要分析目的!是GWAS的后续分析呢!还是专门做一些群体的全基因组LD pattern的探索性分析!
对你的数据结构也不清楚。是F2呢!还是特定的地方品种群体。很想了解下,第一你的样本量有多大!第二你是统计分析了几条染色体的计算结果!第三既然R_2没降低,那平均值是多少呢!另外D_prime等于1的MARKER PAIR多吗!
当然,不方便的话就不需要说了! 个人觉得你说的问题理论上在某条染色体的特殊区段出现上述情况是可能的!但是如果总体上观察到这种现象确实比较奇怪。
最后登录&注册时间&威望0 &活跃度22600 ℃&金币44 枚&积分47&精华0&帖子12&主题1&
其实我主要是想做一下中外品种猪的LD分析,每个群体,每条染色体想比较一下。群体的话都是20几个。
最后登录&注册时间&威望0 &活跃度4765 ℃&金币20 枚&积分22&精华0&帖子12&主题0&
头像被屏蔽
CopyOf1 路过!
提示: 作者被禁止或删除 内容自动屏蔽
Powered by
Copyright &1819人阅读
PLINK&is a free, open-source whole genome
association analysis toolset, designed to perform a range of basic, large-scale analyses in a computationally efficient manner.
Plink是一个免费的,开源的全基因组关联分析的工具集,是设计用来在高效计算方式完成一系列基础的,大规模分析。
The focus of&PLINK&is
purely on&analysis&of genotype/phenotype data, so there is no support for
steps prior to this (e.g. study design and planning, generating genotype or CNV calls from raw data). Through integration with&and&,
there is some support for the subsequent visualization, annotation and storage of results.
Plink的关注点在于基因型/表型的数据分析,因此没有关于在这(运行plink)之前的步骤的帮助(例如研究方案的设计与计划,产生基因型或者从raw
data中找出CNV)。通过gPLINK和Haploview软件覆盖,后期数据的可视化、注释和结果的储存还是有一些帮助与支持的。
可能翻译得不好,如有错误或者更好的理解建议,欢迎评论指正。
一、Plink的安装
1、下载Plink安装包或者源代码:
2、根据自己的环境进行安装。
& & & & 由于暂时没有服务器,暂时在windows下搭建。下载的plink是一个压缩包,解压到目录,为了方便我将安装目录添加到Path路径里。
3、测试运行。
二、使用方法:
& & & &例子:&./plink --ped test.ped --map test.map&
ped格式的文件格式见
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:2202次
排名:千里之外

我要回帖

更多关于 紧急求助电话 的文章

 

随机推荐