怎么把2bit genomee转成2bit

Genome Browser Utilities
JavaScript is disabled in your web browserYou must have JavaScript enabled in your web browser to use the Genome Browser
UCSC Genome Browser Utilities
The following tools and utilities created by the UCSC Genome Browser Group are available for
public use:
converts genome coordinates and genome annotation files between assemblies. The current version
supports both forward and reverse conversions, as well as conversions between selected
removes formatting characters and other non-sequence-related characters from an input sequence.
Offers several configuration options for the output format, including translated protein.
removes formatting characters and other non-sequence-related characters
from an input sequence. Offers several configuration options for the output format.
- creates a PNG image
from the phylogenetic tree specification given. Offers several configuration options for branch
lengths, normalized lengths, branch labels, legend etc.
- executable and source code downloads of the Genome Browser,
Blat and liftOver.From Genomewiki
Prerequisites: you have the kent source tree checked out in your home directory ~/kent/src/
and you are familiar with the contents of the README files in ~/kent/src/product/README.*
You have built all of the utilities (see those README files:
Organize your work.
Decide on a database name.
UCSC bases our names on the binomial nomenclature.
The UCSC naming scheme is abcDef1 where abc is the first three letters of the genus, Def is the first three letters of the species, the 1 is the version of the genome.
Versions start at 1.
At UCSC we use a symlink from /cluster/data/abcDef1 -& to a filesystem that has enough data space to contain the build.
Thus, all genome builds can be found from /cluster/data/ despite their actual NFS filesystem location.
For this discussion, our new genome name will be simply: abcDef1.
A few files are kept in /cluster/data/abcDef1/ but most work files for tracks are kept in /cluster/data/abcDef1/bed/trackName/
You should have fasta file(s) of your genome sequence and an
file describing their construction from contigs into scaffolds, or scaffolds into chromosomes, or combinations thereof.
AGP files can be constructed purely from fasta files if no AGP file exists (hgFakeAgp).
Usually assemblers will be producing an AGP file.
To mark all N's as gaps in your fake AGP:
hgFakeAgp -minContigGap=1 newGenome.fa abcDef1.agp
3. Convert your fasta to 2bit format:
$ faToTwoBit newGenome.fa abcDef1.2bit
$ mkdir /gbdb/abcDef1
$ mkdir /gbdb/abcDef1/html
$ ln -s `pwd`/abcDef1.2bit /gbdb/abcDef1/abcDef1.2bit
4. verify your agp file matches your fasta file:
$ sort -k1,1 -k2n,2n original.agp & abcDef1.agp
$ checkAgpAndFa abcDef1.agp abcDef1.2bit
5. Create a chromInfo file:
$ twoBitInfo abcDef1.2bit stdout | sort -k2nr & chrom.sizes
$ mkdir -p bed/chromInfo
$ awk '{printf "%s\t%d\t/gbdb/abcDef1/abcDef1.2bit\n", $1, $2}' \
chrom.sizes & bed/chromInfo/chromInfo.tab
6. Start your new database:
(you may need to update your MySQL database permissions to allow access to your new database)
$ hgsql -e "create database abcDef1;" mysql
7. Load the grp table:
$ hgsql abcDef1 & $HOME/kent/src/hg/lib/grp.sql
8. Load the chromInfo table:
$ hgLoadSqlTab abcDef1 chromInfo $HOME/kent/src/hg/lib/chromInfo.sql \
bed/chromInfo/chromInfo.tab
9. Load the gold and gap tables from your AGP file:
$ hgGoldGapGl abcDef1 abcDef1.agp
10. Generate the gc5Base data and load table:
$ mkdir bed/gc5Base
$ cd bed/gc5Base
$ hgGcPercent -wigOut -doGaps -file=stdout -win=5 -verbose=0 abcDef1 \
../../abcDef1.2bit | wigEncode stdin gc5Base.{wig,wib}
$ hgLoadWiggle -pathPrefix=/gbdb/abcDef1/wib \
abcDef1 gc5Base gc5Base.wig
$ mkdir /gbdb/abcDef1/wib
$ ln -s `pwd`/gc5Base.wib /gbdb/abcDef1/wib
11. Create the dbDb SQL insert statement.
The orderKey is determined from existing dbDb entries.
This creates the order of the pulldown menus in the gateway page.
Place this into a file: dbDbInsert.sql and load it with the command:
hgsql hgcentral & dbDbInsert.sql
INSERT INTO dbDb
(name, description, nibPath, organism,
defaultPos, active, orderKey, genome, scientificName,
htmlPath, hgNearOk, hgPbOk, sourceName, taxId)
(&abcDef1&, &July 2008&, &/gbdb/abcDef1&, &A. organism&,
&chr1:69783&, 1, 123, &A. organism&, &Genus species&,
&/gbdb/abcDef1/html/description.html&, 0, 0, &new genome version 1.0&, 12345);
12. Create defaultDb and genomeClade table SQL entries.
For example:
hgsql hgcentral -e 'INSERT INTO defaultDb (genome, name) VALUES (&A. organism&, &abcDef1&);'
hgsql hgcentral -e 'INSERT INTO genomeClade (genome, clade, priority) VALUES (&A. organism&, &vertebrate&, 123);'
the genomeClade.priority helps choose the default genome for that clade.
See examples of these values in the existing defaultDb and genomeClade tables.
You can verify the hgcentral table relationships with a join command on these tables:
hgsql -e &SELECT d.name,d.orderKey,g.genome,g.priority,g.clade,d.scientificName FROM
dbDb d, genomeClade g
WHERE d.organism = g.genome
ORDER by d.orderK& hgcentral
Make a trackDb hierarchy of your genome.
Populate it with trackDb.ra files and a description.html file.
See existing examples in the source tree ~/kent/src/hg/makeDb/trackDb/.
It does not have to be in the source tree.
You can load it into a separate database with the hgTrackDb and hgFindSpec commands.
Place a reference to this trackDb extra database via your cgi-bin/hg.conf options.
Personal tools
This page was last modified on 28 May 2015, at 23:40.
This page has been accessed 31,972 times.Bowtie2用法祥解;懒人必看;对参考序列构建index;$bowtie2-buildgenome.fas;尝试使用前10000个reads进行比对;$bowtie2-u10000-p8-xinde;使用8个线程进行比对;$bowtie2-p8-xindex-1read;比对的sam结果中添加了readgroup信息;$bowtie2-p8--rg-ids
Bowtie2用法祥解
懒人必看 对参考序列构建index $ bowtie2-build genome.fasta index
尝试使用前10000个reads进行比对 $ bowtie2 -u 10000 -p 8 -x index -1 reads1.fq -2 reads2.fq -S out.sam
使用8个线程进行比对 $ bowtie2 -p 8 -x index -1 reads1.fq -2 reads2.fq -S out.sam
比对的sam结果中添加了read group信息 $ bowtie2 -p 8 --rg-id sample01 --rg \--rg \index -1 reads1.fq -2 reads2.fq -S out.sam
常用的参数进行比对,可以更改其中的参数获得更好的结果 $ bowtie2 -q --phred33 --sensitive --end-to-end -I 0 -X 500 --fr --un unpaired --al aligned --un-conc unconc --al-conc alconc -p 6 --reorder -x
{-1 <m1 -2
| -U } -S [] 用法: bowtie2 [options]* -x
| -U } -S [] bowtie2-build用法 bowtie2-build默认情况下将fasta文件换成index的数据库。 $ bowtie2-build
必须参数: -x 由bowtie2-build所生成的索引文件的前缀。首先 在当前目录搜寻,然后 在环境变量BOWTIE2_INDEXES中制定的文件夹中搜寻。
-1 双末端测寻对应的文件1。可以为多个文件,并用逗号分开;多个文件必须和-2 中制定的文件一一对应。比如:\_2.fq\测序文件中的reads的长度可以不一样。
-2 双末端测寻对应的文件2.
-U 非双末端测寻对应的文件。可以为多个文件,并用逗号分开。测序文件中的reads的 长度可以不一样。
-S 所生成的SAM格式的文件前缀。默认是输入到标准输出。 以下是可选参数: 输入参数 -q输入的文件为FASTQ格式文件,此项为默认值。
-qseq输入的文件为QSEQ格式文件。
-f输入的文件为FASTA格式文件。选择此项时,表示--ignore-quals也被选择了。
-r输入的文件中,每一行代表一条序列,没有序列名和测序质量等。选择此项时,表示-- ignore-quals也被选择了。
-c后直接为比对的reads序列,而不是包含序列的文件名。序列间用逗号隔开。选择此项时, 表示―ignore-quals也被选择了。
input的reads中,跳过前个reads或者pairs。
-u/--qupto 只比对前个reads或者pairs(在跳过前个reads或者 pairs后)。Default: no limit.
-5/--trim5 剪掉5'端长度的碱基,再用于比对。(default: 0).
-3/--trim3 剪掉3'端长度的碱基,再用于比对。(default: 0).
--phred33输入的碱基质量等于ASCII码值加上33.在最近的illumina pipiline中 得以运用。最低碱基质量是“#”。
--phred64输入的碱基质量等于ASCII码值加上64.最低碱基质量是“B”。
--solexa-quals将Solexa的碱基质量转换为Phred。在老的GA Pipeline版本中得以 运用。Default: off.
--int-quals输入文件中的碱基质量为用“ ”分隔的数值,而不是ASCII码。比如40 40 30 40...。Default: off.
Cend-to-end模式下的预设参数 --very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50
--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50
--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-endmode)
--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50 Cloca模式下的预设参数 --very-fast-local Same as: -D 5 -R 1 -N 0 -L 25 -i S,1,2.00
--fast-local Same as: -D 10 -R 2 -N 0 -L 22 -i S,1,1.75
--sensitive-local Same as: -D 15 -R 2 -N 0 -L 20 -i S,1,0.75 (default in --local mode)
--very-sensitive-local Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50
比对参数: -N 进行种子比对时允许的mismatch数.可以设为0或者1.Default: 0.
-L 设定种子的长度.
************************************************************ 功能选项 给bowtie的一些参数设定值的时候,使用一个计算公式代替,于是值的大小与比对序列的长 度成一定关系。有三部分组成: (a)计算方法,包括常数(C),线性(L),平方根(S)和 自然对数(G); (b)一个常数; (c)一个系数. 例如: 为L,-0.4,-0.6则计算公式为: f(x) = -0.4 + -0.6 * x
为G,1,5.4则计算公式为: f(x) = 1.0 + 5.4 * ln(x) ************************************************************
-i 设定两个相邻种子间所间距的碱基数。 ************************************************************ 例如:如果read的长度为30,种子的长度为10,相邻种子的间距为6,则提取出的种子如下 所示: Read:
TAGCTACGCTCTACGCTATCATGCATAAAC Seed 1 fw: TAGCTACGCT Seed 1 rc: AGCGTAGCTA Seed 2 fw:
CGCTCTACGC Seed 2 rc:
GCGTAGAGCG Seed 3 fw:
ACGCTATCAT Seed 3 rc:
ATGATAGCGT Seed 4 fw:
TCATGCATAA 三亿文库包含各类专业文献、专业论文、文学作品欣赏、行业资料、各类资格考试、幼儿教育、小学教育、58Bowtie2用法祥解等内容。 
 Bowtie2用法祥解懒人必看对参考序列构建 index $ bowtie2-build genome.fasta index 尝试使用前10000个 reads 进行比对 $ bowtie2 -u 10000 -p 8 -x index -...  Bowtie2使用方法与参数详细介绍 - Public Library of Bioinformatics_生物学_自然...bowtie-短序列比对的新工... 5页 免费
Bowtie2用法祥解 12页 1下载券
samt...  bowtie2的SAM文件格式_计算机软件及应用_IT/计算机_专业资料。biwtie2生成SAM...Bowtie2 23页 2下载券
Bowtie2用法祥解 12页 免费
Bowtie2使用方法与参数详...  SAM格式-Bowtie2_计算机软件及应用_IT/计算机_专业资料。这是对Bowtie2产生的SAM...BWA比对软件说明书 10页 1下载券 Bowtie2使用方法与参数详... 4页 免费&#169;...genomedata 1.2.2
相关合集:
相关热搜:
WIN7激活工具大全,一款可以帮助用户解决win7激活问题的工具,不需要输入任何路径,也不占用系统任何资源,win7激活就是这么简单。WIN7正式版已经出来了,已经在更新win7。支持WIN7 RTM正式版和Office 2016 正式版。只需运行而不用去管它自动激活,能自动激活为180天无限循环。华军小编给大家整理推荐了各类免费的WIN7激活工具大全软件,赶快来下载吧!...
高速下载地址
联通下载地址
电信下载地址
移动及其他下载地址
(您的评论需要经过审核才能显示)
升级新版后我发现了几个小问题,并且发给genomedata的官方人员了,下次升级应该会解决了
之前找了其他的与这个genomedata类似的软件,唯独这个满意,而且还是免费软件
爱死华军软件园了!我好久都没找到这个genomedata,在这里居然发现它了
那些说下载慢的人那是你自己的网速问题,和genomedata有啥关系,真逗
这个genomedata1.2.2好用么,我看大小是0.4MB,跟前一个版本差别并不大
genomedata超级棒!点一亿个赞
实在没想到genomedata现在已经优化到0.4MB了,技术的确厉害
这个genomedata我已经安装了,用起来感觉不错,感谢分享!
很好用哈哈,最喜欢这个genomedata了,别的都不怎么样。。
最近试试看这个genomedata,如果好用的话会向朋友推荐的。
热门关键词

我要回帖

更多关于 varchar转换成 bit 的文章

 

随机推荐