Im trying to test some indel calling programs with large deletions in sequencing reads.
I ve got this sequence in Chromosome 20 of hg19 :
> CTAGCAAGGG GGCTGTATGG CTTGAGGCCA TAGTCCAGGA CATCATCGGG 50140599
GTATGCGGGT CCGGAGGGTG GGCTGGCGAC CTTATGTGCA TTCGGCTCTT 50140649
ctggaaagag aagggggaag ggggttcttt ttaagcctca aaaacagaac 50140699
TCCCGGTGCA GAGCAATCAC AGGCTGGATT TCGTCTCACG TCGTTTATTT 50140749
TTTTCAAATT CCCACCATGC CAAACCCCAA GCTAGAAGCT CCGTCCCTCA 50140799
CCAGAAGAAA ACTGAGGCCA CTTTGTCCCA GGTCCCTGGA GAAGACAGGT 50140849
thank I created a fastq file with a simulated deletion between positions 50140699 and 50140748:
>@teste.01 ER85B5301EGS5O length=250
CTAGCAAGGGGGCTGTATGGCTTGAGGCCATAGTCCAGGACATCATCGGGGTATGCGGGTCCGGAGGGTGGGCTGGCGACCTTATGTGCATTCGGCTCTTTCCCGGTGCAGAGCAATCACAGGCTGGATTTCGTCTCACGTCGTTTATTTTTTTCAAATTCCCACCATGCCAAACCCCAAGCTAGAAGCTCCGTCCCTCACCAGAAGAAAACTGAGGCCACTTTGTCCCAGGTCCCTGGAGAAGACAGGT
+teste.01 ER85B5301EGS5O length=250
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
So I mapped my read using bwasw from BWA, and thats what is mapped in my sam file:
>teste.01 0 chr20 50140700 204 100S150M * 0 0 CTAGCAAGGGGGCTGTATGGCTTGAGGCCATAGTCCAGGACATCATCGGGGTATGCGGGTCCGGAGGGTGGGCTGGCGACCTTATGTGCATTCGGCTCTTTCCCGGTGCAGAGCAATCACAGGCTGGATTTCGTCTCACGTCGTTTATTTTTTTCAAATTCCCACCATGCCAAACCCCAAGCTAGAAGCTCCGTCCCTCACCAGAAGAAAACTGAGGCCACTTTGTCCCAGGTCCCTGGAGAAGACAGGT @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AS:i:150 XS:i:0 XF:i:3 XE:i:4 XN:i:0
teste.01 0 chr20 50140550 177 100M150S * 0 0 CTAGCAAGGGGGCTGTATGGCTTGAGGCCATAGTCCAGGACATCATCGGGGTATGCGGGTCCGGAGGGTGGGCTGGCGACCTTATGTGCATTCGGCTCTTTCCCGGTGCAGAGCAATCACAGGCTGGATTTCGTCTCACGTCGTTTATTTTTTTCAAATTCCCACCATGCCAAACCCCAAGCTAGAAGCTCCGTCCCTCACCAGAAGAAAACTGAGGCCACTTTGTCCCAGGTCCCTGGAGAAGACAGGT @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AS:i:100 XS:i:0 XF:i:3 XE:i:3 XN:i:0
So I usde samtools sort, mpileup, and then I used pileup2indel from VARSCAN, but it dindt find any indels, does some one knows what can I do ?
thanks for the tips ! Can u recommend me a read simulator? thanks again
Here: How To Produce Simulated 'Synthetic' Sequences
either MetaSim (gui) or wgsim (comes with samtools)