15

Click here to load reader

Non-synonymous SNP ID

Embed Size (px)

DESCRIPTION

"Large" data set project for Bioinformatics class identifying non-synonymous SNPs in sockeye salmon

Citation preview

Page 1: Non-synonymous SNP ID
Page 2: Non-synonymous SNP ID
Page 3: Non-synonymous SNP ID

Additionally,  

Page 4: Non-synonymous SNP ID
Page 5: Non-synonymous SNP ID
Page 6: Non-synonymous SNP ID

5’‐TCTAAAATGGGTGAC‐3 

5’‐UCUAAAAUGGGUGAC‐3 

1.  UCU  AAA  AUG  GGU  GAC 2.   . CUA  AAA  UGG  GUG  AC 3.   .  . UAA  AAU  GGG  UGA  C 

 dsDNA 

RNA 

6 possible RFs for dsDNA    3 possible RFs in each direction 

Page 7: Non-synonymous SNP ID

1 sequence with 1 SNP  

2 sequences, one for each SNP allele 

Translate into AA sequence for all 6 reading frames  

Determine RF with protein BLAST 

Align AA sequences for RF with highest e‐value for each 

locus 

Identify non‐synonymous SNPs 

Page 8: Non-synonymous SNP ID

2 sequences, one for each SNP allele 

1 sequence with 1 SNP  

Page 9: Non-synonymous SNP ID

http://www.ebi.ac.Tk/Tools/emboss/transeq/index.html? 

Page 10: Non-synonymous SNP ID

276 sequences  84 sequences BLASTP 

All 23 loci  18 loci 

INPUT  OUTPUT 

Page 11: Non-synonymous SNP ID

       Query                   Top Hit                     E‐value           Scenario  

AlleleLocus Reading frame 

Only 1 reading frame had hits 

Multiple reading frames had hits,1 had higher E‐value 

Page 12: Non-synonymous SNP ID

17 synonymous SNPs (no change in AA) 

1 non‐ synonymous SNP 

Page 13: Non-synonymous SNP ID

SNP U1214: [A/C] 

Gene: Sialytransferase 

GO Terms 

Page 14: Non-synonymous SNP ID

SNP Table  AA difference 

Create SNP Table   Determine RF for ref seq via getORF 

Import reading frame as  GenBank format 

Create new SNP table with AA difference  

Page 15: Non-synonymous SNP ID