#Codigo do grupo 7 from Bio import SeqIO record = SeqIO.read("sequence.gb", "genbank") #Verificar as features de genes, CDS e de outros. featcds = [] featgene=[] otherfeat=[] for i in xrange(len(record.features)): if record.features[i].type == "CDS": featcds.append(i) elif (record.features[i].type == "gene"): featgene.append(i) else: otherfeat.append(i) i=+1 #Abrir a tabela referente a nossa zona do genoma fornecida pelo NCBI f = open("ProteinTable.txt", 'r') table=[] for line in f.readlines(): table.append(line.split('\t')) f.close() #Obter geneID e proteinID para comparar com a tabela CDS_proteinID =[] CDS_geneID =[] for i in record.features: if i.type == "CDS": CDS_proteinID.append(i.qualifiers["protein_id"][0]) CDS_geneID.append(i.qualifiers["db_xref"][1].strip("GeneID:")) #Validar os resultados valido=True for j in xrange (1,len(table)): if table[j][5] != CDS_geneID[j-1] or table[j][8] != CDS_proteinID[j-1]: valido=False #Passar numero de features de genes, CDS e outras, bem como os respetivos locais e validacao das features print "Analise das features" print "\n" + "Numero de CDS: " + str(len(featcds)) print "Locais: " + str(featcds) print "Numero de genes: " + str(len(featgene)) print "Locais: " + str(featgene) print "Numero de outras features: " + str(len(otherfeat)) print "Locais: " + str(otherfeat) print "\n" + "Validacao" if valido: print "A validacao das features foi efetuada com sucesso!" else: print "Verifica-se a existencia de features invalidas!"