(EN) Glycosylated biopharmaceuticals are important in the global pharmaceutical market. Despite the importance of their glycan structures, our limited knowledge of the glycosylation machinery still hinders controllability of this critical quality attribute. To facilitate discovery of glycosyltransferase specificity and predict glycoengineering efforts, here we extend an approach to model therapeutic protein glycosylation as a Markov process. Our model leverages putative glycosyltransferase (GT) specificity to define the biosynthetic pathways for all measured glycans, and the Markov chain modelling is used to learn glycosyltransferase isoform activities and predict glycosylation following glycosyltransferase knock-in/knockout. We apply our methodology to four different glycoengineered therapeutics (i.e., Rituximab, erythropoietin, Enbrel, and alpha-1 antitrypsin) produced in CHO cells, along with o-glycosylation and lipid profiles. Our models accurately predict N-linked glycosylation following glycoengineering and further quantified the impact of glycosyltransferase mutations on reactions catalyzed by other glycosyltransferases. By applying these learned GT-GT interaction rules identified from single glycosyltransferase mutants, our model further predicts the outcome of multi-gene glycosyltransferase mutations on the diverse biotherapeutics. We further apply this to study differential O-glycosylation and lipidomics. Thus, this modeling approach enables rational glycoengineering and the elucidation of relationships between glycosyltransferases and other enzyme classes, thereby facilitating biopharmaceutical research and aiding the broader study of glycosylation to elucidate the genetic basis of complex changes in glycosylation and the lipidome.
(FR) Les produits biopharmaceutiques glycosylés sont importants sur le marché pharmaceutique mondial. Malgré l'importance de leurs structures de glycane, les connaissances limitées de la machinerie de glycosylation empêchent encore la contrôlabilité de cet attribut de qualité critique. Pour faciliter la découverte de la spécificité de la glycosyltransférase et prédire des efforts de glyco-modification, l'invention concerne une approche permettant de modéliser la glycosylation de protéines thérapeutiques en tant que processus de Markov. Le modèle selon l'invention tire partie de la spécificité de la glycosyltransférase (GT) putative pour définir les voies de biosynthèse de tous les glycanes mesurés, et la modélisation de la chaîne de Markov sert à apprendre les activités des isoformes de la glycosyltransférase et à prédire la glycosylation qui suit une validation/invalidation de la glycosyltransférase. La méthodologie selon l'invention est appliquée à quatre agents thérapeutiques glyco-modifiés différents (c'est-à-dire le Rituximab, l'érythropoïétine, l'Enbrel et l'alpha-1 antitrypsine) produits dans des cellules de CHO, conjointement avec des profils d'o-glycosylation et de lipide. Les modèles selon l'invention prédisent avec précision la glyco-modification qui suit la glycosylation à liaison N et quantifient en outre l'impact de mutations de la glycosyltransférase sur des réactions catalysées par d'autres glycosyltransférases. En appliquant ces règles d'interaction GT-GT apprises identifiées à partir de mutants de glycosyltransférase unique, le modèle de l'invention prédit en outre le résultat de mutations de glycosyltransférase multigène sur les diverses biothérapies. L'invention concerne en outre l'étude de la O-glycosylation différentielle et des aspects lipidomiques. La présente approche de modélisation permet donc une glyco-modification rationnelle et l'élucidation de relations entre les glycosyltransférases et d'autres classes d'enzymes, ce qui facilite la recherche biopharmaceutique et favorise l'étude plus large de la glycosylation pour élucider la base génétique de changements complexes dans la glycosylation et le lipidome.