(EN) In one aspect, a method is disclosed for using dialects to generate candidate drug compounds. The dialects describe sequences of the candidate drug compounds and activities associated with the sequences. The method includes receiving a data set, training, using the data set, first layers of a machine learning model to determine relationships of components of a portion of a string described by a first dialect. The components pertain to amino acids associated with first activity level information of the sequences. The method includes training, using the data set and the portion of the string, a final layer to generate a remainder of the string. The remainder pertains to second activity level information of the sequences. The method includes generating, using the first and final layer, the string comprising the portion and the remainder. The string represents a candidate drug compound.
(FR) Selon un aspect, un procédé d'utilisation de dialectes pour générer des composés médicamenteux candidats est divulgué. Les dialectes décrivent des séquences des composés médicamenteux candidats et des activités associées aux séquences. Le procédé comprend la réception d'un ensemble de données, la formation, à l'aide de l'ensemble de données, de premières couches d'un modèle d'apprentissage machine pour déterminer des relations de composants d'une partie d'une chaîne décrite par un premier dialecte. Les composants concernent des acides aminés associés à des premières informations de niveau d'activité des séquences. Le procédé comprend la formation, à l'aide de l'ensemble de données et de la partie de la chaîne, d'une couche finale pour générer un reste de la chaîne Le reste porte sur des secondes informations de niveau d'activité des séquences. Le procédé comprend la génération, à l'aide de la première couche et de la couche finale, de la chaîne comprenant la partie et le reste. La chaîne représente un composé médicamenteux candidat.