(EN) Systems and methods for validating that a DNA sample is from a test subject are disclosed. The test subject reports one or more characteristics (biological sex, ethnicity, and/or age) that may be predicted from the DNA sample. The predictions are compared to the reported characteristics to validate the DNA sample. To validate according to biological sex, the system determines a Y-chromosome signal based on counts of sequence reads for a gene specific to the Y chromosome and, similarly, an X-chromosome signal using another gene specific to the X chromosome. The biological sex is predicted based on a comparison of the two signals. To validate according to ethnicity, the system predicts ethnicity based on detected allele frequencies for SNPs specific to each chromosome. To validate according to age, the system calculates the methylation densities for age-informative CpG sites. The system utilizes trained regression models to predict the age using the methylation densities.
(FR) L'invention concerne des systèmes et des procédés permettant de valider qu'un échantillon d'ADN provient d'un sujet de test. Le sujet de test rapporte une ou plusieurs caractéristiques (sexe biologique, origine ethnique et/ou âge) qui peuvent être prédites à partir de l'échantillon d'ADN. Les prédictions sont comparées aux caractéristiques rapportées pour valider l'échantillon d'ADN. Pour valider selon le sexe biologique, le système détermine un signal de chromosome Y sur la base de nombres de lectures de séquence pour un gène spécifique au chromosome Y et, de manière similaire, un signal de chromosome X à l'aide d'un autre gène spécifique au chromosome X. Le sexe biologique est prédit sur la base d'une comparaison des deux signaux. Pour valider selon l'origine ethnique, le système prédit l'origine ethnique sur la base de fréquences d'allèle détectées pour des SNP spécifiques à chaque chromosome. Pour valider selon l'âge, le système calcule les densités de méthylation pour des sites CpG informant sur l'âge. Le système utilise des modèles de régression formés pour prédire l'âge à l'aide des densités de méthylation.