(EN) Systems and techniques by which tables can be joined in a mapreduce procedure. In some implementations, when a large table of business data (e.g., having one billion transaction records or more) is to be joined with a large table of customer data (e.g., having hundreds of millions of customer records), then these two tables can be organized before the mapreduce procedure to speed up the table join. For example, the business data and the customer data can both be hash partitioned, based on the same key, into shards of business data and shards of customer data, respectively. The number of shards in these two groups has an integer relationship with each other: for example such that there are two business data shards for every customer data shard, or vice versa.
(FR) L'invention porte sur des systèmes et des techniques par lesquels des tables peuvent être jointes dans une procédure MapReduce. Selon certains modes de réalisation, lorsqu'une grande table de données d'entreprise (par exemple, comprenant un billion d'enregistrements de transaction ou plus) doit être jointe à une grande table de données de consommateur (par exemple, comprenant des centaines de millions d'enregistrements de consommateur), alors ces deux tables peuvent être organisées avant la procédure MapReduce afin d'accélérer la jointure de tables. Par exemple, les données d'entreprise et les données de consommateur peuvent être partitionnées par hachage, sur la base de la même clé, en fragments de données d'entreprise et fragments de données de consommateur, respectivement. Les nombres de fragments dans ces deux groupes sont en rapport entier l'un avec l'autre : par exemple de telle manière qu'il existe deux fragments de données d'entreprise pour chaque fragment de données de consommateur, ou vice-versa.