(EN) An improved method for encoding data stored in a column-oriented manner, comprises using a data mining algorithm (4) for finding frequent column patterns (5) among a set of data tuples, wherein each data tuple is containing a set of columns, and said data mining algorithm (4) is treating all columns and all column combinations and column ordering similarly when looking for column patterns; ordering column values occurring in said frequent column patterns (5) based on their frequencies into a prefix tree, wherein said prefix tree is defining a pattern order; sorting said data tuples according to said pattern order (7), resulting in sorted data tuples; and encoding columns of said sorted data tuples using run-length encoding.
(FR) La présente invention concerne un procédé amélioré de codage de données stockées d'une manière orientée en colonne qui comprend l'utilisation d'un algorithme d'exploration de données (4) destiné à trouver des modèles fréquents de colonnes (5) parmi un ensemble de tuples de données, dans lequel chaque tuple de données contient un ensemble de colonnes, et ledit algorithme d'exploration de données (4) traite toutes les colonnes et toutes les combinaisons de colonnes ainsi que l'ordre des colonnes de la même manière lorsqu'il est à la recherche de modèles de colonnes ; l'ordre des valeurs de colonnes survenant dans lesdits modèles fréquents de colonnes (5) sur la base de leurs fréquences dans un arbre à préfixe, dans lequel ledit arbre à préfixe définit un ordre de modèle ; le tri desdits tuples de données selon ledit ordre de modèle (7), résultant en des tuples de données triés ; et les colonnes de codage desdits tuples de données triés à l'aide d'un codage RLC.