(EN) A data analytics system implements a data analytics process on a distributed data analytics platform that shares cached data amongst users. The system receives a semantic-aware store command from a user, translates the DAG plan for executing the semantic-aware store command from the user into a translated DAG plan to be executed by a distributed multi-tiered shared cache, and executes the translated DAG plan including at least a final store command. The results of execution of the translated DAG plan are stored to the distributed multi-tiered shared cache. The execution of the translated DAG plan may be optimized by reviewing cached intermediate data to determine whether a branch of the DAG plan can be pruned by loading data directly, whether a repartition of the data can eliminate partitions or shuffle phases, or whether an ensuing operation can eliminate partitions using data-skipping indices.
(FR) Un système d'analyse de données implémente un processus d'analyse de données sur une plateforme d'analyse de données distribuée qui partage des données mises en cache entre des utilisateurs. Le système reçoit une instruction de stockage sensible à la sémantique d'un utilisateur, traduit le plan DAG pour exécuter l'instruction de stockage sensible à la sémantique de l'utilisateur en un plan DAG à exécuter par un cache partagé multiniveau distribué et exécute le plan DAG traduit comprenant au moins une instruction de stockage final. Les résultats de l'exécution du plan DAG traduit sont stockés dans le cache partagé multiniveau distribué. L'exécution du plan DAG traduit peut être optimisée par l'examen de données intermédiaires mises en cache afin de déterminer si une branche du plan DAG peut être élaguée par chargement direct de données, si une répartition des données peut éliminer des partitions ou des phases de brassage ou si une opération suivante peut éliminer des partitions à l'aide d'indices de saut de données.