Introduction aux technologies et applications Big Data
Also appears in collections : ANF Mathrice: management, (recovery) optimized shared storage and archiving of scientific data in mathematics laboratories / ANF Mathrice : gestion, valorisation et archivage des données scientifiques des laboratoires de maths, Outreach - Les vidéos tout public du CIRM
Depuis les années 2000, l'informatique a vu émerger de nouvelles technologies, cloud et big data, qui bouleversent l'industrie avec l'arrivée d'outils de traitement à grande échelle. De nouveaux besoins sont apparus comme la possibilité d'extraire de la valeur des données en s'appuyant sur des outils qui répondent aux nouvelles exigences technologiques. Les architectures distribuées comme Hadoop, les bases de données non-relationnelles, les traitements parallélisés avec MapReduce constituent des outils qui répondent aux accroissements massifs des données, que ce soit en volumétrie, en nombre ou en type. Cette explosion de données a conduit à la terminologie Big Data. Nous découvrirons les différents concepts des systèmes Big Data, ce que signifient les termes comme base NoSQL, MapReduce, lac de données, ETL ou ELT, etc. Nous nous attarderons sur deux grands outils du BigData : Hadoop et MongoDB.