Wendelin Exanalytics Libre

WENDELIN combines Scikit Learn machine learning and NEO distributed storage for out-of-core data analytics in python

Communiqué de presse

Paris, le 3 décembre 2014. Le projet Wendelin vient d'être sélectionné au dernier appel à projets du Programme d’Investissements d’Avenir (PIA) sur la thématique "cloud computing et Big Data". C'est la reconnaissance du succès de la filière technologique française du Big Data (ou  "magna data" selon la terminologie suggérée par Axelle Lemaire) et notamment de la bibliothèque scikit-learn, de la base NoSQL "NEO" et du cloud décentralisé "SlapOS", trois logiciels libres soutenus par le pôle de compétitivité Systematic.

scikit-learn est la bibliothèque de référence mondiale dans le domaine de l'apprentissage automatique ou machine learning.  Gael Varoquaux (INRIA), Olivier Grisel (INRIA) et Alexandre Gramfort (Télécom ParisTech) ont été des acteurs majeurs dans sa création et scikit-learn a reçu le soutien d'une large communauté mondiale autour du langage de programmation Python. Elle est utilisée notamment par les géants du net comme par les start-up les plus dynamiques, comme par exemple Google, Airbnb, Spotify, Evernote, AWeber, TinyClues, et gagne plus de la moitié des concours de data science "Kaggle". scikit-learn permet à partir de jeux de données du passé de prédire l'avenir et d'optimiser ainsi les décisions de gestion d'entreprise: pannes, achats en ligne, stock, fraude, etc.

Près d'1 million d'Euros seront investis pour améliorer le coeur algorithmique de scikit-learn au travers de Wendelin grâce aux équipes de recherche de l'INRIA, de l'ENS et de l'Institut Mines Télécom. scikit-learn sera notamment étendu pour traiter la prédiction en temps-réel en ligne et intégrer des algorithmes récents de gradient stochastique.

NEO est la base NoSQL répartie et transactionnelle native du langage python. Elle a été créée initialement par Nexedi et est aujourd'hui utilisée pour des déploiements de grands logiciels d'entreprise. Plus d'1 million d'euros seront investis autour de NEO pour que scikit-learn puisse traiter d'ici 10 ans en mode "out-of-core" des données matricielles natives de 1 exaoctet, soit un million de téraoctets. Un premier prototype a déjà été réalisé avec succès.

L'université de Paris13 et l'Institut Mines Télécom (IMT) étendront le système de Cloud décentralisé SlapOS (distributed mesh cloud) pour déployer Wendelin en mode "Big Data as a Service" (BDaaS), pour réaliser l'interopérabilité entre les infrastructures Grid5000 et Teralab, et pour étendre le deploiement du Cloud jusqu'aux capteurs intelligents (smart sensor).

La combinaison de scikit-learn, NEO et SlapOS permettra ainsi d'améliorer la maintenance prédictive des objets industriels avec dans un premier temps deux cas d'application: les éoliennes connectées (GDF SUEZ, Woelfel) et la satisfaction du client dans la distribution automobile (MMC Rus). Dans les deux cas, il s'agit de Big Data indépendant de toute donnée personnelle et néanmoins rentable. Le projet Wendelin démontre ainsi que le Big Data permet d'améliorer les infrastructures ou les objets de la vie quotidienne sans intrusion dans la vie privée.

A propos de Wendelin - www.wendelin.io

Wendelin est un projet de moteur de magna data en "Marque France" soutenu par le Programme d’Investissements d’Avenir. Wendelin est construit autour de logiciels open source reconnus mondialement. Deux premières applications sont prévues: la maintenance préventive des éoliennes et la maintenance préventive des automobiles. Dans les deux cas, le Big Data permet de prédire une panne avant qu'elle ne survienne et d'améliorer ainsi la qualité du service rendu aux usagers.

Partenaires du projet:

Soutiens extérieurs:

Adresse permanente du communiqué

http://www.wendelin.io/press/news-Wendelin.PIA

Contacts

  • Jean-Paul Smets - CEO Nexedi S.A. - jp (at) nexedi (dot) com - Tel. +33 (0)6 29 02 44 25
  • Taiki Fukunaga - IT Director - MMC Rus - tfukunaga (at) mmcrus (dot) com - Tel. +7-915-331-1958

A propos de GDF SUEZ

GDF SUEZ inscrit la croissance responsable au cœur de ses métiers (électricité, gaz naturel, services à l’énergie) pour relever les grands enjeux énergétiques et environnementaux : répondre aux besoins en énergie, assurer la sécurité d’approvisionnement, lutter contre les changements climatiques et optimiser l’utilisation des ressources. Le Groupe propose des solutions performantes et innovantes aux particuliers, aux villes et aux entreprises en s’appuyant sur un portefeuille d’approvisionnement gazier diversifié, un parc de production électrique flexible et peu émetteur de CO2 et une expertise unique dans quatre secteurs clés : la production indépendante d’électricité, le gaz naturel liquéfié, les énergies renouvelables et l’efficacité énergétique. GDF SUEZ compte 147 400 collaborateurs dans le monde pour un chiffre d’affaires en 2013 de 81,3 milliards d’euros. Coté à Paris et Bruxelles, le Groupe est représenté dans les principaux indices internationaux : CAC 40, BEL 20, DJ Euro Stoxx 50, Euronext 100, FTSE Eurotop 100, MSCI Europe et Euronext Vigeo (World 120, Eurozone 120, Europe 120 et France 20).

A propos d'Abilian

Abilian développe et commercialise des logiciels open source et met son expertise au service de la compétitivité des entreprises, des collectivités et des administrations: solutions métiers dédiées aux acteurs du soutien à l'innovation et au développement économique des territoires, réseaux sociaux d'entreprises, annuaires professionnels, solutions pour la démocratie participative, MOOCs, open data... Les compétences technologiques d'Abilian recouvrent les principaux axes liés à la transformation numérique des organisations et au *social business* (Entreprise 2.0): gestion d'information entreprise (EIM - Enterprise Information Management), cloud, big data, Web 2.0 - le tout basé sur des technologies open source, avec une forte implication de la société dans l'écosystème du logiciel libre en Ile-de-France.

A propos de 2ndQuadrant

2ndQuadrant est le leader mondial du système de bases de données PostgreSQL, grâce à son équipe d'experts PostgreSQL expérimentés et certifiés sur Oracle, MySQL, Teradata, Progress, Informix, Microsoft SQL Server et Sybase. 2ndQuadrant fourni un ensemble de services permettant une gestion complète du cycle de vie de vos installations PostgreSQL. 2ndQuadrant fourni un ensemble de services complet, aussi bien à l'année que dans le cadre de missions courtes. Nous travaillons avec des entreprises des secteurs publics et privés dans plus de 15 pays répartis en Amérique du nord, en Europe et dans les régions du Pacifique depuis nos bureaux situés aux États Unis, en Angleterre, en France, en Italie, en Allemagne, dans les pays Scandinaves et en Amérique du Sud. Notre dimension internationale nous permet de travailler sur des centaines d'installations PostgreSQL variées. Notre présence locale nous permet d'adapter nos services aux conditions spécifiques à chaque pays. 2ndQuadrant est sponsor « Platinium » de PostgreSQL, avec plus de 7 ans de participation au développement de PostgreSQL et de ses solutions. 2ndQuadrant a collectivement fourni plus de 100 années-homme d'expertise PostgreSQL dans tous les domaines de vos installations PostgreSQL.

A propos de Nexedi

Nexedi est l'éditeur de la base répartie NoSQL "NEO" et est à l'origine du projet de moteur Big Data "Wendelin". Nexedi, l'éditeur du Progiciel de gestion Intégré en licence libre ERP5, a déployé la solution ERP5 dans de nombreux secteurs d'activités : banque, aérospatial, transports, habillement, santé, gouvernement, etc. ERP5 est aujourd'hui utilisé par des organisations de toutes tailles en Europe, Afrique, Asie, Amérique du Nord et Amérique du Sud. La licence libre d'ERP5 permet de s'affranchir de tous les coûts de licence dans le cadre du déploiement d'un ERP et offre à l'organisation utilisatrice d'ERP5 une indépendance réelle doublée d'une liberté totale quant à l'évolution de son système d'information. Nexedi est l'un des contributeurs à la technologie de Cloud Computing décentralisé SlapOS, un système de Cloud Computing Open Source compatible avec les principaux standards du marché et offrant des propriétés de résilience et de réversibilité pour les applications critiques. Présent sur quatre continents, Nexedi offre aux entreprises et aux gouvernements des services de conseil, de développement et d'assistance 24h / 24 pour réussir la migration de leurs applications critiques vers des solutions libres.