Verteego Data Suite : support du lancement

Post on 20-Mar-2017

217 views 1 download

Transcript of Verteego Data Suite : support du lancement

1

BIG

DATA

PAR

IS: V

ERTE

EGO

DATA

SUI

TE O

FFIC

IAL

LAUN

CH

U N D E R S T A N D T O D A Y . K N O W T O M O R R O W .

jeremy.fain@verteego.com

+33(0)1 47 70 08 90

+33(0) 6 99 32 98 99

LANCEMENT

VERTEEGO

DATA SUITE 1.0

BOÎTE A OUTILS DE DATA SCIENCEMardi 7 mars 2017, 12h30-13h00

Big Data Paris, Salle APalais des Congrès, Paris 17ème arr.

France

22VOS INTERVENANTS

Mehdi EL BRINILead R&D engineer, Verteego

@elbrinidiary

Jeremy FAINHead of Growth, Verteego

@jeremy_fain

33

12:30

PROGRAMME

PRESENTATION DES INTERVENANTS & PROGRAMME

12:35

1- Raison d’être2- Utilité3- Pour qui ?4- Ce que n’est pas la Verteego Data Suite5- Composants intégrés dans la Verteego Data Suite6- Services

VERTEEGO DATA SUITE : POSITIONNEMENT ET CHOIX TECHNOLOGIQUES

12:451- Arriver jusqu’à la page GitHub2- Sur la Google Cloud Platform3- Sur vos machines UNIX

INSTALLER LA VERTEEGO DATA SUITE : MODE D’EMPLOI

12:55 QUESTIONS

44

RAISON D’ÊTRE DE LA VERTEEGO DATA SUITE

555

La première et la seule suite logicielle pour data scientists…

…100% Gratuite« En téléchargement libre »

…100% Open source« Pas une boîte noire »

…100% Rassurante« Composée de modules leaders mondiaux uniquement »

66

QU’EST-CE QUE LA VERTEEGO DATA SUITE ?

77

UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA

ORCHESTRATION DES FLUX DE DONNEES

NETTOYAGE AUTOMATIQUE

ANALYSES & DATAVIZ PREDICTIF

SCRIPTING

88

POUR QUI LA VERTEEGO DATA SUITE ?

99

A QUI S’ADRESSE LA VERTEEGO DATA SUITE

Utilisateurs

Plutôt profils

développeurs !

ou statisticiens

qui savent

scripter

Objectifs

Pour une

efficacité

maximale

Contexte

Pour les PoCs

comme pour la

production

1010

CE QUE LA VERTEEGO DATA SUITE N’EST PAS

1111

LA VERTEEGO DATA SUITE N’EST PAS UNE DISTRIBUTION DE HADOOP

1212

CHOIX TECHNOLOGIQUES

13

Interconnectez vos applications et lancez des workflows de traitement

automatisés

ORCHESTRATION DE FLUX DE DONNEES

Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser

vos PoC d’intelligence artificielle

NOTEBOOKS DE SCRIPTING

Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de

données

NETTOYEZ AUTOMATIQUEMENT VOS DONNEES

Créez et appliquez des modèles prédictifs sur vos flux de données

JUSQU’AU PREDICTIF

Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à

qui bon vous semble

ANALYSES ET DATAVIZ

14

Interconnectez vos applications et lancez des workflows de traitement automatisés

ORCHESTRATION DE FLUX DE DONNEES

Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser

vos PoC d’intelligence artificielle

NOTEBOOKS DE SCRIPTING

Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de

données

NETTOYEZ AUTOMATIQUEMENT VOS DONNEES

Créez et appliquez des modèles prédictifs sur vos flux de données

JUSQU’AU PREDICTIF

Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à

qui bon vous semble

ANALYSES ET DATAVIZ

15

Interconnectez vos applications et lancez des workflows de traitement automatisés

ORCHESTRATION DE FLUX DE DONNEES

Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser

vos PoC d’intelligence artificielle

NOTEBOOKS DE SCRIPTING

Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de

données

NETTOYEZ AUTOMATIQUEMENT VOS DONNEES

Créez et appliquez des modèles prédictifs sur vos flux de données

JUSQU’AU PREDICTIF

Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à

qui bon vous semble

ANALYSES ET DATAVIZ

MEHDI HELP STP.

16

Interconnectez vos applications et lancez des workflows de traitement automatisés

ORCHESTRATION DE FLUX DE DONNEES

Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser

vos PoC d’intelligence artificielle

NOTEBOOKS DE SCRIPTING

Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de

données

NETTOYEZ AUTOMATIQUEMENT VOS DONNEES

Créez et appliquez des modèles prédictifs sur vos flux de données

JUSQU’AU PREDICTIF

Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à

qui bon vous semble

ANALYSES ET DATAVIZ

17

Interconnectez vos applications et lancez des workflows de traitement automatisés

ORCHESTRATION DE FLUX DE DONNEES

Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser

vos PoC d’intelligence artificielle

NOTEBOOKS DE SCRIPTING

Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de

données

NETTOYEZ AUTOMATIQUEMENT VOS DONNEES

Créez et appliquez des modèles prédictifs sur vos flux de données

JUSQU’AU PREDICTIF

Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à

qui bon vous semble

ANALYSES ET DATAVIZ

1818

UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA

ORCHESTRATION DES FLUX DE DONNEES

NETTOYAGE AUTOMATIQUE

ANALYSES & DATAVIZ PREDICTIF

SCRIPTING

1919

ET LA PATTE VERTEEGO DANS TOUT CA ?

Interface

Utilisateurs

homogène

Programme

d’installation unifié,

documenté,

simple, rapide et

personnalisable

Mais aussi :

- La veille technologique en continu

- La « plomberie »

ex. connecteur NiFi - OpenRefine

2020

CHOIX TECHNOS, UI HOMOGENE, INSTALLATION UNIFIEE, « PLOMBERIE », COMMUNAUTE

UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA

ORCHESTRATION DES FLUX DE DONNEES

NETTOYAGE AUTOMATIQUE

ANALYSES & DATAVIZ PREDICTIF

SCRIPTING

2121

SERVICES

2222

Le logiciel est gratuit, les services sont payants

• Intra-entrepriseou

• Des sessions organisées chez

Verteego (à Paris) mêlant des

participants de tous horizons

Ex. de tarifs de support par email

exclusivement :• 100€ H.T. / mois /

utilisateur pour jusqu’à 5 questions

• 500€ H.T. / mois / utilisateur pour un nombre illimité de

questions

• Clouds publics : Google Cloud

Platform, AWS, MS Azure

• Clouds privés : Outscale, OVH,…

HEBERGEMENTFORMATION SUPPORT

La Verteego Data Suite 1.0 est 100% Open Source, 100% Gratuite, 100% Composée de modules leaders mondiaux chez les Data Scientists

2323

OÙ TROUVER LA VERTEEGO DATA SUITE ?

2424

2525

2626

2727

2828

OÙ INSTALLER LA VERTEEGO DATA SUITE ?

2929

Réponse : OÙ VOUS VOULEZ

1.

Cloud public

2.

Cloud privé

3030

COMMENT INSTALLER LA VERTEEGO DATA SUITE ?

3131

CHAMPAGNE A 13H15 STAND N°106

32

hello@verteego.com

@verteego_FR

33