Intro au Big Data & Machine Learning

31
Big Data & Machine Learning Eric Daoud Attoyan Séminaire MEA – Jeudi 19 Mai 2016

Transcript of Intro au Big Data & Machine Learning

Page 1: Intro au Big Data & Machine Learning

BigData&MachineLearningEricDaoudAttoyan

SéminaireMEA– Jeudi19Mai2016

Page 2: Intro au Big Data & Machine Learning

Introduction

• Quisuis-je?• MEAdepuisSeptembre2016• IngénieurGénéralisteECAMLyonPromo2015• MastèreSpécialisé« SystèmesInformatiquesOuverts »,CentraleParisPromo2016

• Quefais-je?• Stagedefind’étudeschezManoMano• IngénierieInformatique• MachineLearning• Moteursderecommandations

BigData&MachineLearning 2

Page 3: Intro au Big Data & Machine Learning

Plan

1. Qu’est-cequeleBig Data?2. Qu’est-cequeleMachineLearning?3. Exemplesd’applications

BigData&MachineLearning 3

Page 4: Intro au Big Data & Machine Learning

Qu’estcequeleBig Data?

BigData&MachineLearning 4

Page 5: Intro au Big Data & Machine Learning

Définition

« La notion de big data est un concept s'étant popularisé en 2012 pourtraduire le fait que les entreprises sont confrontées à des volumes dedonnées à traiter de plus en plus considérables et présentant un fortenjeu commercial et marketing. »

BigData&MachineLearning 5

Page 6: Intro au Big Data & Machine Learning

Larègledes3V

BigData&MachineLearning 6

Page 7: Intro au Big Data & Machine Learning

Lesacteurs

• Transformationvenueàlabasedes« .com »

• Maismaintenanttouchebeaucoupplusdesecteurs

BigData&MachineLearning 7

Page 8: Intro au Big Data & Machine Learning

Petitsondage

Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :

a) Un ordinateur très très puissantb) Beaucoup d’ordinateurs normaux

BigData&MachineLearning 8

Page 9: Intro au Big Data & Machine Learning

Petitsondage

Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :

a) Quelques ordinateurs très très puissantsb) Beaucoup d’ordinateurs normauxà Algorithme« Map Reduce »

BigData&MachineLearning 9

Page 10: Intro au Big Data & Machine Learning

L’algorithmeMap Reduce

BigData&MachineLearning 10

Page 11: Intro au Big Data & Machine Learning

Map Reduce pourcompterlesoccurencesdesmotsd’untexte

BigData&MachineLearning 11

Page 12: Intro au Big Data & Machine Learning

Qu’estcequeleMachineLearning?

BigData&MachineLearning 12

Page 13: Intro au Big Data & Machine Learning

Définition

« Machine learning is the science of getting computers to act withoutbeing explicitly programmed. In the past decade, machine learning hasgiven us self-driving cars, practical speech recognition, effective websearch, and a vastly improved understanding of the human genome »

BigData&MachineLearning 13

Page 14: Intro au Big Data & Machine Learning

Processus

BigData&MachineLearning 14

Page 15: Intro au Big Data & Machine Learning

Différentsproblèmes

• ApprentissageSupervisé• ApprentissageNonSupervisé• ApprentissageparRenforcement• ApprentissageProfond

BigData&MachineLearning 15

Page 16: Intro au Big Data & Machine Learning

ApprentissageSupervisé

A partir d’un set de données d’entrainement, l’algorithme vaapprendre un modèle qui lui permettra de faire des prédictionsultérieurement.

Exemple : Filtrage Spam

BigData&MachineLearning 16

Page 17: Intro au Big Data & Machine Learning

ApprentissagenonSupervisé

Aucun set de données d’entrainementn’est fourni. L’algorithme doit trouver lemeilleur modèle lui même.

Exemple : Trouver des groupes d’acheteurssimilaires sur un site d’e-commerce

BigData&MachineLearning 17

Page 18: Intro au Big Data & Machine Learning

ApprentissageSupervisévs.NonSupervisé

BigData&MachineLearning 18

Page 19: Intro au Big Data & Machine Learning

ApprentissageparRenforcement

« Apprendre, à partir d'expériences, ce qu'il convient de faire endifférentes situations. Agent autonome au sein d'un environnement,qui doit prendre des décisions en fonction de son état courant. Enretour, l'environnement procure à l'agent une récompense, qui peutêtre positive ou négative »

Exemple : Un robot qui apprend à jouer aux échecs contre un êtrehumain

BigData&MachineLearning 19

Page 20: Intro au Big Data & Machine Learning

ApprentissageProfond(DeepLearning)

Apprentissage supervisé avec un réseaude neurones. une machine virtuellecomposée d'unités qui effectuentchacune de petits calculs simples. Lesrésultats de la première couche deneurones vont servir d'entrée au calculdes autres.

Exemple : Reconnaissance d’image

BigData&MachineLearning 20

Page 21: Intro au Big Data & Machine Learning

QuelquesExemples

BigData&MachineLearning 21

Page 22: Intro au Big Data & Machine Learning

GoogleDeepMind

BigData&MachineLearning 22

Page 23: Intro au Big Data & Machine Learning

Lapublicitéciblée

BigData&MachineLearning 23

Page 24: Intro au Big Data & Machine Learning

LaVoitureAutonome

BigData&MachineLearning 24

Page 25: Intro au Big Data & Machine Learning

LesMoteursdeRecommandations

BigData&MachineLearning 25

Page 26: Intro au Big Data & Machine Learning

Aquoiçasert?

• Deplusenplusdechoixpourl’utilisateur,quelquesoitlecontenu• Guider,fairedécouvrir, vendreplus…

BigData&MachineLearning 26

Page 27: Intro au Big Data & Machine Learning

Deuxapproches

• ContentBased Filtering• Sebasesurlecontenudesproduitsappréciésparl’utilisateur• Exemple:BobaimeleRock,luiproposerdeschansonsdeRock

• CollaborativeFiltering• Rapprochedesutilisateursetpropose lecontenuquel’unaaiméetpasl’autre

• Exemple:BobetJoesontsimilaires.BobaadoréledernieralbumdesArcticMonkeys. RecommandercetalbumàJoequinel’apasencoreécouté.

BigData&MachineLearning 27

Page 28: Intro au Big Data & Machine Learning

Deuxapproches

BigData&MachineLearning 28

Page 29: Intro au Big Data & Machine Learning

Conclusion

• Domainepasnouveau,maisenpleinessorgrâceàl’explosiondesdonnéesetdelapuissancedecalcul• Beaucoupd’applicationsenliendirectaveclesutilisateurs• Domaineenvogue,quineconnaîtpaslacrise• Lemeilleurresteencoreàvenir!

BigData&MachineLearning 29

Page 30: Intro au Big Data & Machine Learning

Mercidevotre attention!Big Data&MachineLearning

EricDaoudAttoyanSéminaireMEA– Jeudi19Mai2016

Page 31: Intro au Big Data & Machine Learning

Références

• https://fr.coursera.org/learn/machine-learning• http://fr.slideshare.net/xamat/recommender-systems-machine-learning-summer-school-2014-cmu• https://deepmind.com• https://www.google.com/selfdrivingcar/• http://www.lemonde.fr/sciences/article/2016/02/04/la-lecon-d-un-maitre-de-l-intelligence-artificielle_4859368_1650684.html• https://hbr.org/2012/10/big-data-the-management-revolution/ar• http://static.googleusercontent.com/media/research.google.com/en//archive/mapreduce-osdi04.pdf• https://fr.wikipedia.org/wiki/Apprentissage_automatique

BigData&MachineLearning 31