Intro au Big Data & Machine Learning
-
Upload
eric-daoud -
Category
Data & Analytics
-
view
360 -
download
0
Transcript of Intro au Big Data & Machine Learning
BigData&MachineLearningEricDaoudAttoyan
SéminaireMEA– Jeudi19Mai2016
Introduction
• Quisuis-je?• MEAdepuisSeptembre2016• IngénieurGénéralisteECAMLyonPromo2015• MastèreSpécialisé« SystèmesInformatiquesOuverts »,CentraleParisPromo2016
• Quefais-je?• Stagedefind’étudeschezManoMano• IngénierieInformatique• MachineLearning• Moteursderecommandations
BigData&MachineLearning 2
Plan
1. Qu’est-cequeleBig Data?2. Qu’est-cequeleMachineLearning?3. Exemplesd’applications
BigData&MachineLearning 3
Qu’estcequeleBig Data?
BigData&MachineLearning 4
Définition
« La notion de big data est un concept s'étant popularisé en 2012 pourtraduire le fait que les entreprises sont confrontées à des volumes dedonnées à traiter de plus en plus considérables et présentant un fortenjeu commercial et marketing. »
BigData&MachineLearning 5
Larègledes3V
BigData&MachineLearning 6
Lesacteurs
• Transformationvenueàlabasedes« .com »
• Maismaintenanttouchebeaucoupplusdesecteurs
BigData&MachineLearning 7
Petitsondage
Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :
a) Un ordinateur très très puissantb) Beaucoup d’ordinateurs normaux
BigData&MachineLearning 8
Petitsondage
Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :
a) Quelques ordinateurs très très puissantsb) Beaucoup d’ordinateurs normauxà Algorithme« Map Reduce »
BigData&MachineLearning 9
L’algorithmeMap Reduce
BigData&MachineLearning 10
Map Reduce pourcompterlesoccurencesdesmotsd’untexte
BigData&MachineLearning 11
Qu’estcequeleMachineLearning?
BigData&MachineLearning 12
Définition
« Machine learning is the science of getting computers to act withoutbeing explicitly programmed. In the past decade, machine learning hasgiven us self-driving cars, practical speech recognition, effective websearch, and a vastly improved understanding of the human genome »
BigData&MachineLearning 13
Processus
BigData&MachineLearning 14
Différentsproblèmes
• ApprentissageSupervisé• ApprentissageNonSupervisé• ApprentissageparRenforcement• ApprentissageProfond
BigData&MachineLearning 15
ApprentissageSupervisé
A partir d’un set de données d’entrainement, l’algorithme vaapprendre un modèle qui lui permettra de faire des prédictionsultérieurement.
Exemple : Filtrage Spam
BigData&MachineLearning 16
ApprentissagenonSupervisé
Aucun set de données d’entrainementn’est fourni. L’algorithme doit trouver lemeilleur modèle lui même.
Exemple : Trouver des groupes d’acheteurssimilaires sur un site d’e-commerce
BigData&MachineLearning 17
ApprentissageSupervisévs.NonSupervisé
BigData&MachineLearning 18
ApprentissageparRenforcement
« Apprendre, à partir d'expériences, ce qu'il convient de faire endifférentes situations. Agent autonome au sein d'un environnement,qui doit prendre des décisions en fonction de son état courant. Enretour, l'environnement procure à l'agent une récompense, qui peutêtre positive ou négative »
Exemple : Un robot qui apprend à jouer aux échecs contre un êtrehumain
BigData&MachineLearning 19
ApprentissageProfond(DeepLearning)
Apprentissage supervisé avec un réseaude neurones. une machine virtuellecomposée d'unités qui effectuentchacune de petits calculs simples. Lesrésultats de la première couche deneurones vont servir d'entrée au calculdes autres.
Exemple : Reconnaissance d’image
BigData&MachineLearning 20
QuelquesExemples
BigData&MachineLearning 21
GoogleDeepMind
BigData&MachineLearning 22
Lapublicitéciblée
BigData&MachineLearning 23
LaVoitureAutonome
BigData&MachineLearning 24
LesMoteursdeRecommandations
BigData&MachineLearning 25
Aquoiçasert?
• Deplusenplusdechoixpourl’utilisateur,quelquesoitlecontenu• Guider,fairedécouvrir, vendreplus…
BigData&MachineLearning 26
Deuxapproches
• ContentBased Filtering• Sebasesurlecontenudesproduitsappréciésparl’utilisateur• Exemple:BobaimeleRock,luiproposerdeschansonsdeRock
• CollaborativeFiltering• Rapprochedesutilisateursetpropose lecontenuquel’unaaiméetpasl’autre
• Exemple:BobetJoesontsimilaires.BobaadoréledernieralbumdesArcticMonkeys. RecommandercetalbumàJoequinel’apasencoreécouté.
BigData&MachineLearning 27
Deuxapproches
BigData&MachineLearning 28
Conclusion
• Domainepasnouveau,maisenpleinessorgrâceàl’explosiondesdonnéesetdelapuissancedecalcul• Beaucoupd’applicationsenliendirectaveclesutilisateurs• Domaineenvogue,quineconnaîtpaslacrise• Lemeilleurresteencoreàvenir!
BigData&MachineLearning 29
Mercidevotre attention!Big Data&MachineLearning
EricDaoudAttoyanSéminaireMEA– Jeudi19Mai2016
Références
• https://fr.coursera.org/learn/machine-learning• http://fr.slideshare.net/xamat/recommender-systems-machine-learning-summer-school-2014-cmu• https://deepmind.com• https://www.google.com/selfdrivingcar/• http://www.lemonde.fr/sciences/article/2016/02/04/la-lecon-d-un-maitre-de-l-intelligence-artificielle_4859368_1650684.html• https://hbr.org/2012/10/big-data-the-management-revolution/ar• http://static.googleusercontent.com/media/research.google.com/en//archive/mapreduce-osdi04.pdf• https://fr.wikipedia.org/wiki/Apprentissage_automatique
BigData&MachineLearning 31