Machine Learning & SEO - SEO Camp'Us Paris 2016
-
Upload
julien-deneuville -
Category
Data & Analytics
-
view
924 -
download
3
Transcript of Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine LearningQuelles applications concrètes pour le SEO ?
Julien Deneuville• 27 ans
• Monte des sites depuis 2004
• SEO pro depuis 2011
• Twitter : @diije
• Blog : http://blog.1-clic.info/
• Musique
• Vélo
Qui suis-je ?Hello, World!
De quoi parle-t-on ?
Exemple 1 : analyse sémantique
Exemple 2 : segmentation d’utilisateurs
Exemple 3 : catégorisation d’URLs
Aller plus loin
3
Machine LearningSommaire
Machine Learning
De quoi ça s’agit ?
Machine Learning
5
Buzz Word ou réelle tendance ?
Machine Learning
Machine Learning : Field of study that gives computers the ability to learn without being explicitly programmed.
Arthur Samuel, pionnier de l’intelligence artificielle
6
Dessine-moi un mouton
Machine Learning
Mettre au point des algorithmes permettant de déterminer des caractéristiques pour de nouvelles données en se basant
sur la connaissance de données d’apprentissage.
7
Pour de vrai
Comment ça fonctionne ?
8
Dans les grandes lignes
Les régressions• Prédire une valeur « continue »
• Exemple type : calculer le prix de vente d’une maison
Les classifications• Déterminer une valeur « discrète »
• Exemple type : catégoriser des données
9
Deux grands types de méthodesMachine Learning 101
Découper de manière algorithmique un ensemble de données en classes ou clusters :• Classes : connues à l’avance
• Clusters : déterminés par la machine
En théorie :• Des objets d’un même ensemble sont
similaires
• Des objets d’ensembles différents sont dissimilaires
10
ClassificationKézako ?
Pourquoi ?
1. Un bon nombre de traitements automatisables• « Il y a un algorithme pour ça. » © Sylvain Peyronnet
2. Un changement d’échelle• Une machine traitera beaucoup plus de données qu’un humain, et plus vite.
3. Une littérature abondante• Merci à la communauté scientifique !
11
Quel intérêt au Machine Learning ?
Analyse de données sémantiques
Plus grand, plus vite, plus loin
Regrouper des mots clés
Objectif : regrouper des mots clés par proximité sémantique
Sur quels critères ?• Analyse syntaxique
• Cooccurrence
• TF*IDF
• …
Avec quelle méthode ?• K-means : le classique
Clustering
K-means
14
Quelques explications
Les avantages• Un classique du clustering
• Simple à implémenter
• Résultats rapides
Les inconvénients• Résultats aléatoires
• Nécessite d’indiquer à l’avance le nombre de classes
15
http://Scikit-Learn.org/
K-meansQuelques explications
16
Clustering sémantiqueExemple live
Quelles applications ?
Explorer un univers sémantique
Analyser la visibilité de votre site sur cet univers
Détecter des opportunités
Identifier les mots clés à utiliser
…17
Idées d’utilisation
Segmentation d’une base d’utilisateurs
CRM & recommandation
Segmenter une base d’utilisateurs
Mise en situation : vous éditez un site qui propose des contenus sur différentes thématiques (sport, jeux vidéos, cinéma …).
Vos données :• Une liste d’utilisateurs
• Leurs affinités avec vos thématiques
Votre objectif : • Regrouper vos utilisateurs par affinités
19
Trouver mes influenceurs
20
Segmenter des utilisateursCatégorisation
Réutiliser ces données
Objectif : mettre en place un système de recommandation
1. Identifier les « influenceurs » : les utilisateurs typiques d’une affinité
2. Identifier les « suiveurs » : les utilisateurs proches de ces influenceurs
3. Si un contenu plaît aux influenceurs, il plaira probablement aux suiveurs
21
Think different
22
Segmenter des utilisateursCatégorisation
Influenceurs Suiveurs
Catégorisation d’URLs
Au-delà des RegEx
Catégoriser des URLs
Objectif : catégoriser les pages d’un site, sans se baser sur les URLs
Schema classique : • http://www.example.com/category/page.htm
• Catégorie : /category/
Données d’entrée :• Liste des pages
• Liens entre ces pages
24
Brasse coulée
Logiciel open source, gratuit, français.
Visualisation de graphes
Algorithmes intégrés
Documentation
25
https://gephi.org/
GephiCouteau Suisse
Step 1 : intégrer les données dans Gephi
26
Nœuds et liens
Step 2 : catégorisation instantanée
27
Modularity Class
Aller plus loinUn peu de lecture
Les Frères Peyronnet• https://freres.peyronnet.eu/
• @speyronnet et @gpeyronnet
Aurélien Berrut• http://www.htitipi.com/blog/
• @htitipidotcom
Vincent Terrasi• http://data-seo.com/
• @vincentterrasi
29
De bonnes infosBlogs et personnes à suivre
www.1-clic.info
Merci de votre attention !Bon appétit J
Blog
http://blog.1-clic.info/
@diije