Retour d'expérience Reador sur le #WebSem sophiaconf2014

40

Transcript of Retour d'expérience Reador sur le #WebSem sophiaconf2014

Page 1: Retour d'expérience Reador sur le #WebSem sophiaconf2014
Page 2: Retour d'expérience Reador sur le #WebSem sophiaconf2014
Page 3: Retour d'expérience Reador sur le #WebSem sophiaconf2014
Page 4: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Nous avons produit plus d'informations en 2012 que pendant 5000 ans

(4 millions de Tera octets)

Page 5: Retour d'expérience Reador sur le #WebSem sophiaconf2014

INFOBÉSITÉ

Page 6: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Un outil de filtrage automatique de news, puissant et simple pour organiser, à faible coût, votre veille sur

READOR

Page 7: Retour d'expérience Reador sur le #WebSem sophiaconf2014

READOR : PROCESSUS DE VEILLE

EXTRACTION DES DONNEES

FILTRAGE SEMANTIQUE

CREATION DE VOS JOURNAUX

GENERATION DE TAGS

Page 8: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE

FONCTIONNEL“Où est l'utilité des technos. sémantiques ? ”

TECHNIQUE“ Est-ce que ça marche bien ? ”

Page 9: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE

FONCTIONNEL“Où est l'utilité des technos. sémantiques ? ”

TECHNIQUE“ Est-ce que ça marche bien ? ”

Page 10: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE FONCTIONNEL● Suppression du bruit plus poussée– Basé sur du TAL pour pour effectuer la

reconnaissance des termes importants

Page 11: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 12: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 13: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 14: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 15: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 16: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 17: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 18: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 19: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DE RECHERCHE #BIGDATA

Page 20: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE FONCTIONNEL● Suppression du bruit plus poussée– Basé sur du TAL pour pour effectuer la reconnaissance des

termes importants

● Enrichissement des tweets

● Lien avec d'autres bases de connaissances– Grâce à Wikipedia/DBpedia– Inférences

Page 21: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 22: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 23: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 24: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 25: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 26: Retour d'expérience Reador sur le #WebSem sophiaconf2014

EXEMPLE DAVID CAMERON

Page 27: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE FONCTIONNEL● Suppression du bruit plus poussée– Basé sur du TAL pour pour effectuer la reconnaissance des

termes importants

● Enrichissement des tweets

● Lien avec d'autres bases de connaissances– Grâce à Wikipedia/DBpedia– Inférences

Page 28: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Langages de programmation

INFERENCES

Page 29: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Langages de programmation

INFERENCES

programmationdeLangages

Web 2.0

Page 30: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Langages de programmation

Langages

Web 3.0

Langages de programmation

Java Python Rails

INFERENCES

DBpedia

programmationdeLangages

Web 2.0

Page 31: Retour d'expérience Reador sur le #WebSem sophiaconf2014

Incubateur Paca-Est

EstPacaIncubateur

Web 2.0 Web 3.0

Incubateur Paca Est

INFERENCES

Accompagne

Entreprises

France Labs

Azameo

Reador.NET

Base interne

Sophia AntipolisBiot

Valbonne

DBpedia

LieuToulon

Nice

Page 32: Retour d'expérience Reador sur le #WebSem sophiaconf2014

INFERENCES SUR READOR

Page 33: Retour d'expérience Reador sur le #WebSem sophiaconf2014

“ Où est l'utilité des technos. sémantiques ? ”

Page 34: Retour d'expérience Reador sur le #WebSem sophiaconf2014

“Où est l'utilité des technos. sémantiques ? ”STRUCTURER

La donnée& ENRICHIR

“ Où est l'utilité des technos. sémantiques ? ”

Page 35: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE

FONCTIONNEL“Où est l'utilité des technos. sémantiques ? ”

TECHNIQUE“ Est-ce que ça marche bien ? ”

Page 36: Retour d'expérience Reador sur le #WebSem sophiaconf2014

COTÉ DATA

Déjà 22 millions de données traitées

Plus de 300 millions de triplets

4 serveurs : 150 Go de RAM et 20 cœurs

Page 37: Retour d'expérience Reador sur le #WebSem sophiaconf2014

SGBD SÉMANTIQUE : VIRTUOSO●Actuellement en prod. chez Wikipedia

●Quasiment la totalité chargée en RAM => 100Go alloués

● De nombreuses journées de config des options...

● Encore en dev...

Page 38: Retour d'expérience Reador sur le #WebSem sophiaconf2014

GÉNÉRATION DES REQUÊTESPREFIX RSS: <http://purl.org/rss/1.0/>SELECT * WHERE{ SELECT DISTINCT(?concept),?pubDateTime, CONCAT( ?filter272,?filter273,?filter274 ) AS ?filtersVals FROM <http://zone-project.org/datas/items> FROM <http://zone-project.org/datas/sources> WHERE { ?concept RDF:type RSS:item. { ?concept <http://zone-project.org/model/plugins/twitter#hashtag> "#bigdata".} ?concept ?filter275 <http://dbpedia.org/resource/Machine_learning>. ?concept ?filter276 <http://dbpedia.org/resource/Python_(programming_language)>. OPTIONAL { ?concept ?filter272 <http://dbpedia.org/resource/Apache_Hadoop>.} OPTIONAL { ?concept ?filter273 <http://dbpedia.org/resource/Java(programming_language)>.

} OPTIONAL { ?concept ?filter277 <http://dbpedia.org/resource/International_Business_Machines>}. FILTER (!bound(?filter277)) ?concept RSS:pubDateTime ?pubDateTime.}

} ORDER BY DESC(?pubDateTime) LIMIT 10 OFFSET 0

Page 39: Retour d'expérience Reador sur le #WebSem sophiaconf2014

RETOUR D'EXPERIENCE

FONCTIONNEL“Où est l'utilité des technos. sémantiques ? ”

TECHNIQUE“ Est-ce que ça marche bien ? ”

Page 40: Retour d'expérience Reador sur le #WebSem sophiaconf2014

[email protected] 62 59 64 17

@descl3@readornet