Post on 20-Mar-2017
MACHINE LEARNINGDESMISTIFICANDO
ABOUT ME
• System Architect na Ericsson • Engenheiro de Computação ITA 2003•MBA Gerência de Projetos FGV 2008• SCJA, SCJP 5, 6, SCBCD 5, SCDJWS 5• EMC Data Science Associate
$$$$
MACHINE LEARNING STARTUP?
QUE TAL UM CROWDFUNDING?
ERICSSON CONSUMERLAB
• 100.000 pessoas / 40 países• https://www.ericsson.com/re
s/docs/2015/consumerlab/ericsson-consumerlab-10-hot-consumer-trends-2016-report.pdf
O QUE É MACHINE LEARNING?
• A aprendizagem automática ou aprendizado de máquina (em inglês: "machine learning") é um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitam ao computador aprender, isto é, que permitam ao computador aperfeiçoar seu desempenho em alguma tarefa.• Aprendizado de máquina – Wikipédia, a enciclopédia livre• https://pt.wikipedia.org/wiki/Aprendizado_de_máquina
O QUE CONSEGUIMOS FAZER?
• Recomendações• Classificação• Regressão• Clusterização• Extração de Regras
Dados numéricos, textos, fotos etc.
• Aprendizado Supervisionado• Aprendizado Não
supervisionado• Aprendizado por reforço• Deep Learning
RECOMENDAÇÕES
CLASSIFICAÇÃO / REGRESSÃO
• Redes Neurais• Regressões (Linear,
Logística)• Máquina de vetores de
suporte
• https://www.youtube.com/watch?v=KTrgRYa2wbI
DEEP LEARNING
DEEP LEARNING!!!
DEEP LEARNING
ONDE APRENDER?
• https://www.coursera.org/learn/machine-learning• https://www.udacity.com/course/deep
-learning--ud730• Muitos outros!
LINGUAGENS
• Java, Python, R e Scala• http://spectrum.ieee.org/computing/software/top-programmin
g-languages-tre• http://www.infoworld.com/article/3049672/application-develo
pment/which-freaking-big-data-programming-language-should-i-use.htmlnds-the-rise-of-big-data
R
• “Uma linguagem para estatísticos feita por estatísticos”• Excelente para análise de dados e construção de modelos• Normalmente não usada em produção, apesar de possível• Biblioteca: CRAN (Comprehensive R Archive Network)
PYTHON
• A linguagem mais popular em Machine Learning• Menor curva de aprendizado para cientistas• Quantidade impressionante de grandes frameworks: NumPy,
Theano, TensorFlow, scikit, Juypter/iPython• Pode ser usado de forma secundária com outros frameworks big data como Hadoop e Spark
JVM – JAVA E SCALA
• Plataforma principal dos principais frameworks de Big Data• Apache Hadoop (MapReduce / HDFS), Spark (Streaming / Machine
Learning), Kafka, Storm, DeepLearning4J
• Plataforma amplamente usada no mundo corporativo• Scala é uma das linguagens que mais cresce nesse segmento• Twitter, Linkedin
SHOW ME THE CODE!
• Recomendação de Filmes• https://databricks-training.s3.amazonaws.com/movie-recommendation
-with-mllib.html
OBRIGADO!PEDRO CAVALÉROHTTPS://BR.LINKEDIN.COM/IN/PEDROCAVALERO@PEDROCAVALERO