Lecture 16: Spectral Algorithms for GMs · Backpropagation: Reverse-mode differentiation 12....

CS839:ProbabilisticGraphicalModels

Lecture16:SpectralAlgorithmsforGMsTheoRekatsinas

1

Overview

2

• AnoverviewoftheDLcomponents• Historicalremarks:earlydaysofneuralnetworks• Modernbuildingblocks:units,layers,activationsfunctions,lossfunctions,etc.• Reverse-modeautomaticdifferentiation(akabackpropagation)Distributedrepresentations

• SimilaritiesanddifferencesbetweenGMsandNNs• Graphicalmodelsvs.computationalgraphs• SigmoidBeliefNetworksasgraphicalmodels• DeepBeliefNetworksandBoltzmannMachines

• CombiningDLmethodsandGMs• UsingoutputsofNNsasinputstoGMs• GMswithpotentialfunctionsrepresentedbyNNs• NNswithstructuredoutputs

History- Motivation

3

PerceptronandNeuralNetworks

4

ThePerceptronLearningAlgorithm

5

ThePerceptronLearningAlgorithm

6

NeuralNetworkModel

7

Combinedlogisticmodels

8


9


10

Notreally,notargetforhiddenunits...

11

Backpropagation:Reverse-modedifferentiation

12

Backpropagation:Reverse-modedifferentiation

13

Modelbuildingblocks

14

Modelbuildingblocks

15

Buildingblocksofdeepnetworks

16

Buildingblocksofdeepnetworks

17

Hand-craftedfeatures

18

Hand-craftedfeatures

19

UsingDNNsforhierarchicalrepresentations

20

GraphicalmodelsvsDeepnets

22


23


24


25


26

RestrictedBoltzmannMachines

27

RestrictedBoltzmannMachines:LearningandInference

28


29


30

SigmoidBeliefNetworks

31

RBMsareinfinitebeliefnetworks

32


33


34


35

Deepbeliefnetworks:layer-wisepre-training

36

DeepBoltzmannMachines

37

DeepBoltzmannMachines

38

39


40

CombiningsequentialNNsandGMs[Gravesetal.2013]

41

CombiningsequentialNNsandGMs[Gravesetal.2013]

42

HybridNNsandconditionalGMs

43


44


45

Dealingwithstructuredprediction[Domke 2012]

Summary

46

• DL&GM:thefieldsaresimilarinthebeginning(structure,energy,etc.),andthendivergetotheirownsignaturepipelines• DL:mosteffortisdirectedtocomparingdifferentarchitecturesandtheircomponents(basedonempiricalperformanceonadownstreamtask)• DLmodelsaregoodatlearningrobusthierarchicalrepresentationsfromthedataandsuitableforsimplereasoning(“low-levelcognition”)

• GM:lotsofeffortsaredirectedtoimprovinginferenceaccuracyandconvergencespeed• GMsarebestforprovablycorrectinferenceandsuitableforhigh-levelcomplexreasoningtasks(“high-levelcognition”)

• Convergenceofbothfieldsisverypromising!

Lecture 16: Spectral Algorithms for GMs · Backpropagation: Reverse-mode differentiation 12....

Documents

Transcript of Lecture 16: Spectral Algorithms for GMs · Backpropagation: Reverse-mode differentiation 12....