WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14...

Machine learning applied to accounting variables yields the risk-return metrics of

private company portfolios

WAIAF (ITA) 2019

16/05/2019

www.slq.com.br

Flavio Abdenur (SLQ)Elias Cavalcante (FEA-USP)Rodrigo de Losso (FEA-USP)

{Roteiro

2

• A Fronteira Eficiente e a Carteira Ótima

• O Caso de Empresas Abertas

• O Caso de Empresas Fechadas: Métodos Tradicionais

• O Caso de Empresas Fechadas: Machine Learning

• Resultados

• Possíveis Aplicações

{Roteiro

3

• A Fronteira Eficiente e a Carteira Ótima

• O Caso de Empresas Abertas

• O Caso de Empresas Fechadas: Métodos Tradicionais

• O Caso de Empresas Fechadas: Machine Learning

• Resultados

• Possíveis AplicaçõesTrabalho em conjunto com Elias Cavalcante (FEA-USP) e Rodrigo de Losso(FEA-USP)

{Machine Learning: Taxonomia

4

A Fronteira Eficiente e a Carteira Ótima

Figura por Elias Cavalcante


5

A Fronteira Eficiente e a Carteira Ótima

Carteira Ótima

Figura por Elias Cavalcante


6

O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?


7


• Temos séries de preços (diários) publicamente disponíveis, logo obtemos

diretamente volatilidade, retorno (em excesso) e covariâncias


8




• Teoria de Markowitz permite construção de fronteira eficiente e portanto da

carteira ótima lançando mão de retornos, volatilidades e covariâncias das ações


9






• Obs: “desempenho passado não garante desempenho futuro”


10






• Obs: “desempenho passado não garante desempenho futuro”... mas tudo bem


11

O Caso de Empresas Fechadas:

Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira

ótima?


12



ótima? – não há preços diários!


13




Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?


14





• Métodos “artesanais” de valuation geram estimativas de valor


15





• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries

diárias


16






diárias

• Escolha de peers / “empresas comparáveis” gera as estatísticas


17






diárias

• Escolha de peers / “empresas comparáveis” gera as estatísticas, mas é muito

subjetiva


18






diárias


subjetiva

• “Controle sintético” é elegante


19






diárias


subjetiva

• “Controle sintético” é elegante, mas manipulável


20






diárias


subjetiva

• “Controle sintético” é elegante, mas manipulável (vide Ferman-Cristine-Possebom

2018)


21

Machine Learning:

Abordagem via ML, usando companhias abertas como “proxies” de fechadas:


22

Machine Learning:


• Base de ≈ 1000 empresas abertas de diversos setores, cerca de 77% nos EUA e

23% no BR


23

Machine Learning:



23% no BR (obs: small- e large-caps foram purgadas)


24

Machine Learning:




• Séries trimestrais de ≈ 55 características e variáveis contábeis de cada empresa

entre 2005 e 2016, via Economática


25

Machine Learning:




• Séries trimestrais de ≈ 55 características e variáveis contábeis de cada empresa

entre 2005 e 2016, via Economática

• Preços (e portanto vols, rets e corrs) e juros, via Bloomberg / Nefin


26

Variáveis incluem:• País• Setor• EBIDTA• Alavancagem financeira• ROI• etc etc


27

Machine Learning:


• Para cada uma das variáveis v ∈ {ret, vol, corr}, meta é obter função

fv({variáveis contábeis}) ℝ ☃


28

Machine Learning:


• Para cada uma das variáveis v ∈ {ret, vol, corr}, meta é obter função

fv({variáveis contábeis}) ℝ ☃

Train / test split e tuning:

• Split 70% train / 30% test, balanceado por classes (país e setor)

• Tuning via 5-fold CV (no training set)


29

Machine Learning:

Feature Engineering:

14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a

cada uma das variáveis:


30

Machine Learning:




• Por um lado, isso “achatou” as séries em 1 observação por empresa


31

Machine Learning:





• Por outro, gerou algo da ordem de 14 x 50 = 700 features...


32

Machine Learning:






o que traz a necessidade de:


33

Machine Learning:







Feature Selection:


34

Machine Learning:







Feature Selection:

• LASSO para lineares e semi-lineares


35

Machine Learning:







Feature Selection:

• LASSO para lineares e semi-lineares

• Boruta para baseados-em-árvores (e.g, random forest e GBM)


36

Machine Learning:

Modelos testados:

• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM


37

Machine Learning:

Modelos testados:


• No final, ensembling (nos folds)


38

Machine Learning:

Modelos testados:



• Usamos OLS como benchmark


39

Machine Learning:

Modelos testados:




Obs:

• Hipótese implícita: há comportamento semelhante de empresas abertas e

fechadas


40

Machine Learning:

Modelos testados:




Obs:


fechadas

• Não é forecasting; está mais para backcasting


41

Machine Learning:

Modelos testados:




Obs:


fechadas

• Não é forecasting; está mais para backcasting

• Moralmente, combina “empresas comparáveis” com “controle sintético”


42

Resultados

• Vencedor foi RF (random forest)


43

Resultados


(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e

muito aumento de custo computacional...)


44

Resultados




• RF (resp., OLS) teve seguintes R2s:

- vol:

- ret:

- corr:


45

Resultados





- vol: 50%

- ret:

- corr:


46

Resultados





- vol: 50% (15%)

- ret:

- corr:


47

Resultados





- vol: 50% (15%)

- ret: 40%

- corr:


48

Resultados





- vol: 50% (15%)

- ret: 40% (5%)

- corr:


49

Resultados





- vol: 50% (15%)

- ret: 40% (5%)

- corr: 45%


50

Resultados





- vol: 50% (15%)

- ret: 40% (5%)

- corr: 45% (5%)


51

Resultados


52

Machine Learning:

Importância das features varia muito com o modelo:


53

Aplicações


54

Aplicações

- Auxílio de tomada de decisões (de venda e aquisição de empresas fechadas)


55

Aplicações


- Forecasting (ao invés de backcasting)?


56

Aplicações



- Private equity?


57

Aplicações



- Private equity? (neste caso variável-alvo natural seria valuation)

WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14...

Documents

Transcript of WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14...