Tese apresentada ao Curso de Doutorado em Biotecnologia da Rede Nordeste de Biotecnologia – RENORBIO da Universidade Federal do Ceará, como parte dos requisitos para obtenção do título de Doutora em Biotecnologia. Área de concentração: Biotecnologia em Agropecuária. Orientador: Prof. Dr. Arlindo de Alencar Araripe Noronha Moura Coorientador: Prof. Dr. Jorge André Matias Martins



Dados Internacionais de Catalogação na Publicação Universidade Federal do Ceará

Biblioteca UniversitáriaGerada automaticamente pelo módulo Catalog, mediante os dados fornecidos pelo(a) autor(a)

P877a Portela, Antonia Moemia Lucia Rodrigues. Aplicações de técnicas moleculares de nova geração (NGS) para o estudo do desempenho reprodutivo detouros e vacas leiteiras / Antonia Moemia Lucia Rodrigues Portela. – 2018. 138 f. : il. color.

Tese (doutorado) – Universidade Federal do Ceará, Pró-Reitoria de Pesquisa e Pós-Graduação, Programade Pós-Graduação em Biotecnologia (Rede Nordeste de Biotecnologia), Fortaleza, 2018. Orientação: Prof. Dr. Arlindo de Alencar Araripe Noronha Moura. Coorientação: Prof. Dr. Jorge André Matias Martins.

1. Metilação. 2. Epigenética. 3. RNA sequencing. 4. Pós-parto. 5. Gene. I. Título. CDD 660.6

Tese apresentada ao Programa de Pós-Graduação em Biotecnologia da Rede Nordeste de Biotecnologia – RENORBIO da Universidade Federal do Ceará, como requisito parcial à obtenção do título de Doutora em Biotecnologia. Área de concentração: Biotecnologia em Agropecuária.

Aprovada em: ___/___/______.


______________________________________________________ Prof. Dr. Arlindo de Alencar Araripe Noronha Moura (Orientador)

Universidade Federal do Ceará (UFC)

______________________________________________________ Prof. Dr. Fábio Roger de Vasconcelos Universidade Federal do Ceará (UFC)

______________________________________________________ Prof. Dra. Lays Debora Silva Mariz

Universidade Federal do Ceará (UFC)

_______________________________________________________ Prof. Dr. Stefano Biffani

Italian National Research Council (CNR)

_______________________________________________________ Prof. Dr. Vicente José de Figueiredo Freitas

Universidade Estadual do Ceará (UECE)

A Deus, pela minha existência, força, coragem e determinação que me foi dada para alcançar mais esse objetivo, porque nada nos é possível se não for de Sua vontade.


A Deus, pelo seu amor e pela sua infinita misericórdia manifestados a cada dia em

minha vida. Pela proteção, força e coragem para enfrentar todas as dificuldades da vida

pessoal e profissional. Senhor, a minha confiança descansa nas Tuas mãos. Sempre espero e

confio em ti. Obrigado por mais essa vitória.

Aos meus pais Maria Lia Neta Portela e Manoel Raimundo Portela, por terem me

dado a vida e por todo amor e dedicação fundamentais em todos os momentos da minha vida.

Às minhas irmãs Luana Portela e Nalda Portela e ao meu irmão Fábio Portela, com os quais

dividi momentos de alegrias e tristezas, e que sempre estarão me incentivando e torcendo pelo

meu sucesso.

À família Marques de Oliveira (minha segunda família), em especial à dona Maria

das Graças, Sr. Francisco e Jorge Luis, por fazerem me sentir parte da família, dividindo

comigo momentos de tristezas, mas principalmente momentos de muitas alegrias. Vocês

moram no meu coração.

Ao orientador Prof. Dr. Arlindo Moura, pela orientação deste trabalho, paciência,

pela dedicação dispensada, confiança e profissionalismo demonstrado no decorrer de nossa

convivência. Agradeço pela contribuição decisiva na minha formação e pelo muito que

aprendi durante os anos de doutorado.

Ao Co-orientador Prof. Dr. Jorge Martins, pela dedicação constante e por sempre

estar disposto a ajudar em todos os momentos.

Aos queridos amigos integrantes do grupo de pesquisa de Fisiologia Animal,

obrigada pelo apoio de todos.

À querida amiga e irmã Jordania Freire e toda a família Freire, Clayrtiano Freire,

Dona Celina, Sr. Raimundo e Rafael Freire, em especial meu afilhado João Arthur, agradeço

pela amizade, companheirismo, apoio e incentivo desde o início e por me tratarem sempre

com muito carinho, como se eu fosse uma irmã, obrigada pelo apoio e pelas palavras de

carinho nos momentos mais difíceis.

Aos amigos Anderson Weiny Silva, Regislane Pinto Ribeiro, Juliane Passos, Amélia

Soares e Jackson Costa agradeço pela amizade, pelos conselhos, pelos momentos de trabalho

e pelos momentos de descontração. Admiro a competência de vocês.

Ao meu amigo Rony Barroso pelo apoio incondicional e por ser meu companheiro de

momentos bons e ruins durante essa fase.

Page 7: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará

À Solange Damasceno, que esteve presente do início ao fim do trabalho, que me

apoia, que foi em muitos momentos meu porto seguro, pessoa muito especial na minha vida,

uma das melhores pessoas que conheci e que quero para a vida... Amo tu e serei sempre grata

por seu grande apoio.

À Danuza Leão e Denise Azevedo, obrigada pelo apoio, companheirismo, risadas,

por sempre se preocuparem comigo e fazer eu me sentir tão especial para vocês, nos

encontramos, um achado que deu certo.

Ao meu amigo Aderson Viana, que apesar de sermos muito diferentes é alguém em

quem confio, e que me passa confiança. Obrigada, nobre amigo.

Aos meus amigos Taciane Alves, Mayra Vetorazzi, Antônio Carlos, Mónica

Ramirez, Arabela Guedes, Nielyson Batista por todo o apoio nos momentos de desânimo,

obrigada a todos e amo muito vocês.

À Kamila Sousa e Renato Passos, pelo apoio e por terem sido presentes nessa

caminhada, por toda ajuda, agradeço.

A minha amiga Gisvani Lopes, por toda vibração positiva, pela força e apoio nos

momentos difícies, te amo amiga.

Aos integrantes do grupo de pesquisa do Consiglio Nazionale della Ricerche: Dra.

Flavia Pizzi, Emanuele Capra, Dra. Stefania Chessa, Dra. Paola cremonesi e em especial ao

Dr. Stefano Biffani por ter sido muito presente nos meus trabalhos desenvovlvidos, pela

paciência e por ter sido um amigo.

À Elisabety Mendes, por ter me recebido como membro da família, pelas conversas e

conselhos, por ter sido meu apoio durante o ano do meu doutorado sanduíche, muita gratidão

por você.

Aos integrantes da banca examinadora, Prof. Dr. Arlindo de Alencar Araripe

Noronha Moura (Orientador), Prof. Dr. Stefano Biffani, Profa. Dra. Lays Débora Silva Mariz,

Dr. Fábio Vasconcelos, Prof. Dr. José Roberto Viana Silva e Prof. Dr. Vicente José de

Figueiredo Freitas, por terem gentilmente aceito o convite para participar da banca de defesa

desta tese, e pela solicitude em contribuir no engrandecimento deste trabalho.

Aos funcionários da Universidade Federal do Ceará pela convivência, atenção e

disponibilidade durante todos esses anos de convívio.

A todos que de alguma forma me deram força e incentivo na realização do meu

doutoramento, seja profissionalmente ou sentimentalmente e por participarem da minha vida.

Por fim, agradeço a todos que contribuíram, de alguma forma, ou torceram para que

eu chegasse até aqui, compartilhando comigo um momento tão importante. A todos vocês, de

coração, o meu

Muito obrigada!!!

“Porquanto, ainda que a figueira não floresça, nem haja fruto na vide; o produto da oliveira minta, e os campos não produzam mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará andar sobre as minhas alturas.”

(HABACUQUE 3:17-19)

RESUMO O estudo 1 teve como objetivo produzir um perfil de metilação em todo o genoma e

identificar assinaturas epigenéticas diferenciais entre espermatozoides de alta motilidade

(AM) e baixa motilidade (BM). O estudo 2 teve como objetivo caracterizar as vias

metabólicas associadas ao início da lactação em vacas Holandesas utilizando dados de RNA-

seq obtidos de amostras de tecido adiposo subcutâneo coletadas em três momentos: em 2

(T0), 30 (T1) e 90 (T3) dias após o parto. No estudo 1 foi explorado a metilação de

dinucleotídeos citosina-guanina (CpGs) em populações de espermatozoides de AM e BM de

Bos taurus separados por Percoll. Padrões de metilação de espermatozoides de alta e baixa

motilidade foram investigados por sequenciamento de bissulfito. A comparação entre as

populações desses espermatozoides revelou que a variação da metilação afeta os genes

envolvidos na organização da cromatina, no qual houve metilação em genes associados à

remodelação da estrutura do DNA, bem como em um elemento repetitivo BTSAT4 em

regiões pericentroméricas. Desta forma, sugere-se que a manutenção da estrutura

cromossômica através da regulação epigenética seja crucial para a funcionalidade correta do

espermatozoide. Para o estudo 2, o RNA total foi extraído a partir do tecido adiposo

subcutâneo no dia do parto (T0), 30 dias após o parto (T1) e noventa dias após o parto (T3), e

comparações foram feitas entre os grupos mencionados. Um total de 12.294 genomas foram

identificados e submetidos a uma filtragem, identificando um total de 405.435.505 genes, nos

quais os genes diferencialmente expressos foram analisados através do False Discovery Rate

(FDR = 0,05). As vias metabólicas associadas ao início da lactação em vacas holandesas

foram caracterizadas utilizando dados de RNA-seq obtidos de amostras de tecido adiposo

subcutâneo coletadas em três momentos: aos 2 (T0), 30 (T1) e 90 (T3) dias pós-parto. A

análise de enriquecimento identificou 142 vias metabólicas. Os mais significativos foram:

secreção de insulina, sinalização da ocitocina, glicólise / gliconeogênese, metabolismo do

piruvato, resistência à insulina, sinalização de cálcio, GnRH (hormônio liberador de

gonadotropina), MAPK (proteína quinase mitogênica), sinalização de adipocitocinas e o

sistema renina-angiotensina. Todas essas vias representam importantes rotas metabólicas em

bovinos leiteiros em lactação.

Palavras-chave: Espermatozoide. metilação. epigenética. RNA sequencing. pós-parto. gene.

Page 11: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará

ABSTRACT Study 1 aimed to produce a methylation profile in genome in both populations, and to identify

differential epigenetic signatures between high motility (HM) and low motility (LM) sperm.

Study 2 aimed to characterize the metabolic pathways associated to early lactation in Holstein

cows using RNA-seq data obtained from subcutaneous fat tissue samples collected at three

time points: at 2 (T0), 30 (T1) and 90 (T3) days postpartum. In study 1, we explored the

methylation of cytosine-guanine dinucleotides (CpGs) in HM and LM sperm populations in

Bos taurus separated by Percoll. Methylation patterns of high and low motility sperm were

investigated by bisulphite sequencing. The comparison between the populations of HM and

LM sperm revealed that the variation of methylation affects the genes involved in the

organization of chromatin and that methylation occurred in genes associated with the

remodeling of the DNA structure, as well as in a repetitive element BTSAT4 in

pericentromeric regions. Thus, it is suggested that the maintenance of chromosome structure

through epigenetic regulation is crucial for the correct functionality of sperm. For study 2,

total RNA was extracted from subcutaneous adipose tissue on the day of birth (D0), 30 days

postpartum (D30) and ninety days postpartum (D90) and comparisons were made between the

groups mentioned. A total of 12.294 genomes were identified and subjected to a filtering,

identifying a total of 405.435.505 genes, in which differentially expressed genes were

analyzed using the False Discovery Rate (FDR = 0.05). Metabolic pathways associated to the

early lactation in Holstein cows were characterized using RNA-seq data obtained from

subcutaneous fat tissue samples collected at three time points: at 2 (T0), 30 (T1) and 90 (T3)

days postpartum. The enrichment analysis identified 142 metabolic pathways. The most

significative were insulin secretion, oxytocin signaling, glycolysis/gluconeogenesis, pyruvate

metabolism, insulin resistance, calcium signalling, GnRH (Gonadotropin releasing hormone),

MAPK (mitogen-activated protein kinase), adipocytokine signaling, and the

renin−angiotensin system. All these pathways are important metabolic routes in lactating

dairy cattle.

Keywords: Sperm. methylation. epigenetics. RNA sequencing. postpartum. gene.

Figura 1 – Controle da expressão gênica por mecanismos epigenéticos

........................ 22

Figura 2 – Condensação e compactação da cromatina do espermatozoide

.................... 26

Figure 3 – Distribution of CpG methylation levels across the gene bodies, 5’UTR,

3’UTR and CGI ………………………….………………………………… 63

Figure 4 – Hierarchical clustering for DMRs present in CGIs, gene bodies, 5’ UTRs

and 3’ UTRs

…………................…………………………………………… 64

Figure 5 – Distribution of CGIs length in HM and LM (20-60 CpG methylated) and

HM and LM (80-100 CpG methylated)

........................................................... 65

Figure 6 – CpG methylation levels in MRs and DMRs of HM and LM sperm


...................................................................................................... 66

Figure 7 – Top metabolic pathways (from KEGG) enriched in the genes associated

with the lactation period. These pathways were detected from genes

identified in subcutaneous adipose tissue

........................................................ 103

Table 1 – GO terms identified for the differentially methylated genes (DMGs) found

to differ between high motile (HM) and low motile (LM) sperm populations

in gene bodies (GENE), 5’ untranslated regions (5’UTRs), 3’ untranslated

regions (3’UTRs) and CpG islands (CGIs)

…………………………………… 54

Table 2 – Frequency of occurrence for Repetitive Elements (REs) overlapping CGIs

with different methylation levels (20-60 % methylation and 80-100%

methylation) in high motile (HM) and low motile (LM) sperm populations.

Frequency of occurrence for REs is also reported for Bos taurus genome

……. 56

Table 3 – Top 5 pathways associated at different time points comparison (at calving

(T0), at 30 days post-calving (T1) and at 90 days post-calving (T3)

.................. 103

3’UTRs Regiões 3’ não traduzidas 3’ untranslated regions

5’UTR Regiões 5’ não traduzidas 5’ untranslated regions

ALH Amplitude do deslocamento lateral da


Amplitude of lateral head


BCF Frequência de batimentos Frequency of head displacement

BTLTR1 Fragmentos de repetições

interrompidas Registrado por

RepeatMasker ID

Fragments of Interrupted Repeats

Joined by RepeatMasker ID

BTSAT3 Satélite/Centromérico Satellite/Centromeric

BTSAT4 Satélite/Centromérico Satellite/Centromeric

CASA Sistemas automáticos de análise de


Computer-Assisted Semen Analysis

CATSPER1 Canal catiônico 1 do espermatozoide Cation Channel Sperm Associated 1

CGIs Ilhas CpGs CpG islands

CH3 Radical metil Methyl radical

CpGs Dinucleotídeos citosina-guanina Cytosine-guanine dinucleotides

DMGs Genes dierencialmente expressos Differentially methylated genes

DNA Ácido desoxirribonucleico Deoxyribonucleic acid

Dnmt3b DNA (citosina-5-)-metiltransferase 3


DNA (cytosine-5-)-methyltransferase

3 beta

DNMTs DNA metiltransferases Deoxyribonucleic acid


ELISA Ensaio de imunoabsorção enzimática Enzyme-linked immunosorbent assay

GO Ontologia gênica Gene ontology

HDM Histona demetilase histone demethylase

HM Alta motilidade High motile

HMT Histona metiltransferase Histone methyltransferase

HMTases Histona metiltransferases Histone methyltransferases

ICR1 Região 1 controladora de imprinting imprinting control region 1

IGF2 Fator de crescimento semelhante à


insulin-like growth factor 2

Page 15: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará

IVF Fertilização in vitro In vitro fertilization

KDM1 Lysine (K)-specific demethylase 1A

KDMs Lysine (K)-specific demethylase

KMT2A Histone lysine methyltransferases 2A

KMTs Histone lysine methyltransferases

LIN Linearidade Linearity

LINE Long interspersed elements

LM Baixa motilidade Low motile

LSD1 Lysine-specific histone demethylase 1

LSM Least squares means

MBD Methyl-binding domain

MEST Mesoderm-specific transcript

miRNAs micro RNAs MicroRNAs

MLL1 Mixed-lineage leukemia 1

MLL2 Mixed-lineage leukemia 2

MMSET Multiple myeloma SET domain

MRs Methylated regions

NCBI National center for biotechnology


NSD1 Nuclear receptor-binding SET

Domain 1

NSD2 Nuclear receptor-binding SET

Domain 2

NSD3 Nuclear receptor-binding SET

Domain 3

OSSAT2 Fragmentos de repetições

interrompidas Registrado por

RepeatMasker ID

Fragments of Interrupted Repeats

Joined by RepeatMasker ID

PCR Reação em cadeia da polimerase Polymerase chain reaction

Res Elementos repetidos Repetitive elements

RNA Ácido ribonucléico Ribonucleic acid

RNAm Ácido ribonucléico mensageiro Messenger ribonucleic acid

RRBS Reduced representation bisulfite

SCNT Transferência nuclear de células


Somatic cell nuclear transfer

SRA Sequence Reads Archive

STR Retilinearidade Straightness

Suv39h Suppressor of variegation 3-9


TALP Tyrode’s albumine lactate pyruvate

VAP Velocidade de Trajeto Average path velocity

VCL Velocidade Curvilinear Curvilinear velocity

VSL Velocidade Progressiva Straight line velocity

WHSC1 Wolf-Hirschhorn syndrome candidate-


LISTA DE SÍMBOLOS Português Inglês

% Percentagem Percentage

~ Aproximadamente Aproximately

± SEM Erro padrão da média Standard error of the mean

°C Graus Celsius Degrees Celsius

µg Micrograma Microgram

µL Microlitro Microliter

µm Micrômetro Micrometer

µM Micromolar Micromolar

CO2 Dióxido de carbono Carbon dioxide

H Hora Hour

IU/mL Unidades internacionais por mL International units per mL

Min Minuto Minute

Mg Miligrama Milligram

mL Mililitro Milliliter

mM Milimolar Millimolar

Mm Milímetro Millimeter

Ng Nanograma Nanogram

Nm Nanômetro Nanometer

P < 0,05 Probabilidade de erro menor do que 5% Error probabilities is less than 5%

P > 0,05 Probabilidade de erro maior do que 5% Error probabilities is more than 5%

1 INTRODUÇÃO............................................................................................. 19

2 REVISÃO DE LITERATURA.................................................................... 21

2.1 Tecnologias ômicas na reprodução animal................................................. 21

2.1.1 Genômica....................................................................................................... 21

2.1.2 Epigenética..................................................................................................... 26 Epigenética e fertilidade................................................................................. 24 Estrutura do DNA espermático...................................................................... 25 Motilidade espermática.................................................................................. 27

2.1.3 Transcriptômica............................................................................................ 29

2.1.4 Proteômica..................................................................................................... 32

2.1.5 Metabolômica................................................................................................ 33

3 PROBLEMA.................................................................................................. 35

4 JUSTIFICATIVA.......................................................................................... 36

5 HIPÓTESES CIENTÍFICAS....................................................................... 38

6 OBJETIVOS.................................................................................................. 39

6.1 Objetivos gerais............................................................................................. 39

6.2 Objetivos específicos..................................................................................... 39



BOS TAURUS …………......................................................




DURING EARLY LACTATION …...............…………………………


9 CONCLUSÕES……………………………………………………………. 122

10 PERSPECTIVAS………………………………………………………….. 123

REFERÊNCIAS…………………………………………………………… 124

A maioria dos estudos reprodutivos em bovinos está voltada para a fertilidade da

vaca, enquanto a fertilidade do macho recebeu menos importância. No entanto, estudos

relataram que um percentual significativo de falhas reprodutivas em bovinos de leite é

atribuído à subfertilidade dos machos (DEJARNETTE et al., 2004). Consequentemente, a

fertilidade de touros não deve ser considerada menos importante em esquemas de reprodução

destinados a melhorar o desempenho reprodutivo do gado leiteiro (BRAUNDMEIER;

MILLER, 2001).

A avaliação da fertilidade de touros consiste na avaliação seminal. Assim, os

parâmetros tais como concentração, motilidade e morfologia espermática podem não ser

suficientes para uma análise completa do potencial de fertilidade do sêmen. A análise do

sêmen não informa como o espermatozoide, particularmente o DNA espermático ajudará e

influenciará o desenvolvimento do embrião. Em termos de função espermática, a análise do

sêmen não informa realmente sobre eventos como a quimiotaxia, que é o processo no qual o

espermatozoide poderá encontrar o oócito, além de também não informar sobre a penetração,

o processo de obter o espermatozoide e seu DNA no oócito para que o embrião possa começar

a se formar. Dessa forma, o surgimento das tecnologias ômicas, como a genômica,

transcriptômica, proteômica, e metabolômica tornaram-se ferramentas valiosas para o estudo

do sêmen, fornecendo a detecção de possíveis biomarcadores da fertilidade (THUNDATHIL

et al., 2016).

Estudos recentes no campo da genômica comparativa e análise de expressão gênica

forneceram novas ferramentas de detecção molecular que permitem que vários parâmetros

sejam efetivamente integrados na avaliação do potencial fertilizante do sêmen

(BISSONNETTE et al., 2009). Recentemente, estudos baseados na expressão gênica e

epigenética foram usados para analisar características de fertilidade. Em humanos foi

demonstrado que os padrões de metilação do DNA de espermatozoides diferem

significativamente entre homens inférteis e férteis. Além disso, o padrão de metilação do

DNA pode ser preditivo da qualidade do embrião durante a fertilização in vitro (ASTON et

al., 2015). A metilação desordenada em genes em “loci” promotores e impressos está

fortemente associada a várias formas de infertilidade e defeitos de espermatozoides em

homens (WU et al., 2010). Da mesma forma, a hipometilação global do DNA espermático foi

relacionada a resultados insatisfatórios da gestação em pacientes através de fertilização in

vitro (BENCHAIB et al., 2005). Há muitos candidatos prováveis que podem causar alterações

Page 20: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


epigenéticas nos espermatozoides e podem levar à embriogênese anormal (STUPPIA et al.,

2015). Assim, o epigenoma espermatico oferece interessantes oportunidades de estudo e

grandes esforços têm sido empregados para entender o papel dos padrões epigenéticos do

espermatozoide no seu desenvolvimento e funcionalidade, bem como no desenvolvimento

embrionário e na prole.

Em vacas leiteiras no momento de transição do período seco para o início da

lactação, o risco de doenças metabólicas é particularmente alta (HAMMON et al., 2006;

McART et al., 2013). Após o parto, o gado leiteiro requer um aumento acentuado dos

requisitos de nutrientes para propiciar produção de leite (DRACKLEY, 1999). Desta forma,

impedir ou contornar o balanço energético no período pós-parto pode reduzir a incidência de

doenças e diminuir a mobilização de reservas corporais (DUFFIELD et al., 2009).

O melhoramento genético no âmbito da produção de leite requer uma visão

abrangente da biologia do processo de lactação, desde um único estágio até a curva total da

lactação (CUI et al., 2014). Além de dados genéticos, perfis de expressão gênica e análise de

alterações em vias metabólicas oferecem novas oportunidades para elucidar os mecanismos

subjacentes de traços complexos em humanos e animais de produção, e atualmente ocorre o

rápido desenvolvimento e redução de custos do sequenciamento de próxima geração (NGS)

(REINERT et al., 2015). Assim, as novas tecnologias de sequenciamento de nova geração

(NGS), agora avaliado como uma ferramenta abrangente e precisa para analisar complexos

sistemas ômicos subjacentes a processos biológicos, oferecendo grandes oportunidades para

elucidar os mecanismos subjacentes de características complexas, como o processo de

lactação e da fertilidade em touros. Desta forma, ensaios baseados em sequências de

transcriptomas e sequenciamento de RNA e DNA (RNA-seq; DNA-seq), tornou-se uma

abrangente e precisa ferramenta para análise de padrões de expressão gênica.

Page 21: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará




As tecnologias “ômicas” adotam uma visão geral das moléculas que compõem uma

célula, tecido ou organismo. Elas são voltadas principalmente para a detecção universal de

genes (genômica), RNAm (transcriptômica), proteínas (proteômica) e metabólitos

(metabolômica) em meio biológico específico. As abordagens “ômicas” propõem uma

caracterização global de classes específicas de biomoléculas-alvo em sistemas uni ou

multicelulares como uma estratégia para alcançar uma compreensão abrangente das funções

biológicas (ALEXANDRI et al., 2010). As tecnologias genômica, transcriptômica,

proteômica e metabolômica podem ser aplicadas não apenas para a maior compreensão dos

processos fisiológicos normais, mas também nos processos de doença, que desempenham um

papel na triagem, diagnóstico e prognóstico, bem como auxiliam na compreensão da etiologia

das doenças. Estratégias exclusivas se prestam à descoberta de biomarcadores à medida que

investigam múltiplas moléculas simultaneamente (HORGAN; KENNY, 2011).

Nos últimos anos, tem havido um notável desenvolvimento nestes campos. O grande

desafio, no entanto, é integrar várias formas de dados “ômicos” para fornecer informações

sobre os complexos sistemas biológicos dentro dos organismos vivos (SURAVAJHALA et

al., 2016). A maioria das características biológicas é controlada por um grande número de

genes que, além de seus efeitos aditivos, podem interagir entre si e sua expressão pode ser

alterada com base em uma variedade de efeitos ambientais. Desta forma, o rápido

desenvolvimento em tecnologias “omics” fornece oportunidades de investigar o genoma e o

epigenoma, bem como, a possibilidade de sua posterior implementação em métodos de


2.1.1 Genômica

O efeito gênico nas características de produção e na fisiologia animal tem sido

estudado principalmente ao vincular esses parâmetros de resultado à variação em sequências

genéticas. A maioria das pesquisas em animais de produçãoé feita via observação de um

grande número de Polimorfismos de nucleotídeo Único (SNPs – mutações únicas em posições

específicas no genoma) ou sequenciando genes-alvo que devem estar envolvidos no resultado

Page 22: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


de interesse. Porém recentemente, o sequenciamento do genoma inteiro tornou-se mais

popular (CROUCHER et al., 2010).

Embora alguns genes isolados com efeito sobre características econômicas ocorram,

a maior parte da variação genética no ganho econômico se deve a características complexas

controladas por muitos genes. De fato, evidências recentes indicam que a maioria das

características quantitativas é controlada por milhares de polimorfismos (BOYLE et al.,

2017). Os primeiros estudos de reprodução na produção de gado leiteiro foram baseados em

observações fenotípicas e na habilidade de alguns criadores. Com o tempo, a pecuária leiteira

evoluiu para uma ciência com melhor compreensão e apreciação da herança de vários traços

importantes e assim, o desenvolvimento de conjuntos de dados para estimativa de mérito e

melhoria genética de raças leiteiras. Desta forma, ganhos genéticos significativos foram

obtidos usando essas estratégias de melhoramento em muitas áreas, incluindo características

de produção de leite. Embora a combinação de extensos dados genealógicos e fenótipos tenha

melhorado os programas de seleção, as características de baixa herdabilidade, como

fertilidade e saúde, e outras características difíceis de fenotipar, obteve a exploração de novas

metodologias para alcançar um aumento dos ganhos genéticos (FLEMING et al., 2018).

Assim, a genômica realiza o sequenciamento genético dos organismos, sendo

essencial para a compreensão dos complexos eventos que orquestram a função de todos os

organismos ou os defeitos que levam a doenças (SHULDINER; POLLIN, 2010). Portanto, o

desenvolvimento de técnicas como o sequenciamento de DNA tornou-se uma ferramenta

essencial para decifrar genes completos e, mais adiante, genomas inteiros.

Assim, diante do importante papel do macho na determinação da fertilidade do

rebanho bovino e o ganho genético possível com o advento da seleção genômica, múltiplas

abordagens são necessárias para desvendar a complexidade da fertilidade de touros. Apesar do

pequeno tamanho efetivo da população na maioria das raças bovinas e da natureza altamente

selecionada de touros para a inseminação artificial, Whiston et al. (2017) demonstraram o

primeiro catálogo abrangente de variação genética em genes de β-defensina em bovino e o

primeiro sequenciamento de todo exoma de touros divergentes de fertilidade. Essa abordagem

identificou novas variantes nos genes β-defensina e FOXJ3, potencialmente regulando a

função reprodutiva, e esses biomarcadores podem contribuir para futuras estratégias de

reprodução a fim de melhorar a fertilidade em machos

Page 23: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


2.1.2 Epigenética

A epigenética é usada para descrever as mudanças herdáveis que controlam a

expressão gênica, sem que a sequência original do DNA seja alterada (RUSSO et al., 1996).

Entre os mecanismos epigenéticos conhecidos, destacam-se as modificações covalentes nas

histonas, tais como: acetilação, metilação, ubiquitinação e fosforilação, que ocorrem nas

caudas N-terminais de proteínas histonas, as quais o DNA se enrola formando o nucleossomo,

estrutura fundamental da cromatina. O processo da metilação do DNA é descrito como a

introdução de radical metil (CH3) no carbono 5 de citosinas, seguidas de guaninas (ilhas

GpGs), na moléculas de DNA e RNAs não codificantes considerados pequenos ou micro

RNAs (miRNAs) espalhados ao longo do genoma com função regulatória de controle da

expressão gênica (JONES; TAKAI, 2001) conforme demonstrado na figura 1.

Figura 1. Controle da expressão gênica por mecanismos epigenéticos. Fonte: Adaptado de Hagood (2014).

A acetilação de lisinas é altamente dinâmica regulada pela ação oposta de duas

famílias de enzimas: histonas acetiltransferases e histonas deacetilases. Na acetilação há a

transferência de um grupo acetil ao grupo Ɛ-amino de cadeias laterais de lisina, levando a

neutralização da carga positiva da lisina e assim, enfraquecendo as interações entre histonas e

DNA. Há dois grupos de acetilases: A e B. O grupo A é uma família de enzimas mais

diversificada, e de modo geral modificam múltiplos sítios dentro das caudas N-terminais das

Page 24: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


histonas, devido à sua capacidade de interromper a estabilidade de interações eletrostáticas,

onde essas enzimas funcionam como coativadores transcricionais (YANG; SETO, 2008). O

grupo B é predominantemente citoplasmático [acetilando histonas livres, mas não aquelas que

já se depositaram na cromatina] (PARTHUN, 2007). No entanto, não são apenas as caudas

das histonas que estão envolvidas neste regulamento, sítios adicionais de acetilação presentes

dentro do núcleo globular da histona também são encontrados.

A metilação do DNA em ilhas GpGs é a única modificação epigenética que afeta

diretamente o DNA. Na mesma, um grupo metil é adicionado a uma base de citosina, onde

essa alteração não afeta a forma como a citosina é transcrita em RNA mensageiro, porém

promove localmente a compactação da cromatina, afetando o fator de ligação de transcrição

(BIRD, 2002). No processo de metilação do DNA, a introdução do radical metil é catalisada e

mantida por enzimas denominadas DNA metiltransferases (DNMTs), que obtêm e transferem

o radical metil a partir do composto S-adenosyl-L-metionina, que é o doador de metil, para o

carbono 5 da citosina (FERNANDES et al., 2007).

As ilhas CpGs estão em grande parte das regiões promotoras dos genes, sendo essa

região pelo menos 10 vezes mais metilada do que outras regiões do genoma com CpGs

(RODRIGUEZ et al., 2016). Porém, a atuação da metilação do DNA no controle da expressão

gênica em regiões promotoras é considerada um processo simples, visto que este evento pode

afetar a função gênica quando ocorre em regiões diferentes, como o que acontece em regiões

intrônicas, ilhas CpGs distantes da região promotora (shore CpG island) ou em elementos de

repetição em tandem (FERNANDES et al., 2007). Desta forma, o importante papel exercido

pela metilação do DNA, assim como pelas modificações de histonas, no controle da função

gênica assume-se que o epigenoma, ou seja, a programação epigenética total do DNA seja um

fenômeno dinâmico e diferente entre os tipos celulares (BOYES; BIRD, 1992). Epigenética e fertilidade

Durante as últimas décadas, numerosos testes de avaliação da capacidade fertilizante

dos espermatozoides foram desenvolvidos, destacando-se as análises morfológicas (BONDE

et al., 1998), de motilidade (BUDWORTH et al., 1998), de penetração do muco cervical

(AITKEN et al., 1985), análise das membranas plasmática e acrossomal e a interação

espermatozoide-zona pelúcida em testes de fertilização in vitro com oócitos homólogos

(GUIENNE et al., 1990). Entretanto, é necessário um método preciso e amplamente aplicável

Page 25: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


para a avaliação de sêmen no diagnóstico de infertilidade do macho que permita melhorar os

padrões de avaliação seminal. Estudos genômicos e/ou proteômicos sistematizados das

características seminais, assim como, chips de microarranjos poderiam contribuir na

identificação de novas e melhores técnicas de avaliação (CORNER et al., 2006).

A metilação do DNA tem sido intimamente associada à infertilidade masculina, onde

o padrão de metilação em espermatozoides maduros reflete mudanças no padrão de expressão

gênica que ocorre durante a espermatogênese. A metilação do DNA controla a atividade

transcricional dos genes e está envolvida no estabelecimento de uma estrutura de cromatina de

ordem superior. Um padrão normal de metilação nas células germinativas contribui para a

progressão da meiose, culminando na produção de espermatozoides funcionais. Assim,

anormalidades na metilação do DNA podem afetar a produção de espermatozoides e explicar

alguns casos de infertilidade masculina (ROUSSEAUX et al., 2008).

A aplicação de tecnologias da genômica para estudo da célula espermática, em

conjunto com uma avaliação detalhada da competência funcional deve fornecer perspectivas

para as bases bioquímica, fisiológica e genética da qualidade do sêmen de baixo potencial

fertilizante (SAKKAS et al., 2004). Pesquisas têm investigado o papel da integridade do DNA

espermático na infertilidade masculina, e sugere-se que a integridade do DNA do

espermatozoide possa ser um bom preditor da fertilidade masculina, pois, evidências

demonstram que espermatozoides de homens inférteis apresentam mais danos no DNA em

comparação com homens férteis, e esse dano pode ter um efeito negativo no potencial da

fertilidade masculina (ZINI et al., 2001).

Vale ressaltar que os touros são capazes de gerar mais descendentes do que as vacas;

consequentemente, a seleção do macho é mais eficaz do que a seleção da fêmea para melhorar

qualquer característica (McDANIELD; KUEHN, 2014). Diante disso, quando se utilizam

touros com valores genético e reprodutivo superiores em um rebanho, pode-se reduzir o

número de reprodutores em serviço e acelerar o ganho genético (FORDYCE et al., 2002).

Entretanto, existem diferenças na capacidade fertilizante entre os touros (DEJARNETTE et

al., 1992). A estimativa da fertilidade do reprodutor é uma ferramenta importante na escolha

do macho, não só porque reflete o estado individual do reprodutor, mas também porque dito

resultado influencia o futuro do rebanho.

O espermatozoide possui uma natureza inerente quiescente. Contudo, existem vários

vestígios epigenéticas importantes que criam uma paisagem especializada e única, como a

composição da proteína nuclear, metilação do DNA e RNAs dos espermatozoides

(CARRELL, 2012). Desta forma, estudos desenvolvidos na investigação de sinais

Page 26: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


epigenéticos do espermatozoide entre touros de alta e baixa fertilidade demonstraram que 76

regiões são diferencialmente metiladas entre touros de diferentes estados de fertilidade

(KROPP et al., 2017). Verma et al. (2014) relataram análise de metilação por microarray de

espermatozoides de búfalo considerado alto e subfértil, dos quais 73 genes em alta fertilidade

e 78 genes em espermatozoides subférteis foram hipermetilados, logo após a análise da via

caracterizaram esses genes por desempenharem papeis na transcrição regulação e proliferação

celular. Estrutura do DNA espermático

A cromatina espermática se destaca por ser extremamente condensada. Nas células

somáticas o DNA é enrolado ao redor de proteínas denominadas histonas e organizados em

estruturas solenoides (McGHEE et al., 1983). No entanto, o núcleo espermático não possui

volume suficiente para este tipo de organização (WARD, 2011), consequentemente a

cromatina do espermatozoide deve ser organizada de maneira única, altamente condensada e

compactada (SHARMA; AGARWAL, 2011) (FIGURA 2). A compactação da cromatina

espermática ocorre durante a espermatogênese, onde a célula germinativa, geneticamente

ativa, se transforma em um espermatozoide inativo ou quiescente até a fertilização do oócito.

Estas mudanças são induzidas pela modificação de proteínas que se ligam e compactam o

DNA, promovendo a desprogramação temporária do genoma paterno (BALHORN, 2011).

Page 27: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Figura 2. Condensação e compactação da cromatina do espermatozoide. Fonte: Adaptado de Seli et al. (2004).

Antes da meiose, a cromatina dos espermatócitos é estruturalmente semelhante à das

células somáticas, onde as proteínas predominantes são as histonas. Com o progresso da

meiose e nos primeiros estágios da espermiogênese uma série de proteínas variantes das

histonas são sintetizadas; algumas dessas proteínas irão ser mantidas em pequenas proporções

no espermatozoide maduro, e o restante delas é substituída por proteínas de transição

(BALHORN, 2011). Com o aparecimento dessas proteínas de transição nas espermátides, é

iniciada a condensação da cromatina, que acontece no sentido da região apical para a caudal

(OKO et al., 1996). Então, as proteínas de transição são substituídas por proteínas de carga

positiva, denominadas protaminas (BALHORN, 2011).

A integridade do DNA de espermatozoides de mamíferos é de importância vital para

a contribuição paterna de um descendente normal, uma vez que danos de DNA podem resultar

em morte celular e na indução de mutações que podem ser transportadas para a próxima

geração ou resultar em infertilidade do macho(ANDRABI, 2007; SHIBAHARA et al., 2003).

Assim, a integridade do DNA tornou-se importante indicativo da qualidade do

espermatozoide (HUGHES et al., 1999). Consequentemente, os distúrbios na integridade da

cromatina são caracterizados pela presença de fraturas na banda simples ou dupla da molécula

de DNA que leva à formação de segmentos desnaturados (RYBAR et al., 2004). Uma elevada

suscetibilidade à desnaturação demonstra heterogeneidade da estrutura da cromatina e tem

sido relacionada a distúrbios na espermatogênese, morfologia anormal (ENCISO et al., 2011),

concentração e motilidade espermática diminuídas (BENCHAIB et al., 2003), danos ao

desenvolvimento embrionário e consequente fertilidade reduzida (HALLAP, 2005). Os

espermatozoides afetados possuem a capacidade de fertilizar oócitos, porém o consequente

desenvolvimento embrionário depende do grau de alteração do DNA (AHMADI; NG, 1999). Motilidade espermática

A motilidade é um importante fator a ser considerado na análise da qualidade

espermática. Durante o processo de maturação dos espermatozoides no epidídimo ocorre

modificação da membrana plasmática, mitocôndrias, fibras e componentes microtubulares da

peça intermediária, resultando em motilidade progressiva (AMANN et al., 1993). A

motilidade espermática é o parâmetro mais comumente utilizado a fim de analisar o potencial

de fertilidade do sêmen, uma vez que a célula espermática necessita estar móvel para migrar

Page 28: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


ao longo do trato reprodutivo feminino e promover a fertilização do oócito (TALWAR, 2015).

Portanto, a motilidade apresenta correlação significativa (0,34) com a fertilidade, sendo

utilizada em centros de processamento de sêmen como parâmetro limitante para definir a

viabilidade de uma amostra de sêmen (SEVERO, 2009).

A motilidade é classificada de acordo com a porcentagem de células espermáticas

com movimento progressivo e qualidade do movimento, que envolve a velocidade de

movimento linear, distância total e progressão (JANUSKAUSKAS; ZILINSKAS, 2002).

Usualmente, a motilidade espermática é estimada em analisar o sêmen entre lâmina e

lamínula, assim, determinando subjetivamente o percentual de células móveis em uma

amostra com uso da microscopia óptica. Esse método é uma forma indireta de avaliação

simples e de baixo custo, no entanto, demonstra grande variabilidade (VERSTEGEN et al.,

2002). Esta variável, ocorre em função a experiência do avaliador, ocasionando diferenças

nos valores para um mesmo parâmetro. Assim, a avaliação pelo CASA mostra maior

padronização, precisão, confiabilidade e velocidade na obtenção de resultados nas análises

(COX et al., 2006). Esse tipo de análise permite uma avaliação mais exata e objetiva da

motilidade, fornecendo informações precisas e significativas da cinética celular espermática,

determinando não somente a percentagem de células móveis na amostra, mas também

quantifica características específicas do movimento espermático (GARNER, 1997).

Diferenças significativas foram observadas nos parâmetros de motilidade entre os

espermatozoides que resultaram em uma alta taxa de fertilização e àqueles que não

fertilizaram oócitos in vitro (HIRANO et al., 2001). Em bovinos, estudos demonstraram que

ejaculados com maior frequência de espermatozoides, gota citoplasmática proximal e

problemas de motilidade progressiva, não desenvolveram na fertilização in vitro em embriões

além da clivagem (THUNDATHIL et al., 2001a). Nagy et al., (2015) analisando a motilidade

de espermatozoides bovinos através de sistemas automáticos de análise de sêmen (CASA)

detectaram que o parâmetro velocidade de trajeto é algo característico de motilidade do

sêmen, útil e que possui relevância clínica na predição de fertilidade. Assim, o exame e

determinação da motilidade espermática é parte significativa da avaliação da qualidade do


De acordo com Verstegen et al. (2002) os parâmetros gerados da motilidade

espermática pelo CASA são: Total (%), que é a soma de todas as células contadas móveis e

não móveis; Motilidade (%),população de células que estão se movendo com uma velocidade

mínima determinada no “setup”, proporção de células móveis do total; Motilidade

Progressiva (%),porcentagem de células movendo-se progressivamente; Velocidade de

Page 29: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Trajeto (VAP, µm/s), velocidade média ininterrupta do trajeto da célula; Velocidade

Progressiva (VSL, µm/s), velocidade média percorrida em linha reta entre os pontos inicial e

final do trajeto; Velocidade Curvilinear (VCL, µm/s), a velocidade média mensurada de ponto

a ponto do trajeto percorrido pela célula; Amplitude do Deslocamento Lateral da Cabeça

(ALH, µm), largura média da oscilação da cabeça conforme a célula se move; Frequência de

Batimentos (BCF, Hz), frequência com que a cabeça do espermatozóide move-se para trás e

para frente durante um trajeto percorrido; Retilinearidade (STR, %), valor médio da

proporção entre VSL/VAP; Linearidade (LIN, %), valor médio da proporção entre VSL/VCL;

e Velocidade Rápida (%). No entanto, estes parâmetros podem não ser suficientes para uma

avaliação completa do potencial da fertilidade.

O desenvolvimento das tecnologias ômicas tem fornecido novas ferramentas de

detecção molecular que permitem que vários parâmetros estejam efetivamente integrados na

avaliação do potencial fertilizante do sêmen. Por meio da abordagem proteômica, Zhao et al.

(2006) identificaram várias proteínas expressas diferencialmente em amostras de

espermatozoides de baixa motilidade, em comparação com amostras de espermatozoides que

apresentavam motilidade normal. Bissonnette et al. (2009) demonstram que alguns transcritos

previamente identificados em associação com a fertilidade também estão associados com

motilidade in vitro de espermatozoides bovinos. Hering et al. (2014) identificaram genes

associados à baixa motilidade espermática de touros, dentre eles o gene da proteína associada

ao canal catiônico 1 do espermatozoide (CATSPER1) que contribui para a patogênese da

astenozoospermia. Tais informações, podem contribuir para elucidar mecanismos moleculares

subjacentes à motilidade espermática.

2.1.3 Transcriptômica

Os estudos transcriptômicos analisam a transcrição de genes a partir RNAm. Antes

da formação de proteínas/enzimas, a transcrição dos genes é o primeiro passo para a

expressão da atividade dos genes (WANG et al., 2009). A transcriptômica tem como objetivo

realizar o estudo de todos os conjuntos de moléculas de RNA (RNAm, RNAr, RNAt e RNA

não-codificante) em uma única célula ou organismo. Como a transcriptômica reflete os genes

que estão ativos expressos em qualquer momento da célula, também é referida como perfil de

expressão. A principal técnica usada para abordar essa abordagem “omica” é o microarranjo

de RNA e o DNA (BLOW, 2009c).

Page 30: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Estudos transcriptômicos frequentemente demonstram a abundância de RNAms e de

suas proteínas correspondentes e se as mesmas estão bem correlacionadas. O destino de um

RNAm é rigidamente regulado por uma interação complexa de modificação, processamento,

armazenamento, decaimento e tradução, todos envolvendo interações proteína-RNA através

de complexos de ribonucleoproteína mensageiro (RNPm). Alguns desses complexos

montados são conduzidos diretamente para a tradução, enquanto outros são desviados para a

repressão de armazenamento e translacional (MUELLER-MCNICOLL; NEUGEBAUER,


A transcriptômica é amplamente utilizada em estudos com animais de produção.

Diferenças transcriptômicas em embriões derivados de touros de diferente status de fertilidade

no estágio de pré-implantação do desenvolvimento, demonstrando que o gameta masculino

contribui não apenas com DNA, mas também com RNA e fatores de sinalização para o oócito

na fertilização (KROPP et al. 2017).

O RNA-seq é a atual tecnologia usada para a análise de alto rendimento dos perfis de

transcriptoma, o que é essencial para entender a base molecular dos fenótipos. Além disso,

tem a capacidade de sequenciar diretamente toda a população de transcritos através da

amplificação de cDNA curto e, em seguida, marcação fluorescente de uma única base de cada

vez gerando dezenas de milhões de leituras curtas, em torno de 30-400 pb de comprimento

(WANG et al. 2009). Este método foi aplicado para mapear o transcriptoma de diversas

espécies e tecidos, incluindo espermatozoides de humanos (SENDLER et al., 2013),

camundongos (FANG et al., 2014), bovinos (CARD et al., 2013; SELVARAJU et al., 2017) e

cavalo (DAS et al., 2013). Embora essas células sejam consideradas transcricionalmente e

translacionalmente inativas, as quais contêm uma ampla população de moléculas de RNA

codificadoras e não-codificadoras (JODAR et al. 2013), com funções que têm sido

relacionadas à espermatogênese (OSTERMEIER et al., 2002), reorganização da cromatina

espermática (HAMATANI, 2012), potencial de fertilidade (JODAR et al., 2015),

desenvolvimento embrionário precoce (SENDLER et al., 2013) e herança epigenética

transgeracional (RANDO, 2016). Assim, o estudo do transcriptoma do espermatozoide é

fundamental para entender sua biologia e seu papel na fertilidade. Contudo, um dos principais

desafios para o estudo do transcriptoma dos espermatozoides é o baixo rendimento de RNA e

a alta fragmentação dos transcritos tipicamente presente nestas células, visto que a química

padrão de RNA-seq normalmente requer uma grande quantidade (1 mg) de RNA de boa


Page 31: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


A técnica de RNA-Seq tem a capacidade de detectar polimorfismos de nucleotídeo

único (SNPs), bem como os limites de exon-exon para todas as transcrições expressas na

amostra (COSTA et al., 2010). Na reprodução de mamíferos, o RNA-Seq tem sido usado

recentemente para revelar a função e importância dos transcritos em vários estágios

reprodutivos com foco principal na aquisição da função reprodutiva em adultos e na qualidade

do embrião, demonstrando a importância desta técnica para reprodução de um modo geral.

Em bovinos, a análise de RNA-Seq do sêmen sequenciou o transcriptoma do espermatozoide

bovino, consistindo de 6.166 transcritos, incluindo várias transcrições previamente

identificadas e novas para posteriores estudos funcionais (SELVARAJU et al., 2017). O

sequenciamento direto é uma vantagem sobre a sequência curta de sondas de cDNA usadas

para chips de microarray que não cobrem transcritos inteiros potencialmente resultando em

deturpação de transcritos truncados e isoformas transcritas. Huang et al. (2012) utilizaram o

RNA-seq para caracterizar e comparar os padrões de splicing alternativo em blastocistos em

desenvolvimento ou em degeração usando embriões de bovinos fertilizados in vitro,

detectando novos genes que podem desempenhar importantes papéis no início do

desenvolvimento embrionário, demonstrando claramente o poder de RNA-seq e forneceu

novos conhecimentos sobre desenvolvimento embrionário inicial de bovinos, fornecendo uma

compreensão sistemática adicional desenvolvimento embrionário de mamíferos em grande


Em vacas leiteiras a análise da expressão gênica foi realizada pelo sequenciamento

de RNA da Illumina® e obtiveram um total de 16.892 genes expressos no período de

transição, 19.094 genes foram expressos no pico de lactação e 18.070 genes foram expressos

no final da lactação. Independentemente do estágio de lactação, aproximadamente 9.000

genes mostraram expressão em todos os períodos. A maioria dos genes na via do metabolismo

da gordura apresentou alta expressão no leite no período de transição e no pico de lactação.

Este foi o primeiro estudo a descrever o transcriptoma de forma abrangente do leite bovino

em vacas Holandesas (WICKRAMASINGHE et al., 2011).

Estudo analisando perfis de expressão de genes em amostras de tecido adiposo

subcutâneo em diferentes idades e sexos, identificou um total de 12.233 genes expressos, que

foram detectados pelo método RNA-Seq para mostrar os genes diferencialmente expressos

fornecendo uma nova compreensão do tecido adiposo a um nível molecular (ZHOU et al.,


A tecnologia RNA-seq foi também empregada em estudo para detectar a genes

diferencialmente expresos em glóbulo de gordura do leite com 10 dias e 70 dias após o parto

Page 32: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


entre dois grupos de vacas com produção alta e baixa de leite após 305 dias, análise do

rendimento de gordura e rendimento de proteína do leite. No total, 1232, 81, 429 e 178 estes

resultados demonstraram alguns genes considerados promissores para características de

produção de leite em bovinos leiteiros (YANG et al., 2016).

2.1.4 Proteômica

O próximo passo após a transcrição de genes em RNAm é a tradução do RNAm

resultante em proteínas. Este processo pode ser influenciado por fatores como o RNAmi.

Nesta etapa, proteínas altamente abundantes podem ser produzidas, bem como proteínas de

baixa abundância que possuem uma ampla gama de funções em toda a fisiologia do animal de

produção. Assim, a proteômica é considerada uma das mais conhecidas abordagem “ômica”

(CRAVATT et al., 2007). A proteômica, consiste na identificação, quantificação e no estudo

das modificações pós-traducionais do proteoma, ou seja, o conjunto de proteínas expressas em

um genoma ou tecido; e no estudo das interações proteicas e mecanismos regulatórios


Assim, a proteômica baseia-se em princípios bioquímicos, biofísicos e de

bioinformática para quantificar e identificar as proteínas expressas, pois se modificam de

acordo com o desenvolvimento de um organismo bem como em resposta aos fatores

ambientais (ANDERSON; ANDERSON, 1996; WILKINS et al., 1996). A proteômica surgiu

na década de 1970 quando pesquisadores começaram a criar as bases de dados de proteínas

utilizando a técnica de eletroforese bidimensional em gel de poliacrilamida (O’FARREL,

1975). A pesquisa proteômica permite identificar e caracterizar marcadores biológicos, ou

seja, moléculas endógenas ou exógenas específicas de um determinado estado patológico.

Assim, a capacidade de identificação dessas moléculas é útil no diagnóstico precoce de

doenças e no acompanhamento da evolução do tratamento (CASH, 2002).

No que concerne à reprodução animal, essa técnica tem sido empregada

principalmente para a detecção de marcadores bioquímicos da fertilidade, como também da

congelabilidade do sêmen. A análise proteômica dos espermatozoides proporciona maior

entendimento das interações proteicas do plasma seminal com estas células. Portanto, a

proteômica do sêmen é imprescindível para identificação de propriedades e funções das

proteínas envolvidas nos mecanismos de regulação das funções do trato reprodutivo

masculino (STRZEZK et al., 2005).

Page 33: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


A abordagem proteômica clássica é baseada especialmente, na separação das

proteínas por eletroforese em gel bidimensional (2D), que separa as proteínas por dois

parâmetros independentes: na primeira dimensão pelo ponto isoelétrico e na segunda

dimensão pela massa molecular. A eletroforese bidimensional é um método fundamental, pois

possibilita a visualização de um grande número de proteínas simultaneamente e suas distintas

isoformas (HAYNES et al., 2000; LOW et al., 2002). No entanto, o método mais utilizado

para identificação das proteínas é a espectrometria de massas que consiste na mensuração do

peso molecular de átomos e moléculas. Primeiramente, as proteínas de interesse são

recortadas do gel, fragmentadas (obtenção dos peptídeos), geralmente por digestão tríptica, e

os fragmentos são analisados no espectrômetro de massa que, por sua vez, determina a massa

da molécula mesurando a razão massa/carga do íon da molécula (SIUZDAK, 2006).

2.1.5 Metabolômica

Os componentes do proteoma (proteínas/enzimas) são envolvidos no metabolismo do

animal. Além de analisar as enzimas utilizando a tecnologia proteômica, a pesquisa também

podese concentrar nos metabólitos produzidos pelas enzimas de interesse. Metabólitos são

produtos intermediários ou finais do metabolismo em uma amostra biológica. O conjunto de

todos os metabólitos de baixa massa molecular (até 1500 Da), presentes ou alterados em um

sistema biológico, é chamado de metaboloma (do inglês, metabolome) (WITTENBURG et

al., 2013). Existem muitas categorias diferentes de metabólitos que podem ser estudadas,

incluindo lípidos, metabólitos solúveis em água e metabólitos voláteis. Essas diferentes

categorias de metabólitos requerem a sua própria abordagem analítica para detecção (WANG

et al., 2009).

O desenvolvimento da metabolômica tem como principal objetivo avaliar as

mudanças do maior número possível de diferentes metabólitos de pequenas moléculas em

uma célula, tecido, órgão ou organismo. Assim, diferentemente da transcriptômica e

proteômica, o perfil metabolômico pode dar um panorama da fisiologia da célula e tem sido

amplamente utilizado (CARROLL et al., 2010; ZHAO et al., 2014). A metabolômica é um

método promissor para identificar possíveis biomarcadores de fertilidade e infertilidade

masculina (DEEPINDER et al., 2007; KOVAC et al., 2013). A presença, ausência e/ou

alterações de metabólitos específicos podem estar relacionadas à fisiologia dos

espermatozoides, e tais informações podem permitir um diagnóstico precoce associado a um

Page 34: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


melhor tratamento da infertilidade (AITKEN, 2010). No estudo de Bender et al., 2010,

análises do perfil metabolômico de fluidos foliculares de vacas e novilhas em lactação, por

cromatografia gasosa associada à espectrometria de massa (CG-EM), identificaram níveis

mais elevados de ácidos graxos saturados no fluido de vacas em comparação ao fluido das

novilhas. Os autores desse estudo sugerem que elevados níveis de ácidos graxos no fluido

folicular podem ter efeitos negativos sobre a fertilidade de vacas (BENDER et al., 2010).

Velho et al. (2018) determinaram o perfil metabólico do plasma seminal de touros de

alta e baixa fertilidade e identificaram potenciais biomarcadores de fertilidade. Além disso,

foi utilizado ferramentas de bioinformática para revelar as redes e reações nas quais os

metabólitos do plasma seminal do touro podem estar envolvidos. Neste estudo foi

demonstrado que frutose, ácido cítrico, ácido lático, uréia e ácido fosfórico são os metabólitos

predominantes no plasma seminal de touros, ralatando uma clara separação dos perfis

metabólicos entre os touros de alta e baixa fertilidade, sendo a frutose e o ácido 2-

oxoglutárico potenciais candidatos a biomarcadores de fertilidade de touros. Os resultados do

deste estudo ajudarão a avançar nosso entendimento atual dos processos multifatoriais e

complexos relacionadas com a fisiologia da fertilidade em machos.

Page 35: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Conforme descrito na revisão de literatura, vários estudos têm demonstrado os

avanços das tecnologias “ômicas” na reprodução, bem como a importância de apronfundar os

conhecimentos relacionados a expressão de genes ligados a fertilidade de bovinos. Diante

disto, levantou-se os seguintes questionamentos:

1. Será que o padrão de metilação do DNA espermático pode ser um parâmetro importante

para a análise da fertilidade do sêmen de reprodutores?

2. Será que vacas leiteiras holandesas durantre o período da lactação apresentam alterações

na expressão gênica e consequentemente nas vias metabólicas?

Page 36: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



O uso das tecnologias ômicas proporcionam o entendimento do funcionamento

celular dos organismos e suas alterações biológicas. Estas tecnologias tornaram-se de uso

corrente em estudo com animais de produção para melhor entender a fisiologia do animal e a

qualidade dos produtos produzidos. Objetivando descobrir potenciais biomarcadores,

inúmeros estudos têm sido realizados empregando as abordagens “ômicas”, incluindo

proteômica, metabolômica e lipidômica. Sabe-se que um biomarcador ou marcador biológico

é uma característica quantificável e/ou mensurável, que pode representar um fenótipo

funcional ou uma determinada patologia em um organismo vivo. Esses biomarcadores se

estabelecem de acordo com as mudanças nos níveis de genes, microRNAs, proteínas,

metabólitos ou outras moléculas que possam influenciar um determinado processo biológico.

Um aspecto importante de se fazer tais estudos “ômicos” é o entendimento da variação. Por

exemplo, em relação à paridade, lactação, estado alimentar e saúde animal, a variação pode

ocorrer em transcritos, proteínas ou metabólitos encontrados em animais de produção e nos

produtos produzidos. Essa variação pode ajudar a entender melhor a fisiologia do animal


As tecnologias ômicas fornecem informações sobre os benefícios da combinação de

conjunto de dados coletados em diferentes períodos. Isso pode ser ainda mais estendido para

maiores perspectivas, como compreender que os genes não funcionam isoladamente, mas sim

em conjuntos de genes que codificam, através de conjuntos de transcritos, conjuntos de

proteínas que estão envolvidas em processos metabólicos específicos. Uma vez que o genoma

de um animal é sequenciado e anotado, esta informação pode ser utilizada para construir vias

metabólicas, que descrevem o quadro integrado de como diferentes processos em uma espécie

funcionam juntos. Além disso, a construção de visões gerais das vias metabólicas é um

primeiro passo necessário para a pesquisa visando uma melhor compreensão do metabolismo

de um animal. Esta construção de vias metabólicas pode ser feita usando conhecimento de

reações enzimáticas conhecidas e caminhos para os quais os genes podem ser ligados. Como

exemplo, as redes de genes envolvidos na síntese de lipídeos (BIONAZ; LOOR 2008) e

proteínas (BIONAZ; LOOR 2011) de vacas leiteiras.

Portanto, estudar animais de produção em diversos períodos usando simultaneamente

tecnologias “ômicas” pode ser muito útil para entender melhor a fisiologia subjacente, bem

Page 37: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


como as modificações que ocorrem. Uma vez identificadas tais vias metabólicas, novas linhas

de pesquisas serão propostas no sentido de melhor compreender seus mecanismos de ação. As

funções de alguns genes ainda são desconhecidos e, portanto, ainda precisam ser melhor

elucidados, especialmente aqueles associados à lactação de vacas de alto rendimento. Desta

forma, uma melhor compreensão desses mecanismos auxiliará a entender e identificar mais

precocemente animais com problemas metabólicos, aumentando dessa forma a eficiência na

seleção de animais de alta produção.

Page 38: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



1) O enriquecimento de sequências metil-CpG altera o padrão de metilação do DNA

e estão associadas à motilidade dos espermatozoides.

2) A variação de metilação pode afetar os genes envolvidos na organização da

cromatina espermática.

3) Durante o período da lactação em vacas ocorre mudança na expressão de genes.

4) Com o uso das tecnologias ômicas é possível identificar os genes diferencialmente

expressos e revelar variações de sequência nas regiões transcritas.

Page 39: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará




Elaborar um perfil de metilação em todo o genoma nas duas populações de

espermatozoides e identificar assinaturas epigenéticas diferenciais entre espermatozóides

de alta (HM) e baixa motilidade (LM).

Identificar o padrão de expressão de genes do tecido adiposo subcutâneo de vacas no

parto e com 30 e 90 dias pós-parto.


Avaliar a metilação de dinucleotídeos citosina-guanina (CpGs) em populações de

espermatozoides de Bos taurus de alta (HM) e baixa mobilidade (LM) separadas por

gradiente de Percoll.

Identificar os padrões de metilação em espermatozoides HM e LM investigados por

sequenciamento de bissulfito.

Comparar o perfil de expressão gênica no tecido adiposo subcutâneo de vacas leiteiras no

dia do parto (D2), 30 dias e 90 dias pós-parto utilizando o método RNAseq.

Page 40: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Epigenetic variation in pericentromeric regions between high and low motile sperm

populations in Bos taurus

(Variação epigenética em regiões pericentroméricas entre populações de espermatozoides

de alta e baixa motilidade em Bos taurus)

Artigo aceito para publicação no periódico Scientific Reports

(Qualis A1 – Biotecnologia)

Page 41: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Epigenetic variation in pericentromeric regions between high and low motile sperm

populations in Bos taurus.

Capra E.1, Lazzari B. 1-2, Turri F.1, Cremonesi P.1, Portela AMLR.3, Ajmone-Marsan P.4,5

Stella A. 1-2, Pizzi F. 1Istituto di Biologia e Biotecnologia Agraria, Consiglio Nazionale delle Ricerche, Lodi, Italy. 2Parco Tecnologico Padano, Lodi, Italy. 3Department of Animal Science, Federal University of Ceará, Fortaleza, Brazil 4Istituto di Zootecnica, Università Cattolica del Sacro Cuore, Piacenza, Italy 5Centro di Ricerca Nutrigenomica e Proteomica – PRONUTRIGEN, Università Cattolica del Sacro Cuore, Piacenza, Italy Corresponding Author: aIstituto di Biologia e Biotecnologia Agraria, Consiglio Nazionale delle Ricerche, via Einstein, 26900 Lodi, Italy Tel.: +39 0371 4662505; fax: +39 0371 4662501. E-mail address: [email protected] (F. Pizzi). Email addresses: EC: [email protected] BL: [email protected] FT: [email protected] PC: [email protected] AMLRP: [email protected] PAM: [email protected] AS: [email protected] FP: [email protected]

Abstract: Sperm epigenetics is an emerging area of study supported by observations

reporting that abnormal sperm DNA methylation patterns are associated with infertility. Here,

we explore cytosine-guanine dinucleotides (CpGs) methylation in high (HM) and low motile

(LM) Bos taurus sperm populations separated by Percoll gradient. HM and LM methylation

patterns were investigated by bisulfite sequencing. The average level of methylated cytosine

was about 94%. Comparison between HM and LM sperm populations revealed that

methylation variation affects genes involved in chromatin organization. CpG Islands (CGIs),

were highly remodelled. A high proportion of CGIs was found to be methylated at low-

intermediated level (20-60%) and associated to the repetitive element BTSAT4 satellite. The

low-intermediate level of methylation in BTSAT4 was stably maintained in pericentromeric

regions of chromosomes. BTSAT4 was hypomethylated in HM sperm populations. The

characterization of the epigenome in HM and LM Bos taurus sperm populations provides a

Page 42: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


first step towards the understanding of the effect of methylation on sperm fertility.

Methylation variation observed in HM and LM populations in genes associated to DNA

structure remodelling as well as in a repetitive element in pericentromeric regions suggests

that maintenance of chromosome structure through epigenetic regulation is probably crucial

for correct sperm functionality.

Keywords: sperm, motility, methylation, epigenetic, satellite


Male infertility is a complex disorder affecting humans as well as other animals.

Infertility is partially explained by physiological and biochemical factors, such as low sperm

counts and poor sperm quality. The genetic basis of male infertility accounts for about 15% of

infertile cases [1, 2]. The etiology of this disorder remains unclear both in human and other

species. For example, bulls considered of high-merit based on different sperm traits such as

spermatozoa motility and morphology, are sometimes unable to produce successful full-term

pregnancies [3, 4]. Different molecular parameters related to sperm nuclear and mitochondrial

DNA, plasma membrane and lipid composition affect the ability of spermatozoa to fertilize

oocytes and contribute to normal embryo development [5-7]. Therefore, much remains to be

understood and novel molecular approaches may help to unravel the molecular basis of


Among the known epigenetic processes in mammalian cells, DNA methylation has

been identified as an important regulatory mechanism of genome function in normal

embryonic development, X-chromosome inactivation and genomic imprinting [8, 9]. DNA

methylation of the 5-carbon position in cytosine residues was reported to be predominantly

present at cytosine-guanine dinucleotides (CpG) and especially in GC rich regions called CpG

islands (CGIs) [10]. CGIs methylation in different genomic features impacts gene expression

i.e. promoter hypomethylation is associated with gene expression, while methylation in gene

bodies influences splicing [11]. Methylation is also observed in Repetitive Elements (RE) of

adult cells playing a role in the maintenance of chromosome structure and genome integrity


Sperm epigenetic marks are unique, thus the factors that determine the patterns of

DNA methylation differ between male germ cells and somatic cells. Although RE are highly

methylated in both germ and somatic cells, elements from several subfamilies show different

Page 43: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


levels of methylation in the two cell types [13]. Centromeric regions in spermatogonia are

known to be less methylated compared to somatic tissues [14]. This methylation pattern is

supposed to play a role in germ-cell chromatin organization, rather than in the control of gene

expression [15]. Most of the epigenetic signatures in germ cells are erased after conception

from the morula stage to the blastocyst stage in the inner cell mass (ICM), then a sharp

increase in the level of methylation in embryo is observed following implantation [16, 17].

However, a proper regulation of epigenetic processes during spermatogenesis is necessary to

ensure embryonic development in addition to sperm function. It has been reported that the

level of DNA methylation of round spermatid is different from that of mature spermatozoa.

Round spermatid rather than mature spermatozoa microinsemination was also observed to

profoundly influence epigenetic marks in the embryo, thus affecting embryonic development

and male fertility [18].

Aberrant locus specific or global methylation has been associated to abnormal semen

parameters, as well as male infertility. A study reported that oligospermic patients presented a

hypomethylation or unmethylation pattern at the H19/ gene encoding insulin-like growth

factor 2 (IGF2) imprinting control region 1 (ICR1) and hypermethylation at the Mesoderm-

specific transcript (MEST) imprinted locus as well as a reduced sperm quality, as compared

with normozoospermic men [19]. Broad DNA hypermethylation across many loci, including

also the Satellite 2 repetitive element, was associated to poor sperm concentration and

motility and to morphology alterations in abnormal human sperm [20]. The level of DNA

methylation in human sperm, determined by an ELISA-like method, was correlated to

conventional sperm parameters, e.g. concentration and motility, as well as sperm chromatin

and DNA integrity, but not to sperm viability and morphology [21]. DNA methylation in

human spermatozoa was higher in low quality spermatozoa [22]. Pyrosequencing analysis of

human long interspersed elements (LINE) after bisulfite conversion estimated an overall

global methylation of about 75% that increase with age. At the same time, targeted bisulfite

sequencing of different selected genes showed a lower methylation level with a strong trend

toward age associated hypomethylation in some genomic regions [23]. Targeted bisulfite

sequencing, also revealed different levels of methylation in the promoter regions between

high and low motile human sperm [24].

In farm animals, several studies showed altered sperm methylation to be associated

with male infertility. A different DNA methylation pattern was observed between

spermatozoa from high-fertile and sub-fertile buffalo bulls [25]. Recently, assessment of the

epigenetic signature of bull spermatozoa using a human DNA methylation microarray [26]

Page 44: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


and Methyl-Binding Domain (MBD) Sequencing [27] revealed differentially methylated CpG

sites and regions associated to bull fertility rate.

In the present study, the 5-methyl cytosine variations in CpGs was evaluated in high

and low motility bull sperm populations following methyl enrichment and bisulfite

sequencing approach. The objective is to produce a genome-wide methylation profile in the

two populations, and to identify differential epigenetic signatures between high (HM) and low

motile (LM) sperm.


Isolation of spermatozoa and evaluation of sperm characteristics

Sperm cells were successfully fractionated in HM and LM populations; a significant

(P<0.05) improvement of several sperm quality parameters was observed in HM population in

comparison to semen at thawing considering the following parameters: straight-line velocity

VSL, curvilinear velocity VCL, average path velocity VAP and amplitude of lateral head

displacement ALH variables [VSL (μm/s): 46.08±4.11, 61.24±2.91; VCL (μm/s): 76.35±6.02,

110.37±4.25; VAP (μm/s): 55.38±4.27, 74.02±3.01; ALH 2.53±0.14,3.72±0.10; respectively

in semen at thawing and HM population] (Supplementary Info 1).

Sequencing statistic and CpG methylation distribution

The average number of reads per sample was 28.1M (ranging from 13.2M to 37.5M).

Mapping efficiency was high for all samples (range between 83.1% - 90.6%). After

calculating cytosine methylation conversion, a high percentage (93.7%) of the cytosines in the

CpG enriched regions was methylated in both sperm populations (see Supplementary Info 2

for statistics). After applying a threshold of at least 5X coverage per cytosine, a total of 26.6M

methylated regions (MR) (100 bp tiles with sliding window size of 100 bp) were identified

spanning across the whole bovine genome. Among these, 1,086,748 methylated regions

(MRs), observed at least in three samples in both HM and LM sperm population, were

selected to compare the DNA cytosine methylation profile.

Among these, a total of 423,673 MRs mapped in 14,071 out of 23,970 annotated

genes. Furthermore 12,744 MRs mapped upstream (-2Kb) and 19,475 MRs downstream

(+2Kb) of gene regions. A total of 9,397 MRs were located within the 23,431 annotated CpG

Page 45: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


islands (CGIs) Supplementary Dataset 1, 2, 3, 4). Gene bodies, 5’ and 3’ UTRs were

prevalently hyper-methylated in both sperm populations. Intriguingly, probes overlapping

CGIs showed a peculiar distribution, with a relevant proportion of cytosines having an

intermediate level of methylation (between 30 and 60%) (Figure 1).

Differentially Methylated Regions between HM and LM sperm populations

A genome-wide analysis that included genes and regulatory elements revealed that a

small percentage of CpGs showed a significant variation in the methylation level

(differentially methylated regions (DMRs)/MRs percentage) between HM and LM sperm

populations in gene bodies (1.45%), 5′ untranslated regions (5’UTRs) (3.12%) and 3’UTRs

regions (2.72%). Considering CGIs, a higher proportion of the methylome (9.77%) was

remodelled in HM vs LM sperm populations (Supplementary Info 3). Hierarchical analysis of

the 20 most hyper and hypo methylated DMRs found in CGIs, in gene bodies, 5’UTR and

3’UTR well discriminated HM from LM samples (Figure 2). A base resolution vision of some

of the differentially methylated regions in HM and LM sperm populations overlapping gene

bodies, 5’UTR, 3’UTR and CGIs is shown in Supplementary Info 4. Annotation of 6,131

DMRs that overlapped gene bodies resulted in 3,278 differentially methylated genes (DMGs)

(Supplementary Dataset 5). In addition, 398, 538 and 918 DMRs located near 5'UTR, 3'UTRs

and CGIs, were close (± 2Kb) to 355, 484 and 297 DMGs, respectively (Supplementary

Dataset 6, 7, 8). Gene ontology (GO) analysis was performed on genes found to be

differentially methylated in 5'UTR, 3'UTRs and CGIs, and on a selection of 423 genes

differentially methylated in gene bodies (468 DMRs with false discovery rate (FDR) <10exp-

10) (Supplementary Dataset 9). Variation in CpG methylation in different gene features and

CGIs affected GO terms related to DNA replication, repair, organization and maintenance. In

addition, GO terms related to hindbrain function, epithelia and endothelia migration metabolic

processes were also observed to differ between HM and LM sperm population. Unexpectedly,

3’UTR showed the highest number of significant gene ontology terms, whereas only few

terms were affected by CpG variation in 5’UTR (Table1).

Methylation distribution in CpG Islands

To further explore bovine sperm CpG methylation in CGIs, the global level of

cytosine methylation was calculated in each CGI. Out of 23,431 CGIs annotated in the bovine

Page 46: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


genome, 3,869 were detected (at least 3 out of 4 samples for HM and LM) in our dataset.

Based on CpG methylation level in CGIs (Figure 1), profiles were grouped in two classes (20-

60% and 80-100%), and distribution of CGIs length was calculated in each class in HM and

LM sperm populations (Figure 3). Although CGIs length decrease exponentially, low-

intermediate methylated CGIs showed a peak at about 1.4 Kb (Figure 3A). In addition, larger

CGIs (10-240 Kb) were prevalently methylated at 20-60% (Figure 3B). These results were

consistent with the observation of genomic repetitive element motifs methylated at low-

intermediate levels.

Methylation distribution in BTSAT4

Analysis of CGIs size distribution in low-intermediated methylated regions

suggested that the atypical methylation profile observed is likely associated to repetitive DNA


To further test this hypothesis, low-intermediate and highly methylated sequences

were used as a query to the Database of repetitive rDNA element Repbase. Database

interrogation returned BTSAT4 for about 75% of intermediate methylated sequences, whereas

the percentage of BTSAT4 in hypermethylated region was close to zero. BTSAT3, OSSAT2,

BTLTR1 and ERV2-1-LTR were also methylated prevalently at intermediate level (20-60%)

(Table 2). Out of 2,434 BTSAT4 elements annotated in the bovine genome, 720 were detected

(at least 3 out of 4 samples for HM and LM) in our dataset. Analysis of CpG methylation

outlined an overall low level of BTSAT4 methylation in the HM sperm population.

Considering 159 DMRs in the BTSAT4 regions, 122 were more methylated in LM sperm

populations (Supplementary Dataset 10) (Figure 4).


In this work the pattern of methylation in high and low motile bull sperm populations

was determined using an enrichment step of methyl-CpG sequences combined with bisulfite


Our data reveal an overall higher level of CpG methylation (about 94%) of bull

sperm, similar in HM and LM sperm populations that may be explained by the technical

approach here used to enrich samples for methylated sequences before bisulphite treatment

and sequencing. The distribution of CpG methylation observed across the genome was in fact

Page 47: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


different from those previously described in mouse sperm following Reduced Representation

Bisulfite Sequencing RRBS [28]. RRBS method reduces the representation of repeats in the

data set [29] whereas methyl-Seq enrich for CpG methylated repeat. Accordingly, the

methylation level of CGIs observed in our study was higher than previously reported [28],

and highlight a portion of CpG rich regions methylated at low-intermediate level.

The comparison of different genomic features in HM and LM sperm populations

revealed several differentially methylated regions flanking genes with a role in chromatin

organization and maintenance. In particular, differential methylation in 3’UTR was found in

genes (histone lysine methyltransferases 2A (KMT2A), histone lysine demethylases 2A

(KDM2A) and nuclear receptor-binding SET Domain 2 (NSD2)/ multiple myeloma SET

domain (MMSET)/ Wolf-Hirschhorn syndrome candidate-1(WHSC1)) influencing chromatin

structure by epigenetic mechanisms, such as the regulation of histone H3-K4 methylation.

Previous studies reported a strict association between sperm DNA methylation levels and both

sperm chromatin condensation and DNA integrity, suggesting that the formation of a compact

chromatin and proper DNA methylation are closely related events during spermatogenesis


The NSD family of histone methyltransferase (HMT) comprises three members

(NSD1, NSD2/ MMSET/ WHSC1, and NSD3/WHSC1L) that recognise lysine residue of

histones H3 and H4 and mediate their methylation [30]. KMT2A (also known as mixed-

lineage leukemia 1 (MLL1)) catalyzes the methylation of H3K4 [31, 32]. KDM2A, a

Jumonji-C (JmjC)-domain containing histone demethylase (HDM), is a heterochromatin-

associated protein that is required to maintain the heterochromatic state, it represses

transcription of small non-coding RNAs that are encoded by clusters of satellite repeats at the

centromere [33].

Histone Lysine methylation is tightly regulated by distinct families of conserved

enzymes, KMTs and KDMs, which add and remove methyl groups at histone lysine [34].

They play a role in orchestrating methylation of H3K9 and H3K27 in sperm. The methylation

increases during meiosis, but the removal of H3K9me at the end of meiosis is essential for the

onset of spermiogenesis [35]. In mice, the reduction of MLL2 activity results in a dramatic

decrease of the number of spermatocytes by an apoptotic process and prevents spermatogenic

differentiation [36]. Lysine-specific histone demethylase 1 (LSD1)/KDM1 is required for

spermatogonial differentiation, as well as germ cell survival, in the developing testis [37]. An

evolutionarily conserved pathway between histone H3-K9 methylation and DNA methylation

exists in mammals, that is likely to be important to reinforce heterochromatic subdomains

Page 48: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


stability and to protect genome integrity. Suppressor of variegation 3-9 homolog (Suv39h)

HMTases (also called KMT1A/B) are required to direct H3-K9 trimethylation and DNA

(cytosine-5-)-methyltransferase 3 beta (Dnmt3b)-dependent DNA methylation to major

satellite repeats at pericentric region [38].

A concurring variation in methylation of satellite repeats at pericentromeric region

was observed in our dataset. A group of CGIs methylated at intermediated level (20-60%),

located within genomic satellite repeats and in particular BTSAT4 Bovine satellite I [39] was

observed to be less methylated in HM sperm populations. In the bovine genome BTSAT4 is

likely to be the counterpart of human alpha satellites, because both present in high-copy

tandem repeat at centromeric position. Comparative analysis in hundreds of species found a

high variability in size for alpha satellites centromere repeats, e.g. approximately 171-bp in

human and 1,400-bp in Bovidae [40]. in agreement with the size of repetitive element that we

found to be methylated at intermediated level in bovine sperm. The bovine satellite I was

observed to be located in all pericentromeric regions of Bos taurus autosomes by fluorescence

in situ hybridization [41].

As observed in our study, a lower level of methylation of satellite DNA within

pericentromeric regions was previously observed in primate sperm profiling [13]. Bovine

alpha satellite I was observed to have low-intermediated methylation levels in sperm.

Embryos obtained by somatic cell nuclear transfer (SCNT) presented a hyper-methylation in

the bovine alpha satellite I, expected to cause higher chromatin condensation compared to

embryos generated by in vitro sperm fertilization (IVF). This may in turn contribute, either

immediately, or later in development, to the inefficiency of producing live offspring by SCNT

[42, 43]. Low methylation levels have also been correlated with the ability to bind cohesin

complexes that regulate the separation of chromatids at mytosis [44], suggesting a model in

which selective hypomethylation of centromeric satellites might be critical for accurate

chromosome segregation during meiosis. Recently, methylation at satellite repeats throughout

the genome has been observed to be increased in obese rat offspring [45]. Although obesity in

human is associated with infertility by numerous studies [46], a direct link between satellite

repeats methylation and sperm infertility is not yet described.


Methylation profiling in bovine semen revealed differential methylation of the

BTSAT4 repetitive element in pericentromeric regions between HM and LM sperm

Page 49: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


populations. In addition, many DMRs were enriched in genes often functionally related to

sperm DNA organization and maintenance. Together, alteration of methylation in

pericentromeric regions and in genes associated to lysine histone methylation highlights that

the complex mechanism that regulates DNA condensation during chromosomal packaging in

sperm may affect sperm motility.


Isolation of spermatozoa and evaluation of sperm motility

Frozen semen straws from four mature progeny tested Holstein bulls with

satisfactory semen quality were purchased from an Artificial Insemination AI center

(INSEME S.P.A., Modena, Italy).

High Motile (HM) and Low Motile (LM) sperm populations were isolated through

Percoll gradient as previously described [47]. Total motility and sperm kinetics parameters

were assessed by CASA (Computer-Assisted Semen Analysis) system (ISAS® v1). Five μl of

semen pellet obtained after Percoll density gradient centrifugation were diluted in 5 μl

Tyrode’s albumine lactate pyruvate (TALP) sperm medium [48] pre-warmed at 37°C. Ten μl

of diluted semen was placed on a pre-warmed (37 °C) Makler chamber. During the analysis,

the microscope heating stage was maintained at 37 °C. Using a 10× objective in phase

contrast, the image was relayed, digitized and analyzed by the ISAS® software with user-

defined settings as follows: frames acquired, 25; frame rate, 20Hz; minimum particles area 20

microns2; maximum particles areas 70 microns2. Spermatozoa speed was assigned to 3 broad

categories: rapid (50 μm/s), medium (25 μm/s) and slow (10 μm/s). CASA kinetics

parameters were: total motility (MOT TOT, %), progressive motility (PRG, %), curvilinear

velocity (VCL, µm⁄s), straight-line velocity (VSL, µm⁄s), average path velocity (VAP, µm⁄s),

linearity coefficient (LIN, %, = VSL/VCL x 100), amplitude of lateral head displacement

(ALH, µm), straightness coefficient (STR, % = VSL/VAP x 100), wobble coefficient (WOB,

% = VAP/VCL x 100) and beat cross frequency (BCF, Hz).

DNA extraction, library preparation and sequencing

Four HM and four LM sperm samples extracted in previous step were used for DNA

extraction. DNA was isolated by NucleoSpin® Tissue (Macherey-Nagel) following

manufacturer instruction. One μg of genomic DNA was sonicated to produce DNA fragments

Page 50: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


of about 350 bp lengths. Methyl-binding domain (MBD) enrichment was performed using the

MethylMiner™ Methylated DNA Enrichment Kit (Thermo Fisher Scientific), following

manufacture instruction. Libraries were generated using the TruSeq® DNA PCR-Free Library

Preparation Kit (Illumina) including a step of bisulfite treatment. After adapters ligation,

samples were converted with EpiTectBisulfite Kits (Qiagen) and finally PCR amplified with

KAPA HiFi Uracil+ (Kapa Biosystems) to obtain methyl enriched bisulfite libraries. The

eight libraries were used for cluster generation and subsequently sequenced on a single lane of

Illumina Hiseq2000.

Statistical analysis and bionformatics

Data obtained from CASA were analyzed using the SASTM package v 9.4 (SAS

Institute Inc.). The General Linear Model procedure (PROC GLM) was used to evaluate the

efficiency of the sperm separation comparing semen quality parameters at thawing and in the

HM population. The model included the fixed effect of the sperm population, and bull as

random. Results are given as adjusted least squares means ± standard error means (LSM ±


Preliminary quality control of raw reads was carried out with FastQC

( ). Illumina raw sequences were

then filtered with Trimmomatic [49] to remove adapters and low quality bases at the ends of

sequence, using a sliding window approach. Data are available in the Sequence Reads

Archive (SRA), (Accession Number SRP119411). Bismark software v.0.17.0

( was used to align each readto

a bisulfite-converted Bos taurus genome UMD311 with option -N 1, and methylation calls

were extracted using the Bismark methylation_extractor function. Seqmonk software (version

0.34.1) was used for visualization and analysis of the Bismark output

( Only position with at least 5

cytosine were recorded in all samples, others were discarded from the data set. Methylated

regions (MRs) were detected genome wide by dividing the genome in 100 bp tiles and

analyzing average methylation in a sliding window of 100 bp. MRs were considered if present

at least in 3 out of 4 samples in both HM and LM sperm populations. Methylation was

calculated independently for different features: 5’ UTR (-2Kb), 3’ UTR (+2Kb), gene bodies

and CpG islands (CGIs). MRs were also determined per CGI length classes and overlapping

BTSAT4 REs. Differentially methylated regions (DMRs) between HM and LM populations

Page 51: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


were calculated using the logistic regression filter in R to assess differential methylation

(FDR< 0.05, absolute cut-off of 5%). Hierarchical clustering was produced for DMRs present

in CGIs, gene bodies, 5’ UTRs and 3’ UTRs. The level of methylation was normalized across

samples and methylation percentage from a selection of DMRs showing the highest

differences in methylation was used for clustering using the Genesis software [50].

Genes included in DMRs at CGIs and different genomic features were submitted to

GO analysis. GO classification of the DMRs was performed according to canonical GO

categories, using the Cytoscape plug-in ClueGO which integrates GO [51] and enhances

biological interpretation of large lists of genes. Evaluation of REs in CGIs was performed by

intersecting genomic positions of both features by Bedtools intersect

(, thus frequencies for each RE category were calculated for

low-intermediate methylation CGIs (20-60% methylation) and high methylation CGIs (80-

100% methylation), in both HM and LM sperm populations and in Bos taurus genome.

Availability of data and material

All sequence data are deposited at the NCBI Sequence Read Archive (SRA) ( (Accession Number SRP119411).

REFERENCES



TABLES AND FIGURES


Table 1. GO terms identified for the differentially methylated genes (DMGs) found to differ between high motile (HM) and low motile (LM)

sperm populations in gene bodies (GENE), 5' untranslated regions (5’UTRs), 3' untranslated regions (3’UTRs) and CpG islands (CGIs).

GO-ID GO-Term Associated Genes Found P-Value*


GO:0000723 Telomere maintenance [ERCC4, LRIG1, PRKDC, TEP1, WRN] 1.88E-02

GO:0032200 Telomere organization [ERCC4, LRIG1, PRKDC, TEP1, WRN] 1.92E-02


Calcium, mediated multicellular organism

signaling [ASPH, HDAC4, ITPR1, KSR2, P2RX3, PLCE1] 2.13E-02

GO:0033555 Response to stress [CACNA1B, GRIN2B, P2RX3] 2.46E-02

GO:0043954 cellular component maintenance [ABL2, MTMR2, MTSS1] 2.81E-02

GO:0021575 Hindbrain morphogenesis [ABL2, ATP2B2, DLC1, LDB2] 3.48E-02

GO:0031623 Receptor internalization [CAV3, MTMR2, PICALM] 4.76E-02


GO:0010634 Positive regulation of epithelial cell migration [BCAR1, BCAS3, ENPP2, WNT7A] 3.70E-03

GO:0010595 Positive regulation of endothelial cell migration [BCAR1, BCAS3, WNT7A] 5.16E-03


GO:0035162 Embryonic haemopoiesis [GATA3, KAT6A, KMT2A, PBX1, STK4] 1.31E-04

GO:0006516 Glycoprotein catabolic process [FBXO6, GPC1, NEU4] 4.45E-03

GO:0046470 Phosphatidylcholine metabolic process [LIPC, LPCAT3, PLA2G2E, SLC44A2, SLC44A4] 1.11E-02

GO:0051569 Regulation of histone H3-K4 methylation [AUTS2, GATA3, KMT2A] 2.37E-02

GO:1901616 Organic hydroxy compound catabolic process [IMPA1, LIPC, NUDT3] 2.83E-02

Page 59: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Ethanolamine, containing compound metabolic

process [LIPC, LPCAT3, PLA2G2E, SLC44A2, SLC44A4] 3.05E-02


Double, strand break repair via nonhomologous

end joining [KDM2A, PRPF19, WHSC1] 3.85E-02

GO:0071353 Cellular response tointerleukin-4 [GATA3, MCM2, MCM7] 4.24E-02

GO:0032508 DNA duplex unwinding [FBXO18, MCM2, MCM7, MRPL36] 4.29E-02

GO:0032392 DNA geometric change [FBXO18, MCM2, MCM7, MRPL36] 4.31E-02

GO:0000726 non-recombinational repair [KDM2A, PRPF19, WHSC1] 4.97E-02


GO:0035637 Multicellular organismal signaling


P2RX3] 8.53E-04

GO:0032288 Myelin assembly [GPC1, NFASC, TENM4] 1.30E-03

GO:0006942 regulation of striated muscle contraction [CACNA1C, KCNQ1, PDE5A, TNNT3] 3.22E-03

GO:0019226 transmission of nerve impulse [DMRT3, DPP6, NFASC, P2RX3] 3.62E-03

GO:0032200 Telomere organization [ERCC4, LRIG1, TERT, WRN] 3.80E-03

GO:0000723 Telomere maintenance [ERCC4, LRIG1, TERT, WRN] 5.45E-03

Indicated are gene ontology IDs (GO-ID), gene ontology terms (GO-term), associated genes found and corrected p-values as determined by ClueGO ( * Term P-Value Corrected with Bonferroni step down

Page 60: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Table 2. Frequency of occurrence for Repetitive Elements (REs) overlapping CGIs with different methylation levels (20-60 % methylation and

80-100% methylation) in high motile (HM) and low motile (LM) sperm populations. Frequency of occurrence for REs is also reported for Bos

taurus genome.


CGIs methyl.


CGIs methyl.


CGIs methyl.


CGIs methyl.

80-100% Methyl. ref. genome

RE type % RE type % RE type % RE type % RE type %

BTSAT4 75.3 GC-rich 24 BTSAT4 75.9 GC-rich 23.5 Bov-tA2 8.6

SSU-rRNA 4.5 Bov-tA2 3.8 SSU-rRNA 4.6 Bov-tA2 4.1 ART2A 8.3

BTSAT2 3.8 MIRb 3.4 BTSAT2 3.9 MIRb 3.3 BovB 6.7

GC-rich 3 ART2A 2.6 GC-rich 3.3 C-rich 2.7 BOV-A2 5.1

OSSAT2 1.7 (TG)n 2.6 OSSAT2 1.7 ART2A 2.7 AT-rich 4.9

BTLTR1 1.2 C-rich 2.6 BTLTR1 1.2 (TG)n 2.6 Bov-tA1 3.7

ERV2-1-LTR 0.9 (CA)n 2.2 ERV2-1-LTR 0.9 (CA)n 2.2 MIRb 3.3

5S-rRNA 0.9 Bov-tA1 1.9 BTSAT3 0.8 Bov-tA1 2 MIR 2.5

BTSAT3 0.7 MIR 1.9 5S-rRNA 0.7 CHR-2A 1.8 L2a 2.2

LSU-rRNA 0.6 CHR-2A 1.8 LSU-rRNA 0.5 BovB 1.8 L1-2 2.1

G-rich 0.4 G-rich 1.7 BovB 0.4 MIR 1.7 L1 1.8

(CA)n 0.4 BovB 1.6 G-rich 0.4 BOV-A2 1.7 L2c 1.6

(CGGGG)n 0.4 BOV-A2 1.6 (CGGGG)n 0.4 G-rich 1.6 Bov-tA3 1.6

Bov-tA2 0.3 L2b 1.5 (CA)n 0.4 L2b 1.5 BTLTR1 1.5

BovB 0.3 L1-2 1.5 C-rich 0.3 L1-2 1.5 L2b 1.3

(TG)n 0.3 MIR3 1.4 (TG)n 0.2 CHR-2B 1.4 MIRc 1.2

(CGTG)n 0.3 CHR-2B 1.3 (CCCCAG)n 0.2 MIR3 1.4 MIR3 1.2

Bov-tA3 0.3 MLT1B 1.1 (CGG)n 0.2 MIRc 1.1 L1 1.2

C-rich 0.3 MIRc 1.1 L1-3 0.2 MLT1B 1.1 L1-3 1.1

Page 61: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Page 88: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Dynamic profile of active metabolic pathways in the subcutaneous fat tissue of Holstein

cows during early lactation

(Perfil dinâmico de vias metabólicas ativas no tecido adiposo subcutâneo de vacas holandesas

no início da lactação)

Artigo submetido para publicação no periódico Animal Genetics

(Qualis B1 – Biotecnologia)

Page 89: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Dynamic profile of active metabolic pathways in the subcutaneous fat tissue of Holstein cows during early lactation A. M. L. R. Portela£, S. Chessa*, A. Boccardo¥, D. Pravettoni¥; A. A. Moura£, S. Biffani* and F. Biscarini* *Institute of Agricultural Biology and Biotechnology CNR, Italy. ¥Department of Veterinary Science, University of Milan, Via Celoria, 10 – 16, 20133 Milan, Italy. £Department of Animal Science, Laboratory of Animal Physiology, Federal University of Ceará, Campus do Pici – Bloco 810 – CEP 60.356-000 – Fortaleza – CE, Brazil. Sumary

Metabolic pathways associated to the early lactation in Holstein cows were characterized using

RNA-seq data obtained from subcutaneous fat tissue samples collected at three time points: at 2

(T0), 30 (T1) and 90 (T3) days postpartum. Enrichment analysis identified 142 metabolic

pathways. The most significative were: insulin secretion, oxytocin signaling,

glycolysis/gluconeogenesis, pyruvate metabolism, insulin resistance, calcium signalling, GnRH

(Gonadotropin releasing hormone), MAPK (mitogen-activated protein kinase), adipocytokine

signaling, and the renin−angiotensin system. All these pathways are important metabolic routes

in lactating dairy cattle. Some pathways were common between different time-point comparisons,

while others were unique to specific time-point comparisons.

Keywords Negative energy balance, fat tissue, metabolic pathways, rna-seq, dairy cattle

Eartly lactation is a challenging time for dairy cows, who have to simultaneously cope with milk

production and body maintenance. The rapid increase in energy requirements is only partially

met by feed intake which generally decreases around this period. Consequently, cows enter in a

Page 90: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


state of negative energy balance (NEB) and the only way to counterbalance it is by mobilizing

body reserves, mainly represented by the fat tissue (Contreras et al. 2011; Nayeri & Stothard

2016). Indeed, the fat tissue acts as a caloric reservoir that in conditions of nutritional

overbalance stores surplus nutrients in the form of neutral lipids by stimulating lipogenesis,

whereas in case of nutrient deficit supplies nutrients to other tissues through lipolysis (Birsoy et

al. 2013). NEB is frequently associated with several metabolic disease as fatty liver (Ohtsuka et

al. 2001), ketosis (Sakai et al. 1993), left displacement of the abomasum (Biffani et al. 2014),

cystic ovarian disease (Opsomer et al. 1999), lipid mobilization and laminitis (Hendry et al.

1999). Additionally, NEB may be a relevant mediator of reduced fertility by negatively affecting

the follicular and luteal development and the quality of the oocyte (Wathes et al. 2007). The

complex interplay between fat tissue and NEB still is an unresolved conundrum in the physiology

of lactation, whose deeper understanding can be facilitated by the use of a technology like RNA

sequencing (RNA-seq). RNA-seq experiments provide a comprehensive understanding of the

expression of tissue-specific genes as well as of targeted metabolic pathways (Nayeri & Stothard

2016; Aguet & Ardlie 2016). The aim of this study was to characterize the metabolic pathways

associated to early lactation in Holstein cows using RNA-seq data obtained from subcutaneous

fat tissue samples collected at three time points: at 2 (T0), 30 (T1) and 90 (T3) days postpartum.

Seven healthy multiparous Holstein Friesian cows from a single commercial dairy farm in Lodi,

Italy were used in the present study. All procedures were approved by the Italian Ministry of

Health (approved protocol n° 480/2016-PR). Subcutaneous fat tissue was sampled from the tail of

the cows. RNA was extracted and sequenced, and reads were trimmed for quality (Phred > 15).

Additional details can be found in File S1. The read counts obtained were used to estimate gene

expression and identify differentially expressed (DE) genes. This was achieved using the R

packages edgeR version 3.10.0 (Robinson et al. 2010) and limma version 3.24.5 (Ritchie et al.

Page 91: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


2015). Before performing statistical analysis, read counts were normalized using the trimmed

mean of M-values method implemented in edgeR. Finally, differential expression (DE) analysis

was performed comparing the log-fold differences in gene counts at different time points: calving

(T0), 30 days (T1) and 90 days after calving (T3). All genes with a FDR-adjusted p-value < 0.05

were considered significantly different and were retained for gene functional analysis. The

identified differentially expressed genes (DEG) were thus further analysed by querying biological

databases for related annotated functions and pathways. For each comparison between

timepoints, Ensembl gene IDs were obtained and used to search for corresponding gene

ontologies (GO) and metabolic pathways. Based on genes annotated to metabolic pathways in the

KEGG database (, an enrichment analysis was conducted to detect pathways

significantly associated with the identified genes, using a hypergeometric model (Zhang et al.

2015). We found 113, 324 and 17 genes differentially expressed (FDR < 0.05) in T0 versus T1,

T0 versus T3, and T1 versus T3, respectively (Supplementary Table 1). These genes are involved

in 142 metabolic pathways, which are shown, ordered by significance, in Figure 1. The top 5

pathways for each time comparison are reported in Table 1. These include insulin secretion,

oxytocin signaling, glycolysis/gluconeogenesis, pyruvate metabolism, insulin resistance, calcium

signalling, GnRH (Gonadotropin releasing hormone), MAPK (mitogen-activated protein kinase)

and adipocytokine signaling, and the renin−angiotensin system. All these pathways are important

metabolic routes in lactating dairy cattle. Some pathways are common between different time-

point comparisons (e.g. insulin secretion and resistance at T0 vs both T1 and T3), while others

are unique to specific time-point comparisons (e.g. cell proliferation pathways at T1 vs T3).

Among changes in hormonal regulation which take place early in the lactation, major variation

involves the insulin metabolism. Especially at the end of pregnancy and early lactation, dairy

cows show both a decrease in responsiveness of skeletal muscle and adipose tissue to insulin and

Page 92: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


a low blood insulin concentration. This causes reduction of lipogenic pathways (Sadri et al. 2010)

and the redirection of glucose from peripheral tissues toward the uterus and mammary gland

(Bossaert et al. 2008; Nayeri & Stothard, 2016). The oxytocin signaling pathway differed at T0

vs T1 and T0 vs T3. The oxytocin receptor gene is highly expressed in fat tissue where stimulates

hormone-sensitive lipase and metabolic pathways of fatty acid oxidation (Yi et al. 2015). The

glycolysis/gluconeogenesis pathway was significant in all three time-point comparisons. NEB

causes a large increase of free fatty acids in the bloodstream which are then transferred to the

liver resulting in a low rate of glycolysis (Dębskil et al. 2017). Gluconeogenesis and the pyruvate

metabolism together are key pathways for energy metabolism during the mid-lactation of dairy

cows (Sun et al. 2014). Pyruvate is the initial point of gluconeogenesis and the final product for

glycolysis (Denton & Halestrap 1978). Pyruvate is also an intermediate metabolite for the

production of propionate from the succinic or lactate pathways (Jeyanathan et al. 2014). Calcium

signaling pathways participates in diverse biological processes, including lipid metabolism. In

particular, regulation of cellular calcium ion transport triggers nuclear transcription factors

related to the control of fat storage (Baumbach et al. 2015). The mobilization of calcium from

intracellular stores is influenced by GnRH, which binds to its receptor initiating many

intracellular signaling cascades, including calcium influx (Duran-Pasten & Fiordelisio 2013). The

GnRH signaling pathway was significantly different between T1 vs T3. The rapid elevation of

intracellular calcium induced by GnRH is necessary for the rapid secretion of gonadotropins

(Naor 2009). Therefore, the increase of calcium mobilization is an important event during this

phase of lactation. MAPK-signaling pathway is related to cell proliferation, differentiation,

migration, and apoptosis (Fata et al. 2007). This pathway can be involved in the continued

differentiation of mammary secretory cells which supports high milk secretion at peak lactation.

After peak, the mammary gland undergoes progressive regression through cell death by apoptosis

Page 93: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


(Capuco et al. 2001), and the non-esterified fatty acids utilized by dairy cows during NEB

activate the MAPK pathway (Grethe et al. 2004). Thus, the presence of this pathway in our study

might be related to the metabolic changes that occur during lactation, especially the process of

cellular proliferation. Insulin resistance is significantly different at T0 vs T3 and T0 vs T9.

Excessive lipid mobilization can cause an exaggerated insulin resistance with consequent

increase in plasma non-esterified fatty acids and ketones (Bossaert et. al. 2008). The renin-

angiotensin pathway was significantly different between T1 and T3. The renin-angiotensin

system (RAS) plays a role on the regulation of blood pressure, fluid homeostasis,

vasoconstriction, hormone secretion, cellular growth (Yvan-Charvet & Quignard-Boulange 2011;

Kalupahana & Moustaid-Moussa 2012) and lipid metabolism (Jones et al. 1997; Saint-Marc et al.

2001). The main molecule of RAS is angiotensin II, which is synthetized by the fat tissue and

whose overexpression was found to induce an increase of fat mass and cell size as well as insulin

resistance in mice (Xu et al. 2003). Th1/Th2 cell differentiation is associated to the immune

response. Th1 cells protect the organism from intracellular pathogens providing cell-mediated

immune responses. Th2 cells represent essential mediators of the humoral immune response

thereby protecting organism against extracellular pathogens (Rodriguez-Manzanet et al. 2009). In

conclusion, the present study used RNA-seq to evaluate metabolic pathways associated with how

fat tissue of dairy cows go through the early lactation stage. These pathways are mainly

associated with cellular processes, inflammatory response and energy production, which

contribute to milk synthesis, fetal growth and homeostatic mechanisms. For a detailed

understanding of early-stage physiological changes and metabolic diseases (e.g. displacement of

abomasum, ketosis, NEB) and for validation of results, further studies will be necessary, e.g. with

higher sample size or different breeds. This knowledge could be potentially applied to provide

better farming conditions reducing the negative impact on the health and economics of the herds.

Page 94: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Competing interests

Authors declare they have no competing interests.


This research was financially supported by the Italian national research project “GenHome”, by

the Brazilian Research Councils (CAPES and CNPq) and by the Ceara State Research

Foundation (FUNCAP).

REFERENCES


Page 98: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


File S1

Sampling, sequencing and processing

Seven healthy multiparous Holstein Friesian cows from a single commercial dairy farm in Lodi,

Italy were used in the present study. All procedures were approved by the Italian Ministry of

Health (approved protocol n ° 480/2016-PR). Cows underwent subcutaneous fat tissue biopsy in

T0, T1 and T3 from alternate sites of the tail-head. Briefly, each cow was gently allocated in a

standing hoof-trimming chute, the skin of the tail-head was aseptically prepared, 5 mL of

procaine hydrochloride was subcutaneously injected and a 1-cm stab incision was made. A

Gillies dissecting forceps was passed through the skin to grasp and expose the subcutaneous

adipose tissue flap that was cut with dissecting scissors. The incision was not closed and an

antibiotic solution was sprayed on the site.

After collection, adipose tissue was immediately transported at 4°C and preserved in Qiagen

AllPrep solution (IPA®, QIAGEN, Redwood City) for RNA extraction. Total RNA was extracted

from 80 mg of subcutaneous fat tissue using the Qiazol AllPrep method (Kit Qiagen RNeasy®

Lipid Tissue). RNA integrity was evaluated through the RNA Nano 6000 Assay Kit of the

Bioanalyzer 2100 system (Agilent Technologies, CA, USA) to check the requirements for library

preparation. Sequencing libraries were generated using the IlluminaTruSeq™ RNA Sample

Preparation Kit (Illumina, San Diego, CA, USA), following manufacturer’s instructions.

Messenger RNA (mRNA) was isolated and purified using the Dynabeads mRNA (SPRI AMPure

Beads). mRNA was then fragmented and cDNA synthesized. Then, after adapter ligation (400 to

500-bp fragment size), samples were sequenced on the Illumina Hiseq 2500 platform.

Page 99: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Preliminary quality control of raw reads and trimming (minimum Phred quality score > 15) for

low quality bases was carried out with FastQC and Trimmomatic, respectively. Trimmed reads

were mapped to the Bos taurus reference genome (Bos_taurus-UMD3.1, release 84).

Page 100: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Table 1. Top 5 pathways associated at different time points comparison (at calving (T0), at 30 days post-calving (T1) and at 90 days post-calving (T3).

Description pvalue Exp

Insulin secretion 0,0003 T0T1

Glutathione metabolismo 0,0017 T0T1

Adrenergic signaling in cardiomyocytes 0,0023 T0T1

Arrhythmogenic right ventricular cardiomyopathy (ARVC) 0,0024 T0T1

Gastric acid secretion 0,0030 T0T1

Insulin secretion 0,0000 T0T3

Adrenergic signaling in cardiomyocytes 0,0000 T0T3

Proximal tubule bicarbonate reclamation 0,0003 T0T3

Glucagon signaling pathway 0,0006 T0T3

cGMP-PKG signaling pathway 0,0007 T0T3

Hematopoietic cell lineage 0,0035 T1T3

HTLV-I infection 0,0195 T1T3

Renin-angiotensin system 0,0217 T1T3

Glyoxylate and dicarboxylate metabolism 0,0250 T1T3

Propanoate metabolism 0,0258 T1T3

Page 101: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


Figure 1. Top metabolic pathways (from KEGG) enriched in the genes associated with the lactation period. These pathways were detected from genes identified in subcutaneous adipose tissue.

Page 102: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará


O perfil de metilação no sêmen bovino revelou metilação diferencial do elemento

repetitivo BTSAT4 nas regiões pericentroméricas entre as populações de espermatozoides

HM e LM. Além disso, muitos DMRs foram enriquecidos em genes frequentemente

relacionados funcionalmente com a organização e manutenção do DNA do espermatozoide.

Juntos, alteração de metilação em regiões pericentroméricas e em genes associados à

metilação da histona lisina destaca o complexo mecanismo que regula a condensação do DNA

durante o acondicionamento cromossômico no espermatozóide, podendo afetar a motilidade


O presente estudo utilizou o RNA-seq para avaliar as vias metabólicas associadas ao

modo como o tecido adiposo das vacas leiteiras passa pelo estágio inicial da lactação. Essas

vias estão associadas principalmente aos processos celulares, resposta inflamatória e produção

de energia, que contribuem para a síntese do leite, crescimento fetal e mecanismos

homeostáticos. Para uma compreensão detalhada das alterações fisiológicas da fase inicial e

doenças metabólicas (por exemplo, deslocamento do abomaso, cetose, NEB) e para validação

dos resultados, serão necessários mais estudos, p. com maior tamanho de amostra ou raças

diferentes. Esse conhecimento poderia ser potencialmente aplicado para proporcionar

melhores condições de manejoo, reduzindo o impacto negativo na saúde e economia dos


Page 123: UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS … · mantimento; Todavia eu me alegrarei no Senhor, exultarei no Deus da minha salvação. O Senhor é minha força e me fará



Os resultados obtidos no presente trabalho poderão ser utilizados para o

desenvolvimento de novas tecnologias que podem identificar animais com algum tipo de

anormalidade espermática de alto padrão zootécnico e na identificação de doenças

metabólicas relacionadas ao período da lactação.

A epigenética é um sistema de informação que fica no topo do DNA para controlar

quais genes são acessíveis, ativos e inativos. Assim, a epigenética é importante na fertilidade é

que possivelmente pode fornecer um biomarcador para problemas potenciais com a função

espermática e o desenvolvimento inicial do embrião. A questão mais fundamental em relação

ao transcriptoma, cromatina e metilação do DNA dos espermatozoides é se eles podem

transmitir informações sobre a exposição ambiental do macho à prole. Existem atualmente

muitos casos relatados de herança epigenética via espermatozoides.

Nos últimos anos, espermatozoides “Epigenomes” de diferentes espécies foram

descritos usando sequenciamento de alto rendimento. O espermatozoide está deixando de ser

um dos menos estudado para um dos o tipo de célula mais intensamente perfilado. Com base

na disponibilidade dessas novas tecnologias, os resultados deste trabalho poderão contribuir

para a solução dos problemas relacionados com a infertilidade no futuro.

REFERÊNCIAS



