Videos documentales de fronteras. Itinerarios narrativos ...
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y ......para el pasajero, en términos de...
Transcript of UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y ......para el pasajero, en términos de...
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA INDUSTRIAL
MODELO PARA ESTIMAR EL TAMAÑO DE LOS MERCADOS AÉREOS ORIGEN-DESTINO RESTRINGIDOS POR LA OFERTA
MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL INDUSTRIAL
MARÍA VALENTINA NIÑO DE ZEPEDA MUÑOZ
PROFESOR GUÍA: RICARDO MONTOYA MOREIRA
MIEMBROS DE LA COMISIÓN:
MÁXIMO BOSCH PASSALACQUA IGNACIO LÍSBOA ZAMORA
SANTIAGO DE CHILE MARZO 2012
ii
MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL INDUSTRIAL POR: MARÍA VALENTINA NIÑO DE ZEPEDA MUÑOZ
FECHA: 09/03/2012 PROF. GUIA: SR. RICARDO MONTOYA
MODELO PARA ESTIMAR EL TAMAÑO DE LOS MERCADOS AÉREOS ORIGEN-DESTINO RESTRINGIDOS POR LA OFERTA La estimación de tamaños de mercado para rutas nuevas, en las que no existe oferta directa, es compleja ya que la información histórica disponible sobre la cantidad de pasajeros no es representativa del mercado potencial. En estos mercados es muy probable que al agregar un vuelo directo, su tamaño aumente considerablemente. Actualmente, Lan Airlines S.A. no cuenta con una metodología establecida para la estimación del tamaño de mercados de estas características. Luego, existe una importante necesidad de mejorar este procedimiento. El objetivo principal de esta memoria es desarrollar un modelo de estimación de tamaños de mercado aéreos, para apoyar el proceso de evaluación de rutas nuevas en la empresa. Debido a la ausencia de información histórica representativa, es necesario crear una metodología que logre estimar el tamaño de los mercados en base a otras variables explicativas que estén relacionadas con el flujo de pasajeros entre dos ciudades. Para esto, se evalúan diez variables tentativas y se testean regresiones con tres formas funcionales diferentes: lineal, gravitacional y log-log. La calibración de los modelos se realiza con datos para los años 2009 y 2010. Se determina que el modelo que mejor se ajusta a la información corresponde a una regresión log-log que considera como variables explicativas la distancia, el tamaño de la población, el PIB per cápita y la cantidad de viajes originados anualmente desde las ciudades evaluadas. Al comparar la metodología creada con el actual proceso de estimación de mercados de la compañía, se establece que, aunque presentan un nivel de error similar en sus estimaciones, el modelo presenta ventajas asociadas a la sistematización, la eliminación del sesgo y el ahorro de tiempo en el procedimiento. Por último, como trabajo futuro, se propone testear la validez del modelo en mercados específicos no considerados en esta investigación y eventualmente, realizar las adaptaciones necesarias para poder aplicarlo a estos casos. También se propone el desarrollo de un plan para implementar el uso del modelo en la empresa.
iii
INDICE CAPÍTULO PÁG.
1. INTRODUCCIÓN……………………………………………………….... 1
1.1. LA INDUSTRIA AÉREA Y LAN….……………………….………….….. 1
1.2. PLANIFICACIÓN ESTRATÉGICA LAN…………………….…….....… 3
1.3. EL PROBLEMA DE LA ESTIMACIÓN DE MERCADOS RESTRINGIDOS POR LA OFERTA………………………………….…
3
1.4. JUSTIFICACIÓN DEL PROYECTO……..……………………….......... 5
1.5. ALCANCES DEL PROYECTO.…………….……………………........... 6
2. OBJETIVOS…………………………………………………………….... 8
2.1. OBJETIVO GENERAL…………..………………………………………. 8
2.2. OBJETIVOS ESPECÍFICOS…………..………………………………… 8
3. RESULTADOS ESPERADOS……………….………………………… 8
4. CONTEXTO Y MARCO CONCEPTUAL………………………………. 9
4.1. MERCADOS POR OD……………………….……………..……..……. 9
4.2. MERCADOS OW y RT……………….…………………..…......…….... 11
4.3. MERCADO Y DEMANDA………………...………..…….…….……….. 11
4.4. MERCADOS POTENCIALES Y RESTRINGIDOS…….…..…..……... 13
4.5. MIDT: VENTAJAS Y DESVENTAJAS…………………………………. 15
4.6. COMPLEMENTO MIDT………..……..……………………………......... 16
4.7. LA ESTIMACIÓN DEL TAMAÑO DE LOS MERCADOS EN LA INDUSTRIA AÉREA………….............................................................
16
5. METODOLOGÍA…………………………………………………….….... 23
5.1. METODOLOGÍA PARA EL ANÁLISIS Y EVALUACIÓN DEL PROCEDIMIENTO ACTUAL …………….………………………..........
23
iv
5.2. METODOLOGÍA PARA LA DEFINICIÓN DE LAS VARIABLES TENTATIVAS Y SELECCIÓN DE LA MUESTRA……………….......
24
5.3. METODOLOGÍA PARA EL DESARROLLLO DEL MODELO........... 24
5.4. METODOLOGÍA PARA LA VALIDACIÓN DEL MODELO……......... 26
5.5. METODOLOGÍA PARA LA COMPARACIÓN CON EL PROCEDIMIENTO ACTUAL…………………………………...………
27
5.6. METODOLOGÍA PARA EL ANÁLISIS DE MERCADOS NUEVOS.... 28
6. ANÁLISIS DEL PROCEDIMIENTO ACTUAL………………………… 29
6.1. DESCRIPCIÓN Y ANÁLISIS DEL PROCEDIMIENTO ACTUAL……. 29
6.2. EVALUACIÓN DEL PROCEDIMIENTO ACTUAL…………………….. 33
7. DESARROLLO DEL MODELO………………………………………… 37
7.1. DATOS…………………………………………………….....………........ 38
7.2. VARIABLES TENTATIVAS……………………………………...………. 40
7.3. FORMAS FUNCIONALES Y CORRELACIONES……..…….……….. 42
7.4. MODELO LINEAL…..……………………………………………………. 44
7.5. MODELO GRAVITACIONAL………….………………………………… 45
7.6. MODELO LOG-LOG……………….…………………………………….. 46
7.7. SELECCIÓN Y VALIDACIÓN DEL MODELO DEFINITIVO….……… 47
8. COMPARACIÓN CON EL PROCEDIMIENTO ACTUAL………….... 50
9. EVALUACIÓN DE MERCADOS RESTRINGIDOS………………….. 53
10. CONCLUSIONES………………………………………………………… 55
11. GLOSARIO…………..…………………………………………………… 57
v
12. REFERENCIAS BIBLIOGRÁFICAS………..…………………..……… 58
ANEXOS………………………………………………………………….............. 60
ANEXO A: Organigrama Planificación Comercial…………………………….. 61
ANEXO B: Códigos IATA ciudades…………………………………………….. 62
ANEXO C: Tablas de datos …………………………………………………….. 63
ANEXO D: Notas sobre variables explicativas………………………………... 70
ANEXO E: Correlaciones diferentes formas funcionales…………………….. 72
ANEXO F: Correlaciones variable yield………………………………………... 73
ANEXO G: Detección outliers…………………………………………………… 74
ANEXO H: Testeo de ajustes sobre variables explicativas………………….. 76
ANEXO I: RL1. Regresión lineal 1……………………………………………… 80
ANEXO J: RL2. Regresión lineal 2……………………………………………... 81
ANEXO K: RL3. Regresión lineal 3…………………………………………….. 82
ANEXO L: RG1. Regresión gravitacional 1……………………………………. 83
ANEXO M: RG2. Regresión gravitacional 2…………………………………… 84
ANEXO N: RG3. Regresión gravitacional 3…………………………………… 85
ANEXO O: RLog1. Regresión log-log 1………………………………………... 86
ANEXO P: RLog2. Regresión log-log 2………………………………………... 87
ANEXO Q: RLog3. Regresión log-log 3………………………………………... 88
ANEXO R: Análisis de la normalidad de los residuos………………………... 89
ANEXO S: Regresiones para validación………………………………………. 90
ANEXO T: Errores porcentuales de las estimaciones………………………... 92
ANEXO U: Datos mercados restringidos………………………………………. 95
ANEXO V: Definición de intervalos de confianza de las estimaciones…….. 96
ANEXO W: Regresiones con Pij ajustada por POS………………………….. 98
ANEXO X: Gráficos para análisis de variable distancia ……………………... 100
vi
ANEXO Y: Regresiones con variables dummies……………………………… 102
ANEXO Z: Demostración para interpretación de modelo log-log…………… 104
ANEXO AA: Fuentes de información variable Xij……………………………... 105
1
1. INTRODUCCIÓN
En este capítulo se entrega una mirada general de la industria y la empresa en la que se desarrolla esta investigación. Luego, se exponen las razones que justifican la realización de este proyecto y se define su alcance. Finalmente, se da conocer el plan de trabajo con el que se desarrolló esta memoria.
1.1. LA INDUSTRIA AÉREA Y LAN La industria aérea tiene un importante rol en la economía mundial actual. Su estrecha relación con otras industrias, hace que ésta sea altamente influyente en diversas áreas: estimula la industria del turismo, facilita el comercio mundial e incentiva el crecimiento económico y la inversión extranjera en los diferentes países. En la actualidad resulta difícil imaginar una realidad sin medios de transporte aéreos, ya que éstos están presentes en una diversidad de elementos del diario vivir. La cercanía de esta industria con otros sectores económicos, la hacen fuertemente sensible a los cambios del entorno. Por esta razón, las aerolíneas enfrentan grandes desafíos. Por un lado, factores externos, como el precio del combustible y el precio de la mano de obra, pueden generar importantes cambios en la rentabilidad. Por otro, existen factores internos, como el nivel de efectividad de las técnicas de revenue management o la solidez de la planificación comercial, que son determinantes en el éxito de una línea aérea. En los últimos años, el tráfico aéreo ha aumentado fuertemente tanto en viajes de negocio como de turismo. Con excepción del año 2009 que se vio afectado por la crisis económica, éste ha aumentado a una tasa de alrededor de 6-7% anual en la última década.1 En particular en Chile, el transporte aéreo tuvo un fuerte crecimiento en la última mitad de la década de los 90 y, a pesar de que durante este periodo varias líneas aéreas entraron al mercado, ninguna de ellas logró permanecer en el tiempo. De esta forma, el mercado chileno se caracteriza como uno altamente concentrado (Agostini, 2008). Lan se ha posicionado en el mercado nacional como la principal línea aérea del país, teniendo una participación del 78% del mercado en el doméstico y un 62% en el internacional.2 Además, es actualmente una de las empresas chilenas más importantes a nivel mundial. Ésta cuenta con alrededor de 19.000 trabajadores,
1 Fuente: Airbus Global Market Forecast 2010-2019 2 Fuente: Memoria anual 2010, Lan.
2
tiene ingresos anuales que superan los 4500 MMUS$ y, durante el 2010, transportó a más de 17 millones de pasajeros.3
Su importancia es significativa tanto en la industria de transporte de pasajeros como en la industria de carga. Sin embargo, es la primera de estas industrias la que aporta la mayor proporción de sus ganancias, representando un 68,8% de sus ingresos totales.4
Durante los últimos diez años, esta empresa ha experimentado un fuerte crecimiento, llegando a posicionarse como una de las principales líneas aéreas de la región. Sus ingresos se han triplicado en este periodo y la cantidad de pasajeros transportados es cuatro veces mayor que la del año 2000.
Por otro lado, su red de cobertura ha crecido considerablemente. Ha incorporado a su itinerario 17 nuevos destinos en el mercado internacional y 31 en el mercado doméstico. Hoy, cuenta con una importante cobertura en el mercado Latinoamericano, participa competitivamente en el mercado Sudamérica-USA y su oferta incluye algunos destinos a Europa y a Oceanía.
Algunos de los hitos que han marcado su crecimiento en la última década son el inicio de operaciones de Lan Perú (1999), Lan Argentina (2005), Lan Ecuador (2003), y Lan Colombia (2010), la creación del Hub en Lima y la apertura de nuevas rutas como San Francisco (2010) y Sydney (2002).5
Ilustración 1: Crecimiento Lan 2000-2010, Fuente: Memorias 2000-2010.
3 Fuente: Memoria anual 2010, Lan. 4 Fuente: Memoria anual 2010, Lan 5 Fuente: Memorias anuales 2000-2010, Lan.
3
En su proceso de expansión, Lan ha debido decidir hacia dónde orientar su crecimiento, determinando los mercados más atractivos para la compañía. Estas decisiones estratégicas han contribuido al desarrollo de la empresa y han ido dando forma a lo que ésta representa en la actualidad. Por esta razón, un factor determinante para el éxito de la compañía es la definición de planes de crecimiento estratégico sólidos.
1.2. PLANIFICACIÓN ESTRATÉGICA EN LAN Esta investigación se realizó para el área de Desarrollo de Red de la Gerencia de Planificación Comercial. Esta gerencia se encarga de planificar estratégicamente las acciones de la compañía, tanto para solucionar contingencias en el corto plazo como para evaluar proyectos con horizontes de mediano y largo plazo.
En particular, el área de Desarrollo de Red, tal como su nombre lo indica, es el área encargada de asegurar el desarrollo de redes estratégicas entre las rutas de Lan, analizando las posibilidades de crecimiento orgánico de la compañía. Es decir, el crecimiento que se define en base a los recursos internos de los que dispone la empresa. Entre sus tareas principales se encuentran: la definición de planes de crecimiento para el holding6 y la planificación de flota de largo plazo.
De forma general, para las líneas aéreas resulta muy importante generar redes que permitan entregar un itinerario que, por un lado, logre cubrir un número importante de destinos y por otro, tenga la capacidad de ofrecer un buen producto para el pasajero, en términos de horarios, material y frecuencias de vuelo. Elementos complejos en la definición de itinerarios, como la estructura de conexiones a través de un Hub, por ejemplo, requieren de una mirada holística de las necesidades y recursos de los que disponen las diferentes aerolíneas.
En particular, la importancia del área de Desarrollo de Red para Lan, radica en que ésta analiza las oportunidades de crecimiento de forma integrada, logrando incorporar simultáneamente los intereses de diferentes áreas; tanto de las áreas encargadas de gestionar los negocios de pasajeros Long Haul y Regional, como de las áreas de Carga, Ventas u Operaciones, entre otras.
En el Anexo A se puede observar la ubicación de la Gerencia de Planificación Comercial dentro de la estructura de la empresa y es posible ver el detalle de las áreas que componen esta gerencia y sus principales tareas y procesos.
1.3. EL PROBLEMA DE LA ESTIMACIÓN DE MERCADOS RESTRINGIDOS POR LA OFERTA
La estimación de la demanda por transporte aéreo es un problema complejo. En primer lugar, hay que considerar que la demanda por un determinado vuelo se compone por dos tipos de pasajeros: aquéllos cuyo Origen-Destino (OD) coincide con el origen y el destino del vuelo, y aquellos que utilizan el vuelo como tramo
6 Lan Chile, Lan Perú, Lan Ecuador, Lan Argentina.
4
para hacer conexión. Es decir, los pasajeros de un mismo vuelo pueden tener OD diferentes y, por lo tanto, características diferentes.
Por otro lado, para establecer cuántos de los pasajeros con un OD determinado usarían el vuelo en cuestión para llegar a su destino, se debe estimar la participación de mercado de la compañía en ese OD. Es decir, se debe estimar la cantidad total de pasajeros que viajan el OD sin importar la ruta utilizada para llegar a destino. Por lo tanto, el primer paso en la estimación de la demanda de un vuelo es la determinación del tamaño de los mercados a los que atiende.
El presente trabajo se enfoca en estimar el tamaño potencial del mercado; estimar cuántas personas volarían un OD particular si la oferta no fuese un factor restrictivo. Es decir, hacer una estimación que refleje la cantidad de pasajeros que viajarían si existiese oferta suficiente para cubrir la demanda por viajes del OD, dadas sus características externas; características del mercado que no dependen directamente de la acción de la línea aérea, como por ejemplo, la distancia entre la ciudad de origen y la de destino o el poder adquisitivo de los habitantes.
En particular, el proyecto consiste en crear un modelo que permita estimar los tamaños de mercados en rutas que nunca se han volado. Visto que se trata de rutas nuevas (o con oferta altamente restringida), no existe información histórica representativa sobre la cual basarse para determinar la cantidad de pasajeros que potencialmente volarían este OD, si la ruta directa existiese. Por esta razón, es necesario encontrar otras variables que estén directa o indirectamente relacionadas con un potencial mercado.
Por ejemplo, la ruta SCL-CWB7 no es volada actualmente, ni por Lan ni por la competencia. Es decir, una persona que tiene como origen SCL y desea llegar a CWB debe necesariamente hacer una ruta con conexiones y tomar vuelos de al menos dos aerolíneas diferentes.
Por esta razón, se dan dos problemas que dificultan la estimación del mercado para esa OD:
1. Los datos internos de Lan no proporcionan información completa respecto a los pasajeros del OD SCL-CWB, ya que a lo más uno de los tramos del viaje puede ser realizado en un vuelo de la compañía.
2. Los datos externos de los cuales dispone la compañía, como MIDT8, no son representativos del tamaño potencial del mercado. Dado que no existe oferta directa para la ruta en cuestión, la demanda por esta ruta puede estar subestimada por la escasez de oferta y por lo tanto, al incorporar un vuelo directo al itinerario, es muy posible que el tamaño del mercado se vea fuertemente estimulado. Es decir, aún si se supiera que hoy vuelan 1.000 personas al año desde SCL hasta CWB, esta información no sería
7 SCL: Santiago, CWB: Curitiba 8 Market Information Data Transfer: Base de datos de todas las ventas indirectas de tickets de avión. Ésta se explica con mayor detalle en el Capítulo 4.5 de esta memoria.
5
representativa de la cantidad de personas que volarían de existir un vuelo directo. Seguramente, de incorporarse un vuelo directo, existiría un número mayor de personas que volarían este OD.
La estimación del tamaño de los mercados para nuevas rutas aéreas ha sido tema de diversos artículos. Muchos autores han desarrollado modelos para estimar la cantidad de pasajeros potenciales por OD en base a otras variables explicativas.
1.4. JUSTIFICACIÓN DEL PROYECTO El contar con un mecanismo sistemático para estimar el flujo de pasajeros en mercados aéreos es fundamental para poder determinar oportunidades de crecimiento en la industria aérea. Sin embargo, como ya se ha visto en los puntos anteriores, para mercados nuevos, existen dificultades asociadas a realizar esta estimación. Los costos de una mala evaluación de rutas suelen ser considerables y pueden ser de dos tipos: costo de entrar en mercados “equivocados” y costo de oportunidad de no entrar en mercados potencialmente rentables. En particular, cuando la empresa entra a un mercado “equivocado”, es decir, un mercado cuya rentabilidad es más baja que la estimada, se incurre en diversos costos.
Por un lado, cuando se abre una nueva ruta la compañía realiza una inversión que sólo se justifica cuando ésta resulta rentable y logra mantenerse en el tiempo (como la inversión en el nuevo aeropuerto o los costos de promoción de la nueva ruta). Por otro lado, al operar en una ruta que no es rentable, existe un costo de oportunidad asociado a utilizar activos de la compañía que podrían estar generando ganancias si se destinaran a otros fines.
Para cuantificar la magnitud de los costos asociados a entrar en un mercado “equivocado”, basta mencionar que una de las rutas de Lan cuya evaluación sobredimensionó el mercado, tuvo pérdidas de US$1.700.000 en un periodo de 5 meses. Luego, se puede deducir que al mejorar el mecanismo de estimación de mercados, es posible evitar incurrir en costos significativos.
Por otro lado, cuando la empresa subestima los pasajeros potenciales de un OD, arriesga su entrada a ese mercado y por lo tanto, puede perder la oportunidad de ser el primero en satisfacer esa demanda. Esto también trae consigo una serie de costos y desventajas asociadas, como la de perder la oportunidad de lograr una participación de mercado mayoritaria o la de perder los mejores horarios de operación para la ruta en cuestión.
Para tener una noción de las posibles ganancias asociadas a ser los primeros en detectar una oportunidad de negocio, se puede mencionar que en una de las evaluaciones realizadas por el área de Desarrollo de Red, se estimó que de entrar primeros en un mercado particular los ingresos podrían ser hasta 6 veces mayores que si se entrara en el mismo mercado una vez que otras aerolíneas ya tuvieran participación.
6
Además, las proyecciones de crecimiento de la industria aérea y el complejo panorama competitivo que enfrentan las aerolíneas en la actualidad hacen fundamental el contar con un buen mecanismo de estimación de mercados. Las dificultades asociadas a determinar el crecimiento futuro de las líneas aéreas son mayores que en el pasado. En particular para Lan, que ya posee una sólida red entre las ciudades principales de los continentes a los que atiende y que enfrenta una dura competencia por el liderazgo en la región, la definición de nuevas rutas se ha vuelto más compleja.
Resulta necesario evaluar el desarrollo hacia ciudades secundarias con proyecciones de crecimiento. Es decir, ciudades que no son necesariamente capitales, ni grandes metrópolis, pero que pueden resultar interesantes desde un punto de vista estratégico, ya sea porque tienen un atractivo particular, representan un punto importante en términos de conexiones o porque permiten explotar las ventajas de ser el primer jugador en un mercado.
Adicionalmente, surgen inquietudes relacionadas con la expansión hacia nuevos continentes. Continentes para los cuales, la empresa tiene menos conocimientos que para aquellos en los que opera en la actualidad. Esto adquiere especial importancia cuando se analizan las proyecciones de crecimiento de la industria aérea realizadas por la Airbus que estiman que para el año 2028, la red de vuelos entre continentes diferentes aumente en alrededor de 400 rutas nuevas.9
Además, la reciente fusión con la línea aérea TAM (a concretarse en el año 2012) abre nuevas oportunidades de expansión, por lo que el contar con un procedimiento establecido para la evaluación de nuevas rutas resulta especialmente importante.
Por último, otro elemento que justifica la realización de esta investigación es que el procedimiento actual utilizado por la compañía para estimar el tamaño de nuevos mercados presenta importantes oportunidades de mejora. En el Capítulo 6.1 de esta memoria, es posible encontrar una descripción de este procedimiento y un análisis de sus fortalezas, debilidades y oportunidades de mejora. De éste se desprende que, a través del desarrollo de este proyecto, es posible mejorar sustantivamente algunos aspectos del proceso.
1.5. ALCANCES DEL PROYECTO
Esta memoria pretende crear una herramienta que pueda ser utilizada para facilitar el proceso de estimación de demanda en rutas nuevas de la línea aérea Lan Airlines S.A. En particular, esta herramienta consiste en un modelo para estimar el tamaño potencial de mercados altamente restringidos por la falta de oferta, a través de diferentes variables explicativas.
9 Fuente: Airbus Global Market Forecast 2009-2028
7
El modelo creado no busca reemplazar el factor humano en el proceso de evaluación de nuevas rutas, sino servir de apoyo para la toma de decisiones en este proceso. Las estimaciones entregadas por el modelo son valores gruesos y, por esta razón, es necesario complementar los resultados arrojados por el modelo con el juicio experto de los analistas de la compañía.
Dada la disponibilidad de datos y las restricciones de tiempo enfrentadas en esta memoria, el alcance del modelo se ve determinado por las siguientes características de la muestra:
1. Sólo considera mercados internacionales: No se puede asegurar que el modelo tenga el mismo poder predictivo en rutas de mercados domésticos. Esto debido a que los mercados domésticos pueden presentar un comportamiento distinto a los internacionales. Por ejemplo, la sensibilidad al precio de los pasajeros en el mercado doméstico puede ser mayor que en los mercados internacionales debido a la presencia de otros medios de transporte alternativos y al alto porcentaje de pasajeros étnicos.10
2. Sólo considera mercados OD cuya distancia es mayor a 500 km: En
mercados de distancia muy corta juegan un rol importante los transportes sustitutos. Luego, dado que las variables explicativas utilizadas, no consideran este efecto, no se puede asegurar la efectividad del modelo en este tipo de mercados.
3. Sólo considera “mercados maduros”11: Dado que el modelo se calibró
con mercados que no enfrentan altas restricciones de oferta, éste sólo puede ser usado para predecir tamaños de mercados potenciales, una vez que oferta y demanda hayan alcanzado madurez. Es decir, el modelo no captura la dependencia entre oferta y tamaño de mercado.
4. No considera mercados turísticos: Se han excluido de la muestra mercados considerados netamente turísticos12; por ejemplo, destinos como Punta Cana, Iguazú y Cuzco. Esto debido a que probablemente estos mercados tienen un comportamiento diferente y, por lo tanto, sería necesario incorporar nuevas variables explicativas o modificar los pesos relativos de las variables utilizadas.
5. No considera el efecto de la elasticidad entre el precio y el tamaño del mercado: Dado que entre las variables explicativas del modelo definitivo no se considera la tarifa, el modelo desarrollado en esta memoria no refleja el
10 Los pasajeros étnicos son el segmento de pasajeros que dejan el menor margen de ganancias. Se caracterizan por buscar ventajas en precios. Muchas de las personas que viajan regularmente a un destino por temas familiares pertenecen a esta categoría. 11 Según la definición de mercados maduros del Capítulo 7.1. 12 Los mercados netamente turísticos representan alrededor de un 10% de la oferta actual de la compañía.
8
efecto de las alzas o bajas en el precio sobre la cantidad de pasajeros que viajan entre un determinado origen y destino. Sin embargo, considerando que el modelo predice tamaños potenciales de mercados una vez alcanzada su madurez, se asume que los tamaños estimados corresponden mercados con tarifas maduras. Es decir, tarifas que están altamente correlacionadas con la distancia, población y Producto Interno Bruto (PIB) per cápita de los mercados, y que, por lo tanto, se encuentran de forma implícita en los modelos que consideran estas variables.
Además, es necesario señalar que las recomendaciones realizadas a partir de los valores estimados con el modelo en el Capítulo 9, no consideran la totalidad de los elementos que se deben tomar en cuenta en una evaluación de este tipo. Esto debido a que la finalidad de este capítulo es principalmente mostrar la aplicabilidad del modelo y la forma en la que se deben interpretar sus resultados. De esta forma, se establece que no es parte del alcance de esta memoria el generar recomendaciones acabadas respecto de los mercados con mayor potencial para la compañía. Por último, el alcance de esta memoria no contempla la implementación del modelo en la compañía.
2. OBJETIVOS
2.1. OBJETIVO GENERAL
Desarrollar una metodología para estimar el tamaño potencial de mercados aéreos internacionales que se encuentran restringidos por la oferta.
2.2. OBJETIVOS ESPECÍFICOS 1. Analizar el procedimiento actual de estimación de mercados de la
compañía; rescatar fortalezas e identificar oportunidades de mejora.
2. Generar un modelo de pronóstico y entender los factores que inciden en el tráfico aéreo.
3. Evaluar y comparar la metodología desarrollada con el procedimiento utilizado por la compañía en la actualidad.
4. Aplicar el modelo y estimar tamaños potenciales para mercados que actualmente se encuentran restringidos por la falta de oferta.
3. RESULTADOS ESPERADOS
Como resultado de este trabajo de título se desea obtener:
9
1. Un análisis detallado de la situación actual del proceso de estimación de tamaño de los mercados de la empresa.
2. Una lista de factores que potencialmente inciden sobre el tamaño de los mercados aéreos y su importancia en la estimación.
3. Un modelo que permita calcular tamaños estimados para los mercados que actualmente ven su tamaño restringido por la falta de oferta.
4. Una evaluación que mida la validez y efectividad del modelo creado.
5. Una comparación de los resultados arrojados por el modelo y los resultados obtenidos con el procedimiento actual.
6. Un análisis de las oportunidades de crecimiento para tres mercados
potenciales, en base a la estimación arrojada por el modelo.
4. CONTEXTO Y MARCO CONCEPTUAL En este capítulo se presentan los conceptos de la industria aérea a los que se hace referencia en este informe y se explica la principal fuente de información utilizada por Lan para la estimación de mercados. Además, se entrega un contexto histórico que busca resumir los diferentes enfoques que han utilizado otros autores para enfrentar problemas similares al tratado en esta memoria.
4.1. MERCADOS POR OD
Actualmente, en la industria aérea la forma más común de analizar los mercados de las diferentes rutas es a través de pares Origen-Destino (OD). Existen importantes beneficios asociados a analizar los mercados por OD en oposición a analizarlos por tramo, pero para entender estos beneficios es necesario definir estos conceptos. Para esto, se expone el siguiente ejemplo: Hay dos pasajeros que desean viajar de Santiago, Chile (SCL) a New York, EEUU (NYC). Uno de ellos viaja en un vuelo directo y el otro hace una escala en Lima, Perú (LIM). Luego, ambos pasajeros tienen origen SCL y destino NYC, es decir, ambos tienen el mismo OD: SCL-NYC. Sin embargo, estos pasajeros tienen diferentes tramos en su recorrido: el primero tiene el tramo SCL-NYC (que coincide con su OD) y el segundo, los tramos SCL-LIM y LIM-NYC. A continuación se presenta una ilustración que muestra los diferentes tramos para estos pasajeros.
10
Ilustración 2: Mapa ilustrativo de la diferencia entre OD y Tramo De esta forma, al observar los tamaños de los diferentes mercados como pares de OD, se consideran todos los pasajeros que viajan de un origen a un destino determinado, sin importar la ruta (el conjunto de tramos) que recorre para hacerlo. Uno de los principales beneficios de analizar los mercados como pares Origen-Destino, es que esto permite entender de forma más completa el comportamiento de los pasajeros, ya que reúne a todos los pasajeros que desean viajar de SCL a NYC (para seguir con el ejemplo) y de esta forma, resulta más fácil determinar perfiles comunes entre estas personas. Es decir, una de las desventajas de considerar los mercados por tramo es que el pasajero con OD SCL-NYC y tramo SCL-LIM, quizás tenga poco en común con otros pasajeros del vuelo SCL-LIM que utilizaron el mismo vuelo para hacer conexión a un destino diferente. Adicionalmente, otra ventaja de los mercados por OD, es que estos permiten analizar las redes de vuelos de manera integrada. Es decir, cuando el objetivo de
Tramo SCL-‐NYC
Tramo LIM-‐NYC
Tramo SCL-‐LIM
OD SCL-‐NYC
11
una aerolínea es captar la mayor participación de mercado posible sobre un OD, ésta lo puede hacer considerando diferentes vuelos de la red y de esta forma, observar las posibles interacciones. En oposición, cuando se maximiza la cantidad de pasajeros por tramo, el análisis del vuelo se realiza de forma aislada. Las principales desventajas de analizar los mercados por OD están relacionadas con su complejidad. En primer lugar, cuando se evalúa un mercado utilizando este enfoque es necesario considerar toda la red de vuelos que sirven el OD y no sólo aquellos que lo hacen de forma directa, como en el caso del análisis por tramo. En segundo lugar, en este tipo de análisis es necesario contar con una base de datos más completa, ya que además de contener la información de los pasajeros para los diferentes vuelos, ésta debe ser capaz de rastrear a cada uno de ellos desde su origen a su destino. Sin embargo, a pesar de estas desventajas, en la mayoría de los casos, cuando la información lo permite, es preferible realizar un análisis de mercados por OD, por sus múltiples beneficios.
4.2. MERCADOS OW y RT Cuando se consideran mercados OD es necesario conocer los conceptos de One-Way (OW) y Round-Trip (RT). Un mercado OW es uno que toma en cuenta la dirección de los pasajeros para determinar su tamaño. Es decir, si se revisa el ejemplo bajo este concepto, el mercado OW SCL-NYC considera los pasajeros que viajan desde SCL a NYC, mientras que el mercado OW NYC-SCL considera aquellos que viajan en el sentido inverso. Un mercado RT no considera la dirección de los viajes y su tamaño es la suma de los pasajeros que viajan entre dos puntos, sin considerar en qué sentido lo hacen. En el ejemplo, el mercado RT SCL-NYC, considera tanto los pasajeros que viajan desde SCL a NYC, como de los que viajan de NYC a SCL. De esta forma, si el mercado OW SCL-NYC fuera de 104 pasajeros al año y el mercado OW NYC-SCL fuera de 98 pasajeros, el mercado RT SCL-NYC (que es equivalente al mercado RT NYC-SCL) sería de 202 pasajeros. Para efectos de este trabajo, se analizarán mercados RT, pero se les llamará simplemente mercados para simplificar la nomenclatura.
4.3. MERCADO Y DEMANDA Otro aspecto que es necesario aclarar es que, para efectos de esta memoria, se hace una diferencia de terminología entre demanda y tamaño de mercado. Se usará el término demanda para referirse a los pasajeros que desean volar un tramo específico en un vuelo particular, y de mercado, para referirse a todos aquellos que desean volar un OD determinado. Si bien la estimación del tamaño
12
de un mercado puede servir para estimar la demanda, estos conceptos no se consideran como equivalentes. Estimar el tamaño de un mercado supone encontrar el número total de pasajeros que desean llegar de un origen a un destino, sin importar la ruta, ni la aerolínea a través de la cual viajan para hacerlo. La demanda, en cambio, está compuesta por una fracción del mercado en cuestión (dada por la participación de mercado que logra el vuelo) y, eventualmente, por fracciones de otros mercados cuyos pasajeros usan el vuelo para hacer conexión hacia otro destino. Es decir, se usará el término tamaño de mercado, cuando se trate de una demanda agregada total entre aerolíneas que considera todos los vuelos de la red disponibles para un OD. Una forma de entender la interacción entre tamaño de mercado y demanda es a través del siguiente diagrama. En él se analiza el ejemplo de un vuelo que realiza el tramo entre Lima, Perú (LIM) y San Francisco, EEUU (SFO).13 Es posible observar cómo, en la determinación de la demanda por este vuelo, se consideran diferentes mercados OD.
Ilustración 3: Diagrama explicativo de la composición de la demanda por una ruta A-B En este diagrama, es posible apreciar que la demanda total que enfrenta la compañía para algún vuelo o ruta en particular, es la suma de 2 tipos de demandas: Demanda 3ª y 4ª: Son todos los pasajeros que compran un ticket para volar de forma directa en una ruta. Es decir, su OD coincide con el tramo que realiza el
13 Los valores utilizados en el ejemplo son referenciales y no corresponden necesariamente al tráfico real de pasajeros en el mercado.
13
vuelo. Si existen otras rutas o vuelos que permiten viajar ese OD (con otras líneas aéreas o por otros caminos en conexión), esta demanda es una fracción del mercado OD total. Esta fracción representa la participación de mercado de la compañía en la ruta determinada. Demanda 6ª: Son todos los pasajeros dispuestos a comprar un ticket de la compañía para una ruta particular con el objetivo de usarlo como conexión para completar otro OD. De esta forma, se puede apreciar que los tamaños de los mercados en conjunto con la determinación de las participaciones para cada mercado, permiten calcular la demanda total para una ruta particular.
4.4. MERCADOS RESTRINGIDOS Y POTENCIALES El último concepto que es necesario conocer para efectos de la lectura de esta memoria, es el de mercado restringido. Existe una estrecha relación entre oferta y tamaño de mercado. Un aumento o disminución en la oferta de un determinado OD, repercute directamente en la cantidad de gente que vuela dicho OD. Aunque se puede deducir de forma lógica que el tamaño de un mercado es directamente proporcional a su oferta, el estimar en qué proporción cambia el mercado, en función de las variaciones en la oferta, no es trivial. Sin embargo, se puede inferir que, en la mayoría de los casos, un aumento determinado en la oferta suele tener un impacto más fuerte en mercados con nula o poca oferta que en mercados que ya han alcanzado niveles de oferta mayores. Es decir, a pesar de que el tamaño de un mercado crece a medida que crece su oferta, este potencial de crecimiento es limitado; a medida que aumenta la oferta se va saturando el mercado potencial. De forma referencial, sería posible definir una curva del tamaño de mercado en función de la oferta para una ruta tipo, como la que se muestra a continuación.
14
Ilustración 4: Curva de tamaño de mercado en función de la oferta (referencial)
Un mercado puede estar restringido cuando éste tiene nula o poca oferta. Por ejemplo, hoy no existen vuelos directos entre Buenos Aires, Argentina (BUE) y Brasilia, Brasil (BSB). La única forma de hacer esta ruta en la actualidad, es haciendo escala en alguna otra ciudad. Luego, aunque hoy existen pasajeros que realizan esta ruta, es probable que el número total de pasajeros de la ruta fuera mayor de agregarse un vuelo directo. En la Ilustración 4 es posible observar 3 casos. En el primero se puede ver que un aumento de Δ1 en la oferta implica un aumento de δ1 en el tamaño del mercado. Análogamente, en los otros dos casos puede apreciarse la misma relación para Δ2 y δ2, y para Δ3 y δ3. Además se puede observar que, aunque Δ1< Δ2< Δ3, las variaciones en el eje dependiente se relacionan de forma inversa δ1> δ2> δ3. En base a este ejemplo, se pueden definir 3 tipos de mercados:
1. Mercados altamente restringidos por la oferta: Es el caso representado por Δ1 y δ1, y son mercados en los que un aumento pequeño en la oferta puede repercutir en un gran aumento del tamaño del mercado. Son mercados que están muy lejos de haber alcanzado su tamaño potencial.
2. Mercados medianamente restringidos por la oferta: Es el caso
representado por Δ2 y δ2, y son mercados en los que un aumento en la oferta repercute en un aumento moderado del tamaño del mercado. Son mercados que no han alcanzado su tamaño potencial, pero que se encuentran cercanos a éste.
3. Mercados con oferta madura: Es el caso representado por Δ3 y δ3, y son
mercados en los que un gran aumento en la oferta repercute en un
15
aumento muy pequeño o nulo del tamaño del mercado. Son mercados que han alcanzado su tamaño potencial.
En general, para estimar los mercados de los casos 2 y 3, conviene usar como base la data histórica de la que dispone la compañía. Sin embargo, para el caso 1, la data histórica de pasajeros volando este tipo de mercados, no es representativa, ya que es posible que, de aumentar la oferta, el tamaño del mercado aumente de forma explosiva. El objetivo de esta memoria es crear un modelo que entregue un número aproximado de lo que podría ser el tamaño potencial de un mercado que actualmente se encuentra restringido por la falta de oferta.
4.5. MIDT: VENTAJAS Y DESVENTAJAS La principal fuente de información utilizada por Lan para estimar los tamaños de los diferentes mercados es MIDT.
MIDT (Market Information Data Transfer) es una fuente de datos que contiene información histórica de todas las transacciones realizadas sobre las reservas (bookings) de todas las aerolíneas del mundo hechas a través de los sistemas de distribución (GDS) por las agencias de viajes. Por lo tanto, ésta sólo contiene información de los tickets vendidos de forma indirecta. Es decir, considera la información de pasajeros que compran a través de agencias, pero no toma en cuenta aquellos que lo hacen contactándose directamente con las aerolíneas, como por ejemplo, los pasajeros que compran a través de las páginas web de las líneas aéreas.14
La información contenida en MIDT es muy completa y permite analizar diferentes aspectos de interés; permite observar el tamaño de los mercados, la composición de tarifas de la competencia (cuántos pasajeros se llevan de cada clase) y las participaciones de mercado de las diferentes compañías, entre otros.
Aunque esta fuente de datos es una herramienta muy poderosa, presenta dos desventajas importantes.
La primera de ellas es que, para algunas aerolíneas que tienen una fuerte venta de tipo directa, la información contenida en el sistema es muy incompleta. Luego, para mercados liderados por líneas aéreas con estas características, el número de pasajeros suele ser bastante menor al número real.
Por otro lado, como ya se ha mencionado, para el caso particular de los mercados altamente restringidos, el tamaño de mercado entregado por MIDT (que representa el flujo histórico de pasajeros en el OD) no es representativo
14 Fuente: Manual MIDT, Lan.
16
del flujo potencial que podría tener ese OD de levantarse la restricción de demanda.
4.6. COMPLEMENTO MIDT
Con el fin de contar con información más completa, Lan ha creado una base de datos propia, en la que a partir de MIDT, se intenta reconstruir el tráfico real de pasajeros para los diferentes OD, incluyendo tanto la venta directa como la indirecta. Para esto, se complementa MIDT con fuentes de información gubernamentales.15 Estas fuentes gubernamentales son de carácter público y contienen información acerca de los embarques en los diferentes aeropuertos. Luego, al cruzar los datos de MIDT con los datos de estas fuentes es posible obtener tamaños de industria mucho más precisos. Con este cruce de información, la compañía obtiene una nueva base de datos, llamada Complemento MIDT (CMIDT).
4.7. LA ESTIMACIÓN DEL TAMAÑO DE LOS MERCADOS EN LA INDUSTRIA AÉREA
Existe la necesidad de contar con un mecanismo de estimación sistemático para el tamaño de los mercados aéreos. Muchos son los autores que han tratado este tema y existen diversos enfoques para hacer frente a esta necesidad.
De forma muy general, los análisis de los mercados aéreos se pueden clasificar en dos grandes grupos: los de macroanálisis y los de microanálisis (Rengaraju and Thamizh Arasan, 1992). Los primeros son los que realizan proyecciones de los flujos de pasajeros en base a las tendencias globales de la industria (por ejemplo, un análisis sobre los efectos de las proyecciones en el alza de los precios del combustible sobre la industria aérea). Los segundos, en cambio, analizan elementos específicos de cada par Origen-Destino. Luego, como esta investigación busca entregar una metodología que permita evaluar diferentes rutas con sus respectivas particularidades, el enfoque de este trabajo corresponde a uno del segundo tipo.
Existen varios tipos de modelos de microanálisis utilizados para la estimación del tamaño de los mercados. Estos pueden dividirse en 3 grandes grupos (Benítez Rochel, 2000): los métodos cualitativos, los modelos de extrapolación y los modelos causales.
1. Métodos cualitativos: Son aquellos que se basan en las percepciones de personas con conocimientos del tema. Entre ellos se pueden mencionar las opiniones de expertos, el método de Delphi y las investigaciones de mercado.
15 Algunas de estas fuentes son la JAC (Chile), CORPAC (Perú), DOT (US), Aeronáutica Civil de Colombia, ANAC (Brasil), entre otras.
17
2. Modelos de extrapolación: Son aquellos que se basan en información histórica de la variable a estimar para realizar proyecciones futuras. Un ejemplo de modelo de extrapolación son las series temporales.
3. Modelos causales: Son aquellos que se basan en otras variables para
proyectar un valor para la variable en estudio. Entre ellos se pueden mencionar las regresiones y los modelos gravitacionales.
Dado que para el caso de las rutas nuevas no se dispone de información histórica, se utilizará un modelo causal para la estimación del tamaño de las industrias. Para esto, es necesario determinar las variables explicativas que pueden ser determinantes del tamaño de los mercados.
Muchos artículos han intentado determinar los factores que determinan la demanda por un destino. Éstos pueden ser de diversa naturaleza; pueden ser variables sobre las que la empresa puede actuar o pueden ser datos externos. La literatura ha estudiado el efecto de diferentes factores, desde el PIB de los países, hasta el flujo de telecomunicaciones entre el origen y el destino estudiado. A continuación se exponen algunos de estos factores.
Factores externos
Factores Económicos:
• PIB • PIB per cápita • IPC • Renta • Inflación • Nivel de inversión extranjera • Otros
Factores Estructurales:
• Tamaño de las poblaciones • Estructura de las poblaciones (etaria, étnica, según nivel educacional,
según porcentaje de empleados, según tamaño familiar promedio, etc.) • Distancia geográfica entre origen y destino
Otros:
• Nivel de atractivo turístico (recursos naturales, patrimonio histórico, infraestructura turística, etc.)
• Nivel de intercambio comercial • Percepción de niveles de seguridad • Existencia de medios de transporte alternativos
18
• Existencia de mar entre ciudades • Otros
Factores internos
• Tarifas • Material • Frecuencias semanales
Algunos de estos factores son directamente cuantificables, como la distancia geográfica, mientras que otros no lo son, como el nivel de atractivo turístico. Luego, para este último tipo de factores, generalmente se definen indicadores medibles que estén relacionados de alguna manera con el factor en cuestión. Por ejemplo, para medir el nivel de atractivo turístico de una determinada ciudad se podría utilizar como indicador el número de plazas de hotel existentes.
Según Benítez Rochel (2000), uno de los modelos más usados para la evaluación de rutas nuevas es el modelo gravitacional. Éste consiste en un modelo análogo al modelo de gravitación universal, donde la cantidad de pasajeros (Tij) es proporcional al tamaño de las poblaciones (Pi, Pj) e inversamente proporcional al cuadrado de la distancia entre los 2 puntos (dij).
𝑇!" = 𝛼 𝑃!𝑃!𝑑!"!
Ecuación 1: Modelo gravitacional básico
Sin embargo, este modelo básico que sólo considera las variables población y distancia puede extenderse para incorporar todas las variables que se desee. Este modelo gravitacional extendido ha sido utilizado por diversos autores (Brown y Watkins, 1968; Verleger, 1972; Rengaraju y Thamizh Arasan, 1992; Russon y Riley, 1993; entre otros). La forma funcional del modelo gravitacional en su forma general puede observarse en el Capítulo 5.3.
A continuación se presenta una revisión general de la literatura en la que se han utilizado modelos gravitacionales para enfrentar el problema de estimación del tamaño de los mercados de transporte aéreo. En la siguiente tabla se pueden apreciar las variables explicativas, el tamaño de las muestras y el coeficiente de bondad de ajuste para cada uno de ellos.
19
Tabla 1: Literatura modelos gravitacionales (Grosche et al., 2007)
Estudio Variables Obs R2 1. Doganis (1966) Pasajeros por aeropuerto, distancia. 22 0.740
2. Brown & Watkins (1968)
Ingresos, competidores, yield, tiempo medio de viaje por milla, número de escalas, distancia, llamadas telefónicas, cantidad de pasajeros internacionales en vuelos domésticos, índice de competencia.
300 0.870
3. Verleger (1972) Ingresos, precio, llamadas telefónicas, distancia, tiempo de vuelo.
441 0.720
4. Moore & Soliman (1981)
Poblaciones por ciudad, ingresos, tarifa media turista. 69 0.370
5. Fotheringham (1992) Población, tráfico total de la ciudad de origen hacia otros destinos, distancia.
9900 0.730
6. Rengaraju & Thamizh Arasan (1992)
Población, porcentaje de empleados, cantidad de profesionales, factor de cercanía de grandes ciudades, ratio de tiempo de viaje (tiempo de viaje en tren/tiempo de viaje en avión), distancia, frecuencias.
40 0.952
7. Russon & Riley (1993) Ingresos, población, distancias por carretera, número de vuelos directos y en conexión, tiempo de viaje en auto, distancia de los aeropuertos cercanos.
391 0.992
8. O’Kelly et al. (1995) Atracción de los nodos, distancia 294 0.850
9. Jorge-Calderon (1997) Población, ingresos, factor de proximidad de hub, distancia, existencia de mar entre ciudades. Variables adicionales: Destino turístico, frecuencias, material, tarifa económica media.
339 0.371
10. Doganis (2004) Reservas de vuelos por aeropuerto, tarifa media turista, frecuencias.
47 0.722
11. Grosche, Rothlauf & Heinzl (2007)
Población, población localidades aledañas, poder adquisitivo, PIB, distancia, tiempo de viaje.
1228 0.941
Los modelos gravitacionales presentados consideran diferentes variables explicativas y fueron calibrados usando muestras de diferentes tamaños. Es posible notar que los modelos 4, 6 y 10 utilizan muestras de tamaño similar a la utilizada en esta memoria.
Además, se observa que, en la mayoría de los casos, el R cuadrado de las regresiones es alto para este tipo de modelos. En particular, nueve de los once modelos presentan un R cuadrado superior a 0.700 y cinco de ellos presentan valores superiores a 0.850.
El modelo a desarrollar pretende rescatar aspectos metodológicos de la literatura mencionada, para crear una herramienta predictiva que se adapte a los
20
requerimientos particulares de la empresa y a la información con la que cuenta la compañía.
En particular, se tomarán como guías los artículos de Grosche, Rothlauf, Heinzl (2007) y Rengaraju y Thamizh Arasan(1992).
En el primero de estos artículos, se analizan modelos gravitacionales calibrados con una muestra de 956 mercados internacionales europeos, desagregando los mercados según aeropuerto. Es decir, a diferencia del modelo desarrollado en esta memoria que analiza el flujo de pasajeros entre ciudades, éste lo analiza en términos de flujo entre aeropuertos.
Luego, para ciudades que tienen más de un aeropuerto, el modelo de Grosche, Rothlauf, Heinzl permitiría calcular la cantidad de pasajeros que viajan a cada uno de ellos. Por ejemplo, para el caso del mercado SCL-BUE, éste permitiría ver cuántos pasajeros viajan a Buenos Aires por el aeropuerto de Ezeiza y cuántos lo hacen por Aeroparque.
El artículo contempla el desarrollo de dos modelos gravitacionales; uno básico y uno extendido. La diferencia entre ambos es que en el primero se excluyen de la muestra aquellas ciudades que tienen más de un aeropuerto y en el segundo, estas ciudades se toman en consideración, incluyendo entre las variables explicativas una que representa el efecto de la competencia entre aeropuertos.
Aunque el segundo modelo permite obtener estimaciones más detalladas, determinando la distribución de pasajeros en los diferentes aeropuertos de una misma ciudad, para efectos de esta investigación, se analizará con mayor detalle el modelo básico. Esto debido a que cuando se analizan mercados OD con la finalidad de evaluar rutas aéreas, no resulta especialmente relevante diferenciar a qué aeropuerto viaja cada pasajero, ya que en general los aeropuertos en una misma ciudad suelen comportarse como sustitutos para alguien que desea viajar a ese destino. Modelos con este nivel de detalle son más útiles cuando se evalúan otros elementos, como determinar el flujo de pasajeros de los diferentes aeropuertos para determinar su capacidad.
Dado que, para el caso particular de este trabajo, los mercados son considerados a nivel de ciudad y no de aeropuerto, se analizará con mayor detalle el modelo básico.
Las variables explicativas utilizadas en el modelo básico son:
• Pij: Producto de las poblaciones de la ciudad en la que se encuentra el aeropuerto i y de la ciudad en que se encuentra el aeropuerto j.
• Cij: Producto de las poblaciones de localidades aledañas a los aeropuertos i y j.
21
• Bij: Suma de los índices de poder adquisitivo de los habitantes de las
ciudades en que se encuentran los aeropuertos i y j.
• Gij: Producto de los PIB de los países en los que se encuentran los aeropuertos i y j.
• Dij: Distancia geográfica entre los aeropuertos i y j.
• Tij: Tiempo de viaje promedio entre los aeropuertos i y j. Para determinar las primeras cuatro variables, se testearon diferentes formas funcionales y se seleccionaron aquellas que presentaban mayor correlación con la variable dependiente. Este aspecto metodológico también está presente en el artículo de Rengaraju y Thamizh Arasan(1992) y en el desarrollo de esta memoria, se utilizó esta metodología para determinar las variables del modelos.
Esta regresión alcanza un buen factor de ajuste (R cuadrado=0.74), pero debido a la presencia de correlación entre sus variables, no es posible hacer interpretaciones de los signos y magnitudes de sus parámetros. En particular, para este modelo, la variable distancia (Dij) aparece acompañada de un parámetro positivo y esto se contradice con el supuesto común de los modelos gravitacionales de que ésta debería tener un impacto negativo sobre el tamaño del mercado. Sin embargo, como la distancia está correlacionada con la variable tiempo de viaje (Tij), es posible que el parámetro negativo que acompaña esta variable esté compensando el efecto positivo de la distancia.
La decisión de incluir ambas variables se debe a que en esta investigación se privilegió la capacidad predictiva del modelo por sobre la posibilidad de interpretar sus parámetros e incorporando simultáneamente variables correlacionadas se logra un buen ajuste entre las observaciones y las estimaciones.
Sin embargo, para el desarrollo de esta memoria se intentará evitar la inclusión simultánea de variables altamente correlacionadas entre sí en un mismo modelo. De esta forma, se pretende obtener, además de la estimación misma, un análisis de cuáles son las variables más importantes para la estimación.
El modelo desarrollado por Rengaraju y Thamizh Arasan es también uno gravitacional y, al igual que el de esta memoria, considera mercados agregados por ciudades (no por aeropuertos).
La principal diferencia entre este modelo y el de este trabajo, es que el primero analiza mercados domésticos y por lo tanto, necesita considerar algunas variables explicativas adicionales, como por ejemplo, una variable que refleje el efecto de los medios de transporte sustitutos, ya que éstos juegan un importante rol en mercados de estas características.
22
La muestra utilizada en la calibración del modelo de Regaraju y Thamizh Arasan consta de 40 mercados OD, para 20 ciudades de la India. El tamaño de la muestra en esta investigación es bastante menor que en la anterior y se acerca más al de la muestra que se utiliza en la definición del modelo de esta memoria. Esto entrega algo de tranquilidad respecto a las aprensiones asociadas a que la muestra utilizada sea pequeña e indica que es posible realizar estimaciones satisfactorias a través de un modelo calibrado con un número reducido de observaciones.
Las variables de este modelo son las que se describen a continuación:
• Pij: Producto de las poblaciones de la ciudad i y la ciudad j.
• Eij: Suma de los porcentajes de empleados de la ciudad i y la ciudad j.
• Qij: Suma de los porcentajes de profesionales de la ciudad i y la ciudad j.
• Rij: Ratio entre el tiempo promedio que demora el viaje entre i y j en tren y el tiempo que demora el mismo viaje en avión.
• Dij: Distancia geográfica entre las ciudades i y j.
• Fij: Frecuencias semanales de vuelos entre i y j por semana.
• Xij: Variable dummy que toma valor 1 si alguna de las ciudades i o j es una
ciudad pequeña cerca de alguna ciudad mayor y “e” si no.
Es posible observar que existen variables que son comunes en los dos artículos analizados y que se repiten en variadas ocasiones en los modelos de la Tabla 1. Por ejemplo, las variables población y distancia suelen estar presentes en la gran mayoría de los modelos de esta tabla.
Otra variable recurrente en los modelos es la que hace referencia a la situación económica de los habitantes del país. De esta forma, en muchos artículos se considera la variable ingresos u otras que seguramente presentan correlación con ésta, como la tasa de empleo o el PIB.
Además, dependiendo de las particularidades de los mercados analizados en los diferentes artículos, existen variables específicas que se incorporan según las necesidades de cada caso. Por ejemplo, dadas las singularidades de la muestra de Regaraju y Thamizh Arasan, su modelo incluye una variable para rescatar el efecto de la sustitución entre diferentes medios de transporte. Es decir, dado que se trata de mercados domésticos en que el viajar en tren compite con el transporte aéreo, se incorpora como variable la tasa de sustitución de los viajes en avión por viajes en tren.
23
Para el desarrollo de esta memoria se determina incluir, al menos, las 3 variables que aparecen de forma recurrente en la bibliografía revisada y variables adicionales definidas en conjunto con la empresa.
5. METODOLOGÍA
En este capítulo se entrega una descripción detallada de la metodología utilizada para las diferentes etapas del trabajo. A través de esta descripción se pretende mostrar las principales herramientas que se utilizan en el desarrollo del proyecto y las diferentes adaptaciones que se hacen a estas herramientas para satisfacer las necesidades específicas del problema en cuestión.
5.1. METODOLOGÍA PARA EL ANÁLISIS Y EVALUACIÓN DEL
PROCEDIMIENTO ACTUAL La metodología para analizar y evaluar el procedimiento actual de estimación de mercados nuevos de la compañía considera tres etapas: levantamiento del procedimiento, análisis crítico del proceso y evaluación del nivel de error de las estimaciones pasadas.
En la primera etapa de levantamiento y descripción de la situación actual, la metodología consiste básicamente en la realización de entrevistas; tanto a analistas de Desarrollo de Red con experiencia en evaluación de nuevas rutas, como a personas de fuera del área que también se han enfrentado al desafío de estimar los mercados de rutas nunca antes voladas.
En particular, consiste en la realización de tres entrevistas a miembros del equipo de Desarrollo de Red y dos a integrantes del área de Sistemas Comerciales e Investigación Operacional (SCIO). Con los primeros, se levanta el procedimiento actual utilizado por Desarrollo de Red para estimar el tamaño de mercado en rutas nuevas y con los segundos, se profundiza en los conocimientos de Complemento MIDT.
En la etapa de análisis crítico, la metodología contempla identificar los elementos que deben ser rescatados del procedimiento actual y aquellos que deben ser mejorados, en base a la información obtenida a partir de las entrevistas. Como resultado de este análisis se obtiene un listado de las principales fortalezas y elementos a mejorar del proceso de estimación actual.
Por último, la etapa de evaluación del nivel de error de las estimaciones pasadas tiene por objetivo generar valores base con los cuales determinar el error estimado del proceso utilizado hoy en la compañía. Con esto, se obtiene un rango de error sobre el cual realizar una comparación entre el modelo nuevo y el antiguo. La metodología para esta etapa consiste en realizar una recopilación y análisis de las estimaciones de mercados utilizadas en evaluaciones de rutas pasadas. Para esto, se analizan rutas con oferta altamente restringida que fueron evaluadas por Lan en el pasado y para las que hoy existen vuelos operando.
24
5.2. METODOLOGÍA PARA LA DEFINICIÓN DE LAS VARIABLES TENTATIVAS Y SELECCIÓN DE LA MUESTRA
La metodología para definir las variables tentativas considera la revisión de la literatura y el análisis de las variables explicativas utilizadas por los diferentes autores. Adicionalmente, se identifican los factores que los analistas de la compañía consideran interesantes para evaluar su inclusión en el modelo. Para la construcción y validación del modelo de estimación de tamaños de industria, es necesario construir una muestra. Para definir los OD de la muestra, la metodología contempla que ésta cumpla tres condiciones.
1. Disponibilidad de información: La selección de la muestra se ve condicionada por la disponibilidad de información. En particular, es necesario que para los OD de la muestra existan datos MIDT y estadísticas varias que permitan definir valores para las posibles variables explicativas.
2. Selección de mercados maduros: Dado que el modelo busca estimar el
tamaño potencial de mercados, suponiendo que no existen restricciones de oferta, es deseable que la mayoría de los OD de la muestra sean mercados con oferta madura. Sólo de esta forma, puede verse reflejado el efecto de las variables explicativas sobre el tamaño del mercado actual.
La metodología utilizada para diferenciar a los mercados maduros de aquellos que eventualmente podían no serlo, se basa en definir criterios a través de las conversaciones con los analistas de la empresa.
3. Exclusión de casos particulares: La metodología considera excluir de la
muestra pares de OD específicos, en los que los mercados podrían comportarse de forma particular. Esto porque para la calibración del modelo existe el supuesto implícito de que, en términos generales, los tamaños de los diferentes mercados pueden modelarse utilizando las mismas variables y con las mismas ponderaciones.
5.3. METODOLOGÍA PARA EL DESARROLLO DEL MODELO
La metodología para la definición del modelo econométrico contempla el uso de la herramienta Stata versión 11. En la primera etapa del desarrollo del modelo se analizan medias, varianzas y correlaciones. A través del análisis de las correlaciones entre variables se determina qué variables conviene incluir en forma conjunta en el modelo y cuales son excluyentes. Cabe señalar que entre las variables explicativas, se distinguen dos tipos: aquellas que son propias de las ciudades que componen la OD y aquellas propias del
25
mercado de la OD. Por ejemplo, la variable Población es propia de las ciudades (Pi: Población de la ciudad i), en cambio la variable Distancia es propia de un mercado (Dij: Distancia para el mercado OD compuesto por las ciudades i y j). Para las variables de ciudades se define una forma funcional que incorpore, en una sola variable, sus valores tanto para el origen como para el destino del mercado OD. Es decir, en vez de contar con dos variables Pi y Pj para la población, se realiza una transformación de modo de contar con una sola, Pij. La metodología para definir la forma funcional de este tipo de variables consiste en probar dos expresiones para cada variable y elegir aquella que presente mayor correlación con la variable dependiente.16 A continuación se presentan las formas funcionales que se testean en esta memoria.
𝑋!" = 𝑋!𝑋!
Ecuación 2: Forma funcional para variables explicativas 1
𝑋!" = 𝑋! + 𝑋!
Ecuación 3: Forma funcional para variables explicativas 2 Una vez definidas las formas funcionales de las variables explicativas, la metodología contempla testear tanto un modelo lineal como uno gravitacional. Esto con la finalidad de comparar el ajuste de las diferentes formas funcionales y determinar si el modelo gravitacional arroja o no, mejores resultados que una simple regresión lineal. A continuación se detallan las expresiones para la regresión lineal simple y el modelo gravitacional.
𝑇𝑖𝑗 = 𝛽! + 𝛽!𝑋!!" + 𝛽!𝑋!!" +⋯+ 𝛽!𝑋!"#
Ecuación 4: Modelo lineal simple
𝑇!" = 𝑒!!𝑋!!"!! 𝑋!!"!! …𝑋!"#!!
Ecuación 5: Modelo gravitacional general
El modelo lineal tiene la característica de ser de simple interpretación, ya que un aumento en una unidad de la variable explicativa Xi se asocia con un cambio de 𝛽! unidades en la variable dependiente. 16 Metodología utilizada por Rengaraju y Thamizh Arasan (1994) y Grosche et al. (2007).
26
Además, este tipo de especificación permite aplicar funciones de selección de variables como stepwise en Stata 11, mientras que la estimación de funciones no lineales no lo permite. Para simplificar la interpretación del modelo no lineal y poder utilizar la aplicación de selección de variables, se hace una transformación al modelo de la Ecuación 5, aplicando la función logaritmo natural. De esta forma, se obtiene un tercer modelo a evaluar, dado por la expresión que se presenta a continuación.
ln 𝑌!" = 𝛽! + 𝛽! ln 𝑋!!" + 𝛽! ln 𝑋!!" +⋯+ 𝛽! ln (𝑋!"#)
Ecuación 6: Modelo Log-Log En este modelo los parámetros estimados pueden interpretarse como la elasticidad de la variable dependiente respecto a la variable explicativa. Así, un cambio porcentual del 1% en la variable Xi se asocia con un cambio de 𝛽!% en la variable dependiente.17 En un principio, se hacen regresiones que incluyen todas las variables independientes. Luego, se analizan sus niveles de significancia y la posible presencia de colinealidad, para ir seleccionando aquellas con mayor poder explicativo. Para la selección de las variables del modelo se utiliza el método stepwise. Este método incluye sucesivamente las variables al modelo, comenzando por la que tiene mayor coeficiente de correlación parcial (en valor absoluto) con la variable dependiente. A diferencia de otros métodos, como forward, éste permite ir eliminando variables del modelo si éstas se convierten en “redundantes” al incorporar nuevas. Para determinar los parámetros del modelo se utiliza el estimador de Mínimos Cuadrados Ordinarios (MCO). Éste resulta de la minimización de los residuos del modelo al cuadrado.
5.4. METODOLOGÍA PARA LA VALIDACIÓN DEL MODELO Para validar el poder predictivo del modelo, se separa la muestra original en dos submuestras. Una de éstas se utiliza para la calibración del modelo y la otra para la posterior validación.
17 En el Anexo Z se puede encontrar la demostración de la que deriva esta interpretación.
27
Es decir, con la primera muestra se calibran los parámetros de la regresión y luego, a partir de las variables explicativas, se estiman los valores de la variable dependiente para la segunda muestra. Esto permite comparar las estimaciones con los valores reales y de esta forma, tener una noción de la calidad predictiva del modelo y del rango de error del mismo. Además, al separar la muestra y calibrar el modelo con mercados diferentes que los utilizados para la validación, se evitan errores de análisis de la efectividad del modelo por sobreajuste del mismo. Para conseguir resultados más robustos, este proceso de cálculo de error con muestra retenida se realiza diez veces. De esta forma, los errores de predicción calculados son el promedio de los errores obtenidos en cada una de estas diez subdivisiones.
5.5. METODOLOGÍA PARA LA COMPARACIÓN CON EL PROCEDIMIENTO ACTUAL
Se analizan tres casos de mercados que en su momento enfrentaron altas restricciones por la falta de oferta y que hoy tienen oferta directa operando. Se buscan los valores para los tamaños de los mercados estimados por Lan al momento de la evaluación de la nueva ruta y se comparan con los valores reales que han alcanzado estos mercados en su tiempo de operación, determinando el error porcentual para cada estimación pasada. Luego, se generan estimaciones para estos tres mercados utilizando el modelo creado y se obtienen los errores para el nuevo procedimiento. Para realizar las comparaciones entre el proceso actual y el nuevo modelo se calcula el MAPE (Mean Absolute Percentage Error) para cada proceso: un promedio de los errores porcentuales en términos absolutos. A continuación se presenta la expresión para el MAPE.
Ecuación 7: Expresión del error porcentual absoluto medio
Donde 𝐴! es el valor real, 𝐹! es el valor estimado y 𝑛 es el número de observaciones.
28
5.6. METODOLOGÍA PARA EL ANÁLISIS DE MERCADOS NUEVOS
Como última etapa de este trabajo, se analizan tres mercados que actualmente tienen su tamaño restringido por la falta de oferta, en base a las estimaciones arrojadas por el modelo. Para esto, se determinan tres mercados que cumplen con la condición de restricción de oferta. Luego, se reúne información respecto de las variables explicativas para estos mercados y se estiman sus tamaños, utilizando el modelo creado. Se determinan intervalos de confianza para las diferentes estimaciones y a partir de estos valores, se analiza el atractivo de los mercados en base a la magnitud de las diferencias entre mercados actuales y mercados potenciales. En particular, lo primero que se analiza es el potencial de la oportunidad de crecimiento, comparando el tamaño actual con el tamaño estimado del mercado. Así, se define que si el valor estimado supera al tamaño real, entonces éste representa un mercado nuevo no explotado con posibilidades de crecimiento. Una forma de visualizar esta comparación entre los tamaños de los mercados es a través de la Ilustración 5, en que se puede ver que todos los mercados que se encuentran sobre el margen de diferencia definido, son considerados mercados nuevos potenciales.
Ilustración 5: Definición de mercados nuevos potenciales, a través de la comparación entre
tamaños de mercados estimados y reales.18 Adicionalmente, se evalúa su atractivo en base al tamaño de mercado estimado. Para esto se definen rangos para clasificar a los mercados en tres categorías: mercados nuevos grandes, mercados nuevos medianos y mercados nuevos pequeños. Por ejemplo, para mercados grandes puede ser conveniente incorporar oferta directa, mientras que para mercados medianos puede ser mejor incorporar más oferta en conexión.
18 Fuente: Elaboración propia
29
Con esta aplicación práctica del modelo, se desea mostrar la forma en la que éste puede ser utilizado y las posibilidades de interpretación que ofrecen sus estimaciones.
6. ANÁLISIS DEL PROCEDIMEINTO ACTUAL Este capítulo tiene por objetivo describir y evaluar el procedimiento utilizado actualmente por la compañía.
6.1. DESCRIPCIÓN Y ANÁLISIS DEL PROCEDIMIENTO ACTUAL
El procedimiento actual de estimación de tamaños de mercados restringidos por la oferta es de carácter cualitativo. Consiste básicamente en tomar como referencia un mercado “similar” y ajustarlo en base a conversaciones con expertos. En particular, el evaluador de la ruta elige un mercado que considera parecido19 al que debe evaluar y realiza una serie de ajustes a partir de información externa y de conversaciones con diferentes áreas de la empresa. Estos ajustes consideran una revisión de atributos “duros”, que corresponden a aquellos que son cuantificables. Estos consisten básicamente, en modificar el valor del mercado similar, según las diferencias existentes entre éste y el mercado a estimar, en términos de PIB y tamaño poblacional. Luego, se aumenta o disminuye el número de pasajeros estimados, de forma proporcional a estas diferencias. Es decir, si el OD del mercado similar tiene una población mayor al del mercado en estudio, entonces el tamaño del mercado nuevo es el tamaño del mercado similar ajustado a la baja según la magnitud de esta diferencia en población. Una segunda etapa, considera ajustes en base a atributos “blandos”. Estos son atributos más difíciles de cuantificar, como por ejemplo, el nivel de atractivo turístico de un destino o el nivel de atractivo en términos de negocio. Debido al carácter cualitativo de los atributos, los ajustes que se realizan en esta etapa consisten en determinar en base a opiniones de expertos, las posibles diferencias entre el mercado similar y el mercado a estimar. Este proceso de ajustes para obtener la estimación de un mercado nuevo en base a otro mercado parecido demora alrededor de una semana. En este periodo se deben generar consensos entre las diferentes áreas de la empresa que participan en la evaluación de la nueva ruta, acerca de los supuestos a partir de los cuales se construye la estimación. Aunque, como se ha explicado en capítulos anteriores, para los casos en que hay escasez de oferta (como los mercados de rutas nuevas), la información histórica
19 Existe el supuesto de que determinados grupos de mercados se comportan de forma similar. Por ejemplo, mercados turísticos pueden considerarse parecidos entre sí.
30
del tamaño del mercado no es representativa, el proceso actual considera una revisión de los valores pasados de CMIDT para el OD de la ruta nueva. Es decir, se revisa la cantidad de pasajeros actuales que viajan el OD, a pesar de que se sabe que esta cantidad seguramente aumentará considerablemente al incorporar la nueva ruta. Esta revisión de los valores históricos se realiza con dos objetivos. En primer lugar, ésta tiene por objetivo verificar que el valor estimado para el mercado, obtenido a partir del mercado similar, sea consistente. Es decir, en base al flujo de pasajeros actual y a la oferta existente para la OD, se revisa si tiene sentido el nuevo tamaño de mercado. En segundo lugar, esta revisión se realiza porque, si bien la información histórica no es buena para predecir la magnitud del tamaño del mercado al incorporar oferta directa, ésta puede servir para determinar el comportamiento de los pasajeros en los diferentes periodos del año. Es decir, puede ayudar a determinar las fluctuaciones entre periodos de alta y baja demanda. En resumen, la estimación del tamaño de mercados de rutas nuevas se realiza en tres etapas. Se determina un tamaño de mercado anual a partir de un mercado similar, usando el proceso de ajustes ya descrito. Luego, se revisa la consistencia del número estimado, analizando los valores históricos del mercado nuevo y su nivel de oferta. Por último, se desagrega mensualmente según el comportamiento histórico de los pasajeros de la OD, dado por la información de CMIDT. A continuación se presenta un diagrama que describe el procedimiento actual.
31
Ilustración 6: Diagrama del procedimiento actual
Es posible realizar un análisis del procedimiento actual para determinar fortalezas y oportunidades de mejora. A continuación, se presenta una descripción de los principales aspectos positivos y de aquellos a mejorar del proceso de estimación utilizado hoy por la compañía. Fortalezas
1. Flexibilidad: El proceso actual permite tratar las diferentes evaluaciones de formas distintas, según sus requerimientos particulares. Es decir, es un proceso flexible que se puede ajustar a las necesidades de cada evaluación, permitiendo tomar en cuenta los factores de ajuste específicos que se consideren más importantes para cada OD. Por ejemplo, en caso de estimar un mercado a Cuba, se podría incorporar un factor adicional para capturar el efecto del atractivo del destino por el turismo médico.
2. Validación inter-áreas: Dado que el proceso actual tiene larga duración y
considera la interacción de diversas áreas de la compañía, una vez que éste se cierra y se obtienen las estimaciones definitivas, éstas suelen estar validadas por los diferentes negocios. Esto facilita la posterior aceptación de los resultados de la evaluación de la nueva ruta.
32
Oportunidades de mejora
1. Sistematización: El proceso actual no es sistemático y, por esta razón, existen variaciones entre una estimación y otra. Esto se traduce en que los niveles de error entre evaluaciones suelen ser muy distintos y difíciles de predecir. Además, implica que las metodologías no son replicables y por lo tanto, resulta muy difícil reproducir procesos que han dado buenos resultados en el pasado. Por lo tanto, existe la oportunidad de sistematizar este procedimiento, creando una metodología establecida para las diferentes evaluaciones.
2. Auditabilidad: Debido a las variaciones de metodología entre las diferentes
evaluaciones y al alto nivel de improvisación del proceso de estimación de mercados, resulta muy difícil rastrear de dónde provienen los resultados de evaluaciones pasadas. Esto dificulta el análisis de casos pasados e impide generar un análisis crítico de los errores en las estimaciones realizadas en evaluaciones anteriores.
3. Eliminación de sesgo: La evaluación puede verse sesgada por el juicio del
evaluador. Esto se debe a que, en general, las personas con las que se estima y valida el tamaño de los mercados tienen, muchas veces, un interés creado con respecto a los resultados de la evaluación. Por ejemplo, a veces, pueden existir incentivos para “inflar” las estimaciones de las rutas, de modo de lograr la realización de algunos proyectos por sobre otros.
4. Independencia de personas clave: El proceso actual se basa en la
opinión experta de personas clave dentro de la empresa. Es decir, es un proceso que realiza sus estimaciones a partir de conversaciones con personas que tienen un conocimiento de la industria y que, debido a sus años de experiencia, logran saber cuándo se está sobre o sub dimensionando el tamaño de un mercado. Esto hace que el proceso dependa de ciertas personas, y debido a esto, frente a la ausencia de alguna de ellas, el proceso puede verse fuertemente retrasado. Además, es una situación que genera cuellos de botella ya que muchas veces, para poder avanzar, es necesario tener en cuenta el nivel de ocupación de las agendas de los diferentes actores.
5. Posibilidad de hacer un análisis cuantitativo: Durante estos últimos 20 años, la industria del transporte y la industria aérea en particular, han experimentado grandes avances en el estudio del comportamiento de los mercados OD. Existen numerosos artículos que estudian cuantitativamente el efecto de diferentes factores sobre el tamaño de los mercados. Luego, dado que la estimación de mercados actual en la empresa es de carácter más bien cualitativo, existe la oportunidad de explorar estas herramientas y determinar si existen metodologías que se adapten mejor a sus requerimientos.
33
6. Posibilidad de hacer un evaluador de muchos pares OD: El tiempo
requerido en la estimación de cada mercado OD nuevo suele ser considerable y, por lo tanto, sólo se estiman los tamaños de estos mercados cuando se necesita evaluar un proyecto particular que involucra uno de los mercados en cuestión. A través de la utilización de un modelo, existe la posibilidad de reducir el tiempo de estimación para cada mercado y por lo tanto, de generar un evaluador de mercados nuevos que entregue, a partir de datos básicos externos, un tamaño potencial para un número considerable de mercados.
6.2. EVALUACIÓN DEL PROCEDIMIENTO ACTUAL
A fin de comparar las estimaciones arrojadas por el modelo con las estimaciones obtenidas utilizando el procedimiento actual se revisan tres evaluaciones de rutas nuevas pasadas. Es decir, se analizan tres proyectos de evaluación realizados con anterioridad para rutas en las cuales existía poca o nula oferta previa a la incorporación del nuevo vuelo y se compara el valor de las estimaciones realizadas con los valores reales alcanzados en su periodo de operación. La información de las evaluaciones pasadas sólo se pudo rastrear hasta el año 2008. Esto debido a que el disco duro más antiguo del área sólo contiene información de evaluaciones hasta este año. Además, la mayoría de las evaluaciones de proyectos consideran vuelos en mercados medianamente o completamente maduros. Es decir, son pocos los casos en que se evalúan rutas en las que los tamaños de los mercados se ven altamente restringidos por la falta de oferta. En general, se evalúa entre uno y dos proyectos de rutas de este tipo al año. Por esta razón, no fue posible contar con un número importante de evaluaciones para determinar el nivel de error del procedimiento actual. Sin embargo, el análisis de los tres casos encontrados puede servir para tener alguna noción de los errores manejados en la compañía actualmente. Las evaluaciones analizadas para la determinación del error del procedimiento actual son:
• L-S (Evaluado: Jun 2009, Operando desde: Jun 2010) • C-L (Evaluado: Jul 2009, Operando desde: Ene 2010) • L-B (Evaluado: Feb 2010, Operando desde: Ago 2010)
Los OD no se mencionan y se mantienen sólo con iníciales por temas de confidencialidad. Entre paréntesis se señala el periodo en el que se realizó la evaluación de la ruta y el mes a partir del cual está operando la oferta directa.
34
Es posible apreciar que para dos de estas rutas, no existe operación para el año 2010 completo. Luego, dado que se están analizando tamaños de mercado anuales, es necesario desagregar el valor anual de las estimaciones pasadas en los diferentes meses del año, de modo de lograr compararlas con el periodo específico para el que existe operación. Para esto, se utiliza la información de MIDT para conocer el flujo de pasajeros histórico para un año previo a la incorporación de la oferta directa. Si bien la magnitud de este flujo resulta mucho menor al actual debido a las restricciones de oferta, éste permite determinar el comportamiento mensual del tráfico de pasajeros, definiendo los periodos de alta y baja demanda. Para entender mejor este procedimiento a través del cual se desagregó la estimación anual en estimaciones mensuales, se expone como ejemplo el caso de la ruta L-S. Esta evaluación se realizó en Junio del año 2009 y, en ese entonces, se estimó que, dado el aumento en la oferta para el año 2010, se esperaría un tamaño de mercado para el OD L-S de 48.895 pasajeros. Esto significaba un aumento considerable con respecto al valor real del mercado que, en el año anterior, transportaba sólo 34.925. Es decir, en esta evaluación, se estimó que, dada la incorporación de la nueva oferta, la cantidad de personas que viajarían el OD, aumentaría en un 40% anual. Sin embargo, dado que finalmente esta ruta no operó todo el año 2010 (comenzó a operar en Junio), es necesario comparar la estimación pasada sólo para los meses en que ha existido operación directa. Luego, es necesario desagregar los 48.895 pasajeros anuales, de modo de saber cuántos de estos pasajeros asignar a cada mes. Para esto se analiza el flujo real de pasajeros en el OD para el año 2008 y se distribuyen los pasajeros estimados para el 2010 según las proporciones del tráfico de pasajeros histórico. En el gráfico siguiente es posible apreciar el tamaño del mercado 2008, desagregado mensualmente. Se puede notar que hay periodos de alta entre Junio y Agosto, y los meses de Diciembre y Enero. Asimismo, los periodos de mayor baja son los meses de Abril, Mayo y Noviembre.
35
Ilustración 7: Tamaño mensual de mercados para el año 2008.
Las cantidades que aparecen en la Ilustración 7 representan el flujo real de pasajeros para los meses del año 2008 y suman en total, 34.925. Entonces, como se tiene una estimación anual para los pasajeros del año 2010 de 48.895 y no se sabe con exactitud cómo se distribuirán estos pasajeros mensualmente, estos son repartidos según el comportamiento observado para el 2008. La distribución de pasajeros para el año 2010 se puede apreciar en el gráfico a continuación. En él se puede observar cómo ésta sigue el mismo comportamiento que la del año 2008, pero considera cantidades mayores de pasajeros para cada mes del año.
0
500
1000
1500
2000
2500
3000
3500
4000 Nº Pax
Meses
36
Ilustración 8: Tamaño mensual de mercados 2008 y proyecciones mensual para el 2010 L-S. Dado que esta ruta comenzó su operación en Junio 2010, se utiliza como periodo de comparación los meses comprendidos entre Agosto y Diciembre 2010 (Junio y Julio se excluyen porque son considerados meses de adaptación a la nueva oferta). Según esta distribución, los pasajeros estimados para este periodo son 20.055. Revisando la información de Complemento MIDT (CMIDT) para el mismo periodo, se puede observar que el número real de pasajeros con OD entre Agosto y Diciembre 2010 fue de 30.527 Luego, existe una diferencia de 10.472 pasajeros entre el valor de mercado estimado y el real. Esto representa un error porcentual de 52,2%. Análogamente, se realizó un procedimiento similar al utilizado para el mercado L-S, para L-B. Para el mercado C-L no fue necesario realizar este ajuste mensual, ya que la ruta operó durante todo el año 2010. De esta forma, se obtuvo que para el OD C-L, la estimación del mercado para el año 2010 fue de 31.020 y su valor real fue de 33.031. Es decir, hubo una diferencia de 2011 pasajeros y un error porcentual de 6,5%. Por otro lado, para el OD L-B, se estimó un mercado de 4.291 pasajeros entre los meses de Septiembre y Diciembre 2010, mientras que su valor real para este periodo fue de 7.870. Por lo tanto, se tuvo un error porcentual de 45,5%.
0
1000
2000
3000
4000
5000
6000
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2008
2010
Nº Pax
Meses
37
Según esto, se puede calcular el MAPE para el procedimiento actual como el promedio de los errores porcentuales absolutos de cada uno de estos casos.
𝑀𝐴𝑃𝐸 𝑎𝑐𝑡𝑢𝑎𝑙 = 34,7%
Ecuación 8: MAPE procedimiento actual Si bien, el número de comparaciones realizadas no permite hacer afirmaciones categóricas acerca del nivel de error del procedimiento actual, sí entrega nociones acerca de la calidad de las estimaciones y del alto nivel de variación que existe entre los resultados de una evaluación y otra. En particular, es posible notar que el nivel de error varía en un amplio rango, entre 6,5% y un 52,2%. Llama la atención el caso C-L, ya que presenta un error considerablemente menor que las otras dos estimaciones. Sin embargo, se sospecha que este mercado es un caso particular, ya que Lan tiene una participación del 98% en él. Es decir, la gran mayoría de los pasajeros que vuela ese Origen-Destino lo hace con la compañía. Luego, el tamaño del mercado depende directamente de las acciones de la empresa.
7. DESARROLLO DEL MODELO Este capítulo tiene por objetivo mostrar el modelo de estimación de mercados propuesto en esta memoria y entregar un resumen del proceso a través del cual se desarrolla el modelo definitivo. Se presentan los datos utilizados para la calibración del modelo, se describen las variables tentativas a testear en la regresión, se analizan sus correlaciones y se definen sus formas funcionales. Con el fin de determinar la forma funcional que mejor se ajusta a los datos, se evalúan los tres tipos de modelos descritos en el Capítulo 5.3: modelo lineal, modelo gravitacional y modelo log-log. Sólo se presentan las expresiones para las últimas regresiones seleccionadas de cada tipo. Sin embargo, para obtener estos modelos se analizaron regresiones previas cuyas expresiones e indicadores de ajuste se pueden encontrar en la sección de Anexos. En particular, las regresiones previas permitieron detectar los casos outliers de la muestra y testear posibles ajustes sobre las variables explicativas. En el Anexo G se pueden encontrar los casos considerados outliers y el procedimiento utilizado para su detección. En el Anexo H se encuentra el detalle de los ajustes testeados.
38
7.1. DATOS La selección de la muestra se determinó según las tres condiciones explicadas en el Capítulo 5.2. A continuación se detalla, para cada una de estas condiciones, los filtros que se aplicaron para definir la muestra.
1. Disponibilidad de información: Debido a la restricción de disponibilidad de información, se definió que la muestra estaría compuesta por OD conformadas por ciudades que se encontraran dentro del continente americano, tanto ciudades de Latinoamérica como de EEUU20. De esta forma, se asegura la disponibilidad de datos MIDT para el tamaño de los mercados y, gracias a la existencia de institutos de estadísticas establecidos y censos poblacionales para los países que componen la muestra, se asegura también la disponibilidad de estadísticas. Además, como se desean usar los tamaños de los mercados obtenidos a través de Complemento MIDT (CMIDT) para calibrar el modelo, es necesario que los mercados elegidos para este análisis sean de interés para Lan, de modo de asegurar que estos valores hayan sido revisados y validados.21 Luego, éste también fue un factor determinante en la definición de la muestra, ya que actualmente LAN tiene una importante participación en los mercados del Regional, y por lo tanto, es más probable que los valores de CMIDT hayan sido revisados para estos OD. De esta forma, en la primera muestra se tomaron todas las combinaciones de las 50 ciudades más importantes en términos de PIB y población de América Latina.22 Esto determinó una muestra inicial de 1225 pares de OD. De esta muestra inicial se seleccionaron sólo aquellos mercados que pertenecían a los diez principales mercados entre el país de origen y de destino de la OD, Es decir, los diez mercados con mayor tráfico de pasajeros entre los dos países para el año 2010. Con esto, la muestra se redujo a 127 OD.
2. Selección de mercados maduros: Se definió que una buena forma de seleccionar mercados maduros era que éstos cumplieran con las siguientes características:
• Mercados que tuvieran oferta directa • Mercados con al menos dos competidores • Mercados con al menos 25.000 pasajeros anuales
20 Sólo Miami. 21 Esto porque, dado que el proyecto de Complemento MIDT todavía está en desarrollo y pueden existir algunos mercados cuyos tamaños no estén bien definidos y que no han sido revisados. 22 Listado de las 50 ciudades ranking de competitividad urbana 2010, América Economía. Incluye Miami.
39
Para determinar el número de competidores de los mercados se ordenaron, para cada uno, las aerolíneas de forma decreciente según participación de mercado. Se eliminaron las líneas aéreas que tenían menos de un 10% de participación de mercado, a fin de asegurar que los competidores fueran significativos.
3. Exclusión de casos particulares: Se distinguieron dos casos de tipos de
mercados que podían tener comportamientos diferentes al general: aquellos en los que los medios de transporte sustitutos juegan un rol importante y aquellos mercados que son netamente turísticos. Para eliminar el primero de estos tipos de mercado se determinó que en la muestra sólo hubieran OD con distancias superiores a 500 km. Los diferentes análisis parecen indicar que la posibilidad de transporte sustituto en mercados internacionales se reduce considerablemente a partir de los 500-600 km. En particular, Grosche et al. (2007) postula como distancia razonable 500 km para el desarrollo de su modelo. Por otro lado, los mercados netamente turísticos suelen comportarse diferente al resto de los mercados. Por ejemplo, consideremos el caso Santiago (SCL) - Punta Cana (PUJ) y que una de las variables explicativas del modelo es el producto de los PIB per cápita de los países de la OD. En general, el PIB per cápita está relacionado con la capacidad adquisitiva de los pasajeros y, por lo tanto, tiene un efecto importante al determinar el tamaño de un mercado. Sin embargo, si vemos el caso de PUJ, es posible que el PIB per cápita de los habitantes de República Dominicana no sea tan determinante para predecir la cantidad de viajes que se generan desde o hacia esta ciudad. Por otro lado, para este destino quizás sea necesario incluir una variable adicional al modelo como el número de playas o algún otro proxy para capturar en la estimación el atractivo de este tipo de destinos.
Aplicando estas tres condiciones, se obtuvo la muestra definitiva consistente en 53 pares OD. A continuación se presenta un listado con los mercados de la muestra. Los OD están representados por el código de las ciudades de origen y de destino. Para cada ciudad existe un código IATA único de tres letras. En el Anexo B se puede encontrar el significado de cada código.
Tabla 2: Listado de OD de la muestra
1. BOGPTY 12. LIMSAO 23. LIMMDE 34. BOGBUE 45. SCLUIO
2. BOGSAO 13. PTYSJO 24. LIMMEX 35. MIAMVD 46. CCSLIM
3. CCSPTY 14. MEXUIO 25. BOGSJO 36. LPBSCL 47. BUELIM
4. BOGMEX 15. BOGGYE 26. BOGSCL 37. MDEUIO 48. LIMUIO
5. BOGUIO 16. MDEMIA 27. BUESAO 38. GYEMIA 49. BOGLIM
6. LIMMIA 17. LIMLPB 28. ASUBUE 39. CCSMIA 50. ASUSCL
40
7. LIMMVD 18. LIMSDQ 29. BUESCL 40. BUEMEX 51. BUERIO
8. MVDSCL 19. CCSUIO 30. BUESSA 41. CLOMIA 52. CCSSAO
9. MEXSCL 20. MIAUIO 31. MIAPTY 42. CCSSCL 53. GYELIM
10. GUASJO 21. BUEREC 32. BUEGYE 43. MIASCL 11. BOGMIA 22. CCSMDE 33. CCSMEX 44. BUEUIO
Para ampliar el tamaño de la muestra y dado que para las variables significativas existe información adicional para los años 2009 y 2010, se incluyeron en la calibración del modelo definitivo 106 observaciones. Es decir, se consideraron dos observaciones para cada par OD; una con los valores del año 2009 y otra con los del año 2010.
7.2. VARIABLES TENTATIVAS
El modelo considera una variable dependiente y diez potenciales variables explicativas. Como variable dependiente se toma el número total de pasajeros que viajan por OD anualmente. Para esto, se utiliza la información de CMIDT que contiene datos para los años 2008, 2009 y 2010.23
Tabla 3: Variable dependiente.
N° Nombre Descripción Unidad Fuente Años disp.
1 Tij N° de pasajeros que vuelan la OD ij en un periodo de tiempo.
# de pax CMIDT 2008, 2009, 2010
Las variables explicativas pueden clasificarse en indicadores generales, indicadores del atractivo de negocio, indicadores del atractivo turístico, indicadores del atractivo étnico y variables internas.
Tabla 4: Variables explicativas. Indicadores generales.
N° Nombre Descripción Unidad Fuente Años disp. 1
Dij
Distancia geográfica entre la ciudad i y la ciudad j de la OD ij.
Kms.
GCMap
N/A
2
Pi Población del conglomerado urbano en torno a la ciudad i.
# de hab. América Economía
2009, 2010
3 Ai Tráfico de pasajeros en los aeropuertos de la ciudad i.
# de pers. CMIDT
2009, 2010
4 Gi PIB per cápita de los habitantes de la ciudad i.
US$ América Economía UN
2009, 2010
23 La información para el año 2008 no ha sido revisada por la compañía y puede contener errores.
41
Tabla 5: Variables explicativas. Indicadores de atractivo de negocio. N° Nombre Descripción Unidad Fuente Años disp. 5
Eij
Suma de las importaciones y exportaciones entre los países a los que pertenecen i y j.
MM US$
Varias24
2008, 2009, 2010
6 Ii Índice que califica a la ciudad i según su potencial de negocios.
# entre 1 y 100
América Economía
2009, 2010
7 Si Tasa de desempleo de la ciudad i. Porcentaje América Economía
2009, 2010
Tabla 6: Variables explicativas. Indicadores de atractivo turístico. N° Nombre Descripción Unidad Fuente Años disp. 8
Ui
Gasto gubernamental en la industria del turismo del país al que pertenece la ciudad i.
MM US$
World Economic Forum
2010
Tabla 7: Variables explicativas. Indicadores de atractivo étnico N° Nombre Descripción Unidad Fuente Años disp. 9
Xij
Suma de los extranjeros del país de la ciudad i que residen en el país de la ciudad j y de los extranjeros del país de la ciudad j que residen en el país de la ciudad i ajustada según el tamaño de la ciudad.
# de hab.
CELADE
2010
Tabla 8: Variables explicativas. Variables internas N° Nombre Descripción Unidad Fuente Años disp. 10
Fij
Tarifa media de un ticket aéreo entre la ciudad i y la ciudad j.
US$
Tarifas Profit
2009, 2010
Para todas las variables, existe información disponible para el año 2010. Para sólo algunas de ellas existen datos adicionales para los años 2009 y 2008. En el Anexo C se puede observar el detalle para cada una de estas variables.
24 En el Anexo AA se puede encontrar el detalle de las fuentes de información utilizadas para esta variable.
42
A continuación se puede encontrar una tabla con los estadísticos descriptivos de las variables mencionadas, para el año 2010. En particular, se detalla la media, el máximo, el mínimo y la desviación estándar para cada variable.
Tabla 9: Estadísticas descriptivas de las variables.
Tij Dij Eij Xij Fij Pi Ai Gi Si Ii Ui
Media 152.944 2.840 5.695 15.503 317 7,08 3,107 10.970 8,64 74,30 80.978
Min 25.068 537 111 183 101 1,20 0,167 1.664 4,40 53,80 1.351
Max 1.100.000 7.391 26.901 154.391 1073 20,00 8,008 39.749 13,90 100,00 734.188
Desv. Est. 197.291 1.709 8.460 28.566 202 5.34 2.137 9.751 2,14 13,50 201.870
En el Anexo D se encuentran algunas aclaraciones respecto a ciertas variables tentativas, ya sea porque éstas son el producto de algún ajuste (como Gi y Xi) o porque su inclusión en el modelo no resulta intuitivo y puede ser útil explicar la razón por la que se decidió incluirla (como Ai).
7.3. FORMAS FUNCIONALES Y CORRELACIONES Las variables Pi, Ai, Gi, Ii, Si y Ui expresan características de ciudades, no de pares OD. Por ejemplo, la variable Pi indica la población de una ciudad y tomará el mismo valor para todas los OD que incluyan esta ciudad. En cambio, la variable 1 representa la distancia para un OD y toma un valor particular para cada mercado. Basado en la metodología utilizada por Rengaraju & Thamizh Arasan (1992) y Grosche, Rothlauf & Heinzl (2007), se decidió testear dos formas funcionales para combinar las variables de ciudades y, de esta forma, generar una variable común para el OD. Las formas funcionales testeadas son aquellas que se detallan en el Capítulo 5.3. Para cada caso, se elige la forma funcional que tiene mayor correlación con la variable dependiente. Según esto, las formas funcionales elegidas son las que se presentan a continuación. En el Anexo E se pueden encontrar las correlaciones entre la variable dependiente y las diferentes formas funcionales de las variables explicativas.
Tabla 10: Formas funcionales variables por ciudades.
Variable Forma funcional Pij PiPj Aij AiAj Gij Gi+Gj Iij Ii+Ij Sij Si+Sj Uij UiUj
43
Otro aspecto importante a analizar son las correlaciones entre variables explicativas. Esto debido a que altas correlaciones entre variables independientes pueden llevar a problemas de colinealidad en el modelo y dificultar la posterior interpretación de los parámetros. A continuación se presenta la matriz de correlaciones.
Tabla 11: Correlaciones entre variables explicativas.25
Dij Fij Eij Xij Pij Aij Gij Sij Iij Uij Dij 1
Fij 0,8570 1
Eij 0,0340 -0,0994 1
Xij -0,1342 -0,1930 0,2782 1
Pij 0,3883 0,3106 0,1620 -0,0927 1
Aij 0,1676 0,2223 0,1997 0,1766 0,5819 1
Gij 0,3688 0,2082 0,5836 0,3862 0,0118 0,1882 1
Sij -0,0390 -0,1071 0,2845 0,3090 -0,3706 -0,2214 0,4459 1
Iij 0,4573 0,3377 0,4674 0,2631 0,3908 0,3884 0,7723 0,1253 1
Uij 0,2043 0,0785 0,5943 0,3254 -0,0909 0,0770 0,8289 0,5919 0,5412 1
Se analizan las correlaciones para evitar problemas por colinealidad, ya que al incluir simultáneamente 2 o más variables correlacionadas entre sí en un modelo, resulta imposible realizar interpretaciones sobre los parámetros. Aunque la colinealidad no repercute necesariamente en el ajuste de la regresión, en este trabajo se busca analizar el efecto de los diferentes factores sobre la estimación y, por lo tanto, no se incluyen variables altamente correlacionadas en un mismo modelo. En particular, se analizan los casos en los que la correlación es superior a 0,6. Se puede apreciar que las variables Dij y Fij se encuentran altamente correlacionadas. Es decir existe una importante relación entre la distancia y la tarifa de un mercado. Para mitigar este efecto y eventualmente, poder incluir ambas en el modelo, se definió una nueva variable para capturar el efecto del precio en el tamaño de un mercado: el yield. El yield se define como la tarifa promedio por kilómetro volado y se obtiene dividiendo la variable Fij por Dij. De esta forma, definimos la variable Yij como el yield medio de un ticket aéreo para volar desde la ciudad i a la ciudad j. Así, la correlación entre esta nueva variable y la variable distancia pasa a tener un valor
25Dado que las variables tienen información disponible para diferentes años, estas correlaciones se calcularon para la data un año común (2010).
44
de -0.4225. En el Anexo F se puede apreciar la correlación entre yield y el resto de las variables explicativas. Otro caso que presenta alta correlación es la variable Gij con las variables Iij y Uiij. Es decir, el PIB per cápita de las ciudades está fuertemente relacionado con el atractivo en términos de negocio de las ciudades y el gasto gubernamental en la industria del turismo de los países a los que pertenecen. Para evitar problemas de colinealidad, se evitará incluir estas variables de forma simultánea en el modelo de estimación.
7.4. MODELO LINEAL
El primer modelo a evaluar es el lineal. Para su evaluación se realizaron varias regresiones. La primera considera una muestra inicial de 53 observaciones (datos para el año 2010 solamente) y selecciona, mediante el método stepwise, las variables que son significativas al 5%. El detalle de esta primera regresión lineal (RL1) se encuentra en el Anexo I. A partir de esta regresión se determina que sólo cuatro variables son significativas al nivel de confianza establecido: la distancia (Dij), la población (Pij), la población viajante (Aij) y el PIB per cápita (Gij). Dado que las variables significativas consideradas en esta regresión presentan datos para dos años se amplía la muestra original a 106 observaciones, incluyendo los datos para el año 2009. Los detalles de esta segunda regresión lineal (RL2), calibrada con esta muestra ampliada, se pueden encontrar en el Anexo J. Eliminando los casos outliers, se obtiene una muestra definitiva de 102 observaciones y se reduce el MAPE del modelo en un 3%. De esta forma, se obtiene la regresión lineal que se presenta a continuación (RL3).
Tabla 12: RL3. Regresión lineal 3. Expresión Indicadores
𝑻𝒊𝒋 = 𝟒𝟓.𝟕𝟔𝟐,𝟕𝟒𝟎 − 𝟓𝟓,𝟓𝟕𝟗 𝑫𝒊𝒋 + 𝟕𝟖𝟕,𝟒𝟐𝟗 𝑷𝒊𝒋 + 𝟏𝟒.𝟎𝟕𝟎,𝟐𝟖𝟎 𝑨𝒊𝒋 + 𝟓,𝟒𝟒𝟓 𝑮𝒊𝒋 R2 aj. : 0,78
MAPE: 55%
La tabla resumen para la regresión RL3 se puede encontrar en el Anexo K.
45
El R2 ajustado para esta regresión es de 0,78 y su MAPE de 55%. Los signos de los coeficientes que acompañan a las variables significativas son consistentes con lo esperado, siendo el tamaño del mercado inversamente proporcional a la distancia y directamente proporcional al tamaño poblacional, a la población viajante y al PIB per cápita de la ciudad.
7.5. MODELO GRAVITACIONAL El segundo modelo a testear es el modelo gravitacional. De la misma forma que para el modelo lineal, se realizaron tres regresiones: una con la muestra reducida de 53 observaciones para determinar las variables significativas (RG1), una con la muestra completa de 106 observaciones (RG2) y una con la muestra definitiva sin outliers, de 102 observaciones (RG3). El detalle para las regresiones RG1 y RG2 se puede encontrar en los Anexos L y M respectivamente. Dado que para modelos no lineales no es posible aplicar la función stepwise para la selección de variables, se seleccionan las variables significativas de forma manual. Es decir, se hace una regresión inicial con la totalidad de las variables y se van eliminando progresivamente del modelo las que presentan un nivel de significancia inferior al 5%. De esta forma, se determina que las variables explicativas a considerar para el modelo gravitacional son las mismas que las del caso lineal. Mediante la eliminación de casos outliers se logra reducir el MAPE del modelo gravitacional en 4 puntos porcentuales. A continuación se presenta la expresión para RG3, la regresión gravitacional calibrada con la muestra definitiva.
Tabla 13: RG3. Regresión gravitacional 3. Expresión Indicadores
𝑻𝒊𝒋 = 𝟓.𝟎𝟔𝟐,𝟓𝟗𝟓 𝑫𝒊𝒋!𝟎,𝟗𝟐𝟏 𝑷𝒊𝒋
𝟎,𝟏𝟖𝟖𝑨𝒊𝒋𝟎,𝟓𝟑𝟒𝑮𝒊𝒋
𝟎,𝟖𝟗𝟑 R2 aj. : 0,94
MAPE: 36%
La tabla resumen para la regresión RG3 se puede encontrar en el Anexo N. El R2 ajustado para esta regresión es muy alto, de 0.95, pero resulta común encontrar altos valores de R2 para funciones no lineales de este tipo.26
26 Ver en la Tabla 1 los valores de R2 para otros modelos gravitacionales.
46
Su MAPE es de un 36%: nueve puntos porcentuales menos que el MAPE obtenido para el caso lineal. Al igual que en el modelo lineal, los signos de los coeficientes resultan consistentes con lo esperado, siendo sólo la distancia inversamente proporcional a la variable dependiente.
7.6. MODELO LOG-LOG El último modelo a testear es el modelo log-log. De la misma forma que para los modelos anteriores, se realizaron tres regresiones: una con la muestra reducida (RLog1), una con la muestra completa (RLog2) y una con la muestra definitiva sin outliers (RLog3). El detalle para las regresiones RLog1 y RLog2 se puede encontrar en los Anexos O y P respectivamente. Análogamente al caso lineal, se determinaron las variables significativas utilizando el método stepwise a partir de la regresión RLog1. Al igual que en los modelos anteriores, las variables significativas al 5% resultaron ser Dij, Pij, Aij y Gij. La eliminación de los casos outliers permite reducir el MAPE del modelo log-log en 0,24 puntos porcentuales. A continuación se presenta la expresión para RLog3, la regresión log-log calibrada con la muestra definitiva.
Tabla 14: RLog3. Regresión log-log 3.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟑𝟏𝟑 − 𝟏,𝟎𝟓𝟎 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟒𝟏 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟐𝟐 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟖𝟕𝟒 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,82
MAPE: 2,43%
MAPE2: 29%
La tabla resumen para esta regresión se puede encontrar en el Anexo Q. Se puede observar que el R2 ajustado tiene un valor de 0,82. Aunque este valor es menor que el obtenido en la regresión gravitacional, no es posible comparar ambos modelos en base a este indicador, ya que estas regresiones tienen diferentes variables dependientes: el modelo lineal considera como variable
47
dependiente Tij, mientras que el modelo log-log considera al logaritmo natural de Tij .27 Por otro lado, llama la atención el valor del MAPE que resulta significativamente menor que para los otros dos modelos. Sin embargo, este MAPE representa el nivel de error del logaritmo del tamaño del mercado (Tij). Luego, para obtener un indicador que pueda ser utilizado para comparar los niveles de error de los diferentes modelos, se calcula un nuevo MAPE (MAPE2) sobre la transformación de las estimaciones realizadas en base a esta regresión. Es decir, dado que el modelo estima el logaritmo de la cantidad de pasajeros, se calcula el tamaño de mercado aplicando la función exponencial sobre esta estimación. Sobre estos valores se calcula el error porcentual con respecto a los pasajeros reales y de esta forma, se obtiene un MAPE2 de 29%. Por último, se puede señalar que, al igual que en los casos anteriores, los signos de los parámetros de este modelo son consistentes con lo esperado.
7.7. SELECCIÓN Y VALIDACIÓN DEL MODELO DEFINITIVO Al analizar los diferentes modelos testeados, se opta por tomar como modelo definitivo el modelo de la regresión RLog3. Éste corresponde a un modelo de tipo log-log, calibrado con la muestra extendida que excluye los dos casos outliers (102 observaciones). La expresión y los principales indicadores de ajuste de este modelo pueden observarse en la Tabla 14. Este modelo considera cuatro variables significativas: la distancia (Dij), la población (Pij), la población viajante (Aij) y el PIB per cápita (Gij). Se puede deducir entonces, que el flujo de pasajeros está relacionado con los factores que se analizan a continuación. En primer lugar, la presencia de las variables de población (Pij y Aij) indica que la cantidad de viajes que se producen entre dos ciudades se relaciona, por un lado, con su cantidad de habitantes (reflejada por Pij) y, por otro, con la cantidad de personas de localidades aledañas que viajan a través de ellas (reflejada por Aij). Esto resulta lógico ya que es natural suponer que a mayor población de una ciudad y sus alrededores, mayor es la cantidad de viajes que se originan de ella. También resulta esperable la presencia de la variable PIB per cápita, ya que ésta se relaciona con el poder adquisitivo de los habitantes de las ciudades del mercado y es lógico que a mayor poder adquisitivo, mayor sea la cantidad de viajes que éstos realizan.
27 El R2 ajustado no es comparable en regresiones con diferentes variables dependientes. Stock J., Watson M. Introduction to Econometrics. Pp. 274.
48
Por último, la variable distancia indica que, a medida que dos ciudades se alejan, la cantidad de viajes disminuye. Esto se explica por dos razones. La primera es que, en general, mientras más alejadas están las ciudades, menos comunicación existe entre ellas. La segunda es que la variable distancia está directamente relacionada con la tarifa de los pasajes. Luego, a mayor distancia, más costoso es el viaje y en consecuencia, existen menos personas viajando en el mercado. Según lo descrito en el Capítulo 5.3, sobre los parámetros de este modelo log-log se pueden realizar las siguientes interpretaciones.
• Un aumento de un 1% en la distancia entre dos ciudades se traduce en una disminución de un 1,050% en la cantidad de viajes.
• Un aumento de un 1% en el producto de las poblaciones de las ciudades
implica un aumento de 0,341% en la cantidad de viajes. Es decir, un aumento de un 1% sobre la población de cualquiera de las ciudades del mercado implica un crecimiento de 0,341% en su tamaño.
• Un aumento de un 1% en el producto de las poblaciones viajantes de las
ciudades implica un aumento de 0,422% en la cantidad de viajes. Es decir, un aumento de un 1% sobre la población viajante de cualquiera de las ciudades del mercado implica un crecimiento de 0,422% en su tamaño.
• Un aumento de un 1% en la suma de los PIB per cápita de las ciudades
implica un aumento de 0,874% en la cantidad de viajes.
La regresión presenta un MAPE de 2,43%. Esto quiere decir que, en promedio, el error porcentual absoluto de las estimaciones entregadas por el modelo es de esta magnitud. Para observar la variabilidad y dimensión de los residuos de esta regresión, se presenta el siguiente gráfico de dispersión. En él se observan los valores reales de los mercados (en el eje Y) en relación a los valores estimados (en el eje X) y una línea de regresión que permite observar la bondad de ajuste de los datos.
49
Ilustración 9: Mercados estimados y observados.
Las estimaciones parecen ajustarse bien a los valores reales y el MAPE es bastante bajo. Sin embargo, debido a que el modelo estima el logaritmo de la variable tamaño del mercado (Tij) y no la variable misma, hay que considerar que el error asociado a la transformación exponencial de la estimación es mayor, alcanzando un 29% (MAPE2).
Al analizar los residuos del modelo, se puede apreciar éstos tienen una distribución Normal de media 0 y desviación estándar de 0,36. Esto es importante, ya que es uno de los supuestos que debe cumplirse para que el estimador MCO sea insesgado y eficiente. En el Anexo R se puede encontrar el histograma de los residuos, su test de normalidad y sus estadísticos descriptivos.
Para validar la calidad predictiva del modelo y verificar que el modelo no está sobreajustado a los datos de la muestra, se realizan diez calibraciones con muestra retenida según la metodología descrita en el Capítulo 5.4. Para esto, se divide la muestra inicial en dos submuestras de forma aleatoria: una de calibración con 35 mercados (70 observaciones) y una de validación con 16 mercados (32 observaciones). Con la primera de estas muestras se calibra un modelo de estimación y con este modelo, se predicen los mercados de la segunda muestra. Luego, se determina el nivel de error promedio de las estimaciones (MAPE) y de su transformación exponencial (MAPE2). Este procedimiento se ejecuta diez veces, de modo de obtener diez modelos, diez valores para el MAPE y diez valores para el MAPE2. El detalle de estos modelos y sus indicadores se encuentran en el Anexo S.
50
Luego, se determina el error de la predicción como el promedio de los MAPE obtenidos en cada una de estas iteraciones.
𝑀𝐴𝑃𝐸 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑣𝑎𝑙𝑖𝑑𝑎𝑐𝑖ó𝑛 = 2,65%
Ecuación 9: MAPE promedio validación
𝑀𝐴𝑃𝐸2 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑣𝑎𝑙𝑖𝑑𝑎𝑐𝑖ó𝑛 = 30%
Ecuación 10: MAPE2 procedimiento actual Cuando se comparan estos valores, con los MAPE obtenidos para la muestra completa de la Tabla 14 (MAPE que se calcularon usando la misma muestra que se utilizó para la calibración), se puede notar que éstos son sólo levemente mayores. En particular, el MAPE presenta una diferencia de 0,22% y el MAPE2, de 1%. Luego, se puede deducir que el modelo calibrado con la regresión completa no presenta problemas por sobreajuste.
8. COMPARACIÓN CON EL PROCEDIMIENTO ACTUAL Con el fin de comparar el modelo diseñado con el procedimiento actual ambos se analizan en cuatro dimensiones: exactitud, sesgo, sistematización y tiempo que demora el procedimiento. Para comparar la exactitud de las estimaciones entregadas por ambos procedimientos, se analizan sus MAPE. En el Capítulo 6.2, se determina un MAPE de 34,7% para el procedimiento actual. Luego, dado que el MAPE para el modelo creado es de un 29%, se establece que su nivel de exactitud promedio es levemente mejor. Sin embargo, aunque el promedio de los errores del modelo es menor, es necesario señalar que su rango de variación es mayor que para el procedimiento actual. En particular, en las 102 estimaciones realizadas con el modelo, se obtuvieron 4 con errores superiores al 100% y un error máximo de 131%.28 A continuación se presenta un gráfico en el que se pueden observar las magnitudes de los residuos para las estimaciones obtenidas con el modelo. En él se puede ver que alrededor de un tercio de los casos presenta errores superiores al 35%.
28 El error máximo se obtuvo para el mercado BOG-SAO 2010 y las otras tres estimaciones con errores superiores al 100% corresponden a ASU-SCL 2010, LIM-MVD 2010 y MIA-PTY 2009. El detalle de los errores en las estimaciones realizadas con el modelo se puede revisar en el Anexo T.
51
Ilustración 10: Errores porcentuales sobre las estimaciones del modelo.
Al comparar las magnitudes de los errores de los dos procedimientos, es necesario considerar que los valores estimados por la compañía antes de abrir una nueva ruta sirven para fijar sus metas de venta. Por lo tanto, un buen ajuste de las estimaciones pasadas puede deberse en parte a los esfuerzos realizados posteriormente por la fuerza de venta y no necesariamente a la calidad de la estimación. Además, como los encargados de cumplir con las metas de ventas participan del proceso de estimación de mercados actual, pueden existir incentivos para disminuir los tamaños estimados por temor a fijar metas demasiado altas. Es decir, el procedimiento actual puede estar sujeto a sesgo, dado que las personas que participan de él tienen intereses creados respecto a las estimaciones resultantes. Además, a pesar de que el MAPE mejora levemente con el modelo, se considera que éste sigue siendo alto y que, por lo tanto, es deseable complementar los resultados arrojados por este modelo con otros elementos, a fin de obtener errores más bajos. Cuando se utiliza el modelo para predecir los mismos mercados analizados en la determinación del MAPE del proceso actual (para los mismos periodos), se obtienen los siguientes valores.
0%
20%
40%
60%
80%
100%
120%
140% Error (%)
Mercados
52
Tabla 15: Comparación errores L-S, C-L, L-B.
Mercado Error porcentual absoluto actual Error porcentual absoluto modelo
L-S 52,2% Subestimación 24.4% Subestimación
C-L 6,5% Subestimación 21.4% Sobreestimación
L-B 45,5% Subestimación 102.3% Sobreestimación
Es posible observar que para los tres casos analizados, el procedimiento actual subestima los mercados. Es decir, la cantidad de pasajeros resulta ser mayor en la realidad que en la estimación. Esto podría indicar la presencia de algún sesgo en el proceso actual. Sin embargo, debido a que sólo se dispone de tres casos para el análisis, no es posible afirmar la existencia de este sesgo. De existir, el nuevo modelo podría eliminar este efecto ya que se trata de un estimador insesgado. En particular, en el Anexo R se demuestra que los residuos de las estimaciones del modelo siguen una distribución normal con media cero. Por otro lado, existe la posibilidad de que la tendencia a la subestimación observada, se deba a que los mercados estimados podrían estar ajustados a la magnitud de la oferta disponible y no representen necesariamente los mercados potenciales sin restricciones de oferta. Por ejemplo, el mercado L-S puede haber sido estimado considerando que sólo un 40% de la oferta nueva estaría dedicada a pasajeros de tercera y cuarta, y un 60% a pasajeros de sexta. Por lo tanto, su tamaño puede haber estado sujeto a una restricción dada por la cantidad de asientos disponibles para el OD. Luego, cuando existe esta restricción y la cantidad de pasajeros de sextas resulta ser menor a lo esperado, la cantidad de asientos dedicados reales aumenta y la cantidad real de pasajeros del OD puede resultar mayor a la estimación sin que esto se deba necesariamente a errores en el proceso estimativo. Al analizar cada caso en forma particular y comparar la exactitud de las estimaciones, se puede notar que en dos mercados, C-L y L-B, el procedimiento actual presenta errores menores que los arrojados por el modelo. Para el caso de C-L, el modelo arroja un error de 21,4% y aunque éste es superior al error de la estimación pasada, es menor que el MAPE de la regresión. Por lo tanto, es un nivel de error esperable, dadas las características del modelo. Sin embargo, para el caso L-B el error es muy superior al MAPE del modelo, alcanzando un 102,3%. Como ya se mencionó, en la determinación del MAPE para la regresión sólo cuatro casos presentaron errores superiores al 100%, es decir, sólo un 4% de las estimaciones tuvo errores de esta magnitud. Además, se puede señalar que para mercados pequeños el error porcentual del modelo suele ser mayor, ya que cada pasajero de error, representa un mayor porcentaje del mercado total. En particular, de los tres casos analizados en la
53
Tabla 15, L-S es el mercado de menor tamaño, ya que tiene alrededor de 8.000 pasajeros para el periodo analizado, mientras C-L y L-B tienen más de 30.000. Debido a que, en casos específicos, el modelo puede arrojar errores muy altos, como el caso L-B, cuando éste se utilice en el proceso de estimación de mercados es necesario considerar una etapa posterior de revisión de las estimaciones. En síntesis, aunque el nivel de exactitud de las estimaciones no mejora significativamente con el modelo, existen ventajas asociadas a las otras tres dimensiones de comparación mencionadas al inicio de este capítulo. En primer lugar, el modelo elimina el sesgo en la estimación. Es decir, ésta ya no se ve influenciada por los intereses de los evaluadores. En segundo lugar, este nuevo mecanismo de estimación es sistemático y auditable, ya que consiste en un modelo único que puede ser aplicado a diferentes mercados y permite rastrear de dónde provienen los resultados que entrega. Por último, el modelo permite obtener de forma prácticamente instantánea una estimación gruesa de los mercados que se quieren evaluar. Luego, éste permite reducir el tiempo dedicado al proceso de estimación de nuevos mercados. A continuación, se encuentra una tabla resumen en la que se califican a los procedimientos en cada una de las cuatro dimensiones de comparación. Se ha marcado con una cruz cuando la metodología tiene falencias en una dimensión, con un check completo, cuando ésta cumple de manera satisfactoria lo esperado y con un check intermedio, cuando ésta dimensión no cumple las expectativas en su totalidad, pero se acerca a lo esperado.
Tabla 16: Comparación entre proceso actual y modelo
Dimensión Proceso actual Modelo nuevo
Exactitud
Sesgo
Sistematización
Tiempo
9. EVALUACIÓN DE MERCADOS RESTRINGIDOS A partir de la metodología creada en esta memoria es posible estimar el tamaño potencial de mercados que hoy se encuentran restringidos por la oferta. Esto permite determinar posibles oportunidades de negocio en mercados no explotados.
54
En este capítulo se analizan tres mercados restringidos, en base al tamaño potencial estimado por el modelo. Sin embargo, es importante señalar que este análisis tiene por objetivo mostrar la aplicabilidad del modelo y no considera una evaluación acabada de los mercados en cuestión. En particular, se analizan mercados entre SCL y tres importantes ciudades de Brasil: Curitiba (CWB), Belo Horizonte (BHZ) y Porto Alegre (POA). Para estas estimaciones se utilizan los datos del año 2010.29 Es decir, las variables explicativas población, población viajante y PIB per cápita toman los valores correspondientes para este periodo. En el Anexo U se pueden encontrar los datos para estos tres mercados. Estas ciudades son muy importantes a nivel latinoamericano30. Sin embargo, en ninguno de estos OD existe oferta directa en la actualidad. Además, Brasil tiene alrededor de 11 millones de viajantes internacionales al año, siendo país con más viajes de la región, y la reciente fusión con la línea aérea Tam abre las puertas a Lan para entrar en este atractivo mercado. De esta forma, al evaluar estos OD, se obtienen las estimaciones que se presentan en la tabla a continuación. Estos valores corresponden a estimaciones anuales.
Tabla 17: Estimaciones mercados restringidos.
Valor actual Estimación Intervalo confianza 95% Intervalo confianza 90%
Mercado Pasajeros Pasajeros Dif. % Pasajeros Dif. % Pasajeros Dif. %
SCL-CWB 30.230 71.342 136% [35.138 ; 144.846]
[16% ; 379%]
[39.303 ; 129.498]
[ 30% ; 328% ]
SCL-BHZ 25.053 55.133 120% [27.155 ; 111.937]
[ 8% ; 347%]
[30.373 ; 100.075]
[ 21% ; 299% ]
SCL-POA 27.068 82.722 306% [54.075 ; 222.909 ]
[ 100% ; 724% ]
[60.485 ;199.289 ]
[123% ; 636% ]
Como los residuos del modelo siguen una distribución Normal, es posible definir los intervalos de confianza que se muestran en la Tabla 17. El procedimiento utilizado para definir estos intervalos se presenta en el Anexo V. Se puede observar que, en los tres casos, el modelo arroja valores para los mercados superiores a los tamaños actuales. Además, es posible notar que incluso los valores mínimos dados por los intervalos, implican un aumento en el tamaño de mercado con respecto al mercado actual. Esto resulta lógico si se considera que se trata de mercados que se encuentran restringidos por la oferta. 29 Al momento del cierre de esta memoria, aún no estaban disponibles los datos anuales revisados para el año 2011. 30 Tienen más tres millones de habitantes y se encuentran entre las 20 ciudades con más potencial de negocio de América Latina para el año 2010, según América Economía.
55
El mercado que presenta un mayor potencial de crecimiento es el SCL-POA, con un crecimiento estimado del 306% con respecto a su situación actual. Además, según las predicciones del modelo, es posible afirmar con un 95% de confianza que, en base a las variables explicativas, este mercado debería aumentar al menos al doble su tamaño, de no existir restricciones en la oferta que imposibiliten este crecimiento (oferta inferior a 55.000 asientos anuales). Los mercados SCL-CWB y SCL-BHZ también presentan potenciales de crecimiento, pero no se puede asegurar con el mismo grado de confianza que éste alcance niveles tan significativos como los establecidos para SCL-POA. En particular, para éstos es posible afirmar con una confianza del 90% que, dadas las variables explicativas, sus crecimientos deberían ser de al menos 30% y 20% respectivamente. Adicionalmente, cuando se analizan los tamaños de mercados es necesario complementar los valores estimados por el modelo con otros elementos. En este sentido, es útil identificar si existen factores que no se encuentran entre las variables explicativas del modelo y que podrían tener implicancias en cuanto al atractivo de las ciudades del mercado. Por ejemplo, para la ciudad de Curitiba, se podría considerar como factor adicional, el atractivo turístico asociado a su festival anual de teatro. 31 Sin embargo, este análisis más acabado de las situaciones específicas de los mercados evaluados se escapa de los alcances definidos para esta memoria.
10. CONCLUSIONES
Este capítulo presenta un balance de la investigación realizada, analizándola en base al objetivo definido al inicio de esta memoria y evaluando sus resultados. En este trabajo se estableció que estimar tamaños de mercados para casos en los que no existe oferta directa operando es complejo, ya que no existe información histórica representativa del flujo potencial de pasajeros. En particular, el análisis realizado para evaluar el procedimiento utilizado actualmente por la empresa Lan en estos casos reveló importantes oportunidades de mejora. Esto motivó la definición del objetivo principal de la memoria de desarrollar una nueva metodología para pronosticar el tamaño potencial de este tipo de mercados. Para esto, se desarrolló un modelo de estimación consistente en una regresión que considera como variables explicativas la distancia entre las ciudades del mercado a estimar, sus poblaciones, la cantidad de viajes que se originan de ellas y los PIB per cápita de sus habitantes. Su forma funcional es una regresión log-log que deriva de una transformación sobre uno de los modelos más utilizados en la literatura para este tipo de problemas, el gravitacional. 31 Fuente: <http://festivaldecuritiba.com.br/>
56
Las variables del modelo se definieron a partir del testeo de diez variables potenciales, entre las que se encuentran factores estructurales y socioeconómicos del mercado y una serie de indicadores que reflejan su nivel de atractivo en términos turísticos, corporativos y étnicos. Algunas de éstas, como la población o el PIB per cápita, son variables que también han sido utilizadas por otros autores para estimar mercados aéreos. Por lo tanto, su relación con la variable dependiente ya ha sido establecida en ocasiones anteriores y su presencia en el modelo creado resultó esperable. Para la calibración de este modelo, se utilizó una muestra que contiene información para 51 mercados que se definen como “maduros” en base a diferentes criterios. Luego, como el objetivo de la memoria es crear una metodología que pueda ser utilizada para realizar estimaciones sobre mercados restringidos, en la selección del modelo definitivo se privilegió su generalidad. Es decir, se eligió un modelo que considera variables que son generales para la gran mayoría de los mercados, con el fin de que éste pueda ser utilizado para estimar casos que se encuentran fuera de la muestra de calibración. Esto puede implicar una pérdida de exactitud sobre las estimaciones, pero permite que el modelo pueda ser utilizado para un mayor número de casos. Además, otra ventaja del modelo es que sus variables son de fácil acceso. Es decir, son variables para las que conseguir información resulta bastante simple. En particular, las distancias, las poblaciones y los PIB per cápita de las ciudades son información de acceso público. Sólo la variable referente a la población viajante requiere de una fuente de datos privada, pero la empresa ya dispone de esta información por lo que la aplicación del modelo no implicaría gastos adicionales en este sentido. El modelo creado presenta un nivel de error promedio de 30% sobre sus estimaciones y, a partir del análisis de evaluaciones pasadas de la compañía, se definió que el error promedio del procedimiento actual era de aproximadamente un 35%. Esto representa una mejora de cinco puntos porcentuales del modelo con respecto al procedimiento anterior. Sin embargo, se determina que ambas metodologías tienen niveles de exactitud equivalentes, ya que la variabilidad de los errores es mayor en el caso de la regresión. No obstante, se establece que el modelo presenta ventajas en otras dimensiones de comparación asociadas con su nivel de sistematización, su insesgadez y el ahorro de tiempo que genera. Debido a que el error promedio del modelo es de alrededor de un tercio del valor de las estimaciones que entrega, se establece que éste sirve para generar estimaciones gruesas. Por lo tanto, se recomienda que, cuando éste sea utilizado para la evaluación de mercados en la compañía, se incluya una etapa posterior de revisión y validación de estos valores en base al juicio experto. Si bien el alcance de esta investigación no considera el desarrollo de una metodología para esta etapa de revisión de las estimaciones. Se plantea que, en trabajos futuros, podría resultar interesante definir un listado de factores que, a
57
través de un análisis cualitativo, permita realizar adaptaciones sobre los tamaños de los mercados estimados, de modo de poder incorporar las características específicas de cada mercado en la estimación. Por otro lado, también se propone como trabajo futuro, analizar la efectividad del modelo en la estimación de mercados con características específicas, como los mercados domésticos y los mercados netamente turísticos. En esta memoria, éstos fueron excluidos de la muestra de calibración y dado el alcance definido, no es posible asegurar que el modelo sirva para predecir este tipo de mercados. Por lo tanto, se deja como trabajo propuesto, la evaluación del modelo en estos casos particulares y su posible adaptación. Por último, también queda propuesto el desarrollar un plan de implementación de la metodología creada en la compañía.
11. GLOSARIO
CMIDT: Complemento MIDT. Base de datos interna de Lan en que se estiman los tamaños de los mercados en base a la información de MIDT y fuentes gubernamentales.
Hub: Estructura de conexión de vuelos en que se define un horario en torno al cual existen múltiples llegadas y salidas de vuelos, de modo lograr variadas conexiones entre todos los vuelos que llegan y todos los que salen.
IATA: The Air Transport Association.
ICUR: Índice de Competitividad Urbana, América Economía.
IPC: Índice de precio al consumidor.
JAC: Junta aeronáutica civil.
Long Haul: Los mercados long haul son los que tienen una gran distancia entre su origen y destino. Por ejemplo, son mercados long haul los que relacionan diferentes regiones como los mercados Europa-América o Norteamérica-Latinoamérica.
MAPE: Mean Absolute Percentage Error. Error porcentual absoluto medio.
MCO (Estimador): Estimador de mínimos cuadrados ordinarios
MIDT: Market Information Data Transfer. Fuente de datos que contiene la información de todos los pasajeros aéreos que compran su ticket por vía de venta indirecta.
58
Regional: Se les llama mercados regionales a aquellos cuyo OD se encuentra dentro de Latinoamérica.
OD: Origen- Destino. Un mercado OD son todos los pasajeros que vuelan entre un origen y un destino en un periodo determinado, sin importar la ruta ni la línea aérea por la que lo hacen.
OW: One way. Mercados o tramos que incorporan el sentido en el que se realiza el viaje.
PIB: Producto interno bruto.
R cuadrado: Indicador de bondad de ajuste que representa la proporción de la varianza de los datos que logra ser explicada por el modelo.
R cuadrado ajustado: Indicador de bondad de ajuste que incorpora un efecto de penalización por la incorporación de variables explicativas adicionales al modelo. A diferencia de R cuadrado, éste permite comparar modelos con diferente número de variables.
RT: Round Trip. Mercados o tramos que consideran los viajes en ambos sentidos.
12. REFERENCIAS BIBLIOGRÁFICAS
[1] AGOSTINI, C. La organización industrial del transporte aéreo en Chile. Revista de análisis económico 23(1):35-84, 2008.
[2] AIRBUS. Airbus Global Market Forecast 2010-2029, 2010.
[3] AIRBUS. Airbus Global Market Forecast 2009-2028, 2009.
[4] BHADRA, D. Demand for air travel in the United States: Bottom-up econometric estimation and implications for forecasts by origin and destination pairs. Journal of Air Transportation 8(2):, 2003.
[5] BENÍTEZ ROCHEL, J. Factores determinantes de la demanda de transporte aéreo y modelos de previsión. Boletín Económico de ICE 2652:, 2000.
[6] BROWN, S. L. y W. S. WATKINS. The Demand for Air Travel: A Regression Study of Time-Series and Cross Sectional Data in the US Domestic Market. Highway Research Record 213: 21-3, 1968.
[7] DOGANIS, R. Traffic forecasting and the gravity model. Flight International: 547-549, 1966.
59
[8] DOGANIS, R. Flying Off Course: The Economics of International Airlines. 3° ed., New York, Routledge, 2004.
[9] FOTHERINGHAM, A.S. Some theoretical aspects of destination choice and their relevance to production-constrained gravity models. Environment and Planning A15: 1121–1132, 1983.
[10] GROSCHE, T., ROTHLAUF, F., HEINZL, A. Gravity models for airline passenger volume transportation. Journal of Air Tranport Management 13: 175-183, 2007.
[11] JORGE-CALDERON, J.D. A demand model for scheduled airline services on international European routes. Journal of Air Transport Management 3: 23–35. 1997.
[12] LAN AIRLINES. Memoria anual. 2010.
[13] LAN AIRLINES. Planificación Comercial. Manual MIDT. 2011.
[14] MOORE, O.E. y SOLIMAN, A.H. Airport catchment areas and air passenger demand. Transportation Engineering Journal of ASCE 107: 569–579. 1981.
[15] O’KELLY, M.E., SONG, W., SHEN, G. New estimates of gravitational attraction by linear programming. Geographical Analysis 27: 271–285, 1995.
[16] QUIROZ,J., FERNANDEZ,J., ACHURRA,M. JAC. Estudio de los niveles tarifarios en el mercado del transporte aéreo. 2004.
[17] RENGARAJU, V.R., THAMIZH ARASAN, V.Modeling for air travel demand. Journal of Transportation Engineering 118(3): 371-380, 1992.
[18] RUSSON, M.G. RILEY, N.F. Airport substitution in a shorthaul model of air transportation. International Journal of transportation economics 20:157-173. 1993.
[19] SHEN, G. Reverse-fitting the gravity model to inter-city airline passenger flows by an algebraic simplification. Journal of Transport Geography 12: 219–234, 2004
[20] STOCK, James y WATSON, Mark. Introduction to econometrics. Boston, Editorial Pearson, 2007. 273-274, 328.
[21] VERGELER Jr., P.K. Model for the demand for air transportation. Bell Journals of Economics and Management Science 3: 437-457, 1972.
60
ANEXOS
61
ANEXO A: Organigrama del Negocio Internacional, Planificación Comercial y principales procesos.
La Gerencia de Planificación Comercial pertenece a la Gerencia Internacional de Pasajeros. Esta última se estructura de forma siguiente:
Ilustración A1: Estructura organizacional negocio internacional.
A su vez, Planificación Comercial se divide en tres áreas: Desarrollo de Red, Itinerarios y Network Economics. Cada una de estas áreas se dedica a tareas diferentes, pero altamente relacionadas entre sí. A continuación se presenta el organigrama de esta gerencia y los principales procesos de sus áreas.
Ilustración A2: Estructura organizacional planificación comercial
Negocio Internacional CEO
Damián Scokin
Ventas y marketing internacional VP Pablo Montesinos
Innovación comercial corporativa VP Sergio Mendoza
Alianzas Estratégicas VP
Soledad Berríos
Negocio Regional CEO
Nicolás Goldstein
Revenue Internacional VP Luis Moreno
Planificación Comercial VP
Luis Riquelme
Negocio Long Haul CEO
Juan Carlos Altmann
Control de Gestión VP
Gonzalo García
62
ANEXO B: Códigos IATA ciudades
Tabla B1: Códigos IATA
Ciudad Código
Miami, USA MIA
San Francisco, USA SFO
New York, USA NYC
Santiago, Chile SCL
Sao Paulo, Brasil SAO
Ciudad de México, México MEX
Rio de Janeiro, Brasil RIO
Buenos Aires, Argentina BUE
Ciudad de Panamá, Panamá PTY
Bogotá, Colombia BOG
San José, Costa Rica SJO
Lima, Perú LIM
Montevideo, Uruguay MVD
Monterrey, México MTY
Brasilia, Brasil BSB
Curitiba, Brasil CWB
Medellín, Colombia MDE
San Juan, Puerto Rico UAQ
Belo Horizonte, Brasil BHZ
Porto Alegre, Brasil POA
Guadalajara, México GDL
Salvador, Brasil SSA
Querétaro, México QRO
Puebla, México PBC
Recife, Brasil REC
Cali, Colombia CLO
Santo Domingo, Rep. Dominicana SDQ
Quito, Ecuador UIO
San Salvador, El Salvador SAL
Córdoba, Argentina COR
Ciudad de Guatemala, Guatemala GUA
Rosario, Argentina ROS
Guayaquil, Ecuador GYE
Managua, Nicaragua MGA
Asunción, Paraguay ASU
Caracas, Venezuela CCS
La Paz, Bolivia LPB
Santa Cruz, Bolivia SRZ
Tegucigalpa, Honduras TGU
Punta Cana, Rep. Dominicana PUJ
La Habana, Cuba HAV
63
ANEXO C: Tablas de datos
Tabla C1. Datos 2010
Variable dependiente Indicadores generales Indicadores negocio
Indicadores turismo
Indicadores étnico
Variables internas
Mercados Orig. Pais Orig. Destino
Pais Dest.
Cant. de pax Dist.
Pobl. Orig.
Pobl. Dest.
Pobl. Viaj. Orig.
Pobl. Viaj. Dest.
GDP pc Orig.
GDP pc Dest.
GDP Orig.
GDP Dest. Exp/Imp
ICUR Orig.
ICUR Dest.
Desempl. Orig.
Desempl. Dest.
GasTur Orig.
GasTur Dest. ExtrAjust Tarifas
ASUBUE10 ASU PY BUE AR 216881 1069 2 12.8 0.689596 8.008472 2835 13623 1961 12491 1558 57.7 78.7 8.8 8.2 2268.33 14053.2 154391 105
ASUSCL10 ASU PY SCL CL 34815 1570 2 6.5 0.689596 3.954122 2835 13281 1961 11476 1131 57.7 87.9 8.8 8.2 2268.33 9957.51 1292 240
BOGBUE10 BOG CO BUE AR 133390 4686 7.4 12.8 2.842755 8.008472 9558 13623 6793 12491 1439 75.6 78.7 8.6 8.2 8181.52 14053.2 1204 600
BOGGUA10 BOG CO GUA GT 25306 2101 7.4 3 2.842755 1.016314 9558 4205 6793 5023 448 75.6 56.4 8.6 11.2 8181.52 3045.2 183 288
BOGGYE10 BOG CO GYE EC 42454.5 994 7.4 2.3 2.842755 1.110201 9558 4777 6793 4415 2640 75.6 56.3 8.6 11 8181.52 4280.62 9667 164
BOGLIM10 BOG CO LIM PE 129224 1886 7.4 9.2 2.842755 3.78213 9558 5842 6793 4423 1887 75.6 73.5 8.6 9.2 8181.52 6795.31 1364 228
BOGMEX10 BOG CO MEX MX 126283 3156 7.4 20 2.842755 0.999566 9558 13392 6793 12368 4332 75.6 83.7 8.6 7.2 8181.52 73525.5 1225 283
BOGMIA10 BOG CO MIA US 388905 2434 7.4 5.6 2.842755 4.144261 9558 45989 6793 39749 26901 75.6 100 8.6 12.5 8181.52 734188 81161 164
BOGPTY10 BOG CO PTY PA 178924 755 7.4 1.2 2.842755 1.596546 9558 14378 6793 7944 1109 75.6 77.1 8.6 5.6 8181.52 2209.8 4100 118
BOGSAO10 BOG CO SAO BR 87355 4332 7.4 20 2.842755 6.041981 9558 17486 6793 16391 3288 75.6 89.4 8.6 4.4 8181.52 56235.6 812 379
BOGSCL10 BOG CO SCL CL 95178.5 4247 7.4 6.5 2.842755 3.954122 9558 13281 6793 11476 2184 75.6 87.9 8.6 8.2 8181.52 9957.51 1152 612
BOGSJO10 BOG CO SJO CR 61682 1153 7.4 2.6 2.842755 0.504816 9558 9208 6793 8594 502 75.6 72.8 8.6 6.9 8181.52 3152.89 1081 144
BOGUIO10 BOG CO UIO EC 123310 721 7.4 2.2 2.842755 1.354104 9558 4549 6793 4594 2640 75.6 57.1 8.6 6.2 8181.52 4280.62 9538 176
BUEGYE10 BUE AR GYE EC 44140 4245 12.8 2.3 8.008472 1.110201 13623 4777 12491 4415 663 78.7 56.3 8.2 11 14053.2 4280.62 1042 353
BUELIM10 BUE AR LIM PE 326367 3151 12.8 9.2 8.008472 3.78213 13623 5842 12491 4423 1221 78.7 73.5 8.2 9.2 14053.2 6795.31 28480 377
BUEMEX10 BUE AR MEX MX 140345 7391 12.8 20 8.008472 0.999566 13623 13392 12491 12368 2205 78.7 83.7 8.2 7.2 14053.2 73525.5 2584 662
BUEREC10 BUE AR REC BR 79617.5 3818 12.8 3.7 8.008472 0.16657 13623 6610 12491 7487 25003 78.7 65.2 8.2 6.1 14053.2 56235.6 9309 279
BUERIO10 BUE AR RIO BR 466704 1996 12.8 11.8 8.008472 2.17815 13623 11989 12491 11412 25003 78.7 79.1 8.2 6.1 14053.2 56235.6 10848 210
BUESAO10 BUE AR SAO BR 1.10E+06 1693 12.8 20 8.008472 6.041981 13623 17486 12491 16391 25003 78.7 89.4 8.2 4.4 14053.2 56235.6 12369 200
BUESCL10 BUE AR SCL CL 820370 1146 12.8 6.5 8.008472 3.954122 13623 13281 12491 11476 5335 78.7 87.9 8.2 8.2 14053.2 9957.51 85936 200
BUESSA10 BUE AR SSA BR 73392.5 3170 12.8 3.6 8.008472 0.301462 13623 7551 12491 8318 25003 78.7 67.7 8.2 5.8 14053.2 56235.6 9449 241
64
BUEUIO10 BUE AR UIO EC 53559.5 4375 12.8 2.2 8.008472 1.354104 13623 4549 12491 4594 663 78.7 57.1 8.2 6.2 14053.2 4280.62 1013 369
CCSLIM10 CCS VE LIM PE 106861 2751 3.2 9.2 3.245755 3.78213 10638 5842 6111 4423 514 53.8 73.5 8.6 9.2 12242.1 6795.31 11282 355
CCSMDE10 CCS VE MDE CO 25205 1050 3.2 2.3 3.245755 0.609251 10638 6881 6111 7313 1155 53.8 69.2 8.6 13.9 12242.1 8181.52 35211 201
CCSMEX10 CCS VE MEX MX 64943 3573 3.2 20 3.245755 0.999566 10638 13392 6111 12368 967 53.8 83.7 8.6 7.2 12242.1 73525.5 836 192
CCSMIA10 CCS VE MIA US 630443 2190 3.2 5.6 3.245755 4.144261 10638 45989 6111 39749 6361 53.8 100 8.6 12.5 12242.1 734188 11974 212
CCSPTY10 CCS VE PTY PA 166266 1368 3.2 1.2 3.245755 1.596546 10638 14378 6111 7944 800 53.8 77.1 8.6 5.6 12242.1 2209.8 531 230
CCSRIO10 CCS VE RIO BR 33331 4523 3.2 11.8 3.245755 2.17815 10638 11989 6111 11412 1977 53.8 79.1 8.6 6.1 12242.1 56235.6 546 1073
CCSSAO10 CCS VE SAO BR 90429 4390 3.2 20 3.245755 6.041981 10638 17486 6111 16391 1977 53.8 89.4 8.6 4.4 12242.1 56235.6 761 774
CCSSCL10 CCS VE SCL CL 46836 4904 3.2 6.5 3.245755 3.954122 10638 13281 6111 11476 690 53.8 87.9 8.6 8.2 12242.1 9957.51 5682 513
CCSUIO10 CCS VE UIO EC 63907.5 1743 3.2 2.2 3.245755 1.354104 10638 4549 6111 4594 579 53.8 57.1 8.6 6.2 12242.1 4280.62 4698 321
CLOMIA10 CLO CO MIA US 96444 2507 2.2 5.6 0.508287 4.144261 6446 45989 5516 39749 26901 63.5 100 13.7 12.5 8181.52 734188 24632 230
GUASJO10 GUA GT SJO CR 73527 856 3 2.6 1.016314 0.504816 4205 9208 5023 8594 582 56.4 72.8 11.2 6.9 3045.2 3152.89 714 106
GYELIM10 GYE EC LIM PE 96495.5 1135 2.3 9.2 1.110201 3.78213 4777 5842 4415 4423 2239 56.3 73.5 11 9.2 4280.62 6795.31 2059 154
GYEMIA10 GYE EC MIA US 168720 3107 2.3 5.6 1.110201 4.144261 4777 45989 4415 39749 12861 56.3 100 11 12.5 4280.62 734188 49258 246
LIMLPB10 LIM PE LPB BO 67910 1084 9.2 1.9 3.78213 0.305427 5842 2170 4423 1664 694 73.5 54.1 9.2 9 6795.31 1351.2 3639 303
LIMMDE10 LIM PE MDE CO 27903.5 2033 9.2 2.3 3.78213 0.609251 5842 6881 4423 7313 1887 73.5 69.2 9.2 13.9 6795.31 8181.52 1106 214
LIMMEX10 LIM PE MEX MX 85287 4241 9.2 20 3.78213 0.999566 5842 13392 4423 12368 1414 73.5 83.7 9.2 7.2 6795.31 73525.5 1272 372
LIMMIA10 LIM PE MIA US 334535 4216 9.2 5.6 3.78213 4.144261 5842 45989 4423 39749 11857 73.5 100 9.2 12.5 6795.31 734188 86433 337
LIMMVD10 LIM PE MVD UY 25067.5 3308 9.2 1.4 3.78213 1.429252 5842 15735 4423 13397 116 73.5 73 9.2 6.9 6795.31 2249.97 337 240
LIMSAO10 LIM PE SAO BR 154402 3395 9.2 20 3.78213 6.041981 5842 17486 4423 16391 3132 73.5 89.4 9.2 4.4 6795.31 56235.6 3633 249
LIMSDQ10 LIM PE SDQ DO 32989.5 3480 9.2 3.3 3.78213 1.346633 5842 7008 4423 3117 111 73.5 58.6 9.2 10.1 6795.31 18124.8 239 334
LIMUIO10 LIM PE UIO EC 96741 1329 9.2 2.2 3.78213 1.354104 5842 4549 4423 4594 2239 73.5 57.1 9.2 6.2 6795.31 4280.62 2034 233
LPBSCL10 LPB BO SCL CL 34928.5 1894 1.9 6.5 0.305427 3.954122 2170 13281 1664 11476 1181 54.1 87.9 9 8.2 1351.2 9957.51 4453 187
MDEMIA10 MDE CO MIA US 126693 2231 2.3 5.6 0.609251 4.144261 6881 45989 7313 39749 26901 69.2 100 13.9 12.5 8181.52 734188 25741 236
MDEUIO10 MDE CO UIO EC 51315.5 775 2.3 2.2 0.609251 1.354104 6881 4549 7313 4594 2640 69.2 57.1 13.9 6.2 8181.52 4280.62 3934 101
MEXSCL10 MEX MX SCL CL 86986 6589 20 6.5 0.999566 3.954122 13392 13281 12368 11476 3863 83.7 87.9 7.2 8.2 73525.5 9957.51 1589 877
MEXUIO10 MEX MX UIO EC 39794 3125 20 2.2 0.999566 1.354104 13392 4549 12368 4594 778 83.7 57.1 7.2 6.2 73525.5 4280.62 351 234
MIAMVD10 MIA US MVD UY 49963 7203 5.6 1.4 4.144261 1.429252 45989 15735 39749 13397 1053 100 73 12.5 6.9 734188 2249.97 11240 604
65
MIAPTY10 MIA US PTY PA 110238 1861 5.6 1.2 4.144261 1.596546 45989 14378 39749 7944 6444 100 77.1 12.5 5.6 734188 2209.8 47421 239
MIASCL10 MIA US SCL CL 171594 6653 5.6 6.5 4.144261 3.954122 45989 13281 39749 11476 16230 100 87.9 12.5 8.2 734188 9957.51 27231 691
MIAUIO10 MIA US UIO EC 156626 2887 5.6 2.2 4.144261 1.354104 45989 4549 39749 4594 12861 100 57.1 12.5 6.2 734188 4280.62 44992 306
MVDSCL10 MVD UY SCL CL 220378 1365 1.4 6.5 1.429252 3.954122 15735 13281 13397 11476 301 73 87.9 6.9 8.2 2249.97 9957.51 1550 183
PTYSJO10 PTY PA SJO CR 91210 537 1.2 2.6 1.596546 0.504816 14378 9208 7944 8594 531 77.1 72.8 5.6 6.9 2209.8 3152.89 6082 119
SCLUIO10 SCL CL UIO EC 35769.5 3781 6.5 2.2 3.954122 1.354104 13281 4549 11476 4594 1241 87.9 57.1 8.2 6.2 9957.51 4280.62 2986 403
Tabla C2. Datos 2009 y 2010
Variable dependiente Indicadores generales Indicadores negocio
Variables internas
Mercados Orig. Pais Orig. Dest.
Pais Dest. Cant. de pax Dist.
Pobl. Orig.
Pobl. Dest.
Pobl. Viaj. Orig.
Pobl. Viaj. Dest.
GDP pc Orig.
GDP pc Dest.
Exp/Imp
ICUR Orig.
ICUR Dest.
Desempl. Orig.
Desempl. Dest. Tarifas
ASUBUE10 ASU PY BUE AR 216881 1069 2 12.8 0.689596 8.008472 1961 12491 1558 57.7 78.7 8.8 8.2 105
ASUSCL10 ASU PY SCL CL 34815 1570 2 6.5 0.689596 3.954122 1961 11476 1131 57.7 87.9 8.8 8.2 240
BOGBUE10 BOG CO BUE AR 133390 4686 7.4 12.8 2.842755 8.008472 6793 12491 1439 75.6 78.7 8.6 8.2 600
BOGGUA10 BOG CO GUA GT 25306 2101 7.4 3 2.842755 1.016314 6793 5023 448 75.6 56.4 8.6 11.2 288
BOGGYE10 BOG CO GYE EC 42454.5 994 7.4 2.3 2.842755 1.110201 6793 4415 2640 75.6 56.3 8.6 11 164
BOGLIM10 BOG CO LIM PE 129224 1886 7.4 9.2 2.842755 3.78213 6793 4423 1887 75.6 73.5 8.6 9.2 228
BOGMEX10 BOG CO MEX MX 126283 3156 7.4 20 2.842755 0.999566 6793 12368 4332 75.6 83.7 8.6 7.2 283
BOGMIA10 BOG CO MIA US 388905 2434 7.4 5.6 2.842755 4.144261 6793 39749 26901 75.6 100 8.6 12.5 164
BOGPTY10 BOG CO PTY PA 178924 755 7.4 1.2 2.842755 1.596546 6793 7944 1109 75.6 77.1 8.6 5.6 118
BOGSAO10 BOG CO SAO BR 87355 4332 7.4 20 2.842755 6.041981 6793 16391 3288 75.6 89.4 8.6 4.4 379
BOGSCL10 BOG CO SCL CL 95178.5 4247 7.4 6.5 2.842755 3.954122 6793 11476 2184 75.6 87.9 8.6 8.2 612
BOGSJO10 BOG CO SJO CR 61682 1153 7.4 2.6 2.842755 0.504816 6793 8594 502 75.6 72.8 8.6 6.9 144
BOGUIO10 BOG CO UIO EC 123310 721 7.4 2.2 2.842755 1.354104 6793 4594 2640 75.6 57.1 8.6 6.2 176
BUEGYE10 BUE AR GYE EC 44140 4245 12.8 2.3 8.008472 1.110201 12491 4415 663 78.7 56.3 8.2 11 353
BUELIM10 BUE AR LIM PE 326367 3151 12.8 9.2 8.008472 3.78213 12491 4423 1221 78.7 73.5 8.2 9.2 377
BUEMEX10 BUE AR MEX MX 140345 7391 12.8 20 8.008472 0.999566 12491 12368 2205 78.7 83.7 8.2 7.2 662
66
BUEREC10 BUE AR REC BR 79617.5 3818 12.8 3.7 8.008472 0.16657 12491 7487 25003 78.7 65.2 8.2 6.1 279
BUERIO10 BUE AR RIO BR 466704 1996 12.8 11.8 8.008472 2.17815 12491 11412 25003 78.7 79.1 8.2 6.1 210
BUESAO10 BUE AR SAO BR 1.10E+06 1693 12.8 20 8.008472 6.041981 12491 16391 25003 78.7 89.4 8.2 4.4 200
BUESCL10 BUE AR SCL CL 820370 1146 12.8 6.5 8.008472 3.954122 12491 11476 5335 78.7 87.9 8.2 8.2 200
BUESSA10 BUE AR SSA BR 73392.5 3170 12.8 3.6 8.008472 0.301462 12491 8318 25003 78.7 67.7 8.2 5.8 241
BUEUIO10 BUE AR UIO EC 53559.5 4375 12.8 2.2 8.008472 1.354104 12491 4594 663 78.7 57.1 8.2 6.2 369
CCSLIM10 CCS VE LIM PE 106861 2751 3.2 9.2 3.245755 3.78213 6111 4423 514 53.8 73.5 8.6 9.2 355
CCSMDE10 CCS VE MDE CO 25205 1050 3.2 2.3 3.245755 0.609251 6111 7313 1155 53.8 69.2 8.6 13.9 201
CCSMEX10 CCS VE MEX MX 64943 3573 3.2 20 3.245755 0.999566 6111 12368 967 53.8 83.7 8.6 7.2 192
CCSMIA10 CCS VE MIA US 630443 2190 3.2 5.6 3.245755 4.144261 6111 39749 6361 53.8 100 8.6 12.5 212
CCSPTY10 CCS VE PTY PA 166266 1368 3.2 1.2 3.245755 1.596546 6111 7944 800 53.8 77.1 8.6 5.6 230
CCSRIO10 CCS VE RIO BR 33331 4523 3.2 11.8 3.245755 2.17815 6111 11412 1977 53.8 79.1 8.6 6.1 1073
CCSSAO10 CCS VE SAO BR 90429 4390 3.2 20 3.245755 6.041981 6111 16391 1977 53.8 89.4 8.6 4.4 774
CCSSCL10 CCS VE SCL CL 46836 4904 3.2 6.5 3.245755 3.954122 6111 11476 690 53.8 87.9 8.6 8.2 513
CCSUIO10 CCS VE UIO EC 63907.5 1743 3.2 2.2 3.245755 1.354104 6111 4594 579 53.8 57.1 8.6 6.2 321
CLOMIA10 CLO CO MIA US 96444 2507 2.2 5.6 0.508287 4.144261 5516 39749 26901 63.5 100 13.7 12.5 230
GUASJO10 GUA GT SJO CR 73527 856 3 2.6 1.016314 0.504816 5023 8594 582 56.4 72.8 11.2 6.9 106
GYELIM10 GYE EC LIM PE 96495.5 1135 2.3 9.2 1.110201 3.78213 4415 4423 2239 56.3 73.5 11 9.2 154
GYEMIA10 GYE EC MIA US 168720 3107 2.3 5.6 1.110201 4.144261 4415 39749 12861 56.3 100 11 12.5 246
LIMLPB10 LIM PE LPB BO 67910 1084 9.2 1.9 3.78213 0.305427 4423 1664 694 73.5 54.1 9.2 9 303
LIMMDE10 LIM PE MDE CO 27903.5 2033 9.2 2.3 3.78213 0.609251 4423 7313 1887 73.5 69.2 9.2 13.9 214
LIMMEX10 LIM PE MEX MX 85287 4241 9.2 20 3.78213 0.999566 4423 12368 1414 73.5 83.7 9.2 7.2 372
LIMMIA10 LIM PE MIA US 334535 4216 9.2 5.6 3.78213 4.144261 4423 39749 11857 73.5 100 9.2 12.5 337
LIMMVD10 LIM PE MVD UY 25067.5 3308 9.2 1.4 3.78213 1.429252 4423 13397 116 73.5 73 9.2 6.9 240
LIMSAO10 LIM PE SAO BR 154402 3395 9.2 20 3.78213 6.041981 4423 16391 3132 73.5 89.4 9.2 4.4 249
LIMSDQ10 LIM PE SDQ DO 32989.5 3480 9.2 3.3 3.78213 1.346633 4423 3117 111 73.5 58.6 9.2 10.1 334
LIMUIO10 LIM PE UIO EC 96741 1329 9.2 2.2 3.78213 1.354104 4423 4594 2239 73.5 57.1 9.2 6.2 233
LPBSCL10 LPB BO SCL CL 34928.5 1894 1.9 6.5 0.305427 3.954122 1664 11476 1181 54.1 87.9 9 8.2 187
67
MDEMIA10 MDE CO MIA US 126693 2231 2.3 5.6 0.609251 4.144261 7313 39749 26901 69.2 100 13.9 12.5 236
MDEUIO10 MDE CO UIO EC 51315.5 775 2.3 2.2 0.609251 1.354104 7313 4594 2640 69.2 57.1 13.9 6.2 101
MEXSCL10 MEX MX SCL CL 86986 6589 20 6.5 0.999566 3.954122 12368 11476 3863 83.7 87.9 7.2 8.2 877
MEXUIO10 MEX MX UIO EC 39794 3125 20 2.2 0.999566 1.354104 12368 4594 778 83.7 57.1 7.2 6.2 234
MIAMVD10 MIA US MVD UY 49963 7203 5.6 1.4 4.144261 1.429252 39749 13397 1053 100 73 12.5 6.9 604
MIAPTY10 MIA US PTY PA 110238 1861 5.6 1.2 4.144261 1.596546 39749 7944 6444 100 77.1 12.5 5.6 239
MIASCL10 MIA US SCL CL 171594 6653 5.6 6.5 4.144261 3.954122 39749 11476 16230 100 87.9 12.5 8.2 691
MIAUIO10 MIA US UIO EC 156626 2887 5.6 2.2 4.144261 1.354104 39749 4594 12861 100 57.1 12.5 6.2 306
MVDSCL10 MVD UY SCL CL 220378 1365 1.4 6.5 1.429252 3.954122 13397 11476 301 73 87.9 6.9 8.2 183
PTYSJO10 PTY PA SJO CR 91210 537 1.2 2.6 1.596546 0.504816 7944 8594 531 77.1 72.8 5.6 6.9 119
SCLUIO10 SCL CL UIO EC 35769.5 3781 6.5 2.2 3.954122 1.354104 11476 4594 1241 87.9 57.1 8.2 6.2 403
ASUBUE09 ASU PY BUE AR 174557 1069 2.5 12.9 0.573245 6.7721585 1550 10494 1567 54.04 77.07 7.2 7.1 87
ASUSCL09 ASU PY SCL CL 30928 1570 2.5 5.7 0.573245 3.591004 1550 8758 751 54.04 90.94 7.2 11.6 278
BOGBUE09 BOG CO BUE AR 135471 4686 7.3 12.9 2.701674 6.7721585 5637 10494 982 74.46 77.07 11 7.1 399
BOGGUA09 BOG CO GUA GT 19133 2101 7.3 3.3 2.701674 0.962051 5637 4712 358 74.46 57.64 11 11.2 280
BOGGYE09 BOG CO GYE EC 33100.5 994 7.3 2.3 2.701674 1.037947 5637 4018 1932 74.46 55.06 11 12.8 179
BOGLIM09 BOG CO LIM PE 175326 1886 7.3 9 2.701674 3.605524 5637 3613 1384 74.46 72.74 11 8.4 185
BOGMEX09 BOG CO MEX MX 99219 3156 7.3 19.9 2.701674 0.875115 5637 10645 2735 74.46 83.82 11 6.9 216
BOGMIA09 BOG CO MIA US 446983 2434 7.3 5.5 2.701674 3.932125 5637 38535 21901 74.46 100 11 11.7 139
BOGPTY09 BOG CO PTY PA 167300 755 7.3 1.8 2.701674 1.5846905 5637 7472 464 74.46 75.22 11 7 115
BOGSAO09 BOG CO SAO BR 92980 4332 7.3 21.2 2.701674 4.6423825 5637 12628 2607 74.46 88.45 11 9.6 392
BOGSCL09 BOG CO SCL CL 83167 4247 7.3 5.7 2.701674 3.591004 5637 8758 1794 74.46 90.94 11 11.6 407
BOGSJO09 BOG CO SJO CR 43942 1153 7.3 1.6 2.701674 0.4291685 5637 7121 320 74.46 73.91 11 4.9 140
BOGUIO09 BOG CO UIO EC 110694 721 7.3 2.1 2.701674 1.278071 5637 4181 1932 74.46 58.63 11 6.1 194
BUEGYE09 BUE AR GYE EC 44773 4245 12.9 2.3 6.7721585 1.037947 10494 4018 592 77.07 55.06 7.1 12.8 329
BUELIM09 BUE AR LIM PE 309886 3151 12.9 9 6.7721585 3.605524 10494 3613 861 77.07 72.74 7.1 8.4 304
BUEMEX09 BUE AR MEX MX 124567 7391 12.9 19.9 6.7721585 0.875115 10494 10645 2096 77.07 83.82 7.1 6.9 500
BUEREC09 BUE AR REC BR 42612.5 3818 12.9 3.7 6.7721585 0.115112 10494 5768 23196 77.07 60.48 7.1 9.8 265
68
BUERIO09 BUE AR RIO BR 432023 1996 12.9 12.5 6.7721585 1.955421 10494 8792 23196 77.07 77.74 7.1 6.4 167
BUESAO09 BUE AR SAO BR 845628 1693 12.9 21.2 6.7721585 4.6423825 10494 12628 23196 77.07 88.45 7.1 9.6 145
BUESCL09 BUE AR SCL CL 696606 1146 12.9 5.7 6.7721585 3.591004 10494 8758 5016 77.07 90.94 7.1 11.6 182
BUESSA09 BUE AR SSA BR 77027 3170 12.9 4.5 6.7721585 0.2954225 10494 6408 23196 77.07 64.65 7.1 11.4 226
BUEUIO09 BUE AR UIO EC 52199 4375 12.9 2.1 6.7721585 1.278071 10494 4181 592 77.07 58.63 7.1 6.1 375
CCSLIM09 CCS VE LIM PE 132623 2751 3.2 9 3.531363 3.605524 5167 3613 615 53.54 72.74 6.4 8.4 362
CCSMDE09 CCS VE MDE CO 36489.5 1050 3.2 2.3 3.531363 0.5909905 5167 6069 4741 53.54 67.4 6.4 14.2 185
CCSMEX09 CCS VE MEX MX 72719 3573 3.2 19.9 3.531363 0.875115 5167 10645 1593 53.54 83.82 6.4 6.9 336
CCSMIA09 CCS VE MIA US 635035 2190 3.2 5.5 3.531363 3.932125 5167 38535 10437 53.54 100 6.4 11.7 221
CCSPTY09 CCS VE PTY PA 229756 1368 3.2 1.8 3.531363 1.5846905 5167 7472 915 53.54 75.22 6.4 7 224
CCSRIO09 CCS VE RIO BR 21461 4523 3.2 12.5 3.531363 1.955421 5167 8792 4192 53.54 77.74 6.4 6.4 381
CCSSAO09 CCS VE SAO BR 90758.5 4390 3.2 21.2 3.531363 4.6423825 5167 12628 4192 53.54 88.45 6.4 9.6 693
CCSSCL09 CCS VE SCL CL 52644 4904 3.2 5.7 3.531363 3.591004 5167 8758 882 53.54 90.94 6.4 11.6 527
CCSUIO09 CCS VE UIO EC 71555 1743 3.2 2.1 3.531363 1.278071 5167 4181 649 53.54 58.63 6.4 6.1 308
CLOMIA09 CLO CO MIA US 103557 2507 2.2 5.5 0.4929695 3.932125 4578 38535 21901 60.16 100 12.7 11.7 221
GUASJO09 GUA GT SJO CR 68045 856 3.3 1.6 0.962051 0.4291685 4712 7121 514 57.64 73.91 11.2 4.9 88
GYELIM09 GYE EC LIM PE 85317 1135 2.3 9 1.037947 3.605524 4018 3613 1600 55.06 72.74 12.8 8.4 127
GYEMIA09 GYE EC MIA US 171082 3107 2.3 5.5 1.037947 3.932125 4018 38535 9211 55.06 100 12.8 11.7 174
LIMLPB09 LIM PE LPB BO 66414.5 1084 9 2.8 3.605524 0.2418285 3613 1492 599 72.74 53.48 8.4 8.7 138
LIMMDE09 LIM PE MDE CO 31454.5 2033 9 2.3 3.605524 0.5909905 3613 6069 1384 72.74 67.4 8.4 14.2 171
LIMMEX09 LIM PE MEX MX 69571.5 4241 9 19.9 3.605524 0.875115 3613 10645 978 72.74 83.82 8.4 6.9 320
LIMMIA09 LIM PE MIA US 329175 4216 9 5.5 3.605524 3.932125 3613 38535 9077 72.74 100 8.4 11.7 245
LIMMVD09 LIM PE MVD UY 24008.5 3308 9 1.3 3.605524 1.150475 3613 10458 91 72.74 72.01 8.4 9.2 294
LIMSAO09 LIM PE SAO BR 146253 3395 9 21.2 3.605524 4.6423825 3613 12628 2189 72.74 88.45 8.4 9.6 273
LIMSDQ09 LIM PE SDQ DO 23195 3480 9 3.3 3.605524 1.277106 3613 2855 90 72.74 59.48 8.4 14.9 325
LIMUIO09 LIM PE UIO EC 100687 1329 9 2.1 3.605524 1.278071 3613 4181 1600 72.74 58.63 8.4 6.1 157
LPBSCL09 LPB BO SCL CL 29433.5 1894 2.8 5.7 0.2418285 3.591004 1492 8758 1190 53.48 90.94 8.7 11.6 192
MDEMIA09 MDE CO MIA US 132396 2231 2.3 5.5 0.5909905 3.932125 6069 38535 21901 67.4 100 14.2 11.7 226
69
MDEUIO09 MDE CO UIO EC 31506 775 2.3 2.1 0.5909905 1.278071 6069 4181 1932 67.4 58.63 14.2 6.1 92
MEXSCL09 MEX MX SCL CL 76001.5 6589 19.9 5.7 0.875115 3.591004 10645 8758 2635 83.82 90.94 6.9 11.6 692
MEXUIO09 MEX MX UIO EC 30642.5 3125 19.9 2.1 0.875115 1.278071 10645 4181 619 83.82 58.63 6.9 6.1 283
MIAMVD09 MIA US MVD UY 44635 7203 5.5 1.3 3.932125 1.150475 38535 10458 741 100 72.01 11.7 9.2 463
MIAPTY09 MIA US PTY PA 111592 1861 5.5 1.8 3.932125 1.5846905 38535 7472 4594 100 75.22 11.7 7 233
MIASCL09 MIA US SCL CL 151879 6653 5.5 5.7 3.932125 3.591004 38535 8758 13263 100 90.94 11.7 11.6 635
MIAUIO09 MIA US UIO EC 151736 2887 5.5 2.1 3.932125 1.278071 38535 4181 9211 100 58.63 11.7 6.1 191
MVDSCL09 MVD UY SCL CL 127521 1365 1.3 5.7 1.150475 3.591004 10458 8758 235 72.01 90.94 9.2 11.6 140
PTYSJO09 PTY PA SJO CR 80439 537 1.8 1.6 1.5846905 0.4291685 7472 7121 477 75.22 73.91 7 4.9 102
SCLUIO09 SCL CL UIO EC 35515 3781 5.7 2.1 3.591004 1.278071 8758 4181 1314 90.94 58.63 11.6 6.1 356
70
ANEXO D: Aclaraciones variables Gi, Xi y Ai.
1. Variable Gi: Para esta variable, que representa el PIB per cápita de las ciudades, es necesario aclarar que los valores para el año 2010 se obtuvieron a partir de los valores del año 2009, ajustándolos según el crecimiento del PIB per cápita a nivel de país. Los valores de los PIB per cápita de las ciudades para el año 2009 se obtuvieron a partir de los datos recolectados por América Economía Intelligence y los crecimientos del PIB per cápita a nivel de país se determinaron en base a la información disponible en Naciones Unidas.
2. Variable Xi: Se realizó un ajuste sobre la variable Xi, que representa la
presencia de extranjeros del país de origen en el país de destino y viceversa. Su objetivo es reflejar el atractivo en términos de la cantidad de pasajeros de tipo étnico para el OD. Debido a que se dispone de esta información a nivel de país y no a nivel de ciudad, se ajustó su valor para hacerlo proporcional a la relación entre el tamaño poblacional de la ciudad y el tamaño poblacional del país a la que pertenece. Es decir, sin el ajuste, esta variable reflejaría para el OD LIM-MIA la suma de todos los peruanos residentes en Estados Unidos y todos los estadounidenses residentes en Perú. Sin embargo, aunque puede existir un número considerable de peruanos viviendo en US, no necesariamente viven en la ciudad de MIA, entonces el indicador pierde validez para la OD en cuestión. Luego, como no se dispone de la información a nivel de ciudad, se decide ajustar la variable según el tamaño poblacional relativo de la ciudad con respecto al país.
3. Variable Ai: La variable Ai es una variable adicional de población y, debido
a que su presencia en el modelo no resulta tan intuitiva como otras, puede ser útil explicar por qué se decidió incluirla en el modelo. En términos generales, la razón por la que se incluye esta variable es para que el modelo considere a los pasajeros de otras ciudades que viajan a través de alguna de las ciudades del mercado a estimar. Por ejemplo, la población (Pi) de Ciudad de Panamá es de 1.2 millones de habitantes para el año 2010. Sin embargo, el aeropuerto internacional principal está ubicado en esta ciudad y prácticamente todos los pasajeros que viajan desde o hacia Panamá lo hacen a través de éste. Luego, existen pasajeros provenientes de otras ciudades aledañas que, aunque en estricto rigor tienen OD diferente, se consideran parte del mercado de esta ciudad.
71
En particular, cerca del 100% de los viajes internacionales realizados desde o hacia este país tienen origen o destino la Ciudad de Panamá.32 Entonces, además del potencial dado por el tamaño poblacional de la ciudad misma, existe un potencial dado por la población de ciudades cercanas que viajan a través de los aeropuertos de la ciudad. Para rescatar este efecto, se incluye la variable Ai que representa la población viajante de los aeropuertos de las ciudades del mercado a estimar. Luego, para casos como la Ciudad de Panamá, en que la población de la ciudad es relativamente pequeña en relación a la cantidad de viajes que se originan desde o hacia ella, se puede rescatar el efecto de estos pasajeros adicionales a través de Ai.
32 Fuente: Complemento MIDT
72
ANEXO E: Correlación entre la variable dependiente y las diferentes formas funcionales de las variables explicativas.
Tabla E1. Correlaciones variable dependiente – formas funcionales
Forma funcional Correlación
PiPj 0,4340
Pi+Pj 0,3271
AiAj 0,7701
Ai+Aj 0,6159
GiGj 0,2886
Gi+Gj 0,3117
IiIj 0,3846
Ii+Ij 0,3881
SiSj -0,0643
Si+Sj -0,0770
UiUj 0,2909
Ui+Uj 0,1768
73
ANEXO F: Correlación entre la variable yield y las variables explicativas.
Tabla F1. Correlaciones yield – variables explicativas
Variable Correlación
Dij -0,4964
Eij -0,3135
Xij -0,1087
Pij -0,2566
Aij -0,0760
Gij -0,3946
Iij -0,3802
Sij -0,1472
Uij -0,3115
74
ANEXO G: Detección de casos outliers en la muestra ampliada.
En este Anexo se detalla el procedimiento utilizado para detectar los casos outliers de la muestra ampliada de 106 observaciones. Los outliers son casos de mercados que presentan un comportamiento diferente al resto y que no logran ser explicados por los modelos.
La razón por la que es recomendable detectar estos casos particulares es que, al presentar un comportamiento distinto al de la mayoría de la muestra, éstos pueden estar distorsionando los parámetros del modelo. Por lo tanto, puede ser necesario incorporar alguna variable adicional para explicarlos o simplemente, puede ser conveniente extraer estos casos de la muestra.
Para determinar si existen outliers se analizaron, para los tres modelos, los errores arrojados para las estimaciones de cada uno de los mercados de la muestra.
En general, los errores de los modelos presentan alta variabilidad y por lo tanto, existen varios casos en los que éstos presentan errores de magnitudes muy superiores al MAPE. Sin embargo, no es conveniente considerar la totalidad de estos casos como outliers, ya que si se eliminan todos los casos en los que el nivel de error es alto, se puede obtener un modelo que no refleja el comportamiento general de los mercados y que, por esta razón, no es aplicable para mercados fuera de la muestra.
Luego, para efectos de esta investigación, se determina que se consideran como outliers aquellos casos que no logran ser explicados por ninguno de los tres modelos testeados y que presentan altos niveles de error en todos los casos.
En particular, se tomaron como outliers los mercados cuyas estimaciones tenían errores para los años 2009 y 2010 que promediaban sobre un 100% (en valor absoluto) para todos los modelos. Es decir, se calculó un error único para cada OD, promediando el error de las estimaciones 2009 y 2010 de este mercado. De esta forma, se detectaron dos mercados outliers: CCS-MDE y BOG-GYE.
A continuación se presentan tres gráficos en los que se pueden apreciar los errores porcentuales de las estimaciones para cada uno de estos modelos (regresiones RL2, RG2 y RLog2, que se pueden encontrar en los Anexos J, M y P respectivamente). En ellos, los errores de las diferentes estimaciones están representados por los puntos azules y se han destacado en rojo aquellos que corresponden a las observaciones para los mercados CCS-MDE y BOG-GYE. Además, se han marcado en color verde los valores promedio para los errores de estos mercados. Con el fin de que los niveles de error los diferentes modelos sean comparables, para el caso de RLog2 se presentan los errores asociados a la transformación
75
exponencial de las estimaciones, ya que a diferencia de los otros dos modelos, éste no entrega directamente el tamaño del mercado, sino su logaritmo.
Ilustración G1: Errores porcentuales y mercados outliers. Para evitar distorsiones en el modelo y dado que estos casos especiales no logran ser explicados por la incorporación de variables dummies33, se decide excluir estos dos casos de la muestra de calibración.
33 Según el ajuste testeado para variables dummies descrito en el Anexo H.
76
ANEXO H: Testeo de ajustes sobre las variables explicativas.
Con el fin de disminuir el nivel de error de las regresiones, se testearon diferentes ajustes sobre los datos y las variables de los modelos. En particular, los ajustes corresponden a una ponderación de la variable población por punto de venta (POS), una segmentación de la variable distancia y la inclusión de variables dummies por ciudad. Finalmente, se opta por no incluir en el modelo definitivo los ajustes mencionados, ya sea porque éstos no se traducen en una mejora de los modelos o porque se considera que la mejora no justifica el aumento en la complejidad y pérdida de generalidad de los modelos (cosa que puede repercutir en su posterior aplicabilidad).
1. Población ajustada por POS En primer lugar, se testeó realizar un ajuste sobre la variable población (Pij) para que ésta considere el peso de los POS (Point of sale) de los diferentes mercados. En su versión original, la variable Pij es el producto de las poblaciones de la ciudad i y la ciudad j, sin embargo, existen ocasiones en que los mercados round trip no son equilibrados y existen más pasajeros viajando en uno de los sentidos que en el otro. Por ejemplo, para el mercado BUE-SAO, cerca de un 70% de los pasajeros del mercado vuela desde Sao Paulo a Buenos Aires y sólo un 30% lo hace en el sentido contrario. Es decir, el POS SAO tiene un mayor peso que el POS BUE. Por esta razón, es razonable considerar que las poblaciones de las ciudades que componen un mercado pueden tener impactos diferentes sobre la cantidad de pasajeros que vuelan el OD. Para reflejar el efecto del POS, se define una nueva variable de población que corresponde al producto de las poblaciones ajustadas según el peso de su POS. Por ejemplo, para el caso del mercado BUE-SAO, ésta variable ajustada considera el producto de la población de Buenos Aires ponderada por un 30% y la población de Sao Paulo ponderada en un 70%. Se calibran nuevas regresiones para cada uno de los tres modelos utilizando la variable de población ajustada pos POS en lugar de la variable Pij original. Las expresiones para estas regresiones y sus tablas resumen se pueden encontrar en el Anexo X.34 Al comparar los R2 ajustados obtenidos para estas regresiones con los obtenidos para RL3, RG3 y RLog3, se puede notar que en los tres modelos ocurre una disminución en su valor. Es decir, frente a dos modelos del mismo tipo, ya sea lineal, gravitacional o log-log, ocurre que la regresión calibrada con la variable población ajustada tiene menor R2 ajustado que la regresión calibrada con la
34 Regresiones calibradas con la muestra de 102 observaciones (sin outliers).
77
variable población original. En particular, los modelos lineal y gravitacional reducen su R2 ajustado en un punto porcentual y el modelo log-log, en cinco puntos porcentuales. Además, cuando se analizan los valores del test de significancia individual 35 para cada una de las variables, es posible notar que, aunque tanto para la variable ajustada como la original, la población resulta significativa, el valor del test disminuye cuando se calibra con la variable que considera el efecto del POS. Por otro lado, el MAPE también aumenta al hacer este ajuste de la variable población. Para el caso lineal, éste crece en un 1%, en el gravitacional, un 5% y en el log-log, un 3%. Luego, dado que los indicadores de ajuste son mejores para los modelos originales, no conviene hacer esta modificación sobre la variable y es preferible utilizar la población sin ponderar. Al optar por el modelo original, se hace el supuesto de que, un aumento de una unidad en la población de cualquiera de las ciudades de un mercado, tiene el mismo impacto sobre la cantidad de pasajeros del OD, independiente del peso de sus POS.
2. Segmentación de la variable distancia Otro ajuste que se evaluó fue el de segmentar la variable distancia. Es decir, definir diferentes parámetros para distintos rangos de esta variable, suponiendo la posibilidad de que para algunas magnitudes de distancia el peso de este factor fuera mayor que para otras. Por ejemplo, el impacto marginal de cada unidad de esta variable podría ser mayor para mercados de poca distancia que para casos de orígenes-destinos que se encuentran muy alejados el uno del otro, ya que el costo de recorrer un kilómetro adicional (yield) es decreciente con respecto a la distancia (Quiroz et al. 2004). Para determinar posibles rangos de distancia que no están siendo correctamente explicados por los modelos originales, se grafican los errores porcentuales en función de la distancia y se observa si existen intervalos para los que éstos son mayores que otros. En el Anexo Y es posible encontrar estos gráficos. Sin embargo, en los gráficos no se observan rangos de distancia para los que los modelos presenten problemas particulares. En general, la variabilidad de los errores se mantiene para los mercados de diferentes distancias. Por último, se evaluó la posibilidad de incorporar variables dummy para algunas ciudades con el fin de explicar ciertos casos particulares que presentaban altos
35 Test T-student.
78
niveles de error. Es decir, se incorporan variables que toman el valor 1 si la ciudad en cuestión está presente en el OD del mercado y 0 si no. 36 Estas variables suponen que pueden existir ciertas ciudades para las que el modelo no logra capturar su atractivo en base a las variables explicativas originales. Por ejemplo, puede ocurrir que parte del atractivo de Buenos Aires esté dado por la gran oferta teatral de la que dispone y que esto no se vea reflejado en las cuatro variables del modelo. Luego, una dummy para esta ciudad puede ayudar a capturar este efecto. Se testean variables binarias para siete ciudades. Debido a que para determinar si una ciudad presenta un atractivo no capturado, es necesario contar con un número suficiente de observaciones para ésta, se testearon sólo aquellas que aparecen en al menos nueve mercados de la muestra (18 observaciones). En particular, las ciudades testeadas son: BOG, BUE, CCS, MIA, SCL y UIO. Se obtienen nuevas regresiones que consideran como variables potenciales las cuatro del modelo original más las siete variables dummy. Luego, mediante el método stepwise (o manualmente en el caso del modelo no lineal) se seleccionan las variables significativas. De esta forma, se determina que sólo cuatro de las variables dummies resultan significativas: BUE, CCS, MIA y SCL (ésta no es significativa en el modelo gravitacional). Las regresiones correspondientes a los modelos con variables binarias y sus tablas resumen se encuentran en el Anexo Z. En los modelos lineal y gravitacional con dummies, la variable de PIB per cápita no resulta significativa. Luego, es posible suponer que estas nuevas variables explican en parte, el efecto de las diferencias de PIB sobre la variable dependiente. Al incluir las variables binarias, los R2 ajustado aumentan con respecto a los valores de las regresiones originales (RL3, RG3 y RLog3) para cada uno de los tres modelos. Por otro lado, el MAPE disminuye para los modelos gravitacional y log-log, pero aumenta para el caso lineal. En particular, éste presenta un aumento de un 13% para el modelo lineal y disminuciones del 6% y 5% para el modelo gravitacional y log-log respectivamente. Por otro lado, al incluir estas variables y predecir los valores de la muestra utilizando los modelos, el número de estimaciones con errores porcentuales aceptables (inferiores al 30%37) aumenta para los tres tipos de modelos. Es decir, con las dummies, los modelos entregan más estimaciones “aceptables” que sin
36 En el caso del modelo gravitacional, las dummies toman valor e si la ciudad está presente en la OD y 1 si no. 37 El valor aceptable se define en base al error del procedimiento actual.
79
ellas: el modelo lineal entrega un 4% más de estimaciones aceptables, el gravitacional un 9% y el log-log un 10%. Sin embargo, a pesar que los niveles de error disminuyen al incluir las dummies, se opta por no incorporarlas al modelo definitivo, ya que se considera que esta mejora no justifica el aumento en la complejidad y pérdida de generalidad del mismo. Es necesario señalar que, el número de observaciones para las que existe una dummy activa corresponde a alrededor del 70% de la muestra, entonces para una gran cantidad de las estimaciones se está ajustando su valor por una constante característica de las ciudades del mercado. Luego, este modelo podría presentar altos niveles de error cuando se utilice para predecir mercados que no se encuentran en la muestra.
80
ANEXO I: RL1. Regresión lineal 1.
Tabla I1: RL1. Regresión lineal 1.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟑𝟒.𝟏𝟓𝟕,𝟒𝟗𝟎 − 𝟓𝟖,𝟒𝟗𝟑 𝑫𝒊𝒋 + 𝟖𝟏𝟐,𝟏𝟒𝟖 𝑷𝒊𝒋 + 𝟏𝟑.𝟔𝟕𝟎,𝟕𝟏𝟎 𝑨𝒊𝒋 + 𝟓,𝟕𝟔𝟐 𝑮𝒊𝒋 R2 aj. : 0,78
MAPE: 57%
Tabla I2: Tabla Resumen RL1
Coef. T P valor Intervalo de confianza Cons. 34.157,490 1,14 0,259 [-25.971,680 ; 94.286,670] Dij -58,493 -6,48 0,000 [-76,639 ; -40,347] Pij 812,148 2,87 0,006 [243,490 ; 1380,805] Aij 13.670,710 7,63 0,000 [10.069,770 ; 17.271,650] Gij 5,762 5,11 0,000 [3,495 ; 8,028]
N° de obs. 53 F(4,48) 47,51 P valor 0,0000 R2 0,7984 R2 Ajust. 0,7816
81
ANEXO J: RL2. Regresión lineal 2.
Tabla J1: RL2. Regresión lineal 2.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟑𝟕.𝟖𝟏𝟕,𝟓𝟒𝟎 − 𝟓𝟒,𝟒𝟕𝟕 𝑫𝒊𝒋 + 𝟕𝟗𝟏,𝟖𝟗𝟏 𝑷𝒊𝒋 + 𝟏𝟒.𝟏𝟕𝟗,𝟐𝟏 𝑨𝒊𝒋 + 𝟓,𝟓𝟏𝟔 𝑮𝒊𝒋 R2 aj. : 0,78
MAPE: 58%
Tabla J2: Tabla Resumen RL2.
Coef. T P valor Intervalo de confianza Cons. 37.817,54 1,94 0,055 [-788,677 ; 76.423,760] Dij -54,477 -9,32 0,000 [-66,075 ; -42,878] Pij 791,891 4,45 0,000 [439,2093 ; 1144,572] Aij 14.179,210 10,97 0,000 [11.615,910 ; 16.742,510] Gij 5,516 7,45 0,000 [4,048 ; 6,984]
N° de obs. 106 F(4,101) 93,57 P valor 0,0000 R2 0,7875 R2 Ajust. 0,7791
82
ANEXO K: RL3. Regresión lineal 3.
Tabla K1: RL3. Regresión lineal 3.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟒𝟓.𝟕𝟔𝟐,𝟕𝟒𝟎 − 𝟓𝟓,𝟓𝟕𝟗 𝑫𝒊𝒋 + 𝟕𝟖𝟕,𝟒𝟐𝟗 𝑷𝒊𝒋 + 𝟏𝟒.𝟎𝟕𝟎,𝟐𝟖𝟎 𝑨𝒊𝒋 + 𝟓,𝟒𝟒𝟓 𝑮𝒊𝒋 R2 aj. : 0,78
MAPE: 55%
Tabla K2: Tabla Resumen RL3.
Coef. T P valor Intervalo de confianza Cons. 45.762,740 2,22 0,028 [4.940,246 ; 86.585,240] Dij -55,579 -9,31 0,000 [-67,425 ; -43,733 ] Pij 787,429 4,38 0,000 [ 430,587 ; 1.144,272 ] Aij 14.070,280 10,75 0,000 [11.472,200 ; 16.668,35] Gij 5,448 7,26 0,000 [3,959 ; 6,937 ]
N° de obs. 102 F(4, 97) 90,13 P valor 0,000 R2 0,7880 R2 Ajust. 0,7792
83
ANEXO L: RG1. Regresión gravitacional 1.
Tabla L1: RG1. Regresión lineal 1.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟏.𝟓𝟐𝟕,𝟏𝟗𝟔 𝑫𝒊𝒋!𝟎,𝟗𝟔𝟒 𝑷𝒊𝒋
𝟎,𝟏𝟖𝟒𝑨𝒊𝒋𝟎,𝟓𝟓𝟐𝑮𝒊𝒋
𝟏,𝟎𝟑𝟏 R2 aj. : 0,95
MAPE: 39%
Tabla L2: Tabla Resumen RG1.
Coef. T P valor Intervalo de confianza Cons. 1527,196 0,91 0,366 [-1833,973 ; 4.888,365 ] Dij -0,964 -10,37 0,000 [-1,151 ; 0,777 ] Pij 0,184 2,73 0,009 [ 0,048 ; 0,321 ] Aij 0,552 6,01 0,000 [ 0,367 ; 0,736 ] Gij 1,031 8,41 0,000 [ 0,784 ; 1,278 ]
N° de obs. 53 R2 0,9542 R2 Ajust. 0,9494
84
ANEXO M: RG2. Regresión gravitacional 2.
Tabla M1: RG2. Regresión gravitacional 2.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟑.𝟖𝟑𝟓,𝟏𝟑𝟓 𝑫𝒊𝒋!𝟎,𝟗𝟏𝟐 𝑷𝒊𝒋
𝟎,𝟏𝟖𝟔𝑨𝒊𝒋𝟎,𝟓𝟒𝟕𝑮𝒊𝒋
𝟎,𝟗𝟏𝟎 R2 aj. : 0,94
MAPE: 40%
Tabla M2: Tabla Resumen RG2.
Coef. T P valor Intervalo de confianza Cons. 3.835,135 1,33 0,187 [ -1.897,174 ; 9567, 445 ] Dij -0,912 -13,66 0,000 [ -1,045 ; -0,780 ] Pij 0,186 4,02 0,000 [ 0,094; 0,277 ] Aij 0,547 8,68 0,000 [ 0,422 ; 0,672 ] Gij 0,910 10,98 0,000 [ 0,746 ; 1,075 ]
N° de obs. 106 R2 0,9422 R2 Ajust. 0,9394
85
ANEXO N: RG3. Regresión gravitacional 3.
Tabla N1: RG3. Regresión gravitacional 3.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟓.𝟎𝟔𝟐,𝟓𝟗𝟓 𝑫𝒊𝒋!𝟎,𝟗𝟐𝟏 𝑷𝒊𝒋
𝟎,𝟏𝟖𝟖𝑨𝒊𝒋𝟎,𝟓𝟑𝟒𝑮𝒊𝒋
𝟎,𝟖𝟗𝟑 R2 aj. : 0,94
MAPE: 36%
Tabla N2: Tabla Resumen RG3.
Coef. T P valor Intervalo de confianza Cons. 5.062,595 1,32 0,189 [-2529,302 ; 12.654,490 ] Dij -0,921 -13,85 0,000 [-1,053 ; -0,789] Pij 0,188 4,10 0,000 [0,097 ; 0,279] Aij 0,534 8,55 0,000 [0,410 ; 0,657] Gij 0,893 10,82 0,000 [0,729 ; 1,057]
N° de obs. 102 R2 0,9443 R2 Ajust. 0,9414
86
ANEXO O: RLog1. Regresión log-log 1.
Tabla O1: RLog1. Regresión log-log 1.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟖,𝟏𝟕𝟑 − 𝟏,𝟎𝟑𝟐 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟓𝟗 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟑𝟗𝟒 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟗𝟔𝟑 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,77
MAPE: 2,66%
MAPE2: 33%
Tabla O2: Tabla Resumen RLog1
Coef. T P valor Intervalo de confianza Cons. 8,173 7,02 0,000 [ 5,831 ; 10,514 ] Ln(Dij) -1,032 -8,89 0,000 [-1,265 ; -0,799] Ln(Pij) 0,359 5,12 0,000 [ 0,218 ; 0,499 ] Ln(Aij) 0,394 5,48 0,000 [ 0,249 ; 0,539 ] Ln(Gij) 0,963 7,60 0,000 [ 0,709 ; 1,219 ]
N° de obs. 53 F(4,48) 44,18 P valor 0,000 R2 0,7864 R2 Ajust. 0,7686
87
ANEXO P: RLog2. Regresión log-log 2.
Tabla P1: RLog2. Regresión log-log 2.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟖,𝟓𝟕𝟒 − 𝟎,𝟗𝟗𝟓 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟓𝟎 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟐𝟐 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟗𝟎𝟎 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,78
MAPE: 2,67%
MAPE2: 33%
Tabla P2: Tabla Resumen RLog2
Coef. T P valor Intervalo de confianza Cons. 8,574 11,06 0,000 [ 7,036 ; 10,111 ] Ln(Dij) -0,995 -12,56 0,000 [ -1,153 ; -0,838 ] Ln(Pij) 0,350 7,36 0,000 [ 0,256 ; 0,444 ] Ln(Aij) 0,422 8,66 0,000 [ 0,325 ; 0,518 ] Ln(Gij) 0,900 10,80 0,000 [ 0,735 ; 1,065 ]
N° de obs. 106 F(4,101) 94,59 P valor 0,000 R2 0,7893 R2 Ajust. 0,7810
88
ANEXO Q: RLog3. Regresión log-log 3.
Tabla Q1: RLog3. Regresión log-log 3.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟑𝟏𝟑 − 𝟏,𝟎𝟓𝟎 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟒𝟏 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟐𝟐 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟖𝟕𝟒 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,82
MAPE: 2,43%
MAPE2: 29%
Tabla Q2: Tabla Resumen RLog3.
Coef. T P valor Intervalo de confianza Cons. 9,313 12,97 0,000 [ 7,888 ; 10,739 ] Ln(Dij) -1,050 -14,46 0,000 [-1,194 ; -0,906 ] Ln(Pij) 0,341 7,89 0,000 [ 0,255 ; 0,427 ] Ln(Aij) 0,422 9,58 0,000 [ 0,335 ; 0,510 ] Ln(Gij) 0,874 11,55 0,000 [ 0,724 ; 1,025 ]
N° de obs. 102 F(4,97) 112,86 P valor 0,000 R2 0,8231 R2 Ajust. 0,8158
89
ANEXO R: Test de normalidad y estadísticos descriptivos de los residuos para modelo definitivo (RLog3).
Tabla R12: Estadísticos descriptivos de los residuos para RLog3.
Variable Obs Media Desv. Estándar Min Max
Residuos RLog3 102 0,000 0,361 -1,031 0,837
Tabla R2: Test de normalidad skewness/ kurtosis para RLog3.
Variable Obs Pr(Skewness) Pr(Kurtosis) Chi2 Ajust. P-valor
Residuos RLog3 102 0,932 0,589 0,300 0,861
Este test toma como Hipótesis Nula (H0) la normalidad de los residuos. Luego, el p-valor indica que existe alrededor de un 86% de probabilidades de equivocarse al rechazar H0 y esto sugiere que la variable testeada sigue una Normal.
De forma gráfica, es posible apreciar la normalidad de los errores en la siguiente ilustración.
Ilustración R9: Histograma de los residuos del modelo RLog3.
0.5
11.5
Density
-1 -.5 0 .5 1residuosRLog3
Residuos
Densidad
90
ANEXO S: Regresiones para el proceso de validación del modelo.
Tabla S1: Modelos validación
Iteración Expresión Indicadores
1 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟔𝟔𝟎 − 𝟎,𝟗𝟔𝟑 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟐𝟖𝟑 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟖𝟒 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟕𝟖𝟐 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,80
MAPE: 2,43%
MAPE2: 30%
2 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟒𝟗𝟕 − 𝟏,𝟎𝟑𝟖 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟒𝟎𝟓 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟑𝟐𝟔 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟑𝟐 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,78
MAPE: 3,27%
MAPE2: 33%
3 𝐥𝐧 𝑻𝒊𝒋 = 𝟖,𝟗𝟖𝟕 − 𝟏,𝟎𝟎𝟎 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟎𝟒 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟑𝟏 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟕𝟗 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,86
MAPE: 2,93%
MAPE2: 35%
4 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟎𝟗𝟗 − 𝟏,𝟏𝟏𝟎 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟑𝟕 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟐𝟒 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟗𝟒𝟕 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,86
MAPE: 2,86%
MAPE2: 37%
5 𝐥𝐧 𝑻𝒊𝒋 = 𝟕,𝟎𝟏𝟐 − 𝟏,𝟎𝟐𝟏 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟒𝟓 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟑𝟎 𝐥𝐧 𝑨𝒊𝒋
+ 𝟏,𝟎𝟖𝟎 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,85
MAPE: 2,98%
MAPE2: 32%
6 𝐥𝐧 𝑻𝒊𝒋 = 𝟖,𝟔𝟗𝟗 − 𝟏,𝟎𝟕𝟐 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟒𝟎𝟕 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟑𝟗𝟑 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟗𝟑𝟓 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,80
MAPE: 2,56%
MAPE2: 28%
7 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟎𝟓𝟓 − 𝟏,𝟎𝟒𝟒 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟑𝟔 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟏𝟗 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟗𝟓 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,77
MAPE: 2,31%
MAPE2: 27%
8 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟒𝟎𝟏 − 𝟏,𝟎𝟑𝟗 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟖𝟏 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟕𝟔 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟒𝟏 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,78
MAPE: 2,34%
MAPE2: 36%
91
9 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟖𝟎𝟎 − 𝟏,𝟏𝟐𝟏 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟑𝟖𝟎 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟐𝟔 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟔𝟑 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,84
MAPE: 2,65%
MAPE2: 28%
10 𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟎𝟑𝟎 − 𝟎,𝟗𝟏𝟒 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟐𝟓𝟓 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟒𝟑𝟒 𝐥𝐧 𝑨𝒊𝒋
+ 𝟎,𝟖𝟐𝟒 𝐥𝐧 (𝑮𝒊𝒋)
R2: 0,78
MAPE: 2,18%
MAPE2: 27%
92
ANEXO T: Errores porcentuales del modelo RLog3 por mercado.
Tabla T1: Errores porcentuales sobre las estimaciones del modelo y sobre sus transformaciones exponenciales.
Mercados/año Error ln(Pij) Error Pij
ASUBUE10 0.77% 9.0%
ASUSCL10 7.07% 109.4%
BOGBUE10 1.16% 14.7%
BOGLIM10 1.88% 24.7%
BOGMEX10 1.07% 11.8%
BOGMIA10 0.27% 3.5%
BOGPTY10 0.30% 3.7%
BOGSAO10 7.36% 130.9%
BOGSCL10 0.01% 0.1%
BOGSJO10 4.28% 60.4%
BOGUIO10 3.15% 44.6%
BUEGYE10 4.08% 54.6%
BUELIM10 2.06% 23.0%
BUEMEX10 2.30% 23.9%
BUEREC10 4.74% 41.5%
BUERIO10 0.11% 1.5%
BUESAO10 0.77% 11.3%
BUESCL10 0.62% 8.8%
BUESSA10 0.16% 1.8%
BUEUIO10 2.65% 33.5%
CCSLIM10 2.33% 23.7%
CCSMEX10 1.33% 15.9%
CCSMIA10 4.87% 47.8%
CCSPTY10 6.53% 54.4%
CCSSAO10 4.67% 70.3%
CCSSCL10 2.75% 34.5%
CCSUIO10 1.67% 16.9%
CLOMIA10 1.42% 17.7%
GUASJO10 2.14% 21.3%
GYELIM10 0.37% 4.3%
GYEMIA10 2.47% 25.8%
LIMLPB10 4.44% 39.0%
LIMMDE10 6.50% 94.6%
LIMMEX10 0.32% 3.7%
LIMMIA10 2.45% 26.8%
LIMMVD10 8.07% 126.5%
LIMSAO10 5.22% 86.6%
LIMSDQ10 0.05% 0.5%
93
LIMUIO10 0.35% 3.9%
LPBSCL10 1.51% 17.1%
MDEMIA10 1.18% 14.9%
MDEUIO10 1.47% 17.3%
MEXSCL10 2.10% 21.3%
MEXUIO10 1.95% 22.9%
MIAMVD10 1.25% 14.5%
MIAPTY10 5.72% 94.4%
MIASCL10 0.78% 8.9%
MIAUIO10 0.62% 7.1%
MVDSCL10 1.91% 20.9%
PTYSJO10 0.72% 8.6%
SCLUIO10 2.51% 30.1%
ASUBUE09 0.88% 10.1%
ASUSCL09 5.20% 71.3%
BOGBUE09 1.09% 12.1%
BOGLIM09 2.54% 26.4%
BOGMEX09 0.96% 10.5%
BOGMIA09 2.11% 24.0%
BOGPTY09 0.92% 11.7%
BOGSAO09 3.92% 56.6%
BOGSCL09 1.62% 16.8%
BOGSJO09 3.62% 47.3%
BOGUIO09 2.42% 32.4%
BUEGYE09 1.79% 21.1%
BUELIM09 3.67% 37.1%
BUEMEX09 3.59% 34.4%
BUEREC09 2.95% 27.0%
BUERIO09 1.46% 17.3%
BUESAO09 0.11% 1.6%
BUESCL09 0.72% 9.3%
BUESSA09 1.89% 19.2%
BUEUIO09 0.67% 7.6%
CCSLIM09 5.40% 47.1%
CCSMEX09 1.11% 11.7%
CCSMIA09 5.18% 50.0%
CCSPTY09 8.35% 64.3%
CCSSAO09 2.35% 30.7%
CCSSCL09 0.69% 7.2%
CCSUIO09 3.76% 34.3%
CLOMIA09 0.07% 0.8%
GUASJO09 4.58% 39.9%
GYELIM09 0.17% 1.9%
94
GYEMIA09 3.33% 33.0%
LIMLPB09 5.58% 46.2%
LIMMDE09 3.25% 40.1%
LIMMEX09 0.10% 1.1%
LIMMIA09 3.09% 32.5%
LIMMVD09 5.05% 66.5%
LIMSAO09 2.88% 40.8%
LIMSDQ09 1.72% 18.9%
LIMUIO09 2.39% 24.0%
LPBSCL09 0.58% 6.2%
MDEMIA09 0.05% 0.6%
MDEUIO09 4.47% 59.0%
MEXSCL09 3.81% 34.8%
MEXUIO09 2.44% 28.6%
MIAMVD09 0.30% 3.2%
MIAPTY09 6.26% 107.0%
MIASCL09 1.30% 14.4%
MIAUIO09 1.20% 13.4%
MVDSCL09 0.99% 10.9%
PTYSJO09 0.00% 0.0%
SCLUIO09 0.43% 4.4%
Promedio 2,43% 29,1%
Ilustración T1: Errores porcentuales sobre las transformaciones exponenciales de las estimaciones del modelo RLog3.
0%
20%
40%
60%
80%
100%
120%
140%
Error Pij
95
ANEXO U: Datos para estimar mercados SCL-CWB, SCL-BHZ y SCL-POA.
Tabla U1: Datos mercados restringidos
Mercado Pax act. MIDT
Dist. Pobl. Orig.
Pobl. Dest.
Pobl. Viaj. Origen
Pobl. Viaj. Destino
GDP pc Orig.
GDP pc Dest.
SCL-CWB 30230 2,260 6.5 3.2 3.95 0.29 13281 12646 SCL-BHZ 25053 3060 6.5 4.9 3.95 0.30 13281 9843 SCL-POA 27068 1889 6.5 3.9 3.95 0.42 13281 13146
96
ANEXO V: Cálculo de los intervalos de confianza.
Se tiene que los residuos del modelo definitivo siguen una distribución normal con los siguientes parámetros:
𝑈 → 𝑁(𝜇 = 0;𝜎 = 0,36)
Luego, por el Teorema Central de Límite, se puede crear una nueva variable estandarizada Z, a partir de U, haciendo la siguiente transformación.
𝑍 =𝑈 − 𝜇𝜎 (1)
De esta forma, se tiene que:
𝑍 → 𝑁(0; 1)
Con esto, es posible determinar un valor 𝑍 tal que se cumpla la siguiente relación.
𝑃 −𝑍 ≤ 𝑍 ≤ 𝑍 = 1− 𝛼 (2)
Donde 𝛼 representa el nivel de confianza del intervalo a definir.
Reemplazando (1) en (2) y despejando la variable U, se obtiene la expresión siguiente.
𝑃 𝜇 − 𝑍𝜎 ≤ 𝑈 ≤ 𝜇 + 𝑍𝜎 = 1− 𝛼 (3)
De la cual, se determina que el intervalo de confianza 𝛼 está dado por:
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜: 𝜇 − 𝑍𝜎; 𝜇 + 𝑍𝜎
Además, por la simetría de la distribución de la variable Z, la expresión (2) es equivalente a:
𝑃 𝑍 > 𝑍 =1− 𝛼 2 (4)
Así, es posible determinar un valor para 𝑍 en función de 𝛼. En particular, para un 𝛼 de 5%, se tiene un 𝑍 de 1,96 y para un 𝛼 de 10%, se tiene un un 𝑍 de 1,65.
Luego, el intervalo de confianza 5% para los residuos del modelo RLog3 es:
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 95%: 𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑀𝑖𝑛 = −0,708 ;𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑀𝑎𝑥 = 0,708
97
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 90%: 𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑀𝑖𝑛 = −0,708 ;𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑀𝑎𝑥 = 0,708
Sumando los valores encontrados para Residuo Min y Residuo Max sobre las estimaciones arrojadas por el modelo, es posible encontrar intervalos para el logaritmo natural de pasajeros.
A continuación se presentan estos intervalos al 5% y al calculados para las estimaciones de los tres mercados restringidos evaluados en el Capítulo 9.
Tabla V13: Intervalos de confianza mercados restringidos
Intervalo 95% Intervalo 90%
Mercado Pax actuales
Ln (Pax actuales)
Estimación Ln (pax)
Ln (pax) Pax Intervalo 95%
Ln (pax)
Intervalo 95% Pax
SCL-CWB 30.230 10,317 11,175 [10,467 ;
11,883 ] [35.138 ; 144.846]
[10,579 ; 11,771 ]
[39.303 ; 129.498]
SCL-BHZ 25.053 10,129 10,917 [10,209 ;
11,626] [27.155 ; 111.937]
[10,321 ; 11,514]
[30.373 ; 100.075]
SCL-POA 27.068 10,206 11,606 [10,898 ;
12,315] [54.075
;222.909 ] [11,010 ; 12,203]
[60.485 ;199.289 ]
98
ANEXO W: Regresiones con la variable Pij ajusta por POS.
Tabla W1: Regresión lineal con variable Pij ajustada por POS.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟒𝟔.𝟗𝟐𝟕,𝟕𝟗𝟎 − 𝟓𝟓,𝟒𝟏𝟐 𝑫𝒊𝒋 + 𝟐.𝟗𝟕𝟕,𝟐𝟐𝟓 𝑷𝑷𝑶𝑺𝒊𝒋 + 𝟏𝟒.𝟔𝟖𝟓,𝟑𝟖𝟎 𝑨𝒊𝒋 + 𝟓,𝟑𝟖𝟎 𝑮𝒊𝒋
R2 aj. : 0,77
MAPE: 56%
Tabla W2: Tabla Resumen regresión lineal con variable Pij ajustada por POS.
Coef. T P valor Intervalo de confianza Cons. 46.927,790 2,24 0,027 [ 5.420,057; 88.435, 520 ] Dij -55,412 -9,00 0,000 [ -67,634 ; -43,190 ] PPOSij 2.977,225 3,91 0,000 [1.465,295 ; 4.489,155 ] Aij 14.685,380 11,40 0,000 [12.129,680 ; 17.241,080 ] Gij 5,380 7,04 0,000 [ 3.863; 6.898 ]
Tabla W3: Regresión gravitacional con variable Pij ajustada por POS.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟏𝟏.𝟔𝟐𝟕,𝟓𝟔𝟎 𝑫𝒊𝒋!𝟎,𝟖𝟓𝟏 𝑷𝑷𝑶𝑺𝒊𝒋
𝟎,𝟎𝟏𝟖𝑨𝒊𝒋𝟎,𝟕𝟕𝟐𝑮𝒊𝒋
𝟎,𝟕𝟒𝟓
R2 aj. : 0,93
MAPE: 41%
Tabla W4: Tabla Resumen regresión gravitacional con variable Pij ajustada por POS.
N° de obs. 102 F(4,97) 86,28 P valor 0,0000 R2 0,7806 R2 Ajust. 0,7716
N° de obs. 102 R2 0,9363 R2 Ajust. 0,9330
99
Coef. T P valor Intervalo de confianza Cons. 11.627,560 1,29 0,201 [-6.308,873 ; 29.563,990 ] Dij -0,851 -12,66 0,000 [ -0,984 ; -0,717 ] PPOSij 0,018 0,50 0,616 [ -0,054 ; 0,091 ] Aij 0,772 9,10 0,000 [ 0,604 ; 0, 941 ] Gij 0,745 12,58 0,000 [ 0,627; 0,863 ]
Tabla W5: Regresión log-log con variable Pij ajustada por POS.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟗,𝟗𝟓𝟓 − 𝟎,𝟗𝟗𝟗 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟐𝟑𝟕 𝐥𝐧 𝑷𝑷𝑶𝑺𝒊𝒋 + 𝟎,𝟒𝟖𝟐 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟖𝟑𝟏 𝐥𝐧 (𝑮𝒊𝒋)
R2 aj. : 0,77
MAPE: 2,68%
MAPE2: 32%
Tabla W6: Tabla Resumen regresión log-log con variable Pij ajustada por POS.
Coef. T P valor Intervalo de confianza Cons. 9,955 12,57 0,000 [ 8,383 ; 11,527 ] Ln(Dij) -0,999 -12,42 0,000 [ -1,159 ; -0,839 ] Ln(PPOSij) 0,237 5,71 0,000 [ 0,154 ; 0,319 ] Ln(Aij) 0,482 10,31 0,000 [ 0,390 ; 0,575 ] Ln(Gij) 0,831 9,97 0,000 [ 0,666 ; 0,997 ]
N° de obs. 102 F(4,97) 87,35 P valor 0,0000 R2 0,7827 R2 Ajust. 0,7737
100
ANEXO X: Gráficos de la variable distancia para evaluar segmentación.
Ilustración X10: Errores del modelo RL3 según distancia.
Ilustración X2: Errores del modelo RG3 según distancia.
-2-1
01
2
errorR3NA
0 2000 4000 6000 8000distancia
-.50
.51
1.5
2
errorRNL3NA
0 2000 4000 6000 8000distancia
101
Ilustración X3: Errores del modelo RLog3 según distancia.
-.50
.51
1.5
errorExpRLog3NA
0 2000 4000 6000 8000distancia
102
ANEXO Y: Regresiones con variables binarias.
Tabla Y1: Regresión lineal con variables binarias.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟖𝟕.𝟕𝟓𝟕,𝟗𝟕𝟎 − 𝟔𝟒,𝟑𝟏𝟎 𝑫𝒊𝒋 + 𝟏.𝟐𝟒𝟗,𝟔𝟏𝟔 𝑷𝒊𝒋 + 𝟏𝟎.𝟔𝟗𝟏,𝟗𝟏𝟎 𝑨𝒊𝒋 + 𝟐𝟑𝟑.𝟐𝟔𝟐,𝟑𝟎𝟎 𝑴𝑰𝑨 + 𝟏𝟏𝟕.𝟗𝟕𝟗,𝟗𝟎𝟎 𝑩𝑼𝑬 + 𝟖𝟕.𝟕𝟔𝟕,𝟒𝟏𝟎 𝑪𝑪𝑺+ 𝟏𝟎𝟑.𝟐𝟏𝟏,𝟗𝟎𝟎 𝑺𝑪𝑳
R2 aj. : 0,82
MAPE: 68%
Tabla Y2: Tabla Resumen regresión lineal con variables binarias.
Coef. T P valor Intervalo de confianza Cons. 87.757,970 5,20 0,000 [ 54.270,980 ; 121.245,000] Dij -64,310 -11,21 0,000 [-75,699 ; -52,922 ] Pij 1.249,616 6,61 0,000 [ 874,326 ; 1.624,906 ] Aij 10.691,910 7,85 0,000 [7.987,562 ; 13.396,270 ] MIA 233.262,300 9,42 0,000 [ 184.103,400 ; 282.419,200] BUE 117.979,900 4,85 0,000 [69.640,950 ; 166.118, 800] CCS 87.767,410 3,40 0,001 [36.560,030 ; 138.974,800] SCL 103.211, 900 4,39 0,000 [ 56.511,780 ; 149.912,000 ]
Tabla Y3: Regresión gravitacional con variables binarias.
Expresión Indicadores
𝑻𝒊𝒋 = 𝟒𝟔.𝟐𝟎𝟎.𝟎𝟎𝟎 𝑫𝒊𝒋!𝟏,𝟎𝟔𝟒 𝑷𝒊𝒋
𝟎,𝟑𝟓𝟒𝑨𝒊𝒋𝟎,𝟓𝟑𝟕𝑩𝑼𝑬𝟎,𝟔𝟑𝟐𝑪𝑪𝑺𝟎,𝟖𝟕𝟖𝑴𝑰𝑨𝟏,𝟓𝟎𝟗
R2 aj. : 0,96
MAPE: 30%
Tabla Y4: Tabla Resumen regresión gravitacional con variables binarias.
N° de obs. 102 F(7,94) 67,75 P valor 0,0000 R2 0,8346 R2 Ajust. 0,8223
N° de obs. 102 R2 0,9672 R2 Ajust. 0,9647
103
Coef. T P valor Intervalo de confianza Cons. 46.200.000,000 1,99 0,049 [ 116.037,600 ; 92.000.000,000] Dij -1,064 -15,25 0,000 [-1,202 ; -0,925 ] Pij 0,354 7,46 0,000 [ 0,260 ; 0,448 ] Aij 0,537 10,56 0,000 [ 0,436 ; 0,637] BUE 0,632 6,27 0,000 [0,432 ; 0,833 ] CCS 0,878 8,20 0,000 [ 0,665 ; 1,090 ] MIA 1,509 15,30 0,000 [ 1,313 ; 1,705 ]
Tabla Y5: Regresión log-log con variables binarias.
Expresión Indicadores
𝐥𝐧 𝑻𝒊𝒋 = 𝟏𝟑,𝟒𝟎𝟏 − 𝟏,𝟏𝟑𝟖 𝐥𝐧 𝑫𝒊𝒋 + 𝟎,𝟒𝟔𝟒 𝐥𝐧 𝑷𝒊𝒋 + 𝟎,𝟑𝟎𝟗 𝐥𝐧 𝑨𝒊𝒋 + 𝟎,𝟒𝟔𝟔 𝐥𝐧 𝑮𝒊𝒋+ 𝟎,𝟒𝟎𝟔 𝑩𝑼𝑬 + 𝟎,𝟓𝟒𝟖 𝑪𝑪𝑺 + 𝟎,𝟐𝟎𝟐 𝑺𝑪𝑳 + 𝟎,𝟖𝟕𝟕𝑴 𝑴𝑰𝑨
R2 aj. : 0,87
MAPE:
MAPE2: 24%
Tabla Y6: Tabla Resumen regresión log-log con variables binarias.
Coef. T P valor Intervalo de confianza Cons. 13,401 11,58 0,000 [11,103 ; 15,700] Ln(Di)j -1,138 -17,34 0,000 [-1,269 ; -1,008 ] Ln(Pij) 0,464 9,96 0,000 [ 0,371 ; 0,556 ] Ln(Aij) 0,309 7,28 0,000 [ 0,225 ; 0,393 ] Ln(Gij) 0,466 3,79 0,000 [0,222 ; 0,710 ] BUE 0,406 4,13 0,000 [0,211 ; 0,601 ] CCS 0,548 5,13 0,000 [ 0,336 ; 0,760 ] SCL 0,202 2,19 0,031 [ 0,019 ; 0,386 ] MIA 0,877 4,68 0,000 [ 0,505 ; 1,249 ]
N° de obs. 102 F(8,93) 83,13 P valor 0,0000 R2 0,8773 R2 Ajust. 0,8668
104
ANEXO Z: Demostración interpretación log-log.
Para esta demostración, se toma la regresión log-log simple:
ln 𝑌 = 𝛽! + 𝛽!ln (𝑋) (1)
Luego, también se tiene que:
ln 𝑌 + ∆𝑌 = 𝛽! + 𝛽!ln (𝑋 + ∆𝑋) (2)
Entonces, (2)-(1):
ln 𝑌 + ∆𝑌 − ln 𝑌 = 𝛽! + 𝛽! ln 𝑋 + ∆𝑋 − [𝛽! + 𝛽! ln 𝑋 ]
ln 𝑌 + ∆𝑌 − ln 𝑌 = 𝛽![ln 𝑋 + ∆𝑋 − ln (𝑋) (3)
Para valores de ∆𝑋 pequeños existe la siguiente aproximación:
ln 𝑋 + ∆𝑋 − ln (𝑋) ≅∆𝑋𝑋
Luego, aplicando esta aproximación, la expresión (3) queda:
∆𝑌𝑌 ≅ 𝛽!
∆𝑋𝑋
𝛽! =∆𝑌/𝑌∆𝑋/𝑋
Es decir, 𝛽!es el ratio del cambio porcentual de Y asociado a un cambio porcentual en X.
105
ANEXO AA: Fuentes de información variable Eij.
Tabla AA14: Fuentes de información Eij.
País Fuente AR,BR,PY,UY
<www.cei.gov.ar/node/26>
CO <www.mincomercio.gov.co>
PE <www.siicex.gob.pe/siicex/portal5ES.asp?_page_=160.00000>
<www.aduanet.gob.pe/aduanas/informae/2010/importacion/rankingPaisOrigen.html>
CL Banco central
VE <www.ine.gob.ve/comercio/comercioindice.asp
US <www.census.gov/foreign-trade/balance/
EC <www.bce.fin.ec/frame.php?CNT=ARB0000768
PA <www.contraloria.gob.pa/inec/ComercioExterior/
CR <www.mideplan.go.cr/sides/economico/indx06.htm
GT <www.banguat.gob.gt/estaeco/comercio/envolver2.asp?kpath=/estaeco/comercio%2Fpaises%2F2010%2FCG%2Famerica+del+sur%2F&karchivo=America+del+SurDB005%2EHTM>
<www.banguat.gob.gt/estaeco/comercio/default.asp?kactual=2>
MX <www.inegi.gob.mx/prod_serv/contenidos/espanol/bvinegi/productos/continuas/economicas/exterior/mensual/ece/ecem.pdf>