Ciencia cubana: síntomas, tendencias y patrones.

Autores: Yasset Perez-Riverol (@ypriverol)

Citación: Yasset Perez-Riverol. (2020, March 2). ypriverol/cubascience: First release (Version v1.0.0). Zenodo.

Introducción

El desarrollo científico y tecnológico es un de los factores más influyentes sobre la sociedad contemporánea. El desarrollo actual, la riqueza y esperanza de vida que hoy experimenta la población mundial sería impensable sin el avance de las fuerzas productivas que la ciencia y la tecnología han hecho posibles.

Adam Smith en su libro Riqueza de la Naciones describía: "el gran incremento en la labor que un mismo número de personas puede realizar como consecuencia de la división del trabajo se debe a tres circunstancias diferentes; primero, al aumento en la destreza de todo trabajador individual; segundo, al ahorro del tiempo que normalmente se pierde al pasar de un tipo de tarea a otro; y tercero, a la invención de un gran número de máquinas que facilitan y abrevian la labor, y permiten que un hombre haga el trabajo de muchos

No todos los avances en la maquinaria, sin embargo, han sido invenciones de aquellos que las utilizaban. Muchos han provenido del ingenio de sus fabricantes, una vez que la fabricación de máquinas llegó a ser una actividad específica por sí misma; y otros han derivado de aquellos que son llamados filósofos o personas dedicadas a la especulación, y cuyo oficio es no hacer nada pero observarlo todo; por eso mismo, son a menudo capaces de combinar las capacidades de objetos muy lejanos y diferentes.

Es así que los países que hoy más crecimiento económico experimentan son los que más invierten en desarrollo científico y tecnología. La inversión global en investigación y desarrollo para 2019 alcanzó su mayor valor 1.7 trillones de dólares americanos. Pero solo el 80% de la inversión global en investigación la relaizan 10 países (http://uis.unesco.org/apps/visualisations/research-and-development-spending/). Estados Unidos y los países europeos invirten como promedio desde 1996 el 2% de su producto interno bruto (GDP) un valor mayor a los 400 billones de dólares. La inversión en investigación y desarrollo tiene que ser sostenida para poder obtener resultados. Por ejemplo, el tiempo promedio para formar un investigador principal desde que comienza la universidad son 27 años (https://www.pnas.org/content/pnas/112/2/313.full.pdf), por otra parte el tiempo promedio para el desarrollo de un fármaco desde la fase investigación hasta que se comienza a utilizar en pacientes es de 17 años (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3241518/). A diferencia de sectores de la economía como el turismo, la industria, o la agricultura la materia prima fundamental del desarrollo científico son las personas y el conocimiento formado.

El siguiente documento presenta una análisis de la producción científica de Cuba en las últimas dos décadas (1996-2018). Si bien los logros de la medicina y la biotechnología cubana son conocidos (sobre todo en la producción de vacunas y anticuerpos monoclonales - https://www.nature.com/articles/457130a) es importante estudiar algunos parámetros que pueden describir más en detalle la salud y productividad de la ciencia cubana. Estas métricas pueden predecir el futuro comportamiento de la investigación científica en Cuba y facilitar la toma de decisiones políticas, económicas, y estructurales.

Algunas preguntas a responder:

  • Es la producción científica homogenea en todo el país o se concentra en unos pocos centros?
  • Crece la producción científica en Cuba?
  • Como se comporta la producción científica en Cuba con respecto a América Latina y el Mundo?
  • Cuales son los áreas de investigación y regiones del país experimentan mejor salud (más productividad)?

Existen diferentes factores que permiten estudiar la salud de la investigación científica (número de centros de investigación, cantidad de investigadores, masters y doctores por habitante, presupuesto anual que invertido en investigación y desarrollo). Todos estas métricas son públicas en la mayoría de los países del mundo pero no existe una forma fácil de obtenerlas en el caso de Cuba. Por esta razón, empleé para este estudio otras métricas igualmente importantes que describen la producción científica de un país, ellas son: la cantidad de artículos cientifíficos publicados cada año y su impacto; ii) la cantidad de patentes internacionales.

  • Un artículo científico (a veces también llamado paper/manuscript como anglicismo) es un trabajo de investigación o comunicación científica publicado en alguna revista especializada. Su impacto se cuantifica mediante el número de veces que otros autores lo mencionan en sus publicaciones (número de citaciones). El número de citaciones se debe no solo al impacto de la investigación, también el campo de investigación y el tipo de resultados. Por ejemplo, los artículos sobre ciencias básicas, que explican fenómenos biológicos o principios físico/químicos tienen más impacto para la ciencia que su correspondientes aplicaciones (e.g. fármacos, software). Para estudiar esta métrica se emplearon datos públicos de diferentes recursos como: Scimago Journal & Country Rank (https://www.scimagojr.com/) y Web of science (https://apps.webofknowledge.com/).

  • Una patente es un conjunto de derechos exclusivos concedidos por un Estado al inventor de un nuevo producto o tecnología, susceptibles de ser explotados comercialmente por un período limitado de tiempo, a cambio de la divulgación de la invención. Las patentes estan más vinculadas al impacto de las aplicaciones de la investigación científica. Por lo general, las patentes se relacionan más a productos (e.g. fármacos, medicamentos) y a procesos tecnológicos (e.g. proceso para la producción de alimentos o extracción de petróleo). Para esta métrica se seleccionó de World Bank Open Data (https://data.worldbank.org/).

In [1]:
import plotly_express as px
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np
import matplotlib.pyplot as plt
import plotly.graph_objects as go
from plotly.offline import iplot, init_notebook_mode
init_notebook_mode()

1. Cantidad de artículos científicos Latinoamericanos entre (1970 - 2019)

In [2]:
data_publications = pd.read_csv('data/country-latin-papers.csv')
fig = go.Figure()
fig.add_trace(go.Bar(x=data_publications.Pais, y=data_publications['Articulos']))
fig.update_layout(
     title="Total de artículos Latinoamericanos (1970 -2019)",title_x=0.5,
     yaxis_title="Cantidad de artículos")

iplot(fig)

La producción científica en América Latina es profundamente desigual. Entre 1970 - 2019, Brazil publicó más de 1 millon de artículos científicos, seguido por países como Mexico (352 mil), Argentina (268 mil), Chile (182 mil), Colombia (99 mil), Venezuela (50 mil), Cuba (31 mil).

Entre las 10 primeras instituciones en publicar en América Latina, 5 son Brasileñas:

  • UNIV. DE SAO PAULO (264,594)
  • UNIV. NACIONAL AUTONOMA DE MEXICO (103,013)
  • CONSEJO NACIONAL DE INVESTIGACIONES CIENTIFICAS Y TECNICAS CONICET (98,334)
  • UNIV. ESTADUAL DE CAMPINAS (74504)
  • UNIV. OF BUENOS AIRES (74317)
  • UNIV. ESTADUAL PAULISTA (67826)
  • UNIV. FEDERAL DO RIO DE JANEIRO (65333)
  • UNIV. DE CHILE (53804)
  • UNIV. FEDERAL DO RIO GRANDE DO SUL (51185)

La primera institución en América Latina es la Universidad de Sao Paulo (264,594) la cual publica más del doble de las publicaciones que la siguiente institución, la Universidad Autónoma de Mexico (103,013).

Es interesante entender que todas estas instituciones por si solas publican más artículos científicos que todas las instituciones cubanas (31226).

In [3]:
data_publications['ratio'] = data_publications['Articulos']/data_publications['Habitantes']
fig = go.Figure()
fig.add_trace(go.Bar(x=data_publications.Pais, y=data_publications['ratio']))
fig.update_layout(
     title="Total de artículos Latinoamericanos / cantidad de habitantes (1970 -2019)",title_x=0.5,
      yaxis_title="Cantidad de artículos por habitante"
)
iplot(fig)

Si normalizamos la cantidad de artículos por habitante* los países que mejor indicador presentan son Chile, Uruguay, Argentina, Brazil y Mexico quedando Cuba séptimo lugar en América Latina cerca de países como Panama y Colombia.

Un factor intesante en a producción científica brasileña es que de las 20 primeras instituciones que más publican en Brasil, 18 son universidades, solo la fundación Oswaldo Cruz y EMBRAPA se encuentran en esta lista.

Comment: * Lo ideal sería normalizar con respecto a cantidad de investigadores pero este número no es público para muchos países, includido Cuba.

Ahora bien, Como es la distribución de artículos cientificicos en Cuba?

In [4]:
from IPython.display import IFrame
IFrame(src='data/cuba-manuscripts.html', width=700, height=600)
Out[4]:
In [5]:
institutes = pd.read_csv('data/centers-publications.csv')
fig = px.treemap(institutes, path=['Pais', 'Instituto'], values='Articulos',
                  color_continuous_scale='RdBu',
                  color_continuous_midpoint=np.average(institutes['Articulos'], weights=institutes['Articulos']))
fig.update_layout(title="Mapa de las publicaciones cubanas por institución, incluyendo colaboradores de instuciones internacionales", title_x=0.5)
fig.show()

El 70% de las publicaciones científicas cubanas (desde 1970-2019) se concentra en 11 Instituciones Académicas, ellas son: Universidad de la Habana (6089), Universidad Marta Abreu (1794), ICA (1536), CIGB (1356), Instituto PEDRO KOURI (1127), Universidad de Santiago de Cuba (1020), Universidad de Cienfuegos (890), Academica de Ciencias de Cuba (848), CIM (493), Universidad de Holguin (492) Universidad de Matanzas (451), Instituto de Neurociencias (440). Más del 50% de la producción científica de Cuba se concentra en la Ciudad de la Habana, siendo la Universidad Marta Abreu de las Villas la única institución con más de 1500 publicaciones. El mapa de la Isla muestra que el 73 porciento de las publicaciones se realizan en la ciudad de la Habana.

Si comparamos la cantidad de publicaciones entre la Universidad de Sao Paulo y la Universidad de la Habana (normalizando contra la cantidad de habitantes) podemos observar que la cantidad de árticulos por habitante que se producen en la Universidad de la Habana (0.003) es un orden de magnitud menor que la cantidad de articulos que se producen en la Universidad de Sao Paulo (0.022). Este comportamiento es similar para otras universidades del país como Santiago de Cuba (0.002).

Contrario a la persección general, la mayoría de las colaboraciones científicas en Cuba son con los Estados Unidos, seguida de las colaboraciones con Francia, Italia, Mexico Alemania y Rusia. Existe mu poca colaboración activa con otras Universidades latinoamericanas y China. Interesantemente, si bien la integración económica y política entre Cuba y Venezuela en los últimos 20 años es evidente, esto no ocurrio en el campo científico.

Los números globales anteriores comprenden el período (1970 - 2019), sin embargo el desarrollo cientítico cubano (en el desarrollo científico en cualquier lugar del mundo) no se puede analizar en un solo número global comprendiendo un período tan extenso. Está la producción cientifífica cubana creciendo?. Como han crecido los países de la región y del Mundo en los últimos 20 años?. Que impacto tiene la ciencia cubana globalmente?

Para contestar esas preguntas se necesita estudiar por años la producción científica cubana. Para ello, hemos curado una lista de las publicaciones por año para diferentes países del mundo en el tiempo comprendido entre 1996 y 2019 (https://www.scimagojr.com/).

 2. Evolución de artículos científicos cubanos (1996-2018)

Para poder analizar el desarrollo científico en las últimas dos decadas en todo el mundo, seleccionamos como métrica la cantidad de árticulos publicados por año en cada país y la cantidad de citaciones por año. En los siguientes dos gráficos se muestra la relación entre cantidad de artículos científicos (eje x) y la cantidad de citaciones (eje y) en el período comprendido entre 1996-2018 para diferentes países. El tamaño de las esferas corresponde al número de citaciones por artículo.

Para una mejor visualización de estos datos se dividieron en dos grandes grupos:

  • En el primer gráfico: los países que tenían en 1996 cerca de 100 artículos y menos de 60 mil citaciones. En este grupo se encuentra Cuba.

  • En el segundo gráfico: los países con mayor producción científica entre 10 mil artículos (período 1996 - 2018). Tres países de la región Argentina, Brazil y Mexico se encuentran en este grupo. Los Estados unidos no aparecen en la gráfica porque tienen más de 4 millones de citaciones por año desde 1996.

In [6]:
data_publications_low = pd.read_csv('data/publications-low.csv')
fig = px.scatter(data_publications_low, x="Citable documents", y="Citations", 
           animation_frame="Year", animation_group="Country",
           size="Citations per document", color="Country", hover_name="Country", facet_col="continent", 
           log_x = True, 
           size_max=45, range_x=[50,20000], range_y=[1,60000])
fig.update_layout(title="Evolución de publicaciones entre 1996 y 2018",title_x=0.5, 
                  yaxis_title="Cantidad de citaciones totales", 
                  xaxis_title="Cantidad de publicaciones totales")
fig.show()
In [7]:
data_publications_high = pd.read_csv('data/publications-high.csv')
fig = px.scatter(data_publications_high, x="Citable documents", y="Citations", animation_frame="Year", animation_group="Country",
           size="Citations per document", color="Country", hover_name="Country", facet_col="continent",  
           log_x = True, 
           size_max=45, range_x=[2000,1000000], range_y=[20000,4000000])
fig.update_layout(title="Evolución de publicaciones entre 1996 y 2018 para países con altos índices de publicación", 
                  yaxis_title="Cantidad de citaciones totales", 
                  xaxis_title="Cantidad de publicaciones totales",title_x=0.5)
fig.show()

En 1996, Cuba publicaba alrededor de 795 artículos científicos, en 2016 (1868). Si bien en dos décadas se han duplicado el número de publicaciones (2.3) en un año, la media de crecimiento para el resto de los países de su mismo grupo ( países con menos de 10 mil publicaiones por año) es de 14.4. Países como Chile y Colombia produjeron 7.5 y 19 veces más artículos científicos en 2018 de los que publicaban en 1996. El gráfico del primer grupo muestra el gran crecimiento que han tenido en la última década páises como Ecuador con 43 y Perú 14 veces más número de publicaciones en 2019 que en 1996.

Un gráfico más detallado de la cantidad de artículos por año para diferentes países latinoamericanos muestra el crecimiento de países como Chile, Colombia, Ecuador y Perú.

In [8]:
america = data_publications_low.loc[data_publications_low['continent'] == 'Sur America']

fig = go.Figure()
for region, geo_region in america.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region['Citable documents'],
                    name=region, fill='tozeroy')
    
fig.update_layout(title="Número de artículos por año para países Latinoamericanos",
                  yaxis_title="Número de artículos", 
                  xaxis_title="Año",
                  title_x=0.5)
iplot(fig)

En el 2012, la mayoría de los países europeos con excepción de Albania tenían más de 20 mil citaciones por año. De 1996 a 2010 la cantidad de citaciones de Colombia y Chile pasaron de menos de 40 mil citas a más de 60 mil citas por año, mientras que para Cuba el número de citaciones se ha mantenido entre 10 mil y 20 mil citaciones en el mismo período (siguiente gráfico), como la cantidad de citaciones promedio por artículos se mantiene constante (cerca de 14 citaciones por artículo) puede que muchos artículos cubanos no tengan citaciones o que el número mayor de citaciones se concentre solo en unos pocos trabajos.

El número de citaciones de los artículos cubanos es como promedio 8 citaciones, un número muy bajo si compara con otros países de la región, Chile (19) o Colombia (15), Brazil (14) o Mexico (14). Este fenómeno puede estar vinculado con el hecho de que las publicaciones cubanas en su mayoría no son ciencia básica, sino aplicada (productos, etc) lo cual tiene un impacto mucho menor.

Importante: Para todos los países el número de citaciones es menor en años recientes porque las citaciones son acumulativas por año.

In [9]:
plt.figure(figsize=(20,10))

import plotly.graph_objects as go

fig = go.Figure()
america = america.query('Year < 2016')
fig = px.bar(america, x="Citations per document", y="Year", color='Country', orientation='h')

# for region, geo_region in america.groupby('Country'):
#     fig.add_trace(go.Bar(x=geo_region.Year, y=geo_region['Citations per document'], name=region))

fig.update_layout(title="Número de citaciones por artículo científico para países Latinoamericanos",
                  yaxis_title="Año", 
                  xaxis_title="Número de citaciones por artículo",
                  title_x=0.5)
iplot(fig)
<Figure size 1440x720 with 0 Axes>

Publicaciones en los países que más publican

El análisis de los países que más publican en el Mundo (e.g. Estados Unidos, Inglaterra, Israel o Brazil) muestra que la producción científica en estos países se ha multiplicado por 4 en las últimas dos décadas. Interesantemente, China es el único país de este grupo que publica 18 veces más de lo que publicaba en 1996. Para que tengamos una idea en números para 2018 China publicó 569227 artículos científicos, solo 800 menos que Estados Unidos.

De igual forma, el impacto de la investigación ha crecido exponencialmente en estos países. China es el ejemplo más significativo que ha pasado de menos de 500 mil citaciones en 1996 a más de 4 millones. Los países europeos son los que invierten (de manera general) en investigación con un mayor impacto para la comunidad científica.

In [10]:
difference = (data_publications_low.query('Year==[2018,1996]')
 .sort_values('Citable documents',ascending=False)
 .groupby('Country',sort=False)
 .agg(fst=('Citable documents','first'), lst=('Citable documents','last'))
 .assign(division=lambda x: x.fst.div(x.lst))
 )
In [11]:
difference = (data_publications_high.query('Year==[2018,1996]')
 .sort_values('Citable documents',ascending=False)
 .groupby('Country',sort=False)
 .agg(fst=('Citable documents','first'), lst=('Citable documents','last'))
 .assign(division=lambda x: x.fst.div(x.lst))
 )

3. Autores cubanos con más de mil citaciones.

La ciencia y el desarrollo científico se soporta sobre el conocimiento acumulado y los científicos. Una pregunta importante es:

  • Cuales son los líderes científicos en Cuba, en que momento están de su carrera?.
  • Cual es el impacto de la emigración en la producción científica en Cuba?

Los datos para el siguiente gráfico fueron recopilados manualmente de Google Scholar, ResearchGate (https://github.com/ypriverol/cubascience/blob/master/data/authors-most-publications.csv). Si usted conoce autores cubanos residentes con más de mil citaciones puede adicionarlos a la lista o reportarlo aquí (https://github.com/ypriverol/cubascience/issues).

In [12]:
authors = pd.read_csv('data/authors-most-publications.csv')
fig = px.scatter(authors, x="Year-Publication", y="Citaciones",
	         size="H-index", color="Pais", hover_name="Pais", log_y=True, size_max=60)
fig.show()

La mayoría de los autores cubanos con más de 1000 citaciones científicas han comenzado su carrera en la Isla en el periodo comprendido entre 1970-1995. Mientras que el resto de los autores más jóvenes (aquellos que comenzaron su carrera entre 1995 - 2010) viven fuera de la Isla.

Este patrón muestra un escenario complejo para el futuro de la Isla ya que la mayoría de los científicos jóvenes con altos indices de impacto viven fuera de la Isla, mientras que la generación que comenzó su carrera de 1970 - 1995 (científicos mayores de ~48 años) se mantiene la mayoría en la Isla.

El h-index (número n de publicaciones que han sido citadas más de n veces) de los científicos cubanos que radican en la Isla es similar al de los autores que viven fuera de la Isla, siendo los científicos radicados en España los que más h-index tienen.

4. Evolución de patentes internacionales (1980 - 2018)

Una patente es un conjunto de derechos exclusivos concedidos por un Estado/País al inventor de un nuevo producto o tecnología, susceptibles de ser explotados comercialmente por un período limitado de tiempo, a cambio de la divulgación de la invención. Las patentes son el vehículo por el cual los investigadores y creadores pueden proteger su investigación (e.g. fármaco, algoritmo computacional) de que sea empleado comercialmente por otros investigadores, empresas, corporaciones. Este derecho concede al titular de la patente exclusividad e impide a terceros hacer uso de la tecnología patentada. El titular de la patente es el único que puede hacer uso de la tecnología que reivindica en la patente o autorizar a terceros a implementarla bajo las condiciones que el titular fije.

La sociedad moderna se soporta sobre millones de patentes que se crean cada año detrás de cada medicamente, efecto electrodómestico, alimento que consumimos, Internet, etc. Solo en 2018, Samsung, Apple y Google registraron 5850, 2160 y 2070 patentes respectivamente. Aunque no todas las patentes terminan convirtiendose en un producto final y ofreciendo ganancias, son un parámetro importante para entender la ciencia aplicada y como la misma puede tener un impacto real en la economía.

El siguiente análisis estudia la evolución en el Mundo, de las patentes internacionales aplicadas por residentes. La fuente de información https://data.worldbank.org/. En algunos años no existe información. Para el análisis se emplearon las publicaciones entre 1980 y 2018 y se dividiron los países por continente y cantidad de patentes para una mejor visualización.

In [13]:
data_patents = pd.read_csv('data/number-patents.csv')
data_patents['Year'] =  pd.to_datetime(data_patents['Year'], format='%Y')
data_patents = data_patents.set_index(data_patents.Year)

4.1 Países Asiáticos con más de mil patentes por año (China, Japón, Sur Corea, India)

Los cuatro países que más patentes registran cada año son China, Japón, Sur Corea y la India. En 1980, Japón lidereaba el continente con alrededor de 200 mil patentes por año. Este crecimiento en los 80's fue propiciado por el crecimiento en los sectores técnologicos, video juegos y de electrónicos; este crecimiento "desmedido" desató una guerra de patentes entre Estados Unidos y Japón en la cúal cada patente se peleaba con otra patente por de la competencia ("fight patent with patent").

En los años 90's Corea del Sur comienza su desarrollo technológico y comienza a registrar alrededor de 100 mil patentes por año. Hacia 2015, Corea del Sur y Japón dejaron de crecer en la producción de patentes y han mantenido un número sostenido de registroentre 150 mil y 240 mil patentes al año respectivamente. En el caso Japón la cantidad de registros por año ha decrecido en casi 100 mil patentes entre el año 2000 y 2015, pero sigue siendo el segundo país asiático en producción intelectual.

In [14]:
values = data_patents[data_patents['Continent'].str.contains('Asia')]
values_high = values[values['Country'].str.contains('China|Japan|Korea|India')]
values_low = values[~values['Country'].str.contains('China|Japan|Korea|India|Australia')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Asiáticos ( más de mil patentes por año)",title_x=0.5)
iplot(fig)

El caso más significativo es China, la cual ha experimentado un crecimiento exponencial entre 1980 y 2018 pasando de unas 1000 patentes por año en 1980 a casi 1.3 millones en 2018. Para 2018, China era el primer país del mundo con mayor cantidad de patentes en telecomunicaciones, liderado por sus dos grandes compañias Huawei and ZTE, por delante de gigantes de las comunicaciones como Intel (Estados Unidos), Samsung (Corea del Sur) o Ericsson (Suecia).

In [15]:
import plotly_express as px
import pandas as pd
import plotly.graph_objs as go

companies = pd.read_csv('data/corporations.csv')
fig = px.bar(companies, x="Count", y="Company", color='Country', orientation='h')
fig.update_layout(yaxis_title="Compañias", 
                  xaxis_title="Cantidad de patentes solicitadas en 2018",title_x=0.5)
fig.show()

Si bien, los tres gigantes asiáticos lideran el registro de patentes a nivel mundial a niveles similares y superiores (en el caso de China) a países como Estados Unidos, Canada o Inglaterra; los demás países de la región registran 2 órdenes de magnitued manos patentes (~2 mil patentes por año). Sin embargo, toda mayoría de los países de la región experimentan un crecimiento positivo con casos muy significativos como Singapur, Vietnam, Israel, Indonesia y Malasia.

In [16]:
fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países asiáticos",title_x=0.5)
iplot(fig)

4.2 Países Europeos con más de 10 mil patentes por año (Alemania, Reino Unido, Francia, Rusia)

El escenario de los países líderes en Europa es muy diferente a los tres gigantes asíaticos (China, Japón y Corea del Sur). En el viejo continente solo Alemania a mantenido un crecimiento en el número de patentes registradas en los últimos 20 años, un número dos veces mayor que los otros países de la región (Francia, Rusi e Inglaterra). Entre 1990 y 1995 el número de patentes rusas disminuyó drasticamente de 40 mil a 15 mil patentes al año. Sin embargo, la investigación y desarrollo rusos a experimentado un sostenido crecimiento reportanto en 2015 cerca de 30 mil patentes un número superior a Inglaterra y Francia.

El resto de los países Europeos han mantenido el número de patentes por año entre 2 mil y 8 mil patentes, con excpción de Italia la cual ha mantenido desde el año 2000 el registro de 8000 patentes cada año. Algunos otros patrones interesantes:

  • Los países ex-miembros de la Unión Soviética como Polonia, Rumani, Bulgaria reducieron su número de patentes en 1985 de 3 mil patentes como promedio a menos de mil patentes. Solo Polonia a partir de 2005 a comenzado a revertir este patrón de decrecimiento y para 2015 (10 años despúes) ha comenzado a registrar nuevamente cerca de 4 mil patentes por año.

  • A partir de 2008 (a raíz de la crisis económica y financiera), España comenzó a decrecer en el número de patentes registradas, registrando un decrecimiento de casi mil patentes en 2017 con respecto a 2018 (tendencia que no parece revertirse).

  • Turquía es el país que más he crecido en el continte (200 pantentes en el año 2000 a 8 mil patentes en el año 2017).

In [17]:
values = data_patents[data_patents['Continent'].str.contains('Europe')]
values_high = values[values['Country'].str.contains('Germany|Russia|United Kingdom|France')]
values_low = values[~values['Country'].str.contains('Germany|Russia|United Kingdom|France')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Europeos (más de 10 mil patentes por año)",title_x=0.5)
iplot(fig)
In [18]:
fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Europeos",title_x=0.5)
iplot(fig)

 4.4 Situación en países de América Latina

Los países que más patentes registras cada año en la región son Brazil, Mexico, Chile, Colombia, Venezuela, Aregentina (más de 500 patentes por año). El gigante sudamericano Brazil a triplicado la cantidad de pantentes por años de 1980 (2 mil patentes por año) a 2017 (6 mil pantenes por año). Brazil registró en 2017 más patentes que la suma de las patentes registradas por Chile, Mexico, Venezuela, Colombia y Argentina.

 Análisis de Cuba

Cuba En 1985 Cuba registró 214 patentes internacionales, para 2018 este número era solo 29. Si bien en Latinoamerica se observa una tendencia estable con respecto a la creación de patentes, países como Perú, Ecuador, Brazil y Mexico han montrado un incremento sustancial (4 veces más patentes en 2017 con respecto a 1980) del número de patentes por año. Cuba es el país que más a caído en la producción de patentes en los últimos 20 años (https://www.wipo.int/ipstats/en/statistics/country_profile/profile.jsp?code=CU).

En 2018 las patentes registradas por Cuba fueron:

  • CENTRO DE INGENIERIA GENETICA Y. BIOTECNOLOGIA (3)
  • CENTRO DE INMUNOLOGIA MOLECULAR (3)
  • EMPRESA DE INGENIERIA Y SERVICIOS TECNICOS AZUCAREROS TECNOAZUCAR (3)
  • CORPORACION HABANOS, S.A. (1)
  • EMPRESA CUBANA DEL TABACO (CUBATABACO) (1)
  • EMPRESA DE TORREFACCION Y COMERCIALIZACION DE CAFE,CUBACAFE (1)

La biotecnología sigue siendo el único sector de innovación en la isla, lidereado por dos instituciones: Centro de Ingeniería Genética y Biotecnología (CIGB) y el Centro de Inmunología Molecular (CIM). En el Polo biotécnologico cubano de la capital se agrupan varias instituciones:

El CIGB patenta casi 10 más veces que todos los otros centros de investigación juntos. Para que tengamos una idea, la empresa Amgen ha publicado una total de 7 mil patentes desde su creación y la compañia británica biotécnologica Astrazeneca publicó solo en 2018, 32 patentes (https://patents.google.com/?assignee=Astrazeneca&before=priority:20181231&after=priority:20180101&language=ENGLISH&type=PATENT&num=100).

En el presente estudio no encontramos, patentes en otros sectores de la economía como las comunicaciones, el sector technológico y de la computación.

In [19]:
values = data_patents[data_patents['Continent'].str.contains('South America')]
values_high = values[values['Country'].str.contains('Brazil|Mexico|Argentina|Venezuela|Chile|Colombia')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Latinoamericanos",title_x=0.5)

iplot(fig)
In [20]:
values_low = values[~values['Country'].str.contains('Brazil|Mexico|Argentina|Venezuela|Chile|Colombia')]
fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Latinoamericanos",title_x=0.5)
iplot(fig)
In [21]:
values = data_patents[data_patents['Continent'].str.contains('North America')]
fig = go.Figure()
for region, geo_region in values.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

#fig.update_layout(title="Gráfico 7: Número de Patentes internacionles para Estados Unidos y Canada",title_x=0.5)
#iplot(fig)

 Conclusiones

El desarrollo científico y tecnológico es uno de los factores más influyentes sobre la sociedad contemporanea y el crecimiento económico de un país. Los países que mayor producto interno bruto per cápita obstentan en el planeta, son de igual forma los que más invierten en ciencia y técnologia. El presente trabajo ha intentado revelar algunos patrones y tendencias en la ciencia cubana en los último 20 años y compararlos otros países del mundo y en especial de la región (Latinoamérica). El artículo no pretende buscar las causas o proner soluciones para revertir o incrementar la producción científica sino clarificar los números reales del impacto de la ciencia cubana y predecir su futuro desarrollo.

El 73% de las publicaciones cubanas se realizan en instituciones de la Ciudad de la Habana y más del 85% solo entre las provincias de la Habana, Santa Clara y Santiago de Cuba. Este patrón evidencia la concentración del capital científico e innovador en la capital de la Isla con respecto al resto del país. Esta concentración en la Ciudad de la Habana tampoco es homogénea y se concentra en tres grandes instituciones La Universidad de la Habana, El Centro de Ingeniería Genética y Biotecnología y el Centro de Inmunología Molecular.

Si comparamos la cantidad de publicaciones entre la Universidad de Sao Paulo (Universidad que más publica en latinoamérica) y la Universidad de la Habana (normalizando contra la cantidad de habitantes) podemos observar que la cantidad de árticulos por habitante que se producen en la Universidad de la Habana (0.003) es un orden de magnitud menor que la cantidad de articulos que se producen en la Universidad de Sao Paulo (0.022). Esto evidencia que si bien la Institución habanera es la que más publica en la isla, su rendimiento sigue siendo infererior que otras instituciones latinoamericanas.

En 1996, Cuba publicaba alrededor de 795 artículos científicos, en 2016 (1868). Si bien en dos décadas se han duplicado el número de publicaciones (2.3) en un año, la media de crecimiento para el resto de los países de su mismo grupo ( países con menos de 10 mil publicaiones por año) es de 14.4. Países como Chile, Colombia y Perú han crecido más de 7 veces en la cantidad de artículos científicos en 2018 de los que publicaban en 1996.

La mayoría de las publicaciones científicas cubanas siguen siendo en el sector de la biotecnología, dejando detrás sectores como las comunicaciones, la computación, la agricultura u otros procesos industriales.

Cuba En 1985 Cuba registró 214 patentes internacionales, para 2018 este número era solo 29. Si bien en Latinoamerica se observa una tendencia estable con respecto a la creación de patentes, países como Perú, Ecuador, Brazil y Mexico han montrado un incremento sustancial (4 veces más patentes en 2017 con respecto a 1980) del número de patentes por año. Cuba es el país que más a caído en la producción de patentes en los últimos 20 años

La biotecnología sigue siendo el único sector de innovación en la isla, lidereado por dos instituciones: Centro de Ingeniería Genética y Biotecnología (CIGB) y el Centro de Inmunología Molecular (CIM). El CIGB patenta casi 10 más veces que todos los otros centros de investigación juntos. Para que tengamos una idea, la empresa Amgen ha publicado una total de 7 mil patentes desde su creación y la compañia británica biotécnologica Astrazeneca publicó solo en 2018, 32 patentes.

La mayoría de los autores cubanos con más de 1000 citaciones científicas han comenzado su carrera en la Isla en el periodo comprendido entre 1970-1995. Mientras que el resto de los autores más jóvenes (aquellos que comenzaron su carrera entre 1995 - 2010) viven fuera de la Isla. Este patrón muestra un escenario complejo para el futuro de la cubano ya que la mayoría de los científicos jóvenes con altos indices de impacto viven fuera, mientras que la generación que comenzó su carrera de 1970 - 1995 (científicos mayores de ~48 años) se mantiene la mayoría en la isla.

El h-index (número n de publicaciones que han sido citadas más de n veces) de los científicos cubanos que radican en la isla es similar al de los autores que viven fuera de la isla, siendo los científicos radicados en España, Inglaterra y Estados Unidos los que más h-index tienen. La emigración de científicos cubanos (con mayores índices de impacto) ha sido con diferencia mayor a países europeos.

In [1]:
import {comments} from "@bumbeishvili/utils"
  File "<ipython-input-1-3e116012890d>", line 1
    import {comments} from "@bumbeishvili/utils"
           ^
SyntaxError: invalid syntax
In [6]:
from jupyter_disqus import inject
# make sure to run this in a cell of your jupyter notebook
inject(
    page_url="https://ypriverol.github.io/cubascience/",
    page_identifier="https-ypriverol-github-io-cubascience",  # unique identifier
    site_shortname="https-ypriverol-github-io-cubascience"                              # your disqus site shortname
)
Out[6]:
In [ ]: