La ley de Benford en el manejo de datos estadísticos

La Estadística necesita de datos para obtener la información necesaria que permita construir hipótesis e inferir resultados para los problemas que pretenda analizar. Los datos son un elemento esencial en cualquier concepción estadística.

Dentro de esta necesidad de estructurar los datos, aparece la ley de Benford, que describe la distribución de los dígitos 1, 2, 3, …, 9 dentro de las cifras significativas (aquellas de más importancia dentro de un número, excluyendo los ceros) de una colección de datos numéricos. Esta ley fue inicialmente observada por el astrónomo y matemático canadiense Simon Newcomb en 1881, quien, manejando manuales que contenían tablas de logaritmos, observó que las páginas que contenían los números con primeras cifras 1 y 2 estaban mucho más manoseadas y eran más oscuras por el uso que aquellas con las primeras cifras 8 y 9. Esto indicaba que los manuales de tablas de logaritmos eran más empleados para números con cifras significativas pequeñas (1, 2 y 3) que para cifras significativas grandes (8 y 9).

En particular, se dio cuenta de que la observación de un primer dígito igual a 1 aparecía un 30% de las veces, mientras que la de que fuera un 9 sólo aparecía un 4,6%. Esta ley fue formalmente establecida en 1938 por el físico Frank Benford, a quien debe su nombre, ya que estuvo recogiendo datos durante varios semestres, y publicó en ese año un artículo en “Proceedings of the American Philosophical Society”, en el que, basándose en 20.229 observaciones de origen diverso (cuencas de ríos, estadísticas de la liga americana de béisbol, pesos atómicos de elementos…), mostró que esta ley se cumplía en una gran cantidad de conjuntos de datos.

En la Figura 1, se muestra una aplicación de la ley de Benford en la medición de la población de los países del mundo.

No sé conoce aún la razón precisa de por qué grandes cantidades de conjuntos de datos cumplen esta ley mientras otros no lo hacen. No obstante, se han observado algunas características que permiten delimitar la naturaleza de los conjuntos de datos que siguen la ley de Benford:

1. Datos provenientes de procesos de crecimiento exponencial. Estos datos suelen tener órdenes de magnitud muy diferentes (es decir, hay datos muy pequeños, junto con otros muy grandes: 0,005 y 10.000.000, por ejemplo), lo que suele ser un rasgo muy común de los conjuntos que siguen esta ley. Habitualmente, los conjuntos de datos que presentan valores acotados dentro de un rango (por ejemplo, poblaciones entre 1.000 y 5.000 habitantes) no suelen seguir la distribución de Benford.

2. Datos que presentan invariancia respecto a la escala. Esta situación se presenta cuando los conjuntos de datos incluyen tanto a los que se presentan en una unidad de medida como en otra. Es decir, da lo mismo expresar los datos en centímetros o en metros, por ejemplo, porque, en ambas situaciones, se cumple la ley de Benford.

De esta forma, una amplia variedad de conjuntos de datos siguen la ley de Benford: facturas de electricidad, direcciones de calles, precios de acciones en la bolsa, tamaños de poblaciones, ratios de defunciones, longitudes de ríos, constantes físicas y matemáticas, por nombrar algunos de ellos.

Por otra parte, la ley de Benford puede aplicarse en diferentes casos prácticos:

a. Detección de fraude contable. Dado que los datos contables siguen esta ley, cuando estos han sido manipulados, habitualmente se observa una mayor presencia de primeros dígitos con valores 8 y 9 que la proporción indicada por la distribución de Benford.

b. Análisis de resultados electorales. La ley de Benford sirvió como evidencia de fraude en las elecciones de Irán en 2009.

c. Control de datos macroeconómicos. Los datos macroeconómicos proporcionados por el Gobierno griego antes de ingresar en la Unión Europea en 1980 fueron considerados fraudulentos a causa de esta ley.

Finalmente, es importante señalar que la evidencia de que un conjunto de datos no siga la ley de Benford, cuando se esperaría que sí lo hiciera, debe hacerse siempre con la conveniente prudencia, fruto de la aplicación cuidadosa de la inferencia estadística, dado que los datos siempre muestran una realidad parcial de un fenómeno determinado.

 

Esta entrada ha sido elaborada por Javier Faulín Fajardo, catedrático del Departamento de Estadística, Informática y Matemáticas y secretario del Instituto de Smart Cities (ISC) de la Universidad Pública de Navarra (UPNA)

Hipatia de Alejandría, la primera científica de la historia

¿Qué nombre de científica importante destacarías de la historia? Casi todos responderíamos el mismo nombre: Marie Curie. Sin embargo, además de ella, ¿conoces alguna más? Es difícil recordar muchos más nombres de mujeres que hayan destacado en la ciencia y la tecnología, y, sin embargo, existen y han aportado muchas cosas importantes. Queremos conocerlas, queremos que las conozcáis y, por eso, les hemos dado vida en una obra de teatro.

En concreto, somos nueve profesoras e investigadoras de la Universidad Pública de Navarra (UPNA), y cada una de nosotras hemos elegido representar a una científica con la que nos sentimos identificada. Pero, además, para que podáis conocerlas más en profundidad, iniciamos, con esta entrada, una serie de breves biografías sobre las científicas a las que representamos, de tal modo que os podáis enamorar de ellas de la misma forma que lo hemos hecho nosotras.

Comenzaremos con la que se considera la primera científica de la historia: Hipatia de Alejandría, nacida aproximadamente en el siglo IV en dicha ciudad egipcia. Por aquel entonces, la metrópoli fundada por Alejandro Magno era la capital de Egipto y se la conocía por su museo, su enorme biblioteca y sus grandes templos. Fue precisamente en la biblioteca donde Hipatia pasó la mayor parte de sus horas, ya que su padre, Teón, trabajaba allí. Así, Hipatia, como muchos científicos de la época, se dedicó a ordenar y reescribir a mano las obras más importantes de la Antigüedad. Una reescritura que conllevaba mucho más que una simple copia: los copistas se dedicaban a hacer comentarios manuscritos al margen, que muchas veces suponían aportaciones originales.

Las mayores contribuciones de Hipatia, y gracias a las cuales se convirtió en una científica de renombre en la época, fueron en los ámbitos de las matemáticas y la astronomía. Destacan el Comentario de la “Aritmética” de Diofanto, que dio un impulso decisivo al álgebra con la creación de unos signos matemáticos que simplificaban y agilizaban sus operaciones; las aportaciones al trabajo de Apolonio de Pérgamo, introductor de la geometría de las figuras cónicas, crucial para el posicionamiento de los cuerpos celestes; y la contribución, junto con su padre, a los trece libros de Comentarios del Almagesto, donde se recoge el estudio de la obra de Ptolomeo, primer tratado matemático que dio una explicación completa, detallada y cuantitativa de todos los movimientos celestes. Los comentarios de esta última obra se cree, además, que influenciaron en la revolución copernicana, uno de los momentos cruciales en el desarrollo del heliocentrismo.

Aparte de los comentarios a importantes obras, Hipatia tuvo tiempo para más. Así, sabemos, a través de los escritos de sus discípulos, que confeccionó un planisferio celeste gracias a un astrolabio que desarrolló ella misma, y también inventó un hidroscopio para pesar líquidos. Pero no sólo eso: Hipatia también invertía parte de su tiempo en impartir clases. Unas clases que se pueden definir como poco convencionales. No eran como las actuales, sino que se trataba de diálogos en los que ella discutía con los alumnos sobre filosofía, matemáticas, astronomía, ética o religión. En estas clases, se trasmitía la doctrina neoplatónica, influenciada, a su vez, por los pitagóricos, por lo que se apoyaba la igualdad de género y se fomentaba la educación de todas las personas, independientemente de su cultura, clase social o género. Este hecho atraía a intelectuales de diferentes partes del mundo, quienes acudían a la ciudad para formarse sobre las diferentes concepciones filosóficas y científicas.

De esta manera, a pesar de que, por la época en la que vivió, en su historia se mezclan la realidad y la leyenda, podemos afirmar que Hipatia fue una matemática, filósofa y astrónoma que, gracias a su constancia y trabajo, se convirtió en una de las mejores científicas de la época. De hecho, son muchas las fuentes que señalan que Hipatia destacó por encima de su padre y otros científicos de la época no sólo en talento, sino también en logros científicos. Consiguió un renombre y una influencia tal que se cree que fue la razón de su desgraciado asesinato ya en el siglo V.

Para finalizar, dejamos al lector con una reflexión que se atribuye a esta científica: “Conserva tu derecho a reflexionar, porque incluso el hecho de pensar erróneamente es mejor que no pensar en absoluto”.

 

Esta entrada ha sido elaborada por Leyre Catalán Ros, investigadora del Departamento de Ingeniería y del Instituto de Smart Cities (ISC) de la Universidad Pública de Navarra (UPNA), presidenta de la Asociación para la Promoción de las Energías Renovables en Navarra (APERNA) y actriz de la obra de teatro “Yo quiero ser científica”, en la que interpreta a Hipatia de Alejandría

 

Nota: el blog Mujeres con ciencia, impulsado por la Cátedra de Cultura Científica de la Universidad del País Vasco (UPV/EHU) y editado por la profesora de esta institución Marta Macho Stadler, repasa periódicamente vidas, obras y reflexiones de diversas mujeres científicas, actuales e históricas

Tecnología y sociedad

¿Por qué unas tecnologías levantan grandes polémicas sociales, mientras que otras se adoptan masivamente sin más? Aquellos que no comprenden por qué algunas tecnologías provocan recelos en la sociedad suelen expresar su sorpresa argumentando aquello de que “la tecnología no tiene ideología”. Aunque aceptásemos esa premisa, es imposible obviar que los grupos/instituciones/personas que promueven una opción tecnológica sí que tienen una ideología determinada (i.e. un conjunto de emociones, ideas y creencias colectivas que describen y postulan modos de actuar sobre la realidad colectiva). Dado que las tecnologías no se instalan en el vacío, si no que se insertan en una sociedad concreta en un momento concreto, será este contexto social el que determine que una misma tecnología tenga o no una recepción parecida en distintas sociedades. Por otro lado, las tecnologías difieren en su potencial para alterar el tejido social y los modos de vida, concitar interés o preocupación, generar negocios o provocar la desaparición de otros, etc. En suma, tecnología y sociedad necesariamente interactúan y se transforman mutuamente.

Esa es la pregunta que el proyecto “History of Nuclear Energy and Society” (HoNESt) contribuye a responder, en el ámbito concreto de la energía nuclear en Europa. HoNESt es un consorcio de 25 instituciones de quince países europeos financiados por el programa de la UE Horizonte 2020 y Euratom.

La energía nuclear tiene niveles de aceptación muy diferentes en Europa. El viejo continente alberga algunos de los países con más energía nuclear producida, tanto en términos absolutos (Francia) como relativos (Eslovaquia, Hungría, Bélgica, Suecia…), pero también incluye países que optaron relativamente temprano por no implantar energía nuclear en su territorio (Austria, Dinamarca, Portugal), otros que decidieron moratorias para contener su expansión (España) o planificar su abandono (Alemania), así como el único caso en el mundo de un país que cerró sus nucleares de golpe después de más de veinte años de operación (Italia). Mientras tanto, Francia sigue apostando por la energía nuclear y Reino Unido, Hungría, Polonia y Bulgaria tienen proyectos en activo para construir nuevas centrales nucleares. Lejos de ser un tema controvertido del pasado, la energía nuclear todavía está en la primera página en el presente y lo seguirá siendo en el futuro. ¿Qué hace tan diferentes las reacciones de las sociedades europeas con respecto a la energía nuclear?

Al comparar los distintos casos europeos, HoNESt trata de comprender las motivaciones, las formas de participación que se llevaron a cabo, qué actores estuvieron involucrados, el contexto en el que ocurrieron (económico y sociopolítico) y cómo fueron de “exitosos” para los diferentes grupos de interés (es decir, ¿quién se beneficia y cómo?). En general (si bien con alguna excepción), hemos observado una falta de interacción entre los actores sociales sobre temas sensibles y éticos provocados por el cambio tecnológico. Históricamente, las estrategias gubernamentales e industriales de “limitación de la información” han permitido el “éxito” en el corto plazo, pero han sido ineficaces para asegurar el apoyo social y/o ganar la confianza de la sociedad en los promotores de los proyectos nucleares en el largo plazo. En el desarrollo e implantación de la energía nuclear, como de otras muchas tecnologías, los promotores optaron con frecuencia por enfoques del tipo “decidir-anunciar-defender”, donde la falta de participación democrática crea la sensación, potencialmente legítima, de ausencia de justicia energética. En contraste, las oportunidades para debatir, deliberar y participar en un diálogo más abierto conducen, según la literatura de ciencias sociales y los casos nacionales que manejamos en HoNESt, a una gobernanza energética más constructiva y sostenible en el tiempo. Una presunta falta de honestidad, las restricciones en el acceso a la información y la dejadez frente a las preocupaciones y prioridades de los ciudadanos han sido identificadas en nuestro análisis comparativo como factores de protección a corto plazo contra las polémicas socio-tecnológicas. Pero también son las semillas de dificultades seguras en el largo plazo.

Los análisis de los investigadores de HoNESt también destacan que el apoyo y/o la oposición a la energía nuclear, tanto de los ciudadanos como de los gobiernos, es dinámica. Las preferencias cambian según las condiciones ambientales, sociales o económicas. Como resultado, lo que se percibe como “exitoso” con respecto al avance tecnológico en un momento puede pasar a percibirse como un estruendoso fracaso años más tarde, y viceversa. Los posicionamientos sobre la energía nuclear varían también en función del momento histórico y del contexto en el que se produjeron: mientras que, en la Europa del sur y central, la izquierda se ha tendido a posicionar frente a la energía nuclear, en la actual Europa del Este es la derecha liberal y pro-europea la que con más vehemencia se ha opuesto a la energía nuclear. Esto no es más que el reflejo de lo que advertíamos al comienzo: las tecnologías no se insertan en el vacío, sino que, en cada país, las alianzas que se configuran para promover una cierta opción tecnológica condicionan en parte qué grupos se posicionarán en sentido opuesto.

Finalmente, los aspectos industriales y económicos han desempeñado un papel importante en el desarrollo nuclear, como se ha identificado en otras partes de la literatura. Sin embargo, también es indicativo de la experiencia derivada de los varios países estudiados que poner el foco únicamente sobre tales objetivos, por encima de los de justicia social y participación pública, arriesga la legitimidad democrática (y con ello, la aceptación) de tales desarrollos, la eficacia de la interacción civil-nuclear asociada y las respuestas de la sociedad a la tecnología en el largo plazo. La equidad en los procesos que resuelven disputas y asignan recursos deben estar presentes si el objetivo es obtener una gobernanza energética responsable y duradera en el tiempo.

 

Esta entrada ha sido elaborada por Mª del Mar Rubio Varas, responsable de la Secretaría Científica de HoNESt, profesora titular de Historia e Instituciones Económicas e investigadora del Institute for Advanced Research in Business and Economics (INARBE) de la Universidad Pública de Navarra