En ocasiones veo “unos”, la ley de Benford

Recientemente me enteré de que si analizamos una lista de números, lo más probable es que el dígito que más se repita en la primera posición sea el “1”. Nunca había pensado sobre ello pero de primeras me pareció bastante loco. Es más, el segundo dígito más probable de encontrar es el “2” y así con todos hasta el “9”, en orden decreciente de probabilidad. Después de leer sobre el tema, el cual formalmente se denomina la Ley de Benford, uno deja de creer en conspiraciones del lobby “unoísta”.

La historia de este descubrimiento comienza a finales del siglo XIX, de forma completamente fortuita, cuando el astrónomo Simon Newcomb consultaba un libro de tablas de logaritmos y observaba que las páginas más desgastadas (y por tanto más consultadas) eran las del principio. Las tablas más visitadas eran las que recogían los resultados para números que iniciaban por “1”. Aún siendo el primero en caer en este hecho, Newcomb no desarrolló ninguna ecuación ni formalismo matemático que lo recogiera. Fue el físico Frenk Benford quien en 1938 observó el mismo fenómeno y decidió poner a prueba esta ley con listas de números que recogían cantidades como longitudes de ríos, constantes de la física y direcciones de personas.

LEY DE BENFORD: “LOS NÚMEROS SUELEN COMENZAR MÁS FRECUENTEMENTE POR «1» QUE POR CUALQUIER OTRO DÍGITO”

En el momento que escribo esto no existe una demostración definitiva de por qué la ley funciona, pero sí puedo mostrar el ejemplo que permite ver su utilidad de forma más directa. Supongamos un conjunto de números al cual podemos realizar un cambio de escala. Un conjunto de este tipo sería el de distancias entre dos puntos en el Universo. Podemos aplicar un cambio de escala y doblar el tamaño del Universo, de modo que aquellas distancias que antes empezaban por 1 ahora empiezan por 2, las que empezaban por 2 ahora empiezan por 4, … , y todas aquellas que empezaban por 5, 6, 7, 8 y 9 ahora empiezan por 1. Existen más ejemplos para probar esta ley y algunos ejemplos de conjuntos de número donde no se puede aplicar, como veremos en la aplicación de la ley.

Más allá de tratarse de una curiosidad matemática, esta ley tiene aplicaciones en la detección de fraudes económico, electorales o en los estudios genéticos entre otros.

Ejemplo con código 

Podemos analizar la aplicabilidad de la ley de con un pequeño código en R. En este, partimos de la información de aproximadamente 50.000 ciudades en todo el mundo. Si representamos las frecuencias con las que aparece cada cifra como primer dígito de la población encontramos que el “1” aparece unas 15.000 veces, el “2” aparece unas 8.000 veces, el “3” unas 5.000 veces y así hasta el “9”, siguiendo un comportamiento similar al predicho por la ley de Benford. Puedes comprobar por tí mismo que este comportamiento no se observa para la latitud de las ciudades.

BenfordPoblaciones
Histograma con las frecuencias de aparición de cada una de las cifras como primer dígito

En este enlace encontrarás el código utilizado en un compilador online de R para que pruebes la distribución de las primeras cifras en el caso de la latitud o pruebes otros conjuntos de números. (https://rextester.com/KUEJD95798)

Referencias.

 

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s