Las computadoras generan números aleatorios para todo, desde criptografía hasta videojuegos y juegos de azar. Hay dos categorías de números aleatorios: números aleatorios “verdaderos” y números pseudoaleatorios, y la diferencia es importante para la seguridad de los sistemas de cifrado.
Las computadoras pueden generar números verdaderamente aleatorios observando algunos datos externos, como los movimientos del mouse o el ruido del ventilador, que no es predecible, y creando datos a partir de ellos. Esto se conoce como entropía. Otras veces, generan números “pseudoaleatorios” mediante el uso de un algoritmo para que los resultados parezcan aleatorios, aunque no lo sean.
Este tema se ha vuelto más controvertido recientemente, con muchas personas cuestionando si el chip generador de números aleatorios de hardware incorporado de Intel es confiable. Para entender por qué podría no ser confiable, tendrá que entender cómo se generan los números aleatorios en primer lugar y para qué se usan.
¿De qué vamos a hablar?
Para qué se utilizan los números aleatorios
Los números aleatorios se han utilizado durante muchos miles de años. Ya sea lanzando una moneda o tirando un dado, el objetivo es dejar el resultado final al azar. Los generadores de números aleatorios en una computadora son similares: son un intento de lograr un resultado impredecible y aleatorio.
Los generadores de números aleatorios son útiles para muchos propósitos diferentes. Aparte de aplicaciones obvias como generar números aleatorios con fines de juego o crear resultados impredecibles en un juego de computadora, la aleatoriedad es importante para la criptografía.
Criptografía requiere números que los atacantes no pueden adivinar. No podemos simplemente usar los mismos números una y otra vez. Queremos generar estos números de una manera muy impredecible para que los atacantes no puedan adivinarlos. Estos números aleatorios son esenciales para el cifrado seguro, ya sea que esté cifrando sus propios archivos o simplemente usando un HTTPS (en in in sitio web en Internet.
Números aleatorios verdaderos
Es posible que se pregunte cómo una computadora puede generar un número aleatorio. ¿De dónde viene esta “aleatoriedad” ? Si es solo una pieza de código de computadora, ¿no es posible que los números que genera la computadora puedan ser predecibles?
Generalmente agrupamos los números aleatorios que generan las computadoras en dos tipos, dependiendo de cómo se generan: números aleatorios “verdaderos” y números pseudoaleatorios.
Para generar un número aleatorio “verdadero”, la computadora mide algún tipo de fenómeno físico que tiene lugar fuera de la computadora. Por ejemplo, la computadora podría medir la desintegración radiactiva de un átomo. Según la teoría cuántica, no hay forma de saber con certeza cuándo ocurrirá la desintegración radiactiva, por lo que esto es esencialmente “aleatoriedad pura” del universo. Un atacante no podría predecir cuándo ocurriría la desintegración radiactiva, por lo que no sabría el valor aleatorio.
Para un ejemplo más cotidiano, la computadora podría confiar en el ruido atmosférico o simplemente usar la hora exacta en que presiona las teclas de su teclado como una fuente de datos impredecibles o entropía. Por ejemplo, su computadora podría notar que presionó una tecla exactamente a 0.23423523 segundos después de 2 p.m.. Tome suficientes de los tiempos específicos asociados con estas pulsaciones de teclas y tendrá una fuente de entropía que puede usar para generar un número aleatorio “verdadero”. No eres una máquina predecible, por lo que un atacante no puede adivinar el momento preciso en que presionas estas teclas. El dispositivo /dev/random en Linux, que genera números aleatorios, “bloquea” y no devuelve un resultado hasta que reúne suficiente entropía para devolver un número verdaderamente aleatorio.
Números pseudoaleatorios
Los números pseudoaleatorios son una alternativa a los números aleatorios “verdaderos”. Una computadora podría usar un valor semilla y un algoritmo para generar números que parecen ser aleatorios, pero que de hecho son predecibles. El equipo no recopila ningún dato aleatorio del entorno.
Esto no es necesariamente algo malo en todas las situaciones. Por ejemplo, si estás jugando un videojuego, realmente no importa si los eventos que ocurren en ese juego son causados por números aleatorios “verdaderos” o números pseudoaleatorios. Por otro lado, si está utilizando el cifrado, no desea usar números pseudoaleatorios que un atacante pueda adivinar.
Por ejemplo, supongamos que un atacante conoce el algoritmo y el valor de semilla que utiliza un generador de números pseudoaleatorios. Y digamos que un algoritmo de cifrado obtiene un número pseudoaleatorio de este algoritmo y lo utiliza para generar una clave de cifrado sin agregar ninguna aleatoriedad adicional. Si un atacante sabe lo suficiente, podría trabajar hacia atrás y determinar el número pseudoaleatorio que el algoritmo de cifrado debe haber elegido en ese caso, rompiendo el cifrado.
La NSA y el generador de números aleatorios de hardware de Intel
Para facilitar las cosas a los desarrolladores y Ayudan a generar números aleatorios seguros, los chips Intel incluyen un generador de números aleatorios basado en hardware conocido como RdRand. Este chip utiliza una fuente de entropía en el procesador y proporciona números aleatorios al software cuando el software los solicita.
El problema aquí es que el generador de números aleatorios es esencialmente una caja negra y no sabemos qué está pasando dentro de ella. Si RdRand contuviera una puerta trasera de la NSA, el gobierno podría romper las claves de cifrado que se generaron con solo datos suministrados por ese generador de números aleatorios.
Esta es una preocupación seria. En diciembre de 2013, los desarrolladores de FreeBSD eliminaron el soporte para usar RdRand directamente como una fuente de aleatoriedad, diciendo que no podían confiar en él. [Source] La salida del dispositivo RdRand se alimentaría a otro algoritmo que agrega entropía adicional, asegurando que cualquier puerta trasera en el generador de números aleatorios no importaría. Linux ya funcionaba de esta manera, aleatorizando aún más los datos aleatorios provenientes de RdRand para que no fueran predecibles incluso si hubiera una puerta trasera. [Source] En un reciente AMA (“Ask Me Anything”) en Reddit, el CEO de Intel, Brian Krzanich, no respondió preguntas sobre estas preocupaciones. [Source]
Por supuesto, esto probablemente no sea solo un problema con los chips Intel. Los desarrolladores de FreeBSD también llamaron a los chips de Via por su nombre. Esta controversia muestra por qué es tan importante generar números aleatorios que sean verdaderamente aleatorios y no sean predecibles.
Para generar números aleatorios “verdaderos”, los generadores de números aleatorios recopilan “entropía”, o datos aparentemente aleatorios del mundo físico que los rodea. Para números aleatorios que no lo hacen realmente necesitan ser aleatorios, solo pueden usar un algoritmo y un valor semilla.
Crédito de la imagen: rekre89 en Flickr, Lisa Brewster en Flickr, Ryan Somma en Flickr, huangjiahui en Flickr