Breve historia de IDNs y Punycode
En el inicio de Internet sólo se podían utilizar caracteres ASCII, lo cual no es realmente sorprendente, ya que fue construido en los Estados Unidos, y el inglés es un idioma que se puede escribir enteramente en caracteres en el conjunto ASCII.
Sin embargo, la mayoría de los idiomas del mundo requieren caracteres que no se encuentran en ASCII. Esto ha llevado a docenas de varios conjuntos de caracteres (o "codificaciones") en otros países y regiones. De estas codificaciones históricas surgió Unicode.
En 2003 algunos registros de dominio comenzaron a permitir dominios IDN (por ejemplo, .cn, .info, .jp, .tw, etc.). Para 2008-2009, se finalizó la especificación IDN/punycode de modo que no sólo el nombre de dominio, sino el dominio de nivel superior (TLD) podría estar en una codificación de idioma nativo y utilizar caracteres específicos de distintas lenguas como la Ñ, acentos, diéresis,... En pocas palabras, un IDN es un nombre de dominio en forma "nativa". Para preservar la compatibilidad con los estándares de Internet, principalmente en los DNS, la forma nativa se convierte en un formato ASCII llamado punycode. Aquí hay algunos ejemplos simples, con la versión de punycode a la izquierda:
- xn--bluecat-x2c.com = bluecȯat.com
- xn--bluecot-fn4c.com = bluecoạt.com
- xn--bluecoa-393c.com = bluecoaṫ.com
Los principales navegadores han admitido IDN durante mucho tiempo. Por lo general, se convierten automáticamente de forma nativa a forma punycode en la barra de direcciones y al pasar el mouse sobre un enlace en la página. (El navegador convierte cualquier IDN que encuentre en el formulario punycode antes de enviarlo al DNS).
¿Por qué debería importarme?
Según symantec, en 2003 agregaron su primera URL IDN a la base de datos de Blue Coat Web Filter. Y ese fue el Gran Total para IDN ese año: uno. En los años siguientes, el número de IDN que agregaron aumentó lentamente:
Fuente: Symantec
Como puede ver, 2008-2009, cuando se finalizó la especificación, es cuando empezaron a ver un repunte, y luego realmente despegó en 2012 y 2013. Claramente, es algo a lo que vale la pena prestarle atención.
Symantec ya había examinado este crecimiento durante años, ¿Y adivina qué? No hubo mucho: casi todas las muestras que vieron en los registros hace cinco años eran simplemente compañías europeas que tenían un nombre de dominio ASCII tradicional, pero que querían una versión nativa con un carácter acentuado o dos en el mismo.
A partir del 2018 es cuando se dieron cuenta de lo que estaba pasando:. Los “chicos malos” estaban usando dominios IDN parecidos a las marca para suplantar identidades para hacer SPAM, Phishing, spoofing,....
Abuso y engaño de IDN:
Como se mencionó anteriormente, las personas sabían desde los primeros días que los IDN podrían conducir a daños con los nombres de dominio. El potencial para este tipo de ataque "homográfico" no es solo teórico. Un nombre de dominio engañoso, donde el "nombre de marca" se deja visualmente intacta es fácil de lograr: simplemente agregando un carácter no ASCII al principio, al final, o en cualquier lugar en el medio de la marca se obtiene un dominio muy parecido a la marca, pero que a nivel de Internet es totalmente distinto. Así, con un dominio de este tipo se consigue suplantar a la marca y enviar a los usuarios a webs fraudulentas, sin que ellos se den cuenta, para conseguir datos críticos, contraseñas, tarjetas de crédito, venta de productos falsificados...
Resumen y recomendaciones: abuso de marca
primer lugar, esperamos que continúe el crecimiento general en el uso de IDN, y probablemente continúe acelerándose.
Segundo, esperamos ver un crecimiento en el uso de IDN en el espacio del subdominio. (Recuerde que más del 90% de los encuentros con etiquetas de dominios codificados están en el nivel del dominio principal). Ya estamos viendo subdominios IDN en Tumblr, por ejemplo, y esperamos que los dominios de host gratuitos del mundo tengan incluso reglas menos estrictas y supervisión sobre el uso de caracteres Unicode en subdominios.
En tercer lugar, tenga en cuenta el aumento continuo de nuevos gTLD disponibles. Todos ellos permiten IDN.
Estos factores combinados significan una explosión exponencial en los posibles escenarios de "abuso de marca" disponibles para los “chicos malos”. En el pasado, una marca importante que estaba preocupada por los ataques de "ocupantes de errores tipográficos" podía considerar razonablemente el enfoque de simplemente registrar todos (o la mayoría) de los nombres de dominio "parecidos". (Y en las variedades .com, .net, .info, .biz y .org; y también en los principales códigos de país ...)
El punto clave es darse cuenta de que en un mundo Unicode, con muchos gTLD nuevos, técnicas tipográficas y dominios IDN’s, simplemente el ataque a la marca puede ser constante.
En los nuevos dominios dominios gTLDs disponemos de servicios que permiten la protección de la marca y sus dominios homográficos , para así poder anticiparse a posibles fraudes. Estos servicios DPML de protección le permiten estar cubierto en una gran de nuevas extensiones de dominio.
Por otro lado, debe centrarse en un modelo de "detección temprana", utilizando un amplio conjunto de tráfico, para detectar variantes de dominio de su nombre de marca tan pronto como entren en uso, para poder tomar medidas. Para este fin Entorno Digital ha desarrollado Vigilancia y detección de dominios que contienen la marca, variantes de dominios homográficos (IDN) parecidos a la marca, detección de activación de servidores de correo con estos dominios,... Con nuestros servicios podrá detectar los dominios que están intentando usar para suplantar su identidad, y dañar su marca, y así poder tomar las medidas legales oportunas al respecto.
Si ningún compromiso, nosotros podemos ayudarle a investigar las variantes de dominios homográficos (IDN) en sus principales marcas, en varios idiomas. Así podrá descubrir los dominios homográficos parecidos a sus marcas, si estos están o no registrados, si le interesa registrarlos en los principales dominios genéricos o si quiere activar los servicios de bloqueo (DPML)de los nuevos dominios genéricos.