Etiqueta: utf-8

    Cómo contar caracteres en UTF-8 en C++

    UTF-8 es una codificación de texto muy versátil y difundida. En particular para casos donde se necesita soportar cualquier caracter Unicode pero no se quiere pagar un costo alto de almacenamiento. Ya que Unicode es enorme no hay manera de codificar todas las posibilidades en un sólo byte. Al mismo tiempo, utilizar dos o cuatro bytes para cada caracter puede ser un desperdicio si la mayoría de los caracteres que usamos entrarán en uno o dos bytes.