Atrás

#unicode

6 APIs con esta etiqueta

API de Sistemas de Escritura (ISO 15924)

El registro ISO 15924 de sistemas de escritura — los códigos de escritura utilizados por Unicode, BCP-47 y CLDR — servido desde memoria (sin key). Cada escritura lleva su código de 4 letras (ej. Latn, Arab, Hani), código numérico, nombres en inglés y francés, el alias de propiedad de Unicode, la versión de Unicode en la que se agregó y su fecha. Busque una escritura por código o numérico, busque por código o nombre, o liste todo el registro. 226 escrituras. Ideal para internacionalización, herramientas de configuración regional y fuentes, validación de etiquetas BCP-47 y canalizaciones de representación de texto.

api.oanor.com/scripts-api

API Braille

Convierte texto a braille Unicode y viceversa. Utiliza braille inglés no contraído (Grado 1): las 26 letras, dígitos con el signo de número, mayúsculas con el signo de mayúscula y puntuación común, todo emitido como Patrones Braille Unicode (U+2800–U+28FF) para que se rendericen en cualquier lugar. El endpoint to-braille convierte texto ordinario a braille; el endpoint from-braille decodifica braille de vuelta a texto. Los caracteres desconocidos pasan sin cambios. Perfecto para herramientas de accesibilidad y educación, maquetas de etiquetas y señalización, vistas previas de pantallas braille y recursos de aprendizaje. Cálculo puramente local — sin clave, sin servicio de terceros, instantáneo. En vivo, nada almacenado. 3 endpoints. Solo Grado 1 (sin contracciones). Distinto de codificadores de cifrado/alfabeto y de transformaciones generales de texto.

api.oanor.com/braille-api

API de Normalización Unicode

Normaliza y pliega texto Unicode. Convierte cualquier cadena a una de las cuatro formas de normalización Unicode — NFC, NFD, NFKC, NFKD — para que el texto visualmente idéntico con diferentes composiciones de puntos de código (é como un punto de código vs e + un acento combinante) se compare y almacene de manera consistente. Pliega diacríticos y letras especiales a ASCII simple (café → cafe, Straße → Strasse, Ångström → Angstrom, Łódź → Lodz) para slugs, claves de búsqueda y nombres de archivo; la ligadura fi y caracteres de compatibilidad similares se expanden bajo NFKC/NFKD. Y compara dos cadenas para determinar igualdad después de la normalización, opcionalmente sin distinción de mayúsculas y minúsculas. Perfecto para deduplicación, búsqueda e indexación, verificación de nombres de usuario e identificadores, y defensa contra entradas de apariencia similar (homoglifos). Cálculo puramente local — sin clave, sin servicio de terceros, instantáneo. En vivo, nada se almacena. 4 endpoints. Distinto de las búsquedas en bases de datos de caracteres Unicode y de la segmentación de texto.

api.oanor.com/normalize-api

API de Segmentación de Texto

Cuenta y divide el texto de la forma en que las personas realmente lo leen, utilizando segmentación correcta según Unicode. El endpoint de conteo devuelve el número de clústeres de grafemas — los caracteres reales percibidos por el usuario, por lo que un emoji de familia cuenta como 1 (no 7) y una letra acentuada como 1 — junto con palabras, oraciones, puntos de código, unidades de código UTF-16 (la longitud ingenua de cadena que sobrecuenta) y la longitud en bytes UTF-8. Esto es exactamente lo que necesitan los campos con límite de caracteres, contadores de tweets/SMS y validación para que el conteo coincida con lo que el usuario ve. El endpoint de segmentación divide el texto en segmentos de grafemas, palabras u oraciones (los segmentos de palabras se marcan como similares a palabras versus puntuación y espacios) y es consciente de la configuración regional, por lo que los límites de palabras en japonés, chino y tailandés resultan correctos. Todo se calcula localmente sin llamadas de red. Un segmentador de texto Unicode — distinto de la base de datos de puntos de código Unicode (unicode), el conjunto de herramientas de mayúsculas/minúsculas y utilidades de texto (text) y la similitud de cadenas (similarity). Sin clave upstream, sin caché.

api.oanor.com/segmenter-api

API Unicode

La Base de Datos de Caracteres Unicode (UCD) como una API. Resuelve CUALQUIER punto de código (0..10FFFF, incluidos los rangos CJK y Hangul) a su nombre, categoría general, bloque y escritura, además del carácter literal, entidad HTML (😀), escape CSS y secuencias de bytes UTF-8/UTF-16. Pasa un punto de código hexadecimal (ej. 1F600 → 😀 CARA SONRIENTE) o un carácter literal (?char=€). Busca más de 40,000 caracteres con nombre por nombre (ej. "corazón", "flecha"), filtra por categoría o bloque, y explora los 346 bloques Unicode. Ideal para herramientas de procesamiento de texto, selectores de emoji, editores, internacionalización y utilidades para desarrolladores.

api.oanor.com/unicode-api

API de Emojis

Una base de datos completa de emojis en una API rápida. Busque aproximadamente 1.870 emojis por nombre, palabra clave, alias o etiqueta, consulte un solo emoji por su alias (como rocket o :fire:) o por el propio carácter emoji, navegue por cualquiera de las nueve categorías Unicode u obtenga emojis aleatorios (opcionalmente de una categoría). Cada emoji incluye su nombre, categoría, alias, etiquetas de búsqueda, puntos de código Unicode y la versión en la que se introdujo. Construido sobre el conjunto de datos abierto de GitHub gemoji y servido completamente en memoria, por lo que las respuestas son instantáneas y el servicio está siempre disponible. Ideal para aplicaciones de chat y mensajería, selectores y búsqueda de emojis, herramientas sociales y de contenido, juegos y widgets divertidos.

api.oanor.com/emoji-api