#unicode — oanor

API des systèmes d'écriture (ISO 15924)

Le registre ISO 15924 des systèmes d'écriture — les codes de script utilisés par Unicode, BCP-47 et CLDR — servi depuis la mémoire (sans clé). Chaque script porte son code à 4 lettres (ex. Latn, Arab, Hani), son code numérique, ses noms en anglais et en français, l'alias de propriété Unicode, la version Unicode dans laquelle il a été ajouté et sa date. Recherchez un script par code ou numérique, cherchez par code ou nom, ou listez l'intégralité du registre. 226 scripts. Idéal pour l'internationalisation, les outils de locale et de polices, la validation des balises BCP-47 et les pipelines de rendu de texte.

api.oanor.com/scripts-api

API Braille

Convertir du texte en braille Unicode et inversement. Utilise le braille anglais non contracté (Grade 1) : les 26 lettres, les chiffres avec le signe numérique, les majuscules avec le signe majuscule et la ponctuation courante, le tout produit sous forme de motifs braille Unicode (U+2800–U+28FF) pour un rendu universel. Le point de terminaison to-braille transforme le texte ordinaire en braille ; le point de terminaison from-braille décode le braille en texte. Les caractères inconnus sont transmis sans modification. Parfait pour les outils d'accessibilité et l'éducation, les maquettes d'étiquettes et de signalisation, les aperçus d'affichage braille et les ressources d'apprentissage. Calcul local pur — pas de clé, pas de service tiers, instantané. En direct, rien n'est stocké. 3 points de terminaison. Grade 1 uniquement (pas de contractions). Distinct des encodeurs de chiffrement/d'alphabet et des transformations de texte générales.

api.oanor.com/braille-api

API de normalisation Unicode

Normalisez et pliez le texte Unicode. Convertissez n'importe quelle chaîne en l'une des quatre formes de normalisation Unicode — NFC, NFD, NFKC, NFKD — afin que les textes visuellement identiques avec des compositions de points de code différentes (é comme un point de code vs e + un accent combinant) se comparent et se stockent de manière cohérente. Pliez les diacritiques et les lettres spéciales en ASCII simple (café → cafe, Straße → Strasse, Ångström → Angstrom, Łódź → Lodz) pour les slugs, les clés de recherche et les noms de fichiers ; la ligature ﬁ et les caractères de compatibilité similaires sont développés sous NFKC/NFKD. Et comparez deux chaînes après normalisation, éventuellement sans tenir compte de la casse. Parfait pour la déduplication, la recherche et l'indexation, les vérifications de noms d'utilisateur et d'identifiants, et la défense contre les entrées d'apparence similaire (homoglyphes). Calcul local pur — pas de clé, pas de service tiers, instantané. En direct, rien n'est stocké. 4 points de terminaison. Distinct des recherches dans la base de données de caractères Unicode et de la segmentation de texte.

api.oanor.com/normalize-api

API de segmentation de texte

Comptez et divisez le texte comme les gens le lisent réellement, en utilisant une segmentation correcte selon Unicode. Le point de terminaison count renvoie le nombre de graphèmes — les véritables caractères perçus par l'utilisateur, donc un emoji de famille compte pour 1 (pas 7) et une lettre accentuée pour 1 — ainsi que les mots, les phrases, les points de code, les unités de code UTF-16 (la longueur naïve de chaîne qui sur-compte) et la longueur en octets UTF-8. C'est exactement ce dont les champs à limite de caractères, les compteurs de tweets/SMS et la validation ont besoin pour que le compte corresponde à ce que l'utilisateur voit. Le point de terminaison segment divise le texte en segments de graphèmes, de mots ou de phrases (les segments de mots sont marqués comme ressemblant à des mots par rapport à la ponctuation et aux espaces) et tient compte de la locale, de sorte que les limites de mots en japonais, chinois et thaï sont correctes. Tout est calculé localement sans appels réseau. Un segmenteur de texte Unicode — distinct de la base de données de points de code Unicode (unicode), de la boîte à outils de casse/utilitaires de texte (text) et de la similarité de chaînes (similarity). Pas de clé en amont, pas de cache.

api.oanor.com/segmenter-api

API Unicode

La base de données de caractères Unicode (UCD) en tant qu'API. Résolvez TOUT point de code (0..10FFFF, y compris les plages CJK et Hangul) en son nom, catégorie générale, bloc et script — plus le caractère littéral, l'entité HTML (😀), l'échappement CSS et les séquences d'octets UTF-8/UTF-16. Passez un point de code hexadécimal (ex. 1F600 → 😀 VISAGE GRIMACANT) ou un caractère littéral (?char=€). Recherchez plus de 40 000 caractères nommés par nom (ex. "cœur", "flèche"), filtrez par catégorie ou bloc, et parcourez les 346 blocs Unicode. Idéal pour les outils de traitement de texte, les sélecteurs d'emoji, les éditeurs, l'internationalisation et les utilitaires pour développeurs.

api.oanor.com/unicode-api

API Emoji

Une base de données complète d'emojis dans une API rapide. Recherchez environ 1 870 emojis par nom, mot-clé, alias ou tag, consultez un seul emoji par son alias (comme rocket ou :fire:) ou par le caractère emoji lui-même, parcourez l'une des neuf catégories Unicode, ou obtenez des emojis aléatoires (éventuellement d'une catégorie). Chaque emoji est fourni avec son nom, sa catégorie, ses alias, ses tags de recherche, ses points de code Unicode et la version dans laquelle il a été introduit. Construit sur l'ensemble de données ouvert GitHub gemoji et servi entièrement en mémoire, les réponses sont instantanées et le service est toujours disponible. Idéal pour les applications de chat et de messagerie, les sélecteurs et recherches d'emojis, les outils sociaux et de contenu, les jeux et les widgets amusants.

api.oanor.com/emoji-api