#unicode — oanor

Schriftsystemen (ISO 15924) API

Het ISO 15924-register van schriftsystemen — de scriptcodes die worden gebruikt door Unicode, BCP-47 en CLDR — geleverd vanuit het geheugen (geen key). Elk script heeft zijn 4-lettercode (bijv. Latn, Arab, Hani), numerieke code, Engelse en Franse namen, het Unicode-eigenschapswaarde-alias, de Unicode-versie waarin het is toegevoegd en de datum. Zoek een script op via code of numeriek, zoek op code of naam, of toon het volledige register. 226 scripts. Ideaal voor internationalisatie, locale- en lettertype-tooling, BCP-47-tagvalidatie en tekstweergavepijplijnen.

api.oanor.com/scripts-api

Braille API

Converteer tekst naar Unicode-braille en terug. Gebruikt ongecontracteerd (Grade 1) Engels braille: de 26 letters, cijfers met het nummerteken, hoofdletters met het hoofdletterteken en veelgebruikte interpunctie, allemaal uitgevoerd als Unicode-braillepatronen (U+2800–U+28FF) zodat ze overal worden weergegeven. Het to-braille-eindpunt zet gewone tekst om in braille; het from-braille-eindpunt decodeert braille terug naar tekst. Onbekende tekens blijven ongewijzigd. Perfect voor toegankelijkheidstools en educatie, labels en bewegwijzering mockups, braille-display previews en leermiddelen. Pure lokale berekening — geen sleutel, geen externe service, direct. Live, niets opgeslagen. 3 eindpunten. Alleen Grade 1 (geen contracties). Te onderscheiden van cipher/alfabet-encoders en algemene teksttransformaties.

api.oanor.com/braille-api

Unicode Normalize API

Normaliseer en vouw Unicode-tekst. Converteer elke string naar een van de vier Unicode-normalisatievormen — NFC, NFD, NFKC, NFKD — zodat visueel identieke tekst met verschillende codepuntcomposities (é als één codepunt vs e + een combinerend accent) consistent wordt vergeleken en opgeslagen. Vouw diakritische tekens en speciale letters naar gewoon ASCII (café → cafe, Straße → Strasse, Ångström → Angstrom, Łódź → Lodz) voor slugs, zoeksleutels en bestandsnamen; de ﬁ-ligatuur en soortgelijke compatibiliteitstekens worden uitgebreid onder NFKC/NFKD. En vergelijk twee strings op gelijkheid na normalisatie, optioneel hoofdletterongevoelig. Perfect voor deduplicatie, zoeken en indexeren, gebruikersnaam- en identificatiecontroles, en verdediging tegen look-alike (homoglyph) invoer. Pure lokale berekening — geen sleutel, geen externe service, direct. Live, niets opgeslagen. 4 endpoints. Anders dan Unicode-tekensetdatabase-opzoekingen en tekstsegmentatie.

api.oanor.com/normalize-api

Text Segmentation API

Tel en splits tekst zoals mensen het daadwerkelijk lezen, met Unicode-correcte segmentatie. Het count-eindpunt retourneert het aantal grafeemclusters — de echte, door de gebruiker waargenomen karakters, dus een familie-emoji telt als 1 (niet 7) en een geaccentueerde letter als 1 — samen met woorden, zinnen, codepunten, UTF-16-code-eenheden (de naïeve stringlengte die te veel telt) en UTF-8-bytelengte. Dit is precies wat karakterlimietvelden, tweet/SMS-tellers en validatie nodig hebben, zodat de telling overeenkomt met wat de gebruiker ziet. Het segment-eindpunt splitst tekst in grafeem-, woord- of zinsegmenten (woordsegmenten worden gemarkeerd als woordachtig versus interpunctie en spaties) en is locatiebewust, zodat Japanse, Chinese en Thaise woordgrenzen correct worden weergegeven. Alles wordt lokaal berekend zonder netwerkaanroepen. Een Unicode-tekstsegmenter — te onderscheiden van de Unicode-codepuntdatabase (unicode), de case/tekst-hulpprogramma's toolkit (text) en stringovereenkomst (similarity). Geen upstream-sleutel, geen cache.

api.oanor.com/segmenter-api

Unicode API

De Unicode Character Database (UCD) als een API. Los ELK codepunt (0..10FFFF, inclusief de CJK- en Hangul-reeksen) op naar zijn naam, algemene categorie, blok en script — plus het letterlijke teken, HTML-entiteit (😀), CSS-escape en UTF-8/UTF-16-bytevolgordes. Geef een hexadecimaal codepunt (bijv. 1F600 → 😀 GRINNING FACE) of een letterlijk teken (?char=€). Zoek 40.000+ benoemde tekens op naam (bijv. "hart", "pijl"), filter op categorie of blok, en blader door alle 346 Unicode-blokken. Ideaal voor tekstverwerkingshulpmiddelen, emoji-pickers, editors, internationalisatie en ontwikkelaarshulpprogramma's.

api.oanor.com/unicode-api

Emoji API

Een complete emoji-database in één snelle API. Zoek ongeveer 1.870 emoji's op naam, trefwoord, alias of tag, zoek een enkele emoji op via zijn alias (zoals rocket of :fire:) of via het emoji-teken zelf, blader door een van de negen Unicode-categorieën, of krijg willekeurige emoji's (optioneel uit een categorie). Elke emoji wordt geleverd met zijn naam, categorie, aliassen, zoektags, Unicode-codepunten en de versie waarin deze is geïntroduceerd. Gebouwd op de open GitHub gemoji-dataset en volledig in-memory geserveerd, zodat reacties onmiddellijk zijn en de service altijd beschikbaar is. Ideaal voor chat- en berichtenapps, emoji-pickers en -zoekopdrachten, sociale en contenttools, games en leuke widgets.

api.oanor.com/emoji-api