#unicode — oanor

Schriftsysteme (ISO 15924) API

Das ISO-15924-Register der Schriftsysteme – die von Unicode, BCP-47 und CLDR verwendeten Skriptcodes – aus dem Speicher bereitgestellt (kein API-Key). Jedes Skript enthält seinen 4-Buchstaben-Code (z. B. Latn, Arab, Hani), numerischen Code, englische und französische Namen, den Unicode-Property-Value-Alias, die Unicode-Version, in der es hinzugefügt wurde, und sein Datum. Suchen Sie ein Skript nach Code oder numerisch, durchsuchen Sie es nach Code oder Namen, oder listen Sie das gesamte Register auf. 226 Skripte. Ideal für Internationalisierung, Locale- und Font-Tooling, BCP-47-Tag-Validierung und Text-Rendering-Pipelines.

api.oanor.com/scripts-api

Braille API

Konvertieren Sie Text in Unicode-Braille und zurück. Verwendet unkontrahiertes (Grade 1) englisches Braille: die 26 Buchstaben, Ziffern mit dem Zahlenzeichen, Großbuchstaben mit dem Großbuchstabenzeichen und übliche Satzzeichen, alle ausgegeben als Unicode-Braille-Muster (U+2800–U+28FF), sodass sie überall dargestellt werden. Der to-braille-Endpunkt wandelt gewöhnlichen Text in Braille um; der from-braille-Endpunkt dekodiert Braille zurück in Text. Unbekannte Zeichen werden unverändert durchgelassen. Perfekt für Barrierefreiheitswerkzeuge und Bildung, Etiketten- und Beschilderungsentwürfe, Braille-Display-Vorschauen und Lernressourcen. Reine lokale Berechnung — kein Schlüssel, kein Drittanbieterdienst, sofort. Live, nichts wird gespeichert. 3 Endpunkte. Nur Grade 1 (keine Kontraktionen). Unterscheidet sich von Chiffre-/Alphabet-Kodierern und allgemeinen Texttransformationen.

api.oanor.com/braille-api

Unicode Normalize API

Normalisieren und falten Sie Unicode-Text. Konvertieren Sie jeden String in eine der vier Unicode-Normalisierungsformen – NFC, NFD, NFKC, NFKD – sodass visuell identischer Text mit unterschiedlichen Codepunkt-Kompositionen (é als ein Codepunkt vs. e + kombinierender Akzent) konsistent verglichen und gespeichert wird. Falten Sie diakritische Zeichen und Sonderbuchstaben zu einfachem ASCII (café → cafe, Straße → Strasse, Ångström → Angstrom, Łódź → Lodz) für Slugs, Suchschlüssel und Dateinamen; die ﬁ-Ligatur und ähnliche Kompatibilitätszeichen werden unter NFKC/NFKD erweitert. Und vergleichen Sie zwei Strings nach Normalisierung auf Gleichheit, optional ohne Berücksichtigung der Groß-/Kleinschreibung. Perfekt für Deduplizierung, Suche und Indizierung, Benutzernamen- und Identifikatorprüfungen sowie zur Abwehr von ähnlich aussehenden (Homoglyph-)Eingaben. Reine lokale Berechnung – kein Schlüssel, kein Drittanbieterdienst, sofort. Live, nichts wird gespeichert. 4 Endpunkte. Unterscheidet sich von Unicode-Zeichendatenbank-Abfragen und Textsegmentierung.

api.oanor.com/normalize-api

Text Segmentation API

Zählen und teilen Sie Text so, wie Menschen ihn tatsächlich lesen, mit Unicode-korrekter Segmentierung. Der Count-Endpunkt gibt die Anzahl der Graphemcluster zurück – die echten, vom Benutzer wahrgenommenen Zeichen, sodass ein Familien-Emoji als 1 (nicht 7) und ein akzentuierter Buchstabe als 1 zählt – zusammen mit Wörtern, Sätzen, Codepunkten, UTF-16-Codeeinheiten (der naiven Stringlänge, die überzählt) und UTF-8-Byte-Länge. Dies ist genau das, was Zeichenbegrenzungsfelder, Tweet/SMS-Zähler und Validierung benötigen, damit die Zählung mit dem übereinstimmt, was der Benutzer sieht. Der Segment-Endpunkt teilt Text in Graphem-, Wort- oder Satzsegmente auf (Wortsegmente werden als wortähnlich versus Satzzeichen und Leerzeichen gekennzeichnet) und ist sprachbewusst, sodass japanische, chinesische und thailändische Wortgrenzen korrekt erkannt werden. Alles wird lokal ohne Netzwerkaufrufe berechnet. Ein Unicode-Textsegmentierer – unterschieden von der Unicode-Codepunkt-Datenbank (unicode), dem Fall-/Text-Utilities-Toolkit (text) und der String-Ähnlichkeit (similarity). Kein vorgeschalteter Schlüssel, kein Cache.

api.oanor.com/segmenter-api

Unicode API

Die Unicode-Zeichendatenbank (UCD) als API. Lösen Sie JEDEN Codepunkt (0..10FFFF, einschließlich der CJK- und Hangul-Bereiche) in seinen Namen, seine allgemeine Kategorie, seinen Block und sein Skript auf – plus das Literalzeichen, die HTML-Entität (😀), das CSS-Escape und die UTF-8/UTF-16-Byte-Sequenzen. Übergeben Sie einen hexadezimalen Codepunkt (z. B. 1F600 → 😀 GRINNING FACE) oder ein Literalzeichen (?char=€). Durchsuchen Sie 40.000+ benannte Zeichen nach Namen (z. B. „heart“, „arrow“), filtern Sie nach Kategorie oder Block, und durchstöbern Sie alle 346 Unicode-Blöcke. Ideal für Textverarbeitungswerkzeuge, Emoji-Auswähler, Editoren, Internationalisierung und Entwicklerdienstprogramme.

api.oanor.com/unicode-api

Emoji API

Eine vollständige Emoji-Datenbank in einer schnellen API. Durchsuchen Sie etwa 1.870 Emojis nach Name, Schlüsselwort, Alias oder Tag, suchen Sie ein einzelnes Emoji nach seinem Alias (wie rocket oder :fire:) oder nach dem Emoji-Zeichen selbst, durchstöbern Sie eine der neun Unicode-Kategorien oder erhalten Sie zufällige Emojis (optional aus einer Kategorie). Jedes Emoji enthält seinen Namen, seine Kategorie, Aliase, Such-Tags, Unicode-Codepunkte und die Version, in der es eingeführt wurde. Basierend auf dem offenen GitHub-gemoji-Datensatz und vollständig im Arbeitsspeicher bereitgestellt, sodass Antworten sofort erfolgen und der Dienst immer verfügbar ist. Ideal für Chat- und Messaging-Apps, Emoji-Auswahlen und -Suche, soziale und Inhaltswerkzeuge, Spiele und unterhaltsame Widgets.

api.oanor.com/emoji-api