Atrás

#soundex

2 APIs con esta etiqueta

API de Soundex y Coincidencia Difusa

Matemáticas de coincidencia de cadenas fonética y difusa como una API, calculadas local y deterministicamente. El endpoint soundex calcula el código Soundex americano de una palabra: la primera letra seguida de tres dígitos que codifican sus sonidos consonánticos, ignorando mayúsculas/minúsculas y no letras, y aplicando las reglas de reinicio de vocales y duplicados adyacentes, por lo que Robert y Rupert ambos codifican como R163, Smith y Smyth como S530, y los casos difíciles clásicos Ashcraft (A261), Tymczak (T522) y Pfister (P236) resultan correctos. El endpoint levenshtein calcula la distancia de edición entre dos cadenas (el mínimo de inserciones, eliminaciones y sustituciones, opcionalmente sensible a mayúsculas/minúsculas) y una similitud del 0–100 %, por lo que kitten → sitting son tres ediciones y aproximadamente un 57 % de similitud. El endpoint compare combina ambos: informa si dos cadenas comparten un código Soundex (suenan igual) y su similitud de Levenshtein (se escriben igual), y marca una posible coincidencia cuando los códigos coinciden o la similitud es al menos del 80 %. Todo se calcula local y deterministicamente, por lo que es instantáneo y privado. Ideal para desarrolladores de aplicaciones de deduplicación de datos, CRM, búsqueda difusa, autocompletado, genealogía y limpieza de datos, herramientas de coincidencia de nombres y vinculación de registros, y software de búsqueda. Cálculo puramente local: sin clave, sin servicio de terceros, instantáneo. En vivo, nada se almacena. 3 endpoints. Esto es coincidencia fonética y de distancia de edición; para búsqueda de texto completo use una API de búsqueda.

api.oanor.com/soundex-api

API de Similitud de Cadenas

Un conjunto de herramientas rápido y completamente local para similitud de cadenas y coincidencia difusa: distancias de edición (Levenshtein, Damerau-Levenshtein, Hamming), puntuaciones de similitud normalizadas 0-1 (relación de Levenshtein, Jaro, Jaro-Winkler, Dice y Jaccard), códigos fonéticos Soundex y clasificación de mejor coincidencia de una consulta contra una lista de candidatos. Cada endpoint acepta entrada a través de la cadena de consulta o el cuerpo de la solicitud. Cómputo puro del lado del servidor, sin terceros externos, por lo que las respuestas son instantáneas y siempre están disponibles. Ideal para coincidencia de registros y deduplicación, búsqueda y autocompletado, corrección ortográfica, limpieza de datos y resolución de entidades.

api.oanor.com/similarity-api