#nlp — oanor

API de Diccionario Japonés Jisho

Datos de diccionario japonés-inglés a través de la API abierta de Jisho.org (sin key). El endpoint de búsqueda consulta el diccionario por palabras y compuestos de kanji y acepta inglés, romaji, kana o kanji como entrada; cada entrada incluye sus escrituras japonesas (palabra + lectura), sentidos en inglés con partes de la oración y etiquetas de uso, nivel JLPT y un indicador de palabra común, con un filtro opcional solo para palabras comunes. El endpoint de palabra devuelve la mejor coincidencia única —preferiblemente común— para una palabra clave, ideal para búsquedas rápidas y herramientas de idioma. Datos reales del diccionario directamente de Jisho, almacenados en caché brevemente para velocidad — sin key. 3 endpoints. Ideal para aplicaciones de aprendizaje de idiomas, ayudas de furigana y lectura, herramientas de vocabulario y enriquecimiento de NLP japonés.

api.oanor.com/jisho-api

API de N-gramas

Genera n-gramas a partir de texto, con recuentos de frecuencia, completamente local. El endpoint ngrams divide el texto en secuencias contiguas de n tokens y devuelve cada n-grama distinto con la frecuencia con la que aparece, ordenado por frecuencia: n-gramas de palabras (unigramas, bigramas, trigramas y más) para análisis de frases y colocaciones, o n-gramas de caracteres (shingles) para coincidencias aproximadas, detección de idioma e indexación. El endpoint range produce todos los tamaños desde un mínimo hasta un máximo en una sola llamada (por ejemplo, gramas de 1 a 3), que es exactamente lo que necesitas para construir vectores de características. Elige modo de palabra o carácter, si convertir a minúsculas primero, y un límite top-N para conservar solo los más frecuentes. La tokenización de palabras es consciente de Unicode y mantiene apóstrofes y guiones internos (don't, well-known) como tokens individuales. Todo se ejecuta local y determinísticamente, por lo que es rápido y privado. Ideal para minería de texto y extracción de características de PNL, modelado de lenguaje y autocompletado, indexación de búsqueda y shingling, detección de plagio y similitud, y análisis de palabras clave y colocaciones. Cálculo puramente local: sin clave, sin servicio de terceros, instantáneo. En vivo, nada almacenado. 3 endpoints. Esto produce n-gramas y recuentos; para resúmenes extractivos y palabras clave, usa una API de resumen y para contar grafemas/caracteres, usa una API de segmentación de texto.

api.oanor.com/ngram-api

API de Resumen

Resume texto y extrae sus palabras clave — sin clave de IA, sin modelo externo. El endpoint de resumen es extractivo: puntúa cada oración por frecuencia de palabras y posición, y devuelve las más representativas (solicita un número fijo de oraciones o una fracción del original), manteniendo la redacción y el orden exactos del autor. El endpoint de palabras clave clasifica los términos más relevantes con sus recuentos y una puntuación relativa, filtrando palabras vacías. Como es determinista y se ejecuta localmente, el mismo texto siempre da el mismo resultado, al instante y de forma privada. Perfecto para vistas previas de artículos y TL;DR, fragmentos de búsqueda, etiquetado y triaje de contenido, y para proporcionar contexto más corto a herramientas posteriores. Cálculo local puro — sin servicio de terceros; envía texto largo mediante POST. En vivo, nada almacenado. 3 endpoints. Distinto del análisis de sentimiento/NLP, listas de palabras vacías y segmentación de texto Unicode.

api.oanor.com/summarize-api

API Stemmer

Reduce palabras a su raíz lingüística (stem) con los algoritmos clásicos de Snowball — running → run, fishing → fish, nationalization → nation — en 24 idiomas, incluyendo inglés, alemán, francés, español, italiano, portugués, neerlandés, ruso, árabe, finlandés, sueco y más. Obtén el stem de un texto completo (cada palabra, devolviendo tanto el mapeo palabra por palabra como el texto completamente procesado) o de una sola palabra. El stemming es el paso de normalización central detrás de motores de búsqueda, expansión de consultas, indexación de texto, coincidencia de palabras clave y preprocesamiento de PLN. Cómputo local puro — sin clave, sin servicio de terceros, instantáneo. En vivo, nada se almacena. 4 endpoints. Distinto del análisis de sentimiento/PLN y la coincidencia difusa de cadenas.

api.oanor.com/stemmer-api

API de Legibilidad

Puntúa qué tan fácil es leer un texto utilizando las fórmulas de legibilidad estándar y revisadas por pares: Flesch Reading Ease, Flesch-Kincaid Grade, Gunning Fog, SMOG, Coleman-Liau y el Automated Readability Index. Envía texto y obtén las seis puntuaciones junto con los recuentos subyacentes (palabras, oraciones, sílabas, palabras complejas y polisílabas, letras y caracteres), un nivel de grado promedio, un tiempo de lectura estimado y una interpretación en inglés sencillo de la facilidad de lectura. Un segundo endpoint cuenta las sílabas de una palabra o de cada palabra en una frase. Proporciona texto en línea mediante ?text=, como parámetro de consulta o en el cuerpo de la solicitud; todo se calcula localmente sin llamadas de red, por lo que es rápido y determinista. Construido para herramientas de contenido y redacción, flujos de trabajo de SEO y editoriales, educación y verificaciones de accesibilidad (lenguaje sencillo), y revisión de escritura UX. Un puntuador de legibilidad, distinto del análisis de sentimiento/NLP (nlp), la revisión de ortografía y gramática (grammar), las utilidades de mayúsculas y texto (text) y la similitud de cadenas (similarity). Sin clave upstream, sin caché.

api.oanor.com/readability-api

API de Hugging Face

El Hugging Face Hub como API: el registro central y abierto de modelos y conjuntos de datos de aprendizaje automático que impulsa gran parte del ecosistema moderno de IA. Esta API envuelve el hub público huggingface.co en JSON limpio. /v1/models busca los modelos del Hub y te permite filtrar por tarea (pipeline_tag — p. ej., text-generation, text-to-image, image-classification, automatic-speech-recognition, sentence-similarity) y por biblioteca (transformers, diffusers, sentence-transformers, …), ordenados por descargas, me gusta, última modificación, fecha de creación o puntuación de tendencia — cada modelo devuelto con su id, autor, tarea, biblioteca, recuento de descargas y me gusta, licencia, etiquetas y marcas de tiempo. /v1/model?id=google-bert/bert-base-uncased devuelve los metadatos completos de un solo modelo. /v1/datasets busca conjuntos de datos de ML de la misma manera, y /v1/dataset?id=ILSVRC/imagenet-1k devuelve los metadatos de un solo conjunto de datos. Los ids tienen la forma org/nombre (tómalos de los endpoints de búsqueda). Ideal para herramientas de ML y MLOps, sitios de descubrimiento y comparación de modelos, tableros de clasificación y paneles de IA, y asistentes de IA que recomiendan modelos. Los datos provienen del Hugging Face Hub público (gratuito para usar). Este es el centro de modelos y conjuntos de datos de IA/ML, distinto de los registros de paquetes de software (npm, PyPI, Maven, NuGet) y los índices de artículos académicos (arXiv).

api.oanor.com/huggingface-api

API de Stopwords

Listas de palabras vacías y eliminación para 58 idiomas. Obtenga la lista completa de palabras vacías para un idioma, vea todos los idiomas compatibles con sus recuentos de palabras, verifique si una sola palabra es una palabra vacía o elimine las palabras vacías de un bloque de texto para obtener un flujo de palabras clave limpio. Construido sobre el conjunto de datos abierto stopwords-iso y servido completamente en memoria, por lo que las respuestas son instantáneas y el servicio está siempre disponible. Ideal para indexación y relevancia de búsqueda, preprocesamiento de PNL y minería de texto, extracción de palabras clave, generación de etiquetas y herramientas de contenido.

api.oanor.com/stopwords-api

API de Palabras

Encuentra palabras por significado, sonido y ortografía: palabras de significado similar (tesauro), rimas, sugerencias de autocompletado y coincidencias de ortografía con comodines. Respaldado por Datamuse. Ideal para asistentes de escritura, autocompletado, crucigramas, juegos de palabras, herramientas de poesía y preprocesamiento de PLN.

api.oanor.com/words-api

API de traducción

Traduce texto entre más de 40 idiomas con una puntuación de confianza y sugerencias alternativas. Interfaz GET simple, sin alojamiento de modelos, ideal para localizar contenido, mensajes de chat, datos de productos y texto generado por usuarios.

api.oanor.com/translate-api

API de Sentimiento y PLN

Analiza texto en tiempo real: puntuación de sentimiento (positivo / negativo / neutral con las palabras coincidentes), detección automática de idioma en más de 180 idiomas y un endpoint de análisis combinado con estadísticas de texto. Sin configuración, sin alojamiento de modelos.

api.oanor.com/nlp-api