Πίσω

#fuzzy-matching

2 API με αυτήν την ετικέτα

Soundex & Fuzzy Match API

Φωνητική και ασαφής αντιστοίχιση συμβολοσειρών ως API, υπολογιζόμενη τοπικά και ντετερμινιστικά. Το endpoint soundex υπολογίζει τον αμερικανικό κώδικα Soundex μιας λέξης — το πρώτο γράμμα ακολουθούμενο από τρία ψηφία που κωδικοποιούν τα σύμφωνά της, αγνοώντας πεζά/κεφαλαία και μη γράμματα και εφαρμόζοντας τους κανόνες επαναφοράς φωνηέντων και διπλών γειτονικών — οπότε τα Robert και Rupert κωδικοποιούνται και τα δύο ως R163, τα Smith και Smyth ως S530, και οι κλασικές δύσκολες περιπτώσεις Ashcraft (A261), Tymczak (T522) και Pfister (P236) βγαίνουν σωστά. Το endpoint levenshtein υπολογίζει την απόσταση επεξεργασίας μεταξύ δύο συμβολοσειρών (τις ελάχιστες εισαγωγές, διαγραφές και αντικαταστάσεις, προαιρετικά με διάκριση πεζών/κεφαλαίων) και μια ομοιότητα 0–100%, οπότε kitten → sitting είναι τρεις επεξεργασίες και περίπου 57% όμοιες. Το endpoint compare συνδυάζει και τα δύο: αναφέρει αν δύο συμβολοσειρές μοιράζονται έναν κώδικα Soundex (ακούγονται ίδιες) και την ομοιότητα Levenshtein (γράφονται ίδιες), και επισημαίνει μια πιθανή αντιστοιχία όταν οι κώδικες συμφωνούν ή η ομοιότητα είναι τουλάχιστον 80%. Όλα υπολογίζονται τοπικά και ντετερμινιστικά, οπότε είναι άμεσα και ιδιωτικά. Ιδανικό για προγραμματιστές εφαρμογών αφαίρεσης διπλότυπων δεδομένων, CRM, ασαφούς αναζήτησης, αυτόματης συμπλήρωσης, γενεαλογίας και καθαρισμού δεδομένων, εργαλεία αντιστοίχισης ονομάτων και σύνδεσης εγγραφών, και λογισμικό αναζήτησης. Καθαρός τοπικός υπολογισμός — χωρίς κλειδί, χωρίς υπηρεσία τρίτου, άμεσο. Ζωντανό, τίποτα δεν αποθηκεύεται. 3 endpoints. Πρόκειται για φωνητική αντιστοίχιση και αντιστοίχιση απόστασης επεξεργασίας· για αναζήτηση πλήρους κειμένου χρησιμοποιήστε ένα search API.

api.oanor.com/soundex-api

API Ομοιότητας Συμβολοσειρών

Ένα γρήγορο, πλήρως τοπικό εργαλείο ομοιότητας συμβολοσειρών και ασαφούς αντιστοίχισης: αποστάσεις επεξεργασίας (Levenshtein, Damerau-Levenshtein, Hamming), κανονικοποιημένες βαθμολογίες ομοιότητας 0-1 (λόγος Levenshtein, Jaro, Jaro-Winkler, Dice και Jaccard), φωνητικοί κώδικες Soundex και κατάταξη βέλτιστης αντιστοίχισης ενός ερωτήματος έναντι μιας λίστας υποψηφίων. Κάθε τελικό σημείο δέχεται είσοδο μέσω της συμβολοσειράς ερωτήματος ή του σώματος αιτήματος. Καθαρός υπολογισμός από την πλευρά του διακομιστή, χωρίς τρίτο μέρος ανάντη, επομένως οι απαντήσεις είναι άμεσες και πάντα διαθέσιμες. Ιδανικό για αντιστοίχιση εγγραφών και αφαίρεση διπλοτύπων, αναζήτηση και αυτόματη συμπλήρωση, ορθογραφικό έλεγχο, καθαρισμό δεδομένων και επίλυση οντοτήτων.

api.oanor.com/similarity-api