spaCy
Το spaCy είναι ανοικτού κώδικα βιβλιοθήκη λογισμικού επεξεργασίας φυσικής γλώσσας (αγγλικά: natural language processing, NLP) το οποίο είναι υλοποιημένο σε Python και Cython.[1][2]
Εν αντιθέσει με το NLTK που χρησιμοποιείται εκτενώς για εκπαιδευτικούς και ερευνητικούς σκοπούς, στην περίπτωση του spaCy έχει δοθεί έμφαση στη δημιουργία λογισμικού για χρήση σε παραγωγικά περιβάλλοντα.[3][4] Υποστηρίζει επίσης ροές εργασίας βαθιάς μάθησης, που επιτρέπουν τη διασύνδεση στατιστικών μοντέλων εκπαιδευμένων από δημοφιλείς βιβλιοθήκες μηχανικής μάθησης όπως οι TensorFlow, PyTorch ή MXNet μέσω της δικής του βιβλιοθήκης μηχανικής μάθησης που ονομάζεται Thinc.[5][6]
Έχοντας ως βάση την Thinc, το spaCy διαθέτει μοντέλα συνελικτικού νευρωνικού δικτύου για τη μορφοσυντακτική σήμανση, τη συντακτική ανάλυση εξαρτήσεων (dependency parsing), την κατηγοριοποίηση κειμένου και την αναγνώριση οντοτήτων. Υπάρχουν έτοιμα στατιστικά μοντέλα για την εκτέλεση αυτών των εργασιών σε διάφορες γλώσσες, συμπεριλαμβανομένων των αγγλικών, πορτογαλικών, ισπανικών, ρωσικών και κινεζικών. Επίσης υποστηρίζεται η τμηματοποίηση (tokenization) σε μεγάλο αριθμό γλωσσών που επιτρέπει στους χρήστες να εκπαιδεύουν προσαρμοσμένα μοντέλα στα δικά τους σύνολα δεδομένων.[7]
Παραπομπές
[Επεξεργασία | επεξεργασία κώδικα]- ↑ Choi et al. (2015). It Depends: Dependency Parser Comparison Using A Web-based Evaluation Tool.
- ↑ «Google's new artificial intelligence can't understand these sentences. Can you?». Washington Post. https://www.washingtonpost.com/news/wonk/wp/2016/05/18/googles-new-artificial-intelligence-cant-understand-these-sentences-can-you/. Ανακτήθηκε στις 2016-12-18.
- ↑ «Facts & Figures - spaCy». spacy.io (στα Αγγλικά). Ανακτήθηκε στις 4 Απριλίου 2020.
- ↑ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). «Multidisciplinary instruction with the Natural Language Toolkit». Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL: 62. doi:. ISBN 9781932432145. https://www.aclweb.org/anthology/W/W08/W08-0208.pdf.
- ↑ «PyTorch, TensorFlow & MXNet». thinc.ai. Ανακτήθηκε στις 4 Απριλίου 2020.
- ↑ «explosion/thinc». GitHub. Ανακτήθηκε στις 30 Δεκεμβρίου 2016.
- ↑ «Models & Languages | spaCy Usage Documentation». spacy.io. Ανακτήθηκε στις 10 Μαρτίου 2020.
Εξωτερικοί σύνδεσμοι
[Επεξεργασία | επεξεργασία κώδικα]
Πολυμέσα σχετικά με το θέμα SpaCy στο Wikimedia Commons- Επίσημος ιστότοπος