WordNet: base de dades lèxica que relaciona paraules entre si.roïn és un sinònim de dolent, malparit, miserable, etc.carnivor, vertebrat serien hyperònims de gat.gat i felí són sinònims, però no tenen el mateix significat.cabró és un sinònim de roïn, però no sempre es poden intercanviar.the shit és un sinònim de the best en anglès que no apareix en WordNet.["gat", "gos", "cavall", "ocell", "peix"], llavors "gat" es pot representar com a ["New", "York", "in", "winter"]p són el seu context.p defineixen el significat de p.
Facilita calcular la similitud entre paraules.
from gensim.models import Word2Vec
sentences = [
["Gavi", "company", "Pedri"],
["Xavi", "entrena", "Barça"],
["Gavi", "juga", "Barça"],
["Gavi", "chuta"],
["Kepa", "para"],
["Xavi", "entrena"],
]
model = Word2Vec(sentences, min_count=1)
gavi = model.wv["Gavi"]
print(gavi)
[
-0.00536227 0.00236431 0.0510335 0.09009273
- 0.0930295 - 0.07116809 0.06458873 0.08972988
- 0.05015428 - 0.03763372
]
model.wv.most_similar("Gavi")
[('Barça', 0.5436005592346191),
('Pedri', 0.3792896568775177),
('entrena', 0.3004249036312103),
('Xavi', 0.10494352877140045),
('juga', -0.1311161071062088),
('chuta', -0.1897382140159607),
('para', -0.22418655455112457),
('Kepa', -0.2726020812988281),
('company', -0.7287455797195435)]
Aquests models es basen en els espectrogrames de les veus (representació de la veu en funció del temps i la freqüència).
Funcionen en quatre etapes:
["El", "Barça", "està", "en", "crisi"].["Barça", "crisi"].Alguns dels models més utilitzats per a l'anàlisi de sentiments són:
[{crisi: 0.8}, {forma: 0.1}, {casa: 0.1}]Els models ocults de Markov (HMM) són models estocàstics que permeten modelar seqüències de paraules.
Es basen en la idea que les paraules d’una seqüència no són independents, sinó que depenen de les paraules anteriors.
Els HMM són capaços de modelar la probabilitat de transició entre paraules.
El seu principal desavantatge és que no poden modelar dependències a llarg termini.
Com ja hem parlat, les xarxes neuronals recurrents (RNN) són xarxes neuronals que poden processar seqüències de longitud variable de forma eficient.
En aquesta secció veuren en més detall com funcionen les RNN i com són utilitzades en NLP.

Poden ser utilitzats en moltes tasques de NLP pero més enllà del NLP també s'utilitzen en altres tasques com les següents:
Tots aquests usos els fan una eina molt potent i que poden arribar a substituir molts dels models actuals.