Naturlig språkbehandling: N-gram modell
Hej!
Jag ska besvara hur många parametrar det finns i en N-gram modell och fått följande förutsättningar:
"En n-gram-modell har lika många parametrar (i detta fall sannolikheter) som det finns möjliga n-gram som kan byggas med hjälp av orden i modellens vokabulär. Antag att vokabulären består av 100 000 unika ord. Hur många parametrar har då en $4$-gram-modell? Svara med ett konkret tal."
Såsom jag har tolkat texten är att en unigram-modell skulle ha lika många parametrar som det finns möjliga unigram för modellens vokabulär, låt oss ponera att denna modell har 10 000 unika ord i dess vokabulär, skulle denna då ha 10 000 parametrar?
För den som är intresserad att lyssna på videon: https://ai-for-naturligt-sprak.ida.liu.se/content/kapitel_6/ngram-modeller