Sannolikhet, 4-gram modell
Hej!
Jag ska besvara hur många parametrar/sannolikheter det finns i en N-gram modell och fått följande förutsättningar:
För en unigram modell har jag formeln:
Om jag har ett vokabulär på 100 unika ord leder det till att N=100, det jag inte riktigt förstår är vad jag ska lägga in i P(w) delen.
För den som är intresserad att lyssna på videon: https://ai-for-naturligt-sprak.ida.liu.se/content/kapitel_6/ngram-modeller
Jag förstår inte riktigt vad du menar med "vad jag ska lägga in i P(w) delen.".
Frågan, om jag förstår dig rätt är alltså, hur många parametrar det finns i modellen, givet att den har den specificerade formen och att vokabulären har 100 element.
Förstår du vad den frågan betyder?
Smutsmunnen skrev:Jag förstår inte riktigt vad du menar med "vad jag ska lägga in i P(w) delen.".
Frågan, om jag förstår dig rätt är alltså, hur många parametrar det finns i modellen, givet att den har den specificerade formen och att vokabulären har 100 element.
Förstår du vad den frågan betyder?
Det jag menar är att jag förstår att i=1 då det är en unigram modell och att N är antal ord. Det jag inte förstår är vad P(w) innebär, tex ska antal ord in där igen eller ska jag formulera en formel?
Frågan som jag ska besvara lyder:
"En $n$-gram-modell har lika många parametrar (i detta fall sannolikheter) som det finns möjliga $n$-gram som kan byggas med hjälp av orden i modellens vokabulär. Antag att vokabulären består av 100 000 unika ord. Hur många parametrar har då en $4$-gram-modell? Svara med ett konkret tal."
Rebecka_k skrev:Smutsmunnen skrev:Jag förstår inte riktigt vad du menar med "vad jag ska lägga in i P(w) delen.".
Frågan, om jag förstår dig rätt är alltså, hur många parametrar det finns i modellen, givet att den har den specificerade formen och att vokabulären har 100 element.
Förstår du vad den frågan betyder?
Det jag menar är att jag förstår att i=1 då det är en unigram modell och att N är antal ord. Det jag inte förstår är vad P(w) innebär, tex ska antal ord in där igen eller ska jag formulera en formel?
Nä du vet ju generellt sett inte vad P(w_i) är och för att besvara frågan behöver du heller inte veta det.
Smutsmunnen skrev:Rebecka_k skrev:Smutsmunnen skrev:Jag förstår inte riktigt vad du menar med "vad jag ska lägga in i P(w) delen.".
Frågan, om jag förstår dig rätt är alltså, hur många parametrar det finns i modellen, givet att den har den specificerade formen och att vokabulären har 100 element.
Förstår du vad den frågan betyder?
Det jag menar är att jag förstår att i=1 då det är en unigram modell och att N är antal ord. Det jag inte förstår är vad P(w) innebär, tex ska antal ord in där igen eller ska jag formulera en formel?
Nä du vet ju generellt sett inte vad P(w_i) är och för att besvara frågan behöver du heller inte veta det.
Det var ju bra, men hur räknar jag ut det? Skulle vilja räkna ut för hand och mha miniräknare
Det jag frågade i min första post var om du förstod frågan, jag känner att jag måste upprepa det: förstår du vad som efterfrågas?
För det första, vet du vad en parameter är för något?
I unigrammodellen har du fått en formel, i den formeln vet du vilka parametrarna är?
I en unigram-modell med N ord, hur många parametrar finns det?
Och om vi lämnar unigram, hur skulle en motsvarighet till formeln se ut för ett 4-gram?
I formeln för 4-gram, vilka är parametrarna?
Sedan slutfrågan, hur många parametrar i 4-gram modellen?
Det är alltså ingen svår fråga, och du behöver absolut inga hjälpmedel för att beräkna det, räcker med huvudräkning, det behövs bara att du förstår vad de efterfrågar.
Eller jag menar om vi struntar i om du förstår vad en parameter är eller inte så står ju svaret i princip i frågan
"En $n$-gram-modell har lika många parametrar (i detta fall sannolikheter) som det finns möjliga $n$-gram som kan byggas med hjälp av orden i modellens vokabulär"
Så en fyrgram-modell har lika många parameterar som det finns möjliga 4-gram av ord från vokabulären. Så det finns lika många parametrar som antalet sätt att skriva en serie av 4 ord från en vokabulär med 100000 ord. Tillämpa sedan bara:
https://sv.wikipedia.org/wiki/Multiplikationsprincipen