6 svar
172 visningar
tangotanga 40 – Fd. Medlem
Postad: 10 okt 2018 10:32

Antal bp i ett genom

Jag har en fil med ett genom och ska nu hitta antalet bp i genomet. Är det length som är bp? Nedan ses början på filen:

 

Location        Strand      Length          PID                       Gene                           Synonym      Code             COG Product
1..822               +               273        292571599    - rpr22_CDS001                    -                   -             hypothetical protein
906..1298       +               130        292571600       trxA rpr22_CDS002           -                   -             Thioredoxin

Tack på förhand!

Laguna Online 30711
Postad: 10 okt 2018 11:02

Jag kan inte det här, men jag googlade lite (med namnen på alla kolumner) för att se om det fanns nåt om det här filformatet. Jag hittade inget jag tyckte var entydigt, men det såg ut som om Length är antalet aminosyror i proteinet.

SvanteR 2751
Postad: 10 okt 2018 11:27

För det första: Ett genom är alla gener i en organism. Är det verkligen det du har? Det ser mer ut som en lista över ett antal proteinkodande gener (som Laguna är inne på). Efter lite googlande verkar det vara från bakterien Rickettsia prowazekii, stämmer det?

Length är mycket riktigt antalet aminosyror i det protein genen kodar för. Eftersom det är en bakterie har den ett cirkulärt genom, och då är nog "location" positionen för genen i genomet. Den första genen börjar alltså på nukleotid nummer 1 och slutar på nukleotid nummer 822. Det kan du använda för att beräkna antalet baspar som kodar för de proteiner du har i din lista.

Jag skulle dock inte kalla det "antalet bp i genomet", för ofta inkluderar man även icke-kodande DNA och DNA som kodar annat än proteiner i begreppet genom, men det beror lite på hur din uppgift är formulerad.

tangotanga 40 – Fd. Medlem
Postad: 10 okt 2018 12:29

Tack för responsen! Om jag istället vill ha genfrekvensen?

SvanteR 2751
Postad: 10 okt 2018 12:57
tangotanga skrev:

Tack för responsen! Om jag istället vill ha genfrekvensen?

 Jag har svårt att förstå hur du skulle kunna beräkna en genfrekvens ur den typ av data du har visat. Begreppet genfrekvens syftar på hur stor andel av en given allel det finns i en population. Du behöver alltså data på populationsnivå.

tangotanga 40 – Fd. Medlem
Postad: 1 feb 2019 16:33

Jag har en mycket större datafil men jag ville såklart inte bifoga hela den. Jag läser på universitetsnivå och i denna labb ska vi alltså "Rewrite your program from exercise 1 so that it reads the original ptt file (not the one where you removed the headers), and calculates the gene density in a genome."

I förra uppgiften skulle vi beräkna antalet baspar, och det är gjort, det var i location. Men genfrekvensen? Antal gener per baspar? Var kan jag tänka finna den informationen? Är det length/#baspar?

Jag behöver alltså inte hjälp med att skriva själva scriptet utan snarare teoretiskt; var hittar jag informationen för att kunna beräkna "genfrekvensen"? 

mag1 9562
Postad: 7 feb 2019 20:21

Det verkar ha kört fast på biologidelen. Kanske det finns lite klarare definitioner i dina instruktioner?

 

Verkar som om du behöver definiera "gene density", kanske kan det vara andelen av genomet som upptas av proteinkodande gener? Mellan dessa proteinkodande segment finns det en del DNA som inte kodar för proteiner, till exempel promotorsekvenser, ORI, RBS, tRNA-kodande DNA - vilka samtliga krävs för överlevnaden av organismen. Vissa organismer med mindre genom, t.ex. bakterier har en hög andel av proteinkodande DNA, jämfört med t.ex. människan med ett mycket större genom som har mycket "icke-kodande" DNA.

 

Apropå din fråga

"Antal gener per baspar?"

-Det går många (100+) baspar på en gen.

Svara
Close