Proteiner - få fram proteinsekvens
I min bok står följande mening, i kontexten att undersöka proteiners struktur och funktion, och jag skulle behöva ha hjälp med hur de menar:
"Many protein sequences, often deduced from genome sequences, are available in vast sequence databases."
Alltså hur menar de med "deduced from". Jag vet vad deduced i sig betyder - men förstår inte hur de menar att att man kan få fram proteinsekvensen.
FÖr om man bara kollar i genomet finns det ju inget som rakt av säger att "här börjar ett protein och här slutar det" (även om man kan få vissa hintar om bitar av genomet som kan ingå i proteiner). Så vad menar de man gör?
DNA kodar ju för vilka aminosyror som skall ingå i proteinet, så om man vet vilka baser det är i DNA-strängen kan man räkna ut vilka aminosyror det motsvarar.
Det finns kanske ingen liten skylt som säger "här börjar en kodande DNA-sekvens", men det finns en massa ledtrådar man kan använda.
Promotorregionerna - de delar där RNA-polymeras binder har typiska sekvenser, och man kan leta efter dem. Man kan också sekvensera mRNA och sedan leta efter motsvarande sekvenser i DNA. Det ger visserligen inte alla gener, men en stor andel. Sedan kombinerar man olika metoder för maximal täckning.
Det står en del om detta här:
Ber om ursäkt om min fråga var otydlig: de bitarna som ni nämner är just vad jag förstår (tex att det finns ledtrådar men ingen "skylt" :) ), men jag tolkade meningen som att de kollat i DNA och sett just att "där och där" kan man se att det är ett protein som kan bli till (i rätt cell). Men då måste jag missförstått. Det lät så konstigt och verkligen motsatsen till vad ALLA lärare och andra böcker sagt.