DODATEK 1

Alternativní výpočet celkové práce tvorby bílkoviny

V kapitole 8 byl počet jedinečných neboli odlišitelných sekvencí polymeru  k počítán podle rovnice 8-7. Alternativní, avšak rovnocenný přístup, který uvedli Brillouin1 a Yockey2, bere v úvahu počet odlišných symbolů, které mohou být inkorporovány do každého místa polymeru. Celkový počet možných sekvencí je pak výsledkem počtu symbolů umocněným počtem míst v sekvenci:

  W k = iN (dod. 1-1)

kde typické hodnoty pro i a N byly již uvedeny v kapitole 8.

Tento vztah vychází z předpokladu, že všechny symboly i jsou stejně pravděpodobné. Podobný vztah lze odvodit pro symboly, které mají odlišnou a ne rovnocennou pravděpodobnost.3 Počet sekvencí vypočítaných podle rovnice dod. 1-1 bude vždy větší než výsledek rovnice 8-7, protože lze do ní doplnit různé soubory n+ n+ n3... + ni = N spíše než jednu skupinu hodnot ni, kterou připouští rovnice 8-7. Ve skutečnosti lze ukázat, že vypočítáme-li rovnici 8-7 pro každý z možných souborů n1 + n2 + n3...+ ni = N, pak součet získaných výsledků bude odpovídat hodnotě, kterou získáme přímo podle rovnice dod. 1-1.

Uvažujme hypotetický protein o délce 100 zbytků 20 různých aminokyselin (N = 100, i = 20) a předpokládejme, že každá z dvaceti aminokyselin je v proteinu zastoupena stejným počtem molekul, tj. 5. Dosazením do rovnice 8-7 lze vypočítat, že počet odlišných sekvencí této skupiny aminokyselin by byl 1,28 x 10115. Budeme-li předpokládat, že se počet molekul každé aminokyseliny může pohybovat v rozmezí 0 - 100, a pokud platí   20n= 100 (i = 1), pak jsou možné další odlišné sekvence. Ke 1,28 x 10115 možným sekvencím pro n1 = n2 = ...n20 = 5 by byly pak připočteny další odlišné sekvence, např. pro n1 = 3, n2 = 7, n3 = n4...n20 = 5 a pro všechny ostatní možné kombinace ni. Součet těchto všech odlišných sekvencí lze vypočítat pomocí rovnice dod. 1-1:

  W K = iN = 20100 = 1,26 x 10130

Yockey4 provedl přesnější analýzu cytochromu c, proteinu, který má u různých živočichů různě pozměněnou strukturu. Upravil rovnici 8-7 vzhledem k nerovnocenným pravděpodobnostem výskytu všech aminokyselin, který vyplynul z pozorovaných frekvencí zastoupení ve skutečných bílkovinách. Spočítal množství odlišných sekvencí 101 aminokyseliny na 1,8 x 10126. Tato hodnota se nachází mezi předchozími odhady, tj. 1,28 x 10115 podle rovnice 8-7 a 1,26 x 10130 podle rovnice dod. 1-1. Nyní je zřejmé, že rovnice 8-7 hůře vystihuje počet odlišných sekvencí pozorovaných v daném polypeptidu, protože omezuje úvahu na skupinu ni hodnot pozorovaných v polypeptidech se specifickou sekvencí, neboli proteinech. Rovnice 8-7 bude tedy ve zbývající části naší knihy použita pro získávání nižších odhadů W k.

Literatura

1. L. Brillouin, 1951. J.Appl.Phys. 22, 338.

2. Hubert P. Yockey, 1977. J.Theoret.Biol. 67, 377.

3. C. Shannon, 1948. Mathematical Theory of Communications. Urbana: The University of Illinois Press.

4. Yockey, J. Theoret. Biol. 67, 345


Zpět     Dále