Алгоритм ssp – Secondary Structure Protein icon

Алгоритм ssp – Secondary Structure Protein



НазваниеАлгоритм ssp – Secondary Structure Protein
Дата конвертации26.08.2012
Размер321.5 Kb.
ТипДокументы

Я попыталась пошагово описать процесс декодирования вторичной структуры белка всячески избегая биологической терминологии.

АЛГОРИТМ SSP – Secondary Structure Protein

  1. Разобьём нуклеотидную последовательность на триплеты

Например:

аaggtggagc aagcggtgga gacagagccg gagcccgagc tgcgccagca gaccgagtgg

cagagcggcc agcgctggga actggcactg ggtcgctttt gggattacct gcgctgggtg

cagacactgt ctgagcaggt gcaggaggag ctgctcagct cccaggtcac ccaggaactg

agggcgctga tggacgagac catgaaggag ttgaaggcct acaaatcgga actggaggaa

caactgaccc cggtggcgga ggagacgcgg gcacggctgt ccaaggagct gcaggcggcg

caggcccggc tgggcgcgga catggaggac gtgtgcggcc gcctggtgca gtaccgcggc

gaggtgcagg ccatgctcgg ccagagcacc gaggagctgc gggtgcgcct cgcctcccac

ctgcgcaagc tgcgtaagcg gctcctccgc gatgccgatg acctgcagaa gcgcctggca

gtgtaccagg ccggggcccg cgagggcgcc gagcgcggcc tcagcgccat ccgcgagcgc

ctggggcccc tggtggaaca gggccgcgtg cgggccgcca ctgtgggctc cctggccggc

cagccgctac aggagcgggc ccaggcctgg ggcgagcggc tgcgcgcgcg gatggaggag

atgggcagcc ggacccgcga ccgcctggac gaggtgaagg agcaggtggc ggaggtgcgc

gccaagctgg aggagcaggc ccagcagata cgcctgcagg ccgaggcctt ccaggcccgc

ctcaagagct ggttcgagcc cctggtggaa gacatgcagc gccagtgggc cgggctggtg

gagaaggtgc aggctgccgt gggcaccagc gccgcccctg tgcccagcga caatcac

и раскрасим их в соответствие с таблицей 1.


аaggtggagc aagcggtgga gacagagccg gagcccgagc tgcgccagca gaccgagtgg

cagagcggcc agcgctggga actggcactg ggtcgctttt gggattacct gcgctgggtg

cagacactgt ctgagcaggt gcaggaggag ctgctcagct cccaggtcac ccaggaactg

agggcgctga tggacgagac catgaaggag ttgaaggcct acaaatcgga actggaggaa

caactgaccc cggtggcgga ggagacgcgg gcacggctgt ccaaggagct gcaggcggcg

caggcccggc tgggcgcgga catggaggac gtgtgcggcc gcctggtgca gtaccgcggc

gaggtgcagg ccatgctcgg ccagagcacc gaggagctgc gggtgcgcct cgcctcccac

ctgcgcaagc tgcgtaagcg gctcctccgc gatgccgatg acctgcagaa gcgcctggca

gtgtaccagg ccggggcccg cgagggcgcc gagcgcggcc tcagcgccat ccgcgagcgc

ctggggcccc tggtggaaca gggccgcgtg cgggccgcca ctgtgggctc cctggccggc

cagccgctac aggagcgggc ccaggcctgg ggcgagcggc tgcgcgcgcg gatggaggag

atgggcagcc ggacccgcga ccgcctggac gaggtgaagg agcaggtggc ggaggtgcgc

gccaagctgg aggagcaggc ccagcagata cgcctgcagg ccgaggcctt ccaggcccgc

ctcaagagct ggttcgagcc cctggtggaa gacatgcagc gccagtgggc cgggctggtg

gagaaggtgc aggctgccgt gggcaccagc gccgcccctg tgcccagcga caatcac


^ Таблица 1. Генетический код пространственной структуры белка

Y

X

C

A.о.

A

A.о.

T

A.о.

G

A.о.

Z



C

ccc

cca

cct

ccg



P

cac

H

ctc

cta

ctt

ctg



L

cgc

cga

cgt

cgg



R

C

A

T

G

caa

Q

cat

H

cag

Q



A

acc

aca

act

acg



T

aac

N

atc

ata

att


I

agc

S

C

A

T

G

aaa

K

aga

R

aat

N

agt

S

aag

K

atg

M

agg

R



T

tcc

tca

tct

tcg



S

tac

Y

ttc

F

tgс

C

C

A

T

G

taa

Stop

tta

L

tga

Stop

tat

Y

ttt

F

tgt

C

tag

Stop

ttg

L

tgg

W



G

gcc

gca

gct

gcg



A

gac

D

gtc

gta

gtt

gtg



V

ggc

gga

ggt

ggg



G

C

A

T

G

gaa

E

gat

D

gag

E

Примечание: Stop-кодоны taa, tag и tga не транслируются в аминокислотную последовательность белка, а обрывают саму трансляцию. Это вроде точки в конце предложения. В кодирующие нуклеотидные последовательности данные триплеты, как правило, не включают. В программе, на всякий случай, их можно при написании аминокислотной последовательности позиционировать не буквой, а точкой.


Пункт 1 реализован в программе ПИКОТЕХ на основе таблицы композиционного кода А.Ю. Кушелева, которая отличается от моей таблицы 1. Пункт два ещё не реализован нигде. Приступим.

  1. Начинаем обесцвечивать раскрашенную нуклеотидную последовательность, сверяясь с таблицей 5, чтобы выявить фрагменты вторичной структуры.


^ Таблица 5. Топологический генетический код вторичной структуры белка

A

для R-спиральных мотивов белка

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

С

А.о.

U

А.о.

А

А.о.

G

А.о.

ссc

ccg

P

ttc

---

F

cac

---

H

cgc

cgg

R

acc

acg

T

gtc

gtg

V

aac

---

N

ggc

ggg

G

tcc

tcg

S

ctc

ctg

L

tac

---

Y

agc

---

S

gcc

gcg

A

atc

---

I

gac

---

D

tgc

---

C

---

---

---

---

ttg

L

---

cag

Q

---

agg

R

---

---

---

---

atg

M

---

aag

K

---

tgg

W

---

---

---

---

---




---

gag

E

---

---

---

Б

для β-складчатой структуры белка

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

С

A.о.

U

A.о.

А

A.о.

G

A.о.

ссa

P

cta

L

caa

G

cga

R

aca

T

ata

I

aaa

K

gga

G

tca

S

tta

L

gaa

E

aga

R

gca

A

gta

V

---

---

---

---

B

для L-спиральных мотивов белка

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

С

А.о.

U

А.о.

А

А.о.

G

А.о.

ссt

P

ttt

F

cat

H

cgt

R

act

T

gtt

V

aat

N

ggt

G

tct

S

ctt

L

tat

Y

agt

S

gct

A

att

I

gat

D

tgt

C



а) смотрим на жёлтые триплеты нуклеотидной последовательности (Таблица 5Б),


^ Таблица 5Б. Топологический генетический код вторичной структуры белка

для β-складчатой структуры белка

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

С

A.о.

U

A.о.

А

A.о.

G

A.о.

ссa

P

cta

L

caa

G

cga

R

aca

T

ata

I

aaa

K

gga

G

tca

S

tta

L

gaa

E

aga

R

gca

A

gta

V














если они из группы операторов связности (левая часть таблицы), то оставляем их жёлтыми, а если из группы операторов антисвязности (правая часть таблицы), то ОБЕСЦВЕЧИВАЕМ, вот так:


аaggtggagc aagcggtgga gacagagccg gagcccgagc tgcgccagca gaccgagtgg

cagagcggcc agcgctggga actggcactg ggtcgctttt gggattacct gcgctgggtg

cagacactgt ctgagcaggt gcaggaggag ctgctcagct cccaggtcac ccaggaactg

agggcgctga tggacgagac catgaaggag ttgaaggcct acaaatcgga actggaggaa

caactgaccc cggtggcgga ggagacgcgg gcacggctgt ccaaggagct gcaggcggcg

caggcccggc tgggcgcgga catggaggac gtgtgcggcc gcctggtgca gtaccgcggc

gaggtgcagg ccatgctcgg ccagagcacc gaggagctgc gggtgcgcct cgcctcccac

ctgcgcaagc tgcgtaagcg gctcctccgc gatgccgatg acctgcagaa gcgcctggca

gtgtaccagg ccggggcccg cgagggcgcc gagcgcggcc tcagcgccat ccgcgagcgc

ctggggcccc tggtggaaca gggccgcgtg cgggccgcca ctgtgggctc cctggccggc

cagccgctac aggagcgggc ccaggcctgg ggcgagcggc tgcgcgcgcg gatggaggag

atgggcagcc ggacccgcga ccgcctggac gaggtgaagg agcaggtggc ggaggtgcgc

gccaagctgg aggagcaggc ccagcagata cgcctgcagg ccgaggcctt ccaggcccgc

ctcaagagct ggttcgagcc cctggtggaa gacatgcagc gccagtgggc cgggctggtg

gagaaggtgc aggctgccgt gggcaccagc gccgcccctg tgcccagcga caatcac


б) теперь смотрим на розовые триплеты:

  • если подряд стоит меньше трёх розовых триплетов, то мы их ОБЕСЦВЕЧИВАЕМ

вот так:

аaggtggagc aagcggtgga gacagagccg gagcccgagc tgcgccagca gaccgagtgg

cagagcggcc agcgctggga actggcactg ggtcgctttt gggattacct gcgctgggtg

cagacactgt ctgagcaggt gcaggaggag ctgctcagct cccaggtcac ccaggaactg

agggcgctga tggacgagac catgaaggag ttgaaggcct acaaatcgga actggaggaa

caactgaccc cggtggcgga ggagacgcgg gcacggctgt ccaaggagct gcaggcggcg

caggcccggc tgggcgcgga catggaggac gtgtgcggcc gcctggtgca gtaccgcggc

gaggtgcagg ccatgctcgg ccagagcacc gaggagctgc gggtgcgcct cgcctcccac

ctgcgcaagc tgcgtaagcg gctcctccgc gatgccgatg acctgcagaa gcgcctggca

gtgtaccagg ccggggcccg cgagggcgcc gagcgcggcc tcagcgccat ccgcgagcgc

ctggggcccc tggtggaaca gggccgcgtg cgggccgcca ctgtgggctc cctggccggc

cagccgctac aggagcgggc ccaggcctgg ggcgagcggc tgcgcgcgcg gatggaggag

atgggcagcc ggacccgcga ccgcctggac gaggtgaagg agcaggtggc ggaggtgcgc

gccaagctgg aggagcaggc ccagcagata cgcctgcagg ccgaggcctt ccaggcccgc

ctcaagagct ggttcgagcc cctggtggaa gacatgcagc gccagtgggc cgggctggtg

gagaaggtgc aggctgccgt gggcaccagc gccgcccctg tgcccagcga caatcac

  • если подряд стоит три и больше розовых триплетов, то начинаем сверять их с таблицей 5В: если они из группы операторов связности (правая часть таблицы 5В), то оставляем их розовыми, а если из группы операторов антисвязности (левая часть таблицы 5В), то разбираемся дальше.

^ Таблица 5В. Топологический генетический код вторичной структуры белка

для L-спиральных мотивов белка

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

С

А.о.

U

А.о.

А

А.о.

G

А.о.

ссt

P

ttt

F

cat

H

cgt

R

act

T

gtt

V

aat

N

ggt

G

tct

S

ctt

L

tat

Y

agt

S

gct

A

att

I

gat

D

tgt

C



  • если розовый триплет из группы операторов антисвязности стоит в первой позиции более длинного розового мотива, то мы его ОБЕСЦВЕЧИВАЕМ:

Например:

-- в первой позиции

gtggcgga ggagacgcgg gcacggctgt ccaaggagct tggtagttat catggttata atgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagct tggtagttat catggttata atgtg


и повторяем операцию уже с нового начала длинного розового мотива.


  • если один (два или три, но не больше) розовый триплет из группы операторов антисвязности стоит во второй и далее позициях длинного розового мотива (внутри розового мотива) между триплетами из группы операторов связности, то мы ничего

^ НЕ ОБЕСЦВЕЧИВАЕМ

Например:

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct catggttata atgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct catggttata atgtg


или

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct cсtggttata atgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct cсtggttata atgtg


или

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct cсtgtttata atgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtagttct cсtgtttata atgtg


  • если четыре и больше розовых триплетов из группы операторов антисвязности стоят во второй и далее позициях длинного розового мотива (внутри розового мотива) между триплетами из группы операторов связности, то они все ОБЕСЦВЕЧИВАЮТСЯ, а розовый мотив анализируется как два самостоятельных розовых фрагмента


Например:

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtaсttct cсtgtttata atgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtaсttct cсtgtttata atgtg

далее,

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tgаtaсttct cсtgtttata atgtg

поскольку в обоих самостоятельных розовых фрагментах триплетов оказалось меньше трёх.


  • если один (два или три, но не больше) розовый триплет из группы операторов антисвязности стоит в конце розового мотива и перед ним есть хотя бы один триплет из группы операторов связности, то мы ничего ^ НЕ ОБЕСЦВЕЧИВАЕМ


Например:

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catggttata сtgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catggttata сtgtg


или

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catggtttta сtgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catggtttta сtgtg


или

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catgctttta сtgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtagttat catgctttta сtgtg


  • если больше трёх розовых триплетов из группы операторов антисвязности стоят в конце розового мотива и перед ними триплет из группы операторов связности, то мы от этого триплета из группы операторов связности отсчитываем три триплета из группы операторов антисвязности, следующие -- ОБЕСЦВЕЧИВАЕМ


Например:

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtactttt cсtgctttta сtgtg

получаем

gtggcgga ggagacgcgg gcacggctgt ccaaggagcа tggtactttt cctgctttta сtgtg


в) теперь смотрим на голубые триплеты: с ними отчасти также, как и с розовыми, а отчасти наоборот

  • если подряд стоит меньше трёх голубых триплетов, то мы их ОБЕСЦВЕЧИВАЕМ

Например:

gtgtaccatg gtcgttgtcg cgcaggcgcc accctggtgc ccatagcaat ccgcgagcgc

получаем

gtgtaccatg gtcgttgtcg cgcaggcgcc accctggtgc ccatagcaat ccgcgagcgc



  • если подряд стоит три и больше голубых триплетов, то начинаем сверять их с таблицей 5А: если они из группы операторов связности (правая часть таблицы 5А), то оставляем их голубыми, а если из группы операторов антисвязности (левая часть таблицы 5А), то разбираемся дальше

^ Таблица 5A. Топологический генетический код вторичной структуры белка

для R-спиральных мотивов белка

Операторы антисвязности и их кодоны, второй нуклеотид которых -- пиримидин

Операторы связности и их кодоны, второй нуклеотид которых -- пурин

С

А.о.

U

А.о.

А

А.о.

G

А.о.

ссc

ccg

P

ttc

---

F

cac

---

H

cgc

cgg

R

acc

acg

T

gtc

gtg

V

aac

---

N

ggc

ggg

G

tcc

tcg

S

ctc

ctg

L

tac

---

Y

agc

---

S

gcc

gcg

A

atc

---

I

gac

---

D

tgc

---

C










---

ttg

L

---

cag

Q

---

agg

R










---

atg

M

---

aag

K

---

tgg

W



















---

gag

E












  • если голубые триплеты из группы операторов антисвязности стоят в первой, второй и третьей позициях более длинного голубого мотива, то мы их ^ НЕ ОБЕСЦВЕЧИВАЕМ:

Например:

-- в первой позиции

gggtaccaсg gtcgttgtcc cggggacggc agccaggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtcc cggggacggc agccaggagc acagcggcaa ccgcgagcgc


-- в первой и второй позициях

gggtaccaсg gtcgttgtcc cgсggacggc agccaggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtcc cgсggacggc agccaggagc acagcggcaa ccgcgagcgc


-- в первой, второй и третьей позициях

gggtaccaсg gtcgttgtcc cgсggtcggc agccaggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtcc cgсgtcggc agccaggagc acagcggcaa ccgcgagcgc


  • если один (два или три, но не больше) голубой триплет из группы операторов антисвязности стоит во второй и далее позициях длинного голубого мотива (внутри голубого мотива) между триплетами из группы операторов связности, то мы их

^ НЕ ОБЕСЦВЕЧИВАЕМ

Например:

gggtaccaсg gtcgttgtcа cgсggacggc agccaggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtcа cgсggacggc agccaggagc acagcggcaa ccgcgagcgc


или

gggtaccaсg gtcgttgtcа cgсggtcggc agccaggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtcc cgсggtcggc agccaggagc acagcggcaa ccgcgagcgc


или

gggtaccaсg gtcgttgtca cggggacgtc accctggagc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtca cgggacgtc accctggagc acagcggcaa ccgcgagcgc


  • если четыре и больше голубых триплетов из группы операторов антисвязности стоят во второй и далее позициях длинного голубого мотива (внутри голубого мотива) между триплетами из группы операторов связности, то они все ОБЕСЦВЕЧИВАЮТСЯ, а голубой мотив анализируется как два самостоятельных голубых фрагмента с новыми границами.


Например:

gggtaccaсg gtcgttgtca cggggacgtc accctggtgc acagcggcaa ccgcgagcgc

получаем

gggtaccaсg gtcgttgtca cgggacgtc accctggtgc acagcggcaa ccgcgagcgc


далее, учитывая, что «если голубые триплеты из группы операторов антисвязности стоят в первой, второй и третьей позициях более длинного голубого мотива, то мы их ^ НЕ ОБЕСЦВЕЧИВАЕМ», ВЫДЕЛЯЕМ заново голубым цветом три триплета из группы операторов антисвязности ближайших к началу второго, сформировавшегося в результате предыдущей операции, голубого мотива. Получаем:


gggtaccaсg gtcgttgtca cgсgacgtc accctggtgc acagcggcaa ccgcgagcgc


  • если голубые триплеты из группы операторов антисвязности стоят подряд в конце голубого мотива, то мы их все ОБЕСЦВЕЧИВАЕМ


Например:

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc acagcggcat cctcgaacgc

получаем

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc acagcggcat cctcgaacgc


или

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc acagcgccat cctcgaacgc

получаем

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc acagcgccat cctcgaacgc


или

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc actccgccat cctcgaacgc

получаем

gggtaccaсg gtcgttgtcа cggggacggc agccaggagc actccgccat cctcgaacgc


И последний шаг:

3. Перекодируем нуклеотидную последовательность в аминокислотную в соответствие с таблицей 1, путём присвоения каждому триплету нуклеотидов однобуквенного символа аминокислоты (А.о.) с обязательным сохранением цветового обозначения вторичной структуры.


Например:

gggtaccaсg gtcgttgtcc cgtggtcgca acactggtgc ccagcggcaa ccgcgagcgc


получаем

GYHGRCPVVATLVPSGNRER


Это и есть схема вторичной структуры белка, экспонированная на его аминокислотную последовательность, в которой позиционированы правые и левые спирали, а также бета-тяжи, с точностью до одного аминокислотного остатка.




Похожие:

Алгоритм ssp – Secondary Structure Protein iconДокументы
...
Алгоритм ssp – Secondary Structure Protein iconОсновные типы алгоритмических структур Линейный алгоритм
В разветвляющемся алгоритм та или иная серия команд выполняется в зависимости от истинности условия
Алгоритм ssp – Secondary Structure Protein iconТема «Оператроры условного и безусловного перехода»
...
Алгоритм ssp – Secondary Structure Protein iconThe Spanish State structure

Алгоритм ssp – Secondary Structure Protein iconMorphological structure of the word

Алгоритм ssp – Secondary Structure Protein icon04 Polysemy. Semantic Structure of the Word

Алгоритм ssp – Secondary Structure Protein iconVocalizations of Kamchatka killer whales: structure and dialects

Алгоритм ssp – Secondary Structure Protein iconДокументы
1. /Structure.doc
Алгоритм ssp – Secondary Structure Protein iconДокументы
1. /Barkhudarov-Structure.doc
Алгоритм ssp – Secondary Structure Protein iconДокументы
1. /Barkhudarov-Structure.doc
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©podelise.ru 2000-2014
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Документы

Разработка сайта — Веб студия Адаманов