Июнь 2018 — Заметка №14

Отличная статья про ДНК глазами разработчика. “ДНК как код”: https://ds9a.nl/amazing-dna/

Автор сам предупреждает, что это всего лишь аналогии, но читается чертовски интересно (но и сложно).

The language of DNA is digital, but not binary. Where binary encoding has 0 and 1 to work with (2 - hence the ‘bi’nary), DNA has 4 positions, T, C, G and A.
Whereas a digital byte is mostly 8 binary digits, a DNA ‘byte’ (called a ‘codon’) has three digits. Because each digit can have 4 values instead of 2, an DNA codon has 64 possible values, compared to a binary byte which has 256.

The genome is littered with old copies of genes and experiments that went wrong somewhere in the recent past - say, the last half a million years. This code is there but inactive. These are called the ‘pseudo genes’.

Furthermore, 97% of your DNA is commented out. DNA is linear and read from start to end. The parts that should not be decoded are marked very clearly, much like C comments. The 3% that is used directly form the so called ‘exons’. The comments, that come ‘inbetween’ are called ‘introns’.

Some code is sacred. We may not remember who wrote it, or why - we just know that it works. The guy who thought it up may have left the company already. Such code is not to be tinkered with. DNA knows the concept of the ‘molecular clock’. Some parts of the genome are actively changing and some parts are sacrosanct. A good example of the latter are the Histone genes H3 and H4.

[Histone genes H3 and H4.] These genes are fundamental to the actual storage of the genome and are thus of paramount importance. Any failure in this code rapidly leads to a non-functioning organism.

So it is to be expected that this code isn’t tinkered with and that turns out the case. The H3 an H4 genes have a zero effective mutation rate in humans. But it goes far beyond that. You share almost the exact same code with anything from chickens to grass or moulds.

Добавление от Eugene Rumynskiy.

Привет. Очень существенная поправка по поводу ДНК кода. 97% закоментировано. Нет. Вообще даже близко нет.

Остальные 95-99% это ДНК с которой ничего не считывается, это верно. Но если совсем просто - эти 95% делают так, чтобы с остальных 5% считывалось хорошо. Вернее, они… Они как документация.

Вот представь, что 5% это программист. А 95% это доки. Это будет самый правильной аналогией.

Там творится лютый треш. Прилетают белки, связываются, отваливаются, запускают транскрипцию, синтезмруют другие белки, они тоже прилетают, тоже отвязваются. Плюс это организовано в пространстве. Собираются целые комплексы. Плюс есть взаимодействия с хроматином (это упаковка для ДНК). Плюс есть взаимодействия между хромосомами. Вот эти 95% устроены так, что все регулируется и не падает.

И это не похоже на просто код. Это похоже на код, который генерирует код.