Ақпарат

Транскрипцияны бастау сайты промоутердің алдында немесе кейін орналасқан ба?

Транскрипцияны бастау сайты промоутердің алдында немесе кейін орналасқан ба?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Бұл ақымақ сұрақ шығар, бірақ мен шынымен жауапты білгім келеді.

Промоутер анықтамасы (Википедиядан):

Генетикада промотор - бұл белгілі бір геннің транскрипциясын бастайтын ДНҚ аймағы. Промоутерлер орналасқан жақын гендердің транскрипциясының басталу орындары

Ал транскрипцияны бастау сайтының анықтамасы (Уикиверситеттен):

Транскрипцияның басталу орны - бұл транскрипция ген тізбегінің 5'-соңында басталатын орын.

Мен бұл суретті де таптым (Дереккөз):

Мен бұл сұрақты қойып отырмын, өйткені менің білуімше, РНҚ Полимераза TSS-мен байланысады және менің бір досым бұл промоутерге байланысты екенін айтты.

PS: Мен бактерияларға қызығамын.


Сіз бұл сұрақтың жауабын биохимия, молекулалық биология немесе молекулалық генетиканың кез келген стандартты оқулықтарынан таба аласыз. NCBI кітап сөресінде бірнеше онлайн бар және олар әдетте Уикипедияға қарағанда әлдеқайда жақсы. Мен Бергтің 28.1 бөлімінен үзінді келтіремін т.б. әл., транскрипциямен айналысатын:

Транскрипция басталады промоутерлер ДНҚ шаблонында. Промоторлар – РНҚ-полимеразаны транскрипция үшін тиісті инициация орнына бағыттайтын ДНҚ тізбегі.

Осыдан кейін прокариоттық промоторлар реттілігінің сипаттамасы және консенсус TATA қорапшасы.

Көптеген прокариоттық промоторлардың тізбегін салыстырған кезде таңқаларлық үлгі көрінеді. Екі ортақ мотив бар бастапқы алаңның 5' (жоғарғы ағын) жағында орналасқан. Олар -10 тізбегі және -35 тізбегі ретінде белгілі, өйткені олар бастапқы орынның жоғары ағынында шамамен 10 және 35 нуклеотидтерде орналасқан.

Оны құрудың әдістемесі сипатталған, одан промоторға қатысты басқа әдіс РНҚ-полимераза байланысатын ДНҚ-дағы учаске екені белгілі болады.

Жоғарыдағы дәйексөздің өрнектелген бөлігінен (менің екпінім), промотор бастапқы сайттың (5') алдында екені анық. Бұл басқа шағын графикада жинақталған:


Дэвидтің жауабынан басқа, ішкі промоутерлердің мысалдары бар (транскрипцияның бастапқы сайтының 3' элементтері бар). Мысал ретінде, тРНҚ гендерінің ішкі промоторлық элементтері эукариоттық RNAP III арқылы тікелей байланысуы және транскрипциясы:

Ақ RJ. 2011. РНҚ-полимераза III арқылы транскрипция: біз ойлағаннан да күрделі. Табиғат Аян Генет 12: 459-463.

Көптеген I класс ретротранспозондарында басқа элементтермен бірге транспозицияға мүмкіндік беретін ішкі промоторлар да бар:

  • LINE - ішкі RNAP II промоторы
  • SINE – ішкі RNAP III промоторы

Винсент Лодет, Хинрих Гронемейер, «Ядролық рецепторлар фактілері кітабында», 2002 ж.

Ген құрылымы, промоторы және изоформалары

Үш RAR генінің геномдық ұйымы, промоторлық құрылымы және изоформалы экспрессиясы тышқандардан қосмекенділерге дейінгі бірқатар түрлерде егжей-тегжейлі сипатталған (113 анықтамада қаралған).

Адамның RARα генінің геномдық ұйымы анықталды 285 . Белгілі RARβ2 изоформасын тудыратын кДНҚ сегіз экзонға бөлінеді, олардың арасында N-терминал А аймағы үшін экзон 3 кодтары және рецептордың жалпы бөлігі үшін 4-10 экзон кодтары. TR-ге келетін болсақ, DBD екі экзонмен кодталған, интрон TR-дегідей позицияда жатыр. Адамның RARα және тышқанның RARγ генінің құрылымы бірдей 9, 132 .

RARα1 изоформасын бақылайтын промотор құрамында TATA немесе CCAAT қораптары жоқ және СИРЕКТІ жоқ GC-қа бай промотор ретінде сипатталды. Бұл промотор тінтуірдің орталық жүйке жүйесінің ерте дамуында маңызды рөл атқаратын Krox20 транскрипция факторына арналған сайтты қамтиды. 284 . 5′UTR және А аймағында ерекшеленетін барлығы жеті изоформа (α1–α7) RARα генінен түзілген және сипатталған. 121 . Бұл изоформалар В доменін, яғни A/B доменінің С-терминал бөлігін кодтайтын экзонның жоғары ағынында орналасқан кем дегенде сегіз түрлі экзонның альтернативті сплайсинг пен промоторларды пайдалануынан туындайды. N-терминалды түрде әр түрлі белоктарды тудыратын екі негізгі изоформада айқын экспрессия үлгілері, сондай-ақ нақты реттеу бар. α1 изоформасынан айырмашылығы, α2 ретиной қышқылымен индукцияланатын СИРЕКТІ бар промотордан транскрипцияланады. 122 . A доменіндегі айырмашылықтар мақсатты гендерді дифференциалды түрде реттей алатын әртүрлі AF-1 функцияларын тудыруы мүмкін.

RARβ гені сонымен қатар бірнеше изоформаларды кодтайды, олардың ішінде үшеуінде бірдей В аймақтарымен байланысқан әртүрлі А аймақтары бар. 136 . Бұл изоформалар әртүрлі промоторлармен басқарылады және айқын экспрессиялық үлгілер мен реттеулерді көрсетеді. RARβ2 изоформасы РА арқылы индукцияланады және белгілі βRARE элементі бар арнайы промотормен басқарылады. 20, 22, 26, 286 . RARβ4 деп аталатын басқа изоформа β2 промоторынан түзіледі және β2 протеинінен AUG емес кодонда CUG басталатын N-терминал бөлігімен ерекшеленеді. 289 . RARβ2 промоторы сонымен қатар ретиной қышқылының тор қабықшадағы индукцияланғыштығын модуляциялайтын TLX орфан рецепторымен реттеледі. 287 . cAMP жауап элементі P19 эмбриональды карцинома жасушаларында РА арқылы RARβ2 белсендіруіне де қатысады. 288 . RARβ2 индукциясы RARβ2 индукциясына РА әсерін бейтараптандыратын RARγ1 сияқты басқа RAR-мен де реттеледі. 129 . Бұл нәтижелер әртүрлі органдардағы RARβ генінің аутологиялық реттелуінде бірнеше факторлардың маңызды рөл атқаратынын көрсетеді. Сонымен қатар, бұл изоформаның өрнегі оның транскрипциясын басқаратын қысқа ашық оқу фреймдерін қамтитын 5′UTR құрылымымен посттранскрипциялық түрде реттеледі. 126 .

Қалған екеуіне келетін болсақ, тінтуірдің RARγ гені белгілі бір өрнек үлгілерін сақтайтын бірнеше (кем дегенде жеті) N-терминалды изоформаларды жасайды. 141, 290 . Мысалы, теріде тек дерлік RARγ1 транскрипттері бар. RARγ2 изоформасы RARβ жағдайындағы сияқты, RA индукцияланғыштығының күрделі реттелуін болжайтын Sp1 сайттарына енгізілген RARE элементі арқылы реттеледі. 133 .


Промоутер аймақтар

Промоторды құрайтын үш негізгі бөлік бар: негізгі промотор, проксимальды промоутер және дистальды промотор. Төменде эукариоттық жасушалардағы осы аймақтардың ерекшеліктері сипатталған.

Негізгі промоутер

Негізгі промотор аймағы бастапқы кодонға ең жақын орналасқан және құрамында РНҚ полимеразаны байланыстыру орны, TATA қорабы және транскрипцияның басталу орны (TSS) бар. РНҚ полимераза осы негізгі промотор аймағымен тұрақты байланысады және шаблон тізбегінің транскрипциясы басталуы мүмкін. TATA қорабы – жалпы транскрипция факторы ақуыздары мен гистондары байланыса алатын негізгі промотор аймағындағы ДНҚ тізбегі (5'-TATAAA-3'). Гистондар - эукариоттық жасушаларда кездесетін, ДНҚ-ны нуклеосомаларға біріктіретін ақуыздар. Гистонмен байланысуы транскрипцияның басталуын болдырмайды, ал транскрипция факторлары транскрипцияның басталуына ықпал етеді. Негізгі промотордың ең 3' бөлігі (геннің бастапқы кодонына ең жақын) транскрипция шынымен басталатын TSS болып табылады. Тек эукариоттар мен археяларда бұл TATA қорабы бар. Прокариоттардың көпшілігінде әдетте алты нуклеотидтен тұратын TATAAT Pribnow қорапшасы деп аталатын функционалды эквивалентті реттілік бар.

Проксимальды промоутер

Негізгі промотордан жоғары қарай сіз көптеген негізгі реттеуші элементтерді қамтитын проксималды промоторды табасыз. Проксимальды промотор TSS-тен жоғары ағында шамамен 250 базалық жұпта орналасқан және бұл жалпы транскрипция факторларының байланысатын жері.

Дистальды промоутер

Промотор аймағының соңғы бөлігі проксимальды промотордан жоғары орналасқан дистальды промотор деп аталады. Дистальды промоторда сонымен қатар транскрипция факторын байланыстыру орындары бар, бірақ негізінен реттеуші элементтерді қамтиды.


Нәтижелер

Промоторлық ДНҚ-ның ерекшелік профильдері

Эукариоттық Pol II промоторлары негізгі промотор элементтерінің, қосымша проксимальды жоғары ағынды промотор элементтерінің және күшейткіш элементтердің комбинациясы арқылы бақыланады. Негізгі промотор TSS айналасында -50-ден +50-ге дейін созылады және базальды транскрипцияны бастау үшін өте маңызды. Тек бірнеше белгілі негізгі промотор элементтері бар. TATA жәшігі және Inr екі негізгі құрамдас болып табылады, олардың әрқайсысы Pol II арқылы дәл транскрипцияның бастамасын бағыттай алады. Төменгі промотор элементі, TFIIB тану элементі, мотив он элементі және төменгі ағындық негізгі элемент жақында ашылған кейбір негізгі промотор элементтері болып табылады [15, 16]. Дегенмен, жоғарыда аталған әрбір элемент негізгі промоторда бола бермейді, бұл транскрипцияға делдалдық жасауға қабілетті промоутер мүмкіндіктерінің көбірек екенін көрсетеді. Проксимальды промотор аймағы мен дистальды күшейткіштер транскрипциялық реттеуге жауап беретін бірнеше TFBS-ті қамтиды [17]. Бұл байланыстыру орындарының мазмұны мен орналасуы жергілікті TF концентрациясымен бірге промотордың қашан және қайда белсендірілгенін анықтайды. TSS-тен шамамен 250 бит-ке дейінгі аймақ TFBS-пен байытылған сияқты [18]. Бұл аймақ активаторлармен немесе медиаторлармен байланыстырылған сайттарды қамтуы мүмкін, бұл алдын ала бастау кешенінің қалыптасуын негізгі промоутер аймағына бағыттайды. Біз оң жаттығу деректері ретінде аймақты [-250, +50] және теріс оқу деректері ретінде оның тікелей жоғары және төменгі ағынын алдық және TFBS үшін сканерлендік. Промоторлық емес тізбектерге қарағанда промоторлар тізбегіндегі байланыстыру аффинділігі жоғары байланыстырушы тораптар кемсіту үшін ықтимал пайдалы. (ТФ-ны, сондай-ақ оның байланыстыру мотивін көрсету үшін салмақ матрицасын қолданамыз және тораптың байланыстыру ұқсастығын өлшеу үшін журнал ықтималдық коэффициентін пайдаланамыз [19].)

Промоторлардың күрделілігі мен гетерогенділігі промоутерлерді болжауды қиындатады кремнийде. Негізгі промоутер элементтерінің барлығын Pol II промоутерлері тұрақты түрде бөліспейді, сондықтан олар промоутерлерді өздігінен жақсы ажырата алмайды. Эукариоттық промоутер деректер базасының (EPD) деректер базасын статистикалық талдау негізінде промоутерлердің тек 22% -ында TATA сигналы және тек 49% -ында Inr сайты бар [20]. Дегенмен, соңғы зерттеулер TATA аз немесе Inr-сыз промоторлардың TATA қорапшасына немесе құрамында Inr бар промоторларға ұқсас ерекше механикалық қасиеттерге ие екенін көрсетеді, олар промоторларды тану үшін маркерлер ретінде қызмет етуі мүмкін [21]. 1-суретте CpG байланысты (сол жақта) және CpG байланысты емес (оң жақта) промоторлар үшін минималды энергияның теріс профильдері көрсетілген. Бұл профильдер тетрануклеотидті рентгендік кристалдық құрылымдардың дерекқорынан есептелетін және тетрануклеотидтер тізбегінің потенциалдық энергиясын сипаттау үшін қолданылатын тетрануклеотидтік параметрлерге негізделген [22]. Біз CpG-мен байланысты және CpG-байланысты емес промоутерлер үшін TSS айналасындағы аймақтардың ұпайлары әлдеқайда төмен екенін көреміз. Сондай-ақ -25 және +1 позицияларының айналасында күрт шыңы бар, мұнда әдетте TATA жәшігі мен Inr орналасқан. Ұқсас графиктер (көрсетілмеген) тетрануклеотидтердің икемділік параметрлеріне негізделген профильдер үшін де байқалады. ДНҚ икемділігі ақуыздар мен ДНҚ арасындағы өзара әрекеттесуде рөл атқаруы мүмкін. TSS айналасындағы аймақтар икемді, ал -25 және +1 айналасындағы шағын сегменттер қатаңырақ болады. Бұл ерекше қуат пен икемділік ұпайлары промоутерлерді болжауға арналған мүмкіндіктер жинағына да кіреді.

CpG-байланысты промоторлардың және CpG-байланысты емес промоторлардың энергетикалық профильдері. Транскрипцияны бастау орны жоғарғы фигуралардағы 1000-позицияда және төменгі фигуралардағы 250-позицияда орналасқан. Барлық учаскелер орташа ені 5 тереземен тегістелді. TSS, транскрипцияны бастау орны.

1-кесте CoreBoost-ты үйрету үшін пайдаланылатын барлық мүмкіндік түрлерін береді. 2-кестеде төрт екілік классификатордың (жоғары ағынға қарсы промоутер және CpG-байланысты және CpG-байланысты емес промоторлар үшін төмен ағынға қарсы промотор) ең жақсы мүмкіндіктер тізімі берілген. (Ағымдағы өлшенген жоғалту функциясын азайту үшін итеративті түрде бір мүмкіндікті таңдайды. Бұл жерде тізімделген негізгі мүмкіндіктер олардың алгоритм бойынша таңдау ретіне негізделген.) Біздің мүмкіндіктер жинағында негізгі промотор элементтерінің және TFBS-тің байланыстыру сәйкестігі, тетрануклеотидтердің икемділігі бар. және энергия ұпайлары, Марковиан ұпайлары және k-мер жиіліктері. TATA жәшігі немесе Inr сияқты позицияға тән сигналдардың болжау күші көп емес. Бұларды икемділік/Марковиандық ұпайлар сияқты қапталдағы тізбектердің сигналдарымен біріктіру TSS бар екендігінің ең жақсы көрсеткішін береді. Бұл мүмкіндіктер қалай есептелетіні туралы толық ақпарат Материалдар мен әдістер (төменде) бөлімінде сипатталған.

Басқа промоторларды болжау әдістерімен салыстыру

Бұл бөлімде біз CoreBoost тиімділігін оның өнімділігін McPromoter [23] және Eponine [24] көрсеткіштерімен салыстыру арқылы көрсетеміз, олар сонымен қатар еркін және жалпыға қолжетімді [9] промоутерлердің ең жақсы болжаушылары. McPromoter әртүрлі сегменттердегі ақпаратты (жоғары ағын, негізгі промотор [TATA, spacer және Inr] және төменгі ағын) және кейбір құрылымдық мүмкіндіктерді біріктіру арқылы промоутерлерді болжау үшін нейрондық желілерді пайдаланады. Эпонине Монте-Карло процесі арқылы таңдалған салмақты матрицалардың оңтайлы жиыны бар өзекті векторлық машинаны қолданады.

CoreBoost терезені реттілік бойымен сырғыту арқылы класс ықтималдықтарының векторы шығарылады. Ықтималдығы қандай да бір шекті мәннен асатын лауазымдар ықтимал кандидаттар болып саналады. Содан кейін белгілі бір қашықтықтағы үміткерлер кластерленеді және кластерде ең жақсы ұпай жинаған үміткер болжамды TSS ретінде шығарылады. Егер болжам аннотацияланған TSS-тің 50 bp шегінде болса, біз оны шынайы оң нәтиже деп атаймыз. Қажетті сезімталдыққа және оң болжамды мәнге (PPV) қол жеткізу үшін шекті мән таңдалады. Сезімталдық пен PPV Материалдар мен әдістер (төменде) бөлімінде анықталған.

ChIP-чип деректерін пайдаланып салыстыру

ChIP-чип деректері нақты жасушалардағы белсенді промоторлардың геномдық картасын зерттеуге мүмкіндік береді. Бұл технологияны қолдана отырып, алдын ала бастау кешенінің байланыстыру орындары эксперименталды түрде адамның фибробласт жасушаларының геномында орналасқан [4]. TSS-терді осы эксперименттен дәл анықтау мүмкін болмаса да, оны іздеу үшін кейіннен негізгі промоторларды болжау бағдарламасын пайдалануға болады. CoreBoost өнімділігін бағалау үшін біз промоторлардың геномдық карта деректерінен алынған болжамдарға негізделген әрқайсысы 2,4 кб сынақ тізбектеріне әртүрлі бағдарламаларды қолдандық. Осы сынақ тізбегінің әрқайсысында нақты оң мәндерді санау үшін пайдаланылатын бір және бір ғана Транскрипцияны бастау сайттарының дерекқоры (DBTSS)-аннотацияланған TSS бар.

CpG-ге қатысты болжамдар үшін біз EPD-тен 1445 промоутер негізінде CoreBoost-ты оқыттық. 2-суретте CpG-қа қатысты барлық 1765 сынақ промоторлары үшін DBTSS-аннотацияланған TSS-ке дейінгі максималды ұпайларға сәйкес позициялардан салыстырмалы қашықтықтың тығыздық графигі көрсетілген. Егер максималды баллға сәйкес келетін бірнеше позиция болса, кездейсоқ біреуі таңдалды. CoreBoost аннотацияланған TSS 50 бит ішінде жеткен 39% максималды ұпайға ие, бұл McPromoter's 30% және Eponine's 23% көрсеткіштерінен айтарлықтай жоғары. (Шекті мәнді ескере отырып, Eponine максималды ұпайы бар аймақты болжайды. Сынақ реттілігі үшін максималды ұпаймен позицияны табу үшін біз Eponine-ді сол ұпайға тең шекпен іске қосамыз және болжанған аймақтың ортаңғы орнын максималды деп аламыз. позиция.) Сәйкес П біржақты құндылықтарға негізделген т-тест сәйкесінше 8 × 10 -9 және 0. Назар аударыңыз П мәндері төмендегілер арқылы есептеледі т- статистика:

Аннотацияланған TSS-ке максималды ұпайлары бар позициялардан салыстырмалы қашықтықтың тығыздық графигі. Нүкте қисығы ChIP-чип тәжірибесінің болжамына негізделген. Қатты қисық CoreBoost үшін арналған. Үзік және нүктелі қисықтар сәйкесінше McPromoter және Eponine сәйкес келеді. Оң жақтағы сурет сол жақтағы кескіннің үлкейтілген нұсқасы. CHIP, хроматиндік иммунопреципитация TSS, транскрипцияның басталу орны.

T 1 = ( 0,39 − 0,3 ) / 0,39 × ( 1 − 0,39 ) 1765 + 0,3 × ( 1 − 0,3 ) 1765 T 2 = ( 0,39 − 0,23 ) / 0,39 × ( 1 − 0,23 ) / 0,39 × ( +3 − 6 ) 0. ) 1765. MathType @ аздығы @ 5 @ 5 @ + = feaafiart1ev1aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8tuQ8FMI8Gi = hEeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciGacaGaaeqabaqadeqadaaakeaafaqabeGabaaabaGaamivamaaBaaaleaacaaIXaaabeaakiabg2da9iaacIcacaaIWaGaaiOlaiaaiodacaaI5aGaeyOeI0IaaGimaiaac6cacaaIZaGaaiykaiaac + cadaGcaaqaamaalaaabaGaaGimaiaac6cacaaIZaGaaGyoaiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaac6cacaaIZaGaaGyoaiaacMcaaeaacaaIXaGaaG4naiaaiAdacaaI1aaaaiabgUcaRmaalaaabaGaaGimaiaac6cacaaIZaGaey41aqRaaiikaiaaigdacqGHsislcaaIWaGaaiOlaiaaiodacaGGPaaabaGaaGymaiaaiEdacaaI2aGaaGynaaaaaSqabaaakeaacaWGubWaaSbaaSqaaiaaikdaaeqaaOGaeyypa0JaaiikaiaaicdacaGGUaGaaG4maiaaiMdacqGHsislcaaIWaGaaiOlaiaaikdacaaIZaGaaiykaiaac + cadaGcaaqaamaalaaabaGaaGimaiaac6cacaaIZaGaaGyoaiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaac6cacaaIZaGaaGyoaiaacMcaaeaacaaIXaGaaG4naiaaiAdacaaI1aaaaiabgUcaRmaalaaabaGaaGimaiaac6cacaaIYaGaaG4maiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaa c6cacaaIYaGaaG4[email protected][email protected]

ChIP-чип деректерінде төменгі ағындағы нуклеосомадағы полимеразаның үзілісінен туындауы мүмкін жүйелі төмен ағым бар. Мұндай ауытқуды түзету үшін CoreBoost ChIP-чип деректерімен бірге пайдаланылуы мүмкін.

3-суретте CpG-мен байланысты промоторлар үшін сезімталдыққа қарсы PPV графигі көрсетілген. Біз CoreBoost әр түрлі шектерде TSS-ті жақсырақ болжайтынын көреміз. Шамамен 0,37 сезімталдыққа және 0,37 PPV кластерлік болжамдарға 500 бит арқылы қол жеткізу шегі CpG байланысты промоутерлерге арналған CoreBoost бағдарламасындағы әдепкі шек ретінде таңдалады. (Бір ген үшін балама промоторларды табу үшін CoreBoost жүйесінде кластерлік болжамдар жасау үшін 500 бит таңдаймыз. DBTSS-де бірдей кластерлік қашықтық қолданылады.) ChIP-чип деректерінен тек 85 CpG-байланысты емес сынақ промоторлары бар. CpG-мен байланысты емес промоутерлердегі әртүрлі бағдарламаларды бейтарап бағалауға қол жеткізу үшін біз үлкенірек деректер жиынтығына зерттеу жүргіздік.

CpG байланысты промоторлар үшін сезімталдыққа қарсы оң болжамдық мән. Қатты және ұзын сызықты қисықтар CoreBoost-қа арналған, қаттысы 2000 бит шамасында болжамды кластерленген жағдайларға арналған, ал ұзын сызықты қисықтар 500 бит ішінде. Нүкте-үзік қисық McPromoter-ге арналған, ол әдепкі ретінде 2000 бит ішінде болжамдарды кластерлейді. Нүкте және қысқа үзік қисық сызықтар Eponine-ге арналған, бір нүкте 2000 bp шегінде болжамдарды топтастыруға арналған және қысқа сызықша Eponine әдепкі шығысынан алынған. bp, базалық жұптар.

CpG-байланысты емес промоторлар үшін кросс-валидация

Бұл бөлімде біз EPD және DBTSS ұсынған CpG-байланысты емес промоутерлердің біріктірілген жиынтығы бойынша бес еселік кросс-валидация нәтижесін хабарлаймыз. EPD-дан CpG-ге қатысы жоқ 299 промоутер жинағы және DBTSS-тен 1271-нің бестен төрт бөлігі үлгіні оқыту үшін пайдаланылды, содан кейін ол DBTSS-де орталықтандырылған әрқайсысы 2,4 кб дәйектіліктің қалған бестен бір бөлігіне қолданылды. аннотацияланған ТСС. 4-суретте CoreBoost, McPromoter және Eponine жүйелерін салыстырған PPV және сезімталдық сызбасы берілген. CoreBoost дәйекті түрде McPromoter және Eponine-ден асып түсетіні анық. Кластерлік болжамдарға 500 бит қолданатын шамамен 0,26 сезімталдыққа және 0,24 PPV мәніне қол жеткізу шегі CoreBoost бағдарламасында CpG-байланысты емес промоторлар үшін әдепкі шек ретінде таңдалады.

CpG-байланысты емес промоторлар үшін сезімталдыққа қарсы оң болжамдық мән. Қатты және ұзын сызықты қисықтар CoreBoost-қа арналған, қаттысы 2000 бит шамасында, ал ұзын үзік 500 бит ішінде кластерленген жағдайларға арналған. Нүкте-үзік қисық McPromoter-ге арналған, ол әдепкі бойынша 2000 bp шегінде болжамдарды кластерлейді. Нүкте және қысқа үзік қисық сызықтар Eponine үшін, бір нүкте 2000 bp шегіндегі болжамдарды топтастыруға арналған, ал қысқа сызықша Eponine әдепкі шығысынан алынған. bp, базалық жұптар.

CpG байланысты емес бұлшықетке тән промоторлар

CoreBoost көмегімен TSS болжауының жақсарғанын байқағанымызға қарамастан, CpG-ге қатысы жоқ промоторлар үшін TSS-ті есептеу болжамының өнімділігі қанағаттанарлықсыз болып қала береді. Бұл бөлімде біз тіндік ақпарат болжау дәлдігін одан әрі жақсартуға көмектесетінін көрсетеміз. Негіздеме мынада: тінге тән байланыстыру орындары нұсқаулық ретінде әрекет ете алады және негізгі промотор ақпаратымен бірге шынайы TSS-терді табуға көмектеседі.

Біз 84 бұлшықетке спецификалық емес CpG-байланысты промоторларға негізделген нақтырақ классификаторды дайындадық, олардың әрқайсысы 250 BP жоғары және 50 Bp TSS төменгі ағынынан тұрады. Біз екі теріс жиынтықты қолдандық, сәйкесінше ұзындығы 300 бит болатын екі бірден жоғары және екі тікелей төмен ағын сегментіне сәйкес келеді. Бір-бірін қалдыру-кросс-валидация екі классификация үшін жүргізілді: біреуі промоторларды жоғары ағынды тізбектерден және екіншісі төмен ағындардан ажырату үшін. Содан кейін біз сезімталдықты, PPV және корреляция коэффициентін (CC) есептедік. Бірінші классификатор (жоғары ағынға қарсы промотор) 0,70, PPV 0,83 және CC 0,66, ал екінші классификатор (төменгі ағынға қарсы промотор) сезімталдықты 0,76, PPV 0,82 және CC 0,69 береді. . (Сынақ сегменті үшін, LogitBoost класының ықтималдығы 0,5-тен жоғары болса, ол Промоутер сыныбына жіктеледі.) Сәйкес П осы CC үшін мәндер CpG-байланысты емес кездейсоқ таңдалған 84 промоторлардың 1000 жиынынан есептелген сәйкесінше 0,008 және 0,007 болып табылады. Бұлшықет-спецификалық промоторлар үшін жаттығу деректер жинағының өлшемі әлдеқайда аз болса да, CC-тер CpG-байланысты емес 1570 промоторлардың бес еселік кросс-валидациясынан алынғаннан 10%-дан асады, олардың сәйкес сезімталдығы, PPC және CC болады. Бірінші жіктеуіш үшін 0,64, 0,80 және 0,59, ал екінші жіктеуіш үшін 0,66, 0,80 және 0,61. Бұл бұлшықетке тән промоторлар арасындағы аймақта [-250,+50] қосымша пайдалы ақпарат бар екенін көрсетеді. Шынында да, MEF2 және SRF сияқты бұлшықетке тән ТФ жоғары мүмкіндіктердің арасында пайда болады.


Транскрипция қай жерде басталып, қай жерде аяқталады? РНҚ-полимераза ДНҚ-ға қай жерде қосылып, транскрипциялауды бастау керектігін қайдан біледі?

РНҚ полимеразалары бактериялар мен эукариоттар арасындағы транскрипция учаскелерін сәл басқаша таниды. Прокариоттар үшін РНҚ полимераза промоторларды ДНҚ шаблон тізбегінен іздейді. Промоторлар – полимеразаны қай жерде байланыстыру және транскрипцияны бастау керектігін айтатын ДНҚ сайттары. Эукариоттар үшін РНҚ полимеразалары промотормен байланысу үшін транскрипция факторларының көмегіне мұқтаж. Транскрипция факторлары алдымен байланыстырады, содан кейін РНҚ-полимераза дақпен байланысу үшін басталады. Бұл транскрипция алдындағы бастама кешенін (PIC) құрайды.


Промоутерлік аймақ

Промоутерлік аймақс
The промоутерлік аймақI және II РНҚ полимеразалары үшін s бастапқы алаңның жоғары жағында орналасқан, бірақ III полимеразаның промоторы біртүрлі төмен ағында орналасқан.

The промоутерлік аймақ әдетте геннің транскрипцияланатын жерінің дәл жоғарғы жағындағы немесе дәл қасындағы реттілік болып табылады. Бұл белгілі бір реттеуші элементтер байланыстыратын аймақ, бұл РНҚ транскрипциясына көмектесетін ақуыздар.

fim B «айналдырады». промоутерлік аймақ екі жолмен де, «қосу» күйінен «өшіру» күйіне дейін және керісінше, ал fim E тек «қосудан» «сөндіруге» рекомбинацияны жеңілдетеді.

Лодыгин (2008) гипер-метилденген деп тапты. p53 байланыстыру алаңынан тұратын жоғары ағынды аймақ көптеген әртүрлі қатерлі ісік түрлерінде метилденудің жоғары деңгейін көрсетеді (Lodygin 2008).

Лакл гені үнемі экспрессияланса да, оны блоктайтын ақуызды шығарады

лак оперонынан. Бұл ақуыз лактоза молекулалары онымен байланысқанша лак оперонының оператор аймағымен байланысады.

[96][97][98] Генетикалық зақымдану (ДНҚ-ның аберрантты құрылымдық өзгерістері), мутациялар (ДНҚ тізбегіндегі өзгерістер) және эпимутациялар (геннің метилденуі)

s немесе ген экспрессиясын реттейтін ДНҚ тіректерінің өзгеруі) геннің қалыптан тыс экспрессиясын тудыруы мүмкін.

Гормондармен белсендірілген ядролық рецепторлар ДНҚ-да рецепторларға тән гормонға жауап беретін элементтерде (HREs), ДНҚ тізбегінде орналасады.

гормон-рецепторлық кешен арқылы белсендірілетін гендердің.

Прокариоттарда РНҚ полимераза танып, онымен тікелей байланыса алады

.
Эукариоттарда транскрипция факторлары деп аталатын белоктар РНҚ-полимеразаның байланысуына және транскрипцияның басталуына делдалдық етеді.
Промоторға белгілі бір транскрипция факторлары қосылғаннан кейін ғана РНҚ-полимераза II онымен байланысады.

РНҚ полимераза Транскрипция кезінде ферментке қосылатын

ДНҚ шаблонының РНҚ синтезделген тізбегін құру үшін нуклеотидтерге қосылып, терминатор аймағына жеткенде шаблоннан ажырайды. СУРЕТ
РНҚ транскрипциясы Ядрода транскрипцияланған РНҚ-ға қолданылатын термин. СУРЕТ.

геннен жоғары немесе геннен жоғары немесе төмен қарай күшейткіш аймақтар, ТФ әртүрлі түрлерімен танылатын белгілі бір ерекше мотивтері бар.

TATA қорабы. а ДНҚ-дағы 5'-TATA-3' негізгі тізбегі

. TATA қорабын байланыстыратын ақуыздар осы аймақта байланысады.
Телоцентрлік. Центромера бір ұшында, ал теломера екінші жағында орналасқан хромосома үлгісі. Барлық аутосомды хромосомалар және тышқанның Х хромосомалары телоцентрлік.

бөлігі болып табылатын эукариоттық ДНҚ консенсус тізбегі

, және одан төмен қарай транскрипцияны бастау сайтын анықтайды, сонымен қатар Hogness жәшігі немесе Pribnow терезесі ретінде белгілі.
Іздеу бетіне қайту.

E. coli-де геннің экспрессиясын ынталандыратын көмекші ақуыз

оперонды және промотордың РНҚ полимеразамен байланысу қабілетін арттырады.
катализатор
[Гк. катализ, еріту] .

РНҚ полимеразасымен байланысады

Бұл транскрипцияны бастайды
РНҚ полимеразасы ДНҚ-ны босатады.

Бастау және тоқтату кодондарынан басқа, ағзаға бұл геннің белокқа айналатынын айта алатын басқа да сигналдар бар, сондықтан біз осы геннің құрамындағыларды іздейміз.

геннің с. Біз [сонымен бірге] компьютерлік бағдарламалар жиынтығын пайдалана отырып, басқа сигналдарды іздейміз.

Ағымдағы активатор тізбегі: Транскрипция факторлары үшін байланыстыру орны, әдетте а бөлігі

. UAS TATA тізбегінің жоғары жағында болуы мүмкін (егер бар болса) және оның функциясы (күшейткіш сияқты) транскрипцияны арттыру болып табылады.

Репликациядан кейінгі процесс. CpG тізбегіндегі цитозин қалдықтары генге тән метилдену үлгілерін құра отырып, метилденеді. Метилденуі

s гендік экспрессия үлгілерімен корреляцияланады.
Байланысты
Хроматин эпигенетикасы.

Транскрипцияның негізгі факторлары генмен байланысуды қоса алғанда, бірқатар функцияларды орындайды

s және инициация орнына сәйкес РНҚ полимеразаны тарту, сонымен қатар өсіп келе жатқан РНҚ тізбегінің кіріс рибонуклеотидтеріне қол жеткізу үшін ДНҚ қос спиралін ашу.

транскрипция кешені. Генмен байланысуы керек көптеген ақуыздардың жиынтығы (әдетте олардың саны)


ТРАНСКРИПЦИЯ

ДНҚ-дан хабаршы РНҚ синтезі транскрипция деп аталады. ДНҚ-дағы генетикалық ақпарат тікелей белоктарға ауыспайды. Бұл ақпарат алдымен мРНҚ-ға транскрипцияланады. Транскрипция процесіне көптеген ферменттер қатысады. Бұл ферменттер келесі функцияларды орындайды:

  • Олар ДНҚ молекуласының аймағын ашады
  • Олар мРНҚ синтезін бастайды және аяқтайды.
  • Олар сондай-ақ транскрипция аяқталғаннан кейін мРНҚ-ны өзгертеді.

Транскрипция кезінде тек бір немесе бірнеше ген ашылады. Екі ДНҚ тізбегінің біреуі ғана транскрипцияланады. Эукариоттарда әртүрлі РНҚ-ның транскрипциясына қатысатын үш фермент бар. Бұлар:

(а) РНҚ полимераза I ядрошықта орналасады және рибосомалық РНҚ-ны (рРНҚ) транскрипциялайды.

(b) РНҚ полимераза II ядроға локализацияланған. Ол хабаршы РНҚ (мРНҚ) және көптеген шағын ядролық РНҚ-ны транскрипциялайды

(c) РНҚ полимераза III ядроға локализацияланған. Ол тасымалдаушы РНҚ (тРНҚ) және басқа да кішігірім РНҚ-ларды (соның ішінде шағын 5S рРНҚ) транскрипциялайды.

Транскрипцияның келесі қадамдары бар: I. Инициация

Транскрипцияны бастау үшін келесі қадамдар қатысады:

а) ДНҚ полимераза қосылатын ДНҚ орны деп аталады

промоутер. Промотор әдетте 50 нуклеотидтен тұрады. Ол геннің басында болады. Полимераза II промоторында TATA қорабы бар. TATA қорабын байланыстыратын ақуыз (TBP) TATA қораптарын таниды және промоторға РНҚ полимеразасын тіркейді.

(b) Бұл кезеңде ДНҚ қос тізбекті (“тұйық”). Бұл РНҚ Полимераза/жара-ДНҚ құрылымы деп аталады жабық кешен.

(с) ДНҚ ашылады және инициация алаңының жанында бір тізбекті болады (“ашық”). Бұл РНҚ •Полимераз/жарылмаған-ДНҚ құрылымы деп аталады ашық кешен.

(г) РНҚ-полимераза ДНҚ-ны транскрипциялайды, бірақ 10-ға жуық абортты нуклеотидтер (транскрипттер) түзеді. Бұлар РНҚ-полимеразадан шыға алмайды, себебі шығу арнасы арқылы бітеліп қалады

(д) РНҚ-полимеразаның а-факторы голоферменттен диссоциацияланады және ұзару басталады.

РНҚ-полимераза комплементарлы рибоза нуклеотидтерімен ДНҚ тізбегінің 3′ шетіне қосыла бастайды. Дәл сол комплементарлы негіздер ДНҚ-да жұпталған. Бірақ РНҚ-да урацил негізі тимин негізін ауыстырады. Осылайша урацил аденинге комплемент.

Жаңа РНҚ транскрипттері аденозин-5’рифосфат (АТФ), гуанозин-5 1-трифосфат (CUP) (пуриндік нуклеозид трифосфаттар) пайдаланады. Уридин-5′-трифосфат (UTP) және цитидин-5 . -трифосфат (КТП) (пиримидиндік нуклеозидтрифосфаттар).

2. Тоқтату

Транскрипция жалғасуда. Соңында РНҚ-полимераза аяқталу тізбегіне жетеді. Осылайша транскрипция тоқтайды. Екі тоқтату механизмі белгілі:

(a) Rho-тәуелсіз тоқтату: Ол РНҚ полимеразасына сигнал беретін РНҚ ішіндегі терминатор тізбегін қамтиды

Тоқта. Терминатор тізбегі әдетте a палиндромдық тізбек. Ол өзек-ілмек шаш қыстырғыш құрылымын құрайды. Ол РНҚ полимерлерін ДНҚ шаблонынан ажыратады. Осындай кең тараған палиндромдық тізбегі ‘GCCGCCAG’. РНҚ полимераза осы нүктеден ары қарай жүрмейді. Сондықтан жаңадан пайда болған ДНҚ-РНҚ гибриді диссоциацияланады.

(b) Rho-тәуелді тоқтату: Бұл жағдайда p факторы (rho фактор) деп аталатын тоқтату факторы белгілі бір жерлерде РНҚ синтезін тоқтатады. Бұл ақуыз иРНҚ бойымен РНҚ полимеразаға қарай байланысады және жүреді. Р-фактор РНҚ-полимеразаға жеткенде, ол транскрипцияны аяқтай отырып, ДНҚ-дан РНҚ-полимеразаны ажыратады.

Жаңадан транскрипцияланған мРНҚ бастапқы транскрипт деп аталады. Ол ядродан шықпас бұрын модификацияланады. Жаңадан транскрипцияланған мРНҚ-дағы кейбір базалық тізбектер белоктарды кодтамайды. РНҚ сплайсингі осы кодталмаған аймақтарды кесіңіз. Осылайша, мРНҚ кодтау аймағы рибосомада үздіксіз оқи алады.

(а)Прокариоттарда: Жаңадан синтезделген мРНҚ тікелей

бактериялардың цитоплазмасына бөлінеді. Цитоплазмада полипептидтік тізбекке айналады.

(b) Эукариоттарда: Эукариоттардағы мРНҚ ядроның ішінен цитоплазманың сыртындағы рибосомаларға өтуі керек. Сондықтан эукариоттық мРНҚ бірнеше жолмен модификацияланады. Бұл модификациялар оған саяхатта көмектеседі. Қалпақ пен құйрық қосылады. Осылайша, молекула рибосомаға ұзақ сапар кезінде тұрақты болып қалады. Қақпақтар мен құйрықтар мРНҚ-ны әртүрлі нуклеазалар мен фосфатаза ферменттерінің әсерінен сақтайды.


РНҚ транскрипттерінің түрлері

Дәстүрлі түрде РНҚ транскрипттерінің үш түрі белгілі болды – хабаршы РНҚ (мРНҚ), тРНҚ және рРНҚ – және үшеуі де ақуыз синтезімен тығыз байланысты. mRNA аминқышқылдарының ретін анықтағанымен, tRNA және rRNA мРНҚ кодын аудару механизмі үшін өте маңызды.

mRNA polymerization from DNA containing protein coding genes is catalyzed by RNA polymerase II. Occasionally, proteins that are used together are coded as a single unit, in one long mRNA molecule and this is particularly common among prokaryotes. DNA sequences upstream of the coding sequence contain docking sites for the transcription machinery as well as regulatory factors that modulate the timing and quantity of transcriptional activity. mRNA is then modified and processed to give rise to the final transcript used for translation.

rRNA constitutes nearly fifty percent of the RNA of a cell and is transcribed by RNA polymerase I in specialized regions of the nucleus called the nucleolus. Nucleoli appear as dense spherical structures around the loci that code for rRNA. Prokaryotic rRNA is of three types and eukaryotic ribosomes are made of four types of rRNA with the largest one containing over 5000 nucleotides. These RNA molecules determine the three-dimensional structure of ribosomes.

RNA polymerase III catalyzes the transcription of tRNA precursors in the nucleus. Promoter sequences controlling the expression of tRNA genes can be intragenic, located inside the coding sequence of the gene. tRNA precursors undergo extensive modifications including splicing. Prokaryotic tRNAs retain their catalytic activity and can self-splice, whereas eukaryotic post-transcriptional modification is carried out by special endonuclease enzymes. These endonucleases recognize specific structural motifs within the tRNA that target the sequence for splicing.

In addition to these three types of RNA, the cell contains a number of smaller RNA involved in various cellular activities. These include gene regulation (mediated by micro RNA and sequences in the 5′ untranslated regions of mRNA transcripts), post-transcriptional modification (small nuclear RNA, small nucleolar RNA), genome defense (Piwi-interacting RNA and CRISPR) and the maintenance of genomic structure (telomeres and RNA transcripts that silence X-chromosomes).


Әдебиеттер

Varshney D, Spiegel J, Zyner K, Tannahill D, Balasubramanian S. The regulation and functions of DNA and RNA G-quadruplexes. Nat Rev Mol Cell Biol. 202021(8):459–74. Available from: http://www.nature.com/articles/s41580-020-0236-x. https://doi.org/10.1038/s41580-020-0236-x.

Huppert JL, Balasubramanian S. G-quadruplexes in promoters throughout the human genome. Нуклеин қышқылдары. 200735(2):406–13. https://doi.org/10.1093/nar/gkl1057.

Maizels N, Gray LT. The G4 genome. PLoS Genet. 20139(4):e1003468. https://doi.org/10.1371/journal.pgen.1003468.

Balasubramanian S, Hurley LH, Neidle S. Targeting G-quadruplexes in gene promoters: a novel anticancer strategy? Nat Rev Drug Discov. 201110(4):261–75. https://doi.org/10.1038/nrd3428.

Hänsel-Hertsch R, Beraldi D, Stefanie L, Giovanni M, Zyner K, Parry A, et al. G-quadruplex structures mark human regulatory chromatin. Нат Генет. 201648(10):1267–72. https://doi.org/10.1038/ng.3662.

Hänsel-Hertsch R, Simeone A, Shea A, Hui WWI, Zyner KG, Marsico G, Rueda OM, Bruna A, Martin A, Zhang X, Adhikari S, Tannahill D, Caldas C, Balasubramanian S. Landscape of G-quadruplex DNA structural regions in breast cancer. Нат Генет. 202052(9):878–83. https://doi.org/10.1038/s41588-020-0672-8.

Hou Y, Li F, Zhang R, Li S, Liu H, Qin ZS, Sun X. Integrative characterization of G-Quadruplexes in the three-dimensional chromatin structure. Эпигенетика. 201914(9):894–911. https://doi.org/10.1080/15592294.2019.1621140.

Raiber EA, Kranaster R, Lam E, Nikan M, Balasubramanian S. A non-canonical DNA structure is a binding motif for the transcription factor SP1 in vitro. Нуклеин қышқылдары. 201240(4):1499–508. https://doi.org/10.1093/nar/gkr882.

Sengupta P, Bhattacharya A, Sa G, Das T, Chatterjee S. Truncated G-quadruplex isomers cross-talk with the transcription factors to maintain homeostatic equilibria in c-MYC transcription. Биохимия. 201958(15):1975–91. https://doi.org/10.1021/acs.biochem.9b00030.

Niu K, Xiang L, Jin Y, Peng Y, Wu F, Tang W, Zhang X, Deng H, Xiang H, Li S, Wang J, Song Q, Feng Q. Identification of LARK as a novel and conserved G-quadruplex binding protein in invertebrates and vertebrates. Нуклеин қышқылдары. 201947(14):7306–20. https://doi.org/10.1093/nar/gkz484.

David AP, Pipier A, Pascutti F, Binolfi A, Weiner AMJ, Challier E, Heckel S, Calsou P, Gomez D, Calcaterra NB, Armas P. CNBP controls transcription by unfolding DNA G-quadruplex structures. Нуклеин қышқылдары. 201947(15):7901–13. https://doi.org/10.1093/nar/gkz527.

Kouzine F, Liu J, Sanford S, Chung HJ, Levens D. The dynamic response of upstream DNA to transcription-generated torsional stress. Nat Struct Mol Biol. 200411(11):1092–100. https://doi.org/10.1038/nsmb848.

Gerstein MB, Kundaje A, Hariharan M, Landt SG, Yan KK, Cheng C, Mu XJ, Khurana E, Rozowsky J, Alexander R, Min R, Alves P, Abyzov A, Addleman N, Bhardwaj N, Boyle AP, Cayting P, Charos A, Chen DZ, Cheng Y, Clarke D, Eastman C, Euskirchen G, Frietze S, Fu Y, Gertz J, Grubert F, Harmanci A, Jain P, Kasowski M, Lacroute P, Leng J, Lian J, Monahan H, O’Geen H, Ouyang Z, Partridge EC, Patacsil D, Pauli F, Raha D, Ramirez L, Reddy TE, Reed B, Shi M, Slifer T, Wang J, Wu L, Yang X, Yip KY, Zilberman-Schapira G, Batzoglou S, Sidow A, Farnham PJ, Myers RM, Weissman SM, Snyder M. Architecture of the human regulatory network derived from ENCODE data. Табиғат. 2012489(7414):91–100. https://doi.org/10.1038/nature11245.

Hänsel-Hertsch R, Spiegel J, Marsico G, Tannahill D, Balasubramanian S. Genome-wide mapping of endogenous G-quadruplex DNA structures by chromatin immunoprecipitation and high-throughput sequencing. Nat Protoc. 201813(3):551–64. https://doi.org/10.1038/nprot.2017.150.

Chambers VS, Marsico G, Boutell JM, Di Antonio M, Smith GP, Balasubramanian S. High-throughput sequencing of DNA G-quadruplex structures in the human genome. Нат биотехнол. 201533(8):877–81. https://doi.org/10.1038/nbt.3295.

Duquette ML, Handa P, Vincent JA, Taylor AF, Maizels N. Intracellular transcription of G-rich DNAs induces formation of G-loops, novel structures containing G4 DNA. Genes Dev. 200418(13):1618–29. https://doi.org/10.1101/gad.1200804.

Baumli S, Endicott JA, Johnson LN. Halogen bonds form the basis for selective P-TEFb inhibition by DRB. Chem Biol. 201017(9):931–6. https://doi.org/10.1016/j.chembiol.2010.07.012.

Laitem C, Zaborowska J, Isa NF, Kufs J, Dienstbier M, Murphy S. CDK9 inhibitors define elongation checkpoints at both ends of RNA polymerase II-transcribed genes. Nat Struct Mol Biol. 201522(5):396–403. https://doi.org/10.1038/nsmb.3000.

Titov DV, Gilman B, He QL, Bhat S, Low WK, Dang Y, Smeaton M, Demain AL, Miller PS, Kugel JF, Goodrich JA, Liu JO. XPB, a subunit of TFIIH, is a target of the natural product triptolide. Nat Chem Biol. 20117(3):182–8. Available from: https://doi.org/10.1038/nchembio.522.

Roychoudhury S, Pramanik S, Harris HL, Tarpley M, Sarkar A, Spagnol G, Sorgen PL, Chowdhury D, Band V, Klinkebiel D, Bhakat KK. Endogenous oxidized DNA bases and APE1 regulate the formation of G-quadruplex structures in the genome. Proc Natl Acad Sci. 2020117(21):11409–20. https://doi.org/10.1073/pnas.1912355117.

Gray LT, Vallur AC, Eddy J, Maizels N. G quadruplexes are genomewide targets of transcriptional helicases XPB and XPD. Nat Chem Biol. 201410(4):313–8. https://doi.org/10.1038/nchembio.1475.

Batie M, Frost J, Frost M, Wilson JW, Schofield P, Rocha S. Hypoxia induces rapid changes to histone methylation and reprograms chromatin. Science (80-). 2019363:1222–6. https://doi.org/10.1126/science.aau5870.

Kirmes I, Szczurek A, Prakash K, Charapitsa I, Heiser C, Musheev M, Schock F, Fornalczyk K, Ma D, Birk U, Cremer C, Reid G. A transient ischemic environment induces reversible compaction of chromatin. Геном Биол. 201516(1):246. https://doi.org/10.1186/s13059-015-0802-2.

Dutta B, Yan R, Lim SK, Tam JP, Sze SK. Quantitative profiling of chromatome dynamics reveals a novel role for HP1BP3 in hypoxia-induced oncogenesis. Mol Cell Proteomics. 201413(12):3236–49. https://doi.org/10.1074/mcp.M114.038232.

Chen H, Yan Y, Davidson TL, Shinkai Y, Costa M. Hypoxic stress induces dimethylated histone H3 lysine 9 through histone methyltransferase G9a in mammalian cells. Рак рес. 200666(18):9009–16. https://doi.org/10.1158/0008-5472.CAN-06-0101.

Gao X, Lin SH, Ren F, Li JT, Chen JJ, Yao CB, Yang HB, Jiang SX, Yan GQ, Wang D, Wang Y, Liu Y, Cai Z, Xu YY, Chen J, Yu W, Yang PY, Lei QY. Acetate functions as an epigenetic metabolite to promote lipid synthesis under hypoxia. Nat Commun. 20167(1):11960. https://doi.org/10.1038/ncomms11960.

Semenza GL. Hypoxia-inducible factors in physiology and medicine. Ұяшық 2012148(3):399–408. https://doi.org/10.1016/j.cell.2012.01.021.

Zaret K. Micrococcal nuclease analysis of chromatin structure. Curr Protoc Mol Biol. 200545:1–17. https://doi.org/10.1002/0471142727.mb2101s45.

Lorenzini PA, Chew RSE, Tan CW, Yong JY, Zhang F, Zheng J, Roca X. Human PRPF40B regulates hundreds of alternative splicing targets and represses a hypoxia expression signature. РНҚ. 201925(8):905–20. https://doi.org/10.1261/rna.069534.118.

Biffi G, Tannahill D, McCafferty J, Balasubramanian S. Quantitative visualization of DNA G-quadruplex structures in human cells. Nat Chem. 20135(3):182–6. https://doi.org/10.1038/nchem.1548.

Müller S, Kumari S, Rodriguez R, Balasubramanian S. Small-molecule-mediated G-quadruplex isolation from human cells. Nat Chem. 20102(12):1095–8. https://doi.org/10.1038/nchem.842.

Di Antonio M, Ponjavic A, Radzevičius A, Ranasinghe RT, Catalano M, Zhang X, et al. Single-molecule visualization of DNA G-quadruplex formation in live cells. Nat Chem. 202012:832–7. https://doi.org/10.1038/s41557-020-0506-4.

Bristow RG, Hill RP. Hypoxia, DNA repair and genetic instability. Nat Rev Cancer. 20088(3):180–92. https://doi.org/10.1038/nrc2344.

Hanna R, Flamier A, Barabino A, Bernier G. G-quadruplexes originating from evolutionary conserved L1 elements interfere with neuronal gene expression in Alzheimer’s disease. Nat Commun. 202112(1828). https://doi.org/10.1038/s41467-021-22129-9.

Makowski MM, Gräwe C, Foster BM, Nguyen NV, Bartke T, Vermeulen M. Global profiling of protein-DNA and protein-nucleosome binding affinities using quantitative mass spectrometry. Nat Commun. 20189(1):1653. https://doi.org/10.1038/s41467-018-04084-0.

Varshney D, Vavrova-Anderson J, Oler AJ, Cowling VH, Cairns BR, White RJ. SINE transcription by RNA polymerase III is suppressed by histone methylation but not by DNA methylation. Nat Commun. 20156(1):6569. https://doi.org/10.1038/ncomms7569.

Calviello AK, Hirsekorn A, Wurmus R, Yusuf D, Ohler U. Reproducible inference of transcription factor footprints in ATAC-seq and DNase- seq datasets using protocol-specific bias modeling. Геном Биол. 201920(1):42. https://doi.org/10.1186/s13059-019-1654-y.

De Chaumont F, Dallongeville S, Chenouard N, Hervé N, Pop S, Provoost T, et al. Icy: an open bioimage informatics platform for extended reproducible research. Nat әдістері. 20129(7):690–6. https://doi.org/10.1038/nmeth.2075.

Martin M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 201117(1):10–2. https://doi.org/10.14806/ej.17.1.200.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genome Project Data Processing Subgroup. The sequence alignment/map format and SAMtools. Биоинформатика. 200925(16):2078–9. https://doi.org/10.1093/bioinformatics/btp352.

Quinlan AR, Hall IM. BEDTools: a flexible suite of utilities for comparing genomic features. Биоинформатика. 201026(6):841–2. https://doi.org/10.1093/bioinformatics/btq033.

Ramírez F, Dündar F, Diehl S, Grüning BA, Manke T. DeepTools: a flexible platform for exploring deep-sequencing data. Нуклеин қышқылдары. 201442(W1):W187–91. https://doi.org/10.1093/nar/gku365.

Marsico G, Chambers VS, Sahakyan AB, McCauley P, Boutell JM, Di Antonio M, et al. Whole genome experimental maps of DNA G-quadruplexes in multiple species. Нуклеин қышқылдары. 201947(8):3862–74. https://doi.org/10.1093/nar/gkz179.

Shen J, Varshney D, Simeone A, Zhang X, Adhikari S, Tannahill D, et al. Promoter G-quadruplex folding precedes transcription and is controlled by chromatin. Datasets. Gene Expression Omnibus. 2021 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE162299. Accessed 31 Mar 2021.

Dunham I, Kundaje A, Aldred SF, Collins PJ, Davis CA, Doyle F, et al. An integrated encyclopedia of DNA elements in the human genome. Табиғат. 2012489:57–74. https://doi.org/10.1038/nature11247.

Shen J, Varshney D, Simeone A, Zhang X, Adhikari S, Tannahill D, et al. Promoter G-quadruplex folding precedes transcription and is controlled by chromatin. Github. 2021 https://github.com/sblab-bioinformatics/G4_and_trancription. Accessed 28 Mar 2021.

Simeone A. promoterG4s_precedes_transcription. figshare. Бағдарламалық қамтамасыз ету. 2021 https://doi.org/10.6084/m9.figshare.14393699.v1. Accessed 9 Apr 2021.


Is the transcription starting site located before or after the promoter? - Биология

Транскрипция сияқты, аударма процесті байланыстыратын және бастайтын ақуыздармен бақыланады. Аудармада, ақуыз синтезі басталмас бұрын, рибосомалардың жиналуын аяқтау керек. Бұл көп сатылы процесс.

Рибосоманың жиналуында үлкен және кіші рибосомалық суббірліктер мен тРНҚ инициаторы (tRNA)мен) соңғы полипептидтік тізбектің бірінші амин қышқылын қамтитын барлығы трансляцияның басталуына мүмкіндік беру үшін мРНҚ-дағы трансляцияны бастау кодонында біріктіріледі. Біріншіден, кіші рибосомалық суббірлік тРНҚ -мен байланысадымен эукариоттар мен археяларда метионинді тасымалдайды және бактерияларда N-формил-метионинді тасымалдайды. (Себебі тРНҚмен ол аминқышқылын алып жүреді, ол зарядталған деп айтылады.) Келесі, зарядталған тРНҚ бар кіші рибосомалық суббірлік.мен mRNA тізбегі бойынша әлі де байланған сканерлеу AUG бастапқы кодонына жеткенше, ол аударудың қайда басталатынын көрсетеді. Бастапқы кодон сонымен қатар аминқышқылдарының дұрыс тізбегін синтездеу үшін маңызды болып табылатын mRNA тізбегінің оқу шеңберін орнатады. Оқу шеңберінің ауысуы мРНҚ -ны қате аударуға әкеледі. тРНҚ-дағы антикодонмен содан кейін базалық жұптастыру арқылы бастапқы кодонмен байланысады. мРНҚ, зарядталған тРНҚ-дан тұратын кешенмен, ал кіші рибосомалық бөлімше рибосоманың жиналуын аяқтайтын үлкен рибосомалық бөлімшеге бекітіледі. Бұл компоненттер инициация кезінде кіші рибосомалық суббірлікпен байланысатын және өмірдің барлық үш саласында кездесетін инициативті факторлар деп аталатын белоктардың көмегімен біріктіріледі. Сонымен қатар, жасуша инициация кешенін құруға көмектесу үшін GTP энергиясын жұмсайды. Рибосоманың жинақталуы аяқталғаннан кейін зарядталған тРНҚмен рибосоманың Р учаскесінде орналасады, ал бос А келесі аминоацил-тРНҚ үшін дайын. Полипептид синтезі N-терминалынан C-терминалына дейін басталады және әрқашан N-to-C бағыты деп аталады.

Эукариоттарда бірнеше эукариоттық инициация факторы ақуыздары (eIFs) рибосомалардың жиналуына көмектеседі. Эукариоттық инициация коэффициенті-2 (eIF-2) гуанозинтрифосфатпен (ГТФ) байланысқанда белсенді болады. GTP байланыстырылған кезде, eIF-2 ақуызы 40S рибосомалық кіші бөлімшемен байланысады. Әрі қарай инициатор тРНҚ метионинмен зарядталған (Met-tRNAмен) GTP-eIF-2/40S рибосомалық комплексімен байланысады, және бұл компоненттердің барлығы бір-бірімен байланысқаннан кейін олар жиынтығында 43S кешені деп аталады.

Eukaryotic initiation factors eIF1, eIF3, eIF4, and eIF5 help bring the 43S complex to the 5′-m 7 G cap of an mRNA be translated. Once bound to the mRNA’s 5′ m 7 G cap, the 43S complex starts travelling down the mRNA until it reaches the initiation AUG codon at the start of the mRNA’s reading frame. AUG айналасындағы тізбектер mRNA-да инициациялық кодоны ретінде дұрыс AUG пайдаланылуын қамтамасыз етуге көмектесуі мүмкін.

43S кешені AUG инициациясында болғаннан кейін, tRNAi-Met AUG үстінде орналасады. TRNA -дағы антикодонмен-AUG кодонымен негізгі қабатпен танысыңыз. Осы кезде 43S комплексінде eIF2-мен байланысқан GTP ЖІӨ+фосфатқа дейін гидролизденіп, энергия бөлінеді. Бұл энергия 43S кешенінен eIF2 (ЖІӨ байланысты) шығаруға жұмсалады, 40S рибосомалық суббірлік пен тРНҚ қалады.мен-mRNA -ның аударманың бастапқы сайтында танысыңыз.

Әрі қарай, GTP байланысы бар eIF5 mRNA мен tRNA -ға комплексті 40S рибосомалық суббірлікпен байланысады.мен-Кездесу. EIF5-GTP 60S үлкен рибосомалық суббірлікті байланыстыруға мүмкіндік береді. 60S рибосомалық суббірлік келгеннен кейін, eIF5 өзінің байланыстырылған GTP -ін ЖІӨ + фосфатқа дейін гидролиздейді және энергия бөлінеді. Бұл энергия екі рибосомалық қосалқы бөлікті 80S рибосомасына біріктіреді, оның Р-сайтында tRNAi-Met бар, сонымен қатар mRNA-дағы AUG кодонына қосылады. Аударма бастауға дайын.

EIF-2-нің 40S рибосомалық суббірлікпен байланысы фосфорлану арқылы бақыланады. Егер eIF-2 фосфорланса, ол конформациялық өзгеріске ұшырайды және GTP-пен байланыса алмайды. Сондықтан 43S кешені дұрыс қалыптаса алмайды және трансляцияға кедергі келтіреді. eIF-2 фосфорланбаған күйінде қалса, ол 40S рибосомалық суббірлікті байланыстырады және ақуызды белсенді түрде аударады.

Translation Initiation Complex: Gene expression can be controlled by factors that bind the translation initiation complex.

Рибосоманың толық жиналу мүмкіндігі трансляцияның жылдамдығына тікелей әсер етеді. Бірақ ақуыз синтезі басқа да әртүрлі деңгейлерде, соның ішінде мРНҚ синтезі, тРНҚ синтезі, рРНҚ синтезі және эукариоттық инициациялық фактор синтезі арқылы реттеледі. Бұл компоненттердің кез келгенінің өзгеруі аударудың мүмкін болатын жылдамдығына әсер етеді.


Бейнені қараңыз: Лук-Батун Клип Фиксая 10 часов (Ақпан 2023).