Ақпарат

Бірнеше мотиві бар ақуыздар бар ма?

Бірнеше мотиві бар ақуыздар бар ма?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Әрбір ақуыз бір ерекше құрылымдық мотивті қабылдайды ма (мысалы, мырыш саусақ) немесе тізбекте бірнеше мотиві бар белоктар бар ма?


Ірі ақуыздардың көпшілігінде бірнеше мотивтер бар; Егер сіз протеин құрылымдарының суреттерін интернеттен іздесеңіз, бұл бірден анық болуы керек. Міне, мен басқа күні жұмыс істеген нәрсенің мысалы: WD40 қайталау мотиві. Ол көптеген белоктарда кездеседі, бірақ бұл белоктар WD40 бірліктерінің жиынтығынан әлдеқайда көп. Егер сіз Википедия парағының төменгі жағында көрсетілген ақуыздардың кейбірін зерттесеңіз, олардың күрделі екенін және әр түрлі домендерден, пішіндерден және бөліктерден тұратынын растай аласыз.

Сіз мырыш саусақтарын да айтасыз; бұл ДНҚ-ны байланыстыратын мотив, олар ДНҚ-ны байланыстыратын көптеген ақуыздарда кездеседі. Бұл әртүрлі ДНҚ байланыстыратын протеиндер әртүрлі функцияларға ие және олардың ерекшелігі мырыш саусағының үстінде/сыртында орналасқан әртүрлі мотивтер мен домендердің кең ауқымымен өңделеді. Уикипедиядағы мырыш саусақтары туралы мақалада мырыш саусақтарын енгізуге болатын көптеген құрылымдар көрсетілген, тіпті бұл құрылымдар жасушада жұмыс жасайтын нақты функционалды ақуыздардың кішкене бөліктері ғана.


Инверсияланған индекс стратегиясын қолдана отырып, ақуыздардан нақты уақыттағы құрылымдық мотивті іздеу

Филиалдар RCSB Протеин деректер банкі, Сан-Диего суперкомпьютер орталығы, Калифорния университеті, Сан-Диего, Ла-Джолла, Калифорния, АҚШ, RCSB ақуыз деректер банкі, Сандық биомедицина институты, Ратгерс, Нью-Джерси мемлекеттік университеті, Пискатауэй, Нью-Джерси, АҚШ , Нью -Джерси штатының Университеті, Рисгерс, Химия және химиялық биология кафедрасы, Нью -Джерси, Нью -Джерси онкологиялық институты, Ратгерс, Нью -Джерси мемлекеттік университеті, Нью -Брансуик, Нью -Джерси, АҚШ, Скаггс мектебі Фармация және фармацевтика ғылымдары, Калифорния университеті, Сан -Диего, Ла -Жолла, Калифорния, АҚШ

Рөлдер Концептуализация, әдістеме, қадағалау, визуализация, жазу - қарау және өңдеу

RCSB протеиндік деректер банкі, Сан -Диего суперкомпьютерлік орталығы, Калифорния университеті, Сан -Диего, Ла -Жолла, Калифорния, АҚШ


Кіру опциялары

Журналға 1 жыл бойы толық қол жеткізіңіз

Барлық бағалар NET бағасы болып табылады.
ҚҚС кейінірек кассада қосылады.
Салықты есептеу есеп айырысу кезінде аяқталады.

ReadCube -те уақыт шектеулі немесе толық мақалаға қол жеткізіңіз.

Барлық бағалар NET бағасы болып табылады.


Барлық суперекінші құрылымдар мотивтер болып табылады, бірақ барлық мотивтер суперекіншілік құрылымдар емес.

Мотивтер, биологиялық мағынада, сән мотивтеріне өте ұқсас. Олар әртүрлі жерлерде қайталанатын үлгілер. Қосалқы құрылымдар - бұл бірнеше қосалқы құрылымдардан жасалған мотивтер. Кейбір мотивтер әлдеқайда кішірек (иондарды ұстауға арналған қалталар ұзындығы 3-4 аминқышқылдары) немесе екіншілік құрылымдық өзара әрекеттесулерді қамтымайды (SLMs қараңыз).

Сіздің сұрағыңыздың екінші жартысына келетін болсақ, ақуыздың домені (сіз сұрағандарға байланысты) - бұл ақуыздың бүктелгеніне қарамастан, кез келген аймақ немесе аймақ. Көбінесе домендер өздігінен дұрыс жинала алады. Әдетте ықтимал доменнің техникалық тұрғыдан домен екенін анықтау үшін қажетті протеаза/функционалды талдау әдетте жасалмайды. Мысалы, кейбір тирозинкиназа рецепторларында табылған киназа кірістіру домені, а) өте кішкентай болғанына қарамастан, домен болып саналады b) оқшауланған түрде өз қызметін атқара алмайды (мүлдем әділ емес, өйткені оның функциясы рецептордың қалған бөлігін фосфорлау болып табылады) .

Қорытындылай келе: ақуыз домендерінің бірнеше бәсекелес анықтамалары бар, сондықтан сіз «белоктық домен» деп аталатын нәрсе ақуыздың қалған бөлігінен бөлінген кезде өз қызметін атқара алады деп болжауға болмайды.

Домендер кез келген мөлшерде болуы мүмкін (олардың функционалдық және құрылымдық жіктелуіне байланысты емес), бірақ өте кішкентай және өте үлкендері сирек кездеседі. Олар мотивтердің кез келген санынан жасалуы мүмкін немесе мүлде болмауы мүмкін.


Егер олар соншалықты көп болса, неге оларды табу қиын?

Әдеттегі қысқа сызықты мотивте лиганд доменінің бетінің бір бөлігімен әрекеттесетін үш -төрт амин қышқылының қалдықтары болады [32]. Бұл функционалдылық бұл қалдықтардың эволюциялық жолмен сақталуын талап етеді, дегенмен кейбір позициялар ұқсас мөлшердегі гидрофобты бүйірлік тізбектер (мысалы, Ile, Leu, Val) немесе ұқсас зарядқа ие бүйірлік тізбектер сияқты аминқышқылдарының икемді жиынтығына мүмкіндік береді (мысалы, Asp, Glu) [38]. Биоинформатик берілген мотивке арналған реттілік кеңістігінің ақпараттық мазмұны (оны Шеннон энтропиясы арқылы көрсетуге болады) өте нашар екенін және протеомда мотив үлгілеріне сәйкес келетін қысқа реттіліктердің көп саны болатынын тез түсінеді, олардың көпшілігі жұмыс істей алмайды. Егер жалған позитивтер саны шынайы мотивтер санынан едәуір асып кетсе, сигнал мен шуылдың нашар қатынасы жаңа мотивті даналардың есептік ашылуына айтарлықтай кедергі келтіреді. Демек, биоинформатикалық ашудың және кейінгі эксперименттік валидацияның әлі де аз мысалдары бар [39-41]. Дәл осылай, эксперименталист өзінің сүйікті ақуызындағы мотив кандидатын таңдауда, сонымен қатар жарамсыз нысанның артынан бару қаупі бар.

Жасушаның жалған мотивтер тізбегінің көптігімен шатастырмауының кемінде үш себебі бар. Біріншісі, сигнал беру кеңістікте және уақытта қатаң шектелген, сондықтан жалған мотив-лиганд кандидаттарының көпшілігі ешқашан физикалық түрде кездесе алмайды [42]. Екіншісі - көптеген кандидат мотивтері бүктелген ақуыздарға көмілген және лиганд доменіне мүлде қол жетімсіз. Үшіншісі, егер бір жалған мотив серіктес доменіне қосылса да, бұл реттеуші оқиғаға әкелмейді. Бұл типтік диссоциация константасы К.d микромолярлы емес, сондықтан уақыт шектеулі, әдетте бірнеше секунд күйдің өзгеруіне себепші бола алмайды. SLiM әрқашан бірлесіп жұмыс істейтінін есте сақтау өте маңызды [8, 20, 32].


Ақуыздың гликозилденуі

Гликозилдену-эндоплазмалық торда (ER) және Гольджи аппаратында биосинтетикалық-секреторлық жолдың маңызды қызметі. Әдетте жасушада көрінетін барлық ақуыздардың жартысына жуығы белгілі бір аминқышқылдарына қант бөліктерін ковалентті қосуды талап ететін осы модификациядан өтеді. Эндоплазмалық ретикулумда экспрессияланған еритін және мембранамен байланысқан ақуыздардың көпшілігі белгілі бір дәрежеде гликозилденген, соның ішінде секрецияланған белоктар, беткі рецепторлар мен лигандтар, органеллалар-резиденттік ақуыздар. Сонымен қатар, Гольджиден цитоплазмаға тасымалданатын кейбір ақуыздар да гликозилденген. Липидтер мен протеогликандарды гликозилдендіруге де болады, бұл модификацияның бұл түрі үшін субстрат санын едәуір арттырады.

Қолдану аясы

Ақуыз гликозилизациясы жасушада көптеген қызметтер атқарады. ER -де гликозилдену ақуыздардың бүктелу жағдайын бақылау үшін қолданылады, бұл сапа бақылау механизмі ретінде әрекет етеді, бұл тек дұрыс жиналған ақуыздардың Гольджиге тасымалдануын қамтамасыз етеді. Еритін белоктардағы қант бөліктері арнайы рецепторлармен байланысуы мүмкін транс Гольджи желісі оларды дұрыс тағайындалған жерге жеткізуді жеңілдетеді. Бұл қанттар жасушаның бекітілуіне делдал болу үшін немесе сигналдың берілу жолдарын ынталандыру үшін жасуша бетіндегі рецепторлар үшін лигандтар рөлін атқара алады (1). Олар өте үлкен және көлемді болғандықтан, олигосахаридтер ақуыз мен ақуыздың өзара әрекеттесуіне әсер етуі мүмкін немесе ақуыздардың туыстық өзара әрекеттесу домендеріне қосылуын болдырмайды. Олар гидрофильді болғандықтан, ақуыздың ерігіштігін де өзгерте алады (2).

Бөлу

Гликозилденген белоктар (гликопротеиндер) зерттелген барлық дерлік тірі организмдерде, соның ішінде эукариоттарда, эубактерияларда және архелерде кездеседі (3,4). Эукариоттардың құрамында гликопротеидтерді білдіретін организмдердің ең үлкен диапазоны бар, олар бір клеткадан күрделі көпжасушалы организмдерге дейін.

Гликопротеидтердің әртүрлілігі

Гликозиляция протеоманың әртүрлілігін кез келген басқа аудармадан кейінгі модификациямен теңестіретін деңгейге дейін арттырады. Жасуша әртүрлілікті жеңілдете алады, өйткені гликозилизацияның барлық аспектілерін өзгертуге болады, соның ішінде:

  • Гликозидтік байланыс— гликанмен (олигосахаридпен) байланысу орны
  • Гликан құрамы- белгілі бір ақуызбен байланысқан қант түрлері
  • Гликан құрылымы- тармақталған немесе тармақталмаған тізбектер
  • Гликан ұзындығы— қысқа немесе ұзын тізбекті олигосахаридтер

Гликозилдену ферментативті сатылардың көп болуына байланысты ең күрделі посттрансляциялық модификация болып саналады (5). Гликозилденудің молекулалық оқиғаларына моносахаридтерді бір -бірімен байланыстыру, қанттарды бір субстраттан екінші субстратқа ауыстыру және гликан құрылымынан қанттарды кесу жатады. Транскрипция немесе трансляция сияқты басқа жасушалық процестерден айырмашылығы, гликозилдену үлгіленбейді, сондықтан бұл қадамдардың барлығы әрбір гликозилдену оқиғасы кезінде міндетті түрде болмайды. Үлгілерді пайдаланудың орнына, жасушалар берілген жасушада көрінетін әр түрлі гликопротеидтерді генерациялау үшін бір молекуладан екіншісіне қант қосатын немесе алып тастайтын көптеген ферменттерге сүйенеді. Барлық ферменттердің әсерінен хаотикалық болып көрінуі мүмкін, бірақ гликозилденудің әр түрлі механизмдері жоғары реттелген, жеке ферменттердің белсенділігі алдыңғы ферментативті реакцияның аяқталуына байланысты болатын кезеңдік реакциялар. Фермент белсенділігі жасуша түріне және жасушаішілік бөлімге байланысты өзгеретіндіктен, жасушалар гликан құрылымы бойынша басқа жасушалардан ерекшеленетін гликопротеидтерді синтездей алады (5).

Моно- немесе олигосахаридтерді донорлық молекулалардан өсіп келе жатқан олигосахаридтер тізбегіне немесе ақуыздарға тасымалдайтын ферменттер гликозилтрансферазалар (Gtfs) деп аталады. Әрбір Gtf белгілі бір қантты донордан (қант нуклеотиді немесе долихол) субстратпен байланыстыру ерекшелігіне ие және басқа Gtfs тәуелсіз әрекет етеді. Бұл ферменттердің ауқымы кең, өйткені гликозидтік байланыстар ақуыздың барлық функционалды тобында анықталған, ал гликозилизация белгілі бір дәрежеде жиі кездесетін моносахаридтердің көпшілігін қамтиды (6).

Гликозидазалар белоктардан қантты кетіру үшін гликозидтік байланыстардың гидролизін катализдейді. Бұл ферменттер ER және Гольджидегі гликанды өңдеу үшін өте маңызды және әрбір фермент белгілі бір қантты (мысалы, маннозидаза) жою үшін ерекшелік көрсетеді.

Гликозилдену түрлері

Гликопептидтік байланыстарды қант-пептидтік байланыс пен олигосахаридтің сипатына байланысты белгілі бір топтарға жіктеуге болады, оның ішінде N-, O- және С-байланысқан гликозиляция, глипация және фосфогликозиляция. N- және O-гликозилдену және глипиация гликозилдеудің ең жиі анықталған түрлері болғандықтан, осы мақалада осы модификацияларға көбірек назар аударылады.

Гликозилдену түрлері
N-байланыстыГликан ЭР -де аспарагиннің амин тобымен байланысады
O-байланыстырылғанМоносахаридтер ER, Гольджи, цитозоль және ядродағы сериннің немесе треониннің гидроксил тобымен байланысады.
ГлипиацияГликан өзегі фосфолипид пен ақуызды байланыстырады
C байланысқанМанноза триптофанның индол сақинасымен байланысады
ФосфогликозилденуГликан серинмен фосфодиэстер байланысы арқылы байланысады

Ақуыздар гликозилденудің белгілі бір түрімен шектелмейді. Шынында да, ақуыздар әр түрлі гликозидті байланыстары бар бірнеше жерлерде гликозилденеді, бұл төменде сипатталғандарға, соның ішінде көптеген факторларға байланысты.

1. Ферменттердің болуы

Гликозилдену ақуыздарды ферменттер концентрациялары әр түрлі аймақтарға жылжыту арқылы бақыланады, олардың белсенділігін реттеу үшін жасушалар ферменттерді арнайы бөлімдерге бөледі. Мысалы, ақуыз ER-де N-гликозилденгеннен кейін, гликандық өңдеу протеиндерді арнайы Gtfs және гликозидазалардың жоғары концентрациясы бар Гольджи цистерналарына тасымалдау арқылы сатылы түрде жүреді.

2. Аминқышқылдарының реттілігі

Дұрыс амин қышқылына қойылатын талаптан басқа (мысалы, N-байланысқан Ser/Thr үшін O-байланысты), көптеген ферменттерде гликозидтік байланыстың түзілуіне мүмкіндік беретін консенсус тізбегі немесе мотивтері бар (6).

3. Ақуыздың конформациясы (қолжетімділігі)

Ақуыздар синтезделетіндіктен, олар пайда болатын екінші реттік құрылымға ене бастайды, бұл гликозидтік байланыс үшін арнайы аминқышқылдарын қол жетімсіз етеді. Осылайша, мақсатты аминқышқылдары гликозилдену орын алу үшін конформациялық қолжетімді болуы керек.


B. Екіншілік құрылым

Екіншілік құрылым полипептид ішіндегі өте тұрақты жергілікті құрылымдарды білдіреді (мысалы, спираль) және полипептидтердің ішінде немесе арасында (б-бүрлі парақтар). Линус Паулинг пен оның әріптестері 1951 жылы қосалқы құрылымның осы екі түрін ұсынды. Бұл жерде Линус Полингтің шағын тарихы маңызды болады! 1932 жылға қарай Паулинг өз ойын әзірледі Электртерістілік шкаласы молекулалардағы атомдық байланыстардың беріктігін болжай алатын элементтер. Ол біздің атомдық орбитальдар туралы түсінігімізге, кейінірек биологиялық молекулалардың құрылымына көп үлес қосты. Осы еңбегі үшін ол 1954 жылы химия бойынша Нобель сыйлығын алды. Ол және оның әріптестері кейінірек орақ тәрізді жасушалық анемияның қалыпты гемоглобинге байланысты екенін анықтап, ақуыздардың альфа -спиральды және бүктелген парақтық құрылымын болжауға көшті. Ол осы жаңа молекулалық генетика зерттеулері үшін екінші Нобельді алмаса да, 10 000-ға жуық ғалымдарды Біріккен Ұлттар Ұйымына атмосфералық ядролық бомба сынақтарына тыйым салуға дауыс беруге көндіргені үшін 1962 жылғы Бейбітшілік саласындағы Нобель сыйлығын жеңіп алды. Оның ерекше өмірі туралы толығырақ шолу (мысалы, ат Линус Полинг-Қысқа өмірбаяны) оқуға тұрарлық!

Екіншілік құрылымдық конформациялар төмендегі суретте сол жақтағы екі панельде көрсетілгендей, полипептидтік магистраль бойында аминогруппалар мен оксигендер арасында сутегі байланыстарының өздігінен пайда болуына байланысты пайда болады. Екіншілік құрылымда аминқышқылдарының бүйірлік тізбектері маңызды рөл атқармайтынын ескеріңіз.

Спираль немесе b парақтары тізбектердегі H-байланыстарының ең тұрақты орналасуы болып табылады. Полипептидтегі реттелген қайталама құрылымның бұл аймақтары деп аталатын аз құрылымды пептидтердің әртүрлі ұзындықтары арқылы бөлінуі мүмкін. кездейсоқ катушкалар. Екінші реттік құрылымның осы үш элементі де жоғарыдағы суретте оң жақта көрсетілгендей, үшінші реттік құрылымға енген бір полипептидте немесе ақуызда болуы мүмкін. Бүктелген парақтар жебе ұштары бар таспалар түрінде көрсетілген N-C немесе С-дан Н. парақтардың полярлығы. Көріп отырғаныңыздай, бүктелген парақты құрайтын жұп пептидті аймақтар мұны параллель немесе антипараллель бағытта жасай алады (ленталардың көрсеткі ұштарын қараңыз), бұл үшінші реттік құрылымды қалыптастыру үшін ақуыздың қатпарлануын басқаратын басқа әсерлерге байланысты болады. Кейбір полипептидтер ешқашан талшықты және ерімейтін күйінде екінші реттік құрылымынан шықпайды. Кератин-бұл а-ның ең танымал мысалы талшықты ақуызшашты, тырнақты, құстың қауырсындарын және тіпті цитоскелеттің жіптерін құрайды. Көптеген полипептидтер мен ақуыздар ериді және үшінші реттік құрылымды алады шар тәрізді белоктар.


Реттеуші эволюцияның жалпы принциптері ДНҚ, РНҚ және ақуыздағы мотивтерді біріктіре ме?

Транскрипциялық, посттранскрипциялық және трансляциядан кейінгі деңгейде мотивті қолдану үшін көптеген параллельдер байқалды. Мысалы, бірнеше мотивті тартылған реттеушілердің бірлескен әрекеті арқылы жауаптарды нақтылау реттеудің барлық деңгейіндегі тақырып болып табылады (транскрипция: [97], қосылу: [98], miRNA [99], сигнал беру [11]). Комбинаторлық пост-трансляциялық реттеуші қосқыштарға әкелетін бұзылған аймақтардағы SLiM комбинациялары сияқты [55], күшейткіштер жеке гендерге [97] күрделі транскрипциялық схеманы біріктіреді. ДНҚ және (пре-)мРНҚ реттеуші аймақтары сияқты, құрамында бірнеше SLiM бар ретсіз аймақтар негізгі ошақтар болып табылады, онда мотивтердің пайда болуы мен жоғалуы жасуша реттелуі мен физиологиясында күрделі өзгерістерге әкелуі мүмкін [38, 68]. Тағы бір мысал-SLiM байланыстыратын қалта мен SLiM ДНҚ-байланыстырушы доменмен ДНҚ реттегіш элементінің бірлескен эволюциясының ұқсастығы. ДНҚ-байланыстырушы домен спецификасының өзгерістерінің болжанған плейотропиясына байланысты мұндай өзгерістер (транс-та) ДНҚ-ны байланыстыратын модульдік тораптардағы өзгерістерге (cis [18]-де) қатысты салыстырмалы түрде сирек болуы керек деген пікір айтылды. Соған қарамастан, кейіннен мұндай өзгерістердің бірнеше мысалдары мен ДНҚ байланыстыратын орындардың сәйкес эволюциясы анықталды (мысалы, [100]). Тағы да қалта-SLiM коэволюциясының мысалдары бар [40, 77, 78]. Соңында, жақында геномдық масштабтағы хроматиндік иммунопреципитация және DNase жоғары сезімталдық картасын жасау эксперименттері ДНҚ-ақуыздың өзара әрекеттесуінің түрлер арасында жылдам дамитынын көрсетті. Бұл нәтижелер көптеген ДНҚ мотиві – күрделі геномдардағы ақуыз әрекеттесулері эволюция барысында сақталмайтынын көрсетеді, ал функционалды байланыстыру орындарының шағын бөлігі негізгі мақсатты гендердің жанында сақталады [101]. Бұл жоғарыда сипатталған эволюциялық резервуар моделіне ұқсас, мұнда SLiM -дің көпшілігі эволюциялық түрде өтпелі, ал бірнеше негізгі SLiM табиғи іріктеу арқылы сақталады. Реттеушілік өзара әрекеттестіктің көп бөлігінің жылдам эволюциялық айналымы үлгіге сәйкес келеді, онда өзгерістердің көпшілігі іріктеуге қатысты дерлік бейтарап болады [65, 102] (дегенмен біз генеалогиялық спецификалық іріктеу де осындай үлгілерді шығара алатынын ескереміз [103 ]). Егер негізінен бейтарап модель дұрыс болса, бейімделмейтін процестермен құрылған эволюциялық резервуардың аз ғана бөлігі табиғи сұрыпталу арқылы сақталады. Эукариоттық геномдар мен протеомалардың көлемі мен күрделілігіне және мотивтердің қысқа, азғындау сипатына байланысты бұрынғы нихило мотивтердің пайда болуы барлық деңгейлерде (ДНҚ, РНҚ және ақуыздар) бейтарап реттеуші өзара әрекеттестіктің көп болуы үшін жеткілікті жылдам болуы мүмкін.


Фон

Секвенциялық жобалар таңғажайып жылдамдықпен биологиялық тізбектерді тудыратындықтан, функционалдық қолтаңбаларды тікелей тізбектен анықтау функционалды биологияда ерекше мәнге ие [1, 2]. Бұл қолтаңбаларды жаңа ақуыздың функционалды немесе маңызды қалдықтарын болжау үшін пайдалануға болады. Ақуыздардың функционалды маңызды қалдықтары әдетте эволюция кезінде сақталады [3]. Протеин тізбегінің сақталған аймақтарын сұрау ақуызын оның белок дерекқорларындағы гомологтарымен туралау арқылы анықтауға болады. Сонымен қатар, үлгіні өндіру (мотивтерді ашу деп те аталады) сақталған аймақтарды анықтаудың тиімді әдісі [4–7].

Мотивтерді табудың алгоритмдері осы тізбекте байланысты тізбектер жиынтығы берілген кезде (қолтаңбаны алу) іздеу үшін кеңінен қолданылды. Содан кейін алынған мотивтер жаңа реттілік (үлгі сәйкестігі) берілген кезде ақуыз функциясын және функционалдық учаскелерді болжау үшін қолданылады. Біз бұрын гибридті жолмен мотивті табуды қолдандық: жаңа тізбектің функционалды аймақтарын оның тізбегін және реттілік дерекқорында (MAGIIC-PRO, [8]) табылған гомологтар жиынтығын табу арқылы тікелей анықтау. Бірнеше ретті теңестіруге (MSA) ұқсас, MAGIIC-PRO сұрау ақуызы дерекқорлардан жеткілікті гомологтарды таба алатын болса, шақырылуы мүмкін (бұған көп реттілік жобалары аяқталғаннан кейін оңай қол жеткізуге болады). Осылайша, сұрау ақуызының функционалды қалдықтарын жиналған гомологтардың қызметі әлі белгісіз болған кезде де болжауға болады. MAGIIC-PRO эволюция кезінде бір мезгілде сақталатын қалдықтар жинағын анықтады. Бұл MSA ұсынған сақтау туралы ақпаратты толықтыра алады.

PROSITE тілі - үлгіні білдірудің формалды әдістерінің бірі [9]. Үлгідегі бас әріп дәл таңба деп аталады. Мысалы, 'K-x-L-x(2)-E-x(2,3)-G' үлгісінде төрт нақты таңба бар. Үлкен әріптен басқа, өрнекте 'x' белгісімен көрсетілген қойылмалы таңбалар да бар. Қойылмалы таңба кез келген әріпке биологиялық ретпен сәйкес келуі мүмкін. Бұл үлгі 'K' -ден басталатын ішкі жолды қамтитын кез келген реттілікке сәйкес келеді, содан кейін ерікті әріп, одан кейін 'L', одан кейін екі ерікті әріп, одан кейін 'E', одан кейін екі -үш ерікті әріп бар және аяқталады 'G'. 'x' және 'x(2)' екеуі де қатаң саңылаулар деп аталады, тұрақты ұзындықтағы саңылау. Қатты алшақтық мутацияға рұқсат етілген дәйекті қалдықтардың белгілі бір санына сәйкес келуі мүмкін. Екінші жағынан, x(2,3) - икемді саңылау, тұрақты емес ұзындықтағы саңылау. Икемді алшақтық тек мутациялар ғана емес, сонымен қатар кірістірулер мен өшірулерге де рұқсат етілген қалдықтардың санына сәйкес келуі мүмкін.

Ақуыздар үшін функционалды тораппен байланысты қалдықтар тізбектің жергілікті аймағында міндетті түрде табылмайды [5, 7, 10, 11]. Керісінше, функционалды тораптың қалдықтары бірнеше жергілікті аймақтарға топтастырылған, олар ақуыз бүктелген кезде маңызды құрылымды құрайды. Ақуыздар тобында шектеулі икемділікке жергілікті консервацияланған аймақтарда ғана рұқсат етілгені байқалады, ал кірістірілген немесе жойылған сегменттер ақуыздардың функционалдылығына әсер етпесе, бұл аймақтар арасында үлкен тұрақты емес саңылаулар болуы мүмкін [3, 12 –14]. 1-суретте біз осындай құрылымдық мотивтердің мысалын келтіреміз. «RxYSx (54,96) -GxGx (2) -Px (65,111) -YxCG» құрылымдық мотиві Ferredoxin-NADP [Swiss-Prot қосылу нөмірі: P10933] ақуызында және қосымша 150 Oxidoreductase FAD/NAD (P) байқалады. - P10933 бар бірдей ақуыздар тобына жататын байланыстырушы ақуыздар [InterPro жазбасы: IPR001433]. Бұл мотив үш блоктан тұрады және екі блокаралық бос орындар, 'x (54,96)' және 'x (65,111)', өте үлкен және икемді. 1-суретте үш үлгі блоктары бір-бірінен үлкен дәрежеде дәйектілікпен бөлінгенімен, үш өлшемді кеңістікте біріктірілген және флавин аденин динуклеотиді (FAD) мен никотинамид адениндинуклеотид фосфатының (NADP) байланысуымен байланысты байланыс аймағын құрайтыны көрсетілген. ) лигандтар. Бұл бақылау дәл таңбалардың кластерлері арасындағы үлкен икемді бос орындарды қамтитын реттілік мотивтерін ашу үшін алгоритмді әзірлеуге ағымдағы зерттеуді ынталандырады. Мұндай құрылымдық мотивтер ДНҚ-дағы цис-реттеуші элементтермен байланысты зерттеулерде енгізілген және талданғанына қарамастан [15-18], ақуыздар тізбегін талдауға арналған бірнеше алгоритмдер [15, 19].

Құрылымдық мотивтердің мысалы Бұл мотив Ферредоксин-НАДФ редуктаза [Swiss-Prot: P10933] ақуызында және InterPro жазбасынан қосымша 150 Oxidoreductase FAD/NAD (P) байланыстыратын ақуызда байқалады [InterPro: IPR001433]. Мотив «R-x-Y-S», «G-x-G-x (2) -P '» және «Y-x-C-G» консервацияланған үш аймақтан тұрады, олар x (54,96) және x (65,111) екі үлкен алшақтықпен өрілген. Осы үш үлгі блоктары ферредоксин-NADP редуктазасының 3D құрылымымен салыстырылғанда, барлық үш блоктың FAD/NAD(P) байланыстыру алаңына жақын екендігі көрсетілген. Үлгі блоктары сызбаға салынған таяқшалар түрлі түстерді қолдану. Бірінші және екінші блоктардың (екінші және үшінші блоктар) арасындағы ұзақ алшақтық сызылады ленталар қызғылт сары (күлгін). FAD және NADP лигандтары ретінде көрсетілген доп және таяқ тиісінше көк және қызыл түспен.

Үлкен ретсіз саңылаулары бар функционалды қолтаңбаларды табу тау-кен өңдеу процедураларын қиындатады. Мотивтерді іздеу алгоритмдері әдетте пайдаланушылар күтетін үлгілердің нақты түрлерін шығару үшін шектеулерді қолданады. 1-кестеде биологиялық тізбектегі мотивтерді табуды жүргізу кезінде олқылықтарды өңдеуге арналған белгілі шектеулердің бірнеше модельдері жинақталған. Тек қысқа сақталған сөздерді (саңылаусыз) [5, 20] немесе қатаң саңылауларды [4, 6, 21-23] қарастыратын алгоритмдер қысқа мотивтерді тиімді және тиімді түрде анықтайды (1 -үлгі). Алайда, мұндай модельдер табуға болатын үлгілердің іздеу кеңістігіне шектеулер қояды, себебі тізбектер бойынша кірістіру мен өшіруге жол берілмейді. Екінші жағынан, Пратт алгоритмі [19] іздеу кеңістігін ұлғайту үшін саңылау икемділігі тұжырымдамасын енгізеді (2-модель). Шектеу модельдерінің жалпы түрі сәйкесінше саңылаудың төменгі және жоғарғы шекарасын белгілейді (модель 3). Дегенмен, кез келген екі іргелес нақты таңба арасындағы үлкен икемді бос орындарға рұқсат беру шулы үлгілерді тудырады және сонымен қатар жүйе өнімділігін нашарлатады [24]. Бос орын шектеудің тағы бір моделі шексіз икемді саңылаулармен өрілген үздіксіз сөздер жиынтығын қарастырады (модель 4) [7, 11, 14]. Бұл модель құнды, себебі эволюция кезінде орын алатын үлкен кірістірулер мен жоюларды дұрыс өңдеуге болады. Дегенмен, жергілікті түрде сақталған аймақтар үшін үздіксіз сөздерді қолдану олардың консервативті алмастырулар жиі байқалатын ақуыз тізбегін талдауда қолданылуын шектейді. Сонымен қатар, 4 -модельдегі шексіз икемділік шу шығарады.

1-кестеде ұсынылған 5-модель бұрын біздің соңғы жұмысымызда ұсынылған болатын [24] MAGIIC алгоритмі 'AxCx (2,3) -DFx (10,198) сияқты құрылымдық мотивтерді ашу үшін блокаралық және блок аралық шектеулердің комбинациясын қолданады. RGx (0,1) -D '. Мұндай үлгілердің көптеген үлгі блоктарына топтастырылған таңбалары бар, мұнда үлгі блогының ішіндегі бос орындар блок ішілік саңылаулар деп аталады, ал екі дәйекті блок арасындағы саңылаулар блок аралық саңылаулар деп аталады. Біз алдыңғы зерттеулерде [24] блок ішіндегі және блок аралық шектеулердің комбинациясын қолдану кен өндіру тиімділігін едәуір жақсартатынын көрсетті. MAGIIC үлгілері cis-реттеу элементтерін ашу үшін ұсынылған құрылымдық мотивтерге ұқсас [15]. Бастапқыда ДНҚ тізбегін өндіруге арналған болса да, RISOTTO пакетін ақуыздардың тізбегін өндіру үшін де қолдануға болады.

Ақуыздар тізбегінің функционалды мотивтерін анықтау үшін MAGIIC-ті қолданғаннан кейін, блокаралық саңылауларды тек қатаң саңылаулармен шектеу кен өндіру нәтижелерін одан әрі жақсартуға болатынын байқадық. Осыған байланысты кейінірек ұсынылған MAGIIC-PRO веб-сервері жергілікті мутацияларды өңдеу үшін жай ғана қатаң блок ішіндегі бос орындарды пайдаланады. MAGIIC-PRO-да блок ішіндегі қатаң саңылаудың максималды ұзындығы кішкене мәнге орнатылады, мысалы, екі немесе үш. Блокаралық бос орындарға қатысты MAGIIC де, RISOTTO да блоктар арасындағы ең төменгі (төменгі шекара) және максималды (жоғарғы шекара) қашықтықты алдын ала орнатады. MAGIIC-PRO әзірлегенде, біз мотив ашылғанға дейін блоктар арасындағы минималды және максималды арақашықтықты орнату өте қиын екенін байқадық. Үлгіні өндіру кезінде сұрау ақуызы қатысқан кезде бұл мәселені шешуге болады. Яғни, блоктар арасындағы минималды және максималды қашықтықтарды сұраулар тізбегіндегі бос орындарға сәйкес динамикалық түрде орнатуға болады. Сұрау жүйелілігінде байқалатын бос орындардың ұзындығымен, гомологтардың арасында рұқсат етілген төменгі және жоғарғы шекараларды есептеуге арналған «максималды салыстырмалы икемділік» деп аталатын жаңа шектеу құрылды. MAGIIC-PRO-да ұсынылған шектеулер моделін қанағаттандыратын үлгілер W-үлгілері деп аталады.

Бұл зерттеу W-үлгілерін тиімді ашуға арналған WildSpan алгоритмін енгізуге бағытталған. Бұл мақалада біз «максималды салыстырмалы икемділік» шектеуінің кейбір жақсы қасиеттерге ие екендігін көрсеттік, сондықтан тиімділікті арттыру үшін WildSpan агрессивті кесу стратегияларын қолдануға болады. WildSpan өнімділігі екі жолмен бағаланады. W-үлгілерін қолданыстағы мәліметтер қорындағы аннотацияланған мотивтермен салыстыру W-үлгілерінің белоктардың функционалдық қолтаңбаларын жақсы түсіретінін көрсетеді. WildSpan-ды ұқсас тапсырманы орындайтын қолданыстағы алгоритмдермен салыстыру W-үлгілерінің ақуыздық функционалды аймақтарды анықтауда қазіргі қолданыстағы шектеулер модельдеріне қарағанда күшті екенін көрсетеді.

Бұл мақалада біз WildSpan-ды болашақ протеомика қолданбалары үшін протеинге негізделген немесе отбасы негізіндегі тау-кен өндіру режимі ретінде қалай қолдануға болатынын көрсетеміз. Ақуызға негізделген тау-кен жұмыстарының нәтижелері WildSpan сұраныстағы ақуыздың функционалды немесе құрылымдық қолтаңбаларын ақуыз тізбегінен тиімді және тиімді түрде анықтай алатынын көрсетеді. Екінші жағынан, отбасылық негізде жүргізілген тау-кен жұмыстарының нәтижелері WildSpan-ды болашақ функцияларды болжау мен дәйектілік аннотациясы үшін ақуызды отбасылардың реттік қолтаңбаларын анықтау үшін қолдануға болатынын көрсетеді. Ақуызға негізделген тау-кен идеясы 2006 жылы MAGIIC-PRO [8] және 2007 жылы iPDA [25] веб-серверлерінде белоктар тізбегін аннотациялау үшін біріктірілген. Екінші жағынан, отбасылық өндіру идеясы 2008 жылы E1DS веб-серверіне енгізілген [26] фермент каталитикалық тораптары мен қалдықтарын болжау үшін. Қорытындылай келе, бірнеше тәуелсіз зерттеулер W-үлгілерінің шектеу моделінің пайдалылығын сәтті көрсеткенімен, WildSpan алгоритмінің дизайны бұрын қарастырылмаған және басқа жерде жарияланбаған. Сонымен қатар, WildSpan дербес пакеті мен ашық бастапқы кодтары қазір жүктеуге дайын және оларды болашақта кең көлемді протеомдық зерттеулер үшін пайдалануға болады.


АЯҚТАУЛАР

Мақала баспа алдында онлайнда жарияланды. Мол. Биол. 10.1091 ұяшығы/mbc.E03-02-0120. Мақала мен жариялану күні www.molbiolcell.org/cgi/doi/10.1091/mbc.E03-02-0120 сайтында қол жетімді.

Қолданылатын қысқартулар: CI-M6PR, катионға тәуелсіз манноза 6-фосфатты рецептор EEA1, ерте эндосомалық антиген-1 GST, глутатион С.-трансфераза lgp, лизосомалық мембраналық гликопротеин NCL, нейрондық цероидті липофусциноз NRK, қалыпты егеуқұйрық PDI, протеин сульфидті изомераза PBS, фосфат-буферлі тұзды PFA, параформальдегид TMD, трансмембраналық домен wt, жабайы түрі.


Бейнені қараңыз: Белоктар,құрамы,құрылысы,қасиеттері. Узакова Күнсая (Ақпан 2023).