Ақпарат

Филогенетикалық ағашты топсыз қалай құруға болады?

Филогенетикалық ағашты топсыз қалай құруға болады?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Менде бір түрдегі төрт қоңыз популяциясының тұтас геномдық реттелген тізбектері бар. Мен төртеуімен филогенетикалық ағаш салғым келеді. Дегенмен, мен түрдің қолайлы топ тобын таба алмаймын, сондықтан ағашты тамырлау үшін сыртқы топты пайдалана алмаймын. Ағашты топсыз құру үшін қолдануға болатын нақты әдіс бар ма? Мен MEGA бағдарламалық құралының мұны жақсы орындайтынын білдім. Ағашты топсыз құрудың теориясы мен түсінігі қандай? Ағашты топсыз салудың салдары қандай? Ағаштар арасындағы қашықтық бір-біріне қатысты өлшенеді ме?


Филогенезді қайта құрудың классикалық алгоритмдерінің көпшілігі пайдаланушы таңдаған сыртқы топқа негізделген a posteriori ағашын түбірлейді. Ағаш шын мәнінде тұжырымдалған және тамырсыз ішкі бейнеленген.

Сондықтан, егер сізден топтан тыс топты сұрайтын бағдарламаны пайдалансаңыз, сіз жай ғана ерікті біреуін таңдап, кейінірек алынған ағашты «түбірден жоюға» болады.


Биологияның кіріспе курсындағы филогенетикалық ағаштардың студенттік құрылысы

Филогенетикалық ағаштар биология пәндерінде барған сайын маңызды бола бастады. Демек, филогенетикалық ағаштар туралы білім биологиялық білім берудің маңызды құрамдас бөлігі және биология білімін зерттеу үшін қызығушылық аймағы болды. Оқыту үшін студенттер кейбір деректер түрінен филогенетикалық ағаштарды жасайтын құрылыс тапсырмалары жиі пайдаланылады. Дегенмен, бұл жаттығулардың оқушылардың оқуына әсері белгісіз, бұл ішінара біздің тапсырмаларды орындау кезінде оқушылардың не құрастыратыны туралы үзінді білімімізге байланысты. Бұл жобаның мақсаты құрылыс тапсырмаларын студенттердің оқуымен байланыстыруға тырысатын болашақ зерттеулерді қолдайтын студенттер жасаған филогенетикалық ағаштарды сипаттаудың неғұрлым сенімді әдісін әзірлеу болды.

Нәтижелер

Кіріспе биология курсының деректерін итеративті тексеру арқылы біз студенттер жасаған филогенетикалық ағаштарды стиль, шарттылық және дәлдік тұрғысынан сипаттау әдісін жасадық. Оқушылар құрылыс тапсырмалары үшін жақша стиліне қарағанда қиғаш стильді жиі қолданды. Филогенетикалық ағаштардың көпшілігі шартты түрде салынған, ал бұтақтардың ауыспалы бағдары ең көп таралған дәстүрлі емес ерекшелік болды. Сонымен қатар, филогенетикалық ағаштардың көпшілігі дәлдік тұрғысынан дұрыс (қателері жоқ) немесе адекватты (тек шамалы қателер) жасалған. Қалыптасқан таксондардың басқа таксондардан шыққанын болжау ең көп тараған үлкен қателік болды, ал бос тармақтар мен қосымша түйіндер өте жиі кездесетін кішігірім қателер болды.

Қорытындылар

Студент құрастырған филогенетикалық ағаштарды сипаттау үшін біз әзірлеген әдіс қосымша зерттеуді қажет ететін бірнеше тенденцияларды ашты. Мысалы, диагональды және жақшадағы филогенетикалық ағаштар баламалы ақпаратты қамтығанымен, студенттердің диагональды стильді пайдалану қалауы түсінуге әсер етуі мүмкін. Сонымен қатар, нақты нұсқаулардың жоқтығына қарамастан, студенттер негізінен әдеттегі және дәл болатын филогенетикалық ағаштарды жасады. Бір қызығы, дәлдік пен шарттылық бір-біріне тәуелді болды. Студенттер салған филогенетикалық ағаштарды сипаттау әдісіміз бір мекемедегі бір кіріспе биология курсының деректеріне негізделген және нәтижелер шектеулі болуы мүмкін. Біз зерттеушілерді құрылыс тапсырмаларын студенттердің оқуымен байланыстыруға тырысатын болашақ зерттеулерді қолдайтын жалпылама құрал әзірлеу үшін біздің әдісімізді негіз ретінде пайдалануға шақырамыз.


Материалдар мен тәсілдер

Таксон және таңбаларды іріктеу

Талаттосучиялық крокодиломорфтардың қарым-қатынасын тексеру үшін мен сегіз топтық және 78 ішкі топтық таксондар үшін алынған 394 морфологиялық белгілерге филогенетикалық талдау жасадым, оның ішінде 24 талаттосучиялық түр (онлайн 1-қосымша Dryad.do сайтында Қосымша материал ретінде қолжетімді http://id. org/10.5061/dryad.00ss6). Бұл жаңа деректер жинағы Вилбергте (2015) ұсынылғанның өзгертілген нұсқасы болып табылады, ол 10 жаңа таңбаның қосылуы және көптеген басқалардың модификациясы бар (онлайн 2-қосымша Dryad сайтында http://dx.doi.org/ сайтында Қосымша материал ретінде қолжетімді. 10.5061/dryad.00ss6). Таңбаларды кодтаудағы қателерді азайту үшін мен топтық іріктеуді өз көзіммен бақылай алатын үлгілерге немесе егжей-тегжейлі жарияланған сипаттамалары бар үлгілерге бағыттадым. Мен барлық негізгі крокодиломорф топтарынан кең үлгі алуға тырыстым. Thalattosuchia ішіндегі таксондық іріктеу топта бар морфологиялардың кең ауқымын олардың бүкіл уақытша ұзақтығы бойынша түсіруге бағытталған. Топтан тыс іріктеу алдыңғы талдауларға қарағанда қолтырауындық емес түрлердегі сипат күйлерінің таралуын жақсырақ сипаттау мақсатында көбейтілді. Базальды осындай Gracilisuchus Несбиттің (2011) Архозаврияның кең ауқымды талдауындағы позициясына негізделген ағаштың тамыры үшін пайдаланылды. Рауисучид (sensu Nesbitt 2011) Postosuchus kirkpatricki екі негізгі себеппен қосылды. Біріншіден, Rauisuchidae жиі филогенетикалық тұрақсыз «Сфеносучиядан» тыс, Crocodylomorpha-ның бауырлас тобы ретінде қалпына келтірілді (мысалы, Benton and Clark 1988 Parrish 1993 Juul 1994 Nesbitt 2011). Екіншіден, Postosuchus kirkpatricki Көптеген кейіпкерлердің ұпайларын алуға мүмкіндік беретін толық қаңқаны білдіретін көптеген үлгілерден жақсы белгілі. Сондай-ақ алты «сфеносухиялық» таксон сынама алынды. Олардың үшеуі алдыңғы талдауларда Crocodyliformes үшін әпкелі таксон ретінде қалпына келтірілді (Junggarsuchus sloani, Кларк және т.б. 2004 Kayentasuchus Walkeri, Несбит 2011 ж Almadasuchus figarii, Пол және т.б. 2013). Бұл таксондардың қосылуы Thalattosuchia-ны Crocodyliformes-тің бауырлас тобы ретінде орналастыру мүмкіндігін неғұрлым қатаң сынауды қамтамасыз етеді. Топологияның топтан тыс іріктеуге сезімталдығын бағалау үшін талдау үш ауыстыруда да орындалды: Базальды осындайларды қоспағанда Gracilisuchus (тамыр қосулы Postosuchus) крокодиломорфты емес таксондарды қоспағанда Gracilisuchus және Postosuchus (тамыр қосулы Hesperosuchus agilis) және барлық қолтырауын тәрізді еместер мен протосухиядағы тамырларды қоспағанда Orthosuchus stormbergi кейбір жарияланған талдаулардағыдай (мысалы, Sereno and Larsson 2009).

Кез келген палеонтологиялық филогенетикалық талдаудағыдай, зерттеу деректерінің жиынында жетіспейтін деректердің салыстырмалы түрде жоғары көлемі бар (40,75% жоқ немесе жарамсыз). Жетіспейтін деректердің көпшілігі посткраниальды белгілерде шоғырланған, өйткені көптеген крокодиломорф таксондары негізінен бас сүйек материалынан белгілі. Үш таксон (Zaraasuchus shepardi, Eoneustes Gaudryi, және Steneosaurus brevidens) өте толық емес (80–82%), ал бір таксонның орташа толық еместігі ~36% құрайды. Дегенмен, жетіспейтін деректер филогенетикалық дәлдікті төмендететіні көрсетілген (мысалы, Wiens 2003 Prevosti және Chemisquy 2010 және ондағы сілтемелер), жетіспейтін деректер саны таксонның ақпараттық мазмұнымен тікелей байланысты емес. Өте толық емес таксон ақпараттық синапоморфтық ақпаратты қамтитын болса, ажыратымдылықты әлі де арттыруы мүмкін (Керни және Кларк 2003 Wiens 2003).

Парсимониялық талдау

Филогенетикалық деректер жинағы TNT v1.1 (Goloboff et al. 2008) тең салмақты парсимонияны пайдалана отырып талданды. Ең аз ұзындықтағы ағаштар кездейсоқ қосу тізбегін пайдалана отырып, Вагнер ағаштарының 1000 көшірмелері бар эвристикалық іздеу арқылы табылды, содан кейін ағаш екіге бөлу және қайта қосылу (TBR) тармақтарын ауыстыру. Осы көшірмелерден алынған ең қысқа ағаштар барлық ең аз ұзындықтағы ағаштардың табылғанын қамтамасыз ету үшін TBR бұтақтарын ауыстырудың соңғы айналымына ұшырады. Нөлдік ұзындықтағы бұтақтар, егер оларда ең аз ұзындықтағы ағаштардың кез келгенінің астында қолдау болмаса, құлады (Коддингтон мен Шарф 1994 жылғы 1 ереже). Екі бөлек талдау жүргізілді. Біріншісінде, кейбір көп күйлі таңбаларда болатын ықтимал кірістірілген гомологиялар жиынының әсерін тексеру үшін 36 таңба реттелген ретінде қарастырылды (онлайн 2-қосымша Dryad сайтында http://dx.doi.org/10.5061/dryad сайтында Қосымша материал ретінде қолжетімді. .00ss6). Екіншісінде көп күйді таңбалар жасалмау үшін ретсіз деп қарастырылды априори эволюция процесі туралы болжамдар (бірақ мұндай кейіпкерлерді ретсіз ретінде қарастыру жақсырақ негізделген жорамалдарды қамтиды ма деген сұрақ туындады, мысалы, Lipscomb 1992 Slowinski 1993).

Түйінді қолдау

Түйіндік қолдау таңба деректеріне қолданылатын пышақпен қайта үлгілеу арқылы бағаланды (Farris et al. 1996). Jackknife қолдауы TNT жүйесінде 1000 көшірмелерді пайдаланып, тәуелсіз таңбаларды жою ықтималдығы 0,37 (Farris және т.б. 1996 жылы ұсынылғандай∼e -1) орнатылды. Әрбір көшірмеде 10 ағашты сақтай отырып, 10 кездейсоқ қосу ретінен тұратын эвристикалық іздеу қолданылды. Алынған топологиялар GC жиіліктері арқылы қорытындыланды (берілген топты қалпына келтіру жиілігі мен ең жиі қайшы келетін топ арасындағы айырмашылық Goloboff et al. 2003). GC жиіліктері абсолютті жиіліктерге қарағанда (жүктеуіш және пышақ талдауларындағы жиіліктерді санаудың стандартты әдісі) артықшылық береді, өйткені олар кладты қолдайтын дәлелдерді, сондай-ақ осы топтаманы бұрмалайтын дәлелдер санын есепке алады.

Салыстырмалы матрицалар

Топтан тыс іріктеудің ағаш топологиясына әсерін бағалау үшін бұрын жарияланған екі крокодиломорфтық таксон-сипатты матрицалар (Turner and Buckley 2008 Sereno and Larsson 2009) зерттелді. Тернер мен Бакли (2008) талдауы 75 таксоннан және 290 таңбадан тұрады және мыналарды қамтиды: Gracilisuchus stipanicicorum, Terrestrisuchus gracilis, және Dibothrosuchus elaphros сыртқы топтық таксондар ретінде (тамыр Gracilisuchus). Серено мен Ларссонның (2009) талдауы 43 таксонды және 252 таңбаны (протосухияға негізделген) қамтиды. Orthosuchus stormbergi). Жаңа топтық таксондарды қосуды қоспағанда, екі матрица да өзгерген жоқ. Тернер мен Бакли (2008) жағдайында бірыңғай терминалдық таксон Postosuchus kirkpatricki қосылды. Салыстырмалы мақсаттар үшін екеуі де Postosuchus және Gracilisuchus Серено мен Ларссонның (2009) деректер жинағына қосылды. Бұл деректер жиындары TNT v. 1.1 нұсқасындағы салмақсыз парсимония және жоғарыда сипатталған іздеу параметрлері арқылы талданған. Екі талдау да аддитивті таңбаларды қамтыды және олар осылай сақталды. Gracilisuchus екі матрица үшін де түбір ретінде орнатылды. Барлық филогенетикалық деректер жиынтықтары Dryad сайтындағы Қосымша материал ретінде http://dx.doi.org/10.5061/dryad.00ss6 мекенжайында қолжетімді.


Geneious Prime-те филогенетикалық ағашты қалай құруға болады

Филогенетикалық ағаштар тізбектер арасындағы эволюциялық қатынастарды анықтау үшін қолданылады. Geneious филогенетикалық ағаштарды қашықтықты, максималды ықтималдықты немесе Байес әдістерін қолдана алады. Бұл нұсқаулық ағашты құру және Geneious бағдарламасында ағаш қарау құралын басқарудың негізгі қадамдарын сипаттайды.

Ағашты салуға кіріспес бұрын, ағаш салу принциптерімен және әр әдістің күшті және әлсіз жақтарымен танысу керек. Төмендегі шолу - бастау үшін жақсы орын.

1. Тізбектерді туралаңыз

Филогенетикалық ағашты құрастырмас бұрын, реттіліктерді туралау керек. Мұны істеу үшін барлық реттіліктерді таңдап, таңдаңыз Align/Assemble - Көп реттік туралау. Бұл сілтеме қол жетімді алгоритмдерге нұсқаулық береді.

Туралауыңызға риза болғаннан кейін оны таңдап, басыңыз Ағаш ағаш құру опцияларын ашу үшін.

2. Ағаш құрастырушы мен параметрлерді таңдаңыз

Ағаш салу опцияларының жоғарғы жағында қол жетімді ағаш құру алгоритмдерін көресіз. Бұған кірістірілген Geneious Tree Builder (және Consensus Tree Builder) және сіз орнатқан кез келген плагиндер кіреді.

Geneious Tree Builder көршілес біріктіру немесе UPGMA әдістерін пайдаланып қашықтағы ағаштарды жасайды. Сонымен қатар, максималды ықтималдық, парсимония немесе Байес ағаштарын шығару үшін келесі плагиндер қол жетімді:

RAxML - Үлкен деректер жиыны үшін оңтайландырылған максималды ықтималдық

FastTree - өте үлкен деректер жиыны үшін шамамен максималды ықтималдық

PAUP* - Парсимония немесе максималды ықтималдық (4.0b10 немесе 4.0a149 және одан жоғары нұсқадағы PAUP* көшірмесін осы жерден қажет етеді)

Ағаш жасаушылардың максималды ықтималдығы туралы қосымша ақпаратты мына сілтемеде алуға болады.

Әрбір ағаш құрастырушының эволюциялық модельді және басқа параметрлерді көрсетуге арналған әртүрлі интерфейсі бар. Қол жетімді опциялармен танысу үшін әрбір ағаш құрастырушының пайдаланушы нұсқаулығын қарауды ұсынамыз. Сондай-ақ, ағашты құрастырмас бұрын деректеріңіздің ең жақсы үлгісін анықтау үшін Geneious қолданбасынан тыс Modeltest сияқты бағдарламаны пайдаланғыңыз келуі мүмкін.

3. Ағашыңызды іске қосыңыз

Ағаш құруды бастау үшін OK түймесін басыңыз. Ағашты құруға кететін уақыт сіз таңдаған алгоритмге, туралау өлшеміне және сіз таңдаған параметрлерге (мысалы, жүктеу репликаларының саны) байланысты өзгереді. Қашықтықтағы ағаштар әдетте тез аяқталады (минуттардың ішінде), бірақ максималды ықтималдық пен Байес ағаштары жұмыс істеуге бірнеше сағат немесе тіпті күн кетуі мүмкін.

4. Ағашыңызды қараңыз

Ағашты іске қосуды аяқтаған кезде, жаңа ағаш құжаты жасалады және ол қарау құралында автоматты түрде ашылады. Әдепкі бойынша, Geneious тікбұрышты (түбірлі) орналасуда ағаштарды көрсетеді, тіпті егер ағаш тамыры жоқ болса да. Шеңбер немесе радиалды пішімдерге арналған опцияларды астынан табуға болады Жалпы қойындысын масштабтауды басқару элементтерімен бірге басыңыз.

Ағаштың тамырын алғыңыз келсе, сыртқы топ ретінде көрсеткіңіз келетін таксонның түйінін басып, түймесін басыңыз. Түбір. Топологияны өзгертпестен таксондардың орнын тігінен ауыстыру үшін пайдаланыңыз Ағайындыларды алмастыру опция.

Қарау құралының жоғарғы жағындағы басқару элементтері ағашқа бояу және қаріп өлшемдерін орнату опцияларын да қамтиды. Бүкіл классты бояу үшін, класстың негізіндегі түйінді таңдап, таңдаңыз Түс түйіндері.


1 Жауап 1

Сізге максималды ықтималдық арқылы үлгіге негізделген ағаш құру алгоритмі арқылы жүктеуді қолдау қажет (бірнеше адам Bayes пайдаланады). Файл пішімі жеңіл филип пішімі болып табылады (егер сізде қиындықтар болса, бөлек сұрақ қойыңыз - бұл біршама қиын).

Мен мұнда стандартты RAxML қолданамын, әсіресе raxmlHPC (оңай жүктеп алуға болады және Linux және OSX жүйелерінде құрастырылады). Кодтар өте күрделі және мен оларды төменде келтірдім.

Күшті максималды ықтималдық ағашы,

Бұл ағаш 500 репликация үшін жүктеледі, бірақ бастау үшін мен 100 репликацияны қолданамын.

Жүктеуіштердің консенсус ағашын жасаңыз,

Сізге жүктеуді қолдау >80% қажет және мұны 5-2/5-3 арқылы және онсыз қайталаңыз (ол әлі ұзақ көрінеді)

Сіз қол жеткізе алатын кластер есептеу үшін жақсы, бір деректер жиыны үшін бір жүктеу тізбегін есептеуді аяқтау үшін шамамен 24 сағат қажет болады және сіз есептеуді 22 контиг бойынша параллельдеуіңіз керек екені анық.

Ағашты қарау, FigTree (Mac OSX үшін) оңай.

Түбірлеу қиын болуы мүмкін, себебі мен сіздің бактерияларыңызды білмеймін.

Рекомбинация мәселесі күрделірек, бірақ мен сіздің контигтеріңізден 22 ағашты тұрғызып, оларды сәйкестік үшін бағалаймын. Панмиксия - алаңдаушылық, бұл тым көп рекомбинацияны білдіреді


Филогенетикалық ағашты қалай оқуға болады

Вилли Хенниг түрлер арасындағы генеалогиялық қатынастарды анықтаудың жаңа әдісін ұсынғанына 50 жылдан астам уақыт өтті, ол оны филогенетикалық систематика деп атады. Дегенмен, көптеген адамдар бұл әдіске әлі де сақтықпен қарайды, олар жаңа терминдер мен тұжырымдамалардың басым бөлігімен күресуге мәжбүр болады деп қорқады. Шын мәнінде, филогенетикалық ағаштарды оқу және түсіну шынымен де қиын емес. Сізге тек үш жаңа сөз, аутапоморфия, синапоморфия және плезиоморфияны үйрену керек. Басқа ұғымдардың барлығы (мысалы, ата-бабалар, монофилетикалық топтар, парафилетикалық топтар) Хенниг сахнаға келгенге дейін дарвиндік эволюцияның бөлігі болған таныс ұғымдар.

Дэн Брукс екеуміз Торонто университетінің екінші курс студенттеріне биоәртүрлілік курсын (EEB 265) үйретеміз. Бүкіл курс филогенетикалық шеңбердің айналасында құрылған. Біз үлкен, жеңілдетілген болса да, Метазоа ағашынан бастаймыз, содан кейін топтарды бір-бірімен байланыстыратын кейіпкерлерге және әр топты бірегей ететін кейіпкерлерге назар аудара отырып, губкалардан жыланға дейін жұмыс істейміз. Егер біз өз жұмысымызды дұрыс орындасақ, оқушыларымыз келесі сұрақтарға жауап беруі керек — бұл не жануар (сіз қайдан білесіз)? Ол не істейді? Оны ерекше ететін не? Оның биологиясының қандай аспектілері оны антропогендік араласуға осал етеді? Студенттердің барлығы филогенетика негіздерін қамтитын бірінші курс биология пәнінен зертханалық сабақ алғандықтан, біз биоәртүрлілік курсында филогенетикалық әдістемені қайта қараудың қажеті жоқ деп ойладық. Көптеген студенттер EEB 265-ке келген кезде біздің болжамымыздың аңғал екенін түсінгенімізге көп уақыт болмады, олар миындағы «филогенетика» жанындағы жою түймесін басып үлгерді. Өмірдегі қызықты және маңызды нәрселер туралы сіздің көзқарасыңызбен бәрі бірдей бөліспейтінін (қайта) табу әрқашан кішіпейілділік!

Сурет тақтасына оралу. Метазоандардың әртүрлілігі туралы курсты оқытудағы негізгі мәселелердің бірі - сізде барлық топтарды қамтуға жеткілікті уақытыңыз жоқ. Біздің ең соңғы нәрсе теория туралы пікірталас үшін биологияға негізделген дәрістерді құрбан ету болды. Мәселен, мәселе қарапайым болды: 50 минут ішінде студенттерге филогенетикалық ағаш не айтып тұрғанын қалай түсінуге болатынын үйрететін дәріс құрастырыңыз. Біздің мақсатымыз студенттерге ағаштарды қалай жасау керектігін үйрету емес, оларды қалай оқу керектігін үйрету еді. Бұл мақала сол лекцияға негізделген.

Филогения сөзі екі грек сөзінің қосындысынан жасалған, фил (тайпа — атап айтқанда, ежелгі Афины мемлекетіндегі ең үлкен саяси бөлімше [www.yourdictionary.com www.etymonline.com]: осыдан алатын тағы бір сөз – «филум») және гения (шығу тегі [www.etymonline.com]: осыдан алатын тағы бір сөз – «ген»). Оны 1866 жылы дамушы биолог Эрнст Геккель ойлап тапты, содан кейін Дарвин өзінің әйгілі еңбегінде қолдады, Түрлердің шығу тегі туралы (1869 ж. 5-ші басылымынан бастап). Екі биолог те «филогения» идеясын, яғни топтардың пайда болуын эволюциямен байланыстырды. Филогенетикалық ағаштар - бұл организмдер топтарының шығу тегі мен эволюциясын бейнелейтін қарапайым диаграммалар.

Сіз оны білмесеңіз де, филогенетикалық ағаштар туралы идея бәрімізге таныс. Адамдар ондаған жылдар бойы «филогенетикалық» сөзін «семья» сөзін ауыстырып, мұндай ағаштарды жасайды (1-сурет). Отбасындағы жеке адамдар ұрпақтар бойына «қан» байланыстарымен (ұрпақтар беретін көбею процесі) байланысты болатыны сияқты, жеке түрлер де эволюциялық байланыстармен (табиғи сұрыпталу сияқты биологиялық процестер мен континенттердің жылжуы немесе өзен сияқты геологиялық процестер) байланысты. түрлер тудыратын өзгермелі бағыт). Бұл мағынада түрлену (жаңа түрлердің өндірісі) = көбею (жаңа даралар өндірісі). Басқаша айтқанда, біз бәріміз бір тұқымдастың мүшелерінен бір түрдің өкілдеріне дейін гендер арқылы байланысқанбыз.

Қызықты адамдар тобына арналған отбасылық ағаш. Филогенетикалық тұрғыдан алғанда, тұқымдық ағаштар (адамдар шежіресі) = филогенетикалық ағаштар (түрлердің генеалогиясы)

Отбасылық ағаштар жүзім шоғыры сияқты төңкеріліп тұрғандай сызылады. Филогенетикалық ағаштар біршама басқаша бейнеленген. 2a-суретте көрсетілген үлкен мысықтардың отбасылық шыршасын ұстап тұрғаныңызды елестетіңіз. Енді оны бүйірге аударыңыз (сағат тіліне қарсы 90° бұрыңыз) және сізде 2b-де көрсетілген сурет бар. Бұл кескінді сағат тіліне қарсы тағы 90° бұрыңыз, оны тегістеңіз, сонда сіз 2c-суретте көрсетілген кескінге ие боласыз (бұл ағаш пішіні Түрлердің шығу тегі туралы). Есте сақтау маңызды нәрсе - бұл үш бейнеде де үлкен мысықтардың түрлері арасындағы қарым-қатынастар туралы бірдей нәрсе айтылады. Филогенетикалық ағаштарыңызды қалай салуды таңдайсыз, ішінара жеке қалауыңызға байланысты - кейбір адамдар 2b оқуды жеңілдетеді, басқалары 2c-ті қалайды.

ав Тұқымға арналған отбасы/филогенетикалық ағашты салудың көптеген жолдары Пантера

Филогенетикалық ағаштар «филогенетикалық систематика» деп аталатын әдіспен қайта құрылады (3-сурет). Бұл әдіс ортақ, бірегей белгілерге негізделген организмдер топтарын біріктіреді синапоморфиялар. Мысалы, сіз мысықтармен омыртқаның болуын бөлісесіз, бірақ көбелектермен емес. Омыртқаның болуы, осылайша, адамдар көбелектерге қарағанда мысықтармен жақынырақ деген гипотеза жасауға мүмкіндік береді (4а-сурет) мысықтар мен адамдардың екеуінің де омыртқасы бар, көбелектер омыртқасыз 1 Сілтеме. Барлық кейіпкерлер синапоморфиялық емес. Кейбір қасиеттер деп аталады плезиоморфиялар, топтың барлық мүшелері ортақ. Ағашымызға оралсақ, мысықтарда, адамдарда және көбелектерде ДНҚ бар екенін көреміз (4б-сурет). ДНҚ-ның болуы осы үш түрдің барлығы бір топтың бөлігі деп болжауға мүмкіндік береді, бірақ бұл түрлердің бір-бірімен байланысы туралы ештеңе айтпайды. Бұл туралы ойланыңыз: менің фамилиям МакЛеннан кланының бір бөлігі екенімді айтады. Егер мен Джесси МакЛеннан есімді біреуді кездестірсем, біз қандай да бір түрде туысқан екенімізді білемін, бірақ ол көптен бері жоғалған немере ағасы ма, әлде отбасылық ағаштың алыстағы тармағынан шыққан адам ба білмеймін. Сіз білуіңіз керек соңғы термин аутопоморфия— топтың бір мүшесінде ғана болатын қасиеттер. Мысалы, көбелектерді мысықтар мен адамдардан ажыратуға болады, өйткені оларда хитиннен (глюкозаның қатты, су өткізбейтін туындысы) жасалған экзоскелет бар. Аутапоморфиялар бізге топтағы белгілі бір түрді анықтауға көмектеседі, бірақ плезиоморфиялар сияқты топ ішіндегі қарым-қатынастар туралы ештеңе айтпайды. Жалпы кейіпкерлердің осы үш түрін Goldilocks оқиғасымен салыстыруға болады: плезиоморфиялар тым ыстық (тым кең таралған), аутапоморфиялар тым суық (тым шектеулі) және синапоморфиялар дұрыс (филогенетикалық қатынастарды анықтау үшін).

Филогенетикалық систематиканың негізі

Филогенетикалық ағаштағы кейіпкерлердің түрлерін анықтау. а синапоморфия б плезиоморфия в аутопоморфия

Ағаштардың өздеріне оралу үшін кейіпкерлер жеткілікті. Неліктен ағаштағы бұтақтардың атаулары бар (мысалы, арыстан, жолбарыс, т.б.), ал әртүрлі бұтақтарды біріктіретін сызықтар жоқ (5-сурет)? Себебі бұл сызықтар бейнелейді ата-бабалар. Ата-баба - ұрпақты тудыру үшін түрлену оқиғасынан өткен түр. Ата-баба әдетте түрлену процесінде «жоғалып кетеді». Бұл ата-баба жойылды дегенді білдіре ме?

Филогенетикалық ағаштан ата-бабаларды табу

Бұған жауап беру үшін біз көргендердің барлығын жазып алатын сандық құрылғыны алып біраз уақыт жүруіміз керек (Cурет 6). Елестетіп көріңізші, сіз 10 000 000 жыл артқа саяхат жасайсыз, содан кейін артқы жағында қызыл дақтары бар кесірткенің қызықты түрін (А түрі) қызықтыра отырып, тоқтаңыз. Біраз уақыттан кейін сіз бес миллион жыл немесе одан да көп уақыт ішінде алға жылжуды шешесіз, содан кейін қайтадан тоқтайсыз. Сіз айналаңызды іздеп, екі жаңа кесіртке түрін табасыз, біреуінің артқы жағында көк дақтары бар (В түрі), екіншісі қызыл жолақтары бар (С түрі), бірақ А түрі еш жерде байқалмайды. Ол жойылып кетті ме? Сіз өзіңіздің осы бес миллион жылдағы цифрлық жазбаңызға қарап, А түрінің екі топқа бөлінгенін, уақыт өте келе бір-бірінен ерекшеленетінін білесіз. Эволюциялық тұрғыдан алғанда А түрі ата (ата 1) және В және С түрлері оның ұрпақтары болып табылады. Бүгінге қарай ілгерілеп (көруге болатын сандық материал көп) және сіз кесірткенің үш түрін табасыз: сіздің ескі досыңыз көк дақты кесіртке (В түрі) және екі жаңа кесіртке (С түрінің ұрпақтары, қызыл жолақты кесіртке), біреуі көк түсті жолақтар (D түрі) және екіншісі қатты қара арқасы бар (Е түрі). Бүгінгі таңда кесірткелердің үш түрі ғана тірі. Сіз енді ата-бабалардың ешқайсысын (қызыл дақты және қызыл жолақты кесірткелерді) көрмейсіз, бірақ біз оларды әлі де филогенетикалық ағашта көрсетеміз.

Ата-бабаларды табу үшін уақытты аралау

«Ата-баба жойылды ма?» деген бастапқы сұрағымызға жауап. осылайша Жоқ! Көп жағдайда ата тегі және ата-бабаның ішінде қамтылған биологиялық (генетикалық) ақпарат ұрпақ түріне беріледі. Уақыт өте келе ұрпақтар бір-бірінен және атадан белгілі бір жағынан өзгеріп, кейбір ортақ нәрселерді сақтай отырып (мысалы, кесірткелердің барлық түрлерінің омыртқасы бар) өзгереді. Бұл эволюция.

Сонымен, шынымен жойылу деп не саналады? Жою - биологиялық ақпараттың жоғалуы - түрдің физикалық жоғалуы. Мысалы, динозаврлардың жеңілдетілген филогенетикалық ағашын қарастырайық (7-сурет). Нүктелі бұтақтардағы барлық топтар жойылып кетті — бұл топтағы түрлердің ешқайсысы бұдан былай бұл планетада жоқ (Юра паркіне қарамастан), бұл барлық мәліметтерді білдіреді. бірегей сол топтардың әрқайсысы жоғалды. Жойылып кетуден аулақ болған жалғыз топ Авес (немесе құстар) болды - құс түрлері - соңғы қалған динозаврлар.

Нақты жойылулар. Нүктелі сызықтармен бейнеленген топтар жойылып кетті, сондықтан әр топқа тән генетикалық, морфологиялық, физиологиялық, экологиялық және мінез-құлық белгілерінің барлығы биосферада жойылды.

Жарайды, ортақ, бірегей таңбаларға (синапоморфиялар) негізделген ата-бабалар мен топтастыру топтары туралы білгенімізді алайық және оны филогенетикалық ағаштағы ақпаратты шешу үшін қолданайық. Мұнда сіз таныс жануарлардың көпшілігін қамтитын омыртқалылардың үлкен тобы Амниотаның тірі мүшелерінің арасындағы қарым-қатынасты бейнелейтін ағаш бар (Cурет 8). Түрлердің немесе түрлердің топтарының атаулары ағаштың бұтақтарының ұштарында жазылғанын бұрыннан білесіз. Сіз білуіңіз керек келесі нәрсе - кейіпкерлер филогенетикалық ағашта шығу нүктесінде бейнеленген. Сонымен, бұл ағашта сіз (1) амниотикалық жұмыртқаның 1-атадан пайда болғанын және оның барлық ұрпақтарына (сүтқоректілер, 2-ата, тасбақалар, 3-ата, 4-ата, қолтырауындар, құстар, 5-ата, туатаралар) берілгенін көруге болады. , және кесірткелер плюс жыландар). Эволюциялық тұрғыдан алғанда, амниотикалық жұмыртқа тек 1-атаға және оның барлық ұрпақтарына ғана ортақ ерекше қасиет (2) тері ақуызының ерекше түрі (β кератин) 2-атадан шыққан және оның барлық ұрпақтарына берілген ( тасбақалар, ата 3, ата 4, қолтырауындар, құстар, ата 5, туатара және кесірткелер плюс жыландар). β кератин – «Рептилия» деп аталатын топпен бөлісетін ерекше қасиет және (3) сынғыш құйрық 5 атадан шыққан және оның барлық ұрпақтарына (туатаралар, кесірткелер және жыландар) берілген. Сынғыш құйрық - туатар + кесіртке + жыландар тобына жататын ерекше қасиет.

Филогенетикалық ағаштағы кейіпкерлерді қалай оқуға болады

Шын мәнінде, әрбір организм мыңдаған белгілерден тұратын күрделі мозаика. Бұған сенбесеңіз, отырыңыз және сізді, сіз жасайтын барлық қасиеттерді тізімдеңіз. Көздің түсі мен шаштың түсі сияқты айқын нәрселерден басқа, сізде РНҚ, ДНҚ, жеке жасушалар, алдыңғы және артқы ұшы, бас сүйек, жақ, сүйек, қолдар мен аяқтардың амниотикалық жасушалардан болатынын ұмытпаңыз. Жұмыртқа, ішкі құлағыңызда үш сүйек бар, сүт бездерінде өндірілген сүтті емізген, бас бармағы қарама-қарсы, құйрығы жоқ. Басқаша айтқанда, филогенетикалық ағашқа қараған кезде, сіз бұтақтардың барлығында кем дегенде бір, ең алдымен, көп таңбалар бар екенін көресіз (9а-суреттегі қиғаш сызық). Осыған байланысты ағаштың барлық белгілерін нақты белгілеу жиі қиын, өйткені ол көзбен алаңдатады. Бұл мәселені шешу үшін стенографиялық әдіс әзірленді: топтар арасындағы қарым-қатынасты көрсететін ағашты сызыңыз (9б-сурет) және кестенің басқа жеріндегі әрбір бұтақ үшін синапоморфияларды тізімдеңіз. Екінші жағынан, егер сізді бір немесе бірнеше ерекше белгілер қызықтырса, оларды филогенетикалық ағашта барлық басқа белгілерді көрсетпей бөлектеуге болады. Мысалы, сүтқоректілердің эволюциясын талқылағыңыз келсе, амниот ағашын көрсетіп, сүтқоректілерге арналған синапоморфияларды ғана бөліп көрсетуге болады (мысалы, үш ортаңғы құлақ сүйектері: 9c-сурет). Есіңізде болсын, бұл жай ғана стенография!

ав Филогенетикалық ағаштағы кейіпкерлерді бейнелеу

Кейіпкерлер туралы түсіну керек соңғы бір нәрсе бар: кейіпкерлер тұрақты заттар емес. Олар уақыт өте келе дамиды. Басқаша айтқанда, «синапоморфия» оған ие барлық түрлерде «бірдей көрінбеуі» мүмкін. Мысалы, ортаңғы құлағыңыздағы дыбыс толқындарын құлақ жарғағынан ішкі құлақтың қабығына тасымалдауға жауап беретін үш сүйектің бірі болып табылатын стаптарды қарастырыңыз. Бұл кішкентай сүйектің ұзақ, күрделі және қызықты эволюциялық тарихы бар. Бұл тарихты түсіну үшін біз Дейтеростомдардың шығу тегіне көп жүздеген миллион жылдарға саяхат жасауымыз керек, бұл үлкен топ, құрамында эхинодермалар (теңіз жұлдыздары және олардың туыстары), гемихордалар (құрт тәрізді, теңіз жануарлары) және хордаталар (құрт тәрізділер). amphioxus + tunicates + Craniata [бас сүйектері бар организмдер]). Бұл үлкен топтың ата-бабасының жұтқыншағында (висцеральды доғалар деп аталатын) сүзгі арқылы қоректенумен айналысатын көптеген саңылаулары болған. Уақыт өте келе доғаларды тірек ететін шеміршекті таяқшалар пайда болды, бөлінді және өзгертілді. Екінші висцеральды доға таяқшасының жоғарғы бөлігі біздің ертегіміздің фокусы болып табылады (Cурет 10). Уақыт өте келе ілгері жылжыған сайын, бұл кейіпкер мәні бойынша әртүрлі құрылымдық және позициялық өзгерістерге ұшырайды, ол үлкенірек, берік болады және жақтарды қолдауға қатысады (бұл кезде ол гиомандибула деп аталады), шеміршектен сүйекке, содан кейін көлемінің бірте-бірте кішіреюі басталады, жақ/щек аймағынан ажырап, ортаңғы құлаққа ауысады (бұл кезде ол степен деп аталады). Жалпы алғанда, 2-ші висцеральды доғаның үстіңгі бөлігі — гиомандибула — степень жүздеген миллион жылдар бойы өзінің пішіні де, қызметі де өзгерген құрылым. Сонымен, «тамақ аймағында табылған 2-ші висцеральды доғада шеміршекті таяқшаның» болуы Краниата үшін синапоморфия болуы мүмкін болса да, сіз төрт аяқты жануарларда бұл нақты құрылымды таба алмайсыз. Оның орнына сіз шеміршекті таяқшаның модификациясын табасыз. Белгілі бір кейіпкердің шығу нүктесінен кейінгі эволюциясын жалғастыру ан деп аталады эволюциялық трансформация қатары.

Синапоморфиялар статикалық емес, олар дами беруі мүмкін. «Екінші висцеральды доғаның жоғарғы бөлігі» [гиомандибула, стаптар] сипатындағы өзгерістер хордалар (нотохордалы жануарлар) үшін филогенетикалық ағашта байқалады. Әңгіме де, филогенетикалық ағаш та кейіпкер эволюциясының ұсақ бөлшектерін емес, кейіпкердің шығу тегі мен модификациясы идеясын баса көрсету үшін айтарлықтай жеңілдетілген. Аттар курсивпен жазылады қазбалардан белгілі жойылып кеткен түрлерге сілтеме. Әр түрлі құрылымдар мен түрлердің сызбалары мен фотосуреттерін интернетте оңай табуға болады

Филогенетика студенттері білуі керек келесі нәрсе - организмдердің әртүрлі топтарын қалай тану керек. Топтардың екі жалпы түрі бар, бірі «жақсы» және екіншісі «жаман».

«Жақсыдан», монофилетикалық топтан бастайық (Cурет 11). «Монофилетикалық» сөзі екі грек сөзінің қосындысы, монос (жалғыз) және фил (тайпа). It was coined by our old friend Ernest Haekel, who, as you remember, also invented the word phylogeny. A monophyletic group includes an ancestor and барлық оның ұрпақтарынан. It is identified by the presence of shared, unique characters (synapomorphies). Each phylogenetic tree contains as many monophyletic groups as there are ancestors. For example, looking at the tree in Fig. 11, we can identify five monophyletic groups, only two of which are shown on Fig. 12 (I’ll leave it up to you to discover the other three).

Identifying monophyletic groups

Two of the five monophyletic groups on the hypothetical tree

Now onto “the bad.” The word “paraphyletic” is, once again, a combination of two Geek words, тармақ (near) and phyle (tribe), so the implication is that the whole tribe is not present (Fig. 13). Paraphyletic groups include an ancestor but бәрі емес оның ұрпақтарынан. On this hypothetical tree, species C has been eliminated from the group, even though it is a descendant of ancestor 1 just like the rest of the species. Paraphyletic groups are problematic because they mislead us about how characters evolve and how species are related to one another. For example, let’s consider the big tree for the Amniota and highlight the “old” Reptilia, one of the most famous paraphyletic groups (Fig. 14). Even today people still speak about three distinct classes, the reptiles, the birds, and the mammals. When you look at this figure, what is wrong about the class Reptilia, the way it is drawn?

Identifying paraphyletic groups

The most famous paraphyletic group, the reptiles

Дұрыс! In (Fig. 15) Ancestor 2 is the ancestor of all the reptiles but, as highlighted on this figure, the Reptilia does not include all of ancestor 2’s descendants ancestor 4 and the birds have been removed from the group. The only way to make the Reptilia a monophyletic group is to redefine the term to include crocodiles, turtles, tuataras, lizards, snakes, және құстар. In the past, birds were not considered to be reptiles because they are warm-blooded (in fact, they were often grouped with mammals because of that trait). But phylogenetic studies have demonstrated that birds are indeed reptiles because they share many morphological, behavioral, and molecular characters with other reptilian species in general (synapomorphies originating in ancestor 2 e.g., β keratin), және they share many characters with crocodiles in particular (synapomorphies originating in ancestor 4 e.g., holes in the skull just in front of the eyes).

How to make the Reptilia monophyletic

Why is it important to have monophyletic groups? Say you wanted to figure out how red hair appeared in your family. What would be your chances of tracking down your original red-haired ancestor if no records were kept about the union between your great-great-great-great grandfather Sven and his Irish bride Maggie? Missing information creates problems for any research, be it genealogical or evolutionary, and paraphyletic groups are missing information. In evolutionary terms, monophyletic groups are “real” biological units that is, they are the product of descent with modification (an ancestor and all of its descendants) and as such can be used to study the evolutionary processes that produced them. Paraphyletic groups, on the other hand, are the product of “human error” arising from incomplete or flawed information (e.g., poor descriptions of characters). Using such groups to study evolutionary processes will direct us along misleading and confusing pathways.

Why do we use phylogenetic trees? There are many ways to answer this question (and many papers/books written about it), but the most general answer is that trees summarize valuable information about the evolution of organisms that allows us to understand them better. For example, here’s the family tree for the Hominoidea, the group that includes us and all of our closest relatives (Fig. 16). When you look at the distribution of characters on this tree you can see that a number of traits we associate only with human beings, such as hunting, infanticide, tool making, self-awareness, and language, originated long before Гомо сапиенс. In other words, human beings are not as unique as you might think. If we want to understand how and why those traits evolved, we must study their expression and function in ourselves and in our relatives. So much information from just one phylogenetic tree!


Phylogenetic Trees Tutorial

Investigate the evolutionary origins of HIV

Ескерту: To complete the tutorial with the referenced data please download the tutorial above and install in Geneious Prime.

In this tutorial, you will use Geneious Prime to investigate the evolutionary origins of human immunodeficiency viruses (HIVs) using molecular phylogenetic tools. You will learn how to align sequences and build a phylogenetic tree, as well as how to view and manipulate the tree to answer questions on the origins of HIV-1.

Introduction: Human and Simian Immunodeficiency Viruses

HIVs, the causes of acquired immune deficiency syndrome (AIDS), are closely related to simian (monkey and ape) immunodeficiency viruses (SIVs). These and other similar viruses are retroviruses. Retroviruses are characterised by their RNA genomes, which once inside a host cell, are reverse transcribed into DNA and then integrated into the host cell’s genome. The integrated viral genome is known as a provirus. You will be working with proviral DNA sequences.

The origins of HIVs were mysterious when these viruses were first discovered in the early 1980s. There are two types of HIVs. HIV type 1 (HIV-1) is more widespread and causes more severe disease than HIV type 2 (HIV-2). HIV-1 is also far more diverse than HIV-2. HIV-1 is classified into three major groups: M, N, and O. The viruses causing the AIDS pandemic (widespread epidemic) belong to Group M. Group M is subdivided into several subtypes. You will be analysing sequences from HIV-1 Group M Subtypes A, B, C, D, F, G, H, J, K. The HIV-1 viruses infecting people in North America, Europe and Australia are mostly from Group M Subtype B. All groups and subtypes of HIV-1 and HIV-2 are found in Africa.

Both HIV-1 and HIV-2 are closely related to SIVs found in a variety of African primate species. This lead early on to researchers hypothesising that HIVs had jumped to humans from one or more African primate species. It was suggested that close contact between humans and monkeys that were kept as pets or hunted for food had allowed the SIVs to jump hosts.

More information on HIV can be found on this Wikipedia page.

In this tutorial you will use molecular phylogenetics to determine the evolutionary relationships of HIVs and SIVs, and so determine from which African primates HIVs originated. жылы 1-жаттығу you will build an alignment of the HIV and SIV sequences, then in 2-жаттығу you will learn to build a basic phylogenetic tree. Exercises 3 and 4 provide questions and answers to further your understanding on interpreting phylogenetic trees.

SIV sequences and primate taxa

The sequences in this tutorial come from various African primate species known to be infected with different SIVs. There are also three non-African species, all from Asia, that have been infected with SIVs in captivity: the pig-tailed macaque, the rhesus macaque and the stump-tailed macaque. The SIVs from all of these primate species are referred to by the three-letter code given with each picture. For example, the SIV from the sooty mangabey is called SIVSMM and the sequence in the alignment or tree is labelled SIV-SMM.

Mona monkey
Cercopithecus mona mona [denti]
MON [DEN]

de Brazza’s monkey
Cercopithecus neglectus
DEB

Tantalus monkey
Chlorocebus tantalus
TAN

Syke’s monkey
Cercopithecus albogularis
SYK

Greater spot-nosed monkey
Cercopithecus nictitans
GSN

Green monkey
Chlorocebus sabaeus
SAB

Mustached guenon
Cercopithecus cephus
MUS

Vervet monkey
Chlorocebus pygerythrus
VER

Grivet
Chlorocebus aethiops
GRV

L’Hoest’s monkey
Cercopithecus lhoest
LST

Sooty mangabey
Cercocebus atys
SMM

Red-capped mangabey
Cercocebus torquatus
RCM

Sun-tailed monkey
Cercopithecus solatus
КҮН

Mandrill
Mandrillu sphinx
MND

Бұрғылау
Mandrillus leucophaeus
DRL

Pig-tailed macaque
Macaca nemestrina
MNE

Stump-tailed macaque
Macaca arctoides
STM

Rhesus macaque
Macaca mulatta
MAC

Common chimpanzee
Пан троглодиттер
CPZ

Exercise 1: Multiple alignment of HIV and SIV sequences

Before a phylogeny can be constructed, the sequences must be aligned. The objective of sequence alignment is to maximize the similarity between sequences, inserting gaps in sequences where necessary to improve the overall alignment.

Multiple alignment algorithms use a scoring system where sequence matches and mismatches for each site are assigned a value, and gaps are penalized. The insertion of gaps in an alignment can increase the similarity of the surrounding bases, so the overall alignment score is a trade-off between the increased match/mismatches scores and the cost of opening and extending a gap.

In this exercise you will construct an alignment of 62 конв sequences of HIV-1, HIV-2, and various SIVs. The SIV sequences come from various African and non-African primate species.

The конв gene is found in all retroviruses. It codes for two viral envelope glycoproteins that are positioned on the virion surface and interact with host cell-surface receptors.

Click on ‘HIV_sequences’ to view the sequences.

The sequences are labelled in the format: virus type followed by the common name of the primate species for the SIV sequences, or the group or subtype for HIV-1 and HIV-2 sequences finally followed by the accession number.

To align these sequences, go to Align/Assemble -> Multiple Align. Geneious has 3 different alignment programs built in (Geneious aligner, MUSCLE, and Clustal Omega), plus a plugin for the MAFFT aligner is available. For further information on these aligners please see this article. We will use the MUSCLE aligner for this example, as it is suitable for a medium sized dataset.

таңдаңыз MUSCLE alignment from the alignment options. We will use the default parameters, so click on the settings cog in the bottom left of the window and choose Reset to defaults (if it is greyed out, the default parameters are already set). түймесін басыңыз More Options button to view the parameters if you wish. басыңыз ЖАРАЙДЫ МА to start the alignment – it may take several minutes to complete.

Once the alignment has completed, click on it to view it and zoom in to see the bases. Note that there are many large gaps, which is characteristic of an alignment of a rapidly evolving gene in divergent species.

Exercise 2: Build a Phylogeny of HIVs and SIVs

In this exercise you will construct a phylogeny using the Neighbour-Joining tree building method and the Tamura-Nei үлгі. Models of evolution describe expected frequencies of each nucleotide and the rate of change between nucleotides. The Tamura-Nei model assumes each base has a different equilibrium frequency and allows transitions and transversions to occur at different rates. It allows the two types of transitions (A ↔ G and C ↔ T) to have different rates. This is useful when analysing HIV sequences because HIV exhibits hyper G-to-A mutation caused by a host enzyme (APOBEC3G). You will use the Neighbour-Joining method because these sequences do not, in general, evolve in a clock-like manner.

Select the alignment you created in Exercise 1.

To construct a Neighbour-Joining tree using the Tamura-Nei model, with bootstrapping, click the Tree button and select the Geneious Tree Builder. Check that the default parameters are initially set by clicking Reset to Defaults.

For the genetic distance model select Tamura-Nei and for the tree build method select Neighbor-Joining. Set the outgroup to “SIV-MON Mona monkey AY340701”. This sequence will be used to root the tree.

To calculate support values for the tree use bootstrapping. To do this, tick the box next to Resample tree және таңдаңыз Bootstrap in the dropdown box next to resampling method. Set number of replicates to 100 and the support threshold to 0.

The tree building options should now look similar to this:

басыңыз ЖАРАЙДЫ МА to build the tree.

Once the tree builder completes, the tree document will appear in the document table in Geneious and should open automatically.

Viewing and Manipulating Phylogenetic Trees

A phylogenetic tree is a branching diagram of evolutionary relationships. It contains information about the order of evolutionary divergences within, and hence about the relationships among, a group of organisms. It can also contain information about the amount of evolutionary change which occurred between any two branching events. The lines on the the tree are called branches and the intersections of these lines are called nodes. A node represents a branching event in the tree. The branching pattern of a tree is called its topology. The topology shows how organisms are related to one another.

Depending on the size of your screen and the size of the tree, it may not be physically possible to display all of the sequence names on the tree, so Geneious will only display some of the sequence names. To zoom in on the tree, use the Масштабтау slider under “General” in the panel on the right hand side of the tree view. To expand the distance between the branches of the tree, use the Кеңейту slider. As the amount of space between the branches increases, more sequence names will be displayed on the tree.

As this tree was created using an alignment in Geneious, the alignment is attached to the tree. Click on the “Alignment View” tab to view the alignment.

The sequences in the alignment are sorted according to the topology of the tree. On the left hand side of the sequence names, you can see the tree topology (this may not be visible if you are working with large trees). Select the “SIV-MON Mona monkey AY340701” sequence in the alignment then return to the “Tree View”. This sequence is now selected in the tree as well.

The sequences used to build this alignment and tree have additional meta-data associated with them (this is the data found in the “Properties” field in the “Info” tab in the individual sequence documents). This information can be displayed on the tips of the trees. To display the organism on the tips of the tree, select “Organism” from the box next to “Display” under “Show Tip Labels”.

To display the organism and host organism, hold Ctrl (on Windows) or Cmd (on Macs) and select “Organism” and “Host Organism”. Now the host organism and organism are displayed on the tips of the tree, separated by a comma. To display the sequence names on the tree, select “Names”.

Just as a sentence can be printed using different fonts, or colors of ink, without any change in meaning, so too can trees be represented in different shapes and orientations. The information encoded in the tree remains unchanged, even as the appearance changes. For example, the appearance of the tree can be changed by rotating groups of branches. To rotate the branches, select an internal node in the tree and click the Swap Siblings button at the top of the window. This will rotate the branches in that subtree however, the degree of relatedness is not altered by rotating branches in a tree. Simply having two names close together in a tree does not imply any close relationship.

Try this with the tree you have created. Select the node in the tree containing the Grivet monkey and the four Vervet monkeys and click the Swap Siblings түймесі.

The order of these samples will change in the tree, but the relationship between the sample from the Grivet monkey and those from the four Vervet monkeys has not changed.

Rooted Trees

Trees may be unrooted or rooted. To view the HIV tree as an unrooted tree, click one of the unrooted views under the “General” options in the panel on the right hand side of the tree view.

Unrooted trees do not tell us much about evolutionary relationships. We cannot tell which node is the ancestor and which are the descendent nodes on the tree. To establish ancestor-descendent relationships we need to identify a suitable outgroup and then root the tree on the branch separating the outgroup from the remainder of the tree (the ingroup). We can specify the root before the building the tree to produce a rooted tree, or we can specify the root after the tree is built to change an unrooted tree to a rooted tree.

When you built the tree of HIV and SIV sequences you specified an outgroup (“SIV-MON Mona monkey AY340701”) so Geneious has produced a rooted tree. To view the tree as a rooted tree, click the rooted view under the “General” options in the panel on the right hand side of the tree view.

Rooted phylogenetic trees may be oriented horizontally, as above, or vertically. Here the time axis is implicit, running from left to right. The node at the left end of the tree is the root node, which represents the oldest point on the tree. As we move from the root node, we can identify nodes which are ancestral to their descendent clades. Working in from the tips of the tree enables us to identify close and distant relatives. The degree of relatedness of any two organisms is given by how far back on a rooted tree you must go to find their common ancestor. If, in tracing back to the common ancestor of A and B, you pass the common ancestor of A and C, then you can say that A and C are more closely related than A and B.

On a rooted tree, each node and all of its descendent nodes form a clade. This is what we would commonly refer to as a “branch” on a real tree – the physical branch and all the little branches and leaves attached to it. Because an unrooted tree lacks the time axis described above, it is inappropriate to discuss clades in that context.

Phylograms and cladograms

The lengths of the branches of a tree may be arbitrary (eg. cladogram) or can represent the amount of the evolutionary change (phylogram).

In a phylogram, the lengths of the branches are proportional to the amount of change which occurred between those branching events. As the tree you built was estimated using a distance (1 – similarity) measure (i.e. NJ), the proximity of nodes represents their overall degree of similarity.

To display the lengths of the branches of the tree, in the panel on the right hand side of the tree view, select “Substitutions per site” from the dropdown box next to “Display” under “Show Branch Labels”.

On your tree, find “SIV-MAC Rhesus macaque M33262” and “SIV-MNE Pig-tailed macaque U79412” and look at the length of the branches separating these two taxa. Now find “SIV-RCM Red-capped mangabey AF382829” and “SIV-RCM Red-capped mangabey AF349680” and look at the length of these branches. The length of the branches separating the SIV-MAC and SIV-MNE sequences is shorter than the length of the branches separating the two SIV-RCM sequences. From this you can conclude that SIV-MAC is more similar to SIV-MNE, than the two SIV-RCM sequences are to each other.

If an optimality method (e.g., MP or ML) was used to estimate the tree then the proximity of two nodes reflects the number of evolutionary changes in character states estimated to have occurred between them. If the total branch length from the root of a tree to organism A at one tip is much greater than from the root to organism B at another tip, then you can say that evolution has been faster in the A lineage than in the B lineage for the characters on which the tree was based.

To transform the tree to a cladogram, tick the Transform branches box in the “Formatting” options. In the dropdown box next to Трансформация таңдаңыз Cladogram

Notice how the branch lengths of the tree change and all of the tips of the tree are aligned on the right hand side of the tree view. With this transformation the lengths of the branches are meaningless. If you now look at “SIV-MAC Rhesus macaque M33262” and “SIV-MNE Pig-tailed macaque U79412” and then look at “SIV-RCM Red-capped mangabey AF349680” and “SIV-RCM Red-capped mangabey AF382829” you can see that the branch lengths separating SIV-MAC from SIV-MNE are the same lengths as the branches separating the two SIV-RCM sequences. With the transformed branches you can not draw any conclusions about how similar the sequences are to each other.

To convert the tree back to a phylogram, untick the option Transform branches. To hide the branch lengths, untick the box next to “Show Branch Labels”.

Displaying support values

In addition to the information conveyed by the topology of the tree and the branch lengths of the tree, further information can also be written on the nodes and/or branches of the tree. The information that is available to display will depend on the tree building method and the options used. Often, support values are displayed on the tree.

Tree building methods produce the tree which best explains the information in the alignment however, it is unlikely this tree will explain all of the variation in the alignment. Not all of the sites in the alignment will support this tree and not all of the clades in the tree will necessarily be strongly supported by the alignment. For example, with rapid speciation events, there may be insufficient information in the alignment to determine the branching pattern of a group of species, and some of the clades in the tree may have only marginally more support than alternative possible clades.

If you look at the tree you have built it is difficult to tell which clades are strongly supported and which are not. For example, does the clade containing “SIV-RCM Red-capped mangabey AF382829” and “SIV-RCM Red-capped mangabey AF349680” have the same support from the alignment as the clade containing “SIV-MND Mandrill AY159322” and “SIV-MND Mandrill AF367411”?

To find out how strongly the alignment supports each of the clades in the tree, we can calculate support values. In the tree building options you selected the “Bootstrap” resampling method. The bootstrap statistic for a clade in the tree is the percentage of times that clade appeared in the set of bootstrap replicate trees. This percentage ranges from 0% (the clade did not appear in any of the bootstrap trees) to 100% (the clade appeared in all of the bootstrap trees). A bootstrap replicate tree is generated by randomly sampling sites, with replacement, from the alignment, to create a new randomised alignment and then building a tree from this sampled alignment. This process is repeated for the specified number of bootstrap replicates (in your case, this was 100).

To show the bootstrap values on the tree, tick the box next to Show Branch Labels және таңдаңыз Consensus Support (%) from the dropdown box next to “Display”.

The bootstrap value for a clade will appears to the left of the most recent common ancestral node for that clade.

Now the bootstrap values are displayed on the tree, you can see that there is strong support (100%) for the clade containing the SIV-RCM sequences. However the clade containing the two mandrill sequences has less support (55%). Note that due to the nature of the bootstrapping process, the support values on your tree may be slightly different.

Sometimes it is useful to collapse nodes that have little bootstrap support so that these do not contribute to the topology of the tree. This can be done in the bootstrapping options when the tree is built by changing the Support threshold мән. If this is set on 50%, nodes with bootstrap support of less than 50% will be collapsed into polytomies. The screenshot below shows an example where the nodes with 38% and 36% bootstrap support in (A) are collapsed when the support threshold is set to 50% (B).


PHYLOGENETIC TREE CONSTRUCTION NOTES

A speculatively rooted tree for rRNA genes, showing the three life domains Bacteria, Archaea, and Eucaryota, and linking the three branches of living organisms to the LUCA (the black trunk at the bottom of the tree) cf. next graphic.

A rooted phylogenetic tree, illustrating how Eukaryota and Archaea are more closely related to each other than to Bacteria (based on Cavalier-Smith‘s theory of bacterial evolution). Neomura is a clade composed of two life domains, Archaea and Eukaryota. LUCA, a variant of LUA, stands for last universal common ancestor.

А филогенетикалық ағаш немесе evolutionary tree is a branching diagram or “tree” showing the inferred evolutionary relationships among various biological species or other entities—their филогенез—based upon similarities and differences in their physical or genetic characteristics. The taxa joined together in the tree are implied to have descended from a common ancestor. Phylogenetic trees are central to the field of phylogenetics.

Ішінде тамырлы phylogenetic tree, each node with descendants represents the inferred most recent common ancestor of the descendants, and the edge lengths in some trees may be interpreted as time estimates. Each node is called a taxonomic unit. Internal nodes are generally called hypothetical taxonomic units, as they cannot be directly observed. Trees are useful in fields of biology such as bioinformatics, systematics, and phylogenetic comparative methods.

Unrooted trees illustrate only the relatedness of the leaf nodes and do not require the ancestral root to be known or inferred.

The idea of a “tree of life” arose from ancient notions of a ladder-like progression from lower to higher forms of life (such as in the Great Chain of Being). Early representations of “branching” phylogenetic trees include a “paleontological chart” showing the geological relationships among plants and animals in the book Elementary Geology, by Edward Hitchcock (first edition: 1840).

Charles Darwin (1859) also produced one of the first illustrations and crucially popularized the notion of an evolutionary “tree” in his seminal book Түрлердің шығу тегі. Over a century later, evolutionary biologists still use tree diagrams to depict evolution because such diagrams effectively convey the concept that speciation occurs through the adaptive and semirandom splitting of lineages. Over time, species classification has become less static and more dynamic.

Rooted tree

A rooted phylogenetic tree (see two graphics at top) is a directed tree with a unique node corresponding to the (usually imputed) most recent common ancestor of all the entities at the leaves of the tree. The most common method for rooting trees is the use of an uncontroversial outgroup—close enough to allow inference from trait data or molecular sequencing, but far enough to be a clear outgroup.

Unrooted tree

An unrooted phylogenetic tree for myosin, a superfamily of proteins. [1]

Unrooted trees illustrate the relatedness of the leaf nodes without making assumptions about ancestry. They do not require the ancestral root to be known or inferred. [2] Unrooted trees can always be generated from rooted ones by simply omitting the root. By contrast, inferring the root of an unrooted tree requires some means of identifying ancestry. This is normally done by including an outgroup in the input data so that the root is necessarily between the outgroup and the rest of the taxa in the tree, or by introducing additional assumptions about the relative rates of evolution on each branch, such as an application of the molecular clock hypothesis. [3]

Bifurcating tree

Both rooted and unrooted phylogenetic trees can be either bifurcating or multifurcating, and either labeled or unlabeled. A rooted bifurcating tree has exactly two descendants arising from each interior node (that is, it forms a binary tree), and an unrooted bifurcating tree takes the form of an unrooted binary tree, a free tree with exactly three neighbors at each internal node. In contrast, a rooted multifurcating tree may have more than two children at some nodes and an unrooted multifurcating tree may have more than three neighbors at some nodes. A labeled tree has specific values assigned to its leaves, while an unlabeled tree, sometimes called a tree shape, defines a topology only. The number of possible trees for a given number of leaf nodes depends on the specific type of tree, but there are always more multifurcating than bifurcating trees, more labeled than unlabeled trees, and more rooted than unrooted trees. The last distinction is the most biologically relevant it arises because there are many places on an unrooted tree to put the root. For labeled bifurcating trees, there are:

total unrooted trees, where n represents the number of leaf nodes. Among labeled bifurcating trees, the number of unrooted trees with n leaves is equal to the number of rooted trees with n − 1 leaves. [4]

Special tree types

This section болмайды сілтеме жасау кез келген көздері. Please help improve this section by adding citations to reliable sources. Unsourced material may be challenged and removed. (October 2012) (Learn how and when to remove this template message)

A spindle diagram, showing the evolution of the vertebrates at class level, width of spindles indicating number of families. Spindle diagrams are often used in evolutionary taxonomy.

A highly resolved, automatically generated tree of life, based on completely sequenced genomes. [5] [6]

  • A dendrogram is a broad term for the diagrammatic representation of a phylogenetic tree.
  • A cladogram is a phylogenetic tree formed using cladistic methods. This type of tree only represents a branching pattern i.e., its branch spans do not represent time or relative amount of character change.
  • A phylogram is a phylogenetic tree that has branch spans proportional to the amount of character change.
  • A chronogram is a phylogenetic tree that explicitly represents evolutionary time through its branch spans.
  • A spindle diagram (often called a Romerogram after the American palaeontologist Alfred Romer) is the representation of the evolution and abundance of the various taxa through time.
  • A Dahlgrenogram is a diagram representing a cross section of a phylogenetic tree
  • A phylogenetic network is not strictly speaking a tree, but rather a more general graph, or a directed acyclic graph in the case of rooted networks. They are used to overcome some of the limitations inherent to trees.

Құрылыс

Phylogenetic trees composed with a nontrivial number of input sequences are constructed using computational phylogenetics methods. Distance-matrix methods such as neighbor-joining or UPGMA, which calculate genetic distance from multiple sequence alignments, are simplest to implement, but do not invoke an evolutionary model. Many sequence alignment methods such as ClustalW also create trees by using the simpler algorithms (i.e. those based on distance) of tree construction. Maximum parsimony is another simple method of estimating phylogenetic trees, but implies an implicit model of evolution (i.e. parsimony). More advanced methods use the optimality criterion of maximum likelihood, often within a Bayesian Framework, and apply an explicit model of evolution to phylogenetic tree estimation. [4] Identifying the optimal tree using many of these techniques is NP-hard, [4] so heuristic search and optimization methods are used in combination with tree-scoring functions to identify a reasonably good tree that fits the data.

Tree-building methods can be assessed on the basis of several criteria: [7]

  • efficiency (how long does it take to compute the answer, how much memory does it need?)
  • power (does it make good use of the data, or is information being wasted?)
  • consistency (will it converge on the same answer repeatedly, if each time given different data for the same model problem?)
  • robustness (does it cope well with violations of the assumptions of the underlying model?)
  • falsifiability (does it alert us when it is not good to use, i.e. when assumptions are violated?)

Tree-building techniques have also gained the attention of mathematicians. Trees can also be built using T-theory. [8]

Although phylogenetic trees produced on the basis of sequenced genes or genomic data in different species can provide evolutionary insight, they have important limitations. Most importantly, they do not necessarily accurately represent the evolutionary history of the included taxa. In fact, they are literally scientific hypotheses, subject to falsification by further study (e.g., gathering of additional data, analyzing the existing data with improved methods). The data on which they are based is noisy the analysis can be confounded by genetic recombination, [9] horizontal gene transfer, [10] hybridisation between species that were not nearest neighbors on the tree before hybridisation takes place, convergent evolution, and conserved sequences.

Also, there are problems in basing the analysis on a single type of character, such as a single gene or protein or only on morphological analysis, because such trees constructed from another unrelated data source often differ from the first, and therefore great care is needed in inferring phylogenetic relationships among species. This is most true of genetic material that is subject to lateral gene transfer and recombination, where different haplotype blocks can have different histories. In general, the output tree of a phylogenetic analysis is an estimate of the character’s phylogeny (i.e. a gene tree) and not the phylogeny of the taxa (i.e. species tree) from which these characters were sampled, though ideally, both should be very close. For this reason, serious phylogenetic studies generally use a combination of genes that come from different genomic sources (e.g., from mitochondrial or plastid vs. nuclear genomes), or genes that would be expected to evolve under different selective regimes, so that homoplasy (false homology) would be unlikely to result from natural selection.

When extinct species are included in a tree, they are terminal nodes, as it is unlikely that they are direct ancestors of any extant species. Skepticism might be applied when extinct species are included in trees that are wholly or partly based on DNA sequence data, because little useful “ancient DNA” is preserved for longer than 100,000 years, and except in the most unusual circumstances no DNA sequences long enough for use in phylogenetic analyses have yet been recovered from material over 1 million years old.

The range of useful DNA materials has expanded with advances in extraction and sequencing technologies. Development of technologies able to infer sequences from smaller fragments, or from spatial patterns of DNA degradation products, would further expand the range of DNA considered useful.

In some organisms, endosymbionts have an independent genetic history from the host.

Phylogenetic networks are used when bifurcating trees are not suitable, due to these complications which suggest a more reticulate evolutionary history of the organisms sampled.


Rooting

Evolutionary trees are (almost) always starting with an ancestor and then dividing, so you can always identify the root (if there is one) as the point where all the branches converge. Historically, it was drawn at the bottom like a real tree (as with the great Molluscan tree in OUMNH and the OneZoom Tree of Life Explorer). These days, it is usually drawn on the left as in these diagrams but I have seen trees with the root at the top, bottom or even on the right. (The latter is usually only used when mirroring another tree.) I have posted before on how to root a phylogenetic tree, so I won't go over that again here. The rooting method керек be given in the methods but, when it is missing, you can often guess from the shape of the tree and using the root-to-tip branch lengths again:
Unrooted trees are pretty obvious when shown in the "radiation" style. If the tree is rooted, it is almost certainly either midpoint rooted or outgroup rooted (see "how to root a phylogenetic tree"). Midpoint rooting can be identified by virtue of the fact that the two longest root-to-tip distances will (a) be the same length and (b) be either side of the root. If either of these conditions is broken, it is not midpoint rooted and is probably outgroup rooted. (Note that if both conditions болып табылады met, it is still possible that the tree is outgroup rooted. Indeed, if the evolutionary rates are fairly consistent, outgroup rooting and midpoint rooting should be the same.)

Ideally, a rooted tree should have the root marked. Sometimes, however, it is left off, as in the bottom left. This can be confusing as tree visualising programs will often display trees in the "traditional" style even when they are not rooted. This is particularly a problem when branch lengths are емес shown as it will not be at all obvious when the tree is rooted or not. The time that I see this catch people out most is when making a Maximum Parsimony tree using the popular software, MEGA - these trees are displayed randomly rooted and without branch lengths by default.


Phylogenetic Tools for Comparative Biology

пайдалану function drop.tip() we can easily excise a single taxon or a list of taxa from our "phylo" tree object in R. However, it is not immediately obvious how to prune the tree to қамтиды, rather than exclude, a specific list of tips. Trina Roberts (now at NESCent) shared a trick to do this with me some time ago, and I thought I'd pass it along to the readers of this blog.

First, let's start with a tree of 10 species:

> tree write.tree(tree)
[1] "(t8:0.22,((((t3:0.9,(t7:0.48,t2:0.5):0.12):0.47,t6:0.55):0.08,(t5:0.49,(t9:0.71,t10:0.13):0.15):0.7):0.87,(t1:0.72,t4:0.62):0.55):0.47)"

Now, say we want to keep the species t2 , t4 , t6 , t8 , and t10 in our pruned tree, we just put these tip names into a vector:

[More commonly, this vector will probably come from the row names in our data matrix, or we might read it from a text file.]

We create the pruned tree with one command:

Now we have our pruned tree, as desired:

28 comments:

If there are tips in the "species" vector that are not in the tree, match(species,tree$tip.label) will one or mulitple NAs, and the procedure will fail. To avoid this problem, one can just do:
> pruned.tree<-drop.tip(tree, tree$tip.label[-na.omit(match(species, tree$tip.label))])

Even less code than the -match trick:

pruned.tree<-drop.tip(tree, setdiff(tree$tip.label, species))

setdiff is very handy. (as is intersect and %in%)

Dan's method will also work even if some of the labels in "species" are not in "tree."


Бейнені қараңыз: Ағаштар жайлы қызықты деректер (Ақпан 2023).