Ақпарат

Ең кіші ағаш бізге эволюциялық ата -бабалар туралы пайдалы нәрсені айтады ма?

Ең кіші ағаш бізге эволюциялық ата -бабалар туралы пайдалы нәрсені айтады ма?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Сұрақ қызығушылықтың болмауына байланысты биоақпараттық стек -алмасудан көшірілді.

Мен биоинформатикаға жаңадан таныспын және биоинформатика кітабын оқып шықтым, филогенетикалық ағашты есептеу өте күрделі процесс сияқты.

Ұқсастық матрицасынан минималды созылатын ағашты (MST) жасау нақты филогенетикалық ағашқа лайықты жуықтауды қамтамасыз ете ме, яғни организмдер жинағының эволюциялық шығу тегі туралы кейбір ақпаратты бере ме деп ойлаймын? Менің ойымша, ежелгі ата -бабадан алыстаған жануарлар әрқашан жақында бөлінген жануарларға қарағанда қашықта болады, сондықтан МСТ кем дегенде қандай жануарлардың генетикалық туыстас және генетикалық алыс екенін көрсетеді.

Мен мұның филогенетикалық ағашпен бірдей нәрсе емес екенін түсінемін, бірақ бұл маған филогенетикалық ағаш беретін мәліметтердің кейбірін беретін сияқты, атап айтқанда, қандай жануарлар генетикалық тұрғыдан тығыз байланысты және қайсысы алыс туыстар.

Анықтама үшін мен қалыпты қысу қашықтығы (NCD) метрикасына негізделген ұқсастықты өлшеп жатырмын. Метрика Cilibrasi мен Vitanyi ұсынған «Қысу арқылы кластерлеу» бөлімінде анықталған.

Міне, сілтеме жасалған қағаздағы деректер жиынтығын қолданатын MST мысалы. Кейбір бөліктер приматтардың шоғырлануы сияқты биология туралы қарапайым білімімнен мағынасы бар. Басқа бөліктер мен үшін жаңа, және мен қарым-қатынастар метриканың, MST-тің кездейсоқ мүмкіндігі немесе шынайы ма екеніне сенімді емеспін. Мысалы, сиырлар MST бойынша жылқылардың орнына киттерге көбірек туысты, мысықтар мен иттер итбалықтардан немесе керісінше дамыған сияқты, ал шошқалар жануарлардың алуан түріне жатады: жарқанаттардан қояндарға дейін киттерге дейін.

Есіңізде болсын, «рандген» түйіндері кездейсоқ құрылған ДНҚ тізбегі болып табылады, мен оларды ақыл-ойды тексеру ретінде деректер жиынына қосқанмын. Күтілгендей, олар нақты жануарлардың ДНҚ тізбегінің популяциясына араласудың орнына, өз бетінше тармақта орналасқан. Олардың кластерленген себебі, мен сигналды күшейту үшін әрбір ДНҚ тізбегін 40 рет қайталаймын және қайталанатын қысқа кездейсоқ қосалқы тізбектер қысылатын болады. Кездейсоқ ДНҚ тізбегі кластерленген болуы мүмкін, себебі олар кездейсоқ ішкі тізбектерді бөлісуге бейім, ал сүтқоректілердің ДНҚ тізбегі реттелген және кездейсоқ қосалқы реттіліктері аз болады.

Міне, ағашты жаңғырту репо. https://github.com/yters/ncd


Сіздің графикада ағаштар мен филогенез үшін қажет ағаш түйіндері, тармақталу нүктелері жоқ.

Деректер файлын оқығанда жақшаларды санау керек ((())), себебі олар ағаштың түйіндері, ортақ аталары бар жерді білдіреді.

Ұқсастық үшін күрделі деректер жинауды бастамас бұрын, қарапайым филогения ағаштарын жасау керек. Есімдері латынша? генетикалық қашықтық сандары бар ма? Сіз қандай формат пен деректерді пайдаланасыз? Сіз жануарлардың жалпы атауларын бердіңіз. Сізге «жолбарысты» іздеуге қабілетті болу үшін қарапайым және латын атауларының дерекқорын қолдану қажет болуы мүмкін ... бұл мәліметтер базасы «панель тигрін» қайтарады ... Содан кейін сіз жануарларды іздеу үшін ағаш бұтақтарының үстімен және төмен қарай жылжуды бастай аласыз. Тигр тигрімен байланысты жақшаларды санау және осы атауға жақын түрлерді белгілеу арқылы.

Ағаштың 5000 жануарға жарылуын болдырмау үшін 1/іздеу тереңдігін анықтауға болады. Тереңдігі 5, Бес, жақшадан аспайды: ) 3/деректерді өндіруге негізделген кейбір жануарларды таңдау үшін статистикалық шараларды қолданыңыз.

Егер сіз киттерден маймылдарға саяхат жасағыңыз келсе, сізде сүтқоректілер отбасының көп бөлігі болады, сіз түйіндер мен жақшаларды ондаған санай аласыз.

5000 түрді талдаудың үлкен есептік жүктемесі бар, ол 40 рет айтпағанда, бір рет оқу үшін 1 сағатты алады.

Ұқсастықты, жақшалар санын/генетикалық қашықтық сандарын өлшеу үшін қандай статистиканы пайдалансаңыз да, сіз бір кездері ағаштарды бұтақтар, түйіндер және жапырақтар ретінде көрсетуіңіз керек, өйткені ағаш деректері дәл осылай көрсетуге арналған.

Мен сізге ағашты түйіндер мен кездейсоқ іріктеу арқылы салуды ұсынамын, мысалы, жануардың соңғы ағашқа түсу мүмкіндігі 1%. Егер сіздің ағашыңызда бұтақтар болса және олар OK сызып жатса, MST / MCD кешенді таңдау үшін 1% таңдау жолын өзгертіңіз.


Бейнені қараңыз: АҒАШТЫҢ 5 ПАЙДАСЫ (Желтоқсан 2022).