Ақпарат

(Жаңартылған сұрақ) Абсолютті деректермен салыстырғанда орташа бүктеуді өзгерту мәселесі (qPCR бойынша)

(Жаңартылған сұрақ) Абсолютті деректермен салыстырғанда орташа бүктеуді өзгерту мәселесі (qPCR бойынша)


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Төмендегі мәселе бойынша мен статистиканы білемін, бірақ төмендегілерді біле алмаймын:

Биологияда ген экспрессиясын немесе негізінен мРНҚ көшірмелерінің санын өлшеу үшін qPCR қолданамыз. Ол мұны шекті мәнге жету үшін күшейтудің қанша циклін (2^) санау арқылы жасайды. Барлығын жеңілдету үшін 1024 көшірмеге 10 цикл (2^10) қажет болады деп есептейік. Егер көшірмелер көп болса, шекті мәнге жету үшін цикл азырақ болады, сондықтан 2024 көшірмеге 9 цикл, 512 көшірме 11 цикл және т.б. алады... Енді келесі сценарийді елестетіп көріңіз:

Бізде келесі үлгілер бар:

1 -үлгі. А генінің 1024 көшірмесі және В генінің 4096 көшірмесі 2. Үлгінің 1024 көшірмесі А генінің және 16384 көшірме В генінің

Енді біз 2 -ден 1 -ге дейінгі үлгіні А геніне қатысты В генімен салыстырғымыз келеді:

Абсолютті сандарда бұл:

1-үлгі. 4096 / 1024 = 4 есе артық B 2-үлгі. 16384 / 1024 = 16 есе көп B Орташа сома көп B = (16 + 4) / 2 = 10 есе көп B

Енді qPCR көмегімен жоғарыдан алынған үлгілер келесідей болады:

Үлгі 1. А гені 10 цикл, В гені 8 цикл. Үлгі 2. А гені 10 цикл, В гені 6 цикл.

Енді qPCR деректері үшін қолданылатын стандартты әдістерді пайдалана отырып, біз алдымен В және А гендерінің арасындағы айырмашылықты аламыз. Содан кейін айырмашылықтың орташа мәні және бұл 2^ қабылданады.

Үлгі 1. 10 - 8 = 2 цикл Үлгі 2. 10 - 6 = 4 цикл Орташа сома көп В = 2^((2 + 4)/2) = 8 есе артық В

Барлық жарияланымдар / бағдарламалық құралдар және тағы басқалар орташа есеппен 8 есе көп В есептейді. Мен бұл log2 шкаласынан шыққанын білемін, бірақ бұл статистикалық дұрыс әдіс неліктен абсолютті саннан ерекшеленеді?

Жаңарту Мен өз сұрағымды жеңілдетіп қойдым, сондықтан төменде менің «проблемам» туралы қосымша мәліметтер бар.

1-жағдай биореп 1. Рефтің 1024 көшірмесі және Х генінің 1024 данасы 1-шарт биореп 2. Рефтің 1024 данасы және X генінің 1024 данасы 2-жағдай биореп 1. 1024 рефтің көшірмесі және 4096 геннің X22 ген. Рефтің 1024 данасы және Х генінің 16384 данасы

Сонымен абсолютті сандармен 1-ге қарсы 2-шарттағы X генінің орташа мөлшерін есептеу үшін:

Бұл жерде анықтамалық генді ұмыта аламыз, өйткені cDNA мөлшері бірдей, сондықтан: 1-шарт 1 және 2 биорепс: орташа (1024 + 1024) / 2 = 1024 көшірмелер 2-шарт 1 және 2 биореп: орташа (4096 + 16384) / 2 = 10240 көшірме 2-шарт 1-ге қарсы: орташа 10240 / 1024 = 2-ге қарсы 1-жағдайда 10 есе көп X гені

Енді qPCR CT мәндері жоғарыдағы сандарға негізделген:

1 -шарт biorep 1. Ref_CT 10 және GeneX_CT 10 1 -шарт biorep 2. Ref_CT 10 және GeneX_CT 10 2 -шарт biorep 1. Ref_CT 10 және GeneX_CT 8 2 -шарт biorep 1. Ref_CT 10 және GeneX_CT 6

Енді qPCR ресми есептеулерін қолданыңыз:

1-шарт, Ref_CT орташа (10 + 10) / 2 = 10 2-шарт, Ref_CT орташа (10 + 10) / 2 = 10 1-шарт, GeneX_CT орташа (10 + 10) / 2 = 10 2-шарт, GeneX_CT орташа (8 +) 6) / 2 = 7 Ref_deltaCT (10 - 10) = 0 GeneX_deltaCT (10 - 7) = 3 delta_deltaCT (3 - 0) = 3 Айырмашылық шарт 2 қарсы 1 = (2^3) = 8x

Бұл 1-шартпен салыстырғанда 2-шарттағы X генінің орта есеппен 8 есе көп. Бұл жерде 8x және 10x айырмашылығы бар. Сондай-ақ осы CT мәндерін толтыру үшін пайдаланатын кез келген бағдарлама 10-мен салыстырғанда 8 қатынасын береді.

Мүмкін бұл 8-ге тең келетін бұл әдіс тек техникалық көшірмелер үшін қолданылуы керек, ал биорепстер 10-ға әкелетін басқа теңдеуді қолдануы керек пе?


Үлгі 1. 4096 / 1024 = 4 есе көп B

Үлгі 2. 16384 / 1024 = 16 есе көп B

Орташа сома көп B = (16 + 4) / 2 = 10 есе көп B

Бұл дұрыс жол емес. Сіз орташа өрнекті есептеп жатырсызБекі үлгіде де. Бұл бар дегенді білдірмейді10xКөбірекБ. Тек бар4xКөбірекБжылыҮлгі-2қатыстыҮлгі-1.

Джин-А.үлгілер арасындағы өз өрнегін өзгертпейді және оны анықтамалық ген ретінде қолдануға болады.

Егер шекті цикл бойынша есептесеңіз, бүктеме өзгереді $ = 2^{8-6} = 4x$

Бұл жазбаны да қараңыз.

Орташа әр түрлі эксперименттік жағдайлар арасында емес, репликалар арасында есептеледі.

Кейде екі эксперименттік үлгінің орташа мәні болып табылады есептеледі - бұл әдетте жалпы өрнектің төмен болуына байланысты өте жоғары қатпарлы өзгерістерді көрсететін гендерді сүзу үшін жасалынатын MA -сюжеттік талдау кезінде жасалады.1:4 қарсы 100:300).

Сіздің өңдеуге жауап

Ct орташа мәнін (орташа арифметикалық) қабылдамау керек. Олар өрнектің көмегімен сызықтық масштабта болмайды (және керісінше).

Кез келген сызықтық емес функция үшін $ f (x) $:

$$f(x+y) e f(x)+f(y)$$

$$ f солға ( frac {x+y} {2} оңға) ne frac {f (x)+f (y)} {2} $$

Сонымен қатар, дөңес функция үшін:

$$ f (E [x]) le E [f (x)] $$

$$ Дженсен теңсіздігі $$

қайда $E[x]$ шамасында болжанады $ x $

$ a^x $ қатысты дөңес функция болып табылады $x$ ($ a $ кез келген нақты сан > 1). Сондықтан сіз Cens мәндері мен өрнегіне Йенсен теңсіздігін қолдана аласыз.


Емдеуден кейін бүктеу өзгерісін (әсер мөлшерін) салыстыру

Мен бұл сайтты соңғы жыл статистика бойынша кеңестер алу үшін қолдандым, бірақ мен оны жеңе алмайтын проблемаға тап болдым. Бұл өте күрделі емес, бірақ маңыздылығын қалай анықтау керектігін білмеймін немесе менің ойларым дұрыс. Сіздердің кейбіреулеріңіз аздап көмектесе алады деп үміттенемін. Алдын ала рахмет.

Менде тышқандардың екі штаммы бар жағдай бар. Тышқанның бір штаммында оларда ауру жиі кездеседі, екіншісінде сол ауруға шалдығу деңгейі төмен. Ауру екілік, оларда бар немесе жоқ.

Егер мен тінтуірдің кез келген штаммының популяциясын А препаратымен емдейтін болсам, екеуі де аурудың жиілігін төмендетеді. Тінтуірлердің жиі кездесетін штаммында ауру жиілігі 30% -дан 15% -ға дейін төмендейді. Тінтуірдің штаммы төмен емдеуден кейін 10% -> 1% дейін төмендейді.

Осы эксперименттен, егер мен аурушаңдықтың абсолютті төмендеуіне қарасам, препарат басқалардағы 9% салыстырғанда 15% төмендеген жоғары ауру тобында тиімдірек болады. Дегенмен, (маған) бұл препарат тінтуірдің төмен штамдарында тиімдірек екені анық, өйткені қатпардың өзгеруі 10 есе азаяды, ал жоғары жиіліктегі тышқандар тек 2 есе азаяды.

Сценарий мағыналы болды деп үміттенемін. Менің сұрағым:

Егер мен тышқандардың аурушаңдығының төмендеуінің жоғары аурушаңдыққа қарағанда едәуір үлкен екенін анықтағым келсе, қандай статистикалық тест жасауым керек?

Мен журналға (2) инциденттерді түрлендіру керек деп ойлаймын, содан кейін сызықтық модель немесе ANOVA көмегімен емдеудің әсерін тексеру керек. Мен бұл косер екеніне сенімді емеспін, әсіресе екілік жауап айнымалысы мен қайталануы жоқ (тышқандардың көп болуына байланысты репликация жасау мүмкін емес)

Сіздің кез келген ұсыныстарыңыз/жауаптарыңыз керемет және жоғары бағаланады.


Нәтижелер, экспорттау және сақтау


Күшейту (нақты уақыттағы ПТР) барысында полимеразды тізбекті реакция (ПТР) өнімдерінің жинақталуын тіркеу арнайы жабдықты қажет етеді, яғни ампликон түзілу кезінде реакция түтігіндегі флуоресценция деңгейін тіркеуге қабілетті күшейткіштерді анықтау. Реакция уақыты аяқталған кезде зерттеушілер ДНҚ жинақтау графиктерін ала алады. Бұл шолуда ПТР қисықтары мен мүмкін болатын қателіктерді талдаудың ең перспективалы алгоритмдері талқыланады, олар қолданылған бағдарламалық қамтамасыз ету немесе операторлардың қателіктерінен болады. Қосылған деректер зерттеушілерге сенімді нәтиже алу үшін әдіс ерекшеліктерін түсінуге көмектеседі.
Нақты уақыттағы ПТР деректерін бағалау.

Vaerman JL, Saussoy P, Ingargiola I. J Biol Regul Homeost Agents. 2004 18 (2): 212-214.
UCL, Cliniques Saint Luc, Брюссель, Бельгия.

Егер нақты уақыттағы ПТР пайдаланушы үшін маңызды болса, оның мәліметтерінің сенімділігі туралы кейбір ойлар маңызды. Біз мұнда кейбір мәселелерді талқылаймыз өздері беретін нақты уақыттағы сандық ПТР деректерін интерпретациялаумен байланысты аналитикалық бағалауға. Молекулярлық биология тіліне аударамыз кез келген жаңа өнімділікті бағалау үшін қолданылатын кейбір критерийлер әдіс (сызықтық, дәлдік, ерекшелік, анықтау шегі және сандық).
Мәліметтерді талдаудың жоғары өткізу қабілеттілігіндегі статистикалық тәжірибе.

Malo N, Hanley JA, Cerquozzi S, Pelletier J, Nadon R.
Nat Biotechnol. 2006 24(2): 167-75.
МакГилл университеті мен Genome Quebec инновациялық орталығы, 740 авеню Доктур Пенфилд, Монреаль, Квебек, Канада

Өткізгіштігі жоғары скрининг-есірткі табудағы маңызды кезең. Оның мақсаты - кандидаттардың «соққыларын» тез және дәл анықтау үшін әр түрлі химиялық қосылыстардың үлкен санын тексеру. Қазіргі уақытта жоғары сенімділікпен сапалы хиттерді анықтау үшін бірнеше статистикалық құралдар бар. Біз деректерді алдын ала өңдеудің статистикалық аспектілерін және негізгі экрандар үшін соққыларды анықтауды қарастырамыз. Біз плиталардағы ұңғымалардың позициялық әсеріне, соққы шегін таңдауға және жалған оң және жалған теріс көрсеткіштерді төмендетудің маңыздылығына байланысты мәселелерге назар аударамыз. Ағымдағы әдістердің жорамалдарын тексеру және болжамдар орындалмаған кезде деректерді талдау стратегияларын ұсыну үшін қайталанатын өлшемдер қажет деп есептейміз. Негізгі экрандарда сенімді статистикалық әдістермен репликацияларды біріктіру сенімді соққыларды табуға көмектеседі, сайып келгенде скрининг процесінің сезімталдығы мен ерекшелігін жақсартады.


Әдістері

Affymetrix GeneChip ® препараты

Біз жабайы типті сегіз жұптасуға рұқсат бердік (AB зертханалық штамм) Данио Рерио бақыланатын зертханалық жағдайларда уылдырық шашу және кейіннен қайта жұптаудың алдын алу және репродуктивті циклдарды стандарттау үшін жыныстарды 5 күндік мерзімге бөлу. Балықтар арасындағы индивидуалды айырмашылықты азайту үшін барлық зерттеушілер 4 айдан 12 айға дейінгі туған бауырлар болды. Мұз ваннасының эвтаназиясы арқылы әрбір жеке адамды құрбандыққа шалғаннан кейін, біз ерлердің барлық ұрық тіндерін және әйелдердің барлық аналық без тіндерін тез кесіп алдық. Барлық әдістер Техас A&M университетінің Институционалдық жануарларды күту және пайдалану комитетімен (AUP2005-76) мақұлданды. Тіндер TRIzol ® реагентінде (Invitrogen) жылдам мұздатылған және жалпы РНҚ оқшаулау өндірушінің нұсқауларына сәйкес орындалды. Сандық және сапаны бағалаудан кейін 3 жұп аталық безден, 3 аталық денеден, 3 аналық безден және 3 әйел денесінен алынған жалпы РНҚ үлгілері стандартты Affymetrix хаттамалары арқылы 12 GeneChips ® жүйесіне cRNA таңбалау және будандастыру үшін Кентукки университетінің микромассивінің негізгі мекемесіне жіберілді ( GeneChip ® Экспрессиялық талдаудың техникалық нұсқаулығында сипатталған). Қысқаша айтқанда, жалпы РНҚ транскрипцияланды, содан кейін биотинилденген цРНҚ түзілді. Бөлшектеу кезеңінен кейін биотинилденген цРНҚ массивтерге 16 сағат бойы будандастырылды. Содан кейін үлгілер стрептавидин фикоэритринмен боялған және сканерлеуге дейін биотинилденген стрептавидинге қарсы антидененің көмегімен күшейтілген.

Абсолютті өрнекті талдау

GeneChip ® Zebrafish Genome Array құрамында

15 500 зондтар жиынтығы, әр жиын 16 іргелес, бірақ қабаттаспайтын зонд жұбынан тұрады. Бұл зонд жұптарының ұзындығы 25 негіз, әрқайсысында бір зонд бар (PM) мақсатты транскриптке және басқа зондқа (ММ) бір негізгі жұпта мақсатты реттілікке сәйкес келмейді. Сәйкес келмейтін зондтың болуы мақсатты емес молекулаларды будандастырудан туындаған фондық шуды бақылауға арналған. Массивтік кескін ақпаратын транскрипт молдығының мәніне айналдыру үшін біз төрт түрлі «абсолютті өрнекті талдау» алгоритмін қолдандық. Бұл талдау әдістерінің әрқайсысы берілген чип кескін файлынан нақты деректер жиынтығын құру үшін қолданылды. Біз әрбір сәйкес бағдарламалық нұсқаулық ұсынған талдауға дейін шикі деректерге стандартты нормалау процедураларын қолдандық. Барлық экспериментальды репликациялар бойынша барлық абсолютті талдаулар үшін нормаланған өрнектің мәндері басқа микроореальды бөлшектермен бірге NCBI Gene Expression Omnibus (GEO) GSE14979 қосылу нөмірі бойынша сақталды.

GCOS бағдарламалық пакетінде (Affymetrix) енгізілген алгоритм бір қадамдық Tukey екі салмақтық орташа мәнін пайдаланады. PM мен- CT менбойынша мен зонд жұптары, қайда PM мінсіз сәйкестендіру зонасының қарқындылығы, және CT - бұл «контраст мәні» [31, 32]. CT көбіне тең болады ММ (сәйкес келмейтін зонд ұяшығының қарқындылық мәні), бірақ жиынтықтағы көптеген зонд жұптары көрсетсе ММ сәйкес мәндерден үлкенірек PM мәндері үшін түзетілген мән пайдаланылады CT теріс өрнек мәндерін есептеуді жою үшін [33]. Бұл алгоритм «шынайы сигнал» болжамынан фондық шуды шығаруға негізделген қарапайым есептеу болып табылады.

GC-RMA

Біз сондай-ақ GeneSpring GX 7.3.1 (Agilent) микромассивті талдау бағдарламалық пакетінде енгізілген GC-RMA (GC Robust Multi-Array Analysis) алгоритмін қолдандық. GC-RMA алгоритмі сызықтық аддитивті модельге негізделген және осылайша GCOS алгоритмінен айырмашылығы әрбір чип үшін өрнек мәндерін бағалау кезінде берілген деректер жиынындағы барлық массивтерді қарастырады. Негізгі сызықтық модельді Ву және т.б. [34], деп болжайды Y гиж= O гиж+ Н гиж+ С гиж, қайда Y гижболып табылады PM зондтың интенсивтілік мәні j зонд жинағында g массивте мен. O гижлазерлік сканерлеу қателеріне байланысты сәйкес келетін «оптикалық шу» болып табылады, Н гижсәйкес «арнайы емес байланыстырушы шу» болып табылады және С гиж— үлгідегі мақсатты транскрипттің нақты көптігіне пропорционалды шама («шын» өрнек мәнін бағалауға мүмкіндік береді). GC-RMA алгоритмі компоненттерді бағалау үшін барлық массивтердегі бақыланатын мәліметтерден көптеген параметрлерді қолданады Н гижжәне С гиж, содан кейін ол өрнек мәндерін есептеу үшін үлгіге сәйкес келеді [34].

PM-MM, PM-Only

Сондай-ақ өрнек мәндерін жасау үшін dChip [35, 36] талдау бумасында қол жетімді модельге негізделген екі қосымша тәсіл пайдаланылды. PM-MM моделі топта орнатылған әрбір зонд үшін болжайды мен массивтер, PM ij- ММ ij= θ менφ j+ .. ij, қайда PM ijжәне ММ ijзонд жұбы үшін тамаша сәйкестік пен сәйкессіздік қарқындылығы j массивте мен, θ мен- массивте орнатылған зондтың өрнек индексі мен (пайыздың мәні), φ j- жұптың арасындағы байланысты көрсететін коэффициент j жасушаның қарқындылығы мен нақты мақсатты концентрациясы, және .. ij- бұл модельдің қателік термині [33, 35, 36]. GC-RMA сияқты, PM-MM алгоритмі деректер жиынындағы барлық микросхемалардағы ақпаратты пайдаланады, содан кейін модель әрбір чиптегі әрбір зонд үшін өрнек мәнін бағалауға жарамды. PM-Only алгоритмі PM-MM-ге ұқсас, бірақ сәйкессіздік интенсивтілігі модельде мүлдем еленбейді: PM ij= θ менφ j+ .. ij. Бұл альтернативті модель теріс өрнек мәндерінің кездейсоқ есептелуін болдырмау үшін жасалған ММ салыстырғанда зондтың қарқындылығы жоғары PM қарқындылығы [35, 36].

Салыстырмалы өрнектерді талдау

Әртүрлі емдеу топтары арасындағы абсолютті өрнек мәндерін салыстыру, дифференциалды транскрипт деңгейлерін анықтау және қатпарлы өзгерістерді бағалау үшін біз Cyber-T веб-интерфейсін пайдалана отырып стандартты t-тесттерін өткіздік [37]. Бұл тәсіл келесі салыстырулардың әрқайсысы үшін нәтижелердің 4 жиынын (әр абсолюттік өрнек алгоритміне бір) берді: еркек денесі әйел денесіне қарсы, аталық без аналық безге қарсы, аталық без еркек денесіне және аналық без әйел денесіне қарсы. Орындаудың статистикалық мәселесін бақылау

Салыстыру үшін 15 000 t-тест, біз әрбір талдау үшін Бенджамини мен Хочберг [38] сипаттағандай 0,05 жалған ашу жылдамдығын (FDR) орнаттық. Берілген салыстыруға арналған генді «дифференциалды түрде экспрессияланған» деп санау керектігін шешу үшін біз «қатаң консенсус» критерийін қабылдадық, онда ген барлық 4 абсолютті талдау деректер жиынында маңызды FDR түзетілген p-мәнін көрсету қажет болды. Бұл процедура консервативті, бірақ жалған позитивтерді бақылау атымен ақталады.

Нақты уақыттағы ПТР

Біз қалған 5 еркек және 5 әйел зебрафиш үлгілерін біздің микроараграфиялық талдаулармен дифференциалды түрде анықталған жеті ген үшін экспрессиялық ауытқулардың тәуелсіз сынақтарын жүргізу үшін қолдандық. Ұрық безі реттелген, еркек байытылған және әйел байытылған санаттардың әрқайсысында біз кездейсоқ ең реттелген он геннің екеуін таңдадық. Таңдалған ерлермен байытылған транскрипттердің біреуі үшін ғана (15637.1.S1_at зонд жинағы) біз генге тән ПТР өнімін күшейте алдық. Аналық бездермен реттелетін санат ішінде біз экспрессияда азырақ таңқаларлық айырмашылықтарды көрсететін гендер үшін микромассив нәтижелерінің дәлдігін бағалау үшін ең жоғары реттелетін 200 геннің екеуін кездейсоқ таңдадық. Әрбір үлгі үшін жалпы РНҚ -ның бірдей мөлшері (1 мкг) Superscript ® First Strand Synthesis Kit (Invitrogen) көмегімен cDNA -ға кері транскрипцияланды.

Біз SYBR ® Green PCR Mastermix (Invitrogen) және 2 мкл cDNA үлгісін қолдана отырып, нақты уақытта ПТР жасадық. Реакциялар ABI 7700 нақты уақыттағы ПТР аппаратында (Қолданбалы биожүйелер) әдепкі талдау параметрлерін қолдана отырып жүргізілді. Әрбір жеке реакция үш данада орындалды және күшейту ерекшелігін растау үшін әрбір праймер жұбы үшін үлгісіз бақылаулар қосылды. Салыстырмалы мРНҚ деңгейін бағалау үшін салыстырмалы стандартты қисық әдісін (қолданбалы биожүйе) жеңілдету үшін 5 түрлі шаблон концентрациясын қамтитын сұйылту сериясы қолданылды. Мақсатты гендерге арналған праймер тізбектері Primer Express ® 3.0 (Қолданбалы биожүйелер) көмегімен жасалған және сұраныс бойынша қол жетімді. Әр реакцияда цДНҚ молшылығын қалыпқа келтіру үшін бақылау праймерлерінің екі жиынтығы (Tang et al. [39] ұсынылған) қолданылды. EF1α жыныс бездері-дене салыстыруларында қолданылды және Rpl13α ерлер мен әйелдерді салыстыру кезінде пайдаланылды. Әрбір салыстыру үшін біз 5 эксперименттік қайталаудағы өрнек деңгейінің бағалауларына негізделген орташа бүктеме өзгерісі туралы 95% сенімділік аралығын есептедік.


Ген экспрессиясын есептеу үшін дельта-дельта Ct формуласын қолдану

Дельта-дельта Ct әдісін қолдану үшін сізге қызығушылық танытатын ген үшін Ct мәндері қажет және өңделген және өңделмеген үлгілер үшін үй қызметші гені қажет. Егер сізде үй шаруашылығында бірнеше ген болса, онда көптеген сілтеме гендері бар qPCR деректерін талдау бойынша нұсқаулықты тексерген жөн болар.

Геннің салыстырмалы өрнегін 5 қарапайым қадаммен қалай есептеуге болады.

1. Кез келген техникалық көшірмелер үшін Ct мәндерін орташа

Бірінші қадам әрбір үлгінің техникалық көшірмелері үшін Ct мәндерін орташалау болып табылады. Осылайша, мысалы, екі немесе үш көшірмеде qPCR орындаған кезде, алдымен бұл мәндерді орташалау қажет. Төмендегі мысалда әрбір үлгі екі данада орындалды (Ct1 және Ct2).

2. Әрбір үлгі үшін дельта Ct есептеңіз

Келесі қадам Delta Ct есептеу болып табылады (TCt) әрбір үлгі үшін жаңадан жасалған орташа Ct мәндерін пайдалану арқылы. Ct дельта есептеу формуласы төменде берілген.

∆Ct = Ct (қызығушылық гені) - Ct (үй шаруашылығының гені)

Мысалы, есептеу үшін TCt үшін 'Бақылау 1'Үлгісі:

TCt Control 1 = 30.55 – 17.18

3. Delta Delta Ct есептеу үшін калибраторды/анықтамалық үлгіні/үлгілерді таңдаңыз

Келесі қадам - ​​дельта-дельта Ct есептеу кезінде калибратор/анықтама ретінде қандай үлгіні немесе үлгілер тобын пайдалану керектігін шешу.TCt) барлық үлгілер үшін мәндер. Бұл көптеген адамдарды шатастыратын бөлім. Негізінде, мұның бәрі сіздің эксперимент орнатуыңызға байланысты.

Мұны істеудің жалпы әдісі - эксперименттік үлгілерді сәйкестендіру және геннің экспрессивті қатынастарын бөлек анықтау. Мұның бәрі жұптары сәйкес келетін эксперименттер үшін жақсы және дұрыс, мысалы, жасушалық культуралық эксперименттердегі жағдай. Алайда, егер екі эксперименталды топ n саны бойынша өзгерсе және жұптары сәйкес келмесе, бұл қиын.

Калибраторды/анықтамалық үлгіні таңдаудың тағы бір жолы - ең жоғары Ct мәні бар үлгіні таңдау, сондықтан гендік экспрессиясы ең төмен үлгіні таңдау. Осылайша, барлық нәтижелер осы үлгіге қатысты болады. Немесе анықтамалық үлгі ретінде әрекет ету үшін бақылау үлгілерінің біреуін ғана таңдауға болады.

Мен жеке орташа бағалаймын «Орташа Ct» a құру үшін бақылау тобының биологиялық репликаттарының мәндері «Орташа бақылау». Бұл нәтижелердің бақылау орташа Ct мәндеріне қатысты ұсынылатынын білдіреді.

Қандай үлгіні, не үлгілер тобын пайдалансаңыз да, сіз калибратор/сілтеме ретінде қолданасыз, егер ол барлық талдауларға сәйкес келсе және нәтижелерде көрсетілген болса, бұл түсінікті. Есіңізде болсын, нәтиже соңында болады туыс гендік экспрессия мәндері.

Осыны ескере отырып, егер біз алғымыз келсе ∆∆Т әрбір үлгі үшін мәндерді (әр бақылау үлгісін қосқанда) алдымен 3 бақылау үлгісі үшін ∆Ct орташа мәнін алуымыз керек:

∆Ct Орташа бақылау = (13.38 + 13.60 + 13.68)/3

Назар аударыңыз, егер Ct мәндері айнымалы болса, онда жоғарыдағы арифметикалық ортаның орнына геометриялық ортаны қолданған дұрыс болар. Геометриялық орта орташа арифметикалық көрсеткіштермен салыстырғанда, шығыстарға төзімді. Геометриялық орта Vandesompele генін салыстырмалы түрде көрсету әдісінде осы себептен қолданылады.

Мысалы, егер менің үш бақылау үлгісіндегі Ct мәндері 13.38, 13.60 және 15.80 болса, онда бұл арифметикалық емес, геометриялық ортаны қолдануға жақсы себеп.

Геометриялық орташа мәнді қолдану үшін алдымен сандарды көбейтіп, содан кейін сол мәннің n -ші түбірін алыңыз. n - жай ғана формуладағы бақылаулар саны, бұл мысалдағы 3. Сонымен, менің соңғы мысалды қолдана отырып, бұл:

∆Ct геометриялық орташа бақылау = ∛ (13,38 x 13,60 x 15,80)

4. Әр үлгі үшін delta delta Ct мәндерін есептеңіз

Енді есептеңіз TCt әрбір үлгі үшін мәндер. Есіңізде болсын, delta delta Ct мәндері осы мысалдағы өңделмеген/бақылау тобына қатысты. Ct дельта дельтасын есептеу формуласы төменде берілген.

∆∆Ct = ∆Ct (үлгі) - ∆Ct (орташа бақылау)

Мысалы, есептеу үшін ∆∆Т өңделген 1 үлгі үшін:

∆∆Ct өңделген 1 = 7.83 – 13.55

5. Қатпарлы геннің экспрессия мәндерін есептеңіз

Соңында, қатпарлы геннің экспрессиясын жасау үшін бізге қажет 2 теріс ∆∆Cт күшіне (яғни жаңадан құрылған мәндер). Бұл үшін формуланы төменде табуға болады.

Бүктеме генінің экспрессиясы = 2^-(∆∆Ct)

Мысалы, өңделген 1 үлгісі үшін бүктелген гендік өрнекті есептеу үшін:

Бүктелген ген экспрессиясы = 2^-(-5.72)

Мұны істеу өңделген 1 үлгі үшін 52,71 гендік өрнекті береді. Мұны барлық үлгілер үшін жасау келесідей болады:

Дәл осылайша үлгілеріңіз үшін қатпарлы геннің экспрессиясын жасау үшін delta-delta Ct әдісін қолдануға болады.


Қорытынды

Барлық жұмыс үрдістері RT-qPCR өрнек өлшемдерімен жақсы сәйкестікті көрсетеді және ешбір жұмыс процесі басқаларынан асып түспейді. Айта кету керек, әрбір жұмыс процесі тәуелсіз деректер жинақтарында қайталанатын сәйкес келмейтін өрнек өлшемдері бар гендердің шағын, бірақ нақты жиынтығын ашты. Бұл гендер әдетте кіші болды, экзондары аз болды және экспрессивті өлшеулері бар гендерге қарағанда төмен өрнектелді. Осы арнайы гендер жиынтығы үшін РНҚ-секв негізіндегі экспрессия профильдерін бағалау кезінде мұқият тексеру қажет.


Қорытынды

Біз 24 сағаттық ораза негізінен бройлер тауықтарының ішіндегі құрылымдық және бөлінетін ақуыздардың деңгейіне әсер ететінін анықтадық. Биологиялық қызметтері бойынша бұл ақуыздар май қышқылдарының байланысымен және тасымалымен, жалпы кернеу реакциясымен және иондық немесе везикулалық тасымалдаумен айналысатын цитоскелеттік компоненттер болып табылады. Барлық анықталған цитоскелеттік ақуыздар (ACTA2, ACTB, KRT14, TPM1) бұл ақуыздар вилусты қайта құруда және оразадан туындаған моторикадағы ең маңыздысы болуы мүмкін екендігін көрсететін экспрессияны көрсетті. Алайда, ішектің морфометриялық параметрлері жағдайында кейбір елеулі өзгерістер байқалды, өлшенетін үлгілер санының аздығы морфометриялық өзгерістерді байқалған протеомиканың өзгеруіне байланыстыратын қандай да бір күшті қорытынды жасауға мүмкіндік бермейді. Басқа анықталған белоктар (EXFABP, MAGT1, APOA1, APOA5, MUC6, HSP90A) аштықтан туындаған стресске жауап ретінде аштық тобында ақуыз мөлшерінің жоғарылауын көрсетуі мүмкін және ораза кезінде гомеостазды сақтайтын қорғаныс рөлдері болуы мүмкін.


Деректердің қол жетімділігі

Бұл зерттеу CHARGE синдромы қоры (KS, JAP және SP), Канада инновациялық қоры (CFI SP), Канаданың жаратылыстану және инженерлік зерттеулер кеңесі (NSERC SP) және сирек кездесетін аурулар қоры (SP) қолдауымен өтті. SP FRQS Junior 1 зерттеуші ғылыми сыйлығының иегері және Анна Сфорза Джухадджянның ғылыми кафедрасының иегері. PJ CERMO-FC стипендиясына қолдау көрсетеді. KS-ге CIHR стипендиясы қолдау көрсетті. JAP және NP - FRQS аға зерттеушілері, ал NP сонымен қатар сирек кездесетін генетикалық аурулар бойынша UQAM зерттеу кафедрасының алушысы болып табылады. Авторлар доктор С.Лаланиға, доктор Дж. В. Белмонт пен П.Хернандеске (Бэйлор медицина колледжі) лимфобластоидты жасуша желілерін жомарт қамтамасыз еткені үшін алғыс айтады. Сондай-ақ доктор Мари-Клод Беланджерге Клаудиа Майостың қолжазбасын сыни оқығаны және құнды пікірлері үшін дәрі-дәрмек скринингіне көмектескені үшін алғыс айтамыз. C. elegans және Валентин Лемуин, Александра Лисуба және Марк Аллард зебра балықтарын генотиптеуге көмектескені үшін.


DPCR қолданбаларына шолу

DPCR -ді соңғы қолдану көптеген ДНҚ, РНҚ және эпигенетикалық қосымшаларды қамтиды. Әдістің кең тараған қолданылуы бір қатардағы басқа, басымырақ нұсқалардың қоспаларында сирек кездесетін генетикалық нұсқаларды (мысалы, бір нуклеотидті нұсқаларды) анықтау және сандық анықтау болып табылады. Мұндай «сирек кездесетін» дәйектілікті анықтау ctDNA -дағы әсер ететін мутацияны өлшей алады ( 10,), инвазивті емес пренатальды тестілеудегі ұрықтың генетикалық нұсқалары ( 11,), донорлық органның полиморфизмі трансплантаттың ықтимал қабылданбауын бағалау ретінде ( 12, 13,), сондай-ақ сирек кездесетін бактерия генотиптері ( 14,) және вирустық препараттарға төзімділік ( 15,). Ерте тікелей клиникалық диагностикалық қолданудың мысалы, өкпенің ұсақ жасушалы емес қатерлі ісігін емдеуге бағыттау үшін сұйық биопсиялардағы ctDNA өлшеу болып табылады. ( 16, 17).

dPCR qPCR -ге қарағанда жоғары дәлдікті ұсына алады ( 18,) және бөлімдер оң немесе теріс деп саналатын екілік сипатқа байланысты көшірме санын анықтау үшін пайдалану әлдеқайда қарапайым. DPCR дәлдігінің жоғарылауы ( 18,) көшірме саны нұсқаларының жақсартылған өлшеуін қосты ( 19, 20,)соның ішінде нейробластомадағы генді күшейтуде ( 21,) және ұрықтың трисомиясы инвазивті емес пренатальды тестілеу арқылы ( 22,). dPCR сонымен қатар сирек оқиғаларды немесе із деңгейін жоғары сенімділікпен анықтауға мүмкіндік береді, өйткені экспериментте реакцияға 10 немесе 10 000 нысана молекуласы бар-жоғына қарамастан, әрбір жеке бөлімде ДНҚ молекулаларының бір немесе аз саны ғана күшейтіледі. qPCR нысананың өте төмен концентрацияларын анықтай алатынымен, із өлшемдерін калибрлеу қиын. Бұл dPCR ең аз қалдық ауру кезінде із деңгейін өлшеу әдісі ретінде зерттелген себептердің бірі. ( 23, 24,) және АИТВ сияқты вирустық инфекциялардағы кідіріс ( 25–27).

Қос тізбекті ДНҚ молекулаларын өлшеудің аналитикалық сезімталдығын молекулаларды бөлуге дейін денатурациялау арқылы одан әрі жақсартуға болады. ( 28,). Жалғыз жіптер әр түрлі бөлімдерде болғандықтан, аналитикалық сезімталдық екі есе жақсарады. DPCR-дің бірегей бөлінуін пайдаланатын басқа қосымшалар екі мақсат арасындағы сис-транс-байланыстық қатынастарды қамтиды ( 29–31,) және белгісіз бірізділік мутациясының жиілігін анықтауға арналған «түсіру» талдаулары ( 32), және CRISPR-Cas9 сияқты тәсілдерді қолдану кезінде гендерді өңдеу тиімділігін бағалау ( 33).

Сонымен қатар, dPCR жоғарыда аталған техникалық артықшылықтарға жоғары репродуктивтілікті қамтамасыз етеді. Бұл бір мақсатты әртүрлі зертханаларда өлшегенде мүмкін болады ( 34, 35,) әртүрлі талдаулар немесе талдау пішімдерін пайдалану ( 36,), немесе әр түрлі өндірушілердің құралдары ( 37, 38,). Бұған тазартылған нуклеин қышқылын өлшеу кезінде де қол жеткізуге болады, сонымен қатар экстракция сияқты аналитикалық қадамдар қосылуы қажет тұтас биологиялық үлгілер. ( 36, 39,). Бұл сипаттама dPCR -ді анықтамалық материалдарды сандық бағалаудың танымал әдісіне айналдырды ( 40, 41,), клиникалық диагностикада қолданбалы молекулалық тестілеуді қолдау ( 42–44,) және тағамдық сынақтар ( 45–47).

Молекулалық -генетикалық әдістер сандық өлшеулер жүргізу үшін қолданылғанда, көшірмелер санының концентрациясын есептеу үшін көлеммен біріктірілген масса мен мольді қолданды. ДНҚ сияқты үлкен макромолекуланы қарастырғанда масса немесе моль идеалды емес және нуклеин қышқылын калибрлеу материалдарын Халықаралық бірліктер жүйесінде (SI) сирек байқауға болады. ( 48,). dPCR белгілі бір мақсатты тізбегі бар барлық бұзылмаған (ампликоннан тең немесе үлкен) ДНҚ молекулаларын санау мүмкіндігіне ие. ( 49,), осылайша бір бірлікке санау арқылы SI бақылау мүмкіндігін ұсынады ( 48,). Мұндай мүмкіндіктің ықтимал әсерін барынша арттыру үшін ISO 20395 стандартындағы dPCR (және qPCR) бойынша ең жақсы тәжірибелерді үйлестіру және стандарттау бойынша күш-жігер жұмсалды. ( 50).

Көшірме санын өлшеудің сандық дәлдігі молекулалық санның толықтығына да, үлгінің бірлік көлемінің және жалпы реакцияның нақты анықтамасына (яғни, нақты анықталған көлемнің бөлімдерінің санына) байланысты. dPCR арқылы SI қадағалану талаптарын қолдау үшін екеуін де көрсету қажет. Заттың мөлшері бойынша консультативтік комитеті: химия мен биологиядағы метрология (CCQM) қолдауымен ұлттық метрология институттары арасындағы халықаралық ынтымақтастық dPCR шын мәнінде бастапқы SI-қадағалау үшін жеткілікті дәлдікпен өлшей алатынын көрсететін зерттеулерге әкелді. ( 38, 51,). dPCR зертханалық медицинада қадағалаудың бірлескен комитеті (JCTLM) қабылдаған нуклеин қышқылына сілтеме бойынша өлшеудің бірінші процедурасын ұсынды. ( 38,) және dPCR калибраторларға және диагностикалық әдістерге арналған бақылау материалдарына тағайындалған мәндердің метрологиялық қадағалануы туралы ISO 17511 нұсқаулығының жаңа басылымында жоғары ретті анықтамалық өлшеу процедурасының мысалы ретінде енгізілген. ( 52).

Жаңа зерттеу мүмкіндіктерін ашу және молекулярлық-генетикалық өлшеудің кеңірек саласында бақылауды қолдау үшін dPCR әлеуеті тұтастай алғанда нуклеин қышқылдарын өлшеудің дәлдігіне үлкен әсер етуі керек. Дегенмен, зерттеушілер мен өндірушілер осы өлшемдерге әсер етуі мүмкін нюанстарды түсіну үшін сақтықпен жүруі керек. Бұл саяхатта келесі қадамдарды қарастыру қажет.


Талқылау

Бұл жұмыста біз жасушалардың РНҚ мен экзогендік қосалқы қондырғылардың егжей-тегжейлі статистикалық моделін сипаттадық, оларда белгілі сандарға қосылатын молекулалардың популяциясы қосылған жасушалардың белгіленген санынан дайындалған үлгіде сипатталған. Бұл модельдің контекстінде біз РНҚ-ның жасушалық молекулалық молдығын бағалайтын РНҚ-секв деректерін калибрлеу әдісін максималды ықтималдық аргументтері арқылы шығардық. Біздің молекулалық молдығымызға қарамастан z-мәндер номиналды, олар абсолютті молекулалық молшылықтан бір қадам ғана алыс. Транскрипт үшін салыстырмалы кірістілік коэффициенті бір рет мен, αмен, жеке тәжірибелерде өлшенеді, кітапханадағы абсолютті молекулалық молшылық j, nмен,j теңдеу арқылы белгілі болады: nмен,j = zмен,j/αмен.

Біздің әдіс спик-инс үшін айқын статистикалық модельді пайдаланады, ең қарапайымы, атап айтқанда, берілген кітапхана үшін өсу сандары барлық кітапханалар/шарттар бойынша әрбір өсу молекуласы үшін бекітілген пропорция параметрі бар бірлескен көпмүшелік үлестірімнен таңдалады. бекітілген хаттама үшін. Нәтижесінде, әрбір спик-ин кітапханасындағы санаулар, қарамастан шарт, техникалық көшірмені білдіреді. Біз модельді сандық түрде бірнеше жолмен бағаладық (2-сурет және S2-сурет). Біз спик молекулаларының көпмүшелік модельге тығыз сәйкес келетінін анықтадық, егер бұл кітапхана шамамен 250 000 оқылымнан асса. Басқаша айтқанда, біздің нәтижелер [19] нәтижелерін қолдайды: өсу молекулалары жергілікті РНҚ-ға тәуелсіз түрде жалпы РНҚ-сек кітапханасына ендірілген кітапхана ішіндегі өсуді есептеуге үлес қосады. . A caveat is that we don’t know for sure if deviations of spike-in counts from the multinomial model that we observed are a consequence of some sort of poorly understood noise that is particularly prominent in spike-in libraries of low size, or if the unaccounted for noise was unrelated to library size per se.

We adopted a multinomial mode for spike-in noise, but our model could be extended with a more accurate model. Technical noise in spike-in counts has been studied and modeled recently [36], and we present similar analysis and modeling in S2 Fig and S5 Appendix. Although the proper experimental technique was followed in our study to minimize these errors, pipetting and dilution errors can not be completely eliminated. Pipetting, dilution, and cell number errors may have been sources contributing to the very high variation between experiments that was observed in previous attempts to incorporate spike-ins as normalization standards [42]. [20] however demonstrate technical robustness in the performance of spike-ins in sensitive single cell RNA-seq experiments. Our data agree with the assessment of [20].

We have shown however that our method, especially when supplemented with RUVr [15] correction or our own δj correction, is able to compensate for this source of unavoidable technical variability. Our model could be extended and improved in the future by incorporating a different model for spike-ins. Nevertheless, our model allows for powerful, genome-wide, parametric testing of hypotheses of various sorts concerning nominal RNA abundances, z-values that are explicitly related to absolute cellular molecular abundance (transcripts per cell or attomoles).

We applied our method, to quantify RNA abundance and to test for differential gene expression, using data from two studies with different library preparation protocols, and in species from different kingdoms: a growth rate study in yeast, and a low cell count differentiation study in Ciona. We found global changes in gene expression in both systems: a global increase in transcript abundance with growth rate in yeast, and a global decrease in the Fgfr DN embryonic cell type in Ciona. Reanalysis of the raw data with other algorithms that hold the assumption of equivalent transcriptome sizes, as expected, were not able to reveal these global transcriptome trends.

From relative yield coefficients to absolute cellular molecular abundance

Our focus in this paper is on deriving a nominal cellular molecular abundance that can be converted to absolute abundance by the transcript’s relative yield coefficient, which could be measured in separate experiments. In this study however, we do not attempt to measure the relative yield coefficient values, or estimate the absolute number of molecules per cell for each transcript within a condition. The current work allows us to say, that, for example, RNA transcript A has x times more molecules per cell, on average, in condition 1 compared to condition 2, even if the corresponding RNA-seq libraries were prepared in different batteries of experiments, different studies, or even prepared in different laboratories. Such a conclusion about what might be called, an absolute ratio of abundances, can be drawn without knowing the relative yield coefficient of transcript A. In the section that follows, we discuss the links between our work and methods by which these relative yield coefficients might be measured.

In this manuscript we offer RNA abundance estimates that are proportional to absolute transcript abundance. For this we assign a (relative) yield coefficient value of 1 to a reference spike-in, arbitrarily chosen from among those that contribute a sizable fraction of total spike-in counts. Our nominal abundance of an RNA molecule is based on the temporary assumption that this molecule has the same yield coefficient as the reference spike-in. If our calibration method is supplemented with additional data on the effect that a broad range of transcript physicochemical characteristics has on library preparation and sequencing, a more realistic relative yield coefficient could be assigned to each RNA molecule of interest.

A technical statement of the outstanding problem is that our inferred nominal abundances zмен,j do not disentangle true absolute molecular abundance, nмен,j, and the corresponding relative yield coefficient, αмен because, by definition, zмен,j = αмен nмен,j. However, once one measures absolute cellular abundance of transcript мен in a preparation of cells from which library j was derived (nмен,j), the relative yield coefficient becomes known, at, least in the idealized situation ignoring various sorts of noise, because αмен = zмен,j/nмен,j. Мысалға, nмен,j might be measured by single-cell Fluorescence Орнында Hybridization (FISH) methods, performed on a large population of cells from which library j was derived.

Statistical methods taking into account biological noise and technical noise could be used to compute a confidence interval for αмен, қамтамасыз етілген nмен,j could be estimated. Likelihood methods could be used to integrate data across several libraries in the estimation of αмен. In principle, once αмен is estimated from one or more libraries and a population of cells from which those libraries were derived, this estimate could be used for other libraries (prepared using the same protocol), past, present, and future, to allow the determination of absolute cellular molecular abundances of transcript мен.

Modeling, like that presented in S6 Appendix and S2 Fig, and like that of [17] could also play a vital role in estimating relative yield coefficients, especially if a wider array of synthetic spike-ins covering a large gamut of physical properties were designed and utilized. Our methods have the potential of facilitating statistical modeling of RNA counts because of the explicit relationship between our nominal abundances and absolute molecular, cellular abundances of RNA. In principle, variation in counts as a consequence of true biological variation in random attomoles, Н, and variation in counts due to variation in relative yield coefficient across transcripts with nearly identical mean abundances, μН, could be disentangled.

Our approach lays the groundwork for investigating, testing, and modeling how the physical properties—e.g., length, GC content, folding energy—determine the relative yield coefficient of spike-ins and native RNA transcripts alike. Empirical measurements of relative yield coefficients, as we have defined them, and biophysical modeling could facilitate progress in making the connection between sequencing counts and the underling molecular cellular abundances of the corresponding transcripts.

Relationship to previous studies

Our work follows up on and extends the work of [15, 16, 36, 43, 44]. Our inference method is linear and global for each library, like that of [19], [36] and [45]. We showed that our global (library specific) νj calibration constants are closely related to the Anders and Huber-like “technical” size factors of [36], which are based on spike-in counts. We called their normalization constants , and we showed that they are proportional to our νj normalization constants in the cases of 2 of our data sets with large library sizes, as predicted by theory (S8 Appendix). An important difference is that the calibration constants are on a dimensionless scale, on the order of 1, and do not allow one to infer absolute abundances of transcripts once their relative yield coefficients become known.

[16] applied loess normalization to ERCC spike-in counts to derive a normalization function that they then applied to the counts corresponding to native RNA. Our analysis and rigorous testing of our theory and methods suggest that a local nonlinear transformation, such as loess normalization of the count data is not needed for our RNA-seq data. It seems likely that any local nonlinear fitting of counts to make replicate spike-in libraries as similar as possible would involve overfitting the data.

Our work has some important features in common with the HTN method of [46], particularly, the assumptions underlying their Eq (1) and our Eqs S1 Appendix (2) and (3). These equations explicitly allow for differences in total RNA abundance across conditions. In addition, both normalization methods are global and linear. However the HTN method of [46]: relies on having іс жүзінде housekeeping genes rather than experimentally-added spike-ins does not include a model for biological noise assumes that relative yield is simply proportional to transcript length is focused primarily on testing for differential gene expression and does not provide estimates of absolute RNA abundance. Their global scale factor for a given library is determined by minimizing the sum over spike-ins of the square differences between the spike-in counts in that library and those of a library chosen to be the reference library. That scale factor is then used for the native RNA counts within the same non-reference library. It can be shown that this library-by-library normalization procedure, in the limit as library size (native RNA and spike-ins) approaches infinity, will give an abundance measure that is proportional to our z abundance values based on νj normalization.

A quite different suite of normalization methods, called RUV (removal of unwanted variation), was introduced by [15, 36, 43, 44] and applied with great effect to many different data sets. The methods involve singular value decomposition (SVD) variant of factor analysis to compute a factor matrix W, which is used to model nuisance sources of variation that are unrelated to the experimental design. The factor matrix W is included, in addition to a design matrix, in a generalized linear model for normalized counts. One qualitative way of thinking about the W matrix is that is adds columns to the original design matrix for explanatory variables that one didn’t originally know about. Although this method is widely effective at reducing unwanted variation in RNA-seq data, it does not allow one to infer absolute cellular molecular RNA abundances, even if the factor matrix is computed based on spike-ins or an invariant gene set (S8 Appendix), as the authors are well aware. The simple reason is that proportion of spike-in count is tightly correlated with the biological phenomenon of interest the change of total RNA abundance with condition. However, we showed that results of our maximum likelihood normalization method can be improved, with respect to clustering and detection of differential gene expression, by applying an an RUV method based on residual, RUVr (RUVSeq package [15]) after νj normalization. We obtained closely similar results by a simpler method involving a correction factor δj for each library that was based on our discovery in a dilution study with technical replicates that we seem to have some noise in the actual overall amount of spike-ins added to the cellular RNA. We tentatively ascribed these to dilution/volume errors in handling the stock spike-in mixture. This finding highlights the importance of replacing pipetting methods for handling the spike-ins with more accurate robotic methods.

Қорытынды

The continuing discovery of examples in which there are gross transcriptome differences between cellular states, has established a need for spike-in controls in RNA-seq experiments [19]. Despite some criticisms [15], external RNA spike-ins have been adopted in several recent studies alongside methods developed to use them for RNA-seq quantitation [16, 19, 36, 46, 47].

The model presented in this work lends itself for both absolute and relative RNA quantitation, dependent on the experimental ability to accurately isolate a fixed number cells for library preparation. In both cases, we offer evidence that our approach provides reproducible results in a wide variety of conditions and has a strong predictive power. In conclusion, the presented model allows for improved unbiased RNA-seq quantitation in any experimental setup using external RNA spike-ins.


Бейнені қараңыз: Real Time QPCR Data Analysis Tutorial (Ақпан 2023).