Транскриптомный анализ двух сортов цитрусовых (ширанухи и хуанггуоган) при этиолизации рассады

  1. Сборка транскриптома и аннотация В этом эксперименте мы сконструировали шесть библиотек кДНК, включая...
  2. Идентификация дифференциально экспрессируемых генов (DEG) этиолизации
  3. Функциональная классификация ДЭГ
  4. валидация qRT-PCR

Сборка транскриптома и аннотация

В этом эксперименте мы сконструировали шесть библиотек кДНК, включая R_Y, R_M и R_G, которые представляют этиолированные проростки, разноцветные проростки и зеленые проростки из Сиранухи соответственно, а также, Y_Y, Y_M и Y_G, за исключением того, что они из Хуанггуогана . После удаления адаптеров секвенирования и данных низкого качества мы получили 834,16 млн. Чистых чтений и 125,12 ГБ данных RNA-seq, более 91,37% чтений имели показатель качества Q30 (частота ошибок секвенирования, 0,1%). Статистика данных последовательности приведена в Таблица 1 , Все исходные данные были депонированы в NCBI Gene Expression Omnibus (GEO) с инвентарным номером GSE90935.

Таблица 1: Обзор результатов секвенирования.

Сборка Transcriptome de novo была выполнена с использованием Trinity, программы сборки коротких чтений 25 , Всего было сгенерировано 205 219 транскриптов и 124 952 унигенов. Общая длина транскрипта составила 244 060 930 п.н., средняя длина - 1189 п.н., а N50 - 2463 п.н. Общая длина унигена составила 221 401 747 п.н., средняя длина 1772 п.н. и N50 2690 п.н. Подробная информация показана в Дополнительные рисунки S2 и S3 , Самые популярные виды классификации видов для Shiranuhi и Huangguogan в базе данных NR - Citrus sinensis и Citrus clementina ( Рис. 1А ), которые все принадлежат рутовым. Электронные значения очень значительны, которые в основном близки к нулю (37,1%) и 0 ~ 1e – 100 (20,1%) ( Рис. 1B ), предполагая, что большинство унигенов из Ширанухи и Хуанггуогана имеют очень похожие гомологи у двух цитрусовых.

Рисунок 1Рисунок 1

Классификация видов ( A ) и распределение электронных значений ( B ) унигенов Ширанухи и Хуанггуогана аннотированы в базе данных NCBI NR.

После сборки 124 952 полностью унигенов были подвергнуты общедоступным базам данных, включая NR, NT, KOG, Swiss-prot, KEGG и GO с использованием BLAST (E-значение ≤ 10-5). В конце концов, в общей сложности 111 163 (88,96%) унигенов были аннотированы по крайней мере в одной базе данных ( Дополнительная таблица S2 ). Диаграмма Венна унигенов была представлена ​​в Дополнительный рисунок S4 ,

Оценка уровня экспрессии генов

FPKM (количество фрагментов на килобазу экзона на миллион отображенных фрагментов) использовали для количественной оценки уровня экспрессии унигов. Уровень экспрессии, обнаруженный с помощью RNA-seq, является высокочувствительным. Общее распределение уровня экспрессии генов шести библиотек показано в Дополнительный рисунок S5 , предполагая, что изменение экспрессии генов более заметно в Huangguogan по сравнению с Shiranuhi .

Иерархический кластерный анализ был проведен с 66 существенно дифференцированными экспрессированными генами (DEG) в этиолированных и многоцветных проростках ширанухи и хуанггуогана . Гены с одинаковым или сходным профилем экспрессии были сгруппированы, чтобы представить дифференциальные образцы экспрессии наборов генов в различных экспериментальных условиях. Результаты кластеров DEGs в шести библиотеках показаны в Дополнительный рисунок S6 ,

Идентификация дифференциально экспрессируемых генов (DEG) этиолизации

В процессе скрининга ДЭГ мы использовали P- значение <0,005 26 и log2FC (кратное изменение)> 1 в качестве порога для определения значимости различия в экспрессии генов. ФК - соотношение ФПКМ между этиолированными и зелеными проростками. Анализ профиля DEG использовали для анализа экспрессии генов на двух стадиях этиолизации листьев ширанухи и хуанггуогана . Изменения в экспрессии генов между этиолированными, многоцветными и зелеными проростками были проанализированы на диаграмме Венна ( Рис. 2 ), который иллюстрирует пересечения между экспрессированными генами, обнаруженными на двух стадиях этиолии Ширанухи и Хуанггуогана .

Рисунок 2: Диаграмма Вена показывает количество ДЭГ между этиолированными, разноцветными сеянцами ширанухи и хуанггуогана .Рисунок 2: Диаграмма Вена показывает количество ДЭГ между этиолированными, разноцветными сеянцами ширанухи и хуанггуогана

( A ) Диаграмма Венна показывает распределение повышенных генов в R_Y против R_G, R_M против R_G, Y_Y против Y_G и Y_M против Y_G. ( B ) Диаграмма Венна показывает распределение генов с пониженной регуляцией в R_Y против R_G, R_M против R_G, Y_Y против Y_G и Y_M против Y_G.

14,958 генов, экспрессированных по крайней мере в одном из образцов. 2912o между R_Y и R_G, включая 976 (33,52%) повышенных генов и 1936 (66,48%) пониженных генов. В Y_Y и Y_G мы обнаружили 4225 DEG, среди которых 1707 (40,41%) были индуцированы и 2518 (59,59%) были подавлены. Между R_M и R_G было обнаружено 4786 DEG, с 2273 (47,49%) повышением и 2513 (52,51%) понижением. В Y_M и Y_G мы обнаружили 7007 DEG, среди которых 3880 (55,37%) были индуцированы и 3127 (44,63%) были подавлены. В общей сложности 7 генов с существенно дифференциально повышенной экспрессией были обнаружены в R_Y, R_M, Y_Y и Y_M ( Рис. 2А ), и 59 генов были дифференциально понижены ( Рис. 2B ). В Хуангуога и Ширанухи было обнаружено 1629 ГЭЛ, что отражает общую этиологию у обоих сортов. Когда эти два сорта подвергались этиолизации, число генов с пониженной регуляцией (1046o) было выше, чем у генов с повышенной регуляцией (583 & deg;), и у Huangguogan было больше DEG, чем у Shiranuhi ( Рис. 2 ), что указывает на более сложные пути ответа на этиоляцию у Huangguogan . Это указывало на то, что, хотя многие гены были вовлечены в общий процесс этиолизации, гораздо меньше генов были функционально уникальными для этиолизации проростков цитрусовых .

В целом, изменение экспрессии генов в Shiranuhi не так заметно, как у Huangguogan . В библиотеке R_Y log2FC DEG варьировался от -10,68 до 12,18, а в библиотеке Y_Y этот параметр колебался в диапазоне от -13,04 до 10,52. В R_Y и Y_Y 25 и 11 DEG изменились как минимум в 500 раз, соответственно. В R_Y Cluster-2274.31930 был самым высоким активированным геном (log2FC = 12,18). Он был аннотирован как неизвестный белок в KOG. Принимая во внимание, что Cluster-2274.52311 показал наибольшее снижение экспрессии (log2FC = -10,68), которая кодирует многоатомные оксидазы. В Y_Y Cluster-2274.39936 демонстрировал самый высокий уровень экспрессии (log2FC = 10,52), который кодирует транскетолазу. В то время как экспрессия Cluster-2274.65696 показала наиболее драматическую репрессию (log2FC = -13.04), а также была аннотирована как неизвестный белок. Несмотря на то, что функция самого повышенного и пониженного гена в каждой библиотеке неясна, необходим дальнейший анализ для функциональной идентификации этих генов.

Помимо тех генов, которые показали наибольшие изменения в экспрессии, некоторые гены с самым высоким уровнем экспрессии (значение FPKM) заслуживают внимания, потому что эти гены также могут играть важную роль в этиолизации. Гены с первой десяткой FPKM в R_Y и Y_Y перечислены в Таблица 2 , Шесть генов были общими для обеих библиотек, четыре из которых (Cluster-2274.39471, Cluster-2274.59829, Cluster-2274.79091, Cluster-2274.52612) были связаны с белком. Они кодируют аспарагинсинтазу, белок семейства OmpW, белок семейства гликозилгидролаз и мио-инозитолоксигеназу соответственно. Один специфический ген, Cluster-2274.29764, был связан с регуляцией транскрипции, которая кодирует связанный с белком No apical meristem (NAM). Другой ген, Cluster-2274.64715, не имел доступного описания. Уровни экспрессии этих шести генов были выше в R_Y, чем в Y_Y.

Таблица 2: Список десяти лучших генов с наибольшей FPKM в R_Y и Y_Y.

Кроме того, R_Y и Y_Y владеют четырьмя уникальными генами соответственно. В R_Y три из четырех специфических генов (Cluster-2274.31940, Cluster-2274.31935, Cluster-2274.78324) были связаны с белком, который кодирует родственный цинковый палец (тип CICLE), цинковый палец (тип CICLE) и белок семейства Snf7 соответственно. Другой ген, Cluster-2274.47716, имел неизвестную функцию. В Y_Y три гена (Cluster-2274.56949, Cluster-2274.48669, Cluster-2274.48671) кодируют семейство пролилолигопептидаз, семейство hAT и цинковый палец BED соответственно. Другой ген, Cluster-2274.55102, был связан с развитием, который кодирует Lea5 (обильный белок позднего эмбриогенеза), также известный как обильный белок позднего эмбриогенеза Lea5-like ( LEA 5). Он играет роль в стрессоустойчивости, и его уровни мРНК повышены в ответ на стресс, вызванный солью, жарой и засухой. 27 ,

Функциональная классификация ДЭГ

Чтобы дополнительно выделить отличительную биологическую функцию, генный биологический процесс онтологии (GO-BP), клеточный компонент генной онтологии (GO-CC) и категории молекулярной функции генной онтологии (GO-MF), обогащенные повышенными DEGs R_Y и Y_Y библиотеки. Функциональная классификация повышенных DEG в R_Y и Y_Y отображается в Рис. 3 , Результаты показали, что в обеих библиотеках гены участвуют в биологическом процессе генной онтологии (GO-BP), таком как катаболический процесс инозита (GO: 0019310), катаболический процесс алкоголя (GO: 0046164), катаболический процесс полиола (GO: 0046174), катаболический процесс органического гидроксисоединения (GO: 1901616), метаболический процесс клеточных углеводов (GO: 0044262) и процесс биосинтеза трегалозы (GO: 0005992). Гены, участвующие в клеточном онтологическом компоненте гена (GO-CC), такие как комплекс натриевых каналов с напряжением питания (GO: 0001518), комплекс натриевых каналов (GO: 0034706), комплекс систем секретирования белков III типа (GO: 0030257) и закрепленные на якоре компонент плазматической мембраны (GO: 0046658). Гены, участвующие в молекулярной функции онтологии генов (GO-MF), такие как оксидоредуктазная активность (GO: 0016491), оксидоредуктазная активность, действующая на отдельных доноров с включением молекулярного кислорода (GO: 0016701), инозитолоксигеназная активность (GO: 0050113), активность ацил-СоА-дегидрогеназы (GO: 0003995), каталитическая активность (GO: 0003824) и активность потенциал-управляемых натриевых каналов (GO: 0005248). Поэтому наш анализ сфокусирован на этих аспектах. В этих группах количество генов с повышенной активностью в Y_Y было выше, чем в R_Y. В R_Y и Y_Y 1105 (37,95%) и 1329 (31,46%) DEG были сгруппированы в «не назначен» генной онтологии (GO), соответственно. Некоторые из этих генов могут быть новыми генами, участвующими в реакции этиолизации, о которых никогда не сообщалось.

Рисунок 3: Функциональная классификация повышенных DEGs в R_Y и Y_Y.Рисунок 3: Функциональная классификация повышенных DEGs в R_Y и Y_Y

Генный биологический процесс онтологии (GO-BP), клеточный компонент генной онтологии (GO-CC) и молекулярная функция генной онтологии (GO-MF) обогащены повышенными DEG. Оксидоредуктазная активность и др . является сокращением для оксидоредуктазной активности, действующей на отдельных доноров с включением молекулярного кислорода.

Распределение топ-11 путей KEGG с повышенной регуляцией DEGs показало, что во всех аннотированных аминокислотных обменах (101 и 165 DEG в этиолированных проростках Shiranuhi и Huangguoga n соответственно) и углеводном метаболизме (96 и 95 DEG в этиолированных проростках Shiranuhi и Huangguoga n). соответственно) больше всего хитов ( Рис. 4 ). Эти пути были в основном перепредставлены в метаболизме аминокислот как в R_Y, так и в Y_Y. В библиотеке R_Y и Y_Y было 7 общих путей, обогащенных аминокислотным обменом (КО 00280, КО 00250, КО 00310, КО 00330, КО 00340), углеводным обменом (КО 00053, КО 00500). 32 и 60 позитивных DEG были в основном избыточно представлены в деградации валина, лейцина и изолейцина (КО 00280) метаболизма в R_Y и Y_Y, соответственно ( Дополнительные таблицы S3 и S4 ).

Рисунок 4: Распределение классификации KEGG с повышенной активностью DEG в Ширанухи и Хуанггуога н.

Значение P рассчитывали с использованием метода коррекции Бенджамини и точного критерия Фишера (значение P <0,01). ( А ) Аминокислотный обмен. ( B ) Углеводный обмен. ( С ) Энергетический обмен. ( D ) Метаболизм терпеноидов и поликетидов. ( E ) липидный обмен.

валидация qRT-PCR

Чтобы проверить достоверность и точность наших данных транскриптома, мы выбрали 9 повышенных и 1 пониженных угенов из общих DEGs в библиотеках R_Y и Y_Y и оценили их профили экспрессии с помощью количественной ПЦР в реальном времени. Актин , который является одним из наиболее широко используемых эталонных генов, был выбран для внутреннего контроля. Характер экспрессии выбранных генов определяли и дополнительно сравнивали с таковыми в анализе RNA-seq. Почти все эти гены демонстрировали сходную тенденцию экспрессии в обоих методах ( Рис. 5А, Б ). Кроме того, корреляция между qRT-PCR и RNA-seq была измерена с помощью графика рассеяния log2 (R_Y-NE / R_G-NE) и log2 FC ( Рис. 5C, D ), который показал положительный коэффициент корреляции (коэффициент Пирсона R 2 = 0,918 и 0,9252 соответственно).

Фигура 5: паттерн экспрессии 10 отобранных генов, полученных с помощью RNA-seq и qRT-PCR.Фигура 5: паттерн экспрессии 10 отобранных генов, полученных с помощью RNA-seq и qRT-PCR

( A ) Подтверждение qRT-PCR для 9 случайно выбранных DEG Ширанухи . ( B ) qRT-ПЦР-валидация для 9 повышающих и 1 пониженных DEG Huangguogan. R_Y-NE, R_G-NE, Y_Y-NE и Y_G-NE представляют нормализованные уровни экспрессии для DEG в библиотеках Shiranuhi и Huangguogan , соответственно. ФК - соотношение ФПКМ между этиолированными и зелеными проростками. ( C , D ) Диаграмма рассеяния 10 отобранных генов, основанная на кратном изменении, измеренном с помощью RNA-seq и qRT-ПЦР-анализа Shiranuhi и Huangguogan , соответственно. Линейная линия тренда показана. Корреляция Пирсона была использована для определения взаимосвязи между результатами qRT-PCR и RNA-seq для уровней экспрессии DEG.