Супервычисление эволюции образцового цветка

Вычислительное исследование биологии цветущей горчицы сорняк Arabidopsis thaliana появилось в журнале Molecular Biology Evolution in September 2014. iPlant Совместному и суперкомпьютерному Паническому бегству, Lonestar и Ranger Техаса Продвинутый Вычислительный центр помогают в исследовании. Финансирование исследования прибыло из Национального научного фонда (NSF) и американского Министерства сельского хозяйства.

«Мы нашли довольно достоверные свидетельства, конечно лучшее доказательство до настоящего времени, что эволюция экспрессии гена – важный способ, которым население завода приспосабливается к окружениям», сказал соавтор исследования Джесси Ласки, член Института земли в Колумбийском университете.Томас Джуенджер – другой соавтор и преподаватель в Отделе Интегральной биологии Техасского университета в Остине. Juenger Lab изучала Arabidopsis thaliana больше десятилетия. «Это – один из образцовых заводов тот, биологи учатся», сказал Джуенджер.

У Arabidopsis есть один из самых маленьких геномов любого завода, и в 2000 это был первый геном завода, который будет полностью упорядочен.Биологи завода полагают, что Arabidopsis похож на дрозофилу их генетического исследования. Но вместо того, чтобы вывести из строя или увеличить гены с генной инженерией, Juenger изучает естественное изменение в генах. «Мы хотим понять, как они развились в ответ на процессы естественного отбора и потока генов и мутации в области», сказал он.

До настоящего времени заводы озадачили понимание ученых того, как жизнь приспосабливается к климату, определенно детали экспрессии гена, которая может измениться дико по выносливые виды растений как Arabidopsis, который процветает в окружающей среде, столь же разнообразной как Скандинавия, Северная Африка и Средняя Азия. Гены или отрывки четырехбуквенной Молекулы ДНК, несут не только кодекс, для которого белки делают для его выживания, но также и инструкций для того, сколько сделать, или выразить. Экспрессия гена»… часть организма, который мы показываем, здесь сильно вовлечен в местную адаптацию к окружающей среде», сказал Лаский.Поскольку заводы внедрены, они должны стоять на своем против изменений в температуре, влажности почвы и нападениях насекомого, чтобы назвать некоторых.

Джуенджер объяснил, что один способ, которым они справляются с изменением окружающей среды, состоит в том, чтобы изменить их экспрессию гена.«Поскольку завод начинается к температурам понижения смысла, каскад экспрессии гена может позволить заводу акклиматизироваться к низким температурам, и в действительности готовиться к ближайшему морозу», сказал Джуенджер.

Таким образом, его научная команда использовала предшествующую работу лаборатории, которая выставила рассаду Arabidopsis к искусственной простуде и напряжению засухи, чтобы измерить изменения в экспрессии гена через весь геном.Джуенджер описал проблему нахождения правильного гена как нахождение иголки в стоге сена. Относительно крошечный геном Арабидопсиса все еще содержит более чем 25 000 генов. Команда Джуенджера иглы искала, был тем, что назвало полиморфизм Шотландской национальной партии, единственное различие в письме в более чем 100 миллионах пар оснований ДНК, которые включают гены Arabidopsis. «Это – фундаментальная проблема в биологии», сказал Джуенджер. «Мы просматриваем десятки тысяч генов, чтобы найти правильные, некоторые, которые могли бы на самом деле иметь значение».

Ученые взяли гены, они нашли и сравнили их с геномными данными из предыдущих исследований, которые пробовали Arabidopsis от населения всюду по Европе и Азии. Они сузили те справочные данные к 1 003 напряжениям цветущего сорняка горчицы. Из тех генов, которые показали изменения в их ответе на их среду, должны были знать ученые, показали ли они также изменения в ДНК вдоль экологических градиентов. Такой образец «предполагает, что есть изменения в последовательности ДНК, которые адаптированы к тем местным условиям и которые связаны с изменениями в экспрессии гена», сказал Лаский.

Исследовательская группа, статистически проверенная на ассоциации между климатом и полиморфизмом Шотландской национальной партии, делая пустой указатель гипотезы или не принимая ассоциации. Они сделали это, перетасовав данные и делая тестирование перестановки. «Мы можем рандомизировать климатическое изменение относительно изменения полиморфизма Шотландской национальной партии и сделать это тысячи и тысячи времен и спросить, какая испытательная статистическая величина могла бы мы наблюдать случайно один», сказал Джуенджер. «Мы можем сравнить это с нашими реальными, эмпирическими данными».

Вычислительные проблемы были пугающими, включив тысячи отдельных напряжений Arabidopsis с сотнями тысяч маркеров через геном и проверив на дюжину экологических переменных. «Невозможно сделать это на стандартном настольном компьютере, и требуется часть пропускной способности, которую мы можем иметь на группе как Stampede или Lonestar», сказал Джуенджер. «Вычислительное время на группах в TACC позволило нам оценивать гипотезу, которая произвела от данных Шотландской национальной партии».Лаский добавил, что, «чтобы управлять этими моделями через геном, у Вас быстро заканчивается время.

Это – действительно просто проблема, где Вы делаете много небольших вещей многие, много раз. Намного легче достигнуть этого, когда Вы можете управлять той проблемой на многих ядрах через группу.

Это было проблемой».«У меня не было опыта с высокой эффективностью, вычисляя перед этим», Лаский доверялся.Лаский обратился к Вэйцзя Сюю, лидерству группы для Data Mining and Statistics Group в TACC. «Он помог мне ориентировать меня на то, какую проблему я имел и как увеличить это, чтобы управлять ею на некоторых группах», сказал Лаский. Сюй, которому также помогают, сочиняя параметрическую пусковую установку работы, которая позволила Ласкому получать свое отдельное, натыкается на геном, начатый более легко.

«Это был кодекс, который я разработал, чтобы начать многократные рабочие места R в параллели, используя интерфейс MPI», сказал Сюй относительно пусковой установки. Ученые обычно используют статистический язык программирования R; и MPI короток для Интерфейса Прохождения сообщения, который является библиотекой программного обеспечения, которая разбивает большие вычислительные рабочие места в меньшие, чтобы бежать параллельно на узлах группы.

Финансируемое NSF iPlant Совместное помогает биологам использовать высокоэффективные компьютеры. Джуенджер отметил, что «iPlant, связанный с TACC, конечно разрабатывал много новых инструментов, упрощая вычислительные аппараты для биологов, и предоставляя нам доступ к единицам хранения, а также обслуживания данных через высокую эффективность вычислительные группы как те в TACC. Это – полезная, своевременная программа, это влияет на биологов завода в отдельных лабораториях по всей стране».

Лаский отмечает, что, в то время как результаты эксперимента с Arabidopsis обещают, больше подтверждения необходимо. «У нас есть экспериментальная работа здесь, но мы экспериментально не показали, что гены, которые мы определили, вызывают локализованную адаптацию».


Блог Ислама Уразова