Как мы связаны? Легкий технологический процесс, чтобы найти семейства генов

Соавтор, Уилфрид Хэерти объяснил, почему этот инструмент так полезен для биологов: «Программное обеспечение, разработанное в Институте Earlham, позволяет ученым исследовать разновидности интереса, используя гибкий и восстанавливаемый трубопровод. Исполнение нашего технологического процесса было оценено на позвоночных собраниях генома различных качеств (утконос, свинья, лошадь, собака, мышь и человек).

Разновидности были отобраны, чтобы оценить воздействие качества генома на идентификации семейств генов. Мышь, собака и геномы человека имеют высокое качество, тогда как эти три других на различных стадиях аналитического завершения».На основе и существующий Генный трубопровод Деревьев EnsemblCompara расширяющегося Энсембла, технологический процесс GeneSeqToFamily удаляет много сложных предпосылок процесса, таких как необходимость использовать командную строку, чтобы установить большое количество отдельных инструментов, преобразовывая целый процесс в Галактику; намного более простая платформа, чтобы использовать.

Значительно, технологический процесс очень настраиваем, позволяя пользователям выбрать параметры, инструменты изменения и управлять программным обеспечением на их собственных генах, не имея необходимость использовать базу данных Ensembl.Не только технологический процесс, GeneSeqToFamily содержит много новых, автономных инструментов Галактики, включая TreeBeST, hcluster_sg, T-кофе и ETE. Развитый в EI Анилом Тэнки и Николой Соранцо из Data Infrastructure Group, программное обеспечение делает процесс из нахождения и создания филогенетических деревьев легче, используя диапазон открытых платформ и баз данных.

Анил Тэнки, Научный Программист, сказал: «Мы счастливы поместить нашу работу в открытую область, где это позволяет биологам и bioinformaticians использовать Трубопровод Ensembl Compara GeneTrees в простом, графическом интерфейсе пользователя и изменять его в случае необходимости».Команда надеется, что новый технологический процесс поможет пользователям, незнакомым со сложностями, связанными с использованием Compara быть в состоянии более легко проанализировать филогенетические наборы данных, сопоставляя много полезных инструментов семейства генов в одном технологическом процессе Галактики.

Пользователи могут или выбрать существующие базы данных Ensembl, чтобы использовать в качестве множеств элементарных исходов для их анализа или обеспечить их собственные данные в том же самом формате, и инструменты – то, при условии, что может помочь.Институт Earlham стремится обеспечивать инструменты и алгоритмы, чтобы поддержать, позволить и развивать вычислительную биологию и исследование наук о жизни, с проектами, такими как помощь Галактики к открытому доступу к диапазону научных инструментов и баз данных.

Группа Инфраструктуры Данных, во главе с доктором Робом Дэйви, также поддерживает ресурсы, такие как CyVerse Великобритания и COPO, которые, вместе с Галактикой, расширяют доступность и удобство использования вычислительных ресурсов более широкому научному сообществу в Великобритании и на международном уровне через Национальную Способность EI в электронной инфраструктуре.