Большой инструмент данных начинает новую эру для биологии и персонализированной медицины

Этот сделанный на заказ медицинский подход основан на предпосылке, что предсказание, диагностируя и леча заболевание отличается между людьми и зависит от их личной наследственной изменчивости, объединенной в их определенной среде. Но сделать персонализированную медицину реальностью, нам сначала нужно более глубокое понимание взаимодействия между генетикой, окружающей средой и болезнью.

Чтобы сделать это, сотни исследовательских групп работали над популяцией мышей, названной BXD. Эта популяция мышей использовалась в качестве модели, чтобы изучить генетическое основание фенотипичных черт и болезней. За несколько десятилетий тысячи наборов данных о фенотипе из мышей BXD были собраны в базы данных, в пределах от цвета пальто к продолжительности жизни.Кроме того, исследователи также собрали очень большие молекулярные наборы данных, связанные с экспрессией гена в различных органах мышей BXD, таких как уровни mRNA, белков и метаболитов.

К настоящему времени сообщество BXD собрало приблизительно 300 миллионов точек данных фенотипа от этих животных, произведя безусловно самое большое последовательное «явление» (ряд всех фенотипов, выраженных в организме) для любого животного экспериментальная когорта. Короче говоря, явление BXD – прекрасный ресурс для моделирования народонаселения для генетических исследований.

«Эти богатые и большие данные о явлении остаются, однако, в основном неразработанными, поскольку они трудные к доступу, и инструменты, чтобы проанализировать их требуют передовых навыков», говорит Йохан Оверкс, лаборатория которого в EPFL привела исследование с коллегами из Германии, Нидерландов и США, а также преподавателями EPFL Кристиной Скунджэнс и Штефаном Моргенталером.Ученые решили проблему, организовав все это знание в облачном хранилище данных, которое объединяет все 300 миллионов точек данных, собранных в популяции мышей BXD. Исследователи развивали простой в использовании набор инструментов, который может использоваться, чтобы объединить различные слои «omics» данных из популяции мышей BXD.Набор инструментов уже онлайн по systems-genetics.org и, как ожидают, значительно облегчит открытие генов-генных связей и генного фенотипа.

Ученые уже использовали ресурс, чтобы определить сотни тысяч ассоциаций генных фенотипов, многие из которых абсолютно новые. «Один поразительный пример – связь между рибосомным белком Rpl26 и массой тела», говорит Хао Ли, первый автор статьи. «Мыши, наследующие этот ген от одного родителя, в среднем 10-летние g более тяжелый, чем их кузены».Набор инструментов может быть применен к любому населению с доступными многослойными данными отличной природы (называемый «multi-omics данные»). Это позволяет повторному использованию существующих данных сделать новые открытия. «Результаты в населении вообще прочны и переводят хорошо через когорты и разновидности – создание данных, непосредственно относящихся к человеческой биологии», говорит Ли.

«Мы внесли все данные и набор инструментов в общественной платформе, которая поможет исследователям определить и утвердить функции своих генов интереса», говорит Оверкс, помещая проект в контексте продолжающихся усилий EPFL продвинуть открытую науку. «Этот ресурс действительно – одно из первых усилий принести биологию в облако и кладет краеугольный камень новой эры биологии. Врачи скоро будут в состоянии использовать ресурсы аналогичного характера, чтобы персонализировать лечения их пациентов».