Авторы использовали компьютерные моделирования на основе 440 преклинических исследований через 13 других отношений в моделях животных удара, сердечного приступа и рака молочной железы, и сравнили воспроизводимость результатов между одно-лабораторными и мультилабораторными исследованиями. Их результаты указывают, что мультилаборатория учится – или другие способы создать более разнообразные образцы исследования – могут значительно улучшить воспроизводимость результатов эксперимента.
Чтобы моделировать такие мультилабораторные исследования, исследователи объединили данные из многократных исследований, как будто несколько лабораторий провели их параллельно. Они нашли, что одно-лабораторные исследования произвели большее изменение между результатами исследования. Напротив, мультилабораторные исследования, включая только две – четыре лаборатории, привели к намного более последовательным результатам, таким образом увеличив воспроизводимость без потребности в больших объемах выборки. «Наши результаты демонстрируют, что стандартизация – причина плохой воспроизводимости, поскольку это игнорирует биологически соответствующее изменение», говорят ведущий автор профессор Хэнно Вербель, директор по Разделению Защиты животных в Бернском университете.Ученые сначала выбрали 50 независимых исследований эффекта управления температурой тела (гипотермия) на объеме инфаркта, индикаторе серьезности удара, в разъедающих моделях удара.
Метаанализ этих 50 исследований показал, что гипотермия уменьшает серьезность удара приблизительно на 50%, которые они использовали в качестве критерия, с которым они сравнили точность и воспроизводимость результатов единственного – и мультилабораторные исследования включая два, три, или четыре лаборатории. Пропорция исследований, которые точно предсказали 50%-е сокращение объема инфаркта, увеличилась из-под 50% в исследованиях единственной лаборатории к 73% в исследованиях с двумя лабораториями к 83% в исследованиях с тремя лабораториями, и к 87% в исследованиях с четырьмя лабораториями. «Это увеличение пропорции точных результатов исследования с растущими числами лабораторий отражает улучшенную воспроизводимость результатов мультилабораторных исследований», говорит соавтор доктор Бернхард Фелкль.
Исследователи тогда копировали тот же самый анализ с 12 дальнейшими лечениями в моделях животных удара, сердечного приступа и рака молочной железы, чтобы оценить, были ли их результаты generalizable; во всех случаях они нашли увеличение точности и воспроизводимости с растущим числом участвующих лабораторий. Они также моделировали различные объемы выборки и нашли это вместо того, чтобы решить проблему, просто увеличив объем выборки в одно-лабораторных исследованиях, сделанных хуже вещами, с большими объемами выборки, отдающими еще менее точные результаты.
Эти результаты демонстрируют, что стандартизация – главная причина плохой воспроизводимости в преклиническом исследовании животных. Плохая воспроизводимость подвергает сомнению выгоду экспериментов на животных и создает потребность в дополнительном, копируют эксперименты, которые будут проводиться, чтобы ответить на данный вопрос исследования окончательно. «Наши результаты показывают, что более представительные образцы исследования улучшат воспроизводимость исследования животных и предотвратят пропадающих впустую животных и другие ресурсы для неокончательного исследования», заявляет Ханно Вербель. Он далее завершает, «Мультилабораторные исследования должны заменить стандартизированные одно-лабораторные исследования в качестве золотого стандарта, по крайней мере для последней фазы преклинические испытания». Эти улучшения не требуют ни многих участвующих лабораторий, ни больших объемов выборки.
Действительно, самое большое улучшение воспроизводимости наблюдалось между одно-лабораторными исследованиями и исследованиями, вовлекающими две лаборатории.