Российская компания Genotek разработала метод на основе искусственного интеллекта, который определяет этническое происхождение человека по его тесту ДНК. Точность метода — 99%.
Эксперты опросили своих клиентов из российских городов о национальности их бабушек и дедушек. Также использовались данные партнёров компании и открытые источники. Затем специалисты определили эталонных представителей народов. К ним относятся люди, чьи бабушки и дедушки имеют одинаковое происхождение. Во время второго этапа генетики давали на исследование алгоритму ДНК людей со смешанным происхождением.
Всего были проанализированы представители 168 народов. Эксперты сформировали 102 кластера, в них были включены от 1 до 15 этносов и субэтносов. Эти кластеры были распределены по региональным группам: восточные славяне, народы Северного Кавказа и другие.
Так, при сравнивании геномов людей, относящихся к русским, украинцам или белорусам, алгоритм с высокой долей вероятности может утверждать, что человек относится к данной конкретной популяции.
Исследователи подчёркивают, что не каждый русский геном отличается от украинского и белорусского генома. Не всегда удаётся провести чёткую границу между этими народами.
Для русских разработанный нами алгоритм только в 58% случаев позволяет с точностью 91% говорить о том, что исследуемый геном более характерен именно русским, нежели украинцам, белорусам или мордвинам, — заявил директор по продукту Genotek Александр Ракитько.
Для обработки данных специалисты использовали дата-центры «Яндекса». Объём анализируемых данных превысил 0,5 петабайта.
Ранее NEWS.ru писал, что историю человечества предложили сохранять в ДНК микробов.