Google DeepMind открыла исходники и веса AlphaGenome — модели, которая берёт на вход очень длинные участки ДНК и предсказывает, как некодирующие регионы могут влиять на работу генов. Это может ускорить поиск причин редких заболеваний и помочь при анализе мутаций в онкологии.
Google DeepMind выложила в открытый доступ код и веса модели AlphaGenome для некоммерческого использования. Её ключевая особенность — умение анализировать последовательности ДНК длиной до 1 миллиона пар оснований за один проход и оценивать, как изменения в «некодирующих» областях могут влиять на работу генов.
Почему это важно: «не кодирует» — не значит «не влияет»
Большая часть человеческой ДНК не «содержит инструкции» для сборки белков. Долгое время такие участки воспринимались как второстепенные, но именно они часто управляют тем, когда и насколько активно включаются гены. Проблема в том, что экспериментально проверять влияние каждой буквы ДНК — дорого и медленно. AlphaGenome пытается закрыть этот разрыв: она прогнозирует функциональные эффекты по самой последовательности.
Что умеет AlphaGenome
- Длинный контекст: вход до 1 Мб (в публикации подчёркивается, что это примерно вдвое больше возможностей предшественников по длине окна).
- Много задач одновременно: модель предсказывает тысячи «профилей» по 11 типам сигналов — среди них, например, экспрессия генов, доступность хроматина, сплайсинг и связывание транскрипционных факторов.
- Архитектура: в основе — U-Net с трансформерами; последовательность разбивается на фрагменты по 131 тысяче пар оснований и обрабатывается параллельно на нескольких устройствах.
- Результаты тестов: в сравнительных проверках AlphaGenome обошла специализированные инструменты в 25 из 26 задач, связанных с прогнозированием эффектов генетических вариантов.
Где это может пригодиться на практике
1) Редкие и «неразгаданные» заболевания. В заметке приводится пример из медицинской практики: на хакатоне в сентябре 2025 года исследователи использовали AlphaGenome, чтобы искать возможные причины 29 случаев наследственных заболеваний без ясного объяснения. В одном из кейсов модель предсказала влияние мутации на экспрессию генов в клетках сердца — и это совпало с экспериментальными данными.
2) Онкология и фильтрация мутаций. При сравнении геномов здоровых и раковых клеток обычно возникает «шум»: тысячи одиночных замен, и непонятно, какие из них реально что-то меняют. AlphaGenome может ранжировать такие изменения по вероятности функционального эффекта, помогая быстрее сфокусироваться на кандидатах для дальнейшей проверки.
Что означает открытие кода и весов
Публикация исходников и весов — это шанс для академических команд и исследовательских лабораторий:
- быстрее воспроизводить результаты и проверять ограничения модели;
- делать прикладные надстройки: пайплайны для приоритизации вариантов, отчёты для клиник, инструменты для исследовательских задач;
- снижать порог входа для экспериментов, когда нужно «поиграть» с гипотезой до того, как запускать дорогую лабораторную проверку.
Практическая оговорка
Даже сильные предсказания модели не заменяют лабораторную валидацию. Самый полезный сценарий — использовать AlphaGenome как умный фильтр и систему приоритизации: она помогает понять, куда смотреть сначала, но финальное «да/нет» остаётся за экспериментом и клинической интерпретацией.
