Вычислительные эксперименты
На данной странице представлены краткие отчеты о наиболее интересных и показательных расчетах для реальных прикладных задач, проведенных с использованием различных версий систем метакомпьютинга семейства X-Com.
1. Определение скрытой периодичности в генетических последовательностях
Совместно с Центром "Биоинженерия" РАН с решалась задача по определению скрытой периодичности в генетических последовательностях. Расчет продолжался трое суток с использованием в общей сложности около 400 компьютеров, взаимодействующих через Интернет и расположенных в 8 городах, 10 организациях и 6 часовых поясах. Несмотря на значительную удаленность компьютеров друг от друга, эффективность работы всей среды в целом превысила 95%. Один обычный компьютер справился бы с такой задачей лишь за два года непрерывной работы.
2. Задачи дифракции электромагнитного поля
Серия задач дифракции электромагнитного поля решалась совместно с Пензенским государственным университетом.
2.1. Задача дифракции электромагнитного поля на локально неоднородном диэлектрическом анизотропном теле произвольной формы
Для решения этой задачи были задействованы только простаивающие ресурсы вычислительных кластеров НИВЦ МГУ, т.е. задача считалась на фоне основной работы вычислительного комплекса. Над задачей работали 150 процессоров в пике, в среднем число одновременно работавших процессоров составляло 53. В расчете участвовало несколько различных типов процессоров, от Pentium III/500 МГц до Xeon 2.6 ГГц.
Общее время эксперимента составило 26 дней 19 часов, суммарное время работы узлов - 34582 часа. Было обработано 3.653.832 вычислительные порции, время обработки одной порции варьировалось от 1 сек. до 2 мин. 44 сек.
В процессе эксперимента объем переданных данных составил 589 Мбайт. Эффективность работы системы составила 98.64 %.
2.2. Задача дифракции электромагнитного поля в экранированных слоях, связанных через отверстие в экране.
Задача была реализована в виде двух программ на языке C++, каждая из которых представляла собой вычисление элементов матрицы размером 4095x4095.
Решение каждой задачи было разбито на 16778 порций по 1000 элементов в каждой. Для решения были задействованы ресурсы суперкомпьютерного центра НИВЦ МГУ: кластеры Ant (узлы 2x AMD Opteron 248 2.2 ГГц, RAM 4 Гб, SUSE Linux 9), Aqua (узлы 2x Intel Pentium III 1 ГГц, RAM 1 Гб, RedHat Linux 7.3) и Leo (узлы 2x Intel Xeon 2.6 ГГц, RAM 2 Гб, RedHat Linux 7.3). Вычисления производились на фоне штатной работы кластеров центра, т.е. в те моменты, когда его узлы не были заняты пользователями. Задачи были решены за 21 и 26 часов. Суммарное процессорное время по двум задачам составило 4709 процессорочасов или 0.5 процессорогода - столько работал бы один компьютер над решением этих задач. Среднее время обработки порций составляло 7-10 минут.
Всего в расчете принимало участие 90 узлов и 184 процессора, причем максимальное число процессоров, одновременно работавших над задачей, достигало 144. Расчет продемонстрировал высокую коммуникационную эффективность (99.7%), что было обусловлено достаточно большим временем обработки каждой порции (до 20 минут). Средний показатель комплексной эффективности (соотношения числа отправленных и принятых порций) составил 81.7%, причем наименьшим он был на кластере Ant (72%) из-за регулярных остановок и перезапусков клиентов на узлах, а наибольшим на узлах кластера Aqua (97.6%) и процессорного полигона (99.5%).
Публикации:
- Воеводин В.В., Смирнов Ю.Г., Филамофитский М.П., Цупак А.А. Решение задачи дифракции на диэлектрическом теле методом объемных интегральных уравнений на многопроцессорных системах // Актуальные проблемы науки и образования. Труды Международного юбилейного симпозиума. Пенза: Информационно-издательский центр ПГУ, 2003. 5-8.
- М.Ю. Медведик, Ю.Г. Смирнов, С.И. Соболев. Параллельный алгоритм расчета поверхностных токов в электромагнитной задаче дифракции на экране // Вычислительные методы и программирование. 2005. Том 6, №1. 86-95.
3. Поиск молекул-ингибиторов для заданных белков-мишеней (виртуальный докинг)
Расчеты для задачи виртуального докинга проводятся совместно с ИБМХ РАМН. Данная задача относится к начальному этапу разработки новых лекарственных средств.
3.1. Рождественский эксперимент
Условия задачи - моделирование взаимодействия 5 различных белков (тромбин и 4 модификации ВИЧ-протеазы) с 2123 молекулами из базы данных NCI-Diversity. Всего требовалось обработать 10615 вычислительных порций.
Расчет проводился в дни рождественских каникул (31.12.05-11.01.06), на это время удалось подключить к расчетам следующие компьютерные ресурсы: 101 узел суперкомпьютерного комплекса НИВЦ МГУ, 18 узлов вычислительного кластера Infinity ЮУрГУ (г. Челябинск), 5 рабочих Windows-станций НИВЦ МГУ, Linux-сервер НИВЦ МГУ, 29 Windows-машин компьютерного класса НИВЦ МГУ.
Всего в расчете было задействовано 273 процессора в 154 узлах, из которых 120 узлов работали под управлением ОС Linux, остальные 34 - под управлением ОС Windows. Время обработки одной порции во всем расчете варьировалось от 50 минут до 20 часов, в среднем оно составляло 3-4 часа. Всего в общей сложности эксперимент продолжался 232 часа, при этом суммарное процессорное время составило 42774 процессоро-часа, т.е. 4,8 процессоро-лет. Суммарная производительность распределенной вычислительной среды в основное время расчета превысила 1 Tflops.
3.2. Фестивальный расчет
Расчет проводился в два этапа: 27.10.06-30.10.06 и 03.11.06-09.11.06.
Первый этап приходился на период выходных и праздничных дней, поэтому к расчетам было подключено значительное число компьютерных ресурсов, а именно: 104 узла суперкомпьютерного центра НИВЦ МГУ, 4 узла вычислительного полигона НИВЦ МГУ, 3 рабочие Windows-машины НИВЦ МГУ, 4 узла вычислительного кластера ВМиК МГУ, 17 Windows-машин (рабочие станции и компьютерный класс) ОИЯИ (г. Дубна), 126 Windows-машин компьютерных классов Университета "Дубна", 24 узла вычислительного кластера Infinity ЮУрГУ (г. Челябинск), 16 узлов вычислительного кластера БашГУ (г. Уфа).
Всего над задачей работало около 300 узлов и 450 процессоров, при этом суммарная производительность распределенной среды превысила 2 Tflops. Основным режимом работы был монопольный режим использования подключенных ресурсов. На втором этапе подключалось уже меньшее число ресурсов, часть из которых использовалась по занятности, т.е. в моменты, свободные от штатной работы. Всего на втором этапе было задействовано около 350 процессоров. Моделирование производилось с очень высокой точностью, поэтому среднее время обработки одной порции на узле составляло 23-24 часа. Всего за время эксперимента было обработано 1892 вычислительные порции. В общей сложности эксперимент продолжался 205 часов, при этом суммарное процессорное время составило 45470 процессорочасов, т.е. свыше 5 процессоролет.
3.3. Расчет на суперкомпьютере СКИФ МГУ
Расчет проводился на суперкомпьютере СКИФ МГУ в следующем режиме: около 1000 процессорных ядер были зарезервированы для расчета и использовались монопольно, остальные процессоры подключались к расчету в те моменты, когда они не были заняты заданиями из штатной системы очередей.
Расчет был разбит на 6 этапов (по числу белков-мишеней).
Расчет продолжался около 80 часов, суммарное процессорное время составило 176434 процессорочаса (около 20 процессоролет). В ходе расчета было обработано 24904 вычислительные порции, время обработки каждой порции находилось в диапазоне от полутора до 13 часов.
Публикации:
- Сулимов В.Б., Романов А.Н., Григорьев Ф.В., Кондакова О.А., Лущекина С.В., Соболев С.И. Оценка энергии связывания белок-лиганд с учетом растворителя и программа докинга SOL: принцип работы и характеристики, Сборник материалов XIII российского национального конгресса "Человек и лекарство" 3 апреля 2006 г., 2006, с. 37.
- В.Б. Сулимов, А.Н. Романов, Ф.В. Григорьев, О.А. Кондакова, А.В. Сулимов, С.Н. Жабин, С.И. Соболев; Веб-ориентированная система молекулярного моделирования Keenbase для разработки новых лекарств, Труды Всероссийской научной конференции "Научный сервис в сети Интернет: Технологии параллельного программирования" (г. Новороссийск, 18-23 сентября 2006 г.), 2006, с. 170-172.
- Соболев С.И. Использование распределенных компьютерных ресурсов для решения вычислительно сложных задач // Системы управления и информационные технологии. 2007, №1.3 (27). С. 391-395.
|