Из третьего мира - в первый: ошибки в развивающихся продуктах (AgileDays 2014) Michael KarpovИз третьего мира - в первый: ошибки в развивающихся продуктах (AgileDays 2014)
Вычислительная и коммуникационная инфраструктура Академгородка и СО РАНBDA«Вычислительная и коммуникационная инфраструктура Академгородка и СО РАН»
Максим Александрович Городничев, м.н.с. ИВМиМГ СО РАН
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...ITMO UniversityПредлагается распараллеливание в технологии программно-аппаратной архитектуры (CUDA) алгоритма обучения радиально-базисной нейронной сети (RBFNN), основанного на идее последовательной настройки центров, ширины и весов сети, а также идее коррекции весов по алгоритму минимизации квадратичного функционала методом сопряженных градиентов. Приводятся результаты сравнения времени обучения RBFNN на различных центральных и графических процессорах, доказывающие эффективность распараллеливания.
Доклад к защите кандидатской диссертацииАндрей ГайнулинДоклад к защите кандидатской диссертации. Тема "Управление ресурсами в в беспроводной сети с переменной топологией"
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Cisco Russia 1. Архитектура линейного шасси
2. Линейные карты для Cisco NCS6000
3. Оптические трансиверы
4. Архитектура мультистоечной конфигурации
5. Особенности операционной системы
Кулагин И.И., Пазников А.А., Курносов М.Г. Оптимизация информационных обменов...Alexey PaznikovДоклад Кулагина И.И., Пазникова А.А., Курносова М.Г. "Оптимизация информационных обменов в параллельных PGAS-программах" на 3-й Всероссийской научно-технической конференции «Суперкомпьютерные технологии» (СКТ-2014)
29 сентября – 4 октября 2014 г., с. Дивноморское
EdCrunch 2018 - Skyeng - EdTech product scaling: How to influence key growth ...Michael KarpovSkyeng company case:
"EdTech product scaling: How to influence key growth indicators and achieve rapid progress. Product VS Marketing look"
Global conference for technology in education #EdCrunch
https://2018.edcrunch.ru/en/
Movement to business goals: Data, Team, Users (4C Conference)Michael KarpovIn this talk Mikhail Karpov discuss the methods used to move to business goals faster on example of VK.com processes, including teams flexible structure and feedback loop from service audience
More Related Content
Similar to якобовский - введение в параллельное программирование (2) (20)
Вычислительная и коммуникационная инфраструктура Академгородка и СО РАНBDA«Вычислительная и коммуникационная инфраструктура Академгородка и СО РАН»
Максим Александрович Городничев, м.н.с. ИВМиМГ СО РАН
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...ITMO UniversityПредлагается распараллеливание в технологии программно-аппаратной архитектуры (CUDA) алгоритма обучения радиально-базисной нейронной сети (RBFNN), основанного на идее последовательной настройки центров, ширины и весов сети, а также идее коррекции весов по алгоритму минимизации квадратичного функционала методом сопряженных градиентов. Приводятся результаты сравнения времени обучения RBFNN на различных центральных и графических процессорах, доказывающие эффективность распараллеливания.
Доклад к защите кандидатской диссертацииАндрей ГайнулинДоклад к защите кандидатской диссертации. Тема "Управление ресурсами в в беспроводной сети с переменной топологией"
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Cisco Russia 1. Архитектура линейного шасси
2. Линейные карты для Cisco NCS6000
3. Оптические трансиверы
4. Архитектура мультистоечной конфигурации
5. Особенности операционной системы
Кулагин И.И., Пазников А.А., Курносов М.Г. Оптимизация информационных обменов...Alexey PaznikovДоклад Кулагина И.И., Пазникова А.А., Курносова М.Г. "Оптимизация информационных обменов в параллельных PGAS-программах" на 3-й Всероссийской научно-технической конференции «Суперкомпьютерные технологии» (СКТ-2014)
29 сентября – 4 октября 2014 г., с. Дивноморское
EdCrunch 2018 - Skyeng - EdTech product scaling: How to influence key growth ...Michael KarpovSkyeng company case:
"EdTech product scaling: How to influence key growth indicators and achieve rapid progress. Product VS Marketing look"
Global conference for technology in education #EdCrunch
https://2018.edcrunch.ru/en/
Movement to business goals: Data, Team, Users (4C Conference)Michael KarpovIn this talk Mikhail Karpov discuss the methods used to move to business goals faster on example of VK.com processes, including teams flexible structure and feedback loop from service audience
"Пользователи: сигнал из космоса". CodeFest mini 2012Michael KarpovО способах получения обратной связи от пользователей в российских и иностранных интернет-компаниях.
Также, на основе различных жизненных кейсов рассмотрим их полезность и применимость.
Михаил рассмотрит основные случаи и всякие примеры применения на основе Яндекса и нескольких других российских и иностранных компаний.
(Analyst days2012) Как мы готовим продукты - вклад аналитиковMichael KarpovО том как живётся аналитикам в продуктовой разработке в Яндексе - про их задачи на различных этапах жизни сервиса.
Как сделать команде приятное - Михаил Карпов (Яндекс)Michael KarpovКоманде приятное можно сделать разными способами.
Этот доклад о том, как это сделать с помощью вашего процесса.
Многие понимают то, что важно вовлекать команду в продукт, но также важно вовлекать команду в ваш процесс.
Для этого ваш процесс должен коротко и доходчиво отвечать на вопросы команды.
О них и поговорим.
Hpc Visualization with X3D (Michail Karpov)Michael KarpovThe document describes two modes of data analysis for workload rendering on server clusters:
1. General system analysis uses a molecular metaphor to visualize task load across cluster nodes over time, allowing users to identify bottlenecks.
2. Detailed task analysis uses a greenhouse metaphor to test individual tasks under varying hardware/software parameters and identify bottlenecks like CPU, memory, or disk limitations.
Both modes aim to optimize workload distribution and resource usage across clusters.
сбор требований с помощью Innovation gamesMichael KarpovЗа основу были взяты бизнес-игры от Люка Хоммана: innovationgames.com
Они представлены ниже в презентации: "Начни новый день", "Product Box", "Воспоминания о будущем", "Удиви клиента", "Катер", "Паутина".
Практическое занятие было не лишено соревновательного характера:
в первой части команды "разработчиков" собирали неявные знания с "пользователей", а во второй части должны были предложить им каждый свой продукт.
Естественно, что пользователи выбирают наиболее понравившийся (то есть наиболее удовлетворяющий их потребностям) и команда, предложившая данный продукт, побеждает.
Зачем нам Это? или Как продать agile командеMichael KarpovМы все сталкиваемся с ситуациями когда сложно работать с Заказчиком по Agile и уговорить его на подобный способ коммуникации.
Также, часто команде сложно уговорить своего менеджера.
Но!
Бывает и иначе: менеджер предлагает внедрять Agile, а команда "не до конца уверена"...
Именно о такой ситуации и рассказывает этот доклад!
HPC VisualizationMichael KarpovThe document describes a software system being developed to visually monitor the workload of cores in a high-performance manycore computer architecture. The system receives data about the state of cores in a computing system, analyzes the data, and displays it visually with remote web access. Compared to other software for visually monitoring multiprocessor systems, this system provides a visual display of processed data on the state of cores based on analysis of inter-core messages and characteristics of individual cores. The system is being developed using Microsoft Visual Studio 2008 on a 16-core Windows cluster at Polytechnic University and will aid in analyzing and monitoring complex systems and their components during different workload modes.
Hpc VisualizationMichael KarpovThe document discusses the development of a system for visual monitoring of workloads on high-performance multi-core computer clusters. The system provides visual analysis and performance monitoring of clusters and their components. It was developed using Microsoft tools on a 16-node Windows HPC Server 2008 cluster. The system displays program characteristics, core memory usage, and process status to help optimize parallel programs.
How to give a great research talkMichael KarpovSimon Peyton Jones provides advice on how to give a great research talk in 3 sentences or less:
The purpose of a research talk is to engage the audience and make them eager to read your paper, not to impress them or present all details; the talk should motivate the key idea in the first 2 minutes and then focus 80% on the idea with examples, leaving out technical details and related work. Enthusiasm is the most potent tool for presenting an exciting talk that keeps the audience awake and makes them glad they attended.
20090720 writing a_paperMichael KarpovThis document provides advice on how to write a great research paper. It recommends structuring the paper with an abstract, introduction, sections on the problem and idea, details supporting the claims, related work, and conclusions. The introduction should describe the problem, state the contributions, and reference later sections. Presenting the idea using examples before the general case helps readers. Providing evidence in later sections to support claims from the introduction is important. Give credit to other work and engage experts to improve the paper before publication.
якобовский - введение в параллельное программирование (2)
1. Балансировка загрузки процессоров Институт математического моделирования Российской академии наук mail: [email_address] web: http://lira.imamod.ru Нижний Новгород 2009 М.В.Якобовский
2. Задачи большого вызова ( Kenneth G. Wilson , Cornell University , 1987) Вычислительная газовая динамика: Создание летательных аппаратов, эффективных автомобилей Предсказание погоды, и глобальных климатических изменений Оптимизация нефтедобычи , … Молекулярная динамика: Создание материалов с заданными свойствами Разработка новых лекарственных соединений Сверхпроводимость, Свойства веществ в экстремальных состояниях, … Символьные вычисления Распознавание речи Компьютерное зрение Изучение сложных систем Автономные системы управления Квантовая хромодинамика и теория конденсированных сред Управляемый термоядерный синтез, Геном человека, … http://en.wikipedia.org/wiki/Grand_Challenge
3. Дозвуковая аэродинамическая труба Т-104, ЦАГИ Скорость потока 10–120 м/с Диаметр сопла 7 м Длина рабочей части 13 м Мощность вентилятора 28.4МВт http://www.tsagi.ru/rus/base/t104 Суперкомпьютер СКИФ МГУ «ЧЕБЫШЁВ» Пиковая производительность 60 TFlop/s Мощность комплекса 0.72МВт http://parallel.ru/cluster/skif_msu.html
8. Суперкомпьютеры Не просто составляют конкуренцию натурному эксперименту, но: Необходимы для его проведения Позволяют делать то, что натурный эксперимент делать не позволяет
9. Суперкомпьютеры Используются неэффективно и далеко не в полной мере Необходимы: Вычислительное ядро: адаптация алгоритмов к архитектуре многопроцессорных систем с распределённой памятью Специальное математическое обеспечение: визуализация, генерация сеток, рациональное разбиение на подобласти, динамическая балансировка загрузки процессоров, использование CAD -технологий, использование гетерогенных систем и GRID -технологий Интеграция в единый программный комплекс
13. НЕВЯЗКОЕ ОБТЕКАНИЕ КУЗОВА АВТОМОБИЛЯ Сетка: 209 028 730 узлов, 1 244 316 672 тетраэдра ( 24 Гб) МВС: МВС-100К 1. Запуск задачи на 128, 192, 256, 320, 384 и 437 модулях с порождением 2 и 4 параллельных MPI процессов (до 1748 параллельных процессов). 2. Запуск задачи на 437 модулях в рамках гибридной модели параллелизма MPI + OpenMP ( 3496 параллельных процессов)
14. Суперкомпьютеры МСЦ РАН: процессор: Intel(R) Xeon(R) CPU X5365 @ 3.00GHz ядер на узел: 8 память узла: 4/8 Гб число узлов: 782 (6256 ядер) коммуникации: InfiniBand DDR производительность: 75 TFLOPS СКИФ МГУ: процессор: Intel(R) Xeon(R) CPU E 5472 @ 3.00GHz ядер на узел: 8 память узла: 8 Гб число узлов: 630 (5040 ядер) коммуникации: InfiniBand DDR производительность: 60 TFLOPS
16. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Звукопоглощающие конструкции Панель ЗПК Расчетная область Резонатор Акустические волны в импедансной трубе Сотовая конструкция резонаторов Перфорированный экран
17. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Эксперимент 1 : Модель 2 D и 3D импедансной трубы 2 D задача Концентрация сетки около горла резонатора Размер сетки до 90К узлов 3D задача Размер сетки до 1М узлов
19. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Эффект свиста Слой смешения Возмущения плотности Эксперимент 2 : 2 D канал с резонаторами ( 2 /2)
20. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Базовая численная схема ( 1 / 2 ) Декартова сетка Неструктурированная треугольная сетка Медианные ячейки Ячейки на центрах описанных окружностей 2D контрольные объемы 3D контрольные объемы Декартова сетка Неструктурированная тетраэдральная сетка
21. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Базовая численная схема Пространственный шаблон для определения потока между узлами I и J 2D треугольная сетка 3D тетраэдральная сетка 2D шаблон высокого порядка: Противопоточные треугольники + соседи 3D шаблон высокого порядка: Противопоточные тетраэдры + соседи (сложность для распараллеливания)
22. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Канал с 5 резонаторами Уравнения Эйлера, нет погранслоя, М=0.4 Возмущения плотности Применимость не только суперкомпьютеров, но и Grid технологий
23. Институт Математического Моделирования РАН 125047, M иусская пл. 4а, Москва Heat and Mass Transfer Technological Center Colom 11, E-08222, Terrassa, Barcelona, Spain Производительность вычислений Две различные параллельные системы использовались для тестов 1) Типичный малобюджетный кластер с обычной сетью Ethernet Узел : 2 CPU Intel Xeon 3GHz Сеть : Ethernet 1Gbit 2) “ Продвинутый ” кластер с высокопроизводительной сетью низкой латентности Узел : 2 CPU AMD Opteron 2.4Hz Сеть : Myrinet Эти системы имею существенно различное отношение производительности процессора и сети Тестовая задача : Модельная 2D задача – импедансная труба . Размер сетки 80 000 узлов, схема 5- го порядка Пример разбиения сетки
38. Разбиение тетраэдральной сетки, содержащей 2∙10 8 узлов, на 125 процессорах вычисления производились на кластере СКИФ МГу (1250 4-хядерных процессоров, 60 TFlop/s) геометрическая декомпозиция ParMETIS число доменов 80 000 20 000 время 21 сек. 10 сек. число вершин в домене 2612 2613 2 328 10 932 мин. макс. среднее число связей с соседними доменами 14 14 число некомпактных доменов 229 364
39. Фрагмент треугольной сетки из 75790 вершин результат геометрической декомпозиции результат перераспределения малых блоков вершин
53. Адаптивные декартовы сетки Вначале сетка состоит из одной прямоугольной ячейки Каждая ячейка может быть разделена на четыре ячейки одинакового размера Если ячейки когда-то составляли одну ячейку, то они могут быть объединены обратно Каждая ячейка хранит величину , описывающую среднее значение неизвестной функции впределах ячейки (метод конечных объёмов) При данных предположениях сетку удобно хранить в виде четверичного дерева : Дополнительные ограничения на размеры ячеек : Задан максимально допустимый размер ячеек Задан минимально допустимый размер ячеек Размеры соседних ячеек должны различаться не более, чем в 2 раза
54. На рисунках показаны результаты решения простейшей задачи переноса на равномерной (слева) и адаптивной (справа) сетках содинаковым числом ячеек (4096 штук). Скорость переноса направлена под углом 45° к линиям сетки ; начальное условие показано пунктиром Сравнение с равномерной сеткой
56. Решение двумерной задачи фильтрации нефтеводяной смеси вобласти снеоднородной проницаемостью В юго-западном углу находится скважина, нагнетающая воду, всеверо-восточном углу— добывающая скважина. 5 - ти точечная схема Поле проницаемости сразбросом значений на 4 порядка).
57. Решение двумерной задачи фильтрации нефтеводяной смеси вобласти снеоднородной проницаемостью В юго-западном углу находится скважина, нагнетающая воду, всеверо-восточном углу— добывающая скважина. 5 - ти точечная схема Поле проницаемости сразбросом значений на 4 порядка).
58. Динамическая балансировка загрузки Перераспределение вычислительных узлов между процессорами необходимо: При изменение конфигурации сетки При изменение вычислительной сложности обработки узлов При изменении эффективной производительности процессоров
63. Стратегии балансировки загрузки W i j - вычислительная нагрузка, ассоциированная с узлом сетки i на шаге j W i j = W i j – не зависит от времени W i j ≈ W i j -1 – меняется медленно W i j ≠ W i j -1 – меняется значительно и не прогнозируемо Статическая Динамическая диффузная Динамическая ?
66. Моделирование задач горения Здесь A оператор , - плотность , y (i) – массовые доли i - х компонент , u , v - скорости , p - давление , E – полная энергия , I – сорости образования компонент . I. Блок Газовой динамики (GD): II. Блок химической кинетики (CHEM):
70. Сотояния обрабатывающего процесса занят - если установлен соответствующий флаг. Этот флаг устанавливается перед передачей обрабатывающему процессу необработанной точки (неважно локальной или внешней) и сбрасывается после того, как точка уже обработана и управляющий процесс получил от обрабатывающего процесса результат; свободен - если не занят, т.е. готов к получению очередной свободной точки.
71. Управляющий процесс 1. если - есть необработанные точки (неважно локальные или внешние) и - обрабатывающий процесс свободен, то установить флаг обрабатываемой точки , одна из необработанных точек передается на обработку обрабатывающему процессу.
72. Управляющий процесс 2. если - нет локальных необработанных точек и - нет внешних точек и - нет обрабатываемых точек и - флаг запроса на получение необработанных точек не установлен и - есть процессоры, которые еще не ответили, что не могут предоставить точки для обработки (соответствующий флаг флаг запрета обменов не установлен), то послать запрос на получение необработанных точек одному из таких процессоров. установить флаг запроса на получение необработанных точек
73. Управляющий процесс Иначе (если не 2) 3. если - все переданные точки получены обратно обработанными и - от всех процессоров получено сообщение о том, что точки для обработки предоставлены быть не могут и - всем процессорам послано сообщение о том, что точки для обработки предоставлены быть не могут, то завершение работы
74. Управляющий процесс 4. получить очередное сообщение от любого процессора или от своего обрабатывающего процесса. 5. обработать полученное сообщение 6. перейти к началу цикла (п. 1)
75. Окончание при выполнение всех условий: нет локальных необработанных точек нет внешних точек нет обрабатываемых точек всем процессорам был послан запрос на получение необработанных точек всем процессорам было послано сообщение о том, что необработанные точки предоставлены быть не могут от всех процессоров получено сообщение о том, что необработанные точки предоставлены быть не могут все локальные точки обработаны и получены результаты обработки всех переданных точек
78. Выводы Балансировка загрузки процессоров – ключевой этап обеспечения высокой эффективности использования многопроцессорной системы. С ростом числа процессоров возрастает актуальность использования динамической балансировки загрузки