Конкурс GraphHPC-2017 на найшвидшу реалізацію завдання Betweenness Centrality


Лабораторія DISLab ВАТ «НИЦЭВТ») спільно з НИВЦ МДУ проводять четверту щорічну науково-практичну конференцію з проблем паралельної обробки великих графів з використанням суперкомп'ютерних комплексів і кластерних систем.
Мета конференції — залучення уваги до тематики завдань по суперкомпьютерной обробки графів та надання майданчика для спілкування розробників технологій суперкомпьютерной обробки графів і розробників графових додатків, обговорення перспектив даного напрямку.
Зовсім скоро, в рамках даної науково-технічної конференції GraphHPC-2017, стартує конкурс GraphHPC, присвячений проблемам паралельної обробки великих графів з використанням суперкомп'ютерів. На цей раз учасникам належить отримати найшвидшу реалізацію завдання Betweenness Centrality (Центральність з посередництва) в неориентированном графі.
Читати далі →

Чому цієї зими ми знову запрошуємо всіх пограти в комп'ютерні ігри за допомогою штучного інтелекту

Хабр, МФТІ вітає тебе! Як справжні технарі, відразу переходимо до справи і запрошуємо всіх, кому цікаво, взяти участь у новому хакатоне DeepHack, який пройде на Физтехе з 6 по 12 лютого. Відбірковий етап вже розпочався і триватиме до 22 січня. Це ми все до чого… Якщо ви не з чуток знаєте, що таке DQN, deep RL і DeepHack відразу реєструйтеся на чергову наукову школу-хакатон — rl.deephack.me.

DeepHack

А якщо ви не до кінця в темі і вам, наприклад, не ясно, чому комп'ютерні ігри, яке відношення вони мають до управління дата-центрами і що насправді буде в лютому, то терміново йдіть під кат — там максимальне занурення в життя штучного інтелекту від давнини і до наших днів. Ну ви ж не думаєте, що все це винайшли лише в XXI столітті?

Читати далі →

Порівняння продуктивності GPU-розрахунків на Python і C


Python має ряд привабливих переваг, до яких відноситься простота реалізації програмних рішень, наочність і лаконічність коду, наявність великої кількості бібліотек та численного активного ком'юніті. У той же час, відома всім повільність пітона часто обмежує його придатність для «важких» обчислень. Для ряду задач можна добитися істотного прискорення розрахунків шляхом використання технології CUDA для паралельних обчислень на GPU. Мета цього невеликого дослідження — аналіз можливостей ефективного використання python для розрахунків на GPU і порівняння продуктивності різних python-рішень з реалізацією на C.

Читати далі →

Застосування FPGA для розрахунку деполімеризації мікротрубочки методом броунівської динаміки

Все готово, щоб розповісти Хабр аудиторії про застосування FPGA у сфері наукових високопродуктивних обчислень. І про те, як на цій задачі треба вдалося значно обскакати GPU (Nvidia K40) не тільки в метриці продуктивність на ват, але і просто з точки зору швидкості обчислення. Як FPGA платформи використовувався кристал Xilinx Virtex-7 2000t, підключений за PCIe до хост комп'ютера. Для створення апаратного обчислювального ядра використовувалася мова C++ (Vivado HLS).
Під катом текст нашої оригінальної статті. Там, як зазвичай буває, спочатку йде довгий опис навіщо це все треба і моделі, якщо немає бажання це читати, то можна переходити відразу до реалізації, а модель подивитися потім при необхідності. З іншого боку без хоча б побіжного ознайомлення з моделлю читач не зможе отримати враження про те, які складні обчислення можна реалізувати на FPGA )
Читати далі →

Про інтернет речей і напівпровідникову індустрію в краю, де п'ють верблюже молоко. День перший



Кілька місяців тому мій колега Тимур Палташев, менеджер в графічному відділенні Advanced Micro Devices (AMD) в Саннівейл, Каліфорнія, запропонував мені з'їздити і влаштувати семінар в Казахстані. Він буде розповідати про гетерогенний комп'ютинг і великі процесори AMD для ігрових приставок і віртуальної реальності, а я буду розповідати про маленькі процесори MIPS для вбудованих процесорів і машинного бачення. Крім цього мені було обіцяно спробувати конину, ферментоване молоко кобили (кумис) і ферментоване молоко верблюдиці (шубат). «А тянь-шанские їли там будуть?» — запитав я, і отримавши ствердну відповідь, вигукнув: «я готовий».

«А під яким соусом буде робитися даний захід?», — запитав я у Тимура і його казахської однокласниці Гульфариды Тулемиссовой, яка робила всю роботу по організації в Almaty Management University. З'ясувалося, що казахський народ в даний час зацікавила тематика інтернету речей. Мережі з сенсорів з бездротовим зв'язком вже використовуються щоб наглядати за шахтарями у казахстанських шахтах, чи не трапилося з ними чого. Крім цього в країні є якісні програмісти мікроконтролерів та інженери вбудованих систем, які роблять сейсмоанализаторы і телекомунікаційні ящики (в кооперації з росіянами і китайцями).

«Добре», — сказав я, Imagination Technologies та її відділення MIPS Business Unit, в якому я працюю, є продукти в області інтернету речей, зокрема ядра MIPS microAptiv, які Samsung використовує в платформі для інтернету речей Samsung Artik 1. Крім цього, у нас є матеріали з мікроконтролерів, а також те, чого в Казахстані поки не вистачає — знання ПЛІС-ів і проектування мікросхем, ніж казахстанці могли б зайнятися в кооперації з росіянами, які зараз добре прогресують в даному напрямку.

Після цієї беселы я підловив у коридорі нашого компанійського аналітика в області інтернету речей і спитав у нього, що власне таке інтернет речей.

Читати далі →

Швидше швидкого або глибока оптимізація Медіанної фільтрації для GPU Nvidia

Введення
У попередньому пості я постарався описати, як легко можна скористатися перевагою GPU для обробки зображень. Доля склалася так, що мені підвернулася можливість спробувати поліпшити медіанну фільтрацію для GPU. У цьому пості я постараюся розповісти яким чином можна отримати ще більше продуктивності від GPU в обробці зображень, зокрема, на прикладі медіанної фільтрації. Порівнювати будемо GPU GTX 780 ti оптимізованим кодом, запущеному на сучасному процесорі Intel Core i7 Skylake 4.0 GHz з набором векторних регістрів AVX2. Досягнута швидкість фільтрації квадратом 3х3 в 51 GPixels/sec для GPU GTX 780Ti і питома швидкість фільтрації квадратом 3х3 в 10.2 GPixels/sec на 1 TFlops для одинарної точності на даний час є найвищими з усіх відомих у світі.
Читати далі →

Як ми зробили конвертер і плеєр для CinemaDNG на CUDA

На Хабре у мене вже було дві статті (1 і 2), обидві вони стосувалися реалізації швидкого стиснення зображень у форматі JPEG на CUDA. Тепер я б хотів розповісти про інший, набагато більш масштабне завдання — як ми зробили конвертер відео плеєр для серій DNG зображень на CUDA. При цьому ми отримали дуже високу швидкість роботи, тому що вся обробка вихідних даних у форматі DNG тепер виконується на відеокарті NVIDIA.


Початкове зображення у форматі DNG взято з сайту blackmagicdesign.com

Незважаючи на те, що в світі вже є дуже велика кількість конверторів RAW, які працюють з форматом DNG, ми вирішили зробити ще один, але дуже швидкий, який можна було б використовувати в тому числі для відбракування і сортування. Відео плеєри DNG теж є, але вони зазвичай працюють зі зменшеним дозволом, тому переглянути тільки що знятий у форматі DNG матеріал на повному дозволі — це проблема. За допомогою нашого конвертера ми зробили спробу опрацювати картинки настільки швидко, щоб вміти переглядати серії DNG зображень в режимі реального часу при повному дозволі. Природно, що крім швидкості необхідно було отримати прийнятну якість обробки і шумозаглушення, і мені здається, що нам це вдалося.

Читати далі →

Ще раз про швидкий JPEG на CUDA

У 2012 році на Хабре вже була моя стаття про швидке стиснення JPEG на відеокарті. З тих пір пройшло вже досить багато часу, і мені хотілося б у загальних рисах розповісти про результати, які були отримані по цій темі. Сподіваюся, багатьом буде цікаво дізнатися, який рівень продуктивності можна отримати на сучасних відеокартах NVIDIA при вирішенні практичних завдань на CUDA.

Читати далі →

Марсохід Opportunity більш ніж у 40 разів перевищив запланований термін служби

В цьому році марсохід Opportunity відзначає своє 12-річчя на червоній планеті. Марсохід був висаджений 24 січня 2004 року і досі продовжує функціонувати.
Марсохід «Оппортьюніті» здійснив посадку в кратері Голок, на плато Меридіана. В даний час Opportunity знаходиться в районі кратера Індевор, тим самим пройшовши понад 40 км від свого початкового положення
image
NASA/JPL/Cornell University, Maas Digital LLC — photojournal.jpl.nasa.gov/catalog/PIA04413

Марсохід управляється двома комп'ютерами на базі стандарту CompactPCI, спроектованими і побудованими інженерами компанії BAE Systems.
Коли Opportunity приземлився, команда НАСА думала, що суворий марсіанський клімат зробить його непрацездатним протягом декількох місяців. Запланований термін роботи марсохода дорівнював приблизно 90 діб. Але марсохід, який отримує енергію тільки від сонячних батарей, все ще збирає дані.
Читати далі →