Microsoft виклала на Github інструментарій CNTK для глибинного навчання



Microsoft виклала у відкритий доступ вихідний код інструментів, які використовуються в компанії для прискорення розробок у галузі штучного інтелекту: набір Computational Network Toolkit опублікований на Github.

сообщается в офіційному блозі, дослідникам довелося створити набір інструментів CNTK з необхідності. Провідний спеціаліст Microsoft з систем розпізнавання мовлення Сюэдун Хуан (Xuedong Huang) каже, що розробники в його групі були стурбовані проблемою, як прискорити процес розпізнавання мови комп'ютерами, а наявні інструменти працювали дуже повільно.

Тому група добровольців запропонувала вирішити проблему самостійно, використовуючи власне рішення, яке ставило продуктивність на перше місце.

Зусилля окупилися сповна.

У внутрішніх тестах CNTK показав більш високу продуктивність, ніж чотири інших популярних обчислювальних інструментарію, що розробники використовують для створення моделей глибинного навчання в завданнях начебто розпізнавання мови, розпізнавання образів, за рахунок кращих комунікаційних можливостей.

«Інструментарій CNTK просто неймовірно більш ефективний, ніж все, що нам доводилося бачити», — визнає Сюэдун Хуан.

Приріст продуктивності такого роду виключно важливий для стрімко розвивається області глибинного навчання, тому що деякі з найбільш складних завдань глибинного навчання можуть обчислюватися тижнями.



За останні кілька років область глибинного навчання зробила великий крок вперед, оскільки все більше дослідників запускають алгоритми машинного навчання з використанням глибоких нейромереж. Багато хто вважає, що глибинне навчання має потенціал для поліпшень в області штучного інтелекту, пише Microsoft.

Досягнутий прогрес дозволив створювати системи, які точно розпізнають і навіть переводять мова, а також системи розпізнавання зображень, здатні навіть відповідати на питання про них.

У компанії Microsoft інструментарій CNTK використовується на кластері потужних комп'ютерів з GPU. Виявилося, що GPU ідеально підходять для обробки таких алгоритмів, завдяки ним стався такий ривок у технологіях синтезу, розпізнавання і розуміння мови, розпізнавання зображень і руху на відео.

Користь від інструментів CNTK може отримати кожен: від розробника з обмеженим бюджетом і єдиним комп'ютером до компанії, здатної підняти цілий кластер серверів з GPU. Розробники Microsoft стверджують, що CNTK масштабується для паралельної роботи на багатьох GPU-машинах набагато краще, ніж інші публічно доступні інструменти такого роду.

У квітні минулого року Microsoft відкрила CNTK для академічних дослідників через Codeplex під більш обмеженою вільною ліцензією. Починаючи з понеділка CNTK доступний абсолютно для всіх.

Незалежні розробники висловлюють задоволення такими позитивними діями Microsoft, але при цьому не втрачають можливості підколоти компанію: «Тільки Microsoft могла відкрити документацію на гітхабі у форматі docx», — пише один з них.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.