IBM продовжує роботу з Apache Spark: корпорація запускає Spark-as-a-service



На конференції IBM Insight 2015 було зроблено відразу кілька цікавих анонсів. Основне — це продовження розвитку ідеї підтримки проекту Apache Spark. IBM запускає IBM Analytics on Apache Spark, при цьому хмарної платформою служить Bluemix. Нагадаємо, що в червні корпорація IBM заявила про намір інвестувати в проект понад 300 мільйонів доларів за кілька років. Крім того, раніше стало відомо, що Apache Spark для Linux буде підтримуватися z Systems.

Така підтримка здійснюватиметься в рамках проекту «аналітика на мейнфреймах». Завдяки цьому фахівці з дата-майнингу зможуть використовувати Apache Spark на потужних мейнфреймах z Systems.

Apache Spark буде працювати не тільки як сервіс на платформі Bluemix, систему також інтегрують з іншими хмарними і аналітичними рішеннями, включаючи NoSQL-рішення Cloudant і хмарну платформу для зберігання даних SashDB. Розробники, використовуючи Bluemix, зможуть інтегрувати свої проекти з аналітичними рішеннями і СУБД IBM.

Разом з Spark IBM пропонує ще й те, що одержало назву Insight Cloud Services. Це рішення, що дозволяє отримувати «зовнішні дані про людей, події, компаніях, бізнес-проекти з джерел на зразок Twitter і The Weather Company». Клієнти IBM зможуть доповнювати і розширювати вже наявну інформацію з допомогою Insight Cloud Services, а після проводити повноцінний аналіз зібраного комплексу даних, використовуючи Apache Spark.

Оскільки Spark підтримує і машинне навчання і розпізнавання природних мов, і технологію обробки зображень, так само як і пропонує велику кількість інших можливостей, IBM розглядає Spark також як повноцінне середовище для роботи з даними. Наприклад, за допомогою сервісу IBM Datacap, що є частиною Insight Cloud Services, клієнт може провести автоматичну класифікацію та розпізнавання вмісту документа, включаючи його формат і структуру, текстову і числову інформацію.

Компанія вважає свій інструмент досить надійним, тому більше п'ятнадцяти власних комерційних та аналітичних продуктів IBM переведені на Spark. Завдяки цьому, наприклад, вдалося знизити кількість рядків коду DataWorks з 40 до 5 мільйонів.

Вже в недалекому майбутньому IBM буде розширювати підтримку Apache Spark за межі аналітики за всіма напрямами власного бізнесу.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.