beta.gitlance.net/top/javascript
Джерело зображення: beta.gitlance.net/top/javascript


Оцінюючи розробника ПЗ в якості потенційного партнера, працівника або підрядника, багатьом доводилося в якийсь момент витратити час на копання в його репозиторіях на Github, намагаючись зрозуміти, що за проекти той пише і якої якості у нього код. Це заняття малоефективно, до того ж ще пов'язане з певними труднощами як оцінювання ступеня вкладу розробника в той чи інший репозиторій, якості його коду; можна гадати про те, чи це дійсно його код, і так далі.
Розробникам ж, зі свого боку, важко піднести свій талант в доступній і наочній формі. Багато хто в підсумку створюють власні веб-сайти з перерахуванням цікавих проектів, в яких брали участь або самі є їх авторами, що, звичайно, дає результат, але теж з перемінним успіхом.
Ми ж віримо, що є спосіб краще, і саме тому створили GitLance. По суті своїй, коміти в Git подібно бухгалтерській книзі надійно фіксують внесок кожного з учасників, а на Github знаходиться безліч публічних репозиторіїв Git разом з їх розробниками, а також порівняти кількість їх взаємних оцінок у вигляді зірочок на репозиторіях і форков, що йдуть від них. Так чому б не скористатися цим для генерації кодового графа?

Читати далі →

Введення:
У цій статті мова піде про роботу з Microsoft Analysis Services і трохи про сховище Microsoft SQL Server, з яким AS працює. Мені довелося зіткнутися з не зовсім тривіальними речами і деколи доводилося стрибати через голову" заради того, щоб зробити те, що від мене хочуть. Працювати доводилося в перервах між нарадами. Деколи новий функціонал обговорювалося довше, ніж розроблявся. Часто на нарадах, за кілька разів, доводилося розповідати одне і теж. Коли я сказав, що мені складно радитися довше однієї години, на мене подивилися з подивом і нерозумінням. Багато в чому, завдяки такій обстановці і з'явилися ці, не зовсім тривіальні речі, про які я вирішив написати.

Читати далі →

щотижня у Microsoft з'являються кейси, присвячені розробці рішень для компаній, університетів і навіть держав. Ми вирішили поділитися з вами самими цікавими з них і почати серію статей «Microsoft Technical Case Studies». У першому матеріалі ви дізнаєтесь про IoT-рішення для обробки зображень «теплового тунелю мозку» (Brain Temperature Tunnel) згідно з методикою, заснованої на дослідженнях доктора Марка Абреу (Marc Abreu) з Єльського університету.



Читати далі →

Спеціально для тих, хто не встиг зареєструватися на Superjob Data Science Meetup, ми організуємо пряму трансляцію події на Youtube або Facebook.

Початок у 19:00 за московським часом.
image

Читати далі →

Досить часто enterprise завдання з обробки даних зачіпають дані, які супроводжуються тимчасовою міткою. В R такі мітки, зазвичай зберігаються як клас
POSIXct
. Вибір методів роботи з таким типом даних за принципом аналогії може привести до великого розчарування і переконання про крайню повільності R. Хоча якщо поглянути на цю трохи пильніше, то виявляється, що справа не зовсім в R, а в руках і голові.
Нижче торкнуся пару кейсів, які зустрілися в цьому місяці і можливі варіанти їх вирішення. В ході вирішення з'являються дуже цікаві питання. Заодно згадаю інструменти, які виявляються дуже корисними для вирішення подібних завдань. Практика показала, що про їхнє існування знають небагато.

Читати далі →

Добрий день! Я давно читаю Хабр, а ось написати все ніяк не міг зібратися. Нещодавно я здав іспит HDPCA (Hortonworks Data Platform Certified Administrator) і хотів би поділитися своїми враженнями. Сподіваюся, що ця інформація буде комусь корисною, оскільки навіть англійською мовою інформації про це іспиті не багато.

Читати далі →

Ми 1cloud часто розповідаємо про технології, наприклад, нещодавно ми писали про машинному навчанні і all-flash-масивах зберігання даних. Сьогодні ми вирішили поговорити про Big Data. Найчастіше основним визначенням великих даних вважають відомі «3V» (Volume, Velocity і Variety), які ввів аналітик Gartner Дуг Лейни (Doug Laney) в 2001 році.

При цьому іноді найважливішим вважають саме обсяг даних, що частково зумовлено самою назвою. Тому багато замислюються тільки про те, дані якого розміру можна вважати великими. У цій статті ми вирішили з'ясувати, що насправді важливо у великих даних крім розміру, як вони з'явилися, чому їх критикують і в яких сферах вони успішно застосовуються.


Читати далі →


Дата інженер в очікуванні завдання на спарці.
За роки розробки Wrike у нас накопичилося багато розрізненої інформації про дії користувача. Ця інформація розкидана по декількох баз даних, логів, і зовнішніх сервісів, і нам, аналітикам, потрібно зібрати ці дані разом, знайти в них закономірності і знайти відповіді на вічні запитання SaaS'а:
  • Чому йдуть клієнти?
  • Які користувачі приносять нам гроші?
  • Як розвивати продукт далі?
Більшість завдань ми вирішуємо за допомогою SQL, але запити до логів через SQL — громіздкі і повільні. Їх можна використовувати для автоматики або докладної аналітики, але якщо потрібно щось швидко подивитися, на підготовку даних піде більше часу, ніж на аналіз.
Якщо дивитися доводиться багато і часто, це викликає біль, у цій статті ми розповімо, як її подолати і як отримати максимальну користь з отриманих даних.
Читати далі →