Обробка природної мови в задачі моніторингу передвиборної агітації

У даній статті ми розглянемо процес розробки методики контролю передвиборної агітації в Ростовському регіональному сегменті Інтернет-ЗМІ з використанням обробки природної мови та машинного навчання.
Також я зупинюся на особливостях і нюансах, адже завдання стояло досить спеціалізована: необхідно було виділяти агітацію, і, якщо вона може порушувати закон — оперативно повідомляти Виборчком. Забігаючи вперед скажу, що із завданням я успішно впорався.
 
У задачі розробки методики контролю передвиборної агітації в Ростовському регіональному сегменті Інтернет-ЗМІ застосовуються напрацювання з декількох суміжних галузей знань:
 
     
  • автоматизована обробка текстів (текстмайнінг),
  •  
  • обробка природної мови,
  •  
  • машинне навчання.
  •  
 
Читати далі →

Штучний інтелект і чому мій комп'ютер мене не розуміє?



Гектор Левек wiki стверджує, що його комп'ютер тупий. І ваш теж. Siri і голосовий пошук Google вміють розуміти приготовані пропозиції. Наприклад «Які фільми будуть показувати неподалік в 7 годин?» Але що щодо питання «Чи може алігатор пробігти стометрівку з бар'єрами?» Таке питання ніхто раніше не ставив. Але будь-який дорослий може знайти відповідь на нього (Ні. Алігатори не можуть брати участь у бігу з бар'єрами). Але якщо ви спробуєте ввести це питання в Google, то отримаєте тонни інформації про спортивній команді з легкої атлетики Florida Gators. Інші пошукові системи, такі як Wolfram Alpha, теж не здатні знайти відповідь на поставлене запитання. Watson, комп'ютерна система виграла вікторину «Jeopardy!», Навряд чи покаже себе краще.

Читати далі →