Інженери і лінгвісти знову вступили в Діалог

    На початку червня в підмосковному «Бекасово» відбулася міжнародна конференція з комп'ютерної лінгвістики «Діалог» , яку вже багато років робить наша компанія. Про те, що являє собою «Діалог», ми писали тут , тому не будемо повторюватися, а розповімо, що було нового.
 
Мабуть, одне з найважливіших для нас подій — збірник наукових праць «Діалогу» нарешті буде індексуватися міжнародною системою SCOPUS . Чому це важливо? Для підтвердження свого наукового статусу всі вітчизняні вчені повинні мати публікації в найбільш авторитетних виданнях, що входять в т.зв. список ВАК (Вищої атестаційної комісії). До таких належать, зокрема, журнали, що входять до бази SCOPUS. Скопусовскій статус збірника Діалогу, надає конференції більш високий статус і ми раді, що тепер участь в «Діалозі» буде надавати більше «ваги» науковим працям наших доповідачів.
 
Цього року однією з домінант «Діалогу» була обчислювальна семантика, їй був присвячений перший день конференції. Ця область комп'ютерної лінгвістики вивчає різні способи комп'ютерного моделювання значень слів, фраз, пропозицій, цілих текстів. Проблема важлива для вирішення і дуже складна, є різні підходи. Наприклад, самий новий — дистрибуційна семантика, в якій значення описується на підставі статистики сполучуваності слів, що розраховується за великим текстовим корпусам. У онтологічної семантиці упор робиться на облік знань про світ, формальна семантика широко використовує для опису значень речень математичну логіку, операциональная семантика робить упор на інструктивних аспектах мови: інтерпретує фрази як команди, керівники деяким виконавчим пристроєм, наприклад, роботом. Нарешті, традиційна «пояснювальна» семантика намагається повністю описати значення за допомогою спеціальних мов тлумачень.
 
На конференцію приїхали відомі вчені, лідери цих напрямків комп'ютерної семантики: Марко Бароні, Барбара Парті, Сергій Ніренбург, Костянтин Воронцов, Олена Падучева. Днем були цікаві доповіді, а ввечері відбувся спеціальний круглий стіл, на якому можна було зіставити різні моделі, побачити не тільки відмінності, але й можливості взаємодії цих підходів. Здається, що ідея «огляду семантичних підходів» вдалася, і можна очікувати появи нових досліджень і дослідників у цій галузі.
 
Другий день «Діалогу» був оголошений «Днем технологій». По суті «День технологій» — це спроба зробити щось подібне DOCFLOW (найбільша російська конференція-виставка, присвячена документообігу) стосовно лінгвістичним технологіями. Ринок таких технологій в Росії ще не цілком сформувався, тому дуже важливо створити майданчик, на якій потенційні замовники можуть ознайомитися з пропонованими рішеннями і отримати їх об'єктивну порівняльну оцінку. З запрошеними доповідями виступили представники компаній та організацій, що лідирують в області розробки лінгвістичних технологій: RCO, ABBYY, Яндекс, IBM, наукові групи ВЦ МДУ, НДІ системного програмування, НДІ системного аналізу. Увечері відбувся круглий стіл, на якому обговорювалися проблеми взаємодії науки, інженерії та бізнесу в нашій країні. Прозвучало багато цікавих і конструктивних ідей, як допомогти розробникам і замовникам зрозуміти один одного. Цей «День технологій» був першим, і експеримент можна вважати вдалим: на наступному «Діалозі» можна буде провести вже більше масштабний захід.
В останній день «Діалогу» відбувся вечір пам'яті Іллі Сегаловіча, який зробив величезний внесок у розвиток комп'ютерної лінгвістики в Росії.
 
А ще на конференції були підведені підсумки змагання з автоматичного дозволу анафори і кореферентності. Такі змагання для російської мови проводилися вперше. У змаганні взяли участь сім розробників систем автоматичного аналізу тексту: ABBYY, RCO, SemSyn, Open Corpora (St.Petersburg), Mail.ru, Інститут системного аналізу РАН, Сергій Пономарьов. Детальніше про це — у другій частині статті.
    
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.