Отримання унікального контенту з відеоблогів

Тема стенографії не нова, ось її ми і будемо використовувати для отримання унікального тексту.
Спеціалізованого софту для даної задачі у вигляді однієї програми — я не знайшов і вирішив використовувати кілька програм:

1) RealSpeaker PRO 1.5

2) Virtual Audio Cable 4.10 Full

3) SplitCam

4) Текстовий редактор (Блокнот, Word тощо)


Трохи про софт.

Головною програмою у нас буде RealSpeakerPRO 1.5 яка і буде розпізнавати мову і переводити її в текст, SplitCam у нас буде виступати в якості віртуального веб-камери і для захоплення виділеної області з робочого столу (або браузера), VirtualAudioCable необхідний для емуляції мікрофона, а текстовий редактор для запису/збереження тексту.

Для тих хто хоче працювати з відео не через браузер, можуть його завантажити собі на комп'ютер (використовуючи спец. програми чи сайти) і працювати, наприклад через KMPlayer або будь-який інший програвач.

Приступимо до реалізації.

Викачуємо необхідний софт, який можна знайти на у нас на форумі.

Встановлення софта описувати не буду, а почну відразу з налаштування.

Першим ділом налаштовуємо VirtualAudioCable, для цього з пуску запускаємо VirtualAudioCable-> Controlpanel. У DriverParameters навпаки Cables вказуєте 2 і натискаєте Set. Потім вибираєте перший кабель і ставите галочку напроти VolumeControl натискаєте Set.

У вас повинно вийти так:

image

Закриваєте Controlpanel натисканням на Exit.

Переходьте в Пуск- > Панель управління -> Обладнання та звук -> Звук

image

Перейдіть на вкладку Відтворення і вибираєте Line 1, натискаєте кнопку «За замовчуванням», поки не закриваємо налаштування звуку, вони нам ще знадобляться для перевірки.

Тепер налаштуємо віртуальний кабель, а для цього переходимо в Пуск -> VirtualAudioCable-> Audio Repeater (MME) і налаштовуємо так само як у мене показано на скріншоті і натискаємо Start.

image

В полі WaveOut вам необхідно вибрати свій пристрій виводу звуку (колонки, навушники тощо), рекомендую запустити який-небудь фільм або музику, щоб перевіряти висновок. Якщо ви чуєте звук, значить все налаштовано правильно.

Перевірити можна повернули в налаштування Звуку

Якщо при відтворенні у вас приблизно так само, як у мене на скріншоті, то ви вірно налаштували вивід звуку.

image

Перейшовши на вкладку Запис, Line 1 у вас так само повинна рухатися і на цьому налаштування віртуального мікрофона закінчена.

image

Тепер нам необхідно отримати відео-потік, запускаємо SplitCam.

Натискаємо на вкладку Джерела -> Екран -> вибираємо область екрану, як показано на скріншоті.

image

Наводьте, розширюєте або звужуєте з'явилася область на обличчі диктора з відео ролика (наприклад на YouTube).

image

Вибравши область, натискаєте кнопку closeи можна згорнути SplitCam.

Віртуальна камера і віртуальний мікрофон налаштовані, область обрана, тепер необхідно налаштувати RealSpeaker і переводити мова в текст.

Запускаємо RealSpeaker, натискаємо на шестиренку і вказуємо налаштування як показано на скріншоті, а саме Мікрофон: Line 1, Камера: SplitCam VideoFilter. Натискаємо ОК.

image

Якщо все налаштовано правильно, ви побачите наступне:

image

Тепер тиснете на відтворення відео, потім на RealSpeaker для запуску процесу отримання відео і аудіо потоку, і переведіть курсор на текстовий редактор куди треба записати отриманий текст.

Я рекомендую все ж зберігати відео і запускати його наприклад KMPlayer і програвати буквально секунд 5-10, потім ставити на паузу з перекладом курсору назад в блокнот для запису тексту. RealSpeaker надсилає або отримує дані через гугл, відповідно йде затримка в розпізнаванні, а якщо диктор швидко диктує текст, то розпізнавання іноді буває кривим. Так само слідкуйте за розкладкою клавіатури, тому програма тупо натискає клавіші і не переводить розкладку.

Думаю всі, пробуйте.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.