Набор текста голосом: проверенные программы и онлайн-сервисы
Содержание:
- 5 Dragon Dictation
- Transcribe — Speech to Text (iOS)
- Программа Express Scribe (Экспресс Скрайб)
- Как преобразовать аудио в текст
- Транскрибация вручную
- SpeechTexter (Android)
- Speechnotes (Android)
- Программа Virtual Audio Cable
- Видеоуроки по использованию сервиса и расширения
- э-Диктант (Android)
- 1 Сайт speechpad.ru
- Коротко о главном
- Что такое транскрибация
- Расшифровка аудио и видео в текст на биржах фриланса
- Усовершенствовать ручную расшифровку
5 Dragon Dictation
Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.
Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.
Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.
Только так можно будет получить безукоризненный текст без ошибок.
Transcribe — Speech to Text (iOS)
Transcribe – iOS / iPad-ассистент для перевода голоса в текст в реальном времени. Приложение также умеет расшифровывать аудио из видео источника. Это полезно, в частности, если нужно извлечь субтитры из youtube ролика.
Ключевые особенности и функции Transcribe:
- Автоматический перевод голосовых заметок (voice memo) в простой текст;
- Полноценная поддержка около 100 языков;
- Импорт / экспорт расшифровки в текстовый редактор или облако Dropbox;
- Экспорт субтитров в формате SRT.
3 часа расшифровки доступны бесплатно каждый месяц, после чего вступают в силу тарифы: $4.99 за 1 час перевода в текст, $29.99 за 10 часов и так далее, по нарастающей. Приложение доступно только для iOS, Android-версии у “голосового блокнота” нет.
Программа Express Scribe (Экспресс Скрайб)
Это наверное, одна из самых популярных программ для транскрибации
Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.
В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.
Express Scribe поддерживает все известные мне (и не известные 🙂 ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.
Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на пробретение Экспресс Скрайб.
Как преобразовать аудио в текст
Способ №1
Данный способ, не требует ни каких настроек. Принцип заключается в следующем. Вы воспроизводите звуковой файл или видео, звук идёт через колонки, а микрофон захватывает звук из колонок. Вы также можете включить запись на диктофоне или смартфоне, и микрофон будет захватывать звук с этих устройств.
Схема №1
Открыв голосовой блокнот, переходим в раздел «Транскрибация».
Транскрибация
Сервис предоставляет возможность захвата аудио из видео YouTube, видео файлов и аудио файлов. Видео и аудио файлы при этом могут быть расположены как в интернете, так и на Вашем компьютере.
Для начала, рассмотрим пример открытия видео с YouTube. Для этого потребуется ID данного видео. Этот ID нужно вставить в поле «URL медиа файла для проигрывания» и нажать кнопку «Обновить».
Подключение видео с YouTube
Такой уникальный ID есть у каждого видео на YouTube. Увидеть его можно в адресной строке браузера.
Теперь рассмотрим пример с открытием файла на вашем компьютере.
Сначала указываете тип файла, аудио или видео. Затем нажимаете на кнопку «Выберите файл» и выберите файл на компьютере. Выбрав файл, нажимаете кнопку «Открыть».
Открыть файл с компьютера
Следующим этапом располагаете, микрофон рядом с колонками вашего компьютера или скажем диктофоном или смартфоном, и включаете запись.
Включаем запись
Далее полученный результат (готовый текст), копируете в текстовый редактор и редактируете как вам надо.
Способ №2
Данный способ позволяет исключить микрофон из цепочки преобразования аудио в текст. Звук будет напрямую передаваться из проигрывателя в голосовой блокнот
И уже не важно, какой у вас микрофон
Схема №2
Но для этого потребуется отдельная программа — Virtual Audio Cable. Данная программа создаёт виртуальный аудио кабель и передаёт аудиопоток между приложениями. Программа эта платная, стоит от 25$ до 50$. Но можно воспользоваться бесплатной версией. В бесплатной версии есть ограничение на количество виртуальных кабелей. Можно создать только 3 кабеля. А ещё женский голос постоянно напоминает, что это бесплатная версия если использовать аудиорепитер. Но скажу вам честно, можно обойтись и без него. Зато пробная версия не ограничена по времени. В видеоуроке я покажу, в чем хитрость.
Итак, для начала скачиваем программу «Виртуальный аудио кабель», ссылка выше.
Виртуальный аудио кабель
После того, как вы скачаете архивный файл на компьютер, его нужно распаковаться. Для этого можно воспользоваться архиватором или простым копирование файлов из архива в новую папку.
Распаковка архива
Когда архив будет распакован, запускайте файл установки, соответствующий разрядности вашей операционной системы. В смысле, 32 или 64 разрядная.
Установка программы VAC
Установка стандартная и не потребует от вас дополнительных знаний и умений. Просто следуйте указаниям мастера установки.
Далее, важный технический момент, нужно настроить в качестве устройства воспроизведения виртуальный аудио кабель.
Настройка аудиоустройства
Теперь Вы ни звука не услышите из ваших колонок, зато весь звук через виртуальный аудио кабель будет передаваться в голосовой блокнот. То, что нам и нужно.
Вот теперь можно открыть голосовой блокнот, перейти в раздел «Транскрибация» и выполнить перевод аудио в текст, как это было описано в первом способе. Только сейчас на надо подносить микрофон к колонкам.
Настройка аудиорепитера
Теперь вы будете слышать звук и женский голос, напоминающий о бесплатной версии программы, который после третьего повторения уже сводит с ума. Но, этим можно и не пользоваться, тем более, если вы знаете, о чём речь в вашем видео или аудио.
Всем желаю удачи.
Транскрибация вручную
Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.
Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? 🙂 Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.
Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:
- В комнате шумно
- Диктор говорит тихо
- Диктор говорит с сильным акцентов
- У диктора “фефекты фикции”
- Записан на плохой микрофон
- Одновременно говорит много людей
- Диктор “вклинивает” иностранные фразы. Или малоупотребительные
Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.
SpeechTexter (Android)
Еще один эффективный способ диктовки текста на мобильном устройстве. SpeechTexter распознает речь, используя словарь. Он содержит знаки препинания, номера телефонов, фразы. Вы можете составить не только простое сообщение, но и написать эссе, отчет.
Чтобы начать работу со SpeechTexter, нужно:
- Скачать приложение с Play Market: https://play.google.com/store/apps/details?id=com.speechtexter.speechtexter.
- Выбрать нужный языковой пакет. Программа позволяет загрузить большое число языков от африкаанс до корейского.
- Нажмите кнопку микрофона и начните говорить.
Важный момент. SpeechTexter не работает без подключения к Сети. Качество распознавания влияет скорость подключения. Приложение чувствительно к фоновому шуму.
Speechnotes (Android)
Разработчики Speechnotes утверждают, что голосовой ввод в Speechnotes работает проще и эффективнее, чем в других мобильных приложениях. Чтобы начать диктовку, нужно просто нажать на кнопку микрофона. Программа не требует официальной регистрации и входа, доступ в Интернет не нужен.
Знаки препинания в Speechnotes нужно обозначать голосом. В качестве альтернативы – достаточно удобная клавиатура со знаками препинания. Плюс в том, что она не прерывает диктовку текста.
Одной из других положительных сторон программы является поддержка Bluetooth. Speechnotes уловит каждое слово при вводе через блютус-микрофон или гарнитуру hands free. Премиум-функция – настраиваемые клавиши для быстрой вставки текста: имя, подпись и другие шаблоны.
Программа Virtual Audio Cable
Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.
Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.
К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.
Видеоуроки по использованию сервиса и расширения
На странице speechpad.ru/help.php имеются видеоуроки которые помогут вам пользоваться этим сервисом. Вы можете посмотреть такие уроки в которых рассказано и показано:
- Показаны основные возможности и как вводить текст используя сервис.
- Показаны основные элементы блокнота при работе с микрофоном.
- Показано как можно набранный текст перенести в другие редакторы и документы.
- Настройка микрофона для работы на сервисе используя функцию транскрипцию и показан пример как с ролика ютуб переделать аудио речь в текстовый документ.
- Объясняется как с ролика ютуб переделать аудио речь в текст если имеются звуковые помехи.
- Показан пример использования меток времени при переделывании аудио речи в текст.
- Показан пример создания титров для роликов из ютуб.
- Показано как зарегистрироваться и настроить сервис.
- Показано как вводить текст с помощью расширения.
- Показано как вводить текст в текстовые поля на сайтах используя расширение.
- Показано как произвести проверку произношения.
э-Диктант (Android)
Помните, как писали в школе текст под диктовку? Теперь “диктант” за вас напишет приложение «э-Диктант». Нужно только скачать программу на свой смартфон через Play Market (https://play.google.com/store/apps/details?id=rs.edukom.diktat).
«э-Диктант» упростит жизнь блогерам, писателям, бегунам, бизнесменам, студентам. В общем, тем, кому нужно быстро перевести речь в текст, и желательно на ходу.
Особенности приложения “э-Диктант”:
- Речевой блокнот позволяет быстро писать тексты любого объема.
- Редактирование проводится прямо во время записи.
- Э-Диктант продолжает мониторинг звуков и речи при длительных перерывах.
- Доля успешно преобразованного текста превышает 90 процентов.
1 Сайт speechpad.ru
Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.
Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».
Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.
Рис. 3. Сервис speechpad
Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.
Список видео-уроков по работе с speechpad:
Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:
Видео «Транскрибирование аудио»
Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.
Коротко о главном
— Высококачественное аудио можно попробовать расшифровать автоматически — тогда потребуется минимум правок. Чем хуже качество, чем больше шумов, чем тише голос — тем дольше нужно будет возиться с текстом после автотранскрибации. Примеры инструментов: Google Docs, RealSpeaker, Dictation, Voco.
— Если аудио неважного качества и с обилием посторонних звуков, а у говорящего тихая речь, много слов-паразитов и отвлечений не по теме — пожалуй, стоит выбрать ручную расшифровку. Главное, облегчить ее с помощью специальных решений: oTranscribe, Express Scribe, Transcriber Pro, LossPlay или Transcribe (wreally.com)
У последнего также есть платный автотранскрибатор.
— Можно просто делегировать это дело фрилансерам — они сами разберутся, какой способ расшифровки аудио им выбрать и использовать. Как правило, стоимость часа работы опытного автора/редактора/журналиста в разы выше, чем цена на транскрибацию текста. Выгоднее заплатить сторонним исполнителям, а не тратить часы на рутину. Специалистов можно найти на Zapisano, YouDo, FL, Kwork и других площадках.
Что такое транскрибация
Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.
Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.
Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.
Перевод речи в текст вручную или с помощью специальной программы полезен
- студентам для перевода записанных аудио- или видео-лекций в текст,
- блогерам, ведущим сайты и блоги,
- писателям, журналистам для написания книг и текстов,
- инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
- фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
- людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
- другие варианты.
О проблемах автоматического перевода речи в текст
Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.
Речь у всех людей разная:
- настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
- с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
- с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.
В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.
В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.
В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.
Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.
Расшифровка аудио и видео в текст на биржах фриланса
Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.
Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ – задание на транскрибацию.
Для своего заказа на бирже можно выбрать исполнителя – человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.
Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.
Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.
Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.
Две биржи фриланса
Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:
Рис. 5. (кликните для увеличения)
Биржа фриланса weblancer.net
Другая биржа, где можно заказать расшифровку аудио/видеозаписей – freelance.ru
Биржа фриланса freelance.ru
Дополнительные материалы:
1. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер
2. При просмотре роликов на ноутбуке заикается звук
3. Как всегда открывать видео удобным плеером в Windows 10
4. Программы для создания электронной книги
5. Оповещения Google Alerts – зачем и как пользоваться, примеры использования
Статья впервые была опубликована 5 июля 2017 г., обновлена 31 августа 2019 г.
Распечатать статью
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик. Уже более 3.000 подписчиков
.
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам
Усовершенствовать ручную расшифровку
Можно пойти другим путем — не автоматизировать, но упростить работу и транскрибировать без кошмара, описанного в самом начале статьи. Вам все равно придется слушать и записывать, но это будет удобно делать внутри хорошо обустроенного сервиса.
oTranscribe
Бесплатный веб-сервис для ручной транскрибации текста. Работает как с аудио, так и с видео, в том числе YouTube-роликами. Открывает десятки форматов: wav, mp3, mpeg, webm и др.
Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.
Интерфейс oTranscribeИнтерфейс oTranscribe
Express Scribe
Условно-бесплатное десктопное ПО для Windows/Mac. Позволяет загружать аудио и видеофайлы с самых разных источников: дисков, FTP-серверов, электронных писем и др. Поддержка форматов зависит от версии: например, mp3 и wav открываются в любом случае, а wmv, mp4 или 3gp — только в Pro.
Гибкие настройки воспроизведения: управляйте горячими клавишами, меняйте скорость, переключайтесь на определенный таймкод. Можно добавлять заметки к файлам, подключать к работе ножную педаль — специальное устройство, USB-переключатель для геймеров и транскрибаторов.
Удобно, что все записи добавляются в список и между ними легко переключаться — не нужно каждый раз заново их загружать. Неудобно, что нет текстового редактора (зато есть интеграция с MS Word, Corel Wordperfect, Lotus Wordpro и другими текстовыми процессорами под Windows).
Неограниченная лицензия PRO стоит от 25 $, но для личного использования вполне хватит бесплатной версии.
Так выглядит окно Express Scribe
Transcriber Pro
Тоже десктопный инструмент для ускорения ручной расшифровки (правда, только аудио в текст и только для Windows). Функциональность похожа на аналогичные решения: есть управление горячими клавишами, создание заметок (тегов), автозамена текста, настройка «прыжка» после паузы и др.
В числе преимуществ Transcriber Pro также указали командную работу — возможность разбивать проект на подзадачи, выгружать их и пересылать, потом объединять результаты в один файл. Участники команды будут работать в офлайне, но результат потом соберется в одно целое.
Платная лицензия стоит 640 руб. в год, но ее нет смысла покупать ради такой функции, как экспорт в интерактивные стенограммы. Этот формат похож на обычные субтитры, которые, например, выгружаются с YouTube.
Видеообзор программы.
LossPlay
Это десктопный плеер для Windows в помощь расшифровщикам аудио/видео. Открывает mp3, wav, mp4 и др. (разработчики отмечают, что есть также «интеллектуальная поддержка недокументированных форматов», что бы это ни значило). Парит поверх всех окон, поэтому позволяет работать в любом текстовом редакторе.
Hot keys настраиваются не только для управления воспроизведением, но и для вставки шаблонных текстовых фрагментов. Если не нравится стандартный дизайн, в настройках можно задать элементам другие цвета.
Придется по душе тем, кто ностальгирует или до сих пор пользуется Winamp.
Такой вот внешний вид у LossPlay
Универсальное решение: wreally.com
Альтернатива всем вышеперечисленным инструментам — Transcribe (wreally.com). Этот онлайн-сервис позволяет транскрибировать текст обоими способами: вручную (как в oTranscribe) и автоматически (создатели указывают точность 90%). Открывает десятки видов файлов: webm, mp3, mp4, 3gp, wmv и др. Есть автосохранение, работа без доступа к интернету, интеграция ножной педали, настройка горячих клавиш, экспорт видеосубтитров. В отличие от RealSpeaker, гарантируется безопасность и приватность.
Бесплатно можно получить только 1 минуту автоматической расшифровки. Далее — 6$ в час. Ручная транскрибация тоже стоит денег, но совсем небольших — 20$ в год.
Так выглядит инструмент для ручной транскрибации
Пример работы авторасшифровщика