Транскрибация: что это такое, как и сколько на этом можно заработать?

Как работает транскрибатор, технически?

Процесс работы здесь чем-то напоминает школьный диктант. Вы слушаете “учителя”, т.е. в данном случае оратора на записи. Отслушиваете одну фразу, ставите воспроизведение на паузу, пишете то, что запомнили. Включаете плеер снова, запоминаете услышанное, тормозите запись, снова пишете… И так — без остановки. Я не зря назвал эту работу монотонной.

Конечно есть и другой способ: замедлить скорость воспроизведения настолько, чтобы вы успевали транскрибировать услышанное без постоянных пауз. Профессиональный плеер не зря так называется — он позволяет замедлять скорость аудио без ухудшения качества. Вы все расслышите, голос не превратится в бас, как это иногда бывает при замедлении скорости.

Но к самому принципу такой безостановочной работы необходимо привыкнуть. Конечно же, вы можете попробовать оба режима транскрибирования – с паузами и без, а какой вам больше нравится, это вы решите сами.

Как выполнить транскрибацию?

Как сделать транскрибацию? Самый время затратный способ – сделать все самостоятельно. Для этого необходимо включить звук, запомнить фразу, поставить аудио на паузу и напечатать услышанное в текстовом документе. Причем часто звук уступает по качеству и с первого раза понять речь может не получаться. Тогда приходиться прослушивать одно и то же дважды, а то и трижды и при этом каждый раз переходить из одной программы в другую.

Значительно облегчить процесс можно с помощью специальных программ для транскрибации:

Express Scribe Transcription Software – подходит для операционных систем Mac OS X и Windows. Есть как бесплатная, так и платная версия, но обе они на английском языке. Функции: замедляет скорость воспроизведения звука, поддерживает формат файлов и видео и аудио, работает с Microsoft Word, что дает возможность не тратить время на переключение между программами, так как все будет находиться на одном экране.

LossPlay – простой, бесплатный и русскоязычный плейер для новичков в сфере транскрибации с минимальным количеством настроек, подходящий только для операционной системы Windows. Он поддерживает все популярные форматы аудио, регулирует скорость воспроизведения и работает с Microsoft Word.

Speechpad – это голосовой блокнот, позволяющий конвертировать звук аудио в текст. Устанавливать на компьютер его не нужно, он работает онлайн. Для того, чтобы им воспользоваться потребуется Google Chrome и микрофон. После включения микрофона нужно начинать надиктовывать текст. Программа автоматически все расшифрует и отобразит в текстовом документе. Для конвертирования видео в текст необходимо в строку вставить ссылку с Ютуба и нажать на кнопку запись.

Transcriber-pro – приложение для Windows на русском языке, с помощью которой можно и прослушивать аудио и просматривать видео. С помощью встроенного текстового редактора проставляются временные метки и имена участников диалога. Из готового текста можно делать «интерактивные стенограммы». Воспользоваться этим приложением можно только при годовой подписке, стоимость которой составляет 689 рублей.

RSplayer V1.4 – несложная программа, позволяющая обрабатывать и расшифровывать аудиофайлы с поддержкой горячих клавиш. Работает совместно с Microsoft Word. Скачать ее можно бесплатно и подойдет она только для Windows. Однако, на новых версиях отмечено, что она иногда тормозит.

Voco – профессиональное приложение для операционной системы Windows, позволяющее преобразовывать речь в текстовый формат, а также предоставляет возможность голосового набора в любом тестовом браузере. Для распознавании речи подключение к интернету не требуется и в ней есть большая коллекция тематических словарей. Еще можно купить две расширенные версии: Voco.Professional и Voco.Enterprise. Они работают с уже готовыми аудио файлам. Единственный минус их – высокий ценник.

Dragon Dictation – это приложение для современного мобильного телефона (смартфона), которое распознает надиктованную речь. Причем распознает оно не только русский язык, но и еще 39 иностранных всех разновидностей. Набранный текст можно редактировать, пересылать электронным письмом и в аккаунты социальных сетей или копировать в буфер обмена.

RealSpeaker – это самое уникальное приложение, которое умеет не просто распознавать аудио формат речи, но и живую, которая наговаривается на камеру. Встроенное видеорасширение RealSpeaker позволяет даже считывать движение губ, что положительно сказывается на распознавании речи (увеличивает качество на 30-40%). Также приложение, кроме русского поддерживает еще 10 языков. Воспользоваться приложением можно бесплатно, но это условно на определенный период времени, бессрочная версия обойдется в 2 тыс. руб.

И последний вариант выполнения транскрибации – воспользоваться помощью профессионала, который этим занимается уже давно. Но в таком случае нужно учитывать конечную стоимость работы и во сколько обойдутся услуги исполнителя.

Способ 4. RealSpeaker

Простой и удобный, но платный онлайн сервис. Стоимость — 8 рублей/минута, до 1,5 минут — бесплатно. Если объем файла для транскрибации небольшой по времени, есть смысл им воспользоваться. 

Достоинства RealSpeaker:

  • работает с загруженными медиафайлами
  • воспринимает 37 языков мира
  • указывает расчетное время транскрибации

 Недостатки сервиса:

  • платный
  • готовый текст после транскрибации доступен всем пользователям.

Рассмотрим бесплатный вариант.

Шаг 1. Заходим на сайт RealSpeaker. Сервис предложит выбрать язык речи, используемый в нашем медиа — выбираем. Нажимаем кнопку «Продолжить».

Шаг 2. Выбираем медиа файл, который необходимо транскрибировать.

Шаг 3. Проверяем, какой файл загрузился, и смотрим, сколько времени займет транскрибация. Нажимаем «Перейти в Мои медиа».

Шаг 4. Нажимаем кнопку «Транскрибировать», которая находится в таблице  «Мои медиа» напротив загруженного медиа файла. 

Шаг 5. По завершению транскрибации напротив файла появится кнопка «Текст». Нажимаем на неё.

Шаг 6. Откроется окно с текстом и небольшая панель инструментов для редактирования.

Получившийся текст копируем себе в документ и при необходимости исправляем ошибки.

Коротко о главном

— Высококачественное аудио можно попробовать расшифровать автоматически — тогда потребуется минимум правок. Чем хуже качество, чем больше шумов, чем тише голос — тем дольше нужно будет возиться с текстом после автотранскрибации. Примеры инструментов: Google Docs, RealSpeaker, Dictation, Voco.

— Если аудио неважного качества и с обилием посторонних звуков, а у говорящего тихая речь, много слов-паразитов и отвлечений не по теме — пожалуй, стоит выбрать ручную расшифровку. Главное, облегчить ее с помощью специальных решений: oTranscribe, Express Scribe, Transcriber Pro, LossPlay или Transcribe (wreally.com)

У последнего также есть платный автотранскрибатор.

— Можно просто делегировать это дело фрилансерам — они сами разберутся, какой способ расшифровки аудио им выбрать и использовать. Как правило, стоимость часа работы опытного автора/редактора/журналиста в разы выше, чем цена на транскрибацию текста. Выгоднее заплатить сторонним исполнителям, а не тратить часы на рутину. Специалистов можно найти на Zapisano, YouDo, FL, Kwork и других площадках.

Как происходит транскрибация аудиоролика?

Распознавание звука с аудиозаписей осуществляется исполнителем Юду на профессиональном оборудовании, позволяющем убрать все шумы и помехи и определить дословный текст. Благодаря этому на Юду вы можете заказать расшифровку любых важных записей, в том числе:

  • переговоров
  • аудиокниг
  • телефонных разговоров для суда
  • стенограмм
  • защиты диссертаций
  • конференций

Расшифровка аудио в текст, выполняемая исполнителем Юду, включает в себя не только распознавание слов из звукового файла, но и грамотную запись в текстовом формате. Набор текста осуществляется специалистом с высокой скоростью печати, что позволяет быстро обрабатывать большие объемы информации. Наборщик может создавать контент в любых текстовых документах по вашему заказу (MS Word, RTF, ODT).

После наборщика, зарегистрированного на Юду, текст переходит к редактору, который вносит правки, исправляя все грамматические, пунктуационные и стилистические ошибки

Редактирование текста крайне важно при транскрибации аудиокниг и стенограмм, где необходима художественная подача материала

Профессиональная работа исполнителя Юду также может включать в себя конвертацию файлов аудио из одного формата в другой. К примеру, при записи аудиокниги из MP3 делается одновременно несколько форматов, позволяющих снизить вес файла при сохранении качества звука.

При транскрибации звуковых файлов для суда исполнитель Юду точно воспроизведет все нюансы разговора, включая ненормативную лексику, искаженные слова, смех. Далее документация распечатывается, оформляется титульным листом, прошнуровывается и фиксируется печатью – именно в таком виде документ будет предоставлен вам исполнителем Юду.

Что такое транскрибация

Транскрибация – это умение преобразовывать голосовую информацию в текстовую.

Например. Вам дали аудио или видео запись, где человек что-то рассказывает. Ваша задача состоит в том, чтобы перевести голос в текст.

На первый взгляд, кажется, что ничего сложного в этом нет. Включил звук, запомнил пару предложений и записал в текстовый редактор.

В лучшем случае вам повезет, если выступающий говорит без разных: «бе», «ме» и других слов-паразитов. Как показывает практика, таких людей немного. Транскрибатор должен вырезать такие стоп – слова без потери смысла.

Но, иногда в диалоге участвуют два и более человек. Тогда задача усложняется. Нужно понять и не запутаться, кто и о чем говорит.

Случается и такое, что вам могут дать рабочий материал с плохим качеством звука. Тогда придется по несколько раз прослушивать одно и то же предложение, чтобы понять о чем идет речь.

Преимущества и недостатки транскрибации онлайн

Перевод аудиофайлов в текстовый формат обладает определенными достоинствами и недостатками. К основным преимуществам этого вида деятельности стоит отнести следующее:

  • Позволяет выполнять работу в удобное время. Это означает, что для занятий транскрибацией не требуется всю неделю ходить в офис и сидеть там целый день. Благодаря этому удается составить максимально удобный график.
  • Помогает улучшить память. Такой эффект достигается за счет запоминания длительных аудиограмм.
  • Помогает увеличить скорость печати. При систематическом наборе текста можно даже приобрести навык слепой печати.
  • Помогает развить внимательность и усидчивость. Этот вид деятельности позволяет научиться заниматься монотонным трудом и стать более терпеливым.

При этом данный вид деятельности имеет определенные минусы:

  • Не позволяет получать высокий доход. Это обусловлено отсутствием начальства и четкого графика, который стимулирует выполнение работы. Обычно получать хорошие деньги не удается людям, которые не имеют должного уровня самоорганизации.
  • Нет возможности карьерного роста. В течение всей занятости доходы будут сохраняться примерно на одном уровне.
  • Приходится тратить много времени на проверку бирж. Чтобы была успешной транскрибация, сайты для заработка нужно мониторить постоянно. Это поможет своевременно откликаться на заявки. Если этого не делать, получать заказы не удастся.


Эта сфера деятельности имеет много преимуществ

Транскрибация — прекрасное направление деятельности, которое позволяет получать доход без вложений. С ее помощью удается стать более внимательным и усидчивым, а также самостоятельно сформировать свой график

При этом важно обладать достаточным уровнем самоорганизации

1-й шаг к успеху!
Прекращаем творить себе бедность. Бизнес. Интернет. Финансы
ПЕРЕЙТИ канал Твой 1-й>миллион в телеграмм

Что нужно знать о поиске заказов по транскрибации?

Так, мы разобрались с тем, как перевести аудио в текст, и что может помочь в осуществлении данного процесса. Теперь остановимся на том, кто создает такие задания, и где их можно найти.

Перевод аудиофайла в текст чаще всего востребован людьми, имеющими дело с:

  • лекциями;
  • конференциями;
  • интервью;
  • аудио или видеокурсами;
  • вебинарами и пр.

Таким образом, работу по транскрибации аудио в текст могут заказывать преподаватели ВУЗов, журналисты, репортеры и т. д. Даже студенты могут выступать в роли заказчиков, если им необходимо срочно перевести запись лекции в текстовый формат.

Второй вопрос – где искать заказы по переводу видео в текст. С этим сложностей не возникнет, поскольку такую работу можно найти на всевозможных биржах фриланса. А их в интернете есть огромное множество.

Еще один вариант – самому подать объявление о предоставлении услуг в этой сфере. Работа транскрибатором сегодня не менее популярна, чем наборщиком текста или копирайтером. Размещать свои предложения можно на специальных виртуальных досках объявления и сайтах по поиску удаленной работы.

Но главное, что нужно помнить, – это то, что при подаче объявления или заявки на выполнение заказа по транскрибированию, необходимо избегать шаблонных, стандартных выражений типа «договорная цена», «быстро и качественно» и пр. Необходимо указать конкретно, что именно вы будете делать, за какую цену, и как много времени вам понадобится на выполнение задания.

Сколько можно заработать на транскрибации?

По отзывам людей в интернете, которые занимаются транскрибацией текста, можно сделать вывод, что перевод часового видео или аудио в текстовый формат примерно стоит 1 тыс. руб.

На цену может повлиять:

  1. Срочность выполнения работы, чем быстрее заказчику нужен готовый текст.
  2. Качество материала (присутствие посторонних шумов, помех и нечеткий звук).
  3. Количество говорящих лиц – в диалоге еще нужно разобраться кто какую реплику сказал.
  4. Сложность текста и наличие терминологии. Например, в медицинских аудио, человеку не специализирующемуся на этой сфере будет очень тяжело понять некоторые слова и придется искать в интернете их правильное написание.
  5. Индивидуальные требования заказчика – какое нужно оформление, нужно ли расстанавливать тайм-коды, дословный ли нужен перевод и т. д.
  6. Язык записи – перевод аудио/видео на английском языке в английский текст или с английской речи в русский текст стоит намного дороже.

Немаловажную роль в суммах заработка сыграет быстрота и качество выполнения работы. Если серьезно подойти к транскрибации, то при занятости с утра до вечера в месяц можно получить доход в размере 50-80 тыс. руб.

Сайты для заработка на транкрибации аудио

Сайтов, предоставляющих возможность заработка на переводе аудио в текст, в интернете есть довольно много. Причем, зарабатывать можно сразу на нескольких ресурсах. Если вы – новичок, то самым оптимальным вариантом для вас станет регистрация на нескольких сервисах одновременно. Какие биржи выбрать? Сайты фриланса для заработка на транскрибации приведены ниже.

Лучшие проекты для поиска работы на фрилансе представлены в следующих статьях:

  • Сайты фриланса и удаленной работы в интернете
  • Биржи копирайтинга для заработка на текстах и статьях

Это биржи фриланса, на которых можно заработать не только на транскрибировании аудио в текстовые форматы. Здесь можно найти массу других вакансий для творческих и любящих самосовершенствоваться личностей.

Существуют и другие сайты вакансий для транскрибации. Это популярные биржи копирайтнинга и рерайтинга. На них можно подобрать заказы транскрибации аудио и видео в тексты на разных языках, поэтому такая работа будет интересной и полезной также для полиглотов.

Так, биржами копирайтинга, где время от времени размещаются подобные заказы. Конечно, на биржах контента найти подобные заказы можно нечасто, но, все же, можно. Главное, тщательно отслеживать новые задания в ленте заказов.

Какова средняя цена на перевод звука в текст

Множество сервисов фриланса выставляют разную цену за подобного рода услуги.

В среднем, ценник составляет около тысячи рублей за перевод одного часа видео. Стоит оговориться, что такой хронометраж довольно сложен, и на его транскрибацию может уйти целый день.

Кроме того, ценник сильно зависит от типа аудиофайла, его качества, фоновых шумов, и особенно – языка.

За иностранные аудиофайлы ценник выставляется гораздо выше, чем за русскоязычные, разница почти в 6 раз.

Кроме того, все сильно зависит от тематики – например, светский разговор перевести объективно проще, чем медицинский, с огромным количеством терминов и профессиональных выражений.

В целом, если ответственно подходить к выполнению своей работы и выкладываться по максимуму, то в месяц можно получать до 30 000 рублей.

Это довольно хороший показатель, особенно для небольших городов.

Что приходится расшифровывать

Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.

Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.

Надиктовка
*тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и вышетайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» – бальзам на транскрибаторскую душу.
Простой вебинар
** тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку

Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
***** тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
***** тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего

При этом качество звучания, как правило, оставляет желать лучшего.

Работа для кинематографистов 

Субтитры **тайм-код обязательно Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики.
Простой монтажный лист ***тайм-код обязательно Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды.
Полный монтажный лист *****тайм-код обязательно Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре.

Общая информация и суть перевода аудио в текст

Под транскрибацией понимают автоматический или ручной перевод речи в текстовый формат. За запись аудио или видеофайлов выплачивают определенную сумму денег. При этом процедура выполняется вручную.

Такая работа может требоваться следующим категориям людей:

  • студенты — для перевода записанных аудиофайлов или видеороликов в текст;
  • блогеры — они ведут сайты или блоги;
  • писатели или журналисты — пишут книги или составляют тексты;
  • инфобизнесмены — им требуется текст после проведения вебинара и выступления;
  • фрилансеры — вручную переводят речь в текстовый формат, чтобы облегчить и ускорить свою работу;
  • люди, которые испытывают проблемы с набором текста — они могут продиктовать письмо и отправить его родным и близким.

Суть работы заключается в переводе звуковых файлов в текст

Seolib.ru — сервис определения позиций с бонусным бесплатным функционалом

Программы для транскрибации

Существует много специальных сервисов, которые позволяют облегчить работу. Сервис dictation.io считается прекрасным вариантом, который дает возможность бесплатно перевести речь в текстовый формат.

Площадка обеспечивает автоматическое сохранение готовых результатов. Это поможет избежать случайного удаления вследствие закрытия вкладки или браузера. Сервис не позволяет распознать готовые файлы. Он работает с микрофоном. При диктовке следует называть знаки препинания.

Текст удается распознать достаточно корректно, без орфографических ошибок. Также можно самостоятельно вставлять с клавиатуры знаки препинания. Сохранить готовые результаты можно на своем компьютере.

Сайт speechpad.ru представляет собой онлайн-площадку, которая позволяет через браузер Google Chrome переводить речь в текстовый формат.

Сервис работает с готовыми файлами и микрофоном. Безусловно, качество будет выше при использовании внешнего микрофона. Однако сайт неплохо трансформирует даже ролики на YouTube.

При этом нужно нажать «Включить запись», ответить на вопрос относительно использования микрофона. А затем следует нажать «Разрешить».

Готовый результат удается легко отредактировать. Для этого требуется ручным способом исправить выделенное слово или надиктовать его снова. Результаты можно сохранить в личном кабинете или скачать на компьютер.

Сервис позволяет работать с 7 языками. При этом он имеет и недостаток. Если требуется транскрибация готового аудиофайла, он звучит в колонках. Это становится причиной дополнительных помех в виде эха.

Dragon Dictation представляет собой бесплатное приложение, которое подходит для устройств компании Apple. Программа дает возможность редактировать результаты, выбирая нужные слова из списка

При этом важно четко проговаривать все звуки, без пауз. Нежелательной является и интонация

Иногда можно столкнуться с ошибками в конце слова.

Существует много программ, которые облегчают работу

Приложение Dragon Dictation подойдет и для обладателей гаджетов Android. Они могут диктовать в него список покупок или другую важную информацию.

Следующим полезным сайтом станет RealSpeaker. Эта программа с легкостью переводит речь человека в текстовый формат. Она позволяет преобразовывать речь, которая звучит в микрофон. Он может быть встроен в ноутбук. Также удается преобразовывать формат, записанный в аудиофайлы.

Программа преобразовывает 13 языков мира. Существует бета-версия, которая функционирует как онлайн-сервис. Для этого необходимо выбрать русский язык, загрузить на сайт файл. При этом за его перевод приходится платить. После этого можно скопировать готовый текст. Чем больше размер файла, тем больше времени уйдет на преобразование.

Speechnotes считается альтернативой RealSpeaker, которая позволяет работать на Android. Текст удается редактировать автоматически и расставлять в нем знаки препинания. Этот вариант удобен для составления список или заметок. В результате удается получить качественный текст. Также существует платная премиум-версия.

Способ 3. Speechpad.ru

Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:

А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга. 

Плюсы блокнота: 

  • работа и с микрофоном, и с медиа файлами
  • набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
  • сохранение готового текста в файл 

Минус пользователи отметили лишь один, и он несущественный  — корректно блокнот работает только в браузере Google Chrome. 

Рассмотрим транскрибацию видеоролика с Youtube.

Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.

Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».

Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»

Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.

ID ролика находится в адресной строке Youtube после знака «=». 

Нажимаем кнопку «Обновить».

 Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»

Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.

Клавиатура печатает не те буквы, которые нажимаешь: причины

Как преобразовать аудио в текст

Способ №1

Данный способ, не требует ни каких настроек. Принцип заключается в следующем. Вы воспроизводите звуковой файл или видео, звук идёт через колонки, а микрофон захватывает звук из колонок. Вы также можете включить запись на диктофоне или смартфоне, и микрофон будет захватывать звук с этих устройств.

Схема №1

Открыв голосовой блокнот, переходим в раздел «Транскрибация».

Транскрибация

Сервис предоставляет возможность захвата аудио из видео YouTube, видео файлов и аудио файлов. Видео и аудио файлы при этом могут быть расположены как в интернете, так и на Вашем компьютере.

Для начала, рассмотрим пример открытия видео с YouTube. Для этого потребуется ID данного видео. Этот ID нужно вставить в поле «URL медиа файла для проигрывания» и нажать кнопку «Обновить».

Подключение видео с YouTube

Такой уникальный ID есть у каждого видео на YouTube. Увидеть его можно в адресной строке браузера.

Теперь рассмотрим пример с открытием файла на вашем компьютере.

Сначала указываете тип файла, аудио или видео. Затем нажимаете на кнопку «Выберите файл» и выберите файл на компьютере. Выбрав файл, нажимаете кнопку «Открыть».

Открыть файл с компьютера

Следующим этапом располагаете, микрофон рядом с колонками вашего компьютера или скажем диктофоном или смартфоном, и включаете запись.

Включаем запись

Далее полученный результат (готовый текст), копируете в текстовый редактор и редактируете как вам надо.

Способ №2

Данный способ позволяет исключить микрофон из цепочки преобразования аудио в текст. Звук будет напрямую передаваться из проигрывателя в голосовой блокнот

И уже не важно, какой у вас микрофон

Схема №2

Но для этого потребуется отдельная программа — Virtual Audio Cable. Данная программа создаёт виртуальный аудио кабель и передаёт аудиопоток между приложениями. Программа эта платная, стоит от 25$ до 50$. Но можно воспользоваться бесплатной версией. В бесплатной версии есть ограничение на количество виртуальных кабелей. Можно создать только 3 кабеля. А ещё женский голос постоянно напоминает, что это бесплатная версия если использовать аудиорепитер. Но скажу вам честно, можно обойтись и без него. Зато пробная версия не ограничена по времени. В видеоуроке я покажу, в чем хитрость.

Итак, для начала скачиваем программу «Виртуальный аудио кабель», ссылка выше.

Виртуальный аудио кабель

После того, как вы скачаете архивный файл на компьютер, его нужно распаковаться. Для этого можно воспользоваться архиватором или простым копирование файлов из архива в новую папку.

Распаковка архива

Когда архив будет распакован, запускайте файл установки, соответствующий разрядности вашей операционной системы. В смысле, 32 или 64 разрядная.

Установка программы VAC

Установка стандартная и не потребует от вас дополнительных знаний и умений. Просто следуйте указаниям мастера установки.

Далее, важный технический момент, нужно настроить в качестве устройства воспроизведения виртуальный аудио кабель.

Настройка аудиоустройства

Теперь Вы ни звука не услышите из ваших колонок, зато весь звук через виртуальный аудио кабель будет передаваться в голосовой блокнот. То, что нам и нужно.

Вот теперь можно открыть голосовой блокнот, перейти в раздел «Транскрибация» и выполнить перевод аудио в текст, как это было описано в первом способе. Только сейчас на надо подносить микрофон к колонкам.

Настройка аудиорепитера

Теперь вы будете слышать звук и женский голос, напоминающий о бесплатной версии программы, который после третьего повторения уже сводит с ума. Но, этим можно и не пользоваться, тем более, если вы знаете, о чём речь в вашем видео или аудио.

Всем желаю удачи.

Способ 5. LossPlay

Для корректной работы программы дополнительно потребуется установить кодеки: K-Lite Codec Pack и QuickTime. Рекомендации по их установке есть на сайте разработчика LossPlay. 

Плюсы программы:

  • транскрибация аудио и видео файлов
  • наличие горячих клавиш
  • возможность менять скорость записи 
  • наличие тайм-кодов
  • работа с текстовым редактором Word

Минус всего один  — набор текста выполняется вручную, то есть слушаем запись и набираем текст на клавиатуре.

Шаг 1. Заходим на сайт разработчика LossPlay.  Нажимаем «Скачать».

Шаг 2. Далее открываем скачанный файл и устанавливаем программу на свой компьютер. Также скачиваем и устанавливаем необходимые кодеки. 

Шаг 3. Запускаем плеер. Медиа файл можно добавить нажав внизу на кнопку «+», либо перетащить его мышкой, либо же воспользоваться горячими клавишами Ctrl+Shift+O.

Плеер содержит 7 основных кнопок управления:

  • Перемотка
  • Пауза
  • Стоп
  • Добавление и удаление файлов в плейлист
  • Регулятор громкости
  • Регулятор баланса
  • Регулятор скорости

Шаг 4. С помощью вкладки «Настройки» — «Общие» можно настроить Тайм-код  — указатель времени, который вставляется в текст транскрибации. Он нужен для того, чтобы найти конкретный момент в записи, при этом не переслушивая весь медиа файл, а также для сопоставления текста и записи.

Шаг 5. Открываем документ Word и набираем текст под диктовку плеера.

Во время транскрибации окно плеера можно свернуть, а работу регулировать с помощью горячих клавиш. При этом есть возможность пользоваться как заводскими настройками клавиш, так и настроить их для себя самостоятельно. 

Благодаря горячим клавишам в текстовом редакторе удобно работать, не обращаясь к самому плееру. С их помощью легко перемотать прослушиваемый отрывок назад, поставить на паузу или замедлить воспроизведение, даже не переключаясь на окно плеера.

Теперь вы знаете 5 сервисов, которые помогают сделать транскрибацию. 

Их основные отличия рассмотрим в сводной таблице. Выбирайте тот, который понравится и будет максимально удобен лично вам.

+/- Google Docs Dictation.io Speechpad.ru Realspeaker LossPlay
требуется ли установка +
распознавание речи + + + +
допускает ошибки + + + + +
сервис платный +
корректно работает/
устанавливается со всех браузеров

Все перечисленные способы существенно облегчают кропотливый труд транскрибатора. Но ни один сервис не справится с этой работой без вашего участия. Всё равно придется проверять текст, редактировать его и исправлять ошибки. Только так задание будет выполнено качественно и безупречно. 

На мой взгляд, больше всего ошибок допускает голосовой ввод в Google Docs. Ошибки при работе с программой LossPlay зависят от грамотности самого транскрибатора. Примерно одинаковое количество ошибок допускается в остальных сервисах. На результат транскрибации во многом влияет и качество исходной записи. 

The following two tabs change content below.

  • Елена Кревская: «Мне не жаль отпускать в мир свои тексты» — 20/11/2020
  • Самозанятость для статейного автора: плюсы и минусы — 18/11/2020
  • 6 лучших книг для копирайтера в 2020 году — 31/07/2020

Трехходовой клапан для отопления с терморегулятором: виды и преимущества

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector