Программы и способы для транскрибации аудио и видео в текст. часть 2

Содержание:

Кому нужно транскрибирование текста?

Такие расшифровки на самом деле нужны очень многим. Например, журналистам, которым приходится работать с большим объемом информации, студентам, желающим получить учебные материалы, людям, которые провели свои лекции или вебинары и хотят иметь их в текстовом варианте. Очень много расшифровок дают исследовательские маркетинговые компании. Иногда необходимо «дешифровать» заседания, совещания, семинары, симпозиумы. Это самая сложная работа: люди спорят, перебивают друг друга, высказывают полярные мнения. Бывает сложно понять, кто и что говорит, ведь это не видео, а аудио. Это рваные фразы, не сказанные слова, отрывки мыслей. Тут надо не бездумно печатать, а уловить мысль и донести ее в тексте. Тут транскриптор выступает уже как редактор.

Сколько можно заработать?

Эта работа оплачивается не очень высоко. За 60 минут расшифрованной записи платят в среднем от 8 до 12 $. Учтите, что даже самый опытный расшифровщик за полный рабочий день сможет проработать не больше 60—90 минут записи, так что скорее это небольшой бонус во времена финансового кризиса.

Техника справляется «на троечку»

Конечно, в то время, когда все задания выполняют компьютеры, многим хочется как-то механизировать и упростить этот процесс. Существуют программы на специализированных сайтах, которые переводят аудио в текст. Но пока техника не дошла до такого уровня, чтобы «захватывать» голос, который потом не надо править. Анализаторы речи развиваются крайне медленно и замену человеку пока не изобрели. Еще одна проблема — в том, что машина не понимает всех голосовых нюансов, записывает все что «слышит», с «эканъем» и «мэканьем», не может расшифровать специальные термины или аббревиатуры, если спикер говорит невнятно или не договаривает слова. Тогда расшифровщик выступает еще и редактором, делая текст удобоваримым и понятным. Один из самых популярных сайтов — «Голосовой блокнот». На нем достаточно зарегистрироваться, чтобы получить доступ ко всем его возможностям: тут можно диктовать, а также проигрывать аудио, которое, «по идее», программа должна переведет в текст.

А если у вас хороший микрофон (а не встроенный, например, в ноутбуке) и достаточно терпения, чтобы медленно и четко проговаривать каждое слово, а также делая паузы, чтобы программа успела «переварить» информацию — то вы можете что-то надиктовать. Но даже в идеальных условиях, без посторонних шумов и с идеальной дикцией, получается масса ошибок, которые проще напечатать сначала, чем править. Запись обычного разговора, да еще нескольких человек, она вообще не понимает. Честно говоря, просто напечатать этот текст «по старинке» намного быстрее. Сейчас самый лучший вариант — шифровать вручную, но использовать для поддержки специальные программы. Они понижают уровень шума, замедляют или ускоряют запись делают тембр голоса более высокими или низким.

Подключили уже интернет-банкинг для удобных расчетов с клиентами и поставщиками?

Личный опыт

Транскрибирование текста приносит Виктору Р. примерно 12-14 $ в день. Основные заказы — расшифрование записей маркетинговых исследований.

Программное обеспечение для транскрибации

Знаете, уже несколько лет слышу один и тот же вопрос насчёт этой профессии: «а не смогут ли вскоре нейросети «выдавить» транскрибаторов?». Да, сейчас есть ПО для распознавания речи.

Но реально удачных решений пока что вижу только 2:

  1. Speech API от Google. Можно использовать данное API для внедрения в свои проекты либо для прямого распознавания, но нужно уметь создавать приложение, которое будет с API взаимодействовать. Именно это работает в голосовом поиске или переводчике от Google. Бесплатно вам предоставляется только 60 минут.

  2. Yandex SpeechKit. Тоже неплохое решение, на мой взгляд, не уступает API от Google, а с русской речью работает даже лучше. Используется на сервисах Яндекс, например, в голосовом поиске, Алисе.

Остальное ПО, которое пробовал, оказалось на порядок хуже. Да, я искал такие варианты, ведь надиктовывать статью гораздо удобнее, чем стучать по клавиатуре. Но адекватного решения, кроме данных API, не нашёл. Даже с ними всё далеко не идеально. Пунктуация и у меня не сильная сторона, но эти API соблюдением правил тоже не порадуют. А оформлять списки, таблицы, они точно не могут.

Да и те же субтитры. Посмотрите на автоматически сформированные субтитры на YouTube. Они явно далеки от идеала.

Так что хорошего программного решения для распознавания речи попросту нет. И появится оно, похоже, нескоро.

Это главный инструмент транскрибера (на фото наушники Наушники HyperX Cloud)

Остальное ПО, которое пробовал, оказалось на порядок хуже. Да, я искал такие варианты, ведь надиктовывать статью гораздо удобнее, чем стучать по клавиатуре. Но адекватного решения, кроме данных API, не нашёл. Даже с ними всё далеко не идеально. Пунктуация и у меня не сильная сторона, но эти API соблюдением правил тоже не порадуют. А оформлять списки, таблицы, они точно не могут.

Да и те же субтитры. Посмотрите на автоматически сформированные субтитры на YouTube. Они явно далеки от идеала.

Так что хорошего программного решения для распознавания речи попросту нет. И появится оно, похоже, нескоро.

Я пробовал варианты с распознаванием речи. Но потом времени на оформление статьи, исправление «непоняток», а также ошибок уходило больше, чем на старую добрую печать. Так что для транскрибации вам понадобится старый добрый набор средств:

  1. Видео или аудиопроигрыватель. Для видео я использую VLC media player, так как он позволяет работать со многими форматами, а для аудио ACG Player. Но можете использовать любой другой вариант. Что вам будет удобнее.

  2. Старый добрый текстовый редактор. Я юзаю LibreOffice, но можно работать и с другими текстовыми редакторами, тот же Word. Опять-таки, что удобнее, то и применяйте.

  3. Если мне нужны субтитры на YouTube, то я использую Notepad++. Для работы с таким форматом вариант самый подходящий. Какого-либо более удобного ПО не нашёл.

  4. Хорошие наушники.

Всё, это весь набор. Никаких «секретных и мегакрутых» приложений, которые сделают всю работу за вас, найти не сумел.

Ни одно приложение не распознает некачественную звуковую дорожку, фразы, в которых «ну, это, там, в общем» через слово, а также мямлей, которые что-то бормочут под нос.

А если на записи гвалт и все друг друга стараются перекричать либо говорить начинают вместе, то любое приложение, в том числе API от Яндекс и Google, не осилят транскрибацию такого аудио.

В общем, транскриберы ещё востребованы. И будут востребованы долго.

Как стать мастером транскрибации

Большинство транскрибаторов сейчас – это такие же новички, которых привлекает работа в Интернете. Первые заказы даются нелегко, и по выражению многих исполнителей, они работают практически за бесплатно. Чтобы стать востребованным специалистом, придется преодолеть все эти трудности и начать в буквальном смысле прорываться сквозь тернии, дабы стать заметной фигурой для заказчиков.

Что для этого нужно

  • Оборудование для работы (компьютер/ноутбук+выход в Интернет+хорошие наушники);
  • Программное обеспечение для транскрибации (см. соотв. раздел);
  • Самостоятельное обучение;
  • Внимательность;
  • Упорство;
  • Время;
  • Желание двигаться вперед;
  • Владение техникой быстрой печати;
  • Навыки работы с ПК и основными программами;
  • Грамотность;
  • Широкий кругозор;
  • Умение работать с разными стилями речи.

Ошибки начинающих

Новички зачастую совершают одни и те же ошибки, а потом мчатся в первых рядах «хейтеров» писать негативные отзывы, о которых мы поговорим позднее.

Ошибка ожидания. Даешь 500 р за полчаса! Транскрибация – это труд, а не легкие деньги. Будьте готовы к трудоемкой и кропотливой работе поначалу за небольшое вознаграждение.

Ошибка презентации. Нет времени на «мишуру»

Отсутствие портфолио и грамотно заполненной «визитки», банальное предложение и сомнительные аватары в профилях – поверьте, серьезный заказчик обратит на это внимание.

Ошибка компетенции. Просто напечатать услышанное! Многие берут заказы на темы, в которых не чувствуют себя уверенно

В результате текст получается несвязным, а многие слова и выражения остаются нераспознанными.

Ошибка сервировки. Мне за это не заплатят. Пренебрежение аккуратностью и оформлением готовой работы.

Секреты «мастера»

У опытных мастеров есть свои фишки, которые вы тоже можете начать использовать уже сейчас. Но для начала несколько советов, пренебрегать которыми точно не стоит:

  • Расширяйте свой кругозор. Читайте книги и статьи, повышайте свою грамотность и постоянно развивайтесь. Чем шире ваши знания, тем больше тем вы сможете охватить, и тем качественнее будут ваши тексты.
  • Постоянно практикуйтесь. Свой уровень нужно поддерживать, оттачивая ключевые навыки. Если вы всерьез решили заняться транскрибацией, постарайтесь не делать длительных перерывов между заказами.
  • Используйте утилиты. Научитесь пользоваться программами, которые сэкономят ваше личное время и избавят от ненужной нагрузки.

Мастера знают, что для расшифровки первой записи может потребоваться несколько часов, а то и весь рабочий день. Можно сократить это время почти в три раза, если использовать специальный плеер для транскрибации с функцией глобальных горячих клавиш (Express Scribe).

Не пытайтесь расставлять тайм-коды и идентификаторы вручную, а используйте функционал специальных программ (LossPlay).

Как узнать, подходит ли вам работа транскрибатором?

Если вы никогда до этого не расшифровывали тексты, я могу вам посоветовать попробовать свои силы без всяких заказов. Возьмите какое-нибудь интервью на радио – хотя бы на Эхе Москвы, у них каждый выпуск выкладывается на сайте со ссылкой для скачивания. Скачайте это интервью и попробуйте перевести ее в текст.

Чуть ниже я даю ссылку на программу, созданную специально для транскрибаторов — плеер, которым можно управлять, не сворачивая текстовый редактор. Откройте скачанный эфир радио в этом плеере, включите на своем телефоне секундомер, и печатайте, ни на что не отвлекаясь, пока не сделаете первые 10 минут выпуска. И затем посмотрите, сколько времени у вас отнял этот процесс. Соответственно, умножьте это чистое время на 6, чтобы получить итоговое время расшифровки одного часа.

Поначалу вы будете работать медленно, Печать у большинства сегодняшних людей имеет скорость не более 400 символов в минуту. У меня самого такая. Транскрибатору нужно, чтобы скорость была хотя бы от 500 символов в минуту, иначе вы будете работать слишком долго и получать слишком мало. А значит, вам понадобится научиться быстрому способу набора — слепому десятипальцевому методу. Как именно — это отдельная история. И я вам ее не расскажу (сам не умею =)

Набрав первые в своей жизни транскрибированные абзацы, подумайте, готовы ли вы тратить свое время на такую работу — монотонную, требующую неусыпного внимания. Если да, и вы любите писать под диктовку, то значит вам прямая дорога в транскрибаторы.

Коротко о главном

— Высококачественное аудио можно попробовать расшифровать автоматически — тогда потребуется минимум правок. Чем хуже качество, чем больше шумов, чем тише голос — тем дольше нужно будет возиться с текстом после автотранскрибации. Примеры инструментов: Google Docs, RealSpeaker, Dictation, Voco.

— Если аудио неважного качества и с обилием посторонних звуков, а у говорящего тихая речь, много слов-паразитов и отвлечений не по теме — пожалуй, стоит выбрать ручную расшифровку. Главное, облегчить ее с помощью специальных решений: oTranscribe, Express Scribe, Transcriber Pro, LossPlay или Transcribe (wreally.com)

У последнего также есть платный автотранскрибатор.

— Можно просто делегировать это дело фрилансерам — они сами разберутся, какой способ расшифровки аудио им выбрать и использовать. Как правило, стоимость часа работы опытного автора/редактора/журналиста в разы выше, чем цена на транскрибацию текста. Выгоднее заплатить сторонним исполнителям, а не тратить часы на рутину. Специалистов можно найти на Zapisano, YouDo, FL, Kwork и других площадках.

Основные навыки и инструменты транскрибатора

Специальных знаний и умений для выполнения транскрибации не требуется. Однако минимальный набор навыков всё же необходим.

Навык работы в текстовом редакторе. На начальном уровне желательно иметь представление о редакторе Word. Со временем лучше освоить Google Docs — онлайн-офис, работающий в рамках веб-браузера без установки на компьютер. Это очень удобно, так как пользоваться им можно с любого устройства, подключенного к интернету. Кроме того, офис позволяет работать офлайн и предоставлять доступ другим пользователям, например, заказчикам. 

Навык быстрой печати. Лучше освоить печать вслепую, ведь в таком случае производительность труда будет на порядок выше.  

Из инструментов для выполнения транскрибации понадобятся наушники и микрофон. Если работа выполняется на ноутбуке, можно пользоваться встроенным микрофоном. Но удобнее всего работать, когда он расположен прямо на наушниках. Комплект наушников с микрофоном надо купить и подсоединить в специально предусмотренный для этого разъем на компьютере. 

 Для работы в некоторых сервисах может потребоваться стерео микшер . Этот инструмент находится в настройках звука компьютера. 

Системы распознавания речи и транскрибация

Проблема создания системы распознавания речи получила развитие в 1952 году, когда была продемонстрирована первая попытка в истории человечества распознать голосовую команду.

Система Audrey американской компании «Bell Laboratories» могла распознать только цифры, произнесенные мужским голосом с определенным интервалом, но это стало настоящим прорывом.

С тех пор утекло много воды, лучшие умы бились над задачей научить компьютер понимать речь. Впереди планеты всей в этом вопросе оказались Google с функцией распознавания речи в браузере Chrome и Apple со своей программой Siri – оба события пришлись на 2011 год.

Сегодня выбор программ, автоматически преобразующих устную речь в письменный текст, довольно внушительный и для компьютеров, и для смартфонов, они постоянно совершенствуются, но все же для полноценной транскрибации не подходят.

Проблема таких программ в их требованиях к качеству звука. К сожалению, четкая речь без мусора и отсутствие посторонних шумов – редкое явление в работе транскрибатора. А несколько спикеров превращают итоговый текст в малопонятную кашу, на редактуру может уйти слишком много времени.

Программы, которые помогут увеличить заработок транскрибатора

Облегчают и ускоряют транскрибацию текста специальные программы в помощь транскрибатору. Рассмотрим основные.

Express Scribe

Основные полезные функции — возможность уменьшать скорость воспроизведения текста и отматывать запись с помощью залипаюших клавиш. Последняя позволяет тратить меньше времени, чем при кликании мышкой в плеере.

Transcriber-pro

Набор полезных функций:

  • горячие клавиши управления плеером;
  • возможность вставлять в траскрибируемый текст имена собеседников и именные метки;
  • функция автотекста;
  • набор специальных меток, которые позволяют делать корректуру текста, не прослушивая запись повторно.

Минус — программа платная. Впрочем, годовая лицензия в 2019 году стоит 640 рублей.

LossPlay

  • Плеер, который команда разработчиков создала специально для транскрибации текста.
  • Максимально адаптирован к работе с MsWord. Система горячих клавиш позволяет работать, не переключаясь между окнами, а в настойках ввода можно предусмотреть основные вордовские шрифты.
  • Можно вставлять тайм-коды и совмещать вставку их и текста одним нажатием клавиши.
  • Занимает немного места на жёстком диске компьютера.

Если возникнут сложности в работе, можно посмотреть бесплатный курс видеоуроков.

VOCO

Программа для автоматического распознавания речи и преобразования в печатный текст. В версиях Voco.Professional и Voco.Enterprise предусмотрена возможность работы с аудиофайлами.

Как заверяет производитель, словарный запас программы — 85 тысяч слов, предусмотрена возможность его расширения. Для этого надо указать документы, которые послужат источником недостающей лексики. Другие особенности:

  • При распознавании аудиофайлов автоматически расставляет знаки препинания.
  • Программа платная.
  • Производитель заверяет, что с помощью программы аудио трансформируется в текст в 1,5–2 раза быстрее, чем при расшифровке записи вручную.

Но полагаться на умную программу целиком не стоит. По завершении работы сверка с записью и корректура обязательны, а это всё равно время.

RealSpeker

Ещё одна программа — распознаватель текста, способная работать с любым онлайн или оффлайн текстовым редактором.

Среди полезных функций:

  • начало и завершение распознавания по команде голосом;
  • голосовые команды редактирования текста и знаков препинания;
  • возможность фильтрации неверных результатов;
  • автоматический переключатель заглавных букв.

Но, как и за любым распознавателем, нужен глаз да глаз, что и не позволяет откзаться от участия человека в транскрибации.

Секреты «мастера»

У опытных мастеров есть свои фишки, которые вы тоже можете начать использовать уже сейчас.

Но для начала несколько советов, пренебрегать которыми точно не стоит:

  1. Расширяйте свой кругозор. Читайте книги и статьи, повышайте свою грамотность и постоянно развивайтесь. Чем шире ваши знания, тем больше тем вы сможете охватить, и тем качественнее будут ваши тексты.
  2. Постоянно практикуйтесь. Свой уровень нужно поддерживать, оттачивая ключевые навыки. Если вы всерьез решили заняться транскрибацией, постарайтесь не делать длительных перерывов между заказами.
  3. Используйте утилиты. Научитесь пользоваться программами, которые сэкономят ваше личное время и избавят от ненужной нагрузки.

Мастера знают, что для расшифровки первой записи может потребоваться несколько часов, а то и весь рабочий день. Можно сократить это время почти в три раза, если использовать специальный плеер для транскрибации с функцией глобальных горячих клавиш (Express Scribe).

Не пытайтесь расставлять тайм-коды и идентификаторы вручную, а используйте функционал специальных программ (LossPlay).

Ваша задача – быть точным в написании услышанного, т.е. имен, событий, терминов и географических названий, поэтому проверяйте их на соответствие, прежде чем механически транскрибировать голос.

Зачем и кому нужен перевод аудио в текст?

Сделать аудио в текстовом формате в основном заказывают различные компании, занимающиеся обзвонами клиентов, оптимизаторы, инфобизнесмены, студенты, журналисты.

Приведу несколько популярных примеров:

  • телефонные разговоры;
  • семинары/вебинары;
  • интервью;
  • аудиоподкасты;
  • телепередачи.

Кому-то проще записать свои мысли на диктофон, а потом обратиться к фрилансерам, чтобы они сделали из этого статью или книгу, а кому-то нужны хорошие субтитры к видео и текстовая версия, потому что не всегда есть возможность смотреть.

Существует много различных вариантов, от которых также зависит стоимость работы.

Транскрибация — что это такое?

Транскрибация — это перевод речи из аудио или видео в текст.

Если говорить совсем простым языком, то вы берёте аудио- или видеозапись и перепечатываете всё, что там говорят, в логически связанный текст, в документ, удобный для последующего редактирования.

Очень простой вид работы, для которой требуется лишь слух, позволяющий разбирать русскую (или иностранную) речь, и навык набора текста на компьютере. От того, насколько быстро вы умеете печатать, будет зависеть ваш заработок.

Но не переживайте, если вы тихо набираете текст, чем больше вы будете практиковаться, тем лучше у вас будет это получаться.

Чтобы развить этот навык, необходимый всем, кто работает удалённо, рекомендую почитать мою статью о том, как я научился быстро печатать вслепую.

Плюсы занятия транскрибацией

Несмотря на то, что это один из самых простых способов заработка, он довольно нудный, но имеет ряд плюсов, благодаря которым можно им заниматься.

  1. Учитесь быстрее печать вслепую.
  2. Развиваете память, кратковременно запоминая большие аудиофрагменты.
  3. Развиваете внимательность, усидчивость, терпение и способность выполнять монотонную работу.
  4. Учитесь грамотно писать.

Минусы данной профессии

Считаю, минус транскрибации в том, что за эту работу не так уж и много платят, перспективнее было бы заняться чем-то более интересным и развивающим. Есть десятки других профессий, которым можно научиться и начать зарабатывать удалённо.

Рекомендую скачать и почитать бесплатную книгу «7 профессий для быстрого заработка в интернете».

Для кого подходит работа транскрибатором?

Скорее всего, такая работа подходит для тех, кто только учится зарабатывать онлайн. Школьники, студенты и совсем новички, которые ещё ничего другого делать не умеют.

На этом деле можно быстро и без вложений начать получать первые деньги, а далее уже осваивать что-то другое.

Автоматический и полуавтоматический перевод в текст: что это

Автоматическая (полуавтоматическая)  транскрибация аудио или видео в текст проводится с помощью специальных программ и приложений. Понадобится сервис, на который нужно загрузить аудио файл или видео ролик и нажать на кнопку типа «Включить запись». После этого надо дождаться, когда аудио автоматически превратится в текст и радоваться полученному результату. Сказка, мечты сбываются! Так бывает, но не всегда.

Эта услуга зачастую является платной. Однако качество автоматической транскрибации не всегда получается хорошей, и порой может повергнуть в ужас.

На таких сервисах автоматический перевод делает программа-робот. Задача робота состоит в том, чтобы воспроизвести в виде текста то, что автомат смог «услышать», смог разобрать. Если машина не смогла что-то толком разобрать, то она за это не отвечает. В итоге будет напечатана та «абракадабра», которую робот «услышал». И задумываться над абракадаброй робот не будет, ибо не стоит перед ним такая задача.

Человек может намного лучше выполнить транскрибацию, чем машина. Но скорость работы человека и робота сильно отличается. Программа-робот делает все очень быстро, не задумываясь и не останавливаясь. «Услышал» абракадабру, напечатал ее в виде текста, не задумываясь над отсутствием какого-либо смысла в полученном тексте – вот та задача, которую выполняет автоматическая программа-робот.

Speechpad: бесплатный автоматический перевод

Это Блокнот для речевого ввода. Для работы этого сервиса рекомендуется использовать внешний микрофон хорошего качества. Работает в браузере Гугл Хром для OS Windows, Mac и Linux, для пользователей Андроид и iOS разработаны приложения.

RealSpeaker: платный автоматический перевод

Здесь микрофон не понадобится, потому что на сервис можно загрузить только готовые файлы. Бесплатно можно перевести аудио в текст только запись длительностью до 1,5 мин.

Расшифровка записи более полутора минут будет стоить 8 руб. за минуту. Максимальная продолжительность аудио — 180 мин. Можно перевести аудио на разных языках, их более 40.

На сервисе есть раздел «Мои медиа». Там можно открыть тексты, которые транскрибировали другие пользователи. Это помогает понять качество расшифровки и принять решение, стоит ли оплачивать перевод в текст. Однако нет никакой конфиденциальности, чужие тексты можно даже удалить. Оплаченный текст будет доступен только вам.

Автоматизированная транскрибация с помощью программ

В интернете есть программы для транскрибации, работающие с использованием нейросетей. Они распознают человеческую речь и в автоматическом режиме переводят услышанный звук в текстовый вариант.

Google Docs

Пользователь диктует с помощью микрофона, а программа со встроенным инструментом транскрибирует аудио. Вызвать соответствующую панель можно с помощью сочетания клавиш Ctrl+Shift+S. После необходимо указать язык, на котором говорит пользователь, и нажать на микрофон.

В работе Google Docs плохо справляется с записью, в которой речь произносится слишком тихо или громко. Диктовка должна быть четкой и производиться прямо в микрофон. Главный минус записи – программа работает только в активной вкладке. Диктовать что-то с другой вкладки или воспроизвести запись с компьютера не получится.

Чтобы добавить в текст знаки препинания, нужно помечать эти места голосом: точка, запятая, новая строчка, абзац и так далее.

Speechpad

Еще одна бесплатная программа для транскрибации аудио непосредственно с микрофона. Работает через браузер Google Chrome и мобильное приложение. При необходимости подключается к основным системным программам для обеспечения голосового ввода в любом поле. Аудио плохого качества расшифровать не сможет.

RealSpeaker

Это платный инструмент для транскрибации аудио из загруженных файлов. Перевод разговора в текст осуществляется бесплатно только первые 1,5 минуты. После этого стоимость расшифровки – 8 рублей в минуту. Максимально возможная продолжительность аудио составляет 180 минут. Программа не позволяет диктовать текст напрямую в микрофон и работает только с готовыми файлами. При загрузке видео можно скачать результат обработки с готовыми субтитрами.

Dictation

Программа находится в бесплатном доступе и работает со звуком через микрофон. Не поддерживает возможность обработки готовых файлов. В ходе работы пользователь может задавать команды, например, новый абзац, тире. Функционал этого инструмента включает простой редактор текста, чтобы изменять форматирование, создавать списки.

Лучше всего программа распознает тексты, надиктованные в тишине и с профессионально поставленным голосом. Без специального оборудования (петлички или микрофона) распознает только половину сказанного.

Voco

Это платный десктопный вариант, работающий на базе Windows. Для расшифровки не требуется доступ к интернету. Voco работает с микрофонными записями и обрабатывает аудио с уже готовых файлов. Программа способна к самостоятельному обучению. По мере обработки файлов она учится более глубокому пониманию лексики, пополняет словарный запас. Алгоритм способен воспринимать звук на расстоянии одного метра от микрофона. 

Субтитры YouTube

Алгоритмы YouTube умеют автоматически распознавать речь на видеороликах и представляют ее в виде субтитров в нижней части экрана. Это можно использовать для расшифровки роликов при отсутствии других инструментов для работы. Чтобы транскрибировать таким образом, нужно загрузить видео на канал и ограничить доступ пользователей к нему. Файл открыть в разделе «Творческая студия», далее «Субтитры». Затем указать язык для транскрибации и скачать измененный файл со встроенными субтитрами.

Субтитры загружаются вместе с тайм-кодами и разрывом текста. Это усложняет обработку готового текста, особенно если видео достаточно длинное. В результате такой обработки его придется самостоятельно собирать в связанные абзацы и предложения. 

Детство и юные годы

Будущий мэр Нью-Йорка родился в 1942 году в еврейской семье с русскими корнями бухгалтера и секретаря-машинистки. Те времена были непростыми из-за Второй Мировой Войны. Достаток Блумбергов никогда не поднимался выше среднего. Отец, Генри Блумберг, довольно часто менял место работы, чтобы прокормить семью.

Маленький Майкл с детства видел картину упорного труда родителей и, чтобы помочь, свои первые деньги начал зарабатывать еще в школьные годы. Сначала он продавал елочные игрушки, чтобы накопить на лагерь бой-скаутов. Потом подрабатывал в небольшом магазине электроники во время каникул. А в университетские годы был работником автозаправки, чтобы оплачивать свою учебу.

Школьные годы прошли в муниципальной школе города Мелфорда, недалеко от Бостона. Стандартная обучающая программа навевала на него тоску. А истинное удовольствие Блумберг получал от изучения естественных наук. Даже специально ходил на лекции в Музей наук в Бостоне за новыми знаниями. Его приводило в восторг, что можно было участвовать в физических опытах и трогать все своими руками. Те уроки, которые он получал во время таких экспериментов, сформировали его пытливый ум и жажду познания нового.

Высшее заведение Майкл выбрал под стать своим увлечениям – Институт Джона Хопкинса. Учился на специалиста электроинженерии, но особого энтузиазма не проявлял. Плыл по течению – ходил на лекции, слушал преподавателей, сдавал все экзамены преимущественно на средний балл. Причина была в том, что он не чувствовал, что хочет стать физиком или инженером. Он находился в поиске того, что захватит его сознание и укажет путь дальше.

Но в чем Блумберг действительно преуспевал во время студенческой жизни – это коммуникации с людьми. Он открыл в себе лидерские качества и был организатором различных мероприятий и вечеринок, был старостой группы. Его знали все. К нему обращались за помощью

У него была интересная способность собирать людей и концентрировать их внимание на общую цель

Так у него родилась идея куда пойти учиться дальше. Конечно, диплом Института Джона Хопкинса позволял Майклу без проблем найти хорошую работу, но его манила возможность получить степень магистра в менеджменте. Наконец он нащупал то направление, где видел свое будущее. Он подал документы в Школу бизнеса Гарварда.

Два года учебы пролетели как один день, он жадно глотал знания в маркетинге и финансах, постигал бухгалтерский учет, основы менеджмента и управления. Заветный диплом в области делового администрирования была у него в руках. Оставалось собрать все свои мысли и определиться какой путь выбрать дальше.

Так как это было время войны во Вьетнаме, Майкл был уверен, что ему надо будет сначала отдать долг своей стране. Но после медицинских обследований ему поставили плоскостопие и не рекомендовали к службе в армии. Будучи человеком очень честолюбивым, выпускник Гарварда обращался во все инстанции, чтобы его все-таки отправили в горячую точку. Но ситуация не поменялась, и война к тому времени закончилась.

Что приходится расшифровывать

Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.

Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.

Надиктовка
*тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и вышетайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» – бальзам на транскрибаторскую душу.
Простой вебинар
** тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку

Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
***** тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
***** тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего

При этом качество звучания, как правило, оставляет желать лучшего.

Работа для кинематографистов 

Субтитры **тайм-код обязательно Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики.
Простой монтажный лист ***тайм-код обязательно Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды.
Полный монтажный лист *****тайм-код обязательно Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре.
Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector