Как звукозапись перевести в текст
7 способов перевода аудио и видео в текст
Владельцам сайтов, которые постоянно выкладывают видео и аудиоконтент, стоит помнить о тех, кто по тем или иным причинам просмотреть или прослушать информацию не может. Зато может ее прочитать.
Расшифровка аудио и видеофайлов — занятие нудное и не самое приятное. Но мы живем в век технологий, а, значит, к нашим услугам множество возможностей, чтобы транскрибировать аудио и видеофайлы.
В этой статье мы расскажем, как легко и быстро перевести аудио и видео в текст.
Способы перевода аудиозаписей и видео в текст
1. Онлайн-конвертеры
Для преобразования видео или аудио в текст можно использовать онлайн-сервисы. Качество расшифровки у платных сервисов обычно на порядок выше, чем у бесплатных. Но если качество записи аудио изначально высокое, то и бесплатные конвертеры могут хорошо справиться с задачей преобразования видео в текст онлайн и расшифровкой аудио.
Вот несколько сервисов, которые могут быть вам полезны, когда необходимо записать текст с видео или расшифровать аудиофайл.
Использование сервиса Google Документы — самый простой и доступный любому способ перевести видео в текст или расшифровать аудио.
Чтобы перевести видео в текст онлайн, необходимо открыть и запустить функцию «Голосовой ввод» во вкладке «Инструменты». Если одновременно включить воспроизведение видео или аудио рядом с микрофоном, система начнет сама набирать текст. Конечный результат зависит от качества звука и отсутствия посторонних шумов.
Онлайн-сервис Speechpad позволяет через браузер Google Chrome переводить речь в текст. Имеет поддержку русского языка. Может преобразовать в текст речь, сказанную на микрофон компьютера, получить текст с видео или перевести аудиофайл в печатный текст.
Зарубежный сервис Dictation поддерживает более 100 языков, в том числе русский. Принцип работы схож с функцией «Голосового ввода» в Google Документах, так как сервис использует алгоритмы распознавания речи Google.
Надиктованный текст можно отредактировать, а затем сохранить, отправить на печать, по email или опубликовать в интернете.
Онлайн-сервис RealSpeaker станет хорошим решением для пользователей, которые хотят расшифровать звуковые дорожки и видеофайлы. Конвертер имеет поддержку русского языка. Из недостатков — текстовая расшифровка файлов, длина которых превышает полторы минуты, будет платной.
Бесплатный сервис Speechlogger умеет распознавать речь и мгновенно переводить ее в текст. Готовый документ можно сохранить в форматах txt, doc, srt, загрузить на Google Диск, отправить по email или распечатать. Регистрация не требуется.
Отличный сервис, который может перевести аудио или преобразовать видео в текст. Имеет поддержку русского языка. Для использования необходима регистрация.
Система за пару минут делает расшифровку и отправляет ссылку на готовый вариант на электронную почту. Сервис умеет распознавать даже песни.
У сервиса предусмотрено несколько тарифных планов. Бесплатная версия включает только 30 минут расшифровки аудио в формате MP3. Если вы исчерпали лимит, за транскрибацию придется заплатить, выбрав один из тарифов.
2. Профессиональные сервисы расшифровки
Наиболее качественный вариант перевода аудио в текст обеспечивают профессиональные сервисы расшифровки. Единственный их недостаток — они платные. Но и достоинств у них больше по сравнению с бесплатными способами — качественная расшифровка, предсказуемый результат.
Для расшифровки аудио и видео на русском языке пока существует только один профессиональный сервис — Zapisano. Помимо русского он также поддерживает английский, французский, испанский, итальянский, немецкий и другие языки. Расшифровку текстов осуществляют специалисты.
Для начала работы необходимо загрузить файл или вставить на него ссылку.
Ставки за расшифровку начинаются от 19 рублей за минуту и зависят от срочности исполнения и сложности материала. Тестовая расшифровка бесплатна.
Специалисты не только расшифруют текст, но и расставят знаки препинания, проверят орфографию и сделают легкую редактуру, убрав слова-паразиты и оговорки.
3. Программное обеспечение для десктопных устройств
Существует множество платных и бесплатных версий ПО, которые позволяют конвертировать видео в текст. И аудио тоже. Принцип работы и функционал такого программного обеспечения схож с онлайн-сервисами. Но если онлайн-конвертеры требуют подключения к интернету, ПО можно использовать всегда, когда необходимо перевести звук из видео в текст или преобразовать в текст аудио.
Эта отечественная программа для перевода видео в текст работает на ОС Windows. Она станет помощником для тех пользователей, которые не хотят расшифровывать аудиофайлы самостоятельно. Текст можно наговорить в микрофон, взять готовую аудиозапись или звуковую дорожку из видео. Программа работает со всеми популярными аудиоформатами. Программа осуществит и перевод видео в текст. Качество расшифровки — довольно высокое. Единственный и главный минус — программа платная.
Программа Express Scribe для Windows позволяет расшифровывать аудио и видео вручную. Для этого в программе предусмотрены кнопки воспроизведения, паузы и скорости проигрывания записей. Если самостоятельно набирать текст не хочется, можно включить запись, установить нужную скорость, выставить громкость и дополнительно запустить любой сервис голосового ввода, например, Google Документы.
Недостаток программы — нет версии на русском языке. При этом она интуитивно понятна и проста в использовании.
4. Приложения для смартфонов
Функция голосового ввода и распознавания речи реализована во многих приложениях для смартфонов и планшетов. Работает также, как ПО для десктопов и онлайн-сервисы. Для расшифровки аудио или распознавания текста с видео требуется открыть приложение, включить голосовой ввод и нажать воспроизведение звуковой дорожки рядом с микрофоном мобильного устройства.
Приложение для Android с функцией преобразования речи в текст. Умеет набирать текст под диктовку. Из недостатков — не работает без подключения к интернету.
Android-приложение, которое поддерживает русский язык и умеет распознавать речь. Просто включите рядом с микрофоном ролик, в котором хотите преобразовать видео в текст.
Готовый текст приложение сохраняет в виде заметки, которую можно отредактировать или отправить.
Приложение для iOS, предназначенное для голосового ввода текста. Надиктованный текст можно редактировать и отправить на почту, в Facebook или Twitter. Есть поддержка русского языка. Работает только при подключенном интернете.
5. Расшифровка видео в текст с помощью YouTube
Когда вы ищете конвертер видео в текст, YouTube может оказаться последним сервисом, который придет к вам в голову. Однако многие успешно используют возможности видеохостинга для расшифровки видеозаписей. Все, что нужно, чтобы получить готовый текст из видео, загрузить ролик на сервис. YouTube автоматически сгенерирует субтитры для видео, которые можно будет скопировать и вставить в документ. Расшифрованный текст для видео готов!
6. Расширения для браузеров
Найти бесплатное расширение для браузера, которое качественно может сделать из видео текст или расшифровать звуковую дорожку, задача не из легких. Те, кто готовы к экспериментам и небольшим денежным затратам, могут попробовать следующие плагины из нашего списка.
Полезное расширение для браузера Chrome с функцией распознавания голоса. Может использоваться для диктовки текстов для разных сайтов, даже для заполнения форм или оставления комментариев. Если рядом с микрофоном включить аудио или видео, приложение будет набирать текст в документе. Поддерживает более 120 языков. Пробная версия бесплатна. Тем, кто захочет полноценно пользоваться расширением, придется его купить.
Chrome-приложение с функцией распознавания голоса. Имеет поддержку более 60 языков, в том числе русского. Работает по тому же принципу, что и другие сервисы распознавания речи: вы диктуете или включаете запись, приложение набирает текст. Видео также можно расшифровать, если поднести устройство с записанным роликом близко к микрофону.
Программа может использоваться для заполнения форм на сайтах, диктовки электронных писем. Умеет распознавать голосовые команды и даже позволяет с их помощью просматривать веб-страницы. Например, можно попросить перейти к другому полю, прокрутить страницу вверх или вниз, открыть вкладки или запустить воспроизведение песни с помощью голосовых команд. Также можно попробовать использовать данную программу для расшифровки видео в текст или транскрибации аудио.
7. Преобразование речи в текст в Windows
Владельцы подписки Office 365 могут использовать функции диктовки для преобразования аудио в текст. Для начала требуется войти в учетную запись и активировать микрофон. Затем необходимо включить функцию диктовки. Произнесенный в микрофон текст отобразится на экране.
Также владельцы ПК, у которых установлена ОС Windows 8 и 10, могут преобразовывать речь в текст безо всякого дополнительного ПО. Для этого необходимо активировать «Распознавание речи», а потом можно диктовать тексты прямо в документы.
Самостоятельная расшифровка
Ничто не заменит старой доброй ручной расшифровки видео и аудио, если нужны 100% точность и качество. Чтобы работа проходила эффективнее, существуют приложения и программы, облегчающие транскрибацию. Например, oTranscribe или уже упомянутый Express Scribe помогают видеть перед глазами аудио или видео, сразу вводить прослушанный текст, также имеют горячие клавиши для остановки и включения записи.
Если самостоятельно заморачиваться с расшифровкой лень, всегда можно обратиться к фрилансерам. На любой бирже фриланса можно найти исполнителей, которые помогут записать текст с видео или аудио за небольшую плату. Расшифровка одной минуты аудио или видео в среднем обойдется в 10 рублей.
Заключение
Перед каждым из нас однажды может остро встать вопрос, как перевести видео в текст или расшифровать аудио с минимальными усилиями с нашей стороны. Выбор способа транскрибации будет зависеть от материальных возможностей, срочности выполнения задачи и качества звука. Будьте готовы, что наилучший результат дают платные программы для преобразования видео в текст. А в некоторых случаях, когда качество записи очень плохое и слышны посторонние шумы, придется взяться за расшифровку самостоятельно или прибегнуть к услугам фрилансеров.
Как перевести аудиозапись в текст: используем смартфон для записи лекций
Блочные тетради, цветные маркеры и стикеры всё ещё пользуются популярностью. А ведь у каждого студента есть при себе устройство, с помощью которого можно перевести аудиозапись в текст и получить подробную, хорошо оформленную лекцию. Стоит ли вообще писать конспекты, или прогресс уже дошёл и до сферы образования?
Почему рукописные лекции — не лучший вариант
С детства нам внушают, что нужно обязательно писать от руки — так лучше запоминается материал, можно обдумать написанное, выделить из него важное. А значит, и конспекты в университете стоит тоже записывать в тетради. Так ли это? Всё-таки, в школе и вузе немного разные условия.
Всего этого можно избежать, если вместо ручной записи использовать современные технологии. Любой смартфон позволит перевести звук в текст после записи на диктофон. В крайнем случае можно вводить лекцию в текстовом редакторе.
Приложения, позволяющие перевести аудиозапись в текст
Чтобы конвертировать аудио в текст лекции, сначала нужно сделать запись занятия. С технической стороны нет никаких помех — включенный микрофон поможет записать всё происходящее в хорошем качестве. А вот с юридической стороны может быть проблема.
Итак, запись на руках — самое время перевести аудиозапись в текст. Программ с такой функцией несколько: они отличаются качеством, длиной поддерживаемых записей и, конечно, стоимостью. Разберём самые популярные.
Google Документы
Самый простой и доступный онлайн-сервис голосового набора. Google распознаёт текст, сказанный в реальном времени — напрямую с файлами он работать не может. Но есть хитрость — если запустить его онлайн-конвертер аудио в текст, а около микрофона включить видео- или аудиозапись, то начнётся распознавание текста. Постарайтесь не шуметь в это время, иначе можно ухудшить качество звука, и перевод будет не таким точным.
Speechpad
Дополнение к браузеру Google Chrome, есть версии для Android и iOS. Оно работает с микрофоном, а также позволяет конвертировать в текст аудио- и видеофайлы. Как и Google Документы — абсолютно бесплатно.
Speechlogger
Этот сервис также работает только в браузере Google Chrome. Его бесплатная версия позволяет распознать речь с микрофона, зато после платной регистрации откроется возможность расшифровки в текст видео- и аудиофайлов большинства распространённых форматов. Стоит немало: 1$ за 10 минут речи. Но всегда можно попробовать поступить так же, как и с Google Документами — воспроизвести нужный файл около записывающего устройства. Поддерживаются в том числе сложные языки: японский, китайский и иврит. Если перед вами стоит вопрос, как перевести речь с видео (например, после лекции по иностранному языку) — Speechlogger тоже сможет помочь.
Vocalmatic
Это отличный переводчик аудио файлов в текстовый вариант. Для него не будут помехой даже шумы и музыка на фоне. Первые 30 минут аудио бесплатны, а потом можно выбрать подходящий тариф. Цены ещё выше, чем у Speechlogger, зато Vocalmatic поддерживает другие языки — например, корейский и индонезийский.
ListNote
Усовершенствованный аналог обычных голосовых заметок на смартфоне. Приложение распознаёт речь с микрофона. Судя по отзывам, качество распознавания немного хромает, знаки препинания могут быть пропущены, зато программа абсолютно бесплатна. Транскрибация видео в текст возможна тем же способом, что и у Google Документов — просто включите видеофайл одновременно с запуском приложения.
Программа для компьютеров и ноутбуков. Она достаточно качественно переводит файлы в текстовый формат. Для неё не требуется интернет и помощь сторонних сервисов — можно один кликом мыши прямо в Voco отметить фрагмент записи, который нужно распознать. Готовый текстовый файл можно открыть в MS Word, знаки препинания расставляются автоматически. Полная версия со всеми функциями стоит 15 000 рублей, спустя год требует платной подписки. Более простой вариант программы стоит всего 1 900 р., но он имеет ограниченный функционал. Можно скачать пробную версию и проверить, насколько вам подходит этот сервис.
А если сделать запись аудио нельзя?
Так может случиться по нескольким причинам:
В таком случае проще будет вводить текст лекции на ноутбуке или смартфоне с подключенной клавиатурой. Скорость печати у среднего человека в полтора-два раза выше, чем скорость письма. А помочь в работе смогут простые текстовые редакторы, например MS Word или Open Office. В них есть возможность вставить таблицы, схемы, графики, диаграммы, есть даже редакторы формул. Рисунки, правда, придётся рисовать или от руки на бумаге, или мышью в графическом редакторе. После занятий их можно будет привести в более аккуратный вид и вставить в текст лекции. Не забудьте только предупредить, что ноутбук открыт на столе не для развлечений. К сожалению, это пока не такая распространённая практика, и у преподавателей могут возникнуть сомнения.
Современная техника, которая есть у каждого студента, может помочь фиксировать и запоминать материал и делиться им с одногруппниками. Сделать всю работу смартфон за вас, конечно, не сможет, но избавить вас от рутины, усталости и тяжёлых сумок с тетрадями ему вполне под силу.
Как превратить голос в текст: тестируем 5 сервисов для расшифровки
Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.
Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.
Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.
Текст для теста
Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».
Google Keep
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.
У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.
Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.
Сообщения «Вконтакте»
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.
Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.
Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.
Компьютерная грамотность с Надеждой
Заполняем пробелы — расширяем горизонты!
Перевод речи в текст: топ-5 программ
Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.
Что такое транскрибация
Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.
Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию, в основном, делают вручную.
Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей «слушать» текст и одновременно «печатать» его, превращать в текстовый файл, пригодный для дальнейшего использования.
Перевод речи в текст вручную или с помощью специальной программы полезен
О проблемах автоматического перевода речи в текст
Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.
Речь у всех людей разная:
В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.
В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но все-таки не стоит ожидать чуда.
В некоторых случаях стоит обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и он может полениться внести в получившийся текст правки.
Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.
Сервис oTranscribe для ручной расшифровки аудио в текст
oTranscribe — сервис для ручной транскрибации аудио в текст
Начнем с бесплатного сервиса oTranscribe, который упрощает работу при РУЧНОМ переводе речи в текст.
Бесплатный сайт в помощь при ручной транскрибации аудио в текст https://otranscribe.com/
— Может ли oTranscribe преобразовать аудио в текст автоматически?
— Нет, oTranscribe помогает сделать ручную расшифровку аудио проще и менее трудоемкой.
Этот сервис будет полезен для тех, кто периодически расшифровывает (транскрибирует) аудио в текст. Сервис oTranscribe. Бесплатный.
Для ручной транскрибации на oTranscribe можно выбрать аудио или видео файл со своего компьютера, либо вставить ссылку на видео с Youtube.
В чем удобство сервиса?
Во-первых, все находится в одном окне и не надо ничего устанавливать на компьютер. oTranscribe проще и удобнее, чем другой сайт Express Scribe.
Во-вторых, когда ставишь на паузу, аудио откатывается на пару секунд назад. То есть на те критические секунды, из-за которых приходится перематывать, если что-то не успел. Работа так идет в разы быстрее!
В-третьих, одна кнопка для запуска и пуска, самая удобная на клавиатуре — это клавиша Esc.
Кроме того, минималистичный рабочий стол. Серые поля, ничто не отвлекает от работы. Сервис считает слова и сохраняет историю. Текст сохраняется при обновлении страницы.
Гугл Документы: Вы говорите, а компьютер записывает речь в виде текста
В Гугл Документах есть удобный, бесплатный сервис, когда Вы говорите, и при этом ваша речь сразу воспроизводится в виде текста на экране компьютера. Чтобы использовать такой сервис, понадобится браузер Гугл Хром и аккаунт в Гугле.
Сайт speechpad.ru
Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.
Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».
Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.
Рис. 3. Сервис speechpad
Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.
Список видео-уроков по работе с speechpad:
Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:
Видео «Транскрибирование аудио»
Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.
Сервис dictation.io
Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст. Работает только в браузере Google Chrome.
dictation НЕ работает, если на вашем компьютере установлена Windows 10 ДОМАШНЯЯ версия.
Рис. 4. Сервис dictation.io
1 на рис. 4 – русский язык можно выбрать в конце страницы.
Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.
Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.
Подробнее о том, как работать с этим онлайн-сервисом показываю и рассказываю в видео:
RealSpeaker
Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.
Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:
Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:
В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, с 2018 года такой возможности нет. Вероятно для того, чтобы транскрибированный файл был недоступен всем пользователям для скачивания, необходимо наличие галочки напротив «Сделать файл неудачным в течение 24 часов».
На сайте есть онлайн-чат. Кнопка, чтобы начать чат, находится в правом нижнем углу сайта.
Speechnotes
Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:
Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества. Есть платная премиум-версия.
Dragon Dictation
Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.
Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.
Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.
Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы.
Только так можно будет получить безукоризненный текст без ошибок.
Расшифровка аудио и видео в текст на биржах фриланса
Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.
Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ — задание на транскрибацию.
Для своего заказа на бирже можно выбрать исполнителя — человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.
Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.
Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.
Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.
Две биржи фриланса
Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:
Биржа фриланса weblancer.net
Другая биржа, где можно заказать расшифровку аудио/видеозаписей — freelance.ru
Биржа фриланса freelance.ru
Статья впервые была опубликована 5 июля 2017 г.,
последнее обновление 13 мая 2021 г.
Нашли ошибку? Выделите фрагмент текста и нажмите Ctrl+Enter.
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.
Добавить комментарий Отменить ответ
Комментарии: 53 к “Перевод речи в текст: топ-5 программ”
Пользуюсь простым текстовым блокнотом. Вполне устраивает.
Яков: Программа есть, но она стоит около 20 тыс. руб. И качество распознования так себе. Пока что лучше чем apihost.ru/speech-to-text сервиса не нашел. Преимущество перед остальными что расставляются автоматом знаки препинания. В других же сервисах просто портянка из слов.
Недавно завел свой блог и начал наполнять его статьями, но не так давно появилась потребность в транскрибации видео и аудио в текст. Вручную делать это довольно сложно, да и времени уходит много. Начал искать какую-нибудь программу, которая поможет это сделать автоматически. И вот недавно случайно наткнулся на вашу статью.
Т.е., производить голосовой ввод текста/данных с телефона (под Android) — в программы MS Word (Windows), MS Excel (Windows) и текстовый редактор (Windows).
Спасибо за подборку! Добавлю в ваш список еще одну программу, которой сам пользуюсь:
speechtext.ai/ru
Для расшифровки и перевода аудио в текст на русском языке, наверное, одно из самых толковых решений, что удалось найти. Из плюсов: точность перевода речи в текст на уровне 80-85%, расставляет пунктуацию. Один минус — она платная.
Добрый день, Надежда. Подскажите, пожалуйста — какая самая лучшая программа для просмотра видеофайлов с возможностью перевода речи в текст из них? Дело в том, что есть проблемы со слухом, а хочется учиться. Все обучающие курсы и т.д. предполагают подачу материала именно в формате видео в основном. Пыталась слушать, но не хватает понимания и разборчивости текста. Подсказали. что есть программы, которые преобразуют речь в текст. Спасибо!
Здравствуйте. Мне неизвестна надежная хорошая программа перевода речи в текст. Такие программы есть, их много, но все они не идеальные.
Речь в текст переводится, когда человек сам лично произносит слова в микрофон компьютера или смартфона. Переводчик речи в текст НЕ работает, если одновременно с ним будет работать какая-то программа, издающая звуки. Например, такой программой может быть обучающий курс с воспроизведением слов и музыки. Это связано с тем, что одновременно НЕ работает воспроизведение и запись звуков в одном компьютере.
Для записи звука компьютера и преобразования его в текст нужен или другой компьютер, или другой смартфон (планшет). Тогда этот второй компьютер или смартфон сможет «услышать» звук из первого компьютера, и затем представить его в виде текста. Таким образом, программу (приложение) для преобразования звука в текст можно установить на смартфон, и с его помощью «слушать» курс на компьютере, а затем получать текст. Но текст будет не на компьютере, а на смартфоне.
Или наоборот: можно запустить обучающий курс на смартфоне, а запись и преобразование звука делать на компьютере. Тогда текст появится в компьютере.
Для преобразования звука в текст подобным образом подойдет любая доступная программа или приложение для телефона. Я не пользуюсь такими программами, поэтому не могу ничего посоветовать среди множества имеющихся вариантов.
Желательно искать текстовые обучающие курсы или электронные книги, их тоже очень много. Также есть курсы с видео и с текстом одновременно, хотя это редко теперь встречается. Вариант курса с видео может оказаться очень сложным из-за проблем с переводом речи в текст.
Прекрасная программа для преобразования речи и не могу не поблагодарить разработчиков за их профессионализм все оказалось продумано и лишь незначительная корректировка текста мне понадобилась
Спасибо большое, перевела двухчасовую аудиозапись с помощью программы /dictation.io/
Сначала не получалось перевести аудиозапись, но когда программу открыла в отдельном окне-сразу получилось.Конечно еще потребуется корректировка текста, но это уже мелочи.
У меня ни один не работает, то браузер не тот, то деньги плати.
В Телеграме есть совершенно бесплатный бот для распознавания речи:
t.me/voicybot
Удобен он тем, что в него можно диктовать и с телефона, и с ноута, и с планшета. И текст остаётся в вашем аккаунте Телеграма, а не в каких-то онлайн-сервисах и программах. Распознаёт трёхминутную диктовку за считанные секунды.
Я пользуюсь онлайн сервисом zvukogram.com/speech/ Без регистрации и бесплатно. Мужской и женский голоса. Сразу вставил текст и ждешь. Зависит от объема текста. Как правило очень быстро, чай не успеете попить. Можно сначала прослушать, а потом скачать. Погрешностей не было ни разу.
zvukogram.com/speech/ — это озвучка готового текста. А в моей статье речь идет о прямо противоположном действии — о том, чтобы РЕЧЬ перевести в текст, то есть нужно получить текст, а НЕ озвучить готовый текст.
Валерий, не вводите людей в заблуждение. Во первых, программа платная, а во вторых эт о программа перевода текста в речь.
Я так и не понял, как аудио в текст перевести через speechpad.
Нашёл другой сервис — scribe.team
Очень похож на realspeaker, только в 2 раза дешевле и все загруженные файлы сохраняются в ЛК.
Просят 4 рубля за минуту.
Добрый день! очень много слышала о программе, хочу попробовать.
Крутая программа для перевода текста в речь есть вот здесь textvrech.ru/
Надежда, благодарю за быстрый ответ.
Работаю в Google Chrom.
Всё по-прежнему, как описала ранее.
Попробую освоить Speechpad.
ps: интерфейс у сервиса dictation у меня открывается не такой, как здесь в статье на рис.4.
В т.ч. и по Вашей ссылке.
🙏
Добавлю вдогонку.
Открываю закладку условно левой кнопкой (тачпад на ноутбуке) — не работает сервис.
Если же правой и далее «открыть ссылку в новой вкладке», — работает.
Но, перейдя на «команды», чтобы их посмотреть, и, вернувшись, снова получаю неработающий сервис.
Здравствуйте, Вера. Я попробовала сейчас в браузере Google Chrome открыть сервис dictation. Команды на английском языке, все работает нормально. Попробуйте через другой браузер открыть сервис dictation, лучше через Google Chrome, возможно, что все будет хорошо.
Сейчас появились еще проблемы с сайтами из-за наших интернет-провайдеров, которые выполняют предписания правительства. Например, в Одноклассники я не могла зайти несколько дней, была какая-то странная блокировка, потом все вдруг стало работать нормально.
Здравствуйте, Надежда.
Спасибо за полезную информацию.
Полдня потратила на сервис dictation, переходя на него по ссылкам из других источников и вводя с клавиатуры в поисковой строке. Всё заканчивалось мимолётным появлением на виртуальном листе фраз моей речи, после чего оставалось чистое белое поле.
Последнее, что я сделала, уже без надежды, нажала правой кнопкой мыши на вашу ссылку, а затем «Открыть в новой вкладке»: окно такое же, язык- русский, но команды для управления на английском (например, вместо «начало» — «start» и т.д.).
И, о-о-о, чудо! Желанные буковки чёрным по белому побежали и остались!
Попробовала вставить адрес сайта, скопировав вашу ссылку в поисковую строку, — неудача. Снова лишь мгновенное появление фраз и их испарение.
В чём дело, понять не могу.
Пока сохранила «удачную» страницу в закладках и открываю оттуда.
ps: пока мучалась, хотела написать вопрос разработчикам, и при заполнении данных попросили в анкете проставить ответ, есть ли у меня ключи лицензионного соглашения. Я не стала продолжать. В интерфейсе сервиса нигде об этом ничего не говорится. Может, он стал платным?
Предлагаю в копилку программ-говорилок программу
«РЕЧКА» для синтеза речи и создания аудиокниг.
В программе используется синтезатор от компании Яндекс SpeechKit TTS, обладающий восхитительным качеством и несколькими мужскими и женскими голосами. Требование работы программы — подключенный интернет.
Сайт программы: //rechka.onlinewebshop.net
Ну уж если люди берут 7 рублей за минуту. То имейте ввиду на апворке можно найти объявления которые обещают час речи перевести в текст за 500 рублей.
Час речи — это 60 минут. Если 60 минут умножить на 7 рублей, получим 420 рублей. Получается, что это дешевле, чем перевод часа речи за 500 руб.
Спасибо за статью, все чётко и ясно, смогла выбрать для себя подходящий вариант.
Здравствуйте Надежда. Моё имя Андрей, мне через несколько лет будет 60.
Пытаюсь учиться новому на вебинарах, жизнь заставляет повышать квалификацию. Можете ли Вы подсказать программу для перевода речи лектора
в текст, учился я давно и приучен к работе с книгой ( текстом ).На слух запоминается крайне мало, в большинстве случаев прослушивать повторно и бесплатно невозможно по разным причинам.Лекторы- это мужчины и женщины разных возрастов. Говорят с разной скоростью. С уважением.
Здравствуйте, Андрей Львович. Программы для перевода речи в текст, которые мне известны, приведены в этой статье, к которой Вы оставили свой комментарий. Я не думаю, что эти программы подойдут Вам для автоматической записи и перевода речи в текст на вебинарах. Более того, вряд ли есть такие универсальные программы, которые в состоянии распознать любую человеческую речь и сразу перевести ее в текст.
Все-таки некоторый выход есть. Вы можете записывать на диктофон вебинары. Диктофон сейчас есть на любом смартфоне. Если Вам нужно, то потом со смартфона аудио-файлы можно переносить на компьютер «по проводу» от зарядного устройства, подробнее: https://www.compgramotnost.ru/android/kak-peredat-fajly-s-androida-na-kompyuter
Вариант с диктофоном Вам подходит, если вебинары Вы слушаете «вживую» или онлайн, через интернет.
Также можно использовать аудио-программы для записи звука. Этот вариант особенно подойдет, если вебинары Вы слушаете через интернет, на компьютере.
Кроме того, когда слушаете вебинары, рекомендую взять бумагу и ручку и записывать туда основные моменты. Это помогает сконцентрироваться при прослушивании, а также удобно после вебинара пробежать глазами по своим записям, тогда многие вещи, сказанные на вебинаре, автоматически всплывают в голове. Рекомендую, кроме записи звука, этот вариант также использовать.
отвратные сервисы!на одноп оплатила перевод речи в текст. ТАКАЯ АХИНЕЯ ПОЛУЧИЛАСЬ!так еще и постоянно пропадал текст, пришлось в поддержку писать…ужас. не советую!
Да,у меня тоже самое. Опплевался
Прям сейчас пробую сервис: dictation.io/.
Транскрибирует-то хорошо, но в обратном порядке! Например, «мама мыла раму», транскрибирует «раму мыла мама». Что делать, не пойму((
Есть хороший сервис для этих целей — upsaleslab.ru.
В нем можно легко сгенерировать озвучку любого текста, и сразу же наложить на видео. Более 25 голосов на 20 языков мира — на любой вкус, рекомендую!
А есть такие программы которые могут сразу сгенерировать в битрикс24
Учу немецкий. Ваша программа помогла при транскрибации немецких аудиофайлов с использованием виртуального кабеля. Спасибо большое! Удачи!
Надежда, что по Вашему возможно сделать, если сохранённые архивы впоследствии невозможно открыть + периодически-обусловлено, возникают блокировки интернет-соединений и срабатываний — на уровне изменений функций системных файлов и переферийных «Алиса»-устройств (; как чайник, ничего не могу противопоставить, а IT-спецы отказываются комментировать …). Спасибо, заранее, за профессиональный ответ. Дмитрий Мадьянов.
Дмитрий, важные архивы желательно хранить не в облаках и не в локальных сетях, а на внешних жестких дисках или на флешках. Тогда сисадмины не смогут вмешиваться в процесс архивации или восстановления. Если же архив уже хранится в сети или в облаке, в сисадмины не дают к нему доступ или блокируют длительные соединения, то лучше всего попробовать «достучаться» до архива из другой сети Интернет, подключившись на время к другому провайдеру Интернета. Правда, обойти защиту, установленную сисадминами, обычно непросто. Лучше всего найти с сисадминами «общий язык», и просто уговорить их помочь Вам — поверьте, это самый простой и результативный путь.
Чтобы подключиться, надо самому что-то делать. Попробуйте сначала голосовой поиск на компьютере. Для этого откройте браузер Гугл Хром или Яндекс.Браузер и нажмите там на значок микрофона, подробнее https://www.compgramotnost.ru/kak-rabotaet-pk/golosovoj-poisk-na-kompyutere-cherez-gugl-hrom-ili-yandeks-brauzer#GoogleChrome
Если у Вас не компьютер, а смартфон тоже попробуйте сначала с голосового поиска на телефоне, подробнее: https://www.compgramotnost.ru/android/perevod-rechi-v-tekst-android#Android
Если с голосовым поиском получится, можно будет переходить к программе на ПК или к приложению на смартфоне для перевода речи в текст.
RealSpeaker – генератор бреда. Заплатил 100 руб. за транскрибацию 15 минут интервью. На выходе получил набор бессмысленных слов. Вот фрагмент:
ровно час проговорили телефон достопримечательности заправки КПД процесса w3hc брага для кальвадоса брага из фильма Разумное брага для кальвадоса сидра сейчас я думал что это просто как Криштиану Пусть кроме крепости таких никаких различных Нет это уже не сижу поэтому, будто Брат за брата выдаст это случилось такое достаточно средств и всё сухой я беру всё чтобы вернула эту песню что хочется в свой напиток самый приятный для употребления внутрь Попробовать там перекашивает лицо не перекопана просто.
Машинные технологии переводы не идеальны. Многое зависит от дикции говорящего, а также от качества записи. В случае наличия проблем с дикцией или с записью, лучше обращаться на биржи фриланса типа воркзилла, где «вручную» будет сделана транскрибация текста (перевод речи в текст). На бирже оплата списывается с аккаунта заказчика после того, как заказчик примет работу.
Вы можете обратиться к Виктору Озерову, разработчику RealSpeaker по вопросу возврата денег.
Андрей, речь — это всегда индивидуально. Многое зависит от внешних параметров типа — на сколько далеко диктор от микрофона, качество звука, на сколько диктор чисто произносит голос, многоголосие и так далее. Вы можете зайти в медиа — https://realspeaker.net/media и почитать результаты других распознанных файлов. В большинстве случаев качество просто отменное.
Также у нашего продукта есть политика возврата. Если не понравился результат внизу слева сайта есть иконка для обратной связи — там лишь надо написать, что качество не устраивает — в таком случае мы возвращаем деньги — для нас принципиально важно, чтобы клиент был доволен и приходил к нам снова и снова.
Если проскроллить страницу
realspeaker.me/ru
вниз, то там полным-полно контактов: ВКонтакте, Фейсбук, Ютуб, Твиттер, Телеграм, электронная почта, телефон.
Я почитала отзывы ВКонтакте за 9 февраля, там есть и возврат денег. Виктор Осетров, один из разработчиков сервиса, живет во Франции, судя по номеру его телефона, а там сдвиг по времени, и если Вы писали, то надо подождать ответ. Техподдержку оказывает сам разработчик сервиса.
Что касается моей статьи, она написана в июле 2017 года, когда там была возможность бесплатно попробовать, как работает на сайте бесплатный онлайн-сервис по транскрибации речи в текст. Оказывается, что в феврале 2018 года разработчик изменил политику предоставления услуг, там теперь бесплатного нет. И сейчас проводится платная транскрибация предварительно загруженного файла. В статье я отредактировала информацию про этот сервис.
Станислав! Извините если мы немного задержали обработку медиа файла. Надежда правильно отметила, у нас есть небольшая разница во времени — я живу во Франции и бывает сложно оперативно отвечать ночью. Так как приходиться запускать файлы в обработку иногда вручную. Так как не всегда срабатывает автоматика. Также если не устраивает качество распознавания — делаем возврат.
До середины февраля наш сервис был полностью бесплатным. Сейчас мы в пробном порядке добавили монетизацию — стоимость 7 руб за минуту. Также добавляем личный кабинет. Так как файлы находятся в общем доступе и удаляются автоматически в течение 24 часа. Если Вам нужно, чтобы никто не видел Ваш файл внизу страницы есть чат для обратной связи — напишите туда и мы сделаем Ваш файл приватным.
Если что, мы всегда рады помочь.
С уважением,
Виктор Осетров
Какие непонятливые (были в том числе) эти программисты!… Ведь: НАПИСАНИЕ ПРОГРАММ ЧЕЛОВЕКОМ ЛИШЬ ЗНАЮЩИМ ЯЗЫКИ ПРОГРАММИРОВАНИЯ- перестанет быть обязательным, если создать в памяти компьютеров всего-лишь словарь различных коротких предложений слов, написанных на русском или (и) других языках человеческого общения, каждое из которых представляет собой определённую команду обращённую к компьютеру, для её выполнения им, и переводится им легко, так как в этом словаре каждая из этих команд- словесных предложений, имеют чёткий перевод в нём при помощи языка программирования, в виде определённого алгоритма действий (либо комплекса взаимосвязанных друг с другом множества таковых алгоритмов), которые компьютер и исполняет как адресованные к нему человеком команды! Допустим, например: человек не знающий азов компьютерного программирования, говорит компьютеру, при помощи клавиатуры компьютера печатая предложение: хочу создать свою собственную игру! Компьютер переводит это предложение (дабы иногда и в базе таковых словарных данных интернета, он способен будет мгновенно в таком же как у него словаре, но более глобальном, отыскать правильный перевод этого, и любого словесного предложения, на свой язык состоящий из системы алгоритмов), и в памяти своего ПО, либо опять в интернете, находит правильное действия для себя выполняемое им в качестве ответа на это словесное предложение человека, которое заключается в его первом вначале вопросе адресованном к этому человеку, которым он переспросит человека, дабы устранить этим случайную ошибку: вы хотите создать свою собственную игру?, а после того, как человек ответит ему: Да!, он задаст уже второй ему вопрос, такой: какую вы хотите создать игру, на какую тему она должна быть? И Т.Д., И Т.П. таким образом компьютеру человек и сможет подробно рассказать любую информацию в предложениях словесных, которые компьютер полностью будет понимать, в том числе будет он понимать соответственно и то, какие персонажи должны быть в этой игре, и какое у них должно быть в ней поведение!… Подобным образом, и любые другие программы и действия компьютер будет мочь совершать по просьбе к нему адресованной человеком. Желаю вам счастья.
Вы употребили немало интересных терминов в Вашем обращении. Позвольте и мне применить более сложную терминологию, чтобы пояснить Вам свою позицию по поднятой теме.
Собачки, кошечки и другие домашние животные тоже понимают отдельные слова и команды человеческой речи. И выполняют их с заданной точностью. А в цирке можно увидеть «чудеса» и покруче.
С компьютерами то же самое. Да, речь они уже «понимают», отдельные команды выполняют, искусственный интеллект вышел из лабораторий и используется на практике. Но до того момента, когда компьютер начнет «мыслить», а именно это Вы и предлагаете, должно пройти еще немало времени.
Математически доказано, а математика наука точная, что фон-Неймановская архитектура компьютеров позволяет создавать языки только с ограниченными контекстными условиями. То есть, компьютеру (с современной архитектурой) не под силу наши человеческие контекстно связанные языки (когда значения слов и выражений практически всегда зависит от контекста, в котором они употребляются).
С помощью языков с ограниченными контекстными условиям нельзя смоделировать систему, работающую на контекстно связанном языке, так как ограниченные контекстные условия – это на порядок ниже по уровню развития, чем контекстная связанность.
Говоря более простым языком, современные компьютеры с фон-Неймановской архитектурой никогда не смогут научиться понимать человеческую речь настолько, чтобы стать полноправным собеседником и делать все то, что подразумевается нашей контекстно связанной речью. Это невозможно технически, и доказано математически.
Но идут разработки компьютеров с другой архитектурой, что-то типа нейронных сетей, близких по своему устройству к человеческому мозгу. Вот там, пожалуй, и произойдет прорыв. Осталось немного подождать!
Вы все утверждаете что программ распознающих человеческую речь не существует и это типа очень сложно! Хорошо, а как же тогда существует Бот «Алиса» которая уже более двух лет говорит с человеком.