Telegram Desktop Voice Message Parser

Материал из CSC Wiki
Перейти к:навигация, поиск

В telegram есть поддержка голосовых сообщений. Но часто бывает так, что нет возможности прослушать то, что тебе прислали (если на телефоне это еще можно сделать поднеся телефон к уху, то ноутбук к уху подносить не очень удобно). Хочется реализовать фичу на уровне исходного кода telegramdesktop (НЕ бот), который бы переводил аудио сообщение в текст (например около аудио сообщения будет кнопка, которая отобразит его содержание). Надо посмотреть, какой api предлагает yandex/google/etc для парсинга речи, а так-же разобраться в исходниках telegram.

Команда

  • Хорошев Артем
  • Елисеев Антон
  • Куклина Мария
  • Бахвалов Павел

Результаты

GitHub репозиторий: https://github.com/AntonCoon/tdesktop

кРолик v2 кРолик v1

Инструкция по сборке

Telegram for linux

Презентация

Список багов и фич

  • Файл с голосовым сообщением перезаписывается в случае нескольких запросов трансляции голосовых сообщений (исправлено)
  • Приложение подвисает при запросе трансляции голосового сообщения в текст (исправлено)
  • seg fault при повторном отображении окошка с текстом (исправлено)
  • окошко выбора языков появляется только со второй попытки (исправлено)
  • если не задан ключ Google Speech To Text API (исправлено)
  • Не известно, как ведёт себя на больших сообщениях.
  • Нет локализации названий окон (производится на стороне сервера).
  • Сделать strip