regfi80 · 01-Фев-13 08:01(12 лет 8 месяцев назад, ред. 16-Авг-13 15:09)
Lynda & Pluralsight Subtitles Maker (Создает srt-субтитры для курсов Lynda и Pluralsight) Год выпуска: 2013 Производитель: regfi80 Автор: regfi80 Тип раздаваемого материала: програма для видеоуроков Язык: Английский Системные требования: Windows XP SP3 и выше
Также должен быть установленMicrosoft .NET Framework 4
Примечание (для тех кто не в теме):
на компьютер установятся некоторые компоненты от Microsoft, которые будут использоваться только при запуске данной программы или ей подобных (разработанных по такой же технологии). Т.е. будет использовано немного дискового пр-ва, но никаких активных процессов не добавится.
Дело было вечером, делать было нечего...
Вотс... скоротал вечерок, написал прогу. Некий приквел на эту тему здесь. Описание:
в первое поле можно вставлять следующие типы значений:
путь к ранее сохраненному html файлу с сабами.
htm сохранять в файл можно как "только HTML" (проверил в IE и хроме),
Если пользуетесь хромом, то очень рекомендую SingleFile плагинчик: https://chrome.google.com/webstore/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle
На мой взгляд из разряда must have, я им сохраняю и оглавление и даже топики на рутрекере, если там интересное обсуждение и ссылки...
В общем случае чикбокс from file и радио-батаны lynda и pluralsight вам не придется переключать вручную, при вставке значения в первое поле, после потери фокуса (перехода на др. поле), эти параметры установятся автоматически.
второе поле указывает путь на корневую папку, где находится соответствующий скаченный курс.
ну и как водится в русских-народных сказках, есть и третье поле. В него, через запятую, можно ввести расширения (типы) видео файлов - вдруг может быть что-то иное чем mov, mp4, m4a, flv, f4v, wmv. И если все поля будут заполнены правильно, то кнопочка (Create subs) и "откроется" (раз'дизейблится), хотя это уже не из русской-народной, но не важно.
параметры:
subs as movies - сабы будут названы также как и фильмы (видео-файлы лекций)
movies as subs - видео-файлы лекций будут переименованы как сабы (имена которых берутся на сайте)
if no movies - используется для того случая когда вы хотите создать субтитры без скаченного видео (хотя смысла в этом обычно нет, т.к. получившиеся сабы без переименования будут непригодны). В этом случае во втором поле задайте пустую директорию (в смысле не поле пустое, а директорию в которой ничего нет).
override subs if it exist - эта галочка нужна, если вы хотите переписать (или дополнить) сабы. Иначе, если ее не будет, а какие-либо файлы сабов уже существуют, то программа выдаст ошибку (и сообщит, что такой-то саб уже существует).
delete previous subs - для каждой папки с видео, перед тем как сгенерить для нее сабы, удалить все srt-субтитры если таковые есть в этой папке.
MPC Support для поддержки Media Player Classic (при выборе этой опции добавляет 10 сек. для финального саба, если его нет)
далее жмем на кнопку "Create subs".
Внимание! Порядок папок с темами скачанного курса и порядок видео-файлов внутри этих папок должен соответствовать тому порядку который имеется на странице субтитров сайта lynda. Если же есть какие-то количественные расхождения программа выдаст ошибку. Папки которые не содержат видео (например с примерами) в расчет не принимаются, так что их не трогаем - программа сама поймет, что они ни при делах. Все параметры в программе сохраняются (и соответственно при следующем запуске восстанавливаются), вплоть до размеров и положения окна. P.S. (лицензионное соглашение): Сильно не пинайте (коленкой), потому как прога сделана "на коленке" (часа за 3-4), т.е. это некоммерческий продукт, где все гладко и вылизано (по идеи должно быть, однако в природе редкость).
Тут все может отваливаться и глючить и это нормально
Скриншоты
История обновлений:
от 04.02.2013
Изменен способ получения сабов. Теперь программа не запускает браузер, а тихо по http запросу получает html текст страницы и парсит его. Поэтому все стало работать значительно быстрее и теперь программа занимает всего один файл (dll не нужны).
По просьбам, добавлены некоторые опции (см. раздел "параметры" в описании).
У некоторых программа не работала на Win XP, надеюсь сейчас будет работать (если нет сообщите).
p.s .проверили теперь работает!
от 07.02.2013
Для режимов movies as subs и if no movies, т.е. когда имена берутся из html кода, сделано декодирование имен. Дело в том, что такие символы как например апостроф (') в html коде представляются как см. колонку "HTML Number" в этой таблице, что в названиях файлов было бы не совсем уместно. Также для этих режимов изменена нумерация в именах файлов. Раньше было, например "01 Название лекции" - теперь "04_01 Название лекции", где 04 это номер темы (главы).
Немного оптимизирован алгоритм, по-крайней мере на пару процентов должно работать быстрее.
Чикбокс MPC Support для поддержки Media Player Classic (при выборе этой опции добавляет 10 сек. для финального саба, если его нет)
Возможность задать сразу несколько расширений видео-файлов (через запятую)
от 15.08.2013
Исправление парсинга pluralsight сабов. У них изменился html - теперь они сабы по другому кодируют.
У меня закончилась подписка на Плу уже как ~1.5 месяца, поэтому в предыдущую раздачу проверить не мог, а эту функциональность давно написал.
Спасибо дорогие одно-рутрекерцы за благоприятные отзывы (почему-то хочется добавить "на страшном судище"). Пользуясь случаем, закину удочку ("дерну за бороду", "пушу козла в огород"... ), может кто "на мази" (водителям мазов просьба не беспокоиться):
Ищу программу, которая умела бы хорошо генерить сабы по звуку речи, подобно тому как это делает youtube при заливки туда видео. Если сталкивались с таким софтом, дайте знать пожалуйста.
В принципе, можно опять-таки самому написать эту не такую уж и сложную прогу (благо API для распознавание голоса мелкософт предоставляет), но не уверен в качестве такого бесплатного API (да и нет особо времени заниматься такими проектами). А вот если есть какие-то (пролечено-коммерческие) качественные продукты на эту тему... было бы круто поиметь.
Не такую уж и сложную? Драконские софтины более-менее (с русским правда не знаю насколько успешно), плюс куча всяких плюшек. На яблофоне меня устраивает, на компьютере не пробовала, там удобней ручками
Спасибо.
На Windows 8 x64 всё OK! Почти... Самостоятельно программа не закрывает окно после того как скачала все сабы. Перед тем как нажать ABORT, я убедился в том, что все скачано пробежавшись по всем директориям целевого курса.
Так, если глянете, писал о программе на основе API для распознавание голоса от мелкософта: http://msdn.microsoft.com/en-us/library/system.speech.recognition.speechrecogniti...v=vs.110%29.aspx
Т.е. самое сложное - движок распознавания, мелкософт нам бесплатно предоставляет. Честно, говоря, юзать не пробовал, но подозреваю, что качество распознавания там наверное не ахти.
А вот сделать уже сам движок, тут вы, конечно, правы, задача архи-сложная. И тут не только программирование, этим занимаются специальные звуковые лаборатории и пр...
vampiri6ka писал(а):
Драконские софтины более-менее (с русским правда не знаю насколько успешно), плюс куча всяких плюшек.
Ага, есть такая софтина, помню баловался еще на 98 винде. Смотрю на трекере есть и поновее вариант; https://rutr.life/forum/viewtopic.php?t=4237612 Спасибо, надо будет скачать и "покрутить" ее:
- так понимаю, в ней нет специальной функции генерации сабов.
- если звук умеет брать только с микрофона можно попробовать использовать программу типа аудио-кабеля
- еще важный вопрос с хронометражем для сабов. Если она умеет делать вывод (причем постепенно, слово за слово) в любое текстовое окно, то можно сделать маленькую прогу, которая бы вела этот хронометраж.
Что же, может, когда-нибудь и попробую...
regfi80
Про "не такую уж и сложную", это Вы загнули, кончено
ютуб, даже на английском языке, субтитры неудовлетворительные делает, а на русском тем более. Почему бы Вам не открыть исходные коды этой программы под Свободной лицензией? тогда и другие пользователи смогут лучше протестировать программу на разных ОС и дополнить код.
57699377но подозреваю, что качество распознавания там наверное не ахти.
Я тоже так подозреваю Собственно, это и подразумевала.
regfi80 писал(а):
57699377- так понимаю, в ней нет специальной функции генерации сабов.
- если звук умеет брать только с микрофона можно попробовать использовать программу типа аудио-кабеля
- еще важный вопрос с хронометражем для сабов. Если она умеет делать вывод (причем постепенно, слово за слово) в любое текстовое окно, то можно сделать маленькую прогу, которая бы вела этот хронометраж.
По этому поводу ничего не знаю
Я ей и пользуюсь только потому что на телефоне виртуальную клавиатуру тыкать не всегда удобно. Кончиками пальцев - ногтями дисплей царапаю, подушечками пальцев - иногда попадаю на 3 "клавиши" одновременно.
Но вообще ф-ционал там богатый, если есть необходимость, то поковырять стоит.
sisitor писал(а):
57701208Почему бы Вам не открыть исходные коды этой программы под Свободной лицензией?
57701208regfi80
Про "не такую уж и сложную", это Вы загнули, кончено
ютуб, даже на английском языке, субтитры неудовлетворительные делает, а на русском тем более. Почему бы Вам не открыть исходные коды этой программы под Свободной лицензией? тогда и другие пользователи смогут лучше протестировать программу на разных ОС и дополнить код.
Пожалуйста, будьте внимательней, об этом уже писал: https://rutr.life/forum/viewtopic.php?p=57699377#57699377
и если вы пройдете по указанной там ссылке на сайт microsoft, то в конце страницы увидите даже исходный код простой программы распознавания.
Огромное спасибо. Побольше бы таких умельцев как вы :).
А можете сделать доп. опцию, чтобы не субтитры переименовывались по видеофайлам, а, наоборот, видеофайлы по субтитрам? Есть много курсов, где файлы названы безобразно.
И как вариант предусмотреть возможность создания субтитров из заранее сохраненного текстового файла транскрипта, когда нет доступа в сеть или если Линда перекроет бесплатный доступ к транскриптам.
Sovr, Спасибо!
Кстати, от умельца слышу - если посмотреть на то огромное количество курсов которыми вы нас радуете!
Sovr писал(а):
57733143А можете сделать доп. опцию, чтобы не субтитры переименовывались по видеофайлам, а, наоборот, видеофайлы по субтитрам? Есть много курсов, где файлы названы безобразно.
Ок, сделал - в параметрах надо выбрать опцию "movies as subs"
Sovr писал(а):
57733143И как вариант предусмотреть возможность создания субтитров из заранее сохраненного текстового файла транскрипта, когда нет доступа в сеть или если Линда перекроет бесплатный доступ к транскриптам.
Для этого предлагаю просто сохранять субтитры выбирая опцию "if no movies" (см. описание)
regfi80, вы волшебник. Очень редко пишу восторженные отзывы, а вы достойны. Только сегодня задался вопросом, как автоматизировать создание субтитров, а тут ваше готовое решение. Удивительно, что ему всего несколько дней. Спасибо!
hasteem, на мой взгляд, неудобное решение (разве что для тех кто сидит чисто на линуксе или маке).
Ведь потом вам надо распаковывать, находить и копировать сабы отдельно в каждую главу, а затем еще переименовывать либо сабы либо фильмы.
В общем тот еще гемор. Кроме того, эта прога умеет еще правильно переименовывать фильмы.
hasteem, на мой взгляд, неудобное решение (разве что для тех кто сидит чисто на линуксе или маке).
Ведь потом вам надо распаковывать, находить и копировать сабы отдельно в каждую главу, а затем еще переименовывать либо сабы либо фильмы.
В общем тот еще гемор.
yes I'm agree with you, but this is another service for generating SRT's, on the server, I store zip file's, so next person get the file faster! and, I'm on windows, and using km player, so, this SRT generator, honestly made for my personal use, and share for others just for open source idea's
thanks and if, i miss understood your post, is because of Google translate
hasteem, не знаю как долго у вас генеряться сабы, но эта программа получает их практически мгновенно.
(хотя это может зависеть от железа, у меня: i7 3,1 GHz) Занимался тут упорядочивнием своей коллекции Lynda лекций и понял, что для тех случаев, когда исходное название лекции хочется переименовать (в название как на сайте с префиксом №главы_№лекции), а сабы уже есть, то программа не предусматривает решение такой задачи. Опция override subs if it exist не совсем подходит - она в этом случае оставляет исходные файлы сабов.
Поэтому добавил еще одну опцию, которая решает эту задачу. Если это кому-то тоже интересно могу обновить раздачу.
regfi80
да оставь так пока, всё-равно ручками приходится доводить - у папок скачанных с ресурсов имена не такие как прога даёт, соответственно и сабы переименовывать приходится. это не твоя вина, ты её(прогу))) и так слишком умной сделал, на XP работает, но я сейчас уже на 7ку перешёл)
57887382у папок скачанных с ресурсов имена не такие как прога даёт, соответственно и сабы переименовывать приходится...
gogajuk, плохо понял почему сабы переименовывать приходится?
Папки, может быть да - как и писал в описании:
скрытый текст
Порядок папок (порядок в проводнике, как это выглядит с сортировкой по умолчанию, т.е. с сортировкой по имени) с темами (главами) скачанного курса и порядок видео-файлов внутри этих папок должен соответствовать тому порядку который имеется на странице субтитров сайта lynda.
Т.е. достаточно поставить, если его нет, правильный префикс - номер папки. Это как правило всего одна папка с именем - Introduction (которую переименовываем, например, в "0 Introduction" или "00 Introduction").
А вот сабы почему? (разве если файлы фильмов имеют неупорядоченную нумерацию, но разве такое бывает?)
regfi80
мда... сразу не разобрался , извини, сейчас дошло, а то постоянно ошибка вылетала - кол-файлов не совпадало.
быстродействие, действительно впечатляет, даж икнуть не успел
Ага, программа на всякий случай для каждой темы (которой у нас соответствует папка) проверяет, совпадает ли количество фильмов в ней с количеством лекций на сайте.
Если не совпадает, то дается предупреждение и выбор - можно либо прервать процесс либо пропустив эту папку двигаться дальше. Такие случаи встречаются, либо когда люди при скачивании пропускают какие-то лекции. Вот один пример (но встречал больше примеров): https://rutr.life/forum/viewtopic.php?p=57710788#57710788
Либо, потому что у нас старый вариант лекций, а на сайте же это курс обновился (тоже встречал) и там, соответственно, изменилось количество лекций.
Большое спасибо за программу .
Получилось обработать только один курс. У остальных курсов вылетает ошибка синтаксиса при запуске видео. Как можно это исправить ?
У меня почему то во всех последних курсах по Люстре вылетает ошибка(но частично, т.е не во всех сериях) скачал программу dsrt , там говориться , что ошибка со временем... Сейчас поправляю файлы ей.
Что за "Люстры" для тех кто не в теме неясно (хоть бы ссылочку дали).
А судя по вашему описанию, дело не в программе, а в некорректной инфе по таймингу сабов которая на Lynda сайте.
Есть подозрение, что у вас в поле фильтра "Movie's file extension(mov or avi...)" стоит что-то некорректное. Для данного курса, это, как понимаете, должно быть mov Без правильного фильтра программа не может отличить видео файлы от других файлов (в частности от файлов примеров), которые нужно игнорировать. Поэтому, скорее всего, в случае с этим курсом папка с примерами не игнорируется, а считается как значимая (12-я)