Ticho škodí (přepisu řeči do textu)
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 22:42
English to Czech
Dec 5, 2023

Měl jsem plán: stáhnu si všechna videa z Odoo Experience 2023 a přepíšu si je automaticky do textu a do titulků. Akce trvala tři dny: 8-10.11.2023 a přepis dokončím do 15.11.2023.
Po několika minutách od ukončení živého přenosu byla videa k dispozici. Videa jsem stáhl a zvuk jsem přepsal, termín jsem dodržel.
Jenže, jazykový model Whisper V2.0 vytvořil pouze 170 textů z 337 disponibilních videí.
Youtube vytváří automatické přepisy pouze pro "v
... See more
Měl jsem plán: stáhnu si všechna videa z Odoo Experience 2023 a přepíšu si je automaticky do textu a do titulků. Akce trvala tři dny: 8-10.11.2023 a přepis dokončím do 15.11.2023.
Po několika minutách od ukončení živého přenosu byla videa k dispozici. Videa jsem stáhl a zvuk jsem přepsal, termín jsem dodržel.
Jenže, jazykový model Whisper V2.0 vytvořil pouze 170 textů z 337 disponibilních videí.
Youtube vytváří automatické přepisy pouze pro "velké" jazyky a přepis je méně přesný než přepis vyhotovený pomocí velkého modelu Whisper. Youtube vytvořil automatický přepis téměř ze všech videí. Zajímavé je, že některé titulky jsou dlouhé a jiné jsou krátké. Zatím jsem nezkoumal proč.
Otázka zněla: Proč Whisper vůbec nepřepsal polovinu videí? Jak přepis udělat?
Odpověď: odstřihnout TICHO.
Ukázka jednoho videa:
https://www.youtube.com/watch?v=s_PHEiNpkC4&list=PL1-aSABtP6ABxfzTiEkvg3HnRhBLFcYhk&index=182

0:37 / 25:35

Přepis textu ze 14.11. vypadá takto:
Test test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . atd.

Přepis titulků obsahuje časy, první titulek Test test, další titulky obsahují tečku :
1
00:00:00,000 --> 00:00:02,000
Test test

2
00:00:30,000 --> 00:00:32,000
.

3
00:01:00,000 --> 00:01:02,000
.
atd.
---
Přepis Youtube zobrazuje, že první titulek začíná 3:10 minut.
3:10
okay good uh good afternoon everyone
3:12
thank you very much for joining this
3:14
presentation uh so it's called flavorful
---
Video otevřu v SubtitleEdit (SE), poznačím si časy:
SUB start: 3:10
SE Konec, trvání: 25:35:582 (opis)
SE konec řeči: 25:26 (vyhledáno, ověřeno)
SE start: 3:10 (vyhledáno, ověřeno)
Trvání: 22:16 rozdíl Konec-Start, upravil jsem na 22:22

a napíšu příkaz pro program ffmpeg:
ffmpeg -ss 0:03:10 -i "193.mp4" -to 0:22:22 -c copy 193-s.mp4

Původní soubor
193.mp4 107 939 876 13.11.2023 08:09
Soubor bez úvodního ticha
193-s.mp4 95 715 538 05.12.2023 12:00

Soubor bez úvodního ticha model Whisper zpracuje.
Nedokončená práce na odstraňování ticha způsobila, že jsem už dlouho zticha.
Ještě nějakou dobu zticha budu.

Milan
Collapse


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ticho škodí (přepisu řeči do textu)






Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »