Przejdź do głównej zawartości


Startujemy z projektem serwisu generującego napisy do materiałów wideo na podstawie ich ścieżki audio w języku polskim.

Pliki SRT i TXT z wgranego materiału lub udostępnionego adresu url.

Chcemy zakończyć problem braku napisów dla osób niedosłyszących czy niesłyszących.

Oprogramowanie już działa, potrzebujemy zakupić sprzęt z koprocesorem CUDA by wystartować z nową usługą. Potrzebujemy 7500zł.

Więcej na naszej zrzutce, gdzie zbieramy środki:
https://zrzutka.pl/z/generatornapisowplzaudioiwideo

Prosimy o rozpropagowanie tej zrzutki, to nasza pierwsza :)

Również bardzo prosimy o ewentualne wpłaty, jeśli uważacie że pomysł jest dobry i warto nas wesprzeć ❤️
to byłoby w jakiejś formie bezpiecznej dla prywatności?
@didleth Musi sie to dziać po stronie serwera. Jednak samo oprogramowanie dostarczymy w trybie open-source, więc jeśli ktoś zna się choćby troszkę z oprogramowaniem, to będzie mógł lokalnie uruchomić.

Tylko od razu mówię… to potrzebuje sporo mocy karty GPU, albo sporo czasu i ramu zwykłego komputera … czas liczony w godzinach na filmik pru minutowy.

GPU które godzinny filmik potrafi zrobić w 15 minut kosztuje 9k pln.
@m0bi13
słyszałam kiedyś argument odnośnie karmienia takich narzędzi danymi. Zaintrygowało mnie to wtedy, ale nie zgłebiałam
@m0bi
@didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡ @m0bi @Fundacja Technologie dla Ludzi No właśnie pytanie czy to jest jakiś gotowy wytrenowany model , który tu będzie tylko uruchamiany na materiale w celu wyłącznie konwersji czy ten materiał będzie tez używany do trenowania/ulepszania tego modelu ?
@miklo Bierzemy model, dajemy mu sprzęt i wykorzystujemy do generowania napisów i tłumaczeń.

Bo będziemy też generować wersję en napisów, dla anglojęzycznej części widowni.

@ftdl @didleth
natywny polski też rozpoznacie? Jakaś próbka możliwości?
@cycki Będą próbki niebawem, polskich materiałów z YouTube. Tak, chodzi o rozpoznawanie i generowanie napisów z audio „po polsku”.
@Fundacja Technologie dla Ludzi Czy ten projekt będzie jakkolwiek kompatybilny z projektem https://gitlab.com/apps_education/peertube/plugin-transcription ? Tzn czy da się ten wasz model wykorzystać w tym pluginie ? Modele tam użyte są stąd: https://alphacephei.com/vosk/models
@miklo Niebawem na naszym gitlab pojawi się więcej szczegułów dotyczących projektu #GeneratorNapisówPL

Prosimy o trochę cierpliwości.
@miklo Dzięki za info, zerknę i napiszę więcej, ale już nie dzisiaj.

@ftdl
o jaki silnik będzie oparte rozpoznawanie mowy? Whisper?
@mstankiewicz Niebawem na gitlabie pojawi się projekt i będzie więcej informacji.

Na razie wykorzystujemy dwa modele, testujemy kolejne.