Citizen4 social hub

Fundacja Technologie dla Ludzi

3 lata temu •

Fundacja Technologie dla Ludzi
3 lata temu •

Startujemy z projektem serwisu generującego napisy do materiałów wideo na podstawie ich ścieżki audio w języku polskim.

Pliki SRT i TXT z wgranego materiału lub udostępnionego adresu url.

Chcemy zakończyć problem braku napisów dla osób niedosłyszących czy niesłyszących.

Oprogramowanie już działa, potrzebujemy zakupić sprzęt z koprocesorem CUDA by wystartować z nową usługą. Potrzebujemy 7500zł.

Więcej na naszej zrzutce, gdzie zbieramy środki:
https://zrzutka.pl/z/generatornapisowplzaudioiwideo

Prosimy o rozpropagowanie tej zrzutki, to nasza pierwsza :)

Również bardzo prosimy o ewentualne wpłaty, jeśli uważacie że pomysł jest dobry i warto nas wesprzeć ❤️

Sprzęt do realizacji projektu generatora polskich napisów (srt, txt), z materiałów wideo w języku polskim. Dla osób niedosłyszących i na potrzeby transkrypcji materiału.

Przygotowaliśmy oprogramowanie generujące pliki z napisami (pl) w formatach SRT i TXT z materiału audio/wideo po polsku.

^zrzutka.pl

19 użytkowników udostępniło to dalej

didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡

3 lata temu •

to byłoby w jakiejś formie bezpiecznej dla prywatności?

Piotr Sikora

3 lata temu •

@didleth Musi sie to dziać po stronie serwera. Jednak samo oprogramowanie dostarczymy w trybie open-source, więc jeśli ktoś zna się choćby troszkę z oprogramowaniem, to będzie mógł lokalnie uruchomić.

Tylko od razu mówię… to potrzebuje sporo mocy karty GPU, albo sporo czasu i ramu zwykłego komputera … czas liczony w godzinach na filmik pru minutowy.

GPU które godzinny filmik potrafi zrobić w 15 minut kosztuje 9k pln.

@didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡

m0bi

3 lata temu •

@didleth A jakie widzisz zagrożenia? @ftdl

@Fundacja Technologie dla Ludzi @didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡

didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡

3 lata temu •

@m0bi13
słyszałam kiedyś argument odnośnie karmienia takich narzędzi danymi. Zaintrygowało mnie to wtedy, ale nie zgłebiałam

@m0bi

MiKlo:~/citizen4.eu$💙💛

3 lata temu

@didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡ @m0bi @Fundacja Technologie dla Ludzi No właśnie pytanie czy to jest jakiś gotowy wytrenowany model , który tu będzie tylko uruchamiany na materiale w celu wyłącznie konwersji czy ten materiał będzie tez używany do trenowania/ulepszania tego modelu ?

@Fundacja Technologie dla Ludzi @didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡ @m0bi

m0bi lubi to.

m0bi

3 lata temu •

@miklo Bierzemy model, dajemy mu sprzęt i wykorzystujemy do generowania napisów i tłumaczeń.

Bo będziemy też generować wersję en napisów, dla anglojęzycznej części widowni.

@ftdl @didleth

@MiKlo:~/citizen4.eu$💙💛 @Fundacja Technologie dla Ludzi @didleth 🇵🇱 🌈 🇺🇦 🇪🇺 ⚡

cycki

3 lata temu •

natywny polski też rozpoznacie? Jakaś próbka możliwości?

Fundacja Technologie dla Ludzi

3 lata temu •

@cycki Będą próbki niebawem, polskich materiałów z YouTube. Tak, chodzi o rozpoznawanie i generowanie napisów z audio „po polsku”.

@cycki

MiKlo:~/citizen4.eu$💙💛

3 lata temu

@Fundacja Technologie dla Ludzi Czy ten projekt będzie jakkolwiek kompatybilny z projektem https://gitlab.com/apps_education/peertube/plugin-transcription ? Tzn czy da się ten wasz model wykorzystać w tym pluginie ? Modele tam użyte są stąd: https://alphacephei.com/vosk/models

VOSK Models

Accurate speech recognition for Android, iOS, Raspberry Pi and servers with Python, Java, C#, Swift and Node.

^{VOSK Offline Speech Recognition API}

@Fundacja Technologie dla Ludzi

2 ludzi lubi to

Fundacja Technologie dla Ludzi

3 lata temu •

@miklo Niebawem na naszym gitlab pojawi się więcej szczegułów dotyczących projektu #GeneratorNapisówPL

Prosimy o trochę cierpliwości.

#generatornapisowpl @MiKlo:~/citizen4.eu$💙💛

m0bi

3 lata temu •

@miklo Dzięki za info, zerknę i napiszę więcej, ale już nie dzisiaj.

@ftdl

@MiKlo:~/citizen4.eu$💙💛 @Fundacja Technologie dla Ludzi

Robert "Szkodnix" :mi:

3 lata temu •

Jak tylko wypłata wejdzie to też i sam się dorzucę!

Fundacja Technologie dla Ludziudostępnił to.

Fundacja Technologie dla Ludzi

3 lata temu •

@szkodnix Dziękujemy ♥️

@Robert "Szkodnix" :mi:

Robert "Szkodnix" :mi: lubi to.

Michał Stankiewicz :verified:

3 lata temu •

o jaki silnik będzie oparte rozpoznawanie mowy? Whisper?

Fundacja Technologie dla Ludzi

3 lata temu •

@mstankiewicz Niebawem na gitlabie pojawi się projekt i będzie więcej informacji.

Na razie wykorzystujemy dwa modele, testujemy kolejne.

@Michał Stankiewicz :verified:

naleśnik

9 miesiące temu •

jakie rokowania projektu?
@mstankiewicz #NapiGen

#napigen @Michał Stankiewicz :verified:

MiKlo:~/citizen4.eu$💙💛

9 miesiące temu

@naleśnik @Michał Stankiewicz :verified: @Fundacja Technologie dla Ludzi
W sumie jako fundator dołączam się do pytania ale bardziej konkretnie:
Ostatni wpis na zrzutce (11 października 2023) kończy się "Aktualna wysokość będzie w stanie pokryć koszt zakupu serwera do którego będziemy mogli włożyć GPU, więc część założenia celu mamy osiągnięty."
To zostało w końcu coś zakupione na potrzeby tego projektu czy nie ?

@Fundacja Technologie dla Ludzi @Michał Stankiewicz :verified: @naleśnik

⇧