Audiobooki czytane Twoim głosem mogą stać się przyszłością dzięki nowej technologii rozwijanej przez Project Gutenberg współtworzone przez Microsoft i MIT.
Audiobooki to zjawisko coraz bardziej popularne, które pozwala „czytać uchem”, kiedy fizycznie nie jesteśmy w stanie skupić się na tekście. Te nagrania bywają jednak kosztowne i złożone w produkcji. Ale wszystko może się zmienić.
Naukowcy z Microsoftu i MIT prezentują rozwiązanie bazujące na syntetycznej mowie, które przetransformuje proces tworzenia audiobooków. Za pomocą specjalistycznego oprogramowania do syntezy mowy, tworzą kolekcję książek, które brzmią niemal jak czytane przez człowieka.
Czytaj także:
- Technologia Kluczem do Systemu Kaucji
- Microsoft: Energia jądrowa dla centrów danych AI
- Czy Sędziowie Liniowi Ustąpią Miejsca Nowoczesnej Technologii? Obawy o Przyszłość Arbitrażu
Projekt Gutenberg, wynik współpracy technologicznego giganta i prestiżowej uczelni, ma na celu udostępnienie literatury przez darmowe audiobooki. Biblioteka Gutenberg, mająca 70 tys. ebooków, dzięki nowej technologii przekształca je w audiobooki na platformach streamingowych.
Zainteresowanie syntetyczną mową rośnie. Podobne rozwiązanie Apple spotkało się z krytyką artystów głosowych. Kontrowersje dotyczyły używania autentycznych nagrań w szkoleniu AI. Findaway Voices, centralny w sporze, według lektorów dostarczył Apple nagrań bez informowania. Spór zaangażował związek SAG-AFTRA, dbający o interesy lektorów.
Project Gutenberg, niekomercyjny, dąży do naturalnie brzmiącej mowy. Dla zespołu kluczowe jest skuteczne narzędzie konwersji tekstu na mowę. Projekt pozwala słuchać książek własnym głosem, demokratyzując technologię. System „uczy się” głosu użytkownika po kilku próbkach.
Wizja ma wiele zastosowań, jak pomoc rodzicom w czytaniu dzieciom. Mimo obaw lektorów o przyszłość, technologia otwiera nowe możliwości personalizacji i dostępu do literatury na niebywałą skalę.
Źródło: businessinsider