Usłyszysz je w metrze w Delhi i na gdańskim dworcu. Zrozumiałe komunikaty głosowe dzięki naukowcom z PG
Zespół naukowców Politechniki Gdańskiej i inżynierowie Ambient System opracowali technologię poprawiającą zrozumiałość komunikatów głosowych na lotniskach, dworcach kolejowych czy w metrze. System w pełni autonomicznie moduluje barwę, głośność i tempo komunikatów głosowych, co w sytuacjach kryzysowych, jak pożar czy atak terrorystyczny, może wpływać na bezpieczeństwo tysięcy osób. Rozwiązanie opiera się na autorskich algorytmach i już sprawdza się na całym świecie.
Dźwiękowy system ostrzegawczy smartVES, którego podstawowym zadaniem jest przekazywanie podróżnym informacji głosowych o rozkładach jazdy, statusach lotów dla pasażerów oraz o utrudnieniach i komunikatach, stanowi odpowiedź na zjawisko zanieczyszczenia hałasem w przestrzeni publicznej ma na celu zwiększenie poziomu bezpieczeństwa poprzez poprawę zrozumiałości komunikatów głosowych. System jest z powodzeniem wdrażany w Polsce i za granicą.
Testowany w najtrudniejszych warunkach akustycznych
Rozwiązanie z powodzeniem działa wszędzie tam, gdzie występują trudne warunki akustyczne, np. w metrze w Delhi, które jest jednym z największych i najgłośniejszych korytarzy komunikacyjnych na świecie, obsługującym codziennie miliony pasażerów. Ponadto z technologii mogą skorzystać podróżni na dworcach i liniach kolejowych w Polsce ( m.in. na Dworcu Głównym PKP w Gdańsku), Turcji, Szwecji, Finlandii oraz na lotnisku w Rabacie w Maroku. System sprawdza się zarówno w wielkich halach, jak i wąskich korytarzach.
– Naszym celem było stworzenie systemu, który nie tylko spełnia rygorystyczne normy, ale przede wszystkim realnie podnosi komfort i poczucie bezpieczeństwa użytkowników obiektów użyteczności publicznej, komercyjnych czy przemysłowych. System dźwiękowy smartVES powstał dzięki ścisłej współpracy inżynierów Ambient System z naukowcami Politechniki Gdańskiej i jest przykładem tego, jak efektywnie można łączyć potencjał biznesu z osiągnięciami świata nauki – mówi Marcin Starzyński, prezes zarządu Ambient System.
– W systemie zaimplementowaliśmy dwa autorskie algorytmy cyfrowego przetwarzania dźwięku. Filtracja adaptacyjna pozwala na bieżąco dopasować komunikat do warunków akustycznych, tak aby był zawsze zrozumiały, niezależnie od występującego hałasu. Z kolei algorytm czasowej transpozycji mowy analizuje głos operatora i w czasie rzeczywistym koryguje tempo wypowiedzi, nawet gdy komunikat wygłaszany jest „na żywo”, a mówca pod wpływem stresu mówi niewyraźnie lub mówi bardzo szybko. Dzięki temu przekaz pozostaje zrozumiały także w dużych obiektach, gdzie występuje pogłos – mówi dr hab. inż. Józef Kotus, prof. PG z Katedry Systemów Multimedialnych na WETI PG, kierownik prac badawczych.
Algorytmy z Politechniki Gdańskiej
Algorytm czasowej transpozycji mowy i algorytm adaptacyjnej filtracji, które opracowano na PG, to rozwiązania decydujące o zrozumiałości i komunikatów, które zostały zaimplementowane do dźwiękowych systemów ostrzegawczych smartVES.
Pierwszy z nich umożliwia dostosowanie tempa odtwarzania komunikatu do akustyki przestrzeni, w której jest emitowany. Ten sam algorytm działa również w przypadku podawania komunikatu na żywo przez operatora. W sytuacjach zagrożenia głos osoby odpowiedzialnej za przekazywanie informacji może się załamywać, a tempo mówienia może być zbyt szybkie – a to znacząco ogranicza możliwość zrozumienia.
Drugi algorytm odpowiada za ocenę charakterystyki akustycznej obiektu i detekcję obecnych już w przestrzeni dźwięków, a następnie przekształca sygnał mowy w taki sposób, aby nadawany komunikat wyróżniał się na tle szumu komunikacyjnego. Pozwala na wybór odpowiednich częstotliwości omijając te, na których występuje hałas, przez co znacząco poprawia wyrazistość mowy docierającej do odbiorców.
Warto podkreślić, że smartVES to nie pierwszy efekt współpracy Ambient System z Politechniką Gdańską. Dzięki kooperacji powstały przełomowe projekty m.in. technologia oparta na autorskim modelu AI i ML, która umożliwia natychmiastową detekcję sytuacji zagrożenia na bazie analizy sygnałów audio i niezwłocznie informuje o tym systemy bezpieczeństwa.
Autorami opatentowanych sposobów i układów przetwarzania sygnałów mowy z PG są: dr hab. inż. Józef Kotus, prof. PG, prof. dr hab. inż. Bożena Kostek, dr hab. inż. Grzegorz Szwoch, prof. PG, dr hab. inż. Piotr Szczuko, prof. PG oraz dr inż Piotr Odya.