Wykorzystanie nowych technologii do wspierania osób z dysfunkcjami wzroku ze szczególnym naciskiem na poruszanie się i uczestniczenie w życiu społecznym
2. Kompleksowe rozwiązania
2.1. Elektronika noszona
2.1.1. Interfejs
“Virtualna Warszawa” może pomóc w rozwiązaniu tylko pewnej części problemów, z którymi spotykają się niewidomi w mieście. Aby bardziej zbliżyć się do rozwiązania problemu orientacji przestrzennej i deficytu informacji, potrzebne są rozwiązania jeszcze bardziej kompleksowe i nowe rodzaje interfejsów.
Optymalnym interfejsem dla niewidomego poruszającego się samodzielnie wydają się w tej chwili tzw. Wearables, a szczególnie rozwiązania typu Google Glass. Okulary z wbudowaną kamerą lub kamerami, tzw. słuchawkami kostnymi, nie zasłaniającymi uszu, oraz z wbudowanym mikrofonem pozwalającym na komunikację głosową, to narzędzie, którego można użyć w dowolnej chwili bez konieczności wyjmowania z kieszeni lub trzymania w dłoni. Informacje o przestrzeni użytkownik może dostawać nie tylko w postaci komunikatów głosowych, ale również jako przestrzenne sygnały dźwiękowe, czyli tzw. dźwięki 3D. Jeżeli system bierze pod uwagę charakterystyki akustyczne głowy (HRTF) wrażenie przestrzenności może być bardzo wysokie, co przełoży się na jakość przekazywanej informacji dźwiękowej. Zastosowanie akcelerometrów i kompasu w okularach daje systemowi możliwość obserwacji położenia głowy użytkownika i dostarczanie mu bardziej precyzyjnych danych, np. o kierunku. Takie okulary mogą też spełniać funkcję pomocy optycznej dla osób słabo widzących, dostosowując przekazywany obraz do indywidualnych potrzeb użytkownika. Oprogramowanie do tego typu urządzeń najczęściej znajduje się na smartfonie lub na dedykowanym przenośnym urządzeniu.
2.1.2. Rozpoznawanie ludzi
Programy do rozpoznawania twarzy istnieją od dawna, ale jak dotąd, nie służą one niewidomym. Identyfikacja osób to poważny problem społeczny, bo nieprawdą jest, że niewidomi łatwo rozpoznają ludzi po głosie. W wielu wypadkach nauczenie się czyjegoś głosu wymaga czasu, więc podtrzymywanie znajomości z niedawno poznanymi osobami (np. uczestnicy konferencji) jest bardzo utrudnione.
Propozycja aplikacji: Użytkownik po lub podczas rozmowy z kimś, zapisuje zdjęcie twarzy w bazie danych na urządzeniu i przypisuje nazwę oraz miejsce. W ten sposób powstaje nieduża baza zdjęć osób powiązanych z konkretnym miejscem, np. konferencją. Gdy system wypatrzy w danej lokalizacji osobę zapisaną w bazie, powiadomi o tym użytkownika. Ograniczenie bazy danych do zdjęć z konkretnego miejsca pozwoli zwiększyć skuteczność rozpoznawania twarzy.
2.1.3. Rozpoznawanie obiektów
Rozpoznawanie obiektów to rzecz bardziej złożona od rozpoznawania twarzy, ale, o dziwo, na rynku są aplikacje dla niewidomych służące do tego celu. Są też programy usiłujące optycznie rozpoznawać filmy video. Informacje podawane przez te programy mają jednak charakter ogólny, np. “ręka trzymająca butelkę”. Informacja szczegółowa nie zawsze jest dostępna lub jest niewystarczająca.
Propozycja: W miejscach szczególnie trudnych lub ciekawych, dokładnie fotografujemy i opisujemy przestrzeń. Zdjęcia w bazie danych zostają przypisane do konkretnego miejsca. Program rozpoznający porównuje obraz z kamer wyłącznie ze zdjęciami z bazy danych przypisanej do miejsca oraz z ogólnie występującymi obiektami, np. wzorami sylwetek ludzkich. Rozpoznane obiekty są anonsowane.
Przykład1: Użytkownik słyszy: “Stoisz przed wolnym miejscem przy stoliku w barku na parterze Pałacu Kultury”.
Przykład2: Użytkownik słyszy: “Po lewej osoba w uniformie pracownika ochrony budynku”.
2.1.4. Rozpoznawanie ludzi
Szczególną kategorią obiektów, które czasem trzeba wykryć, są ludzie. W miejscach pustych, np. na peronie podmiejskiej stacji, gdzie ludzie stoją kilka lub kilkanaście metrów od siebie, zorientowanie się, czy w pobliżu stoi ktoś, kogo można spytać, czy jesteśmy we właściwym miejscu lub jak wyjść ze stacji, może być nie lada wyzwaniem. Program rozpoznający sylwetki ludzkie byłby bardzo pomocny.
2.1.5. Optyczne rozpoznawanie napisów
O ile rozpoznawanie tekstów drukowanych w domowych warunkach nie jest trudne, jeżeli tylko ma się skaner i odpowiedni program, to rozpoznawanie tekstów (np. ulotek) za pomocą urządzeń mobilnych wciąż nie jest bardzo łatwe. Oddzielną kwestią jest rozpoznawanie napisów na drzwiach, znakach i budynkach. Jak na razie jedynym komercyjnie dostępnym urządzeniem, którego twórcy deklarują możliwość czytania większych napisów jest OrCam, przeznaczony dla osób słabo widzących.
Propozycja: Program rozpoznaje najważniejsze obiekty w scenie i informuje o tych, które zawierają napisy. Napisy są rozpoznawane na żądanie.
Przykład: Użytkownik podchodzi do drzwi urzędu. Program mówi: “tabliczka przy drzwiach”. Użytkownik: “Rozpoznaj”. Program czyta tekst.
2.1.6. Rozpoznawanie świateł i pasów
Bezpieczeństwo na przejściach przez jezdnię to bardzo złożone zagadnienie. Badania z użyciem EEG przeprowadzone w ramach projektu “Cities Unlocked” pokazały, że przejścia przez jezdnię są jednym z najbardziej stresujących aspektów poruszania się w mieście. Zaproponowane poniżej rozwiązanie tylko częściowo rozwiązuje problem.
Propozycja: Program wykorzystuje beacony do doprowadzenia użytkownika na przejście. Dodatkowo program stara się optycznie odnaleźć pasy, by pomóc ustawić się użytkownikowi prostopadle do przejścia. Następnie program rozpoznaje i informuje, gdy światło zmieni się na zielone. Podczas przechodzenia przez jezdnię program stara się rozpoznawać pasy, by poinformować użytkownika gdyby zaczął on z nich schodzić.
2.1.7. Optyczne rozpoznawanie numeru linii i rodzaju pojazdu
Nawet najbardziej dopracowany system informacji pasażerskiej nie jest w stanie dostarczać informacji o wszystkich pojazdach, które podjeżdżają na przystanek lub w jego okolice. Podawane informacje najczęściej dotyczą transportu miejskiego z pominięciem autobusów linii prywatnych i busów. Optyczne rozpoznawanie wspomagane przez dane z systemu informacji, może znacznie zwiększyć niezależność niewidomego użytkownika środków transportu.
Propozycja: Program rozpoznaje rodzaj pojazdu (autobus, tramwaj, bus, samochód osobowy). Następnie porównuje obraz z numerem linii z informacjami z rozkładu jazdy oraz z bazą numerów linii prywatnych, którymi jeździ użytkownik. Rozpoznany numer jest anonsowany. Jeżeli rozpoznany numer w ogóle nie pasuje do informacji z bazy danych program informuje o tym i podaje rodzaj pojazdu.
2.2. Systemy autonomiczne
2.2.1. Dlaczego?
Nawet najbardziej zaawansowane osobiste pomoce w orientacji przestrzennej mają co najmniej dwa ograniczenia:
- są osobiste, a więc analizują rzeczywistość z miejsca, w którym znajduje się użytkownik i jakby z jego perspektywy, wspomagając się tylko informacjami z rozmaitych systemów, np. korzystając z beaconów.
- mogą się popsuć, zawiesić lub nie być w stanie udzielić wystarczających informacji.
Systemy zewnętrzne, niezależne od osobistych urządzeń, ale mogące z nimi współpracować są świetnym uzupełnieniem, a czasem koniecznym elementem infrastruktury zwiększającej bezpieczeństwo i komfort niewidomych w mieście.
2.2.2. Informacja na przystankach i peronach
Przystanki, szczególnie te na wysepkach na środku jezdni oraz perony to źródło licznych problemów i stresu dla niewidomych użytkowników miast. Trzeba przejść przez jezdnię i skręcić na przystanek tuż przed lub za torami. Oznaczenia fakturowe pomagają, ale częściowo i nie zimą, zatem sytuacje, gdy śpieszący się niewidomy wychodzi albo na tory, albo na jezdnię nie są rzadkie. Potem trzeba zorientować się, jaki numer przyjechał i zlokalizować przycisk do drzwi.
Na peronach trzeba upewnić się, że podjeżdżający pociąg to nasz, a nie pociąg wjeżdżający na sąsiedni peron. Następnie trzeba zorientować się, gdzie jest nasz wagon. Na nieznanych stacjach ilość potrzebnych informacji rośnie, np. potrzebujemy danych o kierunku jazdy.
Propozycja: Kamery obserwują przystanek lub peron. System rozpoznaje niewidomego albo po białej lasce, albo po jakimś markerze, np. specjalnej słuchawce w uchu. Niewidomy jest ostrzegany, gdy zejdzie z pasów lub zbliży się zbytnio do torów. System informuje go też, w którą stronę iść do drzwi, a na peronach podaje mu numery mijanych wagonów i odczytuje inne napisy.
Rafał Charłampowicz
Grudzień 2015
Materiał został opracowany w ramach projektu „Wirtualna Warszawa” – Tyflopolis