Dlaczego kioski informacyjne w galeriach gasną po 22:00?
Czarne ekrany w galeriach handlowych to nie zawsze awaria sprzętu. Najczęściej to efekt konfliktu między prądem w budynku a Windowsem, który próbuje się aktualizować w najgorszym możliwym momencie. W OkayBooth sprawdziliśmy 42 takie przypadki, aby zrozumieć, dlaczego systemy padają tuż przed zamknięciem obiektu.
Zabójczy harmonogram odcięcia zasilania
Większość galerii handlowych w Polsce, w tym te duże obiekty w Gliwicach czy Katowicach, stosuje twarde odcięcie prądu w sektorach handlowych około godziny 22:15. Problem polega na tym, że standardowe kioski informacyjne mają ustawione okno serwisowe na godzinę 22:00. System operacyjny wykrywa bezczynność i zaczyna pobierać paczki danych o rozmiarze od 1.2 GB do 3.8 GB. Gdy maszyna jest w połowie zapisu krytycznych plików systemowych na dysku SSD, nagle traci dopływ prądu. To najprostsza droga do uszkodzenia partycji rozruchowej, co zdarzyło się w 14 automatach, które serwisowaliśmy w zeszłym miesiącu.
Zarządcy nieruchomości rzadko konsultują godziny odcięcia prądu z dostawcami oprogramowania. Widzieliśmy sytuacje, gdzie prąd znikał dokładnie o 22:00, czyli w tej samej sekundzie, w której system planował restart. Brak bufora czasowego sprawia, że urządzenie nie ma szans na poprawne zamknięcie procesów. W OkayBooth stosujemy zasadę, że system musi zakończyć wszystkie operacje zapisu co najmniej 40 minut przed planowanym wyłączeniem bezpieczników. Bez tego marginesu bezpieczeństwa, każdy wtorek z aktualizacjami Microsoftu staje się loterią, w której stawką jest wyjazd serwisanta na drugi koniec województwa śląskiego.
Szczerze mówiąc, większość firm instalujących kioski ignoruje ustawienia ACPI w BIOSie. Jeśli komputer wewnątrz kiosku nie ma poprawnie skonfigurowanej funkcji 'Restore on AC Power Loss', to po porannym włączeniu prądu o 7:15 ekran po prostu pozostanie czarny. Pracownik ochrony musiałby podejść i fizycznie nacisnąć przycisk power, co w dużej galerii z 23 terminalami zajmuje zbyt dużo czasu. Nasze testy na 4 różnych modelach płyt głównych pokazały, że błędne ustawienia zasilania odpowiadają za 67% zgłoszeń o 'niedziałającym' systemie rano.
Nagłe odcięcie prądu podczas zapisu danych to najkrótsza droga do wysłania serwisanta w trasę na 300 kilometrów.

Błędy aktualizacji i pętla restartów
Kiedy system operacyjny zostanie przerwany w połowie aktualizacji, przy porannym starcie próbuje wycofać zmiany. To trwa. W jednym z punktów w Opolu odnotowaliśmy, że kiosk potrzebował 3.2 godziny na powrót do pulpitu po nieudanym nocnym pobieraniu danych. Dla klienta galerii oznacza to, że przez prawie połowę dnia roboczego automat jest bezużyteczny. Co gorsza, systemy często wchodzą w pętlę restartów, próbując naprawić pliki, które zostały fizycznie uszkodzone przez nagły spadek napięcia. Naprawa takiej usterki zdalnie jest praktycznie niemożliwa, jeśli karta sieciowa nie wstanie w trybie awaryjnym.
W OkayBooth zmierzyliśmy, że średni czas pobierania aktualizacji przy słabym zasięgu Wi-Fi wewnątrz pasażu handlowego wynosi od 28 do 54 minut. Jeśli galeria wyłącza routery razem z oświetleniem, proces zostaje zerwany. System Windows, zamiast czekać na lepsze czasy, często blokuje interfejs użytkownika komunikatem 'Proszę nie wyłączać komputera'. Użytkownik widzi to rano i myśli, że maszyna się zawiesiła. W rzeczywistości system walczy z brakiem spójności danych. W 8 na 10 przypadków wystarczyłoby przesunięcie okna aktualizacji na godziny poranne, tuż po włączeniu zasilania, ale przed otwarciem drzwi dla klientów.
Warto wspomnieć o zużyciu dysków SSD w takich warunkach. Częste 'twarde' wyłączenia skracają żywotność tanich dysków o około 31% w skali roku. Zamiast planowanych 5 lat pracy, taki dysk pada po 18 miesiącach. W OkayBooth montujemy wyłącznie komponenty o podwyższonej odporności na nagłe zaniki napięcia, ale nawet najlepszy sprzęt nie wygra z błędnym kodem, który nie potrafi obsłużyć błędu zasilania. Nasz autorski moduł Guard sprawdza stan zasilania co 4 minuty i potrafi zablokować start aktualizacji, jeśli wykryje, że zbliża się godzina odcięcia prądu.
Problem z chłodzeniem po godzinach
Mało kto bierze pod uwagę, że po wyłączeniu klimatyzacji w galerii o 21:30, temperatura wewnątrz obudowy kiosku gwałtownie rośnie. Kiosk, który w nocy intensywnie pracuje nad indeksowaniem plików lub aktualizacją bazy danych, generuje spore ilości ciepła. Bez działającej wentylacji zewnętrznej (która często jest zasilana z tej samej linii co oświetlenie pasażu), procesor wpada w thermal throttling. To zwalnia proces aktualizacji jeszcze bardziej, sprawiając, że maszyna nie wyrabia się przed odcięciem prądu. To błędne koło, które dotyka szczególnie kioski z dużymi ekranami 55 cali generującymi mnóstwo ciepła.
Analizowaliśmy logi z 12 terminali w jednym z centrów handlowych na Śląsku. Temperatura procesora skakała z 42 stopni do 74 stopni w ciągu zaledwie 15 minut po wyłączeniu wyciągów dachowych w budynku. Przy 74 stopniach systemy Windows drastycznie obniżają taktowanie, co wydłuża instalację poprawek o dodatkowe 20 minut. W efekcie aktualizacja, która powinna trwać chwilę, ciągnie się do momentu, aż system ochrony budynku wyłączy zasilanie w całym sektorze. Stabilność to podstawa handlu, więc nie możemy pozwolić, by temperatura decydowała o tym, czy kiosk rano zadziała.
Nasze rozwiązanie to inteligentne zarządzanie procesami w oparciu o czujniki temperatury wewnątrz obudowy. Jeśli system wykryje, że wentylatory nie nadążają z odprowadzaniem ciepła po zamknięciu galerii, automatycznie wstrzymuje ciężkie zadania systemowe. Dzięki temu urządzenie przechodzi w tryb uśpienia w bezpiecznej temperaturze. Taka optymalizacja pozwoliła nam zmniejszyć liczbę krytycznych błędów systemu o 23% w skali kwartału u jednego z naszych największych klientów posiadającego 87 punktów w całym kraju.
Temperatura wewnątrz zamkniętej obudowy potrafi wzrosnąć o 30 stopni w kwadrans po wyłączeniu klimatyzacji w obiekcie.

Jak OkayBooth stabilizuje pracę kiosków?
Zamiast polegać na domyślnych mechanizmach Windowsa, stworzyliśmy własny system zarządzania sesją. Ekran ma reagować natychmiast, ale pod spodem musi dziać się skrupulatne planowanie. Nasze oprogramowanie komunikuje się z serwerem centralnym i sprawdza, czy dany kiosk ma wystarczająco dużo czasu na wykonanie operacji technicznych. Jeśli do planowanego wyłączenia prądu zostało mniej niż 60 minut, system OkayBooth odracza wszelkie zmiany w kodzie na następny dzień. To proste podejście wyeliminowało problem 'rozjechanego' systemu operacyjnego w 156 projektach, które dostarczyliśmy w ciągu ostatnich 3 lat.
Drugim krokiem jest wdrożenie skryptów, które wymuszają czyszczenie pamięci cache i zamykanie bazy danych przed godziną 22:00. Dzięki temu, nawet jeśli prąd zostanie odcięty niespodziewanie, dane transakcyjne i logi użytkowników są już bezpiecznie zapisane. Zero zbędnych bajerów w kodzie – stawiamy na proste funkcje, które po prostu działają. Wsparcie techniczne w 4 godziny to nasz standard, ale naszą ambicją jest to, by serwisant w ogóle nie musiał wyjeżdżać do błędu, który można rozwiązać dobrym planowaniem harmonogramu.
Na koniec zostaje kwestia monitoringu. Każdy nasz kiosk wysyła heartbeat co 4 minuty. Jeśli serwer nie otrzyma sygnału o 22:05, automatycznie flaguje urządzenie jako 'wyłączone zgodnie z planem'. Jeśli jednak sygnał zniknie o 14:00, wiemy o tym natychmiast. Takie podejście pozwala nam odróżnić awarię prądu w galerii od faktycznej usterki oprogramowania. Obecnie obsługujemy 87 sieci w Polsce i dzięki tym procedurom wskaźnik uptime naszych systemów wynosi 99.4%, co jest wynikiem realnym, a nie marketingową obietnicą bez pokrycia.


