Strona główna >> Blog >> Zarządzanie ryzykiem technicznym: awaria nie bierze się znikąd
Każdy zna powiedzenie „no risk, no fun” lub „kto nie ryzykuje, ten nie ma”. W produkcji, biznesie, życiu – ryzyko jest zawsze obecne, a z nim w parze idzie szansa.
W szeroko rozumianej „Technice” jest podobnie tzn. ryzyko jest elementem codzienności (czy nam się to podoba czy nie). Dział Utrzymania Ruchu naturalnie zarządza ryzykiem poprzez:
- naprawy awarii (usuwanie technicznych skutków zmaterializowanych ryzyk),
- działania prewencyjne i predykcyjne (redukcja prawdopodobieństwa wystąpienia),
- modernizacje np. wprowadzenie redundancji (redukcja konsekwencji uszkodzeń),
- logistykę UR – magazyny, zapasy, itd. (redukcję czasu naprawy).
Niestety to „naturalne zarządzanie ryzykiem”, nie zawsze jest wystarczające – w szczególności, gdy nie odbywa się w sposób świadomy może prowadzić do Awarii.
Awaria to efekt decyzji (a właściwie ich braku), które doprowadziły do zmaterializowania ryzyka. Ryzyko zawsze tam było.
Pytanie które powinieneś sobie zadać to: czy ryzyko było widoczne i akceptowalne i czy byłeś/-aś na tą awarię przygotowany/-a?
Załóżmy, że masz 20 mobilnych pomp transferowych, a w procesie na raz wykorzystujesz 10, reszta jest w 100% gotowa do użycia w razie awarii. Czas przełączenia nowej pompy – 5 minut (pomijalny w Twoim procesie produkcyjnym). Koszt remontu pompy – niski, wpływ na bezpieczeństwo – żaden, prawdopodobieństwo niskie (większość pomp w połowie resursu remontowego) ogólnie rzecz biorąc ryzyko awarii pompy – bardzo niskie.
Inny przypadek: 1 pompa dedykowana do określonego medium, farmacja – awaria pompy = konieczność rozszczelnienia układu, utrata batch-a, który był produkowany od 2 tygodni, 8h wymiany pompy, dodatkowe koszty o czas mycia, koszt naprawy samej pompy wysoki, prawdopodobieństwo wysokie (resurs remontowy przekroczony miesiąc temu). Ryzyko awarii – bardzo wysokie.
Kiedy widzisz to ryzyko, czyli jesteś świadomy wszystkich czynników wokół, Twoja decyzja o utrzymaniu tych pomp, działaniach prewencyjnych, przydzieleniu budżetu, priorytetach remontowych, częściach zamiennych na magazynie oraz potrzebnych kompetencjach zespołu jest prosta i logiczna. Co gdy, tych informacji nie ma - widzisz 2 pompy i nic poza tym… albo nawet nie wiesz, że masz 2 pompy do utrzymania bo nie ma ich w CMMS?
Obecnie wiele firm ma wdrożone systemy zarządzania ryzykiem na poziomie biznesowym, finansowym, cyberbezpieczeństwa, BHP itd., ale ile z nich pokazuje co faktycznie dzieje się na poziomie majątku technicznego? Jakie ma REALNE przełożenie na to jak majątek jest utrzymywany?
Do czego prowadzi brak informacji na tym poziomie? Oto kilka konsekwencji braku świadomości ryzyk zaczynając od najkrótszego horyzontu czasowego:
Część z Was może pomyśleć, że przecież po to są ludzie z wiedzą, kompetencjami, doświadczeniem. Zgadzam się, ludzie to fundament każdej organizacji. Niestety fundamenty nie są wieczne i z czasem erodują, w przypadku ludzi ta erozja to rotacja, awanse, ograniczona pamięć. Wszystko to sprawia, że ryzyka mogą nie być zarządzane na takim poziomie, jakiego wymaga system techniczny.
Poniżej kilka najbardziej praktycznych narzędzi, źródeł i metod na które warto zwróci uwagę w kontekście zarządzania ryzykiem.
Pierwszym (podstawowym) narzędziem jest tu oczywiście Analiza Krytyczności majątku technicznego – pokazuje ona w uproszczeniu poziom konsekwencji wynikających z awarii poszczególnych urządzeń. AK nie jest wyrocznią, ale rzuca nowe światło na to gdzie z obiektywnego punktu widzenia jest największe ryzyko.
Niestety w wielu przypadkach przeprowadzenie Analizy Krytyczności kończy się umieszczeniem nowego segregatora na półce i wyciąganie go „na audyt” – w takiej sytuacji nie można mówić o zarządzaniu ryzykiem.
Ponieważ o Analizie Krytyczności pisałem już całkiem sporo, nie będę w tym artykule rozwijał tej metody – zapraszam do lektury wcześniejszych artykułów.
Drugie źródło informacji o ryzyku to Twój CMMS/EAM. To stąd czerpiesz dane do raportów, KPIs, podsumowań itp.. Szczególnie warty uwagi w tym przypadku jest Backlog – czyli zestawienie niewykonanych zleceń pracy. Zarówno reakcyjnych (zazwyczaj ryzyka zmaterializowane) jak i prewencyjnych (ryzyka niezmaterializowane). Krótko o tym jak te informacje wykorzystać w praktyce:
Niektórzy z Was mogą stwierdzić, że taka interpretacja jest ogólnikowa i należałoby uwzględnić dodatkowo inne czynniki np. czas od planowanego wykonania – zgoda, wciąż taka interpretacja jest lepsza niż żadna.
Analiza backlogu w powiązaniu z Analizą Krytyczności mogą wskazać na najistotniejsze ryzyka w obecnym zarządzaniu pracą i pomóc w podjęciu decyzji, gdzie zaadresować zasoby.
Innym przykładem wykorzystania danych z CMMS na potrzeby ryzyka są wskaźniki KPI typu LEADING. Typowo przyjęło się koncentrować na wskaźnikach typu LAGGING – czyli takich, które pokazują zarejestrowaną przeszłość np. dostępność techniczna, średni czas naprawy. Wskaźniki typu LEADING bazują na danych z przeszłości, ale pokazują perspektywę przyszłości. Najlepszym przykładem jest chyba % realizacji zaplanowanych prac prewencyjnych – jeżeli wskaźnik ten jest niski lub spada, to można przypuszczać, że ryzyko awarii będzie rosło, a w efekcie spadać będzie dostępność techniczna.
W CMMS/EAM jest o wiele więcej informacji o ryzykach, często zawartych w opisach zleceń pracy, kodach awarii, powtarzalności zdarzeń na poszczególnych urządzeniach lub typach urządzeń, a nawet w zużyciu części zamiennych. Każda z tych informacji to kolejny element Analizy Przyczyny Źródłowej (RCFA), której celem również jest DECYZJA.
Trzecim działaniem dającym istotne informacje o ryzyku eksploatacyjnym jest Ocena Stanu Technicznego. Taka ocena ma na celu zagregowanie informacji o wieku urządzenia, wynikach prowadzonych działań diagnostycznych oraz innych informacji o starzeniu urządzeń lub infrastruktury do jednej kategorii np. I, II, III (podobnie do Analizy Krytyczności). O czym informuje Ocena Stanu Technicznego? Przede wszystkim pokazuje które z urządzeń mają najniższy pozostały potencjał eksploatacyjny, czyli czas pracy. To ułatwia screening urządzeń wymagających inwestycji lub modernizacji, a wraz z Analizą Krytyczności wskazują na ryzyko utraty funkcji, w którym Analiza Krytyczności pokazuje poziom konsekwencji, a Ocena Stanu Technicznego poziom prawdopodobieństwa.
Nie sposób pominąć pełnej Analizy Ryzyka, która polega na identyfikacji ryzyk (zdarzeń niepożądanych), ich ocenie (z wykorzystaniem Macierzy Ryzyka), zaadresowaniem działań mitygujących, a następnie ponownej ocenie ryzyka po mitygacji. Pełna Analiza Ryzyka w obszarze zarządzania majątkiem technicznym zasługuje na oddzielny artykuł (albo całą serię) i nie będę tu jej szczegółowo omawiał.
Warto wspomnieć, że element analizy ryzyka jest zaimplementowany również w wielu innych popularnych i uznanych metodach stosowanych w utrzymaniu ruchu np. RCM (ang. Reliability Centered Maintenance), FRACAS (ang. Failure Reporting and Corrective Action System), RBM/RBI (ang. Risk Based Maintenance/ Risk Based Inspection).
Zarządzanie ryzykiem to nie ma być kolejny raport, model lub standard „od konsultanta na półkę”. Świadomość ryzyka powinna prowadzić do DECYZJI zarówno krótko- jak i długofalowych i tylko wtedy ma to sens.
Oto kilka przykładowych decyzji opartych o ryzyko w firmach, z którymi współpracowałem:
Każdy z powyższych przykładów prowadzi w dłuższej perspektywie do zmniejszenia awaryjności lub ich skutków, ale żaden nie wyeliminuje ich wszystkich. Co więcej w każdym z tych przypadków, w niektórych obszarach awaryjność może wzrosnąć! Jeżeli tak by się stało będzie to wynik świadomych decyzji, a skumulowany efekt powinien być korzystny dla organizacji.
Awaria wynikająca ze świadomych DECYZJI jest lepsza niż awaria wynikająca z ich braku lub nieświadomości.
Jeżeli analiza ryzyka istnieje w Twojej organizacji, ale nie przekłada się na sposób planowania prac i budżetu, to właśnie tam znajduje się największa luka do zamknięcia.
Analiza Krytyczności - Część II: Jak praktycznie przeprowadzić wdrożenie?