Najlepsze praktyki przemysłowe w projektowaniu oprogramowania i w usługach IT

Łasiczka z damą, czyli inny punkt widzenia

Przemysłowe podejścia i techniki organizacji pracy warto zastosować w IT.

Referat przygotowany na konferencję użykowników Oracle.
Prezentacja z tego wykładu znajduje się tutaj.


Najlepsze praktyki przemysłowe w projektowaniu oprogramowania i w usługach IT

Iwona D. Bartczak
Business Dialog

Andrzej Góralczyk
Dyrekcja.pl

Abstrakt. W referacie przedstawiono propozycje zastosowania wybranych najlepszych praktyk przemysłowych do zapewnienia jakości i produktywności w procesach projektowania sotware’u i świadczenia usług IT w przedsiębiorstwach. Sektor IT dopracował się szeregu specyficznych dla siebie rozwiązań w obu omawianych dziedzinach. Mimo to jakość oprogramowania w wielu obszarach zastosowań nadal wzbudza poważne zastrzeżenia użytkowników, a efektywność pracy działów IT w przedsiębiorstwach nadal pozostaje problemem. Wnioski i postulaty podnoszone przez uczestników projektów realizowanych przez Business Dialog i portal Dyrekcja.pl wskazują, że świadomość tych faktów jest powszechna w wśród kadry kierowniczej IT i niekiedy towarzyszy jej poszukiwanie lepszych rozwiązań w obu dziedzinach. Rośnie zainteresowanie najlepszymi praktykami wypracowanymi w przemyśle przetwórczym. Pojawiają się wycinkowe rozwiązania przeniesione wprost z przemysłu, jak np. podział pracy i ról w zespołach programistów, statystyczne sterowanie procesami przez jakość, czy Robust Engineering. Propozycje przedstawione w referacie idą dalej – ujmują te doświadczenia w sposób systematyczny, w ramach filozofii KAIZEN oraz pokazują przykłady przystosowania przemysłowych podejść i technik do zapewnienia jakości w projektowaniu software’u i do organizacji pracy działów IT.

Wprowadzenie

W rozwoju informatyki jako dziedziny działalności gospodarczej coraz wyraźniej widoczne jest poszukiwanie rozwiązań wypracowanych w innych sektorach. Obserwujemy ów trend na co dzień w toku projektów realizowanych z udziałem szefów informatyki przez Business Dialog i portal Dyrekcja.pl. Wśród postulatów podnoszonych przez uczestników tych projektów najwyraźniejsze dotyczą metod zapewnienia jakości oprogramowania oraz przebudowy roli informatyki w przedsiębiorstwach. Być może ważnym źródłem omawianego trendu jest niezadowolenie z poziomu jakości i produktywności osiąganych dotychczas technikami opracowywanymi samodzielnie przez informatyków.

Podobne zjawisko można było obserwować w historii bardziej dojrzałych sektorów, więc można przypuszczać, że dalsza ewolucja sposobów działania informatyki będzie w znacznym stopniu powtórką historii rozwoju przemysłu przetwórczego, najbardziej zaawansowanego pod względem zarządzania i organizacji pracy. Przypuszczenie to stanowi przesłankę zarysowanej poniżej propozycji przeniesienia najlepszych praktyk zarządzania z tradycyjnych dziedzin przemysłu do informatyki.

Inżynieria wartości i punkt widzenia Użytkownika

W tradycyjnych sektorach gospodarki ogólne ramy dla inżynierii projektowania, produkcji i procesów eksploatacji tworzy Inżynieria Wartości, która rozmaitymi metodami i technikami bada i ustala wymagania Klienta i Użytkownika, a następnie przekształca je w produkt – wyrób bądź usługę. Niektóre praktyki w projektowaniu i w obsłudze produktów informatyki mieszczą się w ogólnych ramach Inżynierii Wartości. Można je więc traktować jako punkt wyjścia do systematycznej, krok po kroku implementacji najlepszych praktyk przemysłowych do IT. Poniżej przedstawiamy systematykę podejść i metod Inżynierii Wartości ujętą w taki sposób, aby łatwo było w niej umiejscowić wybrane typowe praktyki projektowania oprogramowania oraz utrzymania infrastruktury informatycznej.

Projektowanie zintegrowane – wyższy stopień rozwoju projektowania równoległego (Concurrent Engineering), w którym poszczególne etapy procesu projektowania nakładają się na siebie i są wykonywane równolegle. Projektowanie zintegrowane jest możliwe pod dwoma warunkami: standard podstawowy produktu musi być dobrze określony (wiadomo co jest rowerem, a co samochodem), a komunikacja z Użytkownikiem i w łonie zespołu tworzącego nowy produkt musi być intensywna, pozbawiona barier.

W informatyce znany jest problem nadmiernie wydłużonego cyklu projektowania wg tradycyjnej metodologii „wodospadu” (waterfall model). Elementy projektowania równoległego pojawiają się w większych projektach budowy software’u, w szczególności w strefie otwartych standardów oprogramowania. Jednakże typowe dla współczesnej inżynierii oprogramowania rozwiązanie problemu wodospadu, mianowicie programowanie iteracyjne (szczupłe i ekstremalne) nie jest rozwiązaniem optymalnym. Zrodziło się zapewne dlatego, że nie są spełnione dwa wspomniane warunki – nie wiadomo do końca, czym jest projektowany produkt, a zespół projektantów pracuje „pod kloszem”. Wykorzystanie najlepszych praktyk projektowania zintegrowanego wymaga rozwiązania tych dwóch problemów.

Analiza wartości – ma na celu określenie minimalnego zestawu wymagań, które powinien spełniać produkt oraz znalezienie optymalnej pod względem ekonomicznym wielkości zasobów niezbędnych dla spełnienia tych wymagań (materiału, pracy, czasu, technologii, wyposażenia itd.). W sektorze informatyki postępuje się odwrotnie, z wiadomymi skutkami. Ocenia się na przykład, że aplikacje dla biznesu średnio mają 40% nadmiaru funkcjonalności, nigdy nie wykorzystywanego przez Użytkownika i są nadmiernie złożone jak na jego wymagania. Rozmiary infrastruktury także są zbyt wielkie na każdym szczeblu, od pojedynczego stanowiska pracy po wielkie systemy, a przez to jest ona nadmiernie kosztowna w całym jej cyklu życia. Przed informatyką stoi wyzwanie – rewolucja mentalna umożliwiająca uznanie punktu widzenia Klienta i Użytkownika jako JEDYNEJ podstawy dla definicji produktu i jego jakości.

Ekonomika cyklu życia produktu – odgrywa zasadniczą rolę w organizacji procesów projektowania, eksploatacji i wymiany produktu. W typowych przypadkach ok. 70% kosztów cyklu życia wyrobów takich, jak maszyny i urządzenia określanych jest na etapie projektowania. Należy przypuszczać, że podobnie jest z oprogramowaniem dla biznesu. Wśród najlepszych praktyk projektowania zapewniających ekonomiczność cyklu życia jest zasada formułowania założeń „od tyłu”: najpierw założenia dotyczące sposobu zakończenia okresu eksploatacji, następnie kolejno założenia określające plany obsługi (utrzymania infrastruktury), założenia użytkowe, założenia dotyczące rozruchu (uruchomienia eksploatacji), założenia określające sposób produkcji wyrobu i wreszcie założenia dotyczące organizacji procesów przedprodukcyjnych (produkcja próbna, testowanie, wykonanie prototypów). W metodologii projektowania software’u istnieją zaczątki podobnego podejścia, np. tzw. projektowanie kierowane testowaniem. Wydaje się zatem, że pełne wprowadzenie omawianej zasady dałoby się wprowadzić bez większych trudności.

„Druga noga” ekonomiki cyklu życia to organizacja utrzymania infrastruktury. Trzeba powiedzieć, że najlepsze plany obsługi, takie jak utrzymanie prewencyjne (zapobiegawcze) oraz produktywne (nastawione na maksimum efektu ekonomicznego w cyklu życia) należą do rzadkości zarówno w odniesieniu do wyposażenia tradycyjnego, jak i informatycznego. Jednakże w obszarze tradycyjnym najlepsze praktyki są kompletnymi systemami utrzymania i kompletnymi metodologiami, gotowymi do wykorzystania. Wykorzystanie ich wymaga m. in. modyfikacji miernika, jakim jest poziom obsługi (service level) oraz podejść do organizacji pracy działów IT uwarunkowanych wymogiem maksymalizacji tego wskaźnika.

Sterowanie przez jakość – według najlepszych praktyk jakość jest określana WYŁĄCZNIE przez Klienta, ale klientem jest zarówno Użytkownik urządzenia w firmie, jak i właściciel biznesu. Użytkownik wymaga określonego minimalnego, ale niezbędnego zestawu funkcji i cech produktu, a właściciel wymaga określonej progowej ekonomiczności procesów, w których system służy jako narzędzie. W ten sposób zostają określone granice, w których muszą mieścić się parametry rezultatu procesu. U podstaw sterowania przez jakość leży zasada, że utrzymanie rezultatu procesu w określonych granicach dokonuje się poprzez doskonalenie procesu, a nie np. poprzez selekcję rezultatów dobrych i odrzucanie niedobrych. Z drugiej strony wiadomo, że najlepszą strategią sterowania procesem jest redukowanie jego wariancji. W tradycyjnym przemyśle istnieją metodologie sterowania przez jakość właściwie każdym procesem.

W odniesieniu do procesów projektowania najbardziej rozpowszechnione metodologie to projektowanie eksperymentalne i projektowanie solidne (Robust Engineering). Znane są próby zastosowania obu metodologii do projektowania software’u, lecz doświadczenia te są fragmentaryczne i nie zostały upowszechnione.

W odniesieniu do procesów eksploatacji i obsługi stosowanych jest kilka metodologii sterowania przez jakość, z których najbardziej znane to SPC czyli Statystyczne Sterowanie Procesami oraz Sześć Sigma. Elementy obu podejść sprawdzają się ze znakomitymi wynikami w projektowaniu wielkich systemów informatycznych i aplikacji krytycznych w sektorze kosmicznym i obronnym i warte są upowszechnienia.

Inżynieria procesów – w jej ramach dwie metodologie nadają się do implementacji w ulepszaniu procesów projektowania i eksploatacji wyrobów i usług informatycznych – te same, które najpowszechniej stosowane są w przemyśle przetwórczym. Praktyczna Inżynieria Przemysłowa to metodologia ulepszania dokonywanego na niskich szczeblach organizacyjnych, najczęściej na szczeblu zespołu. Natomiast BPI czyli Przeprojektowanie Procesów Biznesowych, które można nazwać „łagodnym reengineeringiem” organizowane jest zazwyczaj i zarządzane ze szczebla przedsiębiorstwa.

Elementy pierwszej ze wspomnianych metodologii zaczynają pojawiać się w dziedzinie projektowania software’u w postaci podziału pracy pomiędzy osoby pełniące różne role w tym procesie np. analityka/architekta biznesowego, architekta systemów i aplikacji, programistów i testerów. Najlepsze praktyki przemysłowe nasuwają przypuszczenie, że właściwym kierunkiem ewolucji tego podziału pracy będzie łączenie dwóch pierwszych ról, jednakże dopiero wtedy, gdy pojawią się specjaliści o wysokich kompetencjach zarówno w dziedzinie użytkowania, jak i projektowania architektury produktów informatycznych.

Z punktu widzenia inżynierii procesów dziedzina utrzymania infrastruktury IT w przedsiębiorstwach wydaje się najbardziej zaniedbana, mimo upowszechniania najlepszych praktyk w rodzaju ITIL. Wydaje się, że u źródła tej słabości leży niedostateczne jeszcze rozumienie tych procesów biznesowych z punktu widzenia Klienta oraz zignorowanie najlepszych praktyk przemysłowych na rzecz podejść i technik wywodzących się z samej IT.

Podsumowując ten punkt można stwierdzić, że w zarządzaniu informatyką nieobecne są do tej pory zagadnienia ciągłości i płynności procesów, dystrybucji pracy, zdolności procesów itd.

KAIZEN sposobem na uprzemysłowienie informatyki

KAIZEN jest ogólną metodologią przejścia danej dziedziny gospodarki z rzemieślniczego do przemysłowego stadium rozwoju. Wiadomo, że zmiana o tak szerokim i głębokim zasięgu nie może dokonać się z dnia na dzień, wymaga nie tylko czasu, ale także systematycznego podejścia. Wśród wielu sprawdzonych w praktyce zalet KAIZEN jest to, że początek tej przemiany dokonywany jest z zastosowaniem technik organizatorskich wywodzących się z rzemiosła, które stopniowo uzupełniane są technikami profesjonalnej inżynierii i organizacji pracy.

Cele dalekosiężne programu KAIZEN dla IT mogą i chyba powinny być te same, co w przemyśle przetwórczym – rozwój ludzi, osiągnięcie radykalnej poprawy jakości produktów informatycznych i kilkunastokrotny wzrost produktywności w sektorze.

——–

Prezentacja z tego wykładu

——–

Patrz także KAIZEN dla IT

——–

Analiza ABC i zasada Pareto

Analiza ABC należy do najprostszych metod wyznaczania priorytetów dla programów usprawnień i ulepszeń.

W analizie ABC wykorzystuje się tzw. prawo Pareto (zasada Pareto, prawo 80/20, prawo 80-20, ang. Pareto Principle, Pareto Rule, The Law of Vital Few and Trivial Many – Prawo żywotnej mniejszości i błahej większości), mówiące że w wielu sytuacjach konkretnych 80% konsekwencji wypływa z 20% przyczyn. Wyrażenie „w wielu sytuacjach konkretnych” oznacza, że jest to prawo empiryczne. Zachodzi ono m. in. w wielu sytuacjach istotnych z punktu widzenia zarządzania, np.:

  • podjęcie na naradzie ok. 80% decyzji zajmuje 20% czasu narady,
  • ok. 80% defektów wynika z 20% przyczyn,
  • ok. 80% sprzedaży realizowanych jest przez 20% sprzedawców,
  • ok. 20% gospodarstw domowych w danym kraju posiada 80% majątku (przypadek opisany przez Vilfredo Pareto, stąd właśnie nazwa omawianej zasady),
  • ok. 20% klientów przynosi 80% przychodów ze sprzedaży,
  • w ok. 20% (grup) pozycji magazynowych zamrożonych jest 80% wartości zapasów…

Z powyższego wynika ogólna zasada, zgodnie z którą osiąganie określonych efektów będzie najbardziej ekonomiczne wtedy, gdy zajmiemy się tylko przyczynami powodującymi największy efekt, nie tracąc czasu, pieniędzy i wysiłku na błahostki.

Nazwa techniki:

Analiza ABC, analiza Pareto, metoda Pareto, metoda 80/20, metoda 20/80 (nieprawidłowa nazwa występująca w Polsce).

Opis postępowania

’1. Na podstawie zebranych danych sporządzić wykres Pareto
’2a. W przypadku dużej liczby kategorii i dużej liczby danych poprowadzić 2 poziome linie od prawej osi wykresu: jedną na wysokości 80%, drugą na wysokości 95%. Oznaczyć na wykresie 3 obszary (patrz Rys 1):

  • Obszar A – wszystkie kategorie, dla których wykres kumulowany mieści się pod linią 80%,
  • Obszar B – przylegający do obszaru A, a kończący się na kategorii leżącej bezpośrednio pod linią 95%,
  • Obszar C – obejmujący pozostałe kategorie.

’2b. W przypadku niewielkiej liczby kategorii i niewielkiej liczby danych (tak jest w wielu przypadkach w praktyce produkcyjnej) wystarczy ograniczyć analizę do obszaru A (patrz Rys. 2).

’3. Wyznaczyć cele programu poprawy, uwzględniając priorytety ujawnione w toku opisanej analizy. Oszacować możliwe do osiągnięcia rezultaty.

Na przykład wykres na Rys. 2 dotyczy reklamacji składanych przez nabywców wentylatora stołowego. Jeśli uznamy, że możliwe jest całkowite wyeliminowanie błędu polegającego na obróceniu tylnej części obudowy (typowe zagadnienie dla rozwiązania poka-yoke) oraz całkowite wyeliminowanie hałaśliwości (dokładniejszy montaż osłony wiatraka) to możemy się spodziewać, że liczba reklamacji obniży się o ok. 80%.

Rys. 1

Analiza ABC

Analiza ABC

Pokazana na rysunku analiza dotyczy tych samych danych, na podstawie których sporządzono wykres przedstawiony na Rys. 3 w artykule Rozkłady potęgowe i diagram Pareto.

Rys. 2

Analiza ABC w prostym przypadku.

Analiza ABC w prostym przypadku.

Powyższy wykres sporządzono na podstawie danych zamieszczonych w tabeli w artykule Rozkłady potęgowe i diagram Pareto.

UWAGI

  1. Sporządzając diagram Pareto należy stosować się do uwag zamieszczonych w artykule Rozkłady potęgowe i diagram Pareto.
  2. W praktyce często stosuje się analizę ABC razem z burzą mózgów i wykresem Ishikawy, w obu możliwych kolejnościach.

Zastosowania:

Wyznaczanie priorytetów.

Wykres Ishikawy w kilku odmianach.

Nazwa techniki:

Wykres Ishikawy

Inne nazwy:

Wykres przyczyn i skutków, wykres rybiej ości, rybia ość, ang. Ishikawa diagram, cause and effect diagram, fishbone, fishbone diagram

Opis postępowania

a) Jasno zdefiniuj problem, symptom albo skutek, którego przyczyny chcesz zbadać

b) Na arkuszu papieru blisko prawej krawędzi pośrodku wysokości napisz słowo oznaczające w/w problem i zamknij je w ramkę. Od lewej krawędzi arkusza poprowadź poziomą strzałkę do tej ramki (patrz rysunki poniżej)

c) Zależnie od specyfiki zadania i warunków postępuj według jednej z poniższych odmian postępowania

Odmiana 1 – Wykres Ishikawy ze wstępną klasyfikacją przyczyn

Opis postępowania

1) Zbierz niewielką grupę pracowników i wyjaśnij im, że zadaniem grupy będzie znalezienie przyczyn tego a tego problemu

2) Zaproponuj wstępną klasyfikację przyczyn

3) Zastosuj techniki Pięć razy Dlaczego oraz Burza mózgów, aby grupa określiła typowe przyczyny (ang. common causes) albo główne przyczyny (ang. root causes) problemu. Kolejne odpowiedzi na to pytanie oznacz kolejnymi strzałkami (na rysunku poniżej są to strzałki coraz cieńsze) i opisz.

Ilustracja

Rys. 1. Wykres Ishikawy ze wstępną klasyfikacją przyczyn.

Rys. 1. Wykres Ishikawy ze wstępną klasyfikacją przyczyn.

Odmiana 2 – Wykres Ishikawy bez wstępnej klasyfikacji przyczyn

Opis postępowania

1) Zbierz niewielką grupę pracowników i wyjaśnij im, że zadaniem grupy będzie znalezienie przyczyn tego a tego problemu

2) Przeprowadź z grupą sesję burzy mózgów, aby grupa „wygenerowała” jak największą liczbę możliwych przyczyn problemu

3) Wspólnie z grupą dokonaj klasyfikacji przyczyn w taki sposób, aby kolejne odpowiedzi na pytanie „Dlaczego?” można było uporządkować według 2-6 głównych przyczyn (patrz rysunek poniżej z przykładem).

Ilustracja

Rys. 2. Wykres Ishikawy bez wstępnej klasyfikacji przyczyn - przykład.

Rys. 2. Wykres Ishikawy bez wstępnej klasyfikacji przyczyn - przykład.

UWAGI

  1. Na rysunku 1. Pokazano najczęściej stosowaną wstępną klasyfikację przyczyn, tzw. 4M (od angielskiego Man, Machine, Material, Method albo Management). Zależnie od dziedziny, w której występuje problem stosuje się czasem inne wstępne kalsyfikacje, np.
    • tzw. 4P – People, Places, Policies, Procedures, czyli ludzie, miejsca, polityka (np. polityka jakości), procedury
    • tzw. 3S – Skills, Systems, Suppliers, czyli umiejętności, systemy, dostawcy
  2. Niektórzy praktycy twierdzą, że przy pomocy techniki w odmianie 1 nie szukają tzw. zwykłych przyczyn, lecz tzw. specjalnych przyczyn (ang. special causes) problemów. Z powodów metodologicznych nie wydaje się to prawdopodobne, natomiast autorowi znana jest firma polska, w której do tego celu zastosowano z sukcesem drugą odmianę wykresu Ishikawy.
  3. W toku stosowania drugiej odmiany techniki może się zdarzyć, ze grupa wygeneruje bardzo dużą liczbę przyczyn. Wówczas dla ułatwienia ich klasyfikacji standardowo stosuje się diagram powinowactwa (ang. affinity diagram)

Zastosowania:

Zadanie: Analiza przyczyn problemów, w przypadku, gdy problem pojawia się często.

Zadanie: Analiza przyczyn odchyleń w procesie, w przypadku, gdy odchylenie danego rodzaju pojawia się często.

(to samo zadanie, lecz sformułowane w języku potocznym oraz w terminach TQC)

Diagram afiniczny

Diagram afiniczny znajduje zastosowanie najczęściej w trzech sytuacjach: gdy mamy do uporządkowania wielką liczbę zagadnień, gdy trafiamy na problem słabo rozpoznany, niejasny bądź kontrowersyjny oraz gdy potrzebne jest kreatywne myślenie.

Nazwy techniki:

Diagram afiniczny, Diagram powinowactwa, tablica afiniczna, metoda JK (od nazwiska twórcy – japońskiego antropologa Jiro Kawakita), ang. affinity diagram.

Opis postępowania

  1. Burza Mózgów – jej celem jest wygenerowanie jak największej ilości pomysłów,
  2. Każdy pomysł należy zapisać osobnej kartce; wygodnie jest użyć dużych karteczek post-it. Następnie wyeksponować je wszystkie, np. umieszczając na tablicy,
  3. Zadaniem uczestników sesji jest pogrupowanie kartek w grupy zagadnień powiązanych,
  4. Sporządzenie kartek z nagłówkami; nagłówek to tytuł grupy powiązanych zagadnień; jako nagłówka można użyć kartki już istniejącej, bądź sporządzić nową kartkę;
  5. Wykończenie diagramu – umieszczenie grup tematycznych pod kartkami z nagłówkami; jeśli uczestnicy zauważą jakieś powiązania pomiędzy dwiema grupami, to niech umieszczą je po sąsiedzku, a nad ich nagłówkami umieszczą „nad-nagłówek”.

Ilustracje

Nadnagłówek
Nagłówek
Nagłówek
Etykieta
Etykieta
Etykieta
Etykieta
Nadnagłówek
Nagłówek
Nagłówek
Etykieta
Etykieta
Etykieta
Etykieta

Układ graficzny diagramu afinicznego

Sprządzanie diagramu powinowactwa. Fot. nashih, CC Attribution, Noncommercial, No Derivatives License.

Sprządzanie diagramu powinowactwa. Fot. nashih, CC Attribution, Noncommercial, No Derivatives License.

Gotowy diagram powinowactwa. Fot. Sean Munson, CC Attribution, Noncommercial, No Derivatives License.

Gotowy diagram powinowactwa. Fot. Sean Munson, CC Attribution, Noncommercial, No Derivatives License.

UWAGI

  1. Jeśli pomysłów jest mniej, niż 15, nie ma potrzeby stosowania diagramu afinicznego do ich porządkowania.
  2. Technika ma zastosowanie do porządkowania dużych zbiorów zagadnień, zwłaszcza w sytuacjach, gdy problematyka jest niejasna bądź zagmatwana, a także wtedy, gdy są duże różnice zdań, opinii i punktów widzenia. Drugie ważne zastosowanie: gdy potrzebne są oryginalne pomysły, więc dobrze jest zachęcić uczestników do myślenia kreatywnego.
  3. Najlepsze wyniki uzyskuje się, gdy:
  • w sesji bierze udział 5-8 osób,
  • praca przebiega w ciszy,
  • praca przebiega szybko, a uczestnicy są zachęceni do opierania się na pierwszych skojarzeniach, a nie na namyśle, gdy niewiele się zastanawiają,
  • osoba prowadząca zachęca, aby uczestnik nie zajmował się wieloma zagadnieniami na raz, lecz raczej tylko jedną kartką w jednym ruchu,
  • osoba prowadząca sesję pilnuje, aby żaden z uczestników nie narzucał innym własnego zdania;
  • w przypadku różnicy zdań należy:
    • doprowadzić do dyskusji, ponieważ często okazuje się, że osoba protestująca po prostu chce dopisać nowe zagadnienie,
    • albo zachęcić uczestników do sporządzenia duplikatu kartek i drugiego diagramu.

—-

Rozkłady potęgowe i diagram Pareto

Rozkłady potęgowe odgrywają coraz większą rolę w strategiach biznesu. Rozkład Pareto to jedna z klasycznych odmian rozkładu potęgowego o wielorakich zastosowaniach.

Prawa potęgowe

W wielu dziedzinach praktycznych obserwuje się, że zależność pomiędzy dwiema wielkościami empirycznymi spełnia tzw. prawo potęgowe, tzn. że przyjmuje postać:

Y=x w

Prostym „szkolnym” przykładem tej zależności jest funkcja kwadratowa (w=2), ale w ekonomii i zarządzaniu szczególne znaczenie mają prawa potęgowe z wykładnikiem ujemnym (funkcje malejące), dotyczące wielkości opisujących rozmiar bądź skalę zjawisk.

Rys. 1

Wykres funkcji potęgowej w przypadku praw potęgowych z wykładnikiem ujemnym

Wykres funkcji potęgowej w przypadku praw potęgowych z wykładnikiem ujemnym

Na Rys. 1 pokazany jest wykres funkcji potęgowej o różnych wykładnikach ujemnych. Jeśli taka funkcja opisuje (w przybliżeniu) rozkład wielkości empirycznych (obserwowanych), to wiadomo, że istotne własności tego rozkładu zależą od wartości wykładnika. Na przykład:

  • rozkład odpowiadający w przybliżeniu wykresowi narysowanemu białą linią posiada wartość oczekiwaną i wariancję,
  • rozkład odpowiadający w przybliżeniu wykresowi narysowanemu niebieską linią posiada wariancję, ale jego wartość oczekiwana jest nieskończona,
  • dla rozkładu odpowiadającego w przybliżeniu wykresowi narysowanemu różową linią zarówno wartość oczekiwana, jak i wariancja są nieskończone.

Dwa najbardziej znane — można powiedzieć historyczne — przykłady praw potęgowych to prawo Zipfa i rozkład Pareto.

Prawo Zipfa odnosi się do rankingów. Najczęściej chodzi o obiekty uporządkowane w szereg, zaczynając od obiektu posiadającego badaną cechę w najwyższym stopniu a kończąc na obiekcie posiadającym ją w stopniu najniższym. Taki szereg spełnia prawo Zipfa, jeśli

Y[R=r] ∼ (r/rmin)-a,

gdzie r jest pozycją obiektu w rankingu, a rmin jest minimalną obserwowaną pozycją w rankingu (na osi X).

Przykład 1
Jeszcze kilkanaście lat temu można było zaobserwować prawie idealne spełnianie prawa Zipfa przez przedsiębiorstwa o różnych przychodach. Na przykład jeśli pierwsze w rankingu przedsiębiorstwo na danym terenie miało przychody roczne 1 mln jednostek pieniężnych, a drugie w rankingu 0,4 mln, to czwarte miało 0,16 mln, ósme 0,064 mln itd.
Przykład 2
Umówmy się, że różowa linia na Rys. 1 ilustruje liczbę wizyt na witrynach internetowych w określonym obszarze Internetu w określonym czasie. Wykres ten zaczyna się od X=5 (czego nie widać z powodu dużej rozpiętości skali), więc można go odczytać następująco: piąta w rankingu witryna odnotowuje — powiedzmy — 100.000 wizyt w rozpatrywanym okresie, dwusetna ok. 40.000 wizyt, sześćsetna ok 30.000 wizyt itd.

Prawa potęgowe odnoszą się m. in. do sieci takich jak Internet oraz do ich podzbiorów (np. tzw. blogsfera), sieci społecznych (np. kliki, sieci organizacji terrorystycznych), sieci energetycznych i wielu innych. Sieci odgrywają coraz większą rolę w biznesie (np. e-commerce, sieci reasekuracji w sektorze ubezpieczeń) i w dziedzinie bezpieczeństwa. Dlatego rośnie znaczenie technik analitycznych wykorzystujących prawa potęgowe.

REGUŁA 1: Analiza danych z zastosowaniem prawa potęgowego nie może pomijać ŻADNEGO obiektu z wybranego stratum w sposób arbitralny.

Reguła ta wynika z własności rozkładu potęgowego – jeśli pominiemy jakieś obiekty w sposób arbitralny, pozostałe nie spełnią prawa potęgowego mimo, że dla kompletnego zbioru ono zachodzi.

Jeśli obiektów jest bardzo dużo, a interesuje nas tylko wykładnik potęgi, można użyć części danych, ale nie wolno wybierać ich w sposób arbitralny, lecz losowo (np. losując 10% próby). Można także pominąć obiekty z „ogona” rozkładu, ale należy przy tym uważać, aby uwzględnione zostały wszystkie obiekty do granicy takiego obcięcia.

Często można spotkać analizy błędne dlatego, że pominięto obiekty o największym nasileniu rozpatrywanej cechy (ulegając złudzeniu, że są one „inne”, „wyjątkowe”). W Przykładzie 2 nie uwzględniono pierwszych 4 obiektów w sposób jawny, lecz nie jest to błąd, ponieważ uwzględniono je w sposób pośredni odnotowując, że pierwszym obiektem w szeregu jest obiekt o rankingu 5. W sposób formalny zostało to ujęte w zapisie funkcji (X/5). W przypadku ogólnym zapis rozkładu potęgowego przyjmuje analogiczną postać:

P[X=x] ∼ (x/xmin)-b,

gdzie xmin jest minimalną obserwowaną wartością (na osi X). Uzyskujemy przy okazji „zaczepienie” rozkładów z różnymi wykładnikami w jednym punkcie (Y=1 na Rys. 1), które ułatwia wizualne porównywanie kształtu rozkładów.

Rozkład Pareto jest rozkładem statystycznym (rozkładem zmiennej losowej) w ścisłym znaczeniu. Można go zapisać powyższą formułą. W pełnym formalnym ujęciu postawienie znaku równości prawej i lewej strony wymaga ustalenia dodatkowych parametrów, w praktyce trudnych do interpretacji, więc dla uproszczenia poniższego wykresu przyjęto, że razem dają one współczynnik = 1.

Rys. 2

Wykres rozkładu Pereto

Wykres rozkładu Pereto

Przykład 3
Dla zagadnienia podobnego do tego opisanego w przykładzie 1 rozkład Pareto różni się od prawa Zipfa tylko tym, że zmienne są zamienione miejscami. Zatem powyższy wykres można czytać jak następuje: Na danym terenie 100 tys. gospodarstw domowych mieści się w najniższej, pierwszej kategorii dochodów, ok. 10 tys. gospodarstw mieści się w kategorii dochodów 7 razy wyższych, a 5 tys. gospodarstw osiąga dochody 11-12 razy wyższe.

Diagram Pareto

UWAGA: w zastosowaniu do zagadnień menedżerskich (gł. zarządzania przez jakość) nazwa diagram Pareto (wykres Pareto) jest używana zarówno w przypadkach podpadających pod prawo Zipfa, jak i w przypadkach podpadających pod rozkład Pareto.

Diagram Pareto przedstawia dwa wykresy zbudowane na tym samym zbiorze kategorii. Jeden wykres to uszeregowane w porządku malejącym liczebności WSZYSTKICH odnotowanych przypadków, a drugi wykres to te same liczebności, lecz skumulowane.

W zastosowaniu do zagadnień zarządzania przez jakość będą to najczęściej kategorie przyczyn powodujących defekty zaliczone do jednego „programu” (patrz Stratyfikacja danych w sterowaniu przez jakość – przykłady ).

Rys. 3

Diagram Pareto - przykład

Diagram Pareto - przykład

Zazwyczaj na diagramie Pareto umieszcza się drugą, pomocniczą oś Y ze skalą procentową, przydatną do dalszych analiz. Na Rys. 3 ta dodatkowa oś, narysowana kolorem brązowym, mieści się po prawej stronie wykresu.

Sporządzanie wykresu Pareto

Nazwa techniki:

Diagram Pareto, wykres Pareto, metoda Pareto

Opis postępowania

  1. Zebrać dane o WSZYTSKICH obserwowanych przypadkach. Zsumować liczebności przypadków zaliczonych do poszczególnych kategorii. Przypadki nie dające się zakwalifikować do żadnej z proponowanych kategorii należy zakwalifikować do kategorii „inne” („pozostałe”)
  2. Uporządkować dane od największej do najmniejszej liczebności.
  3. Umieścić dane w tabeli, podobnej do poniższego przykładu. W trzeciej kolumnie zamieścić obliczone liczebności skumulowane.
    Nr Kategoria defektu Liczba defektów Kumulowana
    1 Obrócenie 22 22
    2 Hałas 10 32
    3 Pęknięcie 4 36
    4 Nacisk 2 38
    5 Resztki 1 39
    6 Obudowa 1 40
    7 Inne 4 44
  4. Z trzech ostatnich kolumn tabeli utworzyć wykres: słupkowy z danych w drugiej kolumnie i liniowy z danych w trzeciej kolumnie (odpowiednie opcje są dostępne w każdym popularnym arkuszu kalkulacyjnym).

UWAGI

  1. Jeśli danych i kategorii jest zbyt dużo, może się zdarzyć, że słupki nie ułożą się regularnie w sposób podobny, jak na wykresie rozkładu Pareto, lecz wystąpią „schodki” (uskoki). Zazwyczaj wskazuje to, że nie dokonano uprzednio właściwej stratyfikacji (UWAGA – stratyfikacja nie pokrywa się z owymi uskokami!).
  2. Jeśli kategorii jest zbyt mało, trudno będzie wyciągać właściwie wnioski co do priorytetów w działaniach usprawniających bądź korygujących. Ponadto na wykresie słupek dla kategorii „inne” może być zbyt wysoki.
  3. Jeśli danych jest zbyt mało, słupki będą miały podobną wysokość i trudno będzie wyciągać właściwie wnioski co do priorytetów w działaniach usprawniających bądź korygujących.

Przykład niewłaściwie zastosowanego wykresu Pareto: W artykule Arkusz zbiorczy – stratyfikacja danych do analizy danych zastosowano arkusz zbiorczy. Wykres Pareto jest nieprzydatny do analizy tych danych, co ilustruje poniższy rysunek.

Rys. 3

Niewłaściwy wykres Pareto.

Niewłaściwy wykres Pareto.


Arkusz zbiorczy – stratyfikacja danych

Arkusz zbiorczy, czyli tzw. zbiorówka, ma wielorakie zastosowania w Statystycznym Sterowaniu Procesami (SPC). Służy do porządkowania zbioru danych, ale przede wszystkim do ograniczenia pola poszukiwań przyczyn problemów.

Nazwa techniki:

Arkusz zbiorczy

Opis postępowania

A. Sporządzanie arkusza

  1. Zbierz dokumentację zawierającą dane o badanym zjawisku z wybranego okresu.
  2. Sprawdź w dokumentacji, jakimi kryteriami jest opisane badane zjawisko. Sporządź listę tych kryteriów.
  3. Wybierz dwa kryteria, które według Twoich przypuszczeń mogą chwytać różnice w przebiegu zjawiska, jego charakterze bądź efektach.
    Przykłady: – reklamacje według przyczyn (pierwsze kryterium) i według regionu (drugie kryterium); – przestoje maszyny według długości przestoju (pierwsze kryterium – np. przestoje krótkie, średnie i długie) i według zmiany, na której przestój wystąpił
  4. Sporządź czytelny arkusz – tabelę, w której główka opisuje kategorie jednego kryterium, a boczek opisuje kategorie drugiego kryterium (patrz przykład na rysunku poniżej).
  5. Przeglądając dokument po dokumencie stawiaj ołówkiem w kreski w polach tabeli odpowiadających obu kryteriom (jak na przykładowym rysunku poniżej).

B. Analiza danych na arkuszu

  1. Starając się ogarnąć spojrzeniem cały wypełniony arkusz poszukaj miejsc, w których jest najwięcej postawionych kresek.
  2. Dodatkowo: Sporządź kserokopię wypełnionego arkusza. Rozetnij arkusz na pojedyncze kolumny i przestawiaj je tak, aby uzyskać skupisko szczególnie wielu kresek w jednym albo dwóch rejonach tabeli. Podobnie postąp z drugą kserokopią, ale rozcinając ją na wiersze i przestawiając wiersze.
  3. Dodatkowo: Jeśli w poprzednim kroku stwierdzasz występowanie skupisk szczególnie wielu kresek w tabeli z poprzestawianymi np. wierszami, sporządź kserokopię tej poprzestawianej tabeli i rozetnij ją na kolumny. Przestawiając kolumny szukaj takiego układu tabeli, w którym skupiska szczególnie wielu kresek są najlepiej widoczne – taka właśnie tabela jest pożądanym wynikiem Twojej pracy.

C. Wnioskowanie

  1. Skupiska szczególnie wielu kresek w tabeli wskazują, na których obszarach należy się skoncentrować poszukując przyczyn zjawiska.

Ilustracja

Przkładowy arkusz zbiorczy przyczyn wszystkich reklamacji dostaw pewnego produktu.

Przkładowy arkusz zbiorczy przyczyn wszystkich reklamacji dostaw pewnego produktu.

UWAGI

  1. Jeśli analiza nie daje wyraźnych rezultatów, należy dobrać inną parę kryteriów.
  2. Czasem arkusz zbiorczy może nie sprawdzać się w praktyce. Oto typowe tego przyczyny:
    • cele analizy są zbyt nieokreślone,
    • nie uwzględniono wszystkich danych,
    • pominięto jakieś kryteria albo dokumentacja nie obejmuje istotnych kryteriów,
    • w przypadku notowania danych z obserwacji na miejscu: obserwator nie nadąża z notowaniem,
    • w przypadku notowania danych przez wielu obserwatorów: różne osoby w odmienny sposób interpretują bądź notują swoje obserwacje,
    • nie przerowadzono pełnej analizy, gdyż np. zbyt wiele czasu i wysiłku pochłonęło zestawianie danych surowych, sporządzenie arkusza itp.
  3. Nietrudno zauważyć, że dobrze sporządzona ostateczna tabela zbiorówki powinna dawać bezpośrednio materiał do prostego testu statystycznego, np. chi-kwardat.

Pomiar doskonałości procesu – wykres kontrolny x-R

Granice na wykresie kontrolnym x-R są ustawione w taki sposób, aby wychwytywały szczególne przyczyny (special causes) niestabilności procesu.

UWAGA: nad literką x powinna znajdować się pozioma kreseczka oznaczająca, że chodzi o wartości średnie.

Wykres z granicami kontrolnymi, służący do detekcji niestabilności procesu, jest pomysłem Waltera Shewhart’a. W klasycznej kontroli jakości procesu jednak na ogół granice kontrolne określa się jako wielokrotność (najczęściej trzykrotność) odchylenia standardowego wyników mierzonych na wyjściu procesu. Genichi Taguchi natomiast zaproponował, aby granice te określać jako trzykrotność sigma, czyli odchylenia standardowego wyników pogrupowanych. W ten sposób, jego zdaniem, wykres kontrolny staje się czuły na przyczyny szczególne (special causes) niestabilności procesu, a jednocześnie nie daje zbyt często powodów do fałszywego alarmu, ponieważ nie jest nadmiernie czuły na wahania wyniku spowodowane przyczynami zwykłymi (common causes).

Zakładanie monitoringu procesu przy pomocy wykresu x-R

Wszystkie decyzje dotyczące polityki doskonałości procesu, a więc dotyczące liczebności grup, położenia granic kontrolnych, częstotliwości pomiarów, obliczeń i nanoszenia punktów na wykres, a także sposobów interpretacji wykresu podejmuje się na podstawie eksperymentów z pomiarami próbnymi. Wskazówki na ten temat znajdują się w zeszycie arkuszy kalkulacyjnych, który można ściągnąć stąd oraz z odnośnika w dziale Narzędzia naszej biblioteki.

UWAGA: plik jest spory, ma 523.264 bajty.

Sposób korzystania z wykresu x-R

Monitorowanie doskonałości (stabilności) procesu wg metody Taguchi’ego wymaga pomiaru wyników procesu zgrupowanych najczęściej po 2,3,4,5 albo 6. Średnią arytmetyczną dla grupy nanosimy na górną część wykresu (X), a rozstęp, czyli różnicę pomiędzy największym i najmniejszym wynikiem w grupie nanosimy na dolną część wykresu (R). Każdy z tych wykresów ma „skalę”, na którą składa się:

  • linia środkowa, reprezentująca średni wynik („cel”), na który został nastawiony proces;
  • granice kontrolne górna i dolna, leżące w odległości 3 sigma od linii środkowej.

A oto przykładowy wykres x-R:

Ilustracja

Przykładowy wykres xR

Przykładowy wykres xR

Obserwujemy, w jaki sposób zachowują się punkty na obu wykresach: czy mieszczą się pomiędzy granicami kontrolnymi, czy układają się po obu stronach linii środkowej oraz – generalnie – czy nie wykazują jakichś regularności. Regularności są bowiem przejawem różnego rodzaju niestabilności procesu.

Co znajduje się na arkuszach

Zeszyt Excela zawiera:

  • 3 arkusze, służące jako praktyczne wprowadzenie w koncepcję Taguchi’ego oraz jako narzędzie do obliczeń niezbędnych w podejmowaniu decyzji o polityce jakości procesu,
  • tablicę współczynników pomocną do obliczeń przy opracowaniu wyników eksperymentów na etapie opracowania polityki,
  • arkusz do nanoszenia wyników, który przeprowadza niezbędne obliczenia i wykreśla wykres,
  • wyjaśnienia i instrukcje.

UWAGA: plik jest spory, ma 523.264 bajty.

Stratyfikacja danych w Kompleksowym Sterowaniu przez Jakość – przykłady

Analizę Pareto należy poprzedzać albo prowadzić łącznie ze stratyfikacją danych.

Zalecenie powyższe można spotkać czasem w podręcznikach SPC (Statystycznego Sterowania Procesami), lecz rzadko wyjaśnia się w nich przesłanki tego zalecenia. W niniejszym artykule spróbuję wyjaśnić to w możliwie najprostszy sposób, na przykładach.

Przykład 1.

Weźmy defekty rejestrowane na zmechanizowanych i zautomatyzowanych liniach pakujących. Jeśli szeregujemy według przyczyn ich względną częstość, od największej do najmniejszej, możemy zilustrować wykresem słupkowym, który — jak nietrudno zgadnąć — ma charakterystyczny kształt wykresu Pareto.

Powiedzmy, że początkowo nasza analiza obejmuje wszystkie defekty zarejestrowane w ciągu miesiąca, a najczęściej występujące defekty to brak nadruku daty bądź barkodu oraz nierówno przyklejone etykiety. To stwierdzenie może stanowić punkt wyjścia do konkretnego programu ulepszeń procesu.

Jeśli jednak weźmiemy pod uwagę próby kilkudniowe, stwierdzamy, że niektóre kategorie defektów występują znacznie częściej w trzeciej dekadzie miesiąca, niż w drugiej, a niektóre na odwrót — częściej w drugiej dekadzie, niż w trzeciej. Wykresy Pareto z tych dóch dekad różnią się znacznie!

Już nawet bez wnikania w przyczyny wspomnianej różnicy możnaby zaproponować stratyfikację i analizować osobno dane z pierwszej, drugiej i trzeciej dekady każdego rozpatrywanego miesiąca. Jednak Kompleksowe Sterowanie przez Jakość (TQC – Total Quality Control) ma u samych podstaw wytyczną „dokonuj stratyfikacji i czatuj na różnice”. Zauważyliśmy różnicę, więc spytajmy o jej przyczyny.

Co różni produkcję w drugiej i trzeciej dekadzie?

Liczba i długość partii!

Z różnych powodów pod koniec miesiąca produkujemy więcej partii krótkich i w związku z tym więcej jest przezbrojeń. Z tego spostrzeżenia wynika natychmiast ogólna klasyfikacja defektów, na trzy kategorie:

defekty początkowe z niewłaściwej regulacji podczas przebrajania
niedowaga albo nadwaga substancji pakowanej, nierówno przyklejone etykiety itp;
defekty z rozregulowania wcześniej wyregulowanych urządzeń
brakujący nadruk daty bądź barkodu, zwichrowanie pudełka itp.
defekty pojawiające się mniej więcej jednakowo często na początku i w trakcie procesu
niewłaściwie zaklejone pudełka (np. z produktem sypkim), niedokładnie obcięte tuby (w przypadku kremów, past) itp.

Defekty drugiej kategorii są powodem szczególnie dużych strat, gdyż zauważa się je zbyt późno, gdy wiele produktów jest już spakowanych do wysyłki. Najgorej jest na liniach z szybkimi maszynami…

Defekty trzeciej kategorii są natomiast najbardziej uciążliwe, gdyż stale trzeba pilnować i poprawiać regulację maszyn…

Wynika stąd wniosek, że potrzebne są trzy osobne programy ulepszeń:

  • poprawa procesu przezbrajania, aby urządzenia były częściej naregulowane „od razu” jak należy,
  • eliminacja defektów wynikających z niezauważenia błędu – klasycznym rozwiązaniem byłaby poka-yoke w postaci czujników alarmujących w przypadku awarii drukarki (braku nadruku), maszyny formującej pudełka itd.,
  • poprawa zdolności jakościowej maszyn, które zbyt szybko się rozregulowują (zbyt krótko „trzymają”).

Właściwa stratyfikacja natomiast to podział danych o defektach nie według dekady miesiąca, lecz według opisanych programów. Tak więc analizować należy osobno dane o defektach z trzech strata:

  • z krótkich partii (stratum krótkich partii),
  • z długich partii (stratum długich partii) oraz
  • z maszyn o obniżonej zdolności jakościowej (stratum maszyn o obniżonej zdolności jakościowej).

Analiza Pareto oraz inne techniki badania wariancji (np. karta x-R) będą wykazywały większą czułość dla każdej z tych trzech grup danych, niż dla danych zbiorczych (np. miesięcznych bądź dekadowych).

Ciąg dalszy nastąpi