poniedziałek, 9 maja 2011

D jak Dane

Rozwijamy słowo IDEA. Druga litera. Już mamy I D ....

Przypominam: O danych. O profesjonalizmie. O Excelu. A właściwie nie całkiem. Teraz raczej o „Excelu w kontekście”.
Jednak jeśli chcemy spojrzeć w drugie oblicze Światowidowego Ducha Profesjonalizmu, musimy zacząć od podstaw.

Zacząć…

Może taka scenka?

Słonecznego ranka, w sobotę, podczas wiosennych porządków w ogródku, pan Zygmunt, właściciel segmentu na podwarszawskim osiedlu, zauważył dziwne, białe plamy na świerku, rosnącym w rogu.
Zaniepokojony, rzucił grabie i poleciał po komórkę, aby zrobić zdjęcie gałązce z plamami. Wsiadł w samochód i popędził do oddalonego o kilkanaście kilometrów marketu budowlanego, chwalącego się, że jego doradcy rozwiążą każdy problem.

I rzeczywiście. Doradca, po obejrzeniu zdjęcia i krótkiej rozmowie poradził kupić środek grzybobójczy do rozpuszczenia w wodzie i ręczne urządzenie do oprysku.
Klient podszedł do kasy, gdzie zapłacił za lekarstwa na swoje kłopoty niecałe 30 złotych gotówką.
Kasjerka, zanim wydała mu paragon, stanowiący jednocześnie dowód zakupu i podstawę ewentualnej rękojmi, poprosiła o kod pocztowy.

Pan Zygmunt, zadowolony, z uczuciem ulgi, bez oporów podał kod i wrócił do swojego ogródka i do swoich spraw. Świerk był uratowany.

Co tu jest ciekawego?

Ktoś przytomny w zarządzie firmy handlowej postanowił zbierać dane. Wdrożył genialnie prostą procedurę. Nobel! I w systemie informatycznym firmy dokonał się właśnie akt

zapisania danych o ... f a k c i e.

Można teraz rozważać przez kilka rozdziałów, co można z taką informacja zrobić, ile to daje korzyści. Jeśli się ją przetworzy i wyciągnie odpowiednie wnioski. No i j a k to zrobić. Ale na to trochę za wcześnie.
Na razie skupmy się na samym fakcie.

Fakt

Pojęcie podstawowe w analizie biznesowej.

Paragon, który zawiera informacje o pozycjach zakupu, ilościach, cenach, podatku VAT, dacie (i godzinie!) oraz wartości zakupu został uzupełniony o ważną daną. O miejscu zamieszkania klienta z dokładnością do urzędu pocztowego, czyli o kodzie pocztowym.

Fakt. Pojęcie podstawowe. Ale można je rozebrać na czynniki jeszcze bardziej pierwotne. I pokazać,
jakie składowe musi mieć taki zestaw danych, żeby był faktem. Bo nie wszystkie dane to fakty.
Najważniejszą cechą faktu nie jest bynajmniej ten sprytnie zdobyty, kod pocztowy.

Miara

Najważniejsze jest, by fakt posiadał składową o nazwie m i a r a. Wartość zakupów. A właściwie, wartości zakupów na poszczególnych pozycjach. Bo mamy tu do czynienia z faktem złożonym.
Bez miary nie ma faktu. Możemy mieć mnóstwo danych, które nie są faktami. Pan Zygmunt mógł pójść do tego sklepu, ale nic nie kupić. Doradca mógł nie mieć dla niego czasu, albo nie wiedział, co poradzić na dziwne, białe plamy. I pan Zygmunt wrócił z niczym.
Przy wyjściu przez bramkę „bez zakupów”, ochroniarz mógłby go nawet zapytać o kod pocztowy. Zakładając nawet, że rozczarowany klient miałby ochotę odpowiedzieć, to na co taka informacja mogła się komu przydać? Nie ma ona miary. Sklepy nie robią jeszcze analizy ruchu zwiedzających bez zakupów. A może robią? Ale my się tym nie zajmujemy.

Tak więc fakt musi mieć miarę. Minimum jedną. Czasem kilka. W omawianym przypadku może to być liczba sztuk zakupionych produktów, liczba asortymentów, podatek VAT w rozbiciu na asortymenty, jeśli stawki są różne.

Miara - to liczba, określająca w jakiś sposób stopień wagi faktu czyli coś w rodzaju jego ciężaru gatunkowego. Żeby można było porównać zakup pana Zygmunta z innym zakupem. Dodać je razem. Dodać wszystkie zakupy z danego dnia. Tygodnia. Wszystkie zakupy dla kodu pocztowego, który podał pan Zygmunt. Wszystkie zakupy dla opryskiwaczy. Albo obliczyć średnią. Albo odszukać zakup największy.

Atrybut

Jeśli mamy miarę, dysponujemy faktem biznesowym. Ale fakt musi mieć jeszcze jedną składową. Przynajmniej jedną. To składowa, którą określmy nazwą atrybut.

Atrybutem może być właśnie kod pocztowy. Ale również nazwa produktu lub jego indeks. Data zakupu. Razem trzy atrybuty.
Można również uzyskać atrybuty pochodne. Można na przykład rozszyfrować kod pocztowy i uzyskać atrybut – „dwa pierwsze znaki kodu”. Będziemy mieli wówczas informację nie tylko o urzędach pocztowych ale o jednostkach terytorialnie większych.
Również data może być źródłem co najmniej dwóch pochodnych atrybutów: rok i miesiąc zakupu.
Dodajmy jeszcze, że atrybut nazywany jest jeszcze kilkoma imionami: kryterium, cecha, wymiar.

Co począć z takim faktem?

W ten sposób wyprawa pana Zygmunta stała się źródłem danych o fakcie, który ma:

Siedem atrybutów:
data, miesiąc, rok zakupu, kod pocztowy, dwa znaki kodu, nazwa artykułu, cena

i

dwie miary:
wartości zakupu netto asortymentu i ilości zakupu asortymentu. Podatki sobie darujemy.

Jeśli zgromadzimy w Excelu dane o faktach z pewnego okresu, dostaniemy następującą tabelkę:

Tabela Faktów



Skąd się te dane tam wzięły? Na pewno nikt ich tam nie będzie wklepywał z klawiatury. Nie te czasy. Ale o tym sobie porozmawiamy później.
Teraz jednak odpowiedzmy sobie na dwa podstawowe pytania:

Czy osiągnęliśmy cel, mając takie dane?
Czy takie ułożenie faktów jest wygodne, czy też należałoby układ ulepszyć?
Rozważmy to po kolei.

Pytanie 1: Czy taka tabelka stanowi dobry punkt wyjścia do analizy?

Odpowiedź jest pozytywna. Spójrzmy, co dostaliśmy: Każdy fakt, opisany w jednym wierszu o stałej strukturze, posiada siedem atrybutów i dwie miary. Skupmy się na jednej mierze: wartości sprzedaży netto, którą określimy po prostu sprzedażą.

Możemy teraz sumować miarę ogółem (całkowita sprzedaż netto), oraz według poszczególnych atrybutów. Np. wartość sprzedaży opryskiwaczy, wartość sprzedaży w kwietniu, wartość sprzedaży w 2010 roku. No i wartość sprzedaży dla kodu 00, czyli śródmieścia Warszawy.
Dysponujemy wiedzą o sprzedaży zarówno w czasie, w zakresie asortymentu, jak i w zakresie miejsca zamieszkania naszych klientów.

Możemy planować zaopatrzenie w towary dla różnych okresów - sezonowo – (dla poszczególnych odcinków roku lub miesiąca), jak też profilować nasze akcje promocyjne, kierując je do rejonów, gdzie mamy najwięcej, lub najlepszych klientów.

Pytanie 2: Czy takie ułożenie faktów jest wygodne?

Najpierw, żeby być ścisłym, opiszmy w punktach dobrą formę ułożenia danych.

1. Pierwszy wiersz jest nagłówkiem tabeli.
2. Każda kolumna jest opisana odpowiednim napisem w nagłówku, który określa, jakie dane znajdują się w kolumnie. To nazwa pola lub kolumny.
3. W kolumnie (polu) znajdują się zawsze dane tego samego rodzaju. W naszym wypadku mamy dziewięć kolumn. Siedem atrybutów, dwie miary.
4. W każdym wierszu (rekordzie) znajduje się ten sam zestaw danych. W tej samej kolejności.
5. Wiersze odróżniają się pewnym polem o unikalnej wartości, którego tu, dla jasności obrazu nie umieściliśmy: identyfikatorem wiersza. Na razie pomińmy ten problem.
6. Opisaliśmy każdą tabelkę, która spełnia postulat wygody. Ta konkretna tabelka, ze względu na jej zawartość, treść, jest tabelą faktów.
Bo zawiera zapis zdarzeń biznesowych, zachodzących w czasie, względnie często.
I dlatego interesujących nas, jako analityków biznesowych.
Faktów podlegających analizie.

To nie jedyny rodzaj tabel, jakie występują w analizie biznesowej.
Innego rodzaju tabelki, które są interesujące i ważne, omówimy później.

Porządek. Podstawa profesjonalnej analizy. Odwrotność entropii, czyli chaosu. Ale o tym będzie później.

Czy to wygodne? Tak! To najlepsza forma. Zamiast dowodu, przykład najprostszy.

Jak najszybciej ustalić sprzedaż dla Bielan w roku 2010 ?

Wystarczy skorzystać z filtru Excela: Zakładka Dane i ikonka lejka.
Następnie trzeba odchylić myszką strzałeczkę w prawym dolnym rogu nagłówka kolumny C (Rok) i wybrać rok 2010. Potem to samo zrobić z nagłówkiem kolumny E (pierwsze dwie cyfry kodu pocztowego). Następnie ustawić się w komórce znajdującą się pod ostatnim wierszem w kolumnie I (miara Wartość sprzedaży netto).
Teraz do wyboru: albo skrót klawiszowy {Alt + =} albo kliknięcie na ikonkę z wielką literą sigma – autosumowanie. W komórce I73 pojawi się formuła wyliczająca wartość sprzedaży netto dla żądanych kryteriów:

=SUMY.CZĘŚCIOWE(9;I2:I72)

Analiza faktów dla Bielan i roku 2010




To nie jest dowód, że taka forma jest najlepsza. Ale to jest mocne uzasadnienie. I to na razie musi nam wystarczyć.

czwartek, 5 maja 2011

Profesjonalizm. Po kolei.

Właściwie powinienem się wstydzić. Zacząłem cykl o obliczach profesjonalizmu od tego, co widać. Podążyłem za modą na PR – p i  a r. A fe!
Jedyne usprawiedliwienie, to fakt, że mam dużo do czynienia z „prawie” profesjonalistami. O słówku „prawie” można by tak:

Amerykański film „Kobieta Roku”.  Z roku 1942-go. Z udziałem Katarzyny Hepburn i Spencera Tracy. Komedia romantyczna.


Urocza, inteligentna i ambitna dziennikarka Tess, świeżo upieczona żona Sama, dziennikarza sportowego, upiera się, że kobieta jest tak samo godna podziwu, jak mężczyzna. Wtedy widocznie jeszcze nie było to takie oczywiste. Ale trochę się zapędza. Stwierdza, że między kobietą i mężczyzną nie ma żadnej różnicy. Sam patrzy na nią filuternie.
- Żadnej?
            - No, może taka maleńka…
Sam już jej dłużej nie męczy.
- Wiesz, Tess, jak mówią Francuzi? Vive cette petite difference! (Niech żyje ta maleńka różnica!)
            Początek sceny miłosnej, dyskretnie wyciemniany przez napis KONIEC.

Między „ prawie” i profesjonalistą jest właśnie taka „maleńka” różnica. I z pozycji „prawie” możemy wznieść też ten okrzyk. Ale zanim wzniesiemy, trzeba tę różnicę jakoś krótko i wyraziście opisać.

Spróbujmy użyć popularnego chwytu z akronimem.

Excel, program do ładnych tabelek dla inteligentnych samouków.
lub
Excel, profesjonalne narzędzie Business Intelligence.


Oto alternatywa. Wybierajcie! Oto IDEA.

Na czym polega różnica? Może być wyjaśniona właśnie tym akronimem. I D E A.

Parzysta liczba liter. Światowidowe oblicze profesjonalizmu. Dwie dotyczą Excela, „jako takiego”. Dwie Excela „w kontekście”.

Interface. Dane. Entropia. Architektura.

Dzisiaj jeszcze raz o tym, co widać. Ale nie całkiem. Bo niektóre rzeczy, chociaż dotyczą interfejsu, nie są widoczne. A trzeba o nich wiedzieć

I jak interface, a może już zwyczajnie, interfejs.  ("Excel, jako taki").

Interfejs to właśnie coś, co widać. I widać, jak się nim posługujesz.
Już było.
Teraz przykład.Oto tabelka.



















Uruchommy na chwilkę wyobraźnię.  Bo tu, na rysunku, to tylko przykład (12 wierszy i 8 kolumn). A jeśli liczy ona, powiedzmy, ponad cztery tysiące wierszy i kilkadziesiąt kolumn? Jak ją szybko „ogarnąć”?

Szef chce szybko wiedzieć, co to za dane, ile ich jest i w jakim zakresie się zawierają.
A gdyby ich było kilkanaście tysięcy wierszy? Kilkadziesiąt?
A może tu jest kilka tabelek poprzedzielanych pustymi wierszami, lub kolumnami?
Będziemy klikać myszką do obiadu? I ciągle nic nie wiemy. Bo wierszy może być nawet milion. A kolumn pare tysięcy.

Znasz ten trik: Ctrl + Strzałka w dół/bok?  Można wtedy przesunąć aktywna komórkę „do pierwszej przeszkody”.  Nic ci nie pomoże. Co chwilę będziesz wpadał w „dół”. Denerwujące bardziej niż przewijanie kółkiem myszy.

Spróbuj Ctrl + „Szara gwiadka”, nad numeryczna dziewiątką. Albo Ctrl+Shift+8 – (to ta ósemka nad klawiaturą główną). Czyli, właściwie też gwiazdka, bo nad ósemką, „na shifcie”, jest właśnie gwiazdka.

Zaznaczyłeś całą, nawet taką dziurawą, tablicę.

{Ctrl + gwiazdka} - to operacja zaznaczania „obszaru bieżącego”. Obiektu bardzo ważnego w Excelu. Właśnie takiego, jak ta „dziurawa” tabelka. Czyli zbioru przylegających do siebie wszystkich, niepustych komórek.

Po zaznaczeniu możesz zrobić kilka ciekawych rzeczy.

Możesz na przykład obejść cała tabelkę wokoło, nie zważając na dziury. {Ctrl + kropka}. Ta kropka po prawej stronie głównej klawiatury, na dole. Klawisz drugi w prawo od litery „M”.
Każde użycie tego skrótu przeniesie cię w inny róg zaznaczonej tabelki. Nie ważne, ile wierszy miała.

Możesz zobaczyć, jak daleko sięga tabelka, czy nie ma granic miedzy nią, a jakąś drugą, niewidoczną na początku. Masz więc szybki ogląd danych.

A jak taką tabelkę teraz podsumować?

Trzeba umieć nieco skorygować zaznaczony obszar w dół i w bok. Wciskamy „Shift” i używamy raz klawisza strzałki w dół {Shift + ↓}, raz – strzałki w prawo {Shift + →}.

Obszar zaznaczony jest teraz powiększony o jeden wiersz pod spodem tabelki i o jedną kolumnę po prawej stronie. Jeśli teraz użyjemy skrótu {Alt + =}, tabelka zostanie podsumowana wierszami, kolumnami i jeszcze w lewym, dolnym rogu, będzie suma wszystkich liczb.

A jak sformatować liczby do ulubionego formatu księgowych i analityków? To później. Może ktoś się zainteresuje.

Na razie tylko podkreślmy: interfejs, „to, co widać”, sfera współpracy użytkownika z programem to pierwszy obszar,  w którym objawia się profesjonalizm. Bo ona decyduje o efektywności pracy. I o wrażeniu.

Nie tylko skróty klawiszowe. Również „sekwencje”, czyli kolejne uderzenia w  klawisze, zaczynając od klawisza Alt. Szczególnie wygodne w Excelu do 2003. Później mniej. Ale kilka sekwencji bardzo przydatnych.
Np: Alt, P, B - to sekwencja wywołująca opcje Excela 2007 i 2010.

A tam? Cała masa ustawień interfejsu!

Ustawienia wyglądu ekranu, sposób przeliczania skoroszytu, ścieżki domyślnego położenia plików.
Ustawienia o zaufanych dodatkach, czyli aplikacjach pomocniczych, specjalizowanych.
Zabezpieczenia przed niechcianymi makrami.
Zabezpieczenia przed zmianą określonych komórek przez „naiwnego” użytkownika naszych arkuszy.

Nieco trudniejsze jest zabezpieczenie przed wpisaniem do komórki niewłaściwej wartości, która nie ma sensu i skutkuje błędami w formułach lub ustawienie formatu warunkowego: dla liczb ujemnych – czerwona czcionka, albo: przekroczony termin płatności – czerwone tło komórki.

Zabezpieczenie przed wpisaniem dwa razy tego samego identyfikatora do pewnej kolumny wymaga już znajomości formuł i specjalnej funkcji: Licz.Jeżeli().

I wiele innych ustawień, które pozwolą dostosować  interfejs Excela do twoich profesjonalnych wymagań w większym stopniu, niż świeżo zakupionego, czerwonego jaguara z siedzeniami jeszcze obitymi folią. A z których wielu „zaawansowanych” użytkowników nawet nie wie, jak skorzystać.

A to tak, jakby jeździć czerwonym jaguarem, nie tylko nie zdejmując folii, ale nawet nie regulując odległości siedzenia od pedałów i kierownicy. I narzekać, jaki ten jaguar jest niewygodny. Zupełnie, jak ten Excel jest nieprzystosowany do poważnych zastosowań.

 Wydawnictwo Helion - pliki przykładów z wydanych książek informatycznych, jak ściągnąć? Wpis nie sponsorowany Helion wydaje ważne dla mnie ...