Problém histogramu není v lexikálním soustředění dat, ale v takzvaných „referenčních třídách". Například se můžeme dozvědět, že :
„Histogram je grafické znázornění četností pomocí sloupcového grafu u souboru hodnot rozděleného do tříd (referenční třídy dat).
Pokud soubor hodnot rozdělíme do tříd a následně určíme četnosti v těchto třídách, můžeme tyto četnosti zobrazit graficky ve formě Histogramu. Histogram nám pak pomůže soubor hodnot posoudit například z hlediska: (normality dat, symetrie, vícemodálnosti, výskytu odlehlých hodnot)."
Výpis četností jednotlivých jmen je ve vzoru proveden ve sloupci „B" (Unikátní jméno) a sloupci „C" (Počet opakování). Je to výchozí soubor pro stanovení tříd, ale není to „histogram" ani náhodou. Histogram je histogramem právě až po stanovení tříd.
Počet tříd bude různý případ od případu. Existují výpočetní postupy, které v zadaném případě nejsou příliš potřebné, ale histogramy se používají velmi často na spojité veličiny (například stín jako diskrétní příklad na fotografii – 256 odstínů). Stín „stejné šedi" se vyskytuje na různých místech obrázku.
Zadaný případ je příkladem diskrétních veličin u kterých má smysl vytvářet histogram až když je mnoho různých případů. Já jsem použil „pouze" 20 různých jmen opakujících se na intervalu 100 případů. Když bych použil více jmen (například 50 a interval 1000) tak by byl histogram pochopitelnější, protože graf s 50 jmény je nepřehledný.
Pravdou je, že k jednotlivým třídám lze přiřadit množinu jmen, kterou třída obsahuje, ale to by jen ukázalo větší složitost. V popisu jsem uvedl příklad z Excelu, kde jsou třídy popsány celkem dobře až na detail – používají nesprávný typ grafu. Mezi hodnotami (sloupci) nemají být mezery, ale to mne netrápilo a netrápí. Chtěl jsem jenom ukázat, že problém není úplně triviální a postupy od konkurence. Ne snad proto, že bych byl obdivovatel MSO :-)
Excel používá také variantně „analytický doplněk", tedy rozšíření. To je zřejmě to co by požadoval autor imcon – kliknout a histogram je hotový. Já v tom velký problém nevidím až na to, že nevidím žádný velký přínos, ani potřebu. Možná se mýlím. Pokud by existovala pravidelná potřeba zamyslel bych se nad ní. Například pokud by vyhovovalo standardní rozdělení do 10 tříd (decily), tak by to bylo snadné. Já jsem vyjádřil v příkladu 4 třídy (prakticky tedy kvartily).
Zadání ale odpovídá prezenční listině, kterou lze snadno zpracovat například filtrovanými hodnotami na mezisoučtech. Na takové potřeby se rozšíření nepoužívá, protože stačí export z kontingenční tabulky, který použijeme jako zdroj grafu. Pokud by se s jednotlivou prezencí vázal nějaká bodový zápočet (známka), byl by to stejně složitý problém – pouze se dvěma sloupci ve zdroji. Takže podle mne by měla stačit místo rozšíření šablona.
Moje e-mailová adresa
Pokud je Váš problém vyřešen, označte prosím svůj příspěvek za "VYŘEŠENÝ"
Zlepšíte orientaci při vyhledávání řešení JAK OZNAČIT TÉMA ZA VYŘEŠENÉ