jak rychle získat Histogram

imcon · 9. 12. 2022 18:08:27

Zdravím odborníky,
Dnes něco jednoduchého základního, nemůžu najít funkci, či add-on.
Potřebuji poradit funkci, která mi na kliknutí vytvoří histogram, klidně tabulkový, když to nejde tak graf.

Konkrátně:
mám tabulku s daty ze systému, v jednom sloupci jsou různá jména.
Potřebuji rychle zjistit četnost počtu jednotlivých jmen. Tedy aby mi funkce vytvořila tabulku jméno, počet výskytů.
Alternativně graf.

Umím to samozřejmě udělat ručně vysoučtovat atd, ale to je strašně zdlouhavé, potřebuji to na kliknutí a vrtá mi hlavou, která je to funkce.

Díky za nakopnutí.

Editoval imcon (9. 12. 2022 18:09:37)

neutr · 10. 12. 2022 12:09:34

Zřejmě Vás nepotěším. Nejde to jednoduchým způsobem. Udělal jsem příklad, kde se snažím problém vysvětlit. Je to zde : Histogram.

imcon · 10. 12. 2022 23:13:58

Hmm, jak vidím, pořád je co vylepšovat. Námět na rozšíření?
Ale díky za odpověď a obzvláště za zpracovaný demo rozbor.
Sice v něm není řešení toho co bych potřeboval (tedy četnost výskytu jednotlivých jmen), ale to nevadí. Jak jsem psal, nejde mi o řešení, ale o rychlost získání výsledku, což by šlo tedy jen funkcí, která není zpracovaná. Ano, možností toho jak vyhodnocovat výchozí data je při obecném zadání víc, prototo asi není.
Ale případ podle mého dotazu je triviální a opakovatelný jak pro čísla tak řetězce, to by zpracovat šlo. Nemusí být vše jen kopírované z Excelu.

Editoval imcon (10. 12. 2022 23:26:28)

Zvedavec · 10. 12. 2022 23:24:06

Možná je to blbost, kdyby to byla čísla, tak na to funkce jsou, ne? Co tak jména nahradit čísly...?

neutr · 11. 12. 2022 09:47:16

Problém histogramu není v lexikálním soustředění dat, ale v takzvaných „referenčních třídách". Například se můžeme dozvědět, že :

„Histogram je grafické znázornění četností pomocí sloupcového grafu u souboru hodnot rozděleného do tříd (referenční třídy dat).
Pokud soubor hodnot rozdělíme do tříd a následně určíme četnosti v těchto třídách, můžeme tyto četnosti zobrazit graficky ve formě Histogramu. Histogram nám pak pomůže soubor hodnot posoudit například z hlediska: (normality dat, symetrie, vícemodálnosti, výskytu odlehlých hodnot)."

Výpis četností jednotlivých jmen je ve vzoru proveden ve sloupci „B" (Unikátní jméno) a sloupci „C" (Počet opakování). Je to výchozí soubor pro stanovení tříd, ale není to „histogram" ani náhodou. Histogram je histogramem právě až po stanovení tříd.
Počet tříd bude různý případ od případu. Existují výpočetní postupy, které v zadaném případě nejsou příliš potřebné, ale histogramy se používají velmi často na spojité veličiny (například stín jako diskrétní příklad na fotografii – 256 odstínů). Stín „stejné šedi" se vyskytuje na různých místech obrázku.

Zadaný případ je příkladem diskrétních veličin u kterých má smysl vytvářet histogram až když je mnoho různých případů. Já jsem použil „pouze" 20 různých jmen opakujících se na intervalu 100 případů. Když bych použil více jmen (například 50 a interval 1000) tak by byl histogram pochopitelnější, protože graf s 50 jmény je nepřehledný.

Pravdou je, že k jednotlivým třídám lze přiřadit množinu jmen, kterou třída obsahuje, ale to by jen ukázalo větší složitost. V popisu jsem uvedl příklad z Excelu, kde jsou třídy popsány celkem dobře až na detail – používají nesprávný typ grafu. Mezi hodnotami (sloupci) nemají být mezery, ale to mne netrápilo a netrápí. Chtěl jsem jenom ukázat, že problém není úplně triviální a postupy od konkurence. Ne snad proto, že bych byl obdivovatel MSO :-)

Excel používá také variantně „analytický doplněk", tedy rozšíření. To je zřejmě to co by požadoval autor imcon – kliknout a histogram je hotový. Já v tom velký problém nevidím až na to, že nevidím žádný velký přínos, ani potřebu. Možná se mýlím. Pokud by existovala pravidelná potřeba zamyslel bych se nad ní. Například pokud by vyhovovalo standardní rozdělení do 10 tříd (decily), tak by to bylo snadné. Já jsem vyjádřil v příkladu 4 třídy (prakticky tedy kvartily).

Zadání ale odpovídá prezenční listině, kterou lze snadno zpracovat například filtrovanými hodnotami na mezisoučtech. Na takové potřeby se rozšíření nepoužívá, protože stačí export z kontingenční tabulky, který použijeme jako zdroj grafu. Pokud by se s jednotlivou prezencí vázal nějaká bodový zápočet (známka), byl by to stejně složitý problém – pouze se dvěma sloupci ve zdroji. Takže podle mne by měla stačit místo rozšíření šablona.

kabi · 12. 12. 2022 07:29:17

sice ne funkcí, ale lze to jednoduše vyřešit kontingenční tabulkou.

imcon · 12. 12. 2022 23:07:39

kabi napsal(a)

sice ne funkcí, ale lze to jednoduše vyřešit kontingenční tabulkou.

Ano je to tak. Pro moji jednoduchou úlohu je tabulku nejrychlejší získat Kontigenční tabulkou, není to na jeden klik ale na pár celkem rychle.

OpenOffice.cz - web věnovaný kancelářským balíkům OpenOffice.org

#1 9. 12. 2022 18:08:27

jak rychle získat Histogram

#2 10. 12. 2022 12:09:34

Re: jak rychle získat Histogram

#3 10. 12. 2022 23:13:58

Re: jak rychle získat Histogram

#4 10. 12. 2022 23:24:06

Re: jak rychle získat Histogram

#5 11. 12. 2022 09:47:16

Re: jak rychle získat Histogram

#6 12. 12. 2022 07:29:17

Re: jak rychle získat Histogram

#7 12. 12. 2022 23:07:39

Re: jak rychle získat Histogram

Zápatí