pro lp.:
Souhlasím - autor by se měl vyjádřit k celé problematice. Na druhou stranu chápu, že problém řeší už od dubna 2014. V té době věděl asi jen málo o tom jak řešit. Věděl jen co chce. Ze 6-ti témat, které vytvořil jako dotazy se 5 týká právě přímo tohoto problému. Ten 6. s tímto souvisí zřejmě také ale nepřímo. Dotazy vznikaly tak jak si postupně vytvářel názor na postup řešení.
Není divu, že se snaží problém specifikovat ve zjednodušené verzi. Vytvoří modelový příklad který ale nevystihuje komplexní problém. Tohle dělá většina tazatelů. Určitě máme s tímto postupem zkušenosti. Když potom (obecně) tazatel dostane uspokojivou odpověď na dotaz tak zjistí, že potřebuje ještě něco jiného.
Já v tom nic špatného nevidím. Málokdy umí tazatel vystihnout potřebu přesným dotazem. Proto i v poměrně jednoznačných případech požaduji ukázku. Z té se pak snažím odhadnout skutečnou potřebu. A to nemluvím o případech kdy tazatel nechce, nebo nemůže sdělit čeho se problém týká.
Také jde o to, že jen málokdo se bez problému přiznává, že něco neumí, nebo že se spletl, nepochopil meritum problému nebo odpovědi.
Já to vidím tak, že nyní už autor má názor jak na to, ale naráží na problém objemů dat. Máte pravdu že přímým sloučením cesta přes 1,048 milionu řádků nevede. Také si myslím, že na doraz plný Calc bude zlobit. Pobere možná ještě prostý text, ale ne vzorce. A pokud vezme i vzorce pochybuji, že by se na výsledky dalo spoléhat.
Řešení ale existuje. Problém se musí řešit jako relace X:Y pro soubory i jednotlivé řádky v nich. Takže v rámci vzorců je to relace dvojic z celku 700 souborů = 244650 porovnání. Při tom se musí "sloučit a odfiltrovat (smazat)" položky které obsahuje základní soubor 1:Y. Je možné, že při tom některé soubory z celku 700 zcela zaniknou.
Takže například po prvním porovnání (1:699) zanikne polovina z celku 700 (vznikne soubor 1 který obsahuje unikátně všechny své položky), ale relace další bude také ještě objemná 1:350 (vznikne soubor číslo 2). Další soubory také budou vznikat a budou také vždy o dost menší nežli předchozí. Dejme tomu, že jich bude 10. (Také je možné zbylé položky přidat k souboru čéslo 1 a pracovat jen s tímto souborem.)
Těchto 10 souborů už asi půjde sloučit do jednoho (pokud nebude existovat přes milion různých druhů zboží). Ovšem já ještě pochybuji, že vystačí jediné kumulování objemů. Taková práce se vyplatí dělat jen v případě, že statistiku vypracujeme celou. Tedy podle mne bude potřeba aby bylo kumulováno více parametrů. Počet prodaných za položku + cena. Ve výsledku pak bude celkový počet s průměrnou cenou a rozsahem ceny od - do. Soustředit taková data vyžaduje také například improvizovat ve vzorci přepočet na existující průměr, pokud je uveden jen počet a ne jednotková cena. Takže potom bude existovat nejméně kumulace počtu a celkové ceny za tento počet, minimální a maximální cena. Také nesmíme zapomenout, že o peníze jde vždy až v první řadě.
Proto si myslím, že to vůbec není jednoduché. Jen autor vše zjednodušil. Představte si, že by to celé takto vybalil v souhrnu. První na co by se lidé ptali možná i "nahlas" - "k čemu to potřebuješ" a "co z toho budeš mít" : - )
Editoval neutr (23. 6. 2015 05:57:33)
Moje e-mailová adresa
Pokud je Váš problém vyřešen, označte prosím svůj příspěvek za "VYŘEŠENÝ"
Zlepšíte orientaci při vyhledávání řešení JAK OZNAČIT TÉMA ZA VYŘEŠENÉ