Sloučení textových polí do jednoho

Sladecek · 7. 10. 2016 22:07:35

Při editaci pdf souborů se importovaný text rozloží do více textových polí, třeba i v 1 řádku.
Je možné nějak jednoduše (makro?) tato pole sloučit do jednoho s více řádky (1 odstavec z obsahu více textových polí do 1 pole?).

Sladecek · 7. 10. 2016 22:08:56

Při editaci pdf souborů se importovaný text rozloží do více textových polí, třeba i v 1 řádku.
Je možné nějak jednoduše (makro?) tato pole sloučit do jednoho s více řádky (1 odstavec z obsahu více textových polí do 1 pole?)?

neutr · 8. 10. 2016 04:49:06

To by jít asi mělo, ale Vy se zřejmě zajímáte o podobnou a opakovanou činnst. Paušální řešení může fungovat jen pro stejný zdroj, respektive postup jakým se PDF provádí. Podstatné je při tom zda jde o stejný základ - například formulář. Jednoduše ty díly co se mají spojit musí být stále na tom samém místě. Draw je grafický program a lze tam operovat jen s vektory, respektive souřadnicemi.
Většina PDF je provedena jinak nežli jako obrázek. Jsou to často formuláře vypracované v textovém editoru. Vím o tom, že zejména ve starších verzích AOO, i LO šlo otevírat PDF právě jen v Draw. A v tom je to problematické z pohledu PDF vytvořených vlastními prostředky AOO, nebo LO. Vím že některé PDF vytvořené v AOO (LO) šlo otevřít i v původním zdroji - nejčastěji Writer, ale ne všechny formáty (existuje např archivní, s tagy, formulář ap.)

Takže to co hledáte je možná již řešitelné mimo Draw. V žádném případě Vám asi nikdo nemůže odpovědět bez konkrétní ukázky a bez upřesnění. Měl byste odpovědět na pár dotazů a poslat ukázku vzorového PDF.
- Je možné, že stejný formulář se zpracovává různými postupy?
- Důležité je označení AOO/LO a verze
- Operační systém
- Původ dokumentu je-li Vám znám (například Word ap.)
- Nejdůležitější je typická ukázka přímo dokumentu PDF

Sladecek · 8. 10. 2016 19:05:20

Nejedná se o formulář. Zpracovávám pdf soubory - dokumentaci, které jsou generovány velmi různě, např. MS Office, často Word ale i třeba Publisher - to těžko zjistím - s exportem do pdf. Tyto soubory potřebuji editovat a měnit v nich bloky textů, popř. i popisy obrázků. Soubory obsahují texty a obrázky a zvláště poslední verze LO od verze 4 je většinou skoro bez chyb otvírají do formátu Draw. Momentálně používám LO 5.2.2, Windows XP, ale totéž je u Windows 7 a 8.1.
Pro jednoduchost jako jednoduchý příklad (abych nemusel vkládat odkazy na soubor): text z rozšíření JP_Lorem ipsum, otevřený ve writeru, export do pdf. Pak otevřít soubor (otevře se automaticky v Draw) a každý řádek textu (původně celého odstavce) je samostatné textové pole.
Při mých úpravách musím ručně upravovat a spojovat textová pole po řádcích (někdy je jich i víc na 1 řádku). Pak je ukládám už jako víceřádkové textové pole. Jedná se mi o možnost automatizace - spojení více těchto polí do jednoho, s více řádky.

neutr · 8. 10. 2016 19:34:12

Já se přiznám že podobné úlohy řeším přes OCR Finereadr 7 - ale umí to asi všechny moderní OCR. Načte vše (i když je to už hodně stará verze). Má to také své mouchy když někdy musím ručně označit typy bloků, ale většinou to proběhne dobře a jen několik málo znaků nebo úseků musím upřesnit. OCR bývá součástí tiskáren, ale otevření PDF jako zdroje asi není standard. Problém je v tom, že PDF má standardně 150 dpi a OCR vyžaduje 300.
Přes to pokud nevyžadujete přesný formát s barvou, tak to lze udělat klasicky - uloží se screeny obrazovky ve větším rozlišení. Ty se pak načtou do OCR jako BMP, JPG a podobně. Jen je s tím maličko víc práce.

Nicméně zítra vyzkouším jestli to jde jinak - jen pomocí LO. Tam by mělo fungovat otevření z Writeru, nebo Calcu - tedy nikoliv otevírání automaticky. Už jsem dlouho nic takového nedělal tak to alespoň znovu otestuji. Je totiž zajímavé, že se načítají textová pole. Podobně by se měly (mohly) načítat také jako bloky grafické objekty - to by mělo být podobné s blokem textu. Ale klasické PDF bývá často celé obrázek (nelze zkopírovat text - jen celou stránku). Tam pomůže jen to OCR. Vyzkouším jak by šly načíst alespoň ty textové bloky. Jestli jich je tam více za sebou měly by jít makrem dorazit k sobě. Zítra po obědě budu mít asi chvíli - pak napíšu.

Editoval neutr (8. 10. 2016 19:40:00)

Sladecek · 8. 10. 2016 21:21:16

Díky, ale vyhovuje mi právě nejlíp Draw, protože nerozhodí obrázky. Otevření z Writeru nebo Calcu na to nefunguje moc dobře. Samozřejmě, pokud je pdf celé jako obrázek, tak to jednoduše nepůjde. Obdobně jako Draw načítá texty třeba i Inkscape, ale i tam jsou to textová pole. Zajímavé je, že třeba on-line
převody do formátu doc to nějak srovnat do textu umí, i když obrázky rozhodí.

neutr · 9. 10. 2016 18:35:22

Tak jsem se tomu chvíli věnoval a zjistil jsem že je to trošku jinak nežli jsem si pamatoval. Draw pracuje opravdu relativně dobře. Naopak Writer a Calc jsou horší a nehodí se a to ani v případě že PDF vložíme jako OLE objekt (otevírá se v Draw).
Použil jsem jeden Datasheet který mám na ploše a ten na mne ječel že chce heslo pro otevření ve Writer. Ostatně posílám vzor kam až jsem se dnes dostal. Není to tak jednoduché. Načítají se mi někdy jen samostatná slova, nebo o jednotlivé znaky. Zatím neumím vytvořit poarametr pro sloučení jednotlivých "dílů". Zřejmě to bude muset být dialog který bude muset autor úpravy potvrzovat - sloučit do řádku, přidat řádek a nebo přerušit sloučení a pokračovat jinde.
Také jsem netestoval zda čte popisky obrázků - tedy to není složité ale já to vlastně ladím a nemám při tom na takové detaily čas. Myslím ale že tam je vše. Dokonce tam jsou i věci, které jsou zřejmě jen v popisu dokumentu.

Tady je vzor abyste mohl otestovat Vaše soubory Ukázka rozpracovaného makra. Stačí z hlavní nabídky spustit "test" a uvidíte co a jak mi to vypisuje.
Když byste potřeboval jiný soubor musíte si překopírovat makro do jiného souboru, nebo v tomto souboru smazat snímky a nahrát jiné. Když tak budete testovat - já jsem viděl jen rámečky u vybraného textu a tak nevím jestli jste měl na mysli právě toto.
Nemá to být vstup do překladů? Tam by asi šlo jen o přizpůsobení řádků a odstavců, ale mylím že by to také šlo - nastavením počtu znaků na řádek.

Já se ktomu dostanu až v úterý odpoledne, ale na fórum se dostanu - když tak napište co jste zjistil. Zatím uvažuju o tom že udělám výpis místo do MsgBoxu - tak to udělám do Writeru jako protokol a pak uvidíme.
Předpokládám, že sloučím všechny následné texty do jediného řetězce a rozdělím podle počtu znaků na řádek to ale není moc dokonalý způsob. Sloučí se zřejmě často i nesprávně do stejného bloku. Umožní to ale manuálně udělat odstavec.

Sladecek · 9. 10. 2016 19:19:35

Díky.
podívám se zítra na to.

neutr · 14. 10. 2016 14:54:38

Tak je to poměrně dost obtížné. není čeho se chytit. Přes to by to snad mohlo trošku pomoci.
Úpravy druhá verze
Otestujte si slučování textu. Není to bůh ví co. Prostě slepuje následné kusy textu do jediného řádku. Při tom můžete vidět který text se odkud bere a přidává k stávajícímu (slučovanému) textu. Nejlepší je vizuelně sledovat a když otipujete že to vyjde na řádek tak dát "ZRUŠIT" čímž to skočí na další řádek.

Je tam makro které automaticky zalomí řádek podle nastavené číselné hodnoty (počet znaků na řádku). To chce ale nejprve se dobře podívat kolik znaků řádek obsahuje. Při tom všechny texty rozuseká stejně. Má to ale výhodu, že všechny sloučené texty jsou v jediném rámečku. Takže zbytek musíte udělat asi růčo.
Je tam ještě makro které vkládá znak po znaku a můžete kdykoliv zalomit řádek. Takže to je řešení pro složitější struktury textů. Rozměry rámce jsou nastartovány úvodním textem - ve smyslu začátku.

Má to fůru nedostatků. Šlo by zařadit lámání řádků do slučování. Já však předpokládám že spíš budete mít zájem na "lavinovitém" slučování. Tím myslím že je možné sloučit rychle bez ohledu na cokoliv všechny následné texty. To by šlo udělat v rámci volby dalším MsgBoxem (nynější způsob), nebo klasickým dialogem.
Jednoduchá volba ANO (sloučit) by se rozdělila na dvě možnosti z nichž ta druhé by sloučila všechny následné texty až do okmažiku kdy my narazila na na jiný typ objektu.

Celkem by tedy pomohlo když byste se zamyslel jak by to mělo být upraveno. Nemůžete ale počítat s tím že v Draw lze formátovat jako ve Writeru. Není tam žádný záchytný bod. Musely by se iterovat souřadnice. Pak už by bylo lepší kopírovat objekty do nového DRAW kam by se zadávaly souřadnice. Nejde totiž přidat "řádek" a posunout vše co je do konce směrem dolů. Nejvýš se sousední objekty přeloží přes sebe.

Sladecek · 14. 10. 2016 16:01:49

Díky.
Vyzkoušel jsem. První makro bohužel přepisuje texty pořád přes sebe.
Druhé makro funguje lépe, ale další odstavec to píše přes ten již upravený.(jestli to není vinou mého HW - Win XP,procesor AMD, LO 5.2.2), jinak tohle by mi už docela stačilo, kdyby se to nepsalo přes sebe. 3. makro je po 1 znaku, to je moc zdlouhavé.
Myslel jsem, že to bude jednodušší, třeba by stačilo vybrat několik textových polí myší a spustit makro, aby z toho vznikl jedno pole. Uvažoval jsem i o možnosti, že by se to přenášelo do jiného souboru ve Writeru.
Přesto děkuji, třeba to někdo udělá jako rozšíření.
I tak mi v tomto směru Draw velmi dobře slouží.

neutr · 14. 10. 2016 17:49:17

Procesorem to není. Stavěl jsem to na stejné konfiguraci (tedy mám to pod Ubuntu jako druhý systém).
To první makro slučuje vše do jediného řádku. Tím pádem všechny sloučené soubory jsou v jednom stringu (řetězci) který se musí rozsekat na řádky. Tím vzniká dojem že přepisuje řádky stále přes sebe. Tak to ale není.
K prvnímu slučovanému řádku (části textu) se přidá mezera a další díl textu. Tento díl se po sloučení smaže. Tím vzniká za prvním dlouhým řádkem "optická" mezera. Do toho místa by se to mělo ve druhém kroku zalomit. Tím se docílí, že sloučené texty jsou v jediném rámečku.
Znamená to, že makro "SloucitTexty" se musí spustit vždy. Když to sloučíte (chce to odhad a i cvik) tak to musíte správně odřádkovat aby vznikl alespoň přibližný blok (ten lze manuálně doformátovat aby vešel i opticky dobře.
To se dá odřádkovat práve jen tím makrem "RadkyAutomat", nebo tím pomalým makrem "VytvoritRadky". Samozřejmě to jde i manuálně. Když se postavíte na místo zalomení - tak dáte ENTER a blok se zalomí. Což je vlastně jakoby finální úprava kterou si jen předpřipravíte tím "automatem". Automat totiž napočítá znaky a rozsekne třeba i slovo v půli.
Naopak na již sloučeném bloku nelze spustit sofistikovanější rozdělení. Můžete jenom manuálně sloučit rozdělená slova. To je ale podle mne mnohem snadnější na jediném bloku nežli na několika různých blocích.

Nejvíc (nejlépe) je možné upravit slučování. Když do toho zabuduji ještě odřádkování tak bych to mohl vylepšit o rozdělení na úsek následných řádků podle trojic kde je uprostřed mazera. Ale obtížně bych se vracel zpět když by bylo poslední slovo hodně dlouhé.
Když bych překročil původní tvar textu stejně bych přeložil poslení část přes následující. To moc nehrozí, protože mezi jednodlivými díly je také mezera, takže teoreticky sloučený text je stejně dlouhý jako nesloučený - při slučování se původní mezera přeskočí (zanikne) a vloží se mezera mezi slova sjednoceného textu.

Ono je to asi trošku matoucí, ale otestujte při slučování tlačítko ZRUŠIT. Dává volbu začít od dalšího textu, nebo skončit práci. To je kvůli tomu že můžete při nejistotě skončit a po prohlédnutí spustit slučování znovu.
Tedy jak uvádíte První makro bohužel přepisuje texty pořád přes sebe. tak přes sebe by se to přepisovat nemělo. Testoval jsem to znovu.

Já jsem původně udělal výpis do Writeru, ale to se musí následně celé přeformátovat. Zkopírované objekty se musí dávat na nový řádek. Takže když se sloučí texty do jednoho bloku, ten se spíš naformátuje (vkládá se jen string a není to objekt jako v Draw). Ale dokument je si s originálem dost nepodobný zejména když tam budou například obrázky na různých místech.
Objekty (obrázky ap.) sice mohu umisťovat například standardně na střed, ale pak už jde opravdu jen o přepis neformátovaného obsahu. Jestli máte zájem o toto, udělám vzorek. Myslím že úprava v Draw je snadnější ačkoliv po jakékoliv úpravě musíte zpětně exporovat PDF.

Netwalker · 15. 10. 2016 15:38:38

"PDF (Portable Document Format) je formát používaný k prezentaci a spolehlivé výměně dokumentů, který je nezávislý na softwaru, hardwaru i operačním systému."
Podle mě je chyba UPRAVOVAT text v PDF formátu. K tomu slouží původní zdrojové soubory ve wordu či jiném editoru. Ano občas také upravuji něco v pdf, ale jen OBČAS a ne systematicky.

neutr · 15. 10. 2016 18:22:19

pro Netwalker :
Já bych nesouhlasil. Dovedu si představit, že autor (Sladecek) má na starosti nějaké dokomenty typu "datasheet" který musí upravit z originálu PDF do PDF v češtině. Další je možnost, že dík změnám zákona a personálnímu obsazení se dostal k povinnosti aktualizovat nějaké oborové předpisy. Takže stačí opravit tu a tam nějaké slovo ve větě.
To znamená že musí vycházet jen z PDF protože původní zdroj prostě není k dispozici. Typicky výrobní katalogy mohou obsahovat i stejný sortiment ale musí se přepsat ISO, nebo jen barva, balení a podobně. Při tom jsou tam také nejspíš obrázky nebo i multimediální soubory a přeformátování je doslova nežádoucí, nebo vyloučené.

Na velké rozsahy jsem doporučoval postup pomocí OCR, ale někde mezi malou opravou a celým přeformátováním (byť s pomocí OCR) je asi dost "zbytečného času". Zejména jestli je souborů hodně a úpravy jen sporadické. Když tedy čte obsah - přijde na potřebu opravy - vyhovuje mu lépe kliknout do PDF otevřeného v Draw. Ale i malá změna (přírůstek slova, krátké věty) způsobí potřebu sloučit celý odstavec který se skládá z mnoha dílčích textových objektů. Ty se pak už dají přeformátovat. Jinak jednotlivě se to prostě nevejde, nebo naopak vznikne díra.
Takže řešením je skutečně otevřít v Draw, nakrokovat makrem odstavec a sloučit ho do jediného bloku. Ten se pak už dá upravit i za cenu relativního zmenšení písma a podobně.

Vím že by asi potřeboval udělat sloučení vybraného bloku a ne procházet celý dokument. Ale když by to potřeboval doslova takto, tak musí zadat slovo které se musí vyhledat. To je zdlouhavé, ale i to by makrem udělat šlo. Obecně jsem nabídl řešení které ale není finální - jen jsem potřeboval upřesnit jak by to vyhovovalo. Nevím - autor to zřejmě vzdal.

Netwalker · 15. 10. 2016 19:13:41

Pro neutr: Já Tě obdivuji. Dlouho sleduji příspěvky a jen Ty se snažíš každému pomáhat. Ale myslím, že u pdf nemáš pravdu. Pokud opravdu někdo potřebuje systematicky upravovat pdf soubory v rámci své práce, je potřeba použít profesionální řešení (nikdy jsem to nepotřeboval, ale asi Photoshop pro Datasheet, Adobe Acrobat pro rozsáhlejší dokumenty). Ale přímo definice pdf od Adobe říká, že je to přenosný formát pro správné zobrazování na všech platformách. Ano, později se doplnila možnost formulářů a jiné fičurky, ale pořád primárně je určen ke čtení. Pokud dělám pro zahraniční firmu a potřebuji předělat jejich datasheet do češtiny, tak buď je to snadné a použiju Draw anebo je to komplikované a vyžádám si zdrojový soubor. A pokud budu udržovat více dokumentů, které jsem po někom "zdědil" v pdf a vím, že do nich budu občas něco dopisovat/přepisovat, tak je primárně mou snahou si to ulehčit i do budoucna - tedy pomocí OCR převést na editovatelný soubor, který kdykoliv otevřu, upravím a vyexportuji do pdf. Jak už jsem psal v předchozím příspěvku - občas taky upravuju pdf (třeba pomocí draw). Ale není to systémové řešení.

Sladecek · 17. 10. 2016 09:44:22

Moc děkuji neutr za snahu a pomoc, je to přesně tak, jak píše. Ještě to vyzkouším.
Samozřejmě - návrh Netwalker je sice hezký, ale pro mne nepoužitelný - většinou z firmy nejde vyrazit zdrojový text vůbec, a pokud ano, tak je dost často skládaný tak strašně, že se skoro nedá upravit - jakákoli úprava ho rozhodí, protože nevyužívá důsledně styly, vnořuje třeba více tabulek s obrázky a rámci do sebe apod. a hodně záleží na tom, v čem se soubor otevírá (zřejmě úprava čínského textu do angličtiny). I když je třeba zdrojový text ve Wordu, tak je v jiné verzi Wordu nebo stejné verzi v jiném PC úplně rozhozený, takže pokud to jde, tak používám Writer z LO, ale často je pdf a Draw jediné řešení. Z těchto důvodů také využívám téměř výhradně LO, většinou v nejnovější verzi, který je aspoň kompatibilní sám se sebou, i když mívám problémy u velkých souborů, kde je už pomalý. Do budoucna většinou použít předešlé verze zpracovávaných souborů nejdou, a pokud je používám, tak je mám uložené sám.

Netwalker · 17. 10. 2016 10:59:14

Pro Sladecek:
Abych jen netvrdil, jak by to mělo být. Pokud někde seženeš "Foxit pdf editor" (pozor firma foxit ho už nevyvíjí, ale na některých serverech by se dal stáhnout - má cca 4 MB), tak budeš překvapen, že splní to, co potřebuješ. S Draw mám zkušenost, že u některých pdf rozhodí formátování.

neutr · 17. 10. 2016 11:00:32

Už jsem myslel, že jste to vzdal. Když tomu tak není potřeboval bych konkrétnější popis.
Nyní se zobrazují všechny textové položky. V tom dialogu se musí pochopit, že když nahoře je "prázdný řádek" a dole něco je, tak se sloučí mezera + text - což je zřejmý nesmysl. Ty prázdné "řádky" vznikají tak, že je to buď mezera udělaná ve zdroji, ale častěji se objevují mezery které jsme dostali vyjmutím textu.
Mezery - respektive prázdná textová pole by měla po aktualizaci zmizet, a tak aby to nemátlo problikáváním - nepoužil jsem tuto možnost. Lze ovšem nalistovat až další "neprázdný" textový rámec. To lze udělat poměrně snadno, ale stejně nejprve musíte pochopit co se při prohledávání a slučování děje. Takže to bych zabudoval v případě, že byste upřednostnil plnou a nebo lavinovitou metodu slučování.

Myslím ale že byste spíš využil sloučení určitého odstavce. To znamená, že byste do dialogu zadal kopii obsahu prvního slučovaného textu. Potom by makro našlo zadaný text a postupovalo by se obvyklým dotazem na sloučení.
Mohu upravit trochu i dialog tak aby se po sloučení dalo následně listovat a prohlížet. Při tom by se zobrazovaly například 3, nebo 4 následné texty. Jakmile zjistíte, že by to chtělo sloučit, zapnete slučování. Je možné zadat také "přidat" další text, čímž by se pod návrh slučovaných textů přidal další řádek textu (za předpokladu že nenásledují jiný typ objektu).

Výsledný typ maker by se mohl uložit jako výchozí šablona DRAW. Tím by se automaticky PDF otevíralo v souboru s makry. Je ovšem možné zadat knihovnu jako rozšíření a stávající výchozí šablona bude obsahovat makra také.

Sladecek · 17. 10. 2016 20:13:48

Pro Netwalker
Foxit pdf editor znám, ale umí v podstatě totéž, co Draw, snad o trochu líp, ale textová pole zůstávají, někdy i několik na řádku. Dá se sehnat i novější verze, kde jde export do Wordu, ale není moc dokonalá. Takže problém zůstává.
pro neutr
díky, snad se k tomu zítra dostanu na vyzkoušení, ještě jednou díky za snahu (je to zajímavý problém)

Sladecek · 25. 10. 2016 17:46:44

Vyzkoušel jsem, i takhle to půjde použít.
Bohužel jako rozšíření to nedokážu udělat, ale jako makro to jde (kromě 1. varianty, tam se mi to pořád přepisuje přes sebe).
Kdybych to dokázal, udělal bych rozšíření, kde by se ta pole, která chci sloučit vybírala myší.

neutr · 26. 10. 2016 09:35:07

Jestli to chápu správně tak byste potřeboval rozšíření které najde vybraný text a začne slučovat. Není to problém. Já jsem ale nyní asi až do neděle mimo domov. Zde nemám svoje knihovny a v podstatě vše co udělám musím dříve či později smazat.
Když bych to věděl dopředu vzal bych si flešku. Není to můj stroj a tak jsem rád že se dostanu vůbec na net. Nicméně myslím, že by se mi to mělo podařit jen s tím, co v tom druhém vzoru je. V každém případě to asi nebude rychle, ale pokusím se.

Jen pro Vaši informaci když otevřete okno basicu (ide) tak tam existuje možnost vyexportovat knihovnu jako soubor .bas který můžete načíst pokaždé když potřebujete. Když byste to používal opravdu často tak to makro stačí uložit do "moje makra standard". Bude k dispozici vždy. Někdy je ale nutné zadeklarovat "global". Já to nemám rád protože někdy dochází k načtení jiného makra nežli potřebuji. To je ale vyšší dívčí protože musí být buď shodné jméno funkce, subroutine nebo proměnné. A tak přestože mám centrální knihovnu jiného jména nežli standard používám překopírované makra s oblišným názvem a proměnnými - a i tak se mi to někdy stane - nechtěně se strefím. Je to tím že těch vzorů mám opravdu hodně.
Když by Vás to zajímalo víc do hloubky, tak bych doporučil Builder (Basic addon builder od P. Mantovaniho ExtensionsPackager. Faktem je, že rozšíření neudělá nic jiného než to, že nahraje mezi "vaše makra - jméno knihovny" ale může to být i do "Moje makra Standard" zadané makro - to můžete udělat ručně je tam navždy stejně jako když uděláte rozšíření. Rozdíl je jen v tom, že rozšíření můžete smazat dialogem "správce rozšíření" ale ručně zadané makro musíte smazat také ručně. Při aktualizaci se knihovny přenáší do nové verze.

Problém je s tím vyhledáváním. Kód se musí upravit tak aby hned našel zadané (zkopírované) heslo. Neumí v podstatě najít blok který by označil více textových polí (možná to jde ale to bych musel otestovat). Umí to najít jen jediný "modře vysvícený" blok. Když zadáte více textových bloků tak vznikne "zelený" rámeček ale ten má charakter obdélníku a často bude zahrnovat i něco nechtěného. Takže stejně by při nahrazování došlo na dotaz - "sloučit-přeskočit". Faktem je že když bude vybrán jen jediný blok - bude obsahovat například jediné slovo, tak to může být v listu Draw na začátku věty x-krát. Ale když se zobrazí co je za ním, měl byste vybrat správně a to sloučit. Ostatní případy odentrovat.

Pokusím se to udělat odpoledne.

Editoval neutr (26. 10. 2016 09:39:36)

Sladecek · 26. 10. 2016 17:46:17

Děkuji za pomoc, na to rozšíření si netroufám.
Nespěchá to, jen mě zajímalo řešení.

neutr · 26. 10. 2016 19:00:57

Dobře událeám to po neděli.

neutr · 4. 11. 2016 21:34:03

Tak jsem měl chvíli. Podívejte se jestli to stačí. Vyhledávání pomocí zadaného hesla. Pokud budete obsah kopírovat, musíte to rozkliknout a vybrat tak aby byly vybrány (tmavé pozadí) potřebné znaky. Čím více tím lépe protože při zadání jednoho nebo dvou písmen se vrátí mnoho možností a ztratíte orientaci. Hledaný řetězec se najde i uprostřed slova. proto většinou musíte spoléhat na paměť který rámec jste myslel. Pochopitelně nejlepší je vybrat vše co je v rámci.

Také bych asi doporučil v některých případech manuálně vložit na začátek rámce specifický řetězec který se jednoznačně (snadno a rychle) najde. Po sloučení je snadné vložený řetězec smazat.
Lepší už to asi nebude. Pro slučování je zobrazen vyhledaný text + 2 následující taxtové rámce. Ale má to problém. Slučování je sice vidět v dialogu i na stránce (pokud text není překryt dialogem), ale někdy nestačí k identifikaci ani 2 následné rámce.

Je zabudováno i automatické (ale slepé) rozdělování, nebo je tam doporučení že je lepší řetězec rozsekat manuálně. Myslím že po otestování potvrdíte, že automatické rozdělení je celkem zbytečné. Získáte jedině orientaci že se "vejde" nebo "nevejde" do stránky. Je to ale pofidérní vzhledem k velikosti fontu a k okrajům, popřípadě k začátku slučování které může být uprostřed řádku. Automat se strefí jen náhodou u krátkých textů.

Až si uděláte názor, tak napište co předělat - je tam hodně dialogů které při rutinné činnosti překáží. Nejvýš by asi pomohlo vytvoření klasického dialogu, který se dá ukotvit na pevné umístění aby bylo vidět co se slučuje. Ale bez velkého monitoru ani tohle nepomůže :-(

Sladecek · 8. 11. 2016 20:46:11

Díky, to funguje. Jen u automatického rozdělení vynechává 1 znak na začátku dalšího řádku (ne vždy) - ale to stejně nevyužiji.
Zůstává ale ještě jeden problém, o kterém jsem se nezmínil: totiž když se textová pole překrývají v umístění, tak to menší pole je ignorováno. Typické je to například u text. polí, kde je třeba horní index - třeba mm2 (ta 2 je horní index).
Nevím, jestli by to šlo vyřešit pro překrývající-se pole, ale i takto je to šikovná pomůcka. Děkuji za ní.

neutr · 9. 11. 2016 08:47:56

- S tou mezerou na začátku se celkem nic dělat nedá. Makro sloučí řetězce z různých následných textových rámců. Z toho vznikne jeden dlouhý rámec. Makro následně řetězec rozseká na kousky které obsahují předem nastavený počet znaků (míst řetězce). Tím se snadno stane, že je rozděleno slovo někde v půlce a je to z pohledu pravidel ČJ nesprávně. Klidně to usekne jen tečku která je pak na začátku řádku, za ní mezera a pak následující věta.
U tohoto postupu je relativně nevhodné přidáván CHAR(10) = nový řádek. Zvětšuje totiž délku řetězce ačkoliv není vidět a sám nemá viditelný rozměr. Zásahy do délky řetězce jsou obecně nežádoucí. Poměrně snadno by šel spustit nad sloučeným řetězcem cyklus, který by smazal dvojité mezery, nebo jiné netisknutelné znaky.
Ty mohou mít různou příčinu ve zdroji textového rámce, nebo i mezi rámci. Problém je v tom, že smazané znaky vytvoří mezeru kterou by někdy bylo nutné pořešit. Většinou by zůstalo u nehezké mezery. Mohl by to být řádek i více.

Právě proto jsem uváděl, že sloučený řetězec je vhodněší odřádkovat ručně - ale za to přesně. Samo sebou to chce určitý návyk jak s tím pracovat. Takže ty mezery na začátku, nebo špatně rozdělená slova musíte opravit ručně.

Podobně to je s těmi indexy. Já takto z voleje nevím jestli má index nějaký vlastní malý rámeček (shape) nad základním rámcem řetězce, nebo jestli je to běžný ale úzký prostor textu. Ten může být jen chybně vyhodnocen jako mezera.
Problém je když by to byl nestandardní samostatný rámec nad běžným textem který se nenačte. To může mít několik příčin :
- ukotvení k mřížce
- jiný nežli textový rámec (obrázek)
- jinou vrstvu (nad/pod tou kde je text)
Navíc různé typy PDF mohou obsahovat různá řešení pohoto problému-

Proto bych doporučil otestovat nejprve zda není index ukotven samostatně. Když se na něj klikne, tak by se vybral (orámoval) jen index. Pak jde o to, zda není přichycen k mřížce - na to je nástroj který by ho odepnul a pak by se to mohlo načíst správně.
Když to bude obrázek tak se ani tak nenačte. Musel by se manuálně přemístit. Možná stačí jen vybrat a odkrokovat protože může být v jiné vrstvě na kterou se musí přepnout, nebo umístit hlavní text na pozadí (to je přepínání mezi objekty a vrstvami).
Další možností by bylo předem rozdělení rámce před indexem a sloučit vše až k indexu. Následně výraz s indexem (nebo jen index) připsat na konec sloučeného textu. Původní výraz ručně smazat a spustit znovu sloučení.
Podobně lze oddělený výraz horního indexu někdy nahradit speciálním znakem. To byste ale musel vyhledat a pak manuálně vložit na správné místo.
Když by index byl polem ve stejné vrstvě, mělo by jít předem spojit objekt textu a indexu (případně odpojit od mřížky).
Dalším řešením by bylo smazání a nahrazení matematickým výrazem pro index - stříška (příklad a^2). Bylo by to zvětšení řetězce o 2,5 znaku. Většinou by se to mělo vejít. nebo maličko posunout celý rámec.

V žádném případě asi nebude možné použít tentýž postup na různé druhy PDF. Prakticky to znamená vždy manuální úpravu. Je to dost limitní záležitost. Jiným řešením by bylo namapovat celý obrázek s identifikací polí a jejich obsahem. Tento protokol pak vyhodnotit a upravit + vytvořit nový obrázek, nebo vše v původním smazat a vložit upravný obsah.
Mapování obsahu (byť se jedná o vektory) už je poměrně náročné na všechny prostředky. Objekty se odlišují názvem typu rámce, ale jednotlivé rámce nejsou označeny - mají jen souřadnice. Co je uvnitř se musí také zmapovat. To by už byl velký projekt. Běžně se toto řeší pomocí XML filtrů. Makrem je to hrozně pomalé - byť asi univerzálnější nežli specializovaný filtr. Do toho bych se už asi nepustil.

Editoval neutr (9. 11. 2016 08:51:46)

OpenOffice.cz - web věnovaný kancelářským balíkům OpenOffice.org

#1 7. 10. 2016 22:07:35

Sloučení textových polí do jednoho

#2 7. 10. 2016 22:08:56

Re: Sloučení textových polí do jednoho

#3 8. 10. 2016 04:49:06

Re: Sloučení textových polí do jednoho

#4 8. 10. 2016 19:05:20

Re: Sloučení textových polí do jednoho

#5 8. 10. 2016 19:34:12

Re: Sloučení textových polí do jednoho

#6 8. 10. 2016 21:21:16

Re: Sloučení textových polí do jednoho

#7 9. 10. 2016 18:35:22

Re: Sloučení textových polí do jednoho

#8 9. 10. 2016 19:19:35

Re: Sloučení textových polí do jednoho

#9 14. 10. 2016 14:54:38

Re: Sloučení textových polí do jednoho

#10 14. 10. 2016 16:01:49

Re: Sloučení textových polí do jednoho

#11 14. 10. 2016 17:49:17

Re: Sloučení textových polí do jednoho

#12 15. 10. 2016 15:38:38

Re: Sloučení textových polí do jednoho

#13 15. 10. 2016 18:22:19

Re: Sloučení textových polí do jednoho

#14 15. 10. 2016 19:13:41

Re: Sloučení textových polí do jednoho

#15 17. 10. 2016 09:44:22

Re: Sloučení textových polí do jednoho

#16 17. 10. 2016 10:59:14

Re: Sloučení textových polí do jednoho

#17 17. 10. 2016 11:00:32

Re: Sloučení textových polí do jednoho

#18 17. 10. 2016 20:13:48

Re: Sloučení textových polí do jednoho

#19 25. 10. 2016 17:46:44

Re: Sloučení textových polí do jednoho

#20 26. 10. 2016 09:35:07

Re: Sloučení textových polí do jednoho

#21 26. 10. 2016 17:46:17

Re: Sloučení textových polí do jednoho

#22 26. 10. 2016 19:00:57

Re: Sloučení textových polí do jednoho

#23 4. 11. 2016 21:34:03

Re: Sloučení textových polí do jednoho

#24 8. 11. 2016 20:46:11

Re: Sloučení textových polí do jednoho

#25 9. 11. 2016 08:47:56

Re: Sloučení textových polí do jednoho

Zápatí