Fórum pro uživatele kancelářského balíku OpenOffice | LibreOffice
 

#1 1. 7. 2023 05:00:25

jik
Člen
Registrace: 28. 6. 2009
Příspěvků: 43

Vyčištění dokumentu

Dobrý den,
používám LO pro překlady poměrně velkých souborů. Ale protože zdrojové soubory jsou z různých zdrojů a většinou doc/x, tak na začátku provádím "vyčištění" - tedy vyexportuji do html a textovým editorem (používám kwrite - zvládá záměny v režimu escape sekvencí i regulárních výrazů) z toho vyhodím spousty značek (velikost souboru se běžně zmenšuje o 1/4 - 1/3). Naprosto běžně tam je například takovýto bordel:

<p align="justify" style="line-height: 0.51cm; text-indent: 0.85cm; margin-bottom: 0cm; background: #dddddd">
<font color="#000000"><font face="Cambria, serif"><font size="3" style="font-size: 12pt">Cosi
napsaného a takto
roztrhaného.</font></font></font></p>

a takto podobně to je odstavec za odstavcem (nemluvě o obsahu, poznámkách pod čarou ad.). Pokud tyto nesmysly z toho vyhodím a převedu to do podoby:

<p>Cosi napsaného a takto roztrhaného.</p>

potom to znovu natáhnu do LO, tak se jednak to jednak stane podstatně rychlejší a jednak podstatně "formátově stabilnější". Je nějaká možnost, jak alespoň částečně toto udělat přímo v LO? "Vymazat přímé formátování" tady nepomůže. Případně se tímto přimlouvám za to, aby nějaká takováto funkce v LO vznikla.

Offline

#2 1. 7. 2023 07:12:04

neutr
Člen
Registrace: 8. 3. 2007
Příspěvků: 3,436

Re: Vyčištění dokumentu

Nějak mi uniká smysl toho převodu doc(x) na html. Jediný důvod vidím v možnosti překládat pomocí nějakého online translátoru, ale například dnes je Google už velmi dobrý - často překládám - dnes už postačuje většinou 1x rekurzívní překlad pro kontrolu a nemusím dělat nic dalšího.


     Translátor umí překládat celé sešity doc(x) a proto mi to co popisujete připadá zbytečné. Jo lze pochopit převod z html zdroje do Wordu, respektive Writeru, ale nikoliv Word - html - Writer. Možná mi něco uniká. Třeba souvislosti s tím jak html vytvoří složku s grafikou, kterou automaticky extrahuje, nebo něco jiného. Vím například o značkách (speciální pole), které se ve Writeru nacházejí po převodu z Wordu jako neoznačené, ale dají se buď smazat, nebo nahradit.


     Prostě podle mne lze vše snadno exportovat do Writeru ať už Word, nebo Html (Html5) přímo. Writer umí převody z a do Html dvěma způsoby. Buď Běžný Writer, nebo Writer Html. Možná byste mohl blíž vysvětlit co tím převodem získáte.


Moje e-mailová adresa
Pokud je Váš problém vyřešen, označte prosím svůj příspěvek za "VYŘEŠENÝ"
Zlepšíte orientaci při vyhledávání řešení JAK OZNAČIT TÉMA ZA VYŘEŠENÉ

Offline

#3 1. 7. 2023 20:45:50

jik
Člen
Registrace: 28. 6. 2009
Příspěvků: 43

Re: Vyčištění dokumentu

Píšete o dvou různých věcech:
Ano já vím, že to co padá z deepl je skutečně slušné (sám to používám) - ale a bez omluvy - čeština to není, to je hnůj a ničení naší schopnosti uvažovat. Aby to skutečně byla dobře čtivá čeština, musíte:
a) nahradit přejatá slova
b) říkám tomu "zpřímočařit" souvětí (částečně "rozpuštěním" vedlejších vět, nebo záměnou vedlejších vět za hlavní anebo použitím přechodníkových vazeb - jejich opomíjení je strašlivá chyba češtinářů - čtivost obrozenecké literatury je z tohoto důvodu nesrovnatelně lepší, než dnešní výplody, o strojových překladech nemluvě)
c) "počeštit" větnou stavbu (zvratná zájmena, obecniny atd. atd.), použít správné pořadí větných členů s ohledem na důraz...
... a jen tak mimochodem - jsem technik, ne češtinář. Dám Vám tip: zkuste rychločtení - to Vám rychle ukáže, kde jsou slabiny strojového překladu. Takže deepl používám, ale po odstavcích a toto, co jsem tady napsal, tam hned opravuji - je to totiž nakonec nejrychlejší.

A druhá věc je to vyčištění formátu. Tím získám jednak rychlou odezvu (zkuste natáhnout takovýto zaplevelený soubor s 1000 normostranami - to je už takřka nepoužitelné) a jednak to, že to, co je na jednom místě na začátku práce na tomto místě také zůstane i na konci práce. To je totiž ten rozdíl mezi WYSIWYG a WYSIWYW a to považuji za velice cennou vlastnost. Toto jsem ostatně dělal i předtím, než jsem začal překládat. Jinak: v LO jsem vcelku bez potíží vysadil a vytiskl knihu právě s těmi 1000 normostranami.

Offline

#4 5. 7. 2023 11:55:46

kamowski
Člen
Registrace: 29. 3. 2013
Příspěvků: 40

Re: Vyčištění dokumentu

chyba

Editoval kamowski (5. 7. 2023 11:59:58)

Offline

#5 6. 7. 2023 09:04:25

kamowski
Člen
Registrace: 29. 3. 2013
Příspěvků: 40

Re: Vyčištění dokumentu

jik napsal(a)

...Je nějaká možnost, jak alespoň částečně toto udělat přímo v LO?

iste,
ak už sa ti to načítalo do LO, tak to ulož ako txt a toto si načítaj znova do LO (alebo iného editoru), k úprave
ak odstrániš všetok ten "bordel", tak o pôvodné formátovanie ti zrejme nejde
niektoré veci si otvorím v calibre, prevediem do fb2, txt, ..., a toto otvorím v LO a ďalej spracujem podľa potreby, fb2 zachová nadpisy (ak boli definované)
calibre dokáže veľa vecí, nie je to len hlúpa polica na knihy smile
ak viac rozvinieš diskusiu, možno sa k niečomu dopracuješ, určite je nás viac, čo upravujeme dokumenty

Offline

#6 10. 11. 2023 10:39:12

jik
Člen
Registrace: 28. 6. 2009
Příspěvků: 43

Re: Vyčištění dokumentu

Dělám překlady a sazbu knih a i když se to mnohým bude zdát divné, sazbu hladkého textu dělám v LibreOffice. Ale to je možné právě a jenom pouze tehdy, pokud je zdrojový dokument "čistý" a běží to v prostředí Linuxu (jediný rasterizér pro obrazovku i tiskárnu). Představuje to ohromné časové úspory oproti používání jakéhokoliv sázecího programu (Scribus, ..Tex, Ventura, ...daleko nejlepší byl starý XPress). To je celý důvod.
Co se týče ukládání přes TXT, tak to nejde například při používání poznámek pod čarou. V takovém případě potřebuji mít takovou podobu dokumentu, kterou mohu editovat čistým textovým editorem (s pomocí regulárních výrazů) a zároveň mám zachovanou strukturu text. Při exportu do XHTML se právě toto zachová a po vyčištění textu stačí tento text natáhnout zpět a vytvořit požadované formáty.

Offline

Zápatí