V databázi Zemského archivu v Opavě jsou kromě severní Moravy také sčítací operáty pro Slezsko. Postupně jsou indexovány a v některých je již nyní možno vyhledávat fulltextově (jméno, příjmení).
Nevíte někdo jak na AI aby uměla číst staré písmo? Jsem v 18 století a tam už je to peklo ...
AI může trochu pomoci. Kurent a jiný škrabopis nepřečtou přesně, ale často mě navedou směrem, který mě před tím nenapadl. Kombinuji ChatGPT (zde hlavně přemýšlivé modely o), zkouším Perplexity.Mám ale docela dobrou zkušenost s latinou, té AI chatboty vcelku rozumí.
PRoč se vlastně nezaptat AI? 🙂Transkribus – Nejlepší software pro historické rukopisy. Používá strojové učení na rozpoznávání různých druhů historického písma a je možné ho trénovat na konkrétní rukopisy.Google Cloud Vision OCR – Umí dobře rozpoznávat tištěné i psané texty, ale pro starší rukopisy není tak přesný jako Transkribus.Tesseract OCR – Open-source nástroj od Google, který lze trénovat na různé fonty a písmo, ale u historických dokumentů může vyžadovat úpravy.HTR+ (Handwritten Text Recognition) – Pokročilá technologie v rámci Transkribus, která je speciálně určena pro rukopisné texty.Ale problém bude s CZ ... i když ... jsou tam možné další modely ... jdu zkoušet 🙂
Názor byl 2× upraven, naposled 15. 2. 2025 09:44
Transkribus má dobře našlápnuto, ale model pro CZ není dokonalý, i když nějaká slova to rozpoznalo.Asi by bylo pěkné, kdyby se to pustilo na celé archivy. Jenže kdo to zaplatí 🙂
Model pro CZ - ono jak jsem se dostal v matrikách ke kurentu, tak už to bylo stejně německy.
https://transkribus.ai/
Díky za tip... musím na to doma mrknout.
Já jsem spokojen https://ctrlv.cz/xfLb
Zde spíše platí pravidlo, že pokud se chci seriózně zabývat rodokmenem, tak se kurent musím naučit a nečekat, že zápisy rozluští někdo za mě 😉
Ano, seriozně se tím chci zabývat v rámci volného času a protože to není moje hlavní náplň, tak se ptám, jak jsou moderní technologie daleko.
Je pravda, že dnes už přečtu zápisy na které jsem před deseti lety nevěřícně zíral. Přesto mám občas pocit, že někteří faráři místo písma jen malovali vlnovky.I když přečtu mnohem více, stále jsem začátečník... některá slova člověk přečte, jiná si odvodí podle zvyklostí zápisu, některá prostě nejdou.
šotek: Po ručním popsání formulářů se začalo „dírkovat“. Úřad měl nakonec k dispozici 24 strojů, začal v dubnu 2021 a skončil v červenci 1922. Štítky se následně třídily a skládaly, statisticky zpracovávaly.
Taky bych chtěl práci, u které omládnu skoro o 100 let.
Potvrďte prosím přezdívku, kterou jsme náhodně vygenerovali, nebo si zvolte jinou. Zajistí, že váš profil bude unikátní.
Tato přezdívka je už obsazená, zvolte prosím jinou.