Vytěžování obsahu dokumentů

Vlastní model na bázi strojového učení, využívající neuronové sítě, určený pro vyčítání informací z dokumentů.

Vyčtení obsahu dokumentu

Pomocí OCR a AI/ML technologií získá data z libovolného dokumentu. Ať již je to obrázek či třeba PDF dokument. Klíčové je, že prostý získaný text dokáže správně rozčlenit dle obsahu, políček a významu jednotlivých částí.

Neustálé učení

Nathan AI model se neustále učí nové věci – jak pochopení různých nových typů dokumentů, tak různé akce na další transformaci a zpracování informací.

Otevřené a modulární technické řešení

Modulární řešení s modelem na bázi strojového učení. Založeno na servisní architektuře s API rozhraním. Možno využívat i jen jednotlivé moduly.

Klíčové vlastnosti

Model aktuálně natrénován na vyčítání českých faktur a účtenek (95%).
Možnost doučení modelu na specifické a opakující se doklady pro ještě vyšší úspěšnost.
Možnost napojení na libovolný systém pomocí API rozhraní.
Součástí administrační rozhraní pro řízení přístupu a statistiky.
Integrované nástroje pro optimalizaci (pre-processing) vstupních obrazových dat.
Možnost nasazení post-processing nástrojů pro kontrolu a doladění výstupních dat.
Provoz možný jako externí služba či instalace přímo do cloud či on-premise prostředí klienta.
Je možné provést úpravy a natrénování na libovolné jiné typy dokumentů.

Bezpečné a GDPR ready řešení

Služba běží na zabezpečené infrastruktuře a v případě potřeby může běžet i ve vašem prostředí (on-premise, privátní cloud, hybridní prostředí). Data tak neodchází ke zpracování třetí stranou.

Do you have an interesting project? Can we help you with?
Do not hesitate to contact us.

PARDUBICE
Čechovo nábřeží 1790
530 03 Pardubice
Czech republic

PRAHA
Radlická 714/113a
158 00 Praha 5
Czech republic

+420 246 097 018

PLZEŇ
Farského 540/12
326 00 Plzeň
Czech republic

+420 246 097 018