Vytěžování obsahu dokumentů

Vlastní model na bázi strojového učení, využívající neuronové sítě, určený pro vyčítání informací z dokumentů.

Vyčtení obsahu dokumentu

Pomocí OCR a AI/ML technologií získá data z libovolného dokumentu. Ať již je to obrázek či třeba PDF dokument. Klíčové je, že prostý získaný text dokáže správně rozčlenit dle obsahu, políček a významu jednotlivých částí.

Neustálé učení

Nathan AI model se neustále učí nové věci – jak pochopení různých nových typů dokumentů, tak různé akce na další transformaci a zpracování informací.

Otevřené a modulární technické řešení

Modulární řešení s modelem na bázi strojového učení. Založeno na servisní architektuře s API rozhraním. Možno využívat i jen jednotlivé moduly.

Klíčové vlastnosti

  • Model aktuálně natrénován na vyčítání českých faktur a účtenek (95%).
  • Možnost doučení modelu na specifické a opakující se doklady pro ještě vyšší úspěšnost.
  • Možnost napojení na libovolný systém pomocí API rozhraní.
  • Součástí administrační rozhraní pro řízení přístupu a statistiky.
  • Integrované nástroje pro optimalizaci (pre-processing) vstupních obrazových dat.
  • Možnost nasazení post-processing nástrojů pro kontrolu a doladění výstupních dat.
  • Provoz možný jako externí služba či instalace přímo do cloud či on-premise prostředí klienta.
  • Je možné provést úpravy a natrénování na libovolné jiné typy dokumentů.

Bezpečné a GDPR ready řešení

Služba běží na zabezpečené infrastruktuře a v případě potřeby může běžet i ve vašem prostředí (on-premise, privátní cloud, hybridní prostředí). Data tak neodchází ke zpracování třetí stranou.