facebook LinkedIN LinkedIN - follow
IT SYSTEMS 5/2024 , AI a Business Intelligence , DMS/ECM - Správa dokumentů

Vytěžování faktur a účtenek pomocí AI

Jak to skutečně funguje

Dalibor Lukeš


Jedním ze způsobů využití umělé inteligence v podnikových proce­sech je vytěžování dat z doku­men­tů. O základních principech a možnostech vytěžování doku­mentů pomocí AI pojednával můj článek v minulém čísle IT Sys­tems, na který bych nyní chtěl navázat a podrobněji rozebrat praktické aspekty této tech­no­lo­gie v oblasti účetnictví, finanční správy a auditu. Konkrétně se zaměřím na automatizované vytěžování dat z faktur a účtenek, které umožňuje ušetřit čas, peníze a lidské zdroje. Jak funguje tato technologie? Jaké jsou její výhody a omezení? A jaké jsou skutečné zkušenosti firem, které ji používají?


Jak to bývalo nebo možná někde ještě je

Vytěžování faktur a účtenek bez využití AI bylo zdlouhavé a náročné. Buď bylo nutné ručně přepisovat data z papírových nebo digitálních dokumentů do elektronické podoby, což zvyšovalo riziko chyb a ztráty informací, nebo používat klasické systémy optického rozpoznávání znaků (OCR), které vyžadovaly vytváření a udržování specifických šablon pro každý typ faktury a dodavatele. To znamenalo, že jakákoli změna ve formátu nebo obsahu faktury vyžadovala aktualizaci šablony, což bylo časově i finančně nákladné. Bohužel si řada lidí myslí, že tato praxe funguje stále stejně, a nepostřehli změnu, kterou přineslo využití umělé inteligence, přesněji její součást s označením strojové učení (Machine Learning, ML).

Nastupuje umělá inteligence a mění hru

Umělá inteligence na bázi strojového učení totiž přináší několik významných změn oproti dřívějším metodám zpracování faktur a účtenek. Mezi ně patří především výrazně vyšší přesnost extrakce dat z různých typů a formátů dokumentů, bez nutnosti vytvářet a aktualizovat šablony pro každého dodavatele nebo zákazníka, či možnost adaptace a učení modelů na požadavky konkrétního klienta, což umožňuje zpracovat i nestandardní, složité nebo nové typy dokumentů. Současně je využití této technologie stále jednodušší a postupně i ekonomicky dostupnější než dříve. Na trhu je na výběr hned několik různých řešení, která se dají integrovat do podnikových systémů, a to jak ERP, CRM či DMS a workflow. Tato řešení můžete dle počtu dokumentů a citlivosti údajů využívat buď jako cloudovou službu, nebo je možné některé z nich nasadit i přímo ve vašem datovém centru. Poslední dobou tyto nástroje, ať již vlastní, nebo externí, začínají do svých systémů integrovat jak globální, tak lokální producenti ekonomických a účetních programů. Což mi ve finále přijde jako nejlogičtější varianta.

Nastavte si správná očekávání

Řešení tedy existují, ale rovnou si na rovinu řekněme, že dosáhnout 100% úspěšnosti není úplně reálné a plně automatizované zpracování faktur či účtenek je také zatím spíše snem. Vždy tam zatím bude muset být kontrola zkušeným účetním a případné doplnění nebo upřesnění. I tak má ale vytěžování smysl a velký přínos. Je totiž opravdu rozdíl mezi přepisováním celé faktury a opravou, či doplněním, jednoho nebo dvou údajů. Pokud tedy budeme brát AI jako nástroj odebírající dle praktických zkušeností zhruba 60–80 % práce při zpracování těchto dokladů, budeme mít stále velice slušnou návratnost a k tomu zlepšení spokojenosti lidí, kteří nebudou muset dělat tolik rutinní práce. Další úspory času a zrychlení procesu se dají získat optimalizací před a po zpracování dokladů, například kontrola vůči objednávce, dopočítání a kontrola sazeb DPH, a pochopitelně optimálním napojením na schvalovací procesy. O tom ale třeba v některém z dalších článků.

Když 95 % není 95 %

Při diskusích o úspěšnosti vytěžování dat z daňových dokladů pomocí umělé inteligence se často setkávám s otázkou na procentuální úspěšnost. Někteří výrobci těchto nástrojů uvádějí číslo někde mezi 90 a 95 %. Lidé si pak často myslí, že jen 5 % faktur je pak potřeba ručně upravovat a zbytek je úplně v pořádku. Bohužel je to lehce zavádějící údaj. Často je toto číslo totiž vztaženo k úspěšnosti vytěžení všech políček/položek na faktuře nebo dokladu. Je tedy lepší se ptát, kolik procent faktur projde bez jediné chyby, kolik s jednou, se dvěma atd. Například 60 % faktur bez jediné chyby je už slušný výsledek. Druhým aspektem je pak úspěšnost při porovnání vytěžování hlavičky faktury (dodavatel, datum vystavení, splatnosti, číslo objednávky, daňová tabulka, cena celkem…), kde bývá úspěšnost vcelku vysoká, a při vytěžování i všech položek na faktuře. Zde je, i díky „kreativitě“ autorů faktur, někdy problém poznat jednotlivé položky i při posouzení zkušeným člověkem. Tedy zákonitě pak je úspěšnost nižší a může ovlivnit celková čísla. A velmi pak záleží, zda takto podrobné vytěžování je vlastně potřeba. Často se setkávám s tím, že například menší firmy vůbec položky do účetnictví nepřenáší, a u velkých je to zase naopak navázáno na konkrétní objednávku a tam už je struktura položek zadána a je naopak žádoucí ji dodržet jednotnou v rámci systému. Tak jako tak, je důležité vědět, jak jsou procenta úspěšnosti v konkrétním případě počítána a co je vlastně zadáním.

Způsoby zapojení AI do procesu

Dalším důležitým bodem ke zvážení v případě nasazování AI nástrojů pro vytěžování faktur či účtenek je způsob zapojení tohoto nástroje do celého procesu a navazujících SW – ať již ERP, či jiných. Variant je řada, tak jako je řada firem, které o nasazení uvažují. V praxi se ale nejčastěji setkávám s následujícími čtyřmi:

  1. Samostatný externí nástroj na vytěžování a zpracování. V tomto případě se nasadí ucelený software, který zahrnuje celý proces příjmu, vytěžení, kontroly, případného schvalování, někdy i platby. Pak se výsledná data „jen“ přenesou do ekonomického/účetního softwaru. Výhodou těchto řešení je kompaktnost řešení a relativně rychlé nasazení. Často jsou to ale na druhou stranu řešení poskytovaná jako služba a bez možnosti úprav pro potřeby konkrétního klienta. Hodí se tak spíše pro menší společnosti.
  2. Vytěžení a přenos do ekonomického systému. Druhou, relativně základní variantou je situace, kdy se faktury/účtenky základní obslužnou aplikací pošlou na vytěžení a data jsou pak rovnou zaslána do ekonomického systému pro další zpracování, jako je kontrola či schvalování. Tato varianta bývá použita v rámci pilotních nasazení.
  3. Obslužná aplikace pro zpracování. Ve středně velkých společnostech se nejčastěji setkávám s variantou, kdy prim hraje procesní aplikace. Tedy příjem, kontrolu, zpracování a schvalování zajišťuje interní aplikace (například v rámci nějakého DMS, nebo agendového řešení). V tomto případě si v jednu chvíli tato aplikace zavolá AI nástroj pro konkrétní dokument a dostane zpět vytěžená data k dalšímu zpracování. No a na konci je opět přenos dat ERP/účetnictví pro finální zaúčtování a zpracování v rámci reportingu.
  4. Všemu vládne ERP. Ve velkých společnostech se pak nejčastěji většina agend z této oblasti řeší přímo v ERP systému. Ten zajistí příjem dokumentu, zažádá si u interního či externího AI nástroje o vytěžení dat a pak již vše běží jako normálně, včetně schvalování, zaúčtování, reportingu. Výhodou je minimální narušení stávajících procesů a zvyklostí uživatelů, při současném zvýšení komfortu účetních a snížení jejich zatížení prostým přepisováním dat. Mohou se tak věnovat důležitějším agendám.

Zajímavé postřehy z praxe

Nyní bych se mohl dále podrobně rozepisovat o tom, jak AI v tomto případě vlastně funguje, jak probíhá učení modelů pro vytěžování, ale bylo by to příliš obsáhlé a vydalo na další článek. A tak si závěrem dovolím raději přidat pár postřehů z praxe.

  • Prvním je skutečnost, že AI dokáže pozitivně (ale i negativně) překvapit – oproti očekávání totiž například celkem dobře vyčítá ručně psané účtenky, není tedy třeba se jich nějak výrazně bát.
  • Druhým postřehem pro nasazování těchto nástrojů je velmi velký význam opravdu dobrého UX pro kontrolu a úpravy vy­tě­že­ných dat, musí to být velmi intuitivní a rychle ovladatelné, jinak budou účetní týmy práci s AI spíše bojkotovat.
  • Používané modely jsou založeny na průběžném učení. Pokud se tedy setkáváme s doklady, které nejsou spolehlivě vyčteny, je vhodné je označit jako podklad pro doučení. Nicméně vlastní anotaci pro učení modelu nechte na proškolených osobách. Představa, že to v rámci své práci předpřipraví účetní při kontrole dokladu, není reálná.
  • Někdy chyba AI není vlastně chyba AI. Proč? Protože někdy je doklad již chybně vystaven. A tak tam může být špatný výpočet, chybný údaj, případně je kreativita na straně vydavatele taková, že to nerozluští ani zkušený člověk.

I přes některá omezení, a stále ještě ne 100% přesnost, je vy­tě­žo­vá­ní faktur a účtenek pomocí umělé inteligence jedním z často vyu­ží­va­ných scénářů využití AI ve firmách. Brzy snad už budou pře­va­žo­vat organizace, které faktury a účtenky nepřepisují. Budete mezi nimi i vy?

Dalibor Lukeš Dalibor Lukeš
Autor článku je odborník na digitalizaci, z pozice člena představenstva řídí technologické, produktové a marketingové aktivity společnosti MULTIMA.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.