facebook LinkedIN LinkedIN - follow
IT SYSTEMS 3/2014 , AI a Business Intelligence , Banky a finanční organizace

Detekce a prevence daňových podvodů



SASDaně, cla, poplatky, odvody – to jsou všechno záležitosti mezi lidem nijak populární. A jistě nikdy nebudou. Na druhé straně každý, kdo racionálně uvažuje, ví, že shromáždit určité množství prostředků pro zajištění společných cílů a potřeb je v zájmu každé společnosti, co civilizace existuje. Odhlédněme pro tuto chvíli od otázky, jak zařídit, aby nakládání s takto získanými prostředky bylo účelné (to je jistě významné téma pro další úvahy). Podíváme se na to, jak tuto nepříjemnou agendu učinit efektivnější, spolehlivější, a nakonec i spravedlivější.


Výběr daní a všelikých poplatků se ze samotného principu děje v masovém měřítku. Týká se velkého počtu subjektů (jsou jimi v podstatě všichni lidé, organizace, všechny výrobky, nemovitosti, výrobní prostředky, výdělečné činnosti, úřady, úředníci, výběrčí, …). Je jich také hodně druhů a mají docela složitou strukturu, způsoby stanovení i vlastního výběru. Hledání anomálií (tedy případů nesprávného či podvodného chování) proto připomíná hledání obligátní jehly v kupce sena.

Tendence vyhnout se placení je určitě přirozená – ať náhodně, příležitostně, z neznalosti či nedbalosti, tak záměrně, v krajních případech metodami organizovaného zločinu. A platilo to jistě ve všech dobách a systémech – určitá část prostředků zkrátka nebývá náležitě odvedena a nepřijde se na to. Obranou proti tomu je samozřejmě kontrola. S rostoucím množstvím subjektů a složitostí celého systému je však téměř nemožné zkontrolovat úplně všechno. A i kdyby to možné bylo, nebylo by to efektivní, protože nároky a náklady na kontrolu s velikostí a složitostí prostředí akcelerují. A kdybychom se přece jen rozhodli a byli schopni je vynaložit, zátěž a obtěžování dotčených (tj. všech kontrolovaných) by byla enormní, a v krajních případech až paralyzující. Proto se kontrolují pouze některé vybrané subjekty s vírou, že podstatné delikty budou odhaleny nebo jejich možní původci odstrašeni.
 

  • Je možné zněkolikanásobit účinnost odhalování daňových deliktů?
  • Je současně možné méně zatěžovat poctivé plátce?
  • Je navíc možné dělat to s efektivnějším vynaložením prostředků a kapacit a v kratším čase?
  • Jak v tom všem pomohou pokročilé analytické metody?


V praxi se většinou kontroly samozřejmě neprovádějí naslepo. Roli hrají zkušenosti, intuice, zkrátka zdravý selský rozum. I tak však mají klasické kontroly omezenou účinnost. Jsou totiž odkázány na to, co lze zachytit pouhým okem, to jest konkrétní případy, na něž se narazí. Omezení člověka-kontrolora přitom spočívá především v lidské schopnosti zpracovat a analyzovat pouze omezené množství informací. Případy, „na které se narazí“, určitě neposkytují úplný obraz terénu, a to co do jeho rozsahu ani složitosti.

Na rozdíl od dřívějších dob máme k disposici data. Pokrývají nejrůznější aspekty činnosti lidí, podniků i úřadů, obsahují informace za dlouhá období, a hlavně – jsou v elektronické podobě. To je obrovská výhoda – nemusíme se hrabat v papírech, potřebné informace jsou snáze dohledatelné, práce je mnohem rychlejší a efektivnější. Přesto i zde narážejí možnosti „zdravého selského rozumu“ na stále stejnou bariéru. Propojit tisíce a miliony informací o stovkách a tisících subjektů, najít v nich právě ty vazby, které jsou pro rozeznání anomálií důležité, oddělit miliony případů standardního chování od desítek a stovek podezřelých, nebo vysloveně nekalých – to vyžaduje použití netriviálních nástrojů, založených na statistice, modelování a dalších pokročilých analytických metodách. Jak to funguje?

Najít zlatou žílu

Pamatujeme si jistě z četby v mladých letech, jak prospektoři hledali tu na dalekém západě, tu na drsném severu zlato. Roli hrála zkušenost, intuice, a také štěstí. A samozřejmě informace – výhodu měl ten, kdo se potřebné zprávy dověděl dřív než ostatní. Přesto byl úspěch téměř vždy dílem náhody. Dnešní prospektoři už neprorývají každou píď země. Využívají chemické analýzy půdy, družicových snímků, analýzu vegetace a spoustu dalších informací, které si vzájemně propojí a získají tím obraz, který jim umožní jít téměř najisto. V našem případě je to podobné. Informace máme. A díky elektronizaci i po ruce. Dokonce je jich někdy až moc. A úloha je podobná jako v případě moderních zlatokopů: získat z nich obraz, který nám také umožní jít najisto. Jak si tuhle úlohu představit prakticky? Základem je co nejpřesněji odlišit případy „spořádaného“ chování od „nekalého“ a nalézt přitom co nejvíce těch nekalých.

Příklad

Předpokládejme, že mezi milionem transakcí je pět procent, tj. padesát tisíc, těch, které nejsou z nějakého důvodu v pořádku (znamenají například nelegální daňový únik). Náš kontrolní tým má kapacitu detailně prověřit sto tisíc případů. Kdyby to dělal náhodně, identifikoval by oněch pět procent, tj. pět tisíc případů. Tedy deset procent všech závadných případů. Zapojí-li jeho členové intuici, zkušenosti a selský rozum a budou-li velmi úspěšní, dostanou se na patnáct, dvacet nebo dvacet pět procent.

Ve všech těchto případech je však pravděpodobnost neodhalení (tedy úspěšnosti podvodu) významně větší, než „že se na to přijde“. Pokud by se tento poměr obrátil, určitě by bylo možno zachránit mnohem více peněz, ale také by to významně přispělo k prevenci (příště už si to každý dvakrát rozmyslí, když bude tak velké riziko odhalení). Toho lze docílit pomocí už zmíněných netriviálních analytických metod. Patří mezi ně různé typy statistické analýzy, prediktivní modelování, analýza sociálních sítí, metody data miningu. Fungují tak, že na základě dostatečně velkých souborů dat vytvářejí modely, jejichž podstatou je zachycení a formalizace vztahu mezi chováním subjektů a daty o nich. Konkrétně lze například z dat zjistit, že daný subjekt či transakce je kandidátem na provedení detailní kontrolní (či jiné) akce.

V našem příkladu nám tyto metody pomohou vybrat takových sto tisíc transakcí, mezi nimiž bude nejraději všech těch padesát tisíc závadných. V praxi je to ovšem nedosažitelný ideál. Nikdy nebudeme mít všechna potřebná data, nikdy nebudeme mít k dispozici stoprocentně účinné metody. Dostaneme-li se však na hodnotu sedmdesát, osmdesát či devadesát procent identifikovaných defektů, bude to bez debaty výborný výsledek. Kdyby byla v tomto případě průměrná hodnota transakce (například nezaplacená daň) jeden tisíc korun, bude se jednat o sumu 45 milionů. Je to tím, že se nám podařilo určit pro kontrolu takovou stotisícovou skupinu, ve které se nalézá 45 tisíc defektních transakcí z celkových padesáti tisíc. V provedených kontrolách tedy máme na stotisícovém vzorku 45 procent „úspěšných zásahů“.

Příklad ukazuje, jak se využitím nenáhodného výběru pomocí chytrých analytických metod zvyšuje účinnost kontroly. Dnes používané metody dokáží ovšem pracovat s velmi vysokou přesností. Znamená to, že pro dosažení stejného výsledku (počtu odhalených případů) dokážou lépe zacílit tím, že vyberou ke kontrole menší množinu subjektů. Místo sto tisíc jich je možno vybrat například pouze polovinu, padesát tisíc, která ovšem obsahuje také devadesát procent všech defektních transakcí (tj. 45 tisíc). Přínos je stejný jako v předchozím případě, ale vlastní kontroly jsou mnohem efektivnější – vykazují devadesát procent úspěšných zásahů. Tedy jen deset procent tzv. falešně pozitivních případů, tj. situací, kdy jsme zbytečně atakovali subjekty, které jsou v pořádku.
 

Obr. 1: Znázornění různých metod identifikace podezřelých subjektů
Obr. 1: Znázornění různých metod identifikace podezřelých subjektů

Tab. 1: Příklad účinnosti detekce
Tab. 1: Příklad účinnosti detekce


Nasazením analytických metod pracujících s vysokou přesností získáváme hned několik výhod:

  • Identifikujeme významně větší část subjektů, jež mají máslo na hlavě.
  • Do hledáčku se dostává podstatně méně subjektů, které nic nepáchají. Výrazně méně obtěžujeme a zdržujeme jak je, tak nás a zatěžování, respektive nezatěžování kontrolami bude určitě spravedlivější.
  • Šetříme čas. Výsledek máme k dispozici rychleji, a následně můžeme i rychleji konat. Dříve než potrefený subjekt zmizí ze scény.
  • Šetříme kapacity. Téhož, nebo dokonce lepšího výsledku dosáhneme s menším počtem lidí. Ti se však neztratí. Většinou jde o odborníky zkušené v oboru, kteří jenom lehce změní profesi. Místo inspektorů spoléhajících se pouze na svou intuici jsou z nich analytici, kteří s podporou účinných nástrojů mnohem lépe využívají svých zkušeností.

Nejúčinnější řešení – kombinace metod

Ve skutečnosti je celá záležitost ještě výrazně složitější. Svět totiž také není jednoduchý, a k tomu se ještě vyvíjí. Ve skutečnosti se v roli pachatele ocitají subjekty, jejichž záměry, zkušenosti, cíle, organizace i nástroje se liší jako nebe a dudy. Jejich škála je široká – od zapomnětlivých a nedbalých plátců přes příležitostné průzkumníky, zkoušející, co jim projde, či rafinovanější podvodníčky a podvodníky, kteří si své akce dobře promýšlejí, až po dobře organizované řetězce často napojené na organizovaný zločin. Každý tento případ se vyznačuje jinými postupy, příznaky, situacemi, u každého spočívá závažnost v něčem jiném. Pro poslední dvě skupiny je rovněž charakteristické, že jsou ve vynalézání podvodných metod velmi aktivní a snaží se být vždy o krok napřed před těmi, kdo se je snaží odhalit.
 

Obr. 2: Hybridní detekce podvodů
Obr. 2: Hybridní detekce podvodů


Proto nemůžeme být závislí na jedné, byť velmi chytré a vědecky podložené analytické metodě, i když nám zatím dobře sloužila a je schopna nekalé chování indikovat. Určitě budou vhodné jiné pro nahodilé nedbalce a pokusníky na jedné straně, a rozsáhlé řetězce organizovaného zločinu na straně druhé. Velmi důležité je mít metod k dispozici více a inteligentně je kombinovat. Říká se tomu hybridní přístup. Jeho podstatou je možnost namíchat pro každý případ nejúčinnější směs detekčních metod, a navíc ji rozšiřovat a přizpůsobovat pro nově vznikající vzorce nekalého chování. Takové řešení vyžaduje již skutečně robustní analytickou platformu zahrnující například statistickou analýzu, prediktivní modelování, analýzu sociálních sítí, analýzu informací z textů a spoustu dalších metod

Praktický příklad: daňový kolotoč

Odhalování a prevence podvodů v (ne)placení daně z přidané hodnoty (DPH) jsou dobrým příkladem využití kombinace pokročilých analytických metod. V těchto řetězových podvodech zpravidla figuruje několik typů subjektů. Ten, kdo nakupuje zboží ze zahraničí bez daně a s daní je prodává dalšímu subjektu. Je to ten, který by měl DPH zaplatit. Následuje jeden nebo více překupníků, kteří si předprodávají zboží mezi sebou a vše provedou na první pohled zcela korektně (DPH si vzájemně účtují). Poslední obchodník buď prodá zboží opět do zahraničí (bez DPH) a inkasuje od státní pokladny daňovou vratku nebo je prodá koncovému spotřebiteli a ten mu DPH zaplatí. Než celý tento kolotoč proběhne, první subjekt zmizí ze scény, aniž by daňovou povinnost uhradil, a státu vznikne škoda. Jde tedy o organizovaný řetězec (říká se mu kolotoč čili karusel), v němž má každý svou roli:

  • missing trader („bílý kůň“) – nastrčený obchodník, jenž zmizí, aniž by daňovou povinnost uhradil,
  • buffer company (překupník) – jedna nebo více účelově vzniklých „průtokových“ společností, jež opticky oddělují zmizelého koně od koncového prodejce,
  • profit taker (koncový prodejce) – firma inkasující nezaplacené DPH od státu nebo spotřebitele.

Pro každou z těchto rolí jsou charakteristické určité znaky a chování. Podle nich lze jednotlivé subjekty s využitím analytických metod klasifikovat jako potenciální účastníky karuselového podvodu.

Obr. 3: Schéma karuselového podvodu s DPH
Obr. 3: Schéma karuselového podvodu s DPH


Obr. 4: Pokročilá analýza sociálních sítí
Obr. 4: Pokročilá analýza sociálních sítí


To ale nestačí. Klíčové je totiž nalezení celého řetězce. A tady přichází ke slovu pokročilá síťová analýza. Mezi subjekty na trhu existují ve skutečnosti stovky a tisíce vazeb vytvářející nepřehlednou a těžko uchopitelnou spleť. Abychom se dobrali výsledku, nestačí vazby jenom nalézt, popsat a znázornit. Chytrost metod pokročilé síťové analýzy spočívá ve schopnosti najít relevantní řetězec. Přiměřeně rozsáhlý a složitý, ale prostý nevýznamných prvků a vazeb. Teprve pak jsme v cíli a můžeme konat. Samozřejmě s podmínkou, že to vše se nám povede provést dostatečně včas…

To, co je zde popsáno, není pouhý teoretický koncept, ale řešení, které bylo už několikrát s drobnými obměnami úspěšně uvedeno do praxe. A v praxi jeho výsledky dokumentují skutečná čísla: redukce karuselových podvodů v hodnotě 1,1 miliardy eur o 98 procent (Belgie), zvýšení výběru daní o sedm miliard GBP (Velká Británie), snížení daňových úniků na méně než polovinu (Švédsko) a řada dalších případů. Využívání pokročilých analytických řešení pro veřejné blaho je realitou. A realitou je i důkaz jejich účinnosti v praxi.

Vladimír Kyjonka

Autor je konzultant společnosti SAS.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Microsoft Fabric umožňuje analýzu dat založenou na AI

GOPASEfektivní řízení a analýza dat je klíčovým faktorem úspěchu každé organizace. Společnost Microsoft představila platformu Microsoft Fabric, která nabízí revoluční možnosti v oblasti sběru, ukládání a analýzy dat.