M-Files a ABBYY = ECM + umělá inteligence. Vstupte a žasněte!

Každý si vybere

Milí čtenáři, v následujících řádcích se pokusím předat Vám něco z úžasu, který mě ještě stále neopouští. Užívám si jej, přestože cítím, že dnešní svět je spíš plný profesionálů, se kterými nepohne nic, co je ohraničeno nekonečnem našeho vesmíru. Ona nepohnutost je známkou dostatečných znalostí, proto je nic nepřekvapí, a profesionálního sebeovládání, proto tak jak tak nedají nic najevo. Dopřeji si tedy ten luxus využít emoce. Vím, článek tím už nebude působit tak odborně. Přesto, a právě proto, v něm možná najdete něco z toho, co ve mně onen úžas vzbudilo.

Na začátku všeho je zpráva, že se dvě firmy rozhodly spojit síly v určité oblasti.

  • Zajímavé je, že se tak stalo nedávno, poslední jarní den 20. 6. 2017. Tedy horká novinka!
  • Zajímavé je, že jedna z nich je Gartnerem uznávaný vizionář roku 2016 v oblasti správy firemních informací – M-Files. Přihořívá…
  • Zajímavé je, že tou druhou je společnost, která nastavuje standardy v oblasti automatického rozpoznávání znaků a vytěžování dokumentů a její řešení využívají i největší mezinárodní podniky – ABBYY. Přihořívá…
  • Zajímavé je, že uživatel M-Files, které bude mít nově pod kapotou přidaný „mozek“ od ABBYY, nemusí vůbec poznat, co se před jeho očima odehrává – že je právě v přímém kontaktu s umělou inteligencí! Chci vědět trochu víc…
  • Zajímavé je, co všechno už dnes počítačové systémy s aplikovanou umělou inteligencí dokáží. Úžasné, že ona umělá inteligence není už laboratorní vědecká záležitost!

Zvu Vás tedy na malou návštěvu do míst, která Vás možná inspirují minimálně v uvědomění, jaké nevyužité zdroje ve Vaší firmě můžete mít a že existují cesty, jak se k nim a jejich bohatství dostat. Možná právě M-Files samotné, tím spíše společně s robustním nástrojem vytěžování dokumentů, jsou pro Vás dveře do vyšší úrovně. Stačí zaklepat, možná jsou dokonce už pootevřené!

V nadpisu každé kapitoly se pokusím naznačit, jak moc ji považuji za důležitou pro celkový smysl článku. Můžete se nechat vést, ale nemusíte.

Jazykový koutek [můžete přeskočit]

Za malou chvíli, o pár řádků níž, začneme rutinně používat řadu zkratek z oblasti, kterou mnozí z nás znají, o které mají alespoň základní povědomí. Důležitá bude schopnost získat digitální podobu nějakého papírového dokumentu. To zvládne zařízení, o kterém jste zcela jistě slyšeli a nazývá se… A jsme u toho: jak to mám správně napsat? Jak s takovým zařízením a na něm probíhajícím procesu naložil a nakládá český jazyk?

Jak už se stalo běžným jevem, přejatá slova mohou natolik zdomácnět v českém prostředí, že se nepozorovaně zařadí nejprve mezi tolerovaná, pak doporučovaná a nakonec „samozřejmě“ spisovná. Touto cestou prochází i zařízení, které dnes tiše hučí či přede téměř v každé firmě a v mnohých domácnostech. Zvědavě prohlíží předlohy a ze všech vyrábí digitální podoby – obvykle obrázky, či rovnou PDF dokumenty. Samozřejmě, správně poznáváte… scanner. Tak zní původní název v kolébce termínů IT technologií, angličtině. Co na to český jazyk? Na jeho čistotu a správnost dohlíží Ústav pro jazyk český, působící pod Akademií věd České republiky. Nemá to jednoduché, protože takových podobných scannerů se s rozvojem IT technologií objevuje víc, než hub po dešti. Ústav v oblasti počešťování a přejímání cizích slov trpělivě vyčkává, jak si se slovem poradí populace. Řada jazykových citlivců se v průběhu začleňování nového slova do pravopisného slovníku potýká s dublovanými tvary a zaujímá k nim různě vyhraněná stanoviska.

V případě scanneru je tedy originální podoba správná, ale ve Slovníku spisovné češtiny ji nenajdete. Jistě, je to přece anglické slovo. Zkusme tedy skener, tak to tady také nemáme. Můžete se potkat i s tvarem scaner, ten samozřejmě také nemá šanci. Musíme se tedy vrátit k originálu scanner. Jenže skládat věty kolem neskloňovaného anglického slova je nepříjemné. A skloňovat anglické slovo je podle mě ta nejhorší varianta, podívejte se na začátek tohoto odstavce. V tom případě na sebe beru zodpovědnost za jazyk český a VOLÍM SKENER, který minimálně pro tento článek prohlašuji za budoucí součást české spisovné slovní zásoby. A v případě potřeby budu se skenerem skenovat.

Děkuji za pochopení všem, kteří by volili jinak.

Rozkryjme zkratky! [alespoň zběžně…]

Možná jsou to věci pro Vás samozřejmé, uvádím proto pár stručných vysvětlivek zejména pro ty, kteří by mohli váhat. Půjdu od záležitostí, které už dnes nikomu dech nevezmou, k těm, které mohou – v případě, že pochopíme, co se za pár sekundami „chroustání“ po naskenování dokumentu může skrývat za činnosti…

OCR – Optical Character Recognition

je metoda, která pomocí skeneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Postupně vzniklo a ujalo se několik standardů, mezi prvními OCR-A a OCR-B, pracující s normovaných počítačovým písmem, dále norma MICR specializovaná na bankovní sektor a zpracování šeků (využívá magnetický inkoust) a další

ICR – Intelligent Character Recognition

pokročilejší úroveň OCR, kdy jde o rozpoznávání znaků v ručně psaném textu, různými styly písma. Tato funkce je navíc rozšířena o učící se algoritmus, který urychluje práci programu a snižuje nároky na zásah uživatele. Jednou mu ukážete, jak může vypadat zkomolené „a“ a příště se na něj program již neptá, sám jej rozpozná. Tato technologie učení je založena na konceptu neuronových sítí. Učení je velmi efektivní, přesto je průměrná úspěšnost 97 %, tedy ještě stále je třeba na pomoc lidská inteligence – korektor, který prohlédne naskenované stránky a opraví všechny nejisté znaky. Korektor musí být optimisticky naladěný, koneckonců s žádnou chybou se znovu již nesetká, systém se ptá vždy pouze na nové okolnosti.

OMR – Optical Mark Recognition

je proces pořizování dat z člověkem označených oblastí z formulářových dokumentů – průzkumů a testů, prezenčních listin, seznamů a podobně.

NLP – Natural Language Processing

je oblast počítačové vědy, umělé inteligence a počítačové lingvistiky zabývající se interakcí mezi počítačem a lidským (přirozeným) jazykem. Základy položil už Alan Turing v roce 1950 pojednáním Computing Machinery and Intelligence, které je považováno za podstatný dokument v oblasti umělé inteligence a který dal vzniknout tomu, co dnes nazýváme Turingův test jako kritérium inteligence.

Computer Vision

je mezioborová vědecká disciplína, zabývající se vysokou úrovní získávání informací z digitálních snímků či videa a jejich využitím pro automatizaci procesů

CNN / ConNET – Convolutional Neural Network

typ umělé inteligence, druh neuronové sítě zvaný konvoluční. Už jsme hodně hluboko ve velmi abstraktním a vědeckém prostředí, tedy stručně a nepřesně, pro naše potřeby dostatečně: neuronové sítě řešící úlohy v oblasti Computer Vision, úspěšnější než předchozí neuronové sítě RNN. Zajímavé pojednání můžete najít např. v rámci materiálů z Konference empirických metod v NLP (viz Použité zdroje).

SLA – Service Level Agreement

dohoda o úrovni poskytovaných služeb mezi dodavatelem a uživatelem služby. Typicky v oblasti IT nepříliš jednoduchý dokument, ve kterém jsou z pohledu firmy rozděleny procesy závislé na konkrétních službách informačních systémů – tyto služby pak smlouva ošetřuje podle naléhavosti různě kvalitním servisem dodavatele se stanovenou dobou reakce a řešení potíží

M-Files a ABBYY: startuje léto 2017 novou epochu?
[pro všechny]

Zpráva zní na první pohled zcela všedně, nevybočuje z tónu mnohých podobných. Kdybych nevěděl, jaké možnosti poskytuje M-Files ve zpracování firemních informací už teď, asi bych se nad oznámením ani nijak zvlášť nezamýšlel. Cituji z oficiální zprávy z webových stránek M-Files (v osobním překladu z angličtiny, omluvte případné nepřesnosti):

DALLAS a MILPITAS, 20. června 2017: Společnost M-Files Corporation, společnost zabývající se systémy pro inteligentní správu informací, dnes oznámila partnerství s ABBYY, globálním poskytovatelem inteligentního snímání, optického rozpoznávání znaků využívajícího inovativní technologie práce s jazykem a technologie umělé inteligence.

Mika Javanainen, viceprezident produktového managementu firmy M-Files, vidí přínos ABBYY do M-Files právě v umělé inteligenci, která umožní dále transformovat a automatizovat způsob, kterým zákazníci řídí informace a procesy. Zároveň spojením inteligentního vytěžování ABBYY s metadaty M-Files vzniká zase výkonnější nástroj, který zbavuje uživatele opakujících se stereotypních činností a zjednodušuje objevování informací ve firmě.

Sven Diedrich, ředitel Business Licensing Technology v ABBYY Europe, dodává, že v dnešním světě je klíčové dostat správné informace ve správný čas. Ve volném překladu tedy co nejrychleji, co nejpřesnější. Většina podstatných informačních zdrojů je ale nestrukturovaná, což komplikuje firmám automatizaci strojového zpracování. ABBYY tedy do M-Files vnáší možnost automaticky klasifikovat cenný nestrukturovaný obsah a přeměnit ho na informace, která lze zpracovat a využít.

Co se tedy může M-Files od ABBYY přiučit? [pro úžasuschopné]

Inspirován zmínkou o vůdčí roli ABBYY na poli vytěžování dokumentů a blízkostí umělé inteligence hledal jsem vlastnosti, které jsou s takovým systémem spojené, aby byl nepřehlédnutelný a aby M-Files stálo o partnerství. Z mnoha řešení a produktů ABBYY jsem vybral ten, který slibuje „chytré snímání pro chytřejší procesy“ – ABBYY FLEXICAPTURE. A na něm popisuji vybrané rysy, o kterých předpokládám, že je M-Files z FlexiCapture zužitkuje.

1) Vícekanálový vstup a škálovatelnost výkonu

  • to není pro M-Files žádná novinka, i M-Files bere informace ve všech podobách,
  • zpracovává digitální i papírové dokumenty,
  • mnoho různých zdrojů – multifunkční zařízení, síťové skenery, e-maily, FTP, webové příspěvky, souborové složky, mobilní zařízení,
  • FlexiCapture zvládne scénáře s vysokým výkonem – ať už se jedná o objem dokumentů, třeba 1 000 000 dokumentů denně, nebo rychlost zpracování, třeba 1 000 stran za minutu,
  • systém je škálovatelný a umožňuje více serverovou architekturu s distribuovanou infrastrukturou podle potřeb.

2) Pokročilá klasifikace dokumentů a automatické učení

  • rozpoznávání příchozí komunikace podle formy i obsahu = podporuje optimalizaci informacemi řízených procesů,
  • vyznačuje se rychlým rozhodováním a krátkým časem zpracování,
  • klasifikační technologie zahrnuje klasifikaci obrazu a využívá metody umělé inteligence tzv. hlubokého učení (Convolutional Neural Network; to už známe, že?) – pokročilé technologii strojového učení firmy ABBYY a NLP (Natural Language Processing) značně snižují náklady na podporu a údržbu systému,
  • umožňuje volit třídění dokumentů podle vzhledu textu nebo vzoru, nebo klasifikací textu, založenou na statistické a sémantické analýze textu – lze využít jednu z metod, nebo obě současně,
  • systém se od uživatele naučí zpracovávat flexibilní nebo nepravidelně rozvržené dokumenty, uživateli přitom zůstává dohled a plná kontrola nad úpravou, vyladěním či vyřazením výsledků automatického zpracování,
  • systém zvládne aktuálně 186 světových jazyků v technologii OCR a 113 jazyků v technologii ICR.

3) Pokročilý monitoring a analýza

  • nástroje umožňující sledovat toky dokumentů, zajišťovat kontinuitu firemních procesů, optimalizovat je,
  • umožňuje ladit systém díky identifikaci úzkých míst – to může být zásadní přínos pro firmu, která investuje nemalé prostředky a efekt optimalizace se nedostavuje!

4) Správa případů

  • umožňuje předdefinovat sady dokumenty typických pro řešení oblastí jako např. hypotéky, pojištění a finance obecně,
  • umožňuje definovat pravidla úplnosti potřebných údajů a kontrolovat jejich plnění

5) Víceúrovňová ochrana dat

  • v souvislosti s neustálým zpřísňováním ochrany dat, nejen osobních, opět naprosto nezbytná podmínka, aby M-Files udržely schopnost implementace i v náročných prostředích spisové služby a podobně,
  • citlivá a důvěrná data mohou být skryta různými metodami při jejich zpracování různými operátory s různými přístupovými právy,
  • protokol HTTPS zajišťuje obousměrné šifrování dat při komunikaci mezi uživatelem a serverem, chránící data před zachycením a zmanipulováním.

6) Podpora SLA a izolovaná prostředí

  • další cesta, jak optimalizovat a maximálně využít systém pro firemní potřeby,
  • možnost nastavení priorit pro fáze zpracování, definovat pořadí dokumentů ve frontě atd.,
  • systém je schopen vytvořit zabezpečené a vzájemně izolované prostředí pro více nezávislých subjektů, např. pracovních skupin,
  • využití zabezpečené centralizované správy pro ochranu dat více pracovních skupin, které se nemusí zabývat nastavováním.

7) Mobilní pořizování dokumentů

  • opět rys sympaticky souznějící s filozofií M-Files a jejími webovými a mobilními klienty,
  • používání mobilních zařízení a dalších zdrojů pro maximální zvýšení dostupnosti dokumentů a urychlení jejich zpracování,
  • nástroje na zlepšení obrazu dokáží převést do vysoké kvality i méně kvalitní zdrojová data,
  • o kompletním zpracování s požadovanými vlastnostmi dostává obsluhující uživatel potvrzení,
  • webový klient FlexiCapture HTML5 podporuje Chrome, Firefox, Safari, Opera, Internet Explorer a další prohlížeče,
  • webové rozhraní umožňuje správu obchodních procesů distribuovaně bez ohledu na to, v jakém prostředí se dokumenty pořizují.

Závěr: těšme se! [všichni, majitelé ECM M-Files zvlášť]

Podle mého názoru je nepochybné, že partnerství M-Files s ABBYY posune použitelnost M-Files na vyšší úroveň. Už dnes existují implementace M-Files externě propojené s aplikacemi pro vytěžování dokumentů, dokonce přímo s produkty ABBYY. Jenže málo platné, vlastní je vlastní.

Moc se těším, protože stále ještě dokážu žasnout nad tím, jak blízko se ocitáme umělé inteligenci. Nepatřím k žádným mimořádným fanouškům tohoto fenoménu, spíš jsem ostražitý při zprávách o humanoidních robotech, kteří už v našem světě existují a vlastní také umělou inteligenci, dokonce dokáží projít Turingovým testem. V podobě, v jaké je použita pro vytěžování dokumentů, s ní ale nemám nejmenší problém.

Jen jsem zvědavý, a rád to co nejdříve vyzkouším, jak si slavná umělá inteligence poradí s mým rukopisem. Autor sám má potíže s jeho čitelností.

O. Hlaváček

Použité informační zdroje

  • M-Files Integrates Artificial Intelligence Technology from ABBYY to Further Automate Information Management. In: M-Files [online]. Tampere, Finland: M-Files, 2017 [cit. 2017-06-27]. Dostupné z: https://www.m-files.com/en/press-release-artificial-intelligence-technology-integration-abbyy
  • Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2001-2017 [cit. 2017-06-27].
  • ABBYY FlexiCapture: Smart Capture for Smarter Processes [online]. 1. Milpitas, California, USA: ABBYY, 2017 [cit. 2017-06-27]. Dostupné z: https://www.abbyy.com/media/15410/flexicapture_brochure.pdf
  • ABBYY FLEXICAPTURE 10. NUPSESO GROUP [online]. CZ: NUPSESO GROUP, 2016 [cit. 2017-06-27]. Dostupné z: http://nupseso.cz/software/vytezovani-dat/abbyy-flexicapture-10
  • PHAM, Ngoc-Quan, German KRUSZEWSKI a Gemma BOLEDA. Convolutional Neural Network Language Models: Center for Mind/Brain Sciences University of Trento. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 1153–1162 [online]. Austin, Texas: Association for Computational Linguistic, 2016, 2016(1), 10 [cit. 2017-06-27]. Dostupné z: https://aclweb.org/anthology/D16-1123

Tags: ,

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *