E-Depot, Pre E-Depot -> uw data duurzaam beschikbaar

” We willen overschakelen naar zaakgericht werken en na inventarisatie hebben we geconstateerd dat we erg veel bronsystemen hebben waar zaakgerelateerde informatie in zit of kan zitten.”  

” Nu we overgeschakeld zijn op ons nieuwe zaaksysteem in de cloud, kunnen we niet meer bij onze oude data, we moeten alles overzetten of een uitgeklede versie van ons oude systeem in de lucht houden, maar dit is er prijzig en niet de bedoeling, daar wilde we juist vanaf “

” Naast de “Actuele” informatie die we uiteraard geacht worden enige tijd te bewaren hebben we toch ook informatie die “Altijd” beschikbaar moet blijven, hoe doen we dat?”

Dit zijn voorbeeld situaties waar Next2know veelvuldig mee geconfronteerd wordt. De oplossing is even simpel als krachtig. Migreer de data naar een open omgeving en ontsluit deze middels Opensource hulpmiddelen. Door het open karakter wordt de informatie bron onafhankelijk, door Opensource leverancier onafhankelijk. Uiteraard komt er iets meer bij kijken. Uw heeft uw informatie de afgelopen jaren voorzien van metadata, juist om het beheer te optimaliseren. Dat dit in de loop der jaren over verschillende systemen niet altijd eenduidig is gebeurd is de praktijk en veelal het gevolg van voortschrijdend inzicht. Next2know heeft daarvoor hulpmiddelen ontwikkeld die ervoor kunnen zorgen dat er weer eenduidige metadata ontstaat! (de TMLO mapper)

Uw nieuwe systeem kan gebruikt worden als portal naar uw oude data. Er wordt eenvoudigerwijs een zoekwindow toegevoegd zodat u altijd zoekt in uw complete dataset! Ook hier zal de TMLO mapper altijd de juiste, uniforme metadata gebruiken.

Weten we dan zeker dat we over 30 jaar de informatie nog kunnen ontsluiten? Ja maar in grote mate afhankelijk van uw beleid. Wij zorgen dat het volledig transparant, gestandaardiseerd, inhoudelijk beschikbaar blijft. Wij leveren als het ware een Pre-E depot. Waardoor u uw data eenduidig kunt beheren.

Indien u de stap naar E-Depot wil zetten kan dat uiteraard ook , hierover adviseren wij u graag!

Ik heb ” het” gelezen weet alleen niet meer waar?

Mensen hebben behoefte aan informatie om hun werk te doen, om zich te verrijken met kennis, om anderen te informeren, om hun bedrijf en de wereld om hen heen een stukje verder te helpen. Informatie vinden in deze tijd is een deels sociaal proces geworden.

Het internet is een podium waar iedereen zijn of haar zegje kan doen conform het credo ‘everyone can say anything about everything’. Op dit podium kan informatie zich manifesteren in velerlei vormen en het wordt inmiddels een kunst om hier relevante samenhang in te ontdekken. De rijkdom aan informatievormen roept voor ontsluiting om verscheidenheid in technologische creativiteit.

Legacy data doorzoekbaar maken uit uw uitgefaseerde DM of postregistratie systeem?

Next2Know heeft zich de afgelopen jaren nadrukkelijk gericht op het duurzaam beschikbaar maken van informatie uit uitgefaseerde of uit te faseren legacy systemen.

Met name de overgang richting Zaakgericht werken en het herinrichten van “het nieuwe zaaksysteem” zorgde ervoor dat het bewustzijn bij veel organisaties over de informatie maar vooral het niet online beschikbaar hebben hiervan toenam. Het eenvoudigerwijs uitfaseren van systeem X ten faveure van systeem Y levert altijd veel restinformatie op waar een bestemming voor moet worden gevonden. Veelal wordt hiervoor een nodeloos duur onderhoudscontract in de lucht gehouden waardoor de gewenste budgetvoordelen veelal niet gerealiseerd worden.

Een inventarisatie langs diverse organisaties heeft aangetoond dat deze “grijze” informatie wel degelijk van belang is en dat men uit hoofde van wet-en -regelgeving hier wel degelijk aandacht aan moet besteden.

Later meer…

 

 

Hoeveel kost een zoekvraag? Soms 50.000 euro!!

Er is erg veel onderzoek gedaan naar de (verborgen) kosten die men maakt in een organisatie om de juiste informatie te vinden die nodig is voor het uitvoeren van een taak. Goede zoektechnologie helpt kosten te besparen, maar niet voor niets staat het woord verborgen in de vorige zin tussen haakjes: de perceptie van de exacte kosten is veelal niet aanwezig.

Pijnlijker wordt het als je informatie in de vorm van een bonnetje nodig hebt vanuit verantwoordingsstandpunt. Dan kost een zoekvraag ineens 50.000 euro! In onze beleving kun je voor zo’n bedrag heel wat maatregelen nemen om een structurele oplossing te realiseren die voorkomt dat je je baan kwijt raakt…

“Zoektocht naar bonnetje kostte 50.000 euro” Bron: Telegraaf

Een zoekmachine: wat vind je van de verschillen?

De meeste mensen gebruiken Google. Voer je daar een trefwoord in dan krijg je zoveel mogelijk hi(n)ts. Je kunt er tevens voor kiezen om met datzelfde trefwoord te zoeken naar afbeeldingen. Je krijgt dan zoveel mogelijk gelijkenissen.

Yossarian, genoemd naar de anti-held in het boek Catch-22 van Joseph Heller, is een hele andere zoekomgeving. Voer je daar een trefwoord in dan krijg je beelden die je helpen je creativiteit op gang te brengen. Met soms wonderlijke resultaten als gevolg. Maar dat is nu juist de bedoeling van deze zoekmachine! Yossarian maakt gebruik van een heel ander algoritme dan Google. Het doet dit omdat het juist te bedoeling is iets anders te vinden. En zo hebben zoekomgevingen allemaal hun eigen functie.

Bij Next2Know ontwikkelen we een omgeving die het mogelijk maakt om alle relevante informatie in een organisatie te ontsluiten. En dan gaat het niet om de kwantiteit aan hits (Google) of de creatieve impuls (Yossarian), maar om efficiency en tijdwinst: simpelweg je werk beter en sneller kunnen doen. Maar we kunnen natuurlijk ook best een koppeling maken, wat je wilt. Een creatieve impuls is immers nooit weg…

http://www.fastcompany.com/3035868/most-creative-people/can-a-search-engine-make-you-more-creative

www.yossarianlive.com

 

Grip op informatie

“Negen van de tien organisaties hebben geen inzicht in de waarde van de aanwezige content”. Dit stelt Hans Kaashoek in zijn artikel in de Automatiseringsgids.

Wij denken dat Hans daar een punt heeft. In het artikel haalt hij ook aan dat tachtig procent van de bedrijfsinformatie ongestructureerd is, alle ECM systemen ten spijt. De enige manier om bij die content te kunnen komen is vaak slechts een bestandsnaam. Ook ontstaan er nieuwe problemen door datamigraties, het gebruik van nieuwe technologie en, last but not least, het ontbreken van een informatiestrategie.

Contentverrijking is een toverwoord maar de realisatie is dikwijls omslachtig en kostbaar. Met contentverrijking zou men in staat moeten zijn informatie beter te classificeren, te ontdubbelen en beter toegankelijk te maken. Het ontdubbelen levert daarbij tevens een voordeel op in de vorm van het besparen van opslagcapaciteit.

Een andere oplossing is het gebruik van moderne zoektechnologie. Hans beschrijft van deze laatste een aantal voordelen en nadelen. Voordelen van deze oplossingskeuze zijn de geringe complexiteit (en dus de lagere kosten voor implementatie) en de eenvoud in gebruik. De functionaliteit van software die hiervoor is ontwikkeld neemt snel toe. Volgens Hans werkt zoektechnologie goed binnen gerichte informatieverzamelingen. Als nadelen noemt hij het ontbreken van opslagreductie (er wordt niets weggegooid omdat dat simpelweg niet nodig is om relevante informatie te vinden!), de noodzaak van een goede contextanalyse en, wat Hans het belangrijkste vindt, het probleem wordt niet bij de bron aangepakt.

We zijn het helemaal eens met Hans. Maar gelukkig komen de twee werelden bij elkaar: geavanceerde zoektechnologie kan ook een uitstekend hulpmiddel zijn om, nadat je de informatie hebt ontsloten, er voor te zorgen dat de content ook verrijkt kan worden. Moderne zoekmachines leren door teksten te “lezen” en te interpreteren. Vervolgens kunnen suggesties worden gedaan om de content te verrijken en bijvoorbeeld onder te brengen in een ander (ECM) systeem.

 

Context

We zijn allen vertrouwd met de wijze waarop we voor ons relevante informatie hopen te vinden op internet. Het paradigma is simpel: na het invoeren van een of meer ogenschijnlijk relevante steekwoorden verwachten we van een zoekmachine een lijst met verwijzingen waarbinnen zich in ieder geval een paar bruikbare pagina’s bevinden. Goed beschouwd is dit vreemd. We communiceren met een systeem in de onbewuste veronderstelling dat het aan de hand van enkele steekwoorden kan bepalen waar we naar op zoek zijn (of waar we het over hebben). Behalve in situaties waarin we terugvallen op krachttermen is het doorgaans in de communicatie tussen mensen niet genoeg om een paar losse woorden te uiten. Wanneer we iemand iets willen uitleggen dan formuleren we daartoe zinnen die gezamenlijk het bedoelde concept bij de ontvanger moeten verduidelijken. Door het aanbrengen van duiding en nuancering in ons verhaal kan de ontvangende partij doelmatiger reageren op wat we zeggen of vragen. In tegenstelling tot bij de zoekmachine verwachten we van de persoon die we bevragen niet dat we meerdere antwoorden krijgen waaruit wij vervolgens zelf de ter zake doende informatie moeten destilleren.

Toch is het zoeken met enkelvoudige begrippen zo gek nog niet. In onze normale communicatie met behulp van natuurlijke taal is veel er op gericht om centrale begrippen te verduidelijken voor de ontvanger. Deze verduidelijking bestaat voor een groot deel uit het aanbrengen van context, d.w.z. we verrijken de centrale begrippen met een beschrijving van de context van gebruik die ons op een bepaald moment voor ogen staat. Wij doen dit onder meer door het begrip te combineren met andere trefwoorden, combinaties die optreden bij een specifieke toepassing. Op een gemeentelijke website kan een combinatie van het woord overlast met de termen geluid of milieu tot andere resultaten leiden dan wanneer we deze term combineren met jongeren of buren. Een goede redactie op het gemeentehuis kan ervoor zorgen dat door het aanbrengen van de juiste contextuele trefwoorden een eindgebruiker toch via een paar termen uitkomt bij het gezochte (en dus het gevoel krijgt ‘begrepen te worden’). Helaas is dit in het huidige tempo van informatieproductie ondoenlijk geworden.

Het aanbrengen van contextinformatie rondom een begrip is zowel waardevol aan de bevraagde zijde (het systeem) als aan de kant van de vrager (de zoekende persoon die de juiste zoektermen tracht te bedenken). Een beproefde en gebruiksvriendelijke aanpak is het op een intuïtieve manier laten zien welke contexten er voorhanden zijn binnen het informatiesysteem. Voorbeelden hiervan zijn bv. het gebruik van ‘topic clouds’ (woordwolken) en het voorstellen van ‘clicks’ voor verfijning. Welke vorm van interactie men ook voorstaat, het succes valt of staat met de beschikbaarheid van contextinformatie. In de computationele taalkunde wordt daarom veel onderzoek gedaan naar methoden om contexten van gebruikte terminologie geautomatiseerd te bepalen.

Next2Know is betrokken bij onderzoek dat wordt gedaan aan de Hochschule Hannover. Doel is onder meer het bepalen van nauwkeurige contexten voor gevonden termen in teksten van diverse aard. Deze contexten worden mede ‘berekend aan de hand van statistisch bepaalde woordafstanden’. Het gaat hier om semantische afstanden, ofwel afstanden in betekenis. De gehanteerde aanpak biedt vele mogelijkheden, waaronder ook het geautomatiseerd vinden van synoniemrelaties en het bepalen van de contexten van een zoekterm binnen een tekst. De methode is zowel bruikbaar voor optimalisaties van zoekvragen als voor de automatische context verrijking van opgeslagen informatie. Een andere interessante – en naar verwachting steeds belangrijker wordende – toepassing is het bepalen van de informatiedichtheid van teksten. Deze toepassing moet o.a. het antwoord geven op de vraag hoe om te gaan met de toenemende berg aan informatie terwijl de kennisomvang nagenoeg constant blijft. In A Mathematical Theory of Communication [Shannon 1948] gaf Claude E. Shannon al vroegtijdig duiding aan dit thema binnen het – toen nieuwe – onderwerp Information Theory. Het belang van deze klassieke paper is niet afgenomen, nieuwe toepassingen van Shannon’s inzichten zijn met moderne taaltechnologie nog dichterbij gekomen. Belangrijk is dat interessante werkende academische halffabrikaten hun weg weten te vinden naar gebruikersoplossingen die voor eenieder te begrijpen zijn. Dit moet zowel voldoening geven aan onderzoekers als aan eindgebruikers. Als we dat met z’n allen weten te bereiken dan hebben we wellicht aan één woord genoeg…

Referenties
[Shannon, 1948] Shannon, C. (1948). A mathematical theory of communication. Bell System Technical Journal, 27:379–423, 623–656.

Een pdf van deze tekst is hier te downloaden.

Informatie governance en records management zijn niet hetzelfde.

Governance als Engelstalig begrip duidt op de handeling of de wijze van besturen, de gedragscode, het toezicht op organisaties (Wikipedia). Vanuit deze definitie is informatie governance specifiek gericht op het organiseren van informatie ten behoeve van besturing en toezicht. Records management is het identificeren, klasseren, archiveren, bewaren en soms vernietigen van records (Wikipedia).
Zo op het eerste oog is de oplossing voor informatie governance simpel: maak van elk stukje informatie een record, klasseer deze en beheer ze. Records management is het domein van de documentaire informatie verzorgers en archivarissen. Zij houden zich dagelijks bezig met het beheer van alle records.

De praktijk is, zoals altijd, weerbarstiger. Gelukkig zijn er vele documentsystemen die alle documenten kunnen “vangen”. Maar governance vereist het organiseren van alle informatie en lang niet alle informatie is gemakkelijk te “vangen”. Sterker, ook op dit gebied geldt de 80-20 regel: slechts 20% van de informatie is gestructureerd, de overige 80% is dit niet. Het is tijdrovend en duur om te trachten deze 80% te structureren.

In dit artikel wordt gewezen op de verschillen tussen de begrippen informatie governance en records management. Wanneer je kijkt naar deze verschillen dan wordt duidelijk dat een nieuwe benadering nodig is. Moderne hulpmiddelen maken het mogelijk om in plaats van pre-coördinatie (alle informatie van te voren classificeren) de aandacht te verschuiven naar post-coördinatie (ordening achteraf). Dit vereist een intelligente toegang tot alle databronnen. Een deel van de bronnen kan mogelijk vooraf worden verrijkt met gegevens (metadatering), slimme zoektechnologie kan verbanden maken die vooraf nog niet geïdentificeerd zijn.