IT-nyheter från

OJCO Secure IT

Så förklarar du datamesh, fabric och moln så att vd:n förstår

Din vd vet säkert vad en databas är. Och han eller hon tror nog att ett data warehouse (informationslager) är ett stort förråd av data som används för rapporter och analys. Men chefen vet nog inte mycket som NoSQL-databaser, varför de behöver ha ett Spark-cluster eller hur man använder datasjöar för att ta in strukturerade och ostrukturerade data.

Vd:ar och andra höga chefer ser till affärsnyttan av data, analys och maskininlärning. De är mindre intresserade av de tekniker som används.

Men det blir en paradox, eftersom de inte vill förstå värdet av att satsa tid och pengar på ny teknik. Försök att förklara de senaste teknikerna för datahantering, sådant som datamesh, fabrics och distribuerade datamoln – det går runt i skallen på chefen.

Och det är inte bara höga chefer. Datatekniken har formligen exploderat sedan webbens första tid, när frågan var om man skulle bygga informationslagret på Oracle, Microsoft eller kanske på öppen källkod. Många höga chefer utanför it är förvissade om att data finns ”i molnet”, och att dataintegrering, kvalitet och prestanda är ”it-grejer”.

Alla som jobbar med data borde kunna förklara de viktigaste teknikerna och praktikerna på ett begripligt språk. I min bok Digital Trailblazer berättar jag om hur jag, i webbens barndom, försökte förklara vad en webbläsarkaka är för en styrelsemedlem i vårt nystartade företag. Man kan aldrig veta när man ber ombedd att ta mikrofonen och besvara en teknikfråga. Om man svarar med it-jargong kan det avskräcka eller åtminstone fördröja viktiga investeringar.

Gordon Allott, vd för K3 (getk3.com), föreslår att man börjar med ett enkelt svar: ”Datasjö, informationslager, mesh och fabric ingår alla i företagets totala datastrategi.”

Vad är en datamesh?

Att ge lättfattliga svar är viktigt, men det räcker inte alltid. När en chef frågar mig om en teknisk term så vill jag svara på ett sätt som väcker nyfikenhet och lockar till följdfrågor.

Vi kan börja med att förklara vad en datamesh är. Steven Lin, produktmarknadsföringschef på Semarchy bidrar med detta koncisa svar:

”Datamesh är ett decentraliserat sätt att hantera data där flera olika team i företaget ansvarar för sina egna data, vilket främjar samarbete och flexibilitet.”

Det finns inga krångliga ord i denna förklaring, och det nämner de problem som datameshar är till för att lösa, hur de löser dem och varför det är viktigt.

Men räkna med att du får fler tekniska frågor, särskilt om chefen råkar känna till andra tekniker för datahantering. Till exempel: ”Var det inte meningen att informationslager och datasjöar skulle lösa problemet med datahantering?”

Sådana frågor kan leda dig i fördärvet om du svarar med att förklara de tekniska skillnaderna mellan informationslager, sjöar och meshar. I stället bör du hålla dig till nyttan för verksamheten.

Satish Jayanthi, medgrundare och teknisk direktör för Coalesce har detta förslag:

”Datakvalitet påverkar ofta exaktheten i verksamhetsanalys och beslutsfattande. Genom att införa datamesh kan man förbättra kvaliteten och noggrannheten hos data, vilket leder till att verksamheten får ökat förtroende för data och använder dem oftare för välgrundat beslutsfattande.”

Jag gillar det svaret och hoppas att chefen sedan vill veta mer om hur datameshar bidrar till högre kvalitet på data. Jayanthi svarar:

”En av de centrala principerna är ägande av domänen. Det gör att det team som producerar data också ansvarar för kvalitet och exakthet. Denna princip, data som produkt, gör att de data som sprids till andra grupper i företaget är exakta, kan återanvändas, är dokumenterade och av hög kvalitet.”

Om datameshar är något nytt för dig, och om du vill fördjupa dig i tekniska detaljer, så föreslår jag att du läser Zhamak Dehgranhis artikel om hur man går från en monolitisk datasjö till en distribuerad datamesh (se länk).

(Språkligt: Engelska mesh står för ett spindelnätsliknande nätverk där varje nod har direkt kontakt med sina närmaste grannar, indirekt kontakt genom hopp med mer avlägsna noder.)

Vad är en data fabric?

Ekonomidirektören råkade höra samtalet om datameshar och därför vill han höra varför datadirektören vill investera i en data fabric i stället för en datamesh.

Ekonomidirektören vill i själva verket veta tre saker:

Vad är en data fabric? Hur skiljer den sig från en datamesh? Varför vill datadirektören investera i data fabric?

När du får en sådan sammansatt fråga föreslår jag att du tar det lugnt, tar ett djupt andetag, funderar på vem det är som ställer frågan och sedan ger ett dekonstruerat svar. Jag skulle kanske börja med: ”Först och främst ska vi tala om data fabric och dess betydelse.”

Ross Stuart, senior lösningsarkitekt på Ahead, föreslår att man låter ekonomidirektören utgå från hur en fabric (väv, flätverk) ser ut och hur den fungerar:

”Data fabric är en term som används för att beskriva en arkitektur som tar olika slags system och väver samman dem, som ett flätverk, så att man får ett enhetligt lager ovanpå organisationens data.”

Ivan Batanov, vice vd med ansvar för produktutveckling på Crux tillägger: ”En data fabric-arkitektur kan ge förbättrade insikter och analys på ett effektiv sätt och det stöder inre sambandet mellan data från olika källor.”

Nu bör du ta en liten paus och ge publiken några sekunder att förstå sambandet mellan datamesh och data fabric, inklusive det som ser ut som en konflikt mellan de två arbetssätten. Hur kombinerar man dem? Jag föreslår att man säger något som detta:

”Datameshar gör det enklare för team att använda data i analys och för att förbättra datakvaliteten, medan data fabrics hjälper datadirektören och datastyrningsteamet att hantera tillgången till sammankopplade datakällor, oavsett var de finns – informationslager, datasjöar, filsystem och SaaS-applikationer.” (SaaS – software-as-a-service.)

Det vi belyser med dessa frågor och svar är de olika rollerna i organisationen och deras datarelaterade ansvar. Vi vill att team i företaget ska anamma medborgardatavetenskap och använda data för beslutsvattande. Organisationerna behöver en datadirektör som fokuserar på proaktiv datastyrning med målet att minska friktionen och riskerna vid demokratisering av data.

Vad är ett distribuerat datamoln?

Nu kommer vi till en tredje aspekt av datahantering. Nu gäller det att lagra och strukturera data för att kunna stötta användarnas behov, prestandamål och säkerhetskrav. ”Var bör vi lagra datamängden X?” är frågan nu, och det finns inget enkelt svar. I de flesta företag finns det ingen arkitektur av typ en storlek passar alla för lagring, hantering och användning av data.

James Malone, chef för produkthantering på Snowflake, säger:

”I stället för att ange ’hur’ när det gäller informationslagring så är molnet ’vad’ – det som man kan få med rätt mix av tekniker”, säger han:

”Molnet ger organisationerna möjlighet att välja något som passar dem i stället för att man bestämmer sig för och propagerar för ett enda sätt att göra saker. Användningsfall förändras, behov förändras och tekniken förändras – det är därför som datamolnet fokuserar på flexibilitet och nytta.”

Hillary Ashton, produktdirektör på Teradata, lägger till något viktigt som man bör berätta för ekonomidirektören:

”Datamoln kan köras på alla möjliga kombinationer av publika moln, privata moln ’i huset’, hybridmoln och multimoln”, säger hon:

”Men ’hjärnan’ i varje datamoln är molnanalysplattformen som behandlar och knyter samman data från alla källor och arkitekturer. Om du vill få mesta möjliga data från dina data är det viktigast att du kan skala upp din analysmotor och kapaciteten i hela organisationen, så att andra team än datavetarna kan komma åt data, ställa frågor och förvandla data till insikter.”

Att sammanfatta det hela

När du har kommit så här långt kanske vd:n och ekonomidirektören letar efter den rätta knappen att trycka på. Därför vill jag påminna dem om att det krävs hantverksskicklighet även för de enklaste jobb:

”För att göra ett gott bröd behöver du fem ingredienser – mjöl, vatten, jäst, salt och socker – i rätt proportioner, de ska knådas på rätt sätt, gräddas rätt tid och sedan sättas fram på ett elegant sätt om man ge det rätta intrycket.”

Alla som någonsin har försökt baka bröd vet hur svårt det är att få till en bra limpa varje gång. Det finns hundratals recept i kokböckerna, och det kommer nya hela tiden.

Att lagra, hantera, integrera, styra och använda data kan låta enkelt, men man behöver rätt ingredienser, rätt verktyg och rätt praktiker för att stötta en datadriven organisation.

 

Akriv - Nyheter