Nedetid, driftsstans og feil – Forstå deres sanne kostnader (2023)

Nedetid, driftsstans og feil – Forstå deres sanne kostnader

Om

Dette innholdet er brakt til deg av Evolven. Evolven Change Analytics er en unik AIOps-løsning som sporer og analyserer alle faktiske endringer utført i bedriftens skymiljø. Evolven hjelper ledende virksomheter med å kutte antall hendelser, kutte feilsøkingstiden og eliminere uautoriserte endringer.Lære mer

Når det gjelder virksomhetskritiske applikasjoner eller datasenterytelseskvalitet, er bedrifter villige til å gjøre enorme investeringer. Dessverre gir disse investeringene ikke alltid full effekt.

Konfronterer nedetid av systemet

Til tross for innsatsen som er investert i robust infrastruktur, fortsetter mange IT-organisasjoner å håndtere nedetidshendelser i databaser, maskinvare og programvare som varer fra bare noen få minutter til flere dager, noe som gjør virksomheten fullstendig ufør og forårsaker enorme tap.

Nedetid forventet

En verden av IT-svikt kan noen ganger virke vanskelig.

Til tross for variasjonen av avanserte løsninger og de økende dataene som samles inn av store programvareleverandører for bedrifter og IT-avdelinger (fra ERP til CRM og mer), er strømbrudd fortsatt en gyldig og en skremmende trussel mot bransjen.

På den annen side har IT-feil på en eller annen måte blitt en iboende akseptert, til og med forventet, del av bedriftslivet.

Dette er kontraintuitivt...

IT nedetid tatt på nytt

Mens IT-fagfolk opplever å konfrontere nedetider fra tid til annen, og så er de fullt fokusert på å prøve å komme på toppen av dem, lider forretningsorganisasjonen som helhet av den "økonomiske smerten" av effekter, som har en tendens til å være svært betydelige.

Tidligere har vi tatt en grundig titt på de mange måtene IT-nedetid kan påvirke bedrifters bunnlinje (du kan lese mer om det her -Kostnader og omfang av uplanlagte driftsstans). Vi så på ulike aspekter, fra direkte tap av inntekter gjennom skade på omdømme til indirekte effekter som produktivitetsnedgang.

Nå ønsker jeg å se på problemet på nytt og undersøke hvordan organisasjoner bør adressere og vurdere trusler mot IT-driften deres, inkludert systemer, applikasjoner og data, ved å analysere solide (og etablerte) benchmarks som representerer de potensielle kostnadene bak nedetid og driftsstans.

Downtime, Outages and Failures - Understanding Their True Costs (3)Systembrudd:
Måling av store merkevarefeil

Når bør bransjen begynne å måle den økonomiske effekten av store merkevarebrudd, som den som nylig rammetFacebook, denen som traff hundretusenvis av Lloyds Bank-kunder, ellerJetstar-bruddsom resulterte i hundrevis av flyforsinkelser?

Med andre ord, på hvilket tidspunkt er et driftsstans «betydelig nok» slik at en kostnadsanalyse blir verdifull for bransjen for å lære av den og forutsi virkningen av fremtidige driftsavbrudd?

Vel, tilsynelatende på et tidspunkt skaper strømbruddet en innvirkning som ikke kan ignoreres, PR-messig. Det er point of no return, som etterfølges av økonomiske konsekvenser.

Nedetidskostnadene varierer betydelig mellom bransjer. Den berørte virksomhetsstørrelsen er åpenbart en kritisk faktor, men det er ikke den eneste store. IT-systemenes rolle i virksomheten er også sentral.

Downtime, Outages and Failures - Understanding Their True Costs (4)

Å sette en numerisk verdi bak et IT-brudd betyr å forhåndsdefinere implikasjonene på tvers av flere forretnings- og organisasjonsaspekter, slik at hele bransjen kan lære og optimalisere deretter.

En svikt i en kritisk applikasjon kan føre til to forskjellige typer tap:

  • Tap av applikasjonstjenesten – virkningen av nedetid varierer i henhold til applikasjonen og virksomheten;
  • Tap av data – potensielt tap av data på grunn av et systembrudd kan ha betydelige juridiske og økonomiske implikasjoner.

Nå er jeg sikker på at du er enig i at dagens datasentre aldri skal gå ned; applikasjoner må være tilgjengelige 24/7, og interne (for ikke å si eksterne) sluttbrukere over hele verden må kunne stole på datasentrenes tilgjengelighet (for kritiske data og applikasjonstilgjengelighet) til enhver tid.

Vel, virkeligheten biter. I backoffice (som betyr inne i datasenteret) er dette ikke tilfelle. Ingen organisasjoner nyter 100 % oppetid. Bør du strebe etter å nå 100%? Sikker. Men du bør også utvikle en dyp forståelse av nedetidsimplikasjoner og måter å minimere den på.

Det verste avbruddsmarerittet noensinne? Sannsynligvis den som skjedde med deg...

Downtime, Outages and Failures - Understanding Their True Costs (5)Noen tidligere avbruddshendelser ble til PR-katastrofer, som den mytologiske Virgin Blue-debakelen fra 2010, eller den nylige som påvirket Facebook.

Hvorfor? Massepåvirkningen hadde nok noe med saken å gjøre.

Som en påminnelse forhindret Virgin Blue-bruddet passasjerer fra å gå ombord på fly i 11 dager (!!), noe som resulterte i negativ presse, skadet omdømme og millioner av dollar tapt.

For å være mer nøyaktig: Virgin Blues reservasjonsadministrasjonsselskap, Navitaire, endte opp med å kompensere Virgin Blue for mer enn $20 millioner (Navitaire-bestillingsfeil tjener Virgin $20 millioner i Compo).

Det er mange andre hendelser som fortsatt klarer å fange oppmerksomheten til media. Her er bare en nyligartikkel av USA Today om strømbruddet i Wells Fargosom hindret kunder i å få tilgang til kontoene sine i mange timer.

Jeg kan trygt si at alle i IT-bransjen vil være enig i at driftsavbrudd eller nedetider er VELDIG dårlig for virksomheten. De er uønskede, svært skadelige økonomisk, og må bekjempes mot å bruke alle tilgjengelige ressurser.

Feilkonfigurasjoner er nøkkelen

IT Process Institutes Visible Ops Handbook rapporterte tidligere at "80 % av uplanlagte driftsavbrudd skyldes dårlig planlagte endringer gjort av administratorer ("driftspersonale") eller utviklere" (Synlig Ops).

Enterprise Management Association rapporterte at 60 % av tilgjengelighets- og ytelsesfeil er et resultat av feilkonfigurasjoner.

Hva koster det?

Nedetid kan koste bedrifter $5 600 per minutt og opptil $300 000 per time i nedetid for nettapplikasjoner (ifølge en2014 Gartners analyse).

Gjennomsnittlig timepris for nedetid for bedriftsservere, over hele verden, 2017-2018:

Downtime, Outages and Failures - Understanding Their True Costs (6)

Kilde:Statsmann

Vedlikeholdskostnadene for applikasjoner øker med en årlig hastighet på 20 %. Men det kan ikke løse alle problemene dine. En tidligere bransjeundersøkelse avslørte at minst en fjerdedel av nedetiden var forårsaket av konfigurasjonsfeil. (Hvor mye vil du bruke på nedetid for søknader i år?).

Hvor vanlig er nedetid eller driftsstans?

Ok, nedetid kan være et økonomisk mareritt. Den delen er tydelig. Men hvis du ønsker å estimere risikopotensialet for driftsstans for virksomheten din, bør det umiddelbare spørsmålet være "hvor sannsynlig er det at det skjer?"

Downtime, Outages and Failures - Understanding Their True Costs (7)

Kilde:Datasenterkunnskap

Ok, så strømbrudd er altfor vanlige til å bli ignorert ved å tenke "Det er ikke sannsynlig at jeg opplever et stort strømbrudd". Nå kommer spørsmålet om hvordan du skal beregne deres spesifikke risiko for virksomheten din.

Produksjons- og nedetidskostnader for applikasjoner tydeliggjort

Uplanlagte strømbrudd er opp til IT å løse. Likevel, og som jeg allerede har nevnt, på slutten av dagen påvirker disse strømbruddene hele organisasjonen.

En viktig del av en grundig evalueringsprosess for avbruddsrisiko er å estimere hvor mye penger du vil tape per time (eller minutt, eller et hvilket som helst annet tidsintervall etter eget valg) i tilfelle nedetid.

For bedrifter som utelukkende er avhengige av datasentres evne til å levere IT- og nettverkstjenester til kunder – for eksempel telekommunikasjonstjenesteleverandører eller e-handelsselskaper – kan nedetid være spesielt kostbart, med den høyeste kostnaden for en enkelt hendelse på over 1 million dollar (mer enn 11 000 dollar per minutt) ifølge estimater fra eksperter.

Downtime, Outages and Failures - Understanding Their True Costs (8)

I en USA Today-undersøkelse blant 200 datasenterledere rapporterte over 80 % at nedetidskostnadene deres oversteg $50 000 per time. Over 25 % rapporterte nedetidskostnader på over $500 000 per time (!!).

I følge en annen undersøkelse, mens selskaper ikke kan oppnå null nedetid, sa én av 10 selskaper at tilgjengeligheten deres må være større enn 99,999 %.

Downtime, Outages and Failures - Understanding Their True Costs (9)

Kilde:Searchcio Techtarget

For å få en solid forståelse av implikasjonene av produksjon og utgivelsesstans, la oss ta en titt på hvordan konsekvensene av nedetid kommer til uttrykk.

Nedetidskostnad - per år eller per hendelse?

EN2017 studieavslørte at av 400 IT-beslutningstakere opplevde 46 % mer enn fire timer med IT-relatert nedetid over 12 måneder; 23% sa at de pådro seg kostnader fra $12 000 opp til mer enn $1 million per time.

Over 35 % innrømmet at de er usikre på kostnadene ved en driftsstans.

Hvis du spør Delta-flyselskapene, som måtte kansellere 280 flyvninger på grunn av et strømbrudd i 2017, tapet av en enkelt avbruddshendelsekan nå over 150 millioner dollar.

For et par år siden rapporterte Dun & Bradstreet at 59 % av Fortune 500-selskapene opplever minimum 1,6 nedetidstimer per uke.

Hvis du tar det gjennomsnittlige Fortune 500-selskapet (eller et selskap som sysselsetter minst 10 000 ansatte) og antar at det betaler et IT-team i gjennomsnitt $56 per time, så (forutsatt at hele IT-en er opptatt med å løse nedetiden) er det bare arbeidskraften. en del av nedetiden for en organisasjon av denne størrelsen vil nå $896 000 per uke, noe som betyr mer enn $46 millioner per år (Vurderer den økonomiske konsekvensen av nedetid).

Selvfølgelig er virkeligheten mer komplisert, siden du må ta hensyn til mange parametere som tidspunktet for hendelsen (midt i uken eller helgen? Dag eller natt?) og mer. Forståelse av kostnadene ved driftsavbrudd vil likevel bidra betydelig til å estimere risikopotensialet ditt og avkastningen til verktøy som kan bidra til å minimere effekten av nedetidshendelser.

Har bransjen klart å lære av fortiden og å minimere sikkerhetsskadene under et strømbrudd?

Hvordan har ting endret seg fra tidligere?

Så vi vet allerede at nedetider og driftsstans hendelser fortsatt skjer i dag, og industrien har ennå ikke klart å avskaffe. Men hvordan har kostnadene deres endret seg over tid? Er disse hendelsene mindre skadelige i dag?

I 2010,en forskning av Coleman Parkesfant at IT-nedetidshendelser samlet sett koster bedrifter mer enn 127 millioner arbeidstimer per år - et gjennomsnitt på 545 timeverk per bedrift - i ansattes produktivitet.

I 2009 ble det rapportert at de gjennomsnittlige nedetidskostnadene varierer betydelig på tvers av bransjer, fra omtrent $90 000 per time i mediesektoren til rundt $6,48 millioner per time for store nettmeglere (Hvordan kvantifisere nedetid).

Ifølge en undersøkelse blant IT-ledere utført i løpet av disse årene, blir bedrifter mer bevisste på de direkte økonomiske kostnadene ved nedetid på datamaskiner. Undersøkelsen avdekket at én av fem bedrifter taper 12 000 dollar i timen på grunn av nedetid (Hvordan kvantifisere nedetid).

Som nevnt ovenfor rapporterte en senere analyse utført i 2014 av Gartner en gjennomsnittlig kostnad på $5600 per minutt og over $300k per time.

Selv allerede i 2004, anga et konservativt estimat fra Gartner timekostnaden for nedetid for datanettverk til $42.000. Følgelig kan et selskap som lider av en dårligere nedetid enn gjennomsnittet på 175 timer per år tape mer enn 7 millioner dollar årlig. Imidlertid påvirker kostnadene for hvert avbrudd hvert selskap forskjellig, så det er viktig å vite hvordan man beregner den nøyaktige økonomiske konsekvensen (Hvordan kvantifisere nedetid).

Det er fornuftig å tro at kostnadene ved strømbrudd bare blir høyere med tiden (siden vi alle lener oss mer på datasystemer i dag). Du kan derfor forstå hvorfor tidligere data kan multipliseres med et betydelig antall for å reflektere dagens virkelighet...

Hvert minutt teller

For over ti år siden ble gjennomsnittskostnaden for nedetid for et datasenter på tvers av bransjer verdsatt til omtrent $5 600 per minutt (Uplanlagte IT-avbrudd koster mer enn $5 000 per minutt), en figur som ihtGartner, forble den samme til 2014. Den nevnte tidligere studien av Ponemon Institute beregnet minimums-, median-, gjennomsnitts- og maksimumskostnad per minutt for ikke-planlagte avbrudd, basert på innspill fra 41 datasentre. Den største kostnaden for et uplanlagt driftsstans ble funnet å overstige $11 000 per minutt.

I gjennomsnitt vil kostnadene for et uplanlagt driftsavbrudd sannsynligvis overstige $5000 per minutt.

Det blir bare mer betydningsfullt

EN2013 studieså en økning på over 41 % fra de tidligere gjennomsnittene beskrevet ovenfor, og en gjennomsnittlig kostnad på mer enn $7900 per minutt.

AnITIC-undersøkelse fra 2015viste tydelig at timekostnaden (sammenlignet med data fra 2008) har økt med mellom 25 % til 30 %.

Nedetidspåvirkning per år

En tidligere analyse Gartner har beregnet at nedetidshendelser i gjennomsnitt kan nå 87 timer per år. Det er åpenbart summen av mange strømbrudd - alt fra noen få minutter til flere timer (Gjennomsnittlig storbedrift opplever 87 timers nedetid i nettverket i året).

Hvordan har ting endret seg?

En senereforskning fra 2011avslørte at selv om industrien har klart å bekjempe nedetidsepidemien og redusere forekomstene deres, ser vi fortsatt betydelige nedetidstimer og enorme inntektstap (Kilde:førte til over 3 millioner (tilsynelatende Whatsapp-brukere) som migrerte til Telegram)

Innvirkning på omdømme og lojalitet

Hvor mye er bedriftens omdømme verdt? Dette kan være ekstremt vanskelig å vurdere, samt den langsiktige effekten av et skadet omdømme og dets innvirkning på inntekter og lønnsomhet.

I dette tilfellet inkluderer nedetidskostnader tapte kunder (både på kort og lang sikt) og andre håndgripelige elementer som gjenspeiler kostnadene ved svekket omdømme som lagernedgang, markedsføringstimer (krise- og merkegjenopprettingsstyring) og mediebudsjett som kreves for å starte på nytt og polere opp. en organisasjons profil.

Hvilke parametere bør påvirke beregningen din?

Downtime, Outages and Failures - Understanding Their True Costs (10)Når du prøver å estimere kostnadene for nedetider, er det åpenbare direkte kostnader (som tap av virksomhet under nedetid). Imidlertid bør mange indirekte kostnader som ansattes overhead eller omdømmespørsmål diskutert ovenfor, også beregnes.

Overhead for arbeidsstyrken er avledet fra kostnadene ved å brenne "krigsrom"-oppgaver som fokuserer på å få IT-systemene i drift igjen, kostnadene ved å bli forsinket med alle andre planlagte oppgaver, kostnadene for ansattes overtidsutgifter (hvis aktuelt), og mer. Så er det verdien av datatap, nødvedlikeholdsgebyrer (spesielt hvis driftsavbruddet oppstår i fritimer) og ekstra reparasjonskostnader som kan fortsette lenge etter at tjenesten er gjenopprettet.

Det er unødvendig å si at du må beregne disse kostnadene når du estimerer implikasjonen av nedetid, da de vanligvis er svært betydelige; men selv et grovt anslag kan vise seg å være ekstremt fordelaktig for å forstå risikoen og bestemme hvilket teknologinivå du bør støtte deg på for å bekjempe det.

Det er også virkningen av tapt salg. For å ha en nøyaktig vurdering av det totale tapte salget, må påvirkningsprosenten økes for å gjenspeile den reelle levetidsverdien til kunder som permanent svikter til en konkurrent. For eksempel Facebook- (og Whatsapp)-bruddet som jeg nevnte tidligereKostnadsbevisst: Fornekter de sanne kostnadene ved nedetid i nettverket. Hva er inntektstapet ved at disse brukerne vil presentere mindre fakturerbare annonsevisninger?

Aksjen falt med 25 %

Downtime, Outages and Failures - Understanding Their True Costs (11)Selv om det er vanskelig å sette et tall på så mange parametere, er de fortsatt betydelige og betydelige. For eksempel, da Amazon.com gikk offline i flere timer i løpet av de første dagene, falt aksjen med 25 % på en enkelt dag (Kostnadsbevisst: Fornekter de sanne kostnadene ved nedetid i nettverket)!

I detteAmazon skybruddfor eksempel fortsatte selskapet å streve etter å få skytjenestene tilbake på nett. Som et resultat stilte mange kunder spørsmålstegn ved påliteligheten til skyen og Amazons kommunikasjon rundt strømbruddet. Andre kunder mente de burde få kompensasjon for nedetiden som en del av SLAen deres.

Jeg vet at du er nysgjerrig: Når det gjelder SLA, til tross for nesten fire dagers driftsstans, ble ikke Amazons EC2 SLA brutt (Sju leksjoner å lære av Amazons strømbrudd).

Kostnaden for nedetid: Beregn det selv

Hvor mye er du nødt til å tape på en uventet nedetid på servere eller forretningsapplikasjoner?

I følge flere kilder er den enkleste måten å beregne potensielle inntektstap under et strømbrudd ved å bruke denne ligningen:

TAPT INNTEKT=(GR/TH) x I x H
GR=brutto årlig inntekt
TH=samlet årlig arbeidstid
Jeg=prosentvis påvirkning
H=antall timer avbrudd

Hvordan minimere driftsstans og nedetidsrisiko?

Nedetid og driftsstans er katastrofale, men de trenger ikke å ha så stor innvirkning. Ved å bruke løsninger som fokuserer på å komme til roten av problemet, kan strømbrudd forhindres før de i det hele tatt oppstår.

Evolven Change Analyticsutviklet en unik AIOps-løsning som fokuserer på endringer - den sanne årsaken til ytelseshendelser. Evolven hjelper bedriftens IT- og Cloud Ops-team med å forhindre og feilsøke hendelser før problemet starter.

Kontakt ossfor å se hvordan vi hjelper ledende bedrifter med å kutte antall hendelser og MTTR.

References

Top Articles
Latest Posts
Article information

Author: Prof. An Powlowski

Last Updated: 10/09/2023

Views: 6470

Rating: 4.3 / 5 (44 voted)

Reviews: 83% of readers found this page helpful

Author information

Name: Prof. An Powlowski

Birthday: 1992-09-29

Address: Apt. 994 8891 Orval Hill, Brittnyburgh, AZ 41023-0398

Phone: +26417467956738

Job: District Marketing Strategist

Hobby: Embroidery, Bodybuilding, Motor sports, Amateur radio, Wood carving, Whittling, Air sports

Introduction: My name is Prof. An Powlowski, I am a charming, helpful, attractive, good, graceful, thoughtful, vast person who loves writing and wants to share my knowledge and understanding with you.