Ceph object store storing

Incident Report for TrueFullstaq

Resolved

Na verdere capaciteitsuitbreidingen afgelopen maandag hebben we geen verdere issues meer geconstateerd op het platform.
Bij deze wordt deze storing afgesloten.
Posted Feb 07, 2024 - 15:03 CET

Monitoring

De fix is inmiddels geïmplementeerd, waarmee de problemen lijken te zijn opgelost.

We houden de situatie voorlopig in de gaten.
Posted Feb 05, 2024 - 21:03 CET

Identified

We hebben inmiddels gevonden dat in specifieke, uitzonderlijke combinatie van HTTP-headers er in enkele gevallen voor kunnen zorgen dat er verminderde performance of gefaalde requests optreden.

We zijn nu bezig met het implementeren van een fix.
Posted Feb 05, 2024 - 20:49 CET

Update

Het platform is vanmiddag verder uitgebreid. Sinds het begin van de avond lijkt toch wederom sprake van verlaagde performance. We zijn momenteel aan het uitzoeken hoe dit komt.
Posted Feb 05, 2024 - 19:34 CET

Update

Vandaag heeft een multidisciplinair team binnen True verder onderzoek gedaan naar de oorzaak van de hoge load op het platform en een aantal wijzigingen gemaakt om verdere impact te beperken.
In de tussentijd wordt er nog gewerkt om de capaciteit van het platform verder uit te breiden.
Posted Feb 02, 2024 - 18:03 CET

Monitoring

Op dit moment ervaren wij geen impact meer op ons Ceph platform. Morgenochtend zal ons onderzoek naar de oorzaak verder gaan.
Posted Feb 01, 2024 - 23:03 CET

Update

We are continuing to investigate this issue.
Posted Feb 01, 2024 - 23:01 CET

Update

Uit ons onderzoek blijkt dat de instabiliteit/traagheid veroorzaakt wordt door een hoge load op het platform.
Helaas heef het herstarten van de servers niet geleid tot een permanente oplossing en wordt er nog steeds traagheid ervaren.
Op dit moment wordt er gekeken of we extra nood capaciteit bij kunnen schakelen.

Volgende update volgt uiterlijk om 23:00
Posted Feb 01, 2024 - 22:07 CET

Investigating

We are currently investigating this issue.
Posted Feb 01, 2024 - 21:12 CET
This incident affected: Managed Storage (Object store).