Email de suporte

Verificou-se que o email de suporte não estava a receber os emails correctamente, esta situação deveu-se a uma incompatibilidade entre o sistema de tickets e o novo servidor. Já se encontra resolvida e os pedidos de suporte deverão ser enviados normalmente para suporte@kolorbit.com

Novo servidor

Dia 31 tivemos vários problemas com o servidor. Por volta da hora de almoço, recebemos uma notificação de reboot automático e deixámos de conseguir aceder a qualquer serviço. Nem o próprio ping nem trace obtiam resposta. Contactado o datacenter, foram despistados problemas de rede e efectuado novo reboot. Recebemos a informação que não haveria nenhum problema de rede, no entanto tivemos por momentos dificuldades em aceder ao painel de gestão remota. Confirmado que não haveria nenhum problema de rede nem de hardware foi efectuado um arranque com um Live CD que permite aceder aos discos e efectuar a verificação e correcção de erros. Foi efectuado novo reboot sem serviços com sucesso, e a partir daqui fomos levantando vários serviços, excepto as quotas em disco e o anti-spam/anti-virus do email que mantemos em baixo, visto não se tratarem de processos fundamentais e consumirem bastante CPU e IO.

Durante o processo verificámos também a integridade do backup que corre diariamente de madrugada, e que em caso de falha grave a nivel de hardware e de impossibilidade de recuperação dos dados em tempo útil seria utilizado para restaurar num novo servidor.

Esta é uma situação “normal” para um provedor de alojamentos e VPS. O que não foi normal foi o tempo necessário por parte do nosso provedor – a EasySpeedy – a responder às nossas solicitações. De forma que uma questão que podia ter sido resolvida em 20 minutos demorou praticamente 3 horas até ficar resolvida.

No nosso planeamento estava previsto um upgrade de servidor para alturas de Agosto, visto o actual já se apresentar frequentemente no limite de carga e o próprio hardware também já contar com 3 anos (que no mundo actual da informática é uma eternidade). No entanto e derivado desta situação somos forçados a antecipar os nossos planos e já estamos a trabalhar na instalação de um novo servidor.

Iremos trocar de provedor para a OVH, visto em termos de servidores e datacenter apresentar um nivel muito bom, a nivel europeu provavelmente do melhor mesmo. Em termos de rede, gostariamos de voltar a estar com uma ligação directa no Gigapix (embora a PT/Sapo/Meo insistir em não fazer ligação), temos informações que está em negociação, mas no entanto temos uma latência muito razoável.

Servidor actual:  76ms
Novo:  44ms

Em termos de especificações de hardware:
Intel i5 @ 2.66Ghz
16 Gb Ram
2T HDD
GigaEthernet

Estamos a proceder à instalação de todo o software necessário e testes de carga e manutenção. Logo que esteja pronto iremos iniciar a migração das contas. Brevemente mais informações.

Estado de serviço – Update

Na semana passada verificaram-se vários periodos de lentidão e mesmo pontualmente interrupções no serviço, que forum prontamente mitigadas.

http://twitter.com/kolorbit

Foi efectuada uma extensa auditoria ao servidor e foi concluido que num dos VPS (Servidor Virtual Privado) estava a correr um servidor Apache com proxy activado, com falhas de configuração que permitia acessos proxy de qualquer IP. Inclusive o IP do VPS já se encontrava em algumas listas de proxys abertos/inseguros. Os constantes acessos com um volume considerável foram passando despercebidos visto que tiveram um aumento progressivo e serem confundiveis com tráfego HTTP legitimo. No processo de auditoria aproveitámos para efectuar vários upgrades conforme as últimas notícias aqui no blog, e também para reforçar os processos de monitorização da utilização de recursos e rede.

Quando esta situação foi mitigada (através da correcta configuração do mod_proxy) a utilização de recursos do servidor diminuiu bastante, e neste momento, passados vários dias desde a intervenção, verifica-se uma utilização de recursos perfeitamente adequada ao hardware instalado. No entanto, conforme previsto, em meados dos próximos meses será efectuado um upgrade no hardware por forma a acautelar necessidades futuras.

Relembramos mais uma vez que qualquer falha ou situação anómala deverá ser comunicada por email para suporte@kolorbit.com ou por telefone para o 91 745 57 31 (em casos urgentes de interrupção de serviço) após verificação no twitter – http://twitter.com/kolorbit – se já se encontra reportada ou em resolução.

Lembramos também, os utilizadores de VPS, que a instalação de software adicional deverá ser efectuada de uma forma responsável e que em caso de dúvida deverão sempre contactar o suporte que prestará o auxilio técnico necessário.

Upgrade PostgreSQL

Foi efectuado o upgrade do PostgreSQL para a última versão stable da série 8.4. Além das vantagens em termos de segurança e funcionalidade de ter a versão stable, verificou-se que a versão que estava instalada, embora recente, apresentava um consumo de recursos anormal especialmente em situações de carga já de si elevada.

Este upgrade, mantendo a mesma série não implica nenhum tipo de actualização ou revisão aos sites alojados que recorrem a esta base de dados relacional.

Upgrade AV – Clamav

Foi efectuado um upgrade no Clamav, o anti-virus que mantém os virus longe das nossas caixas de e-mail, para a última versão stable.

Neste momento estão a ser filtrados 846.214 virus e respectivas variantes (sim, praticamente 1 milhão…). Estamos ainda a enviar estatisticas anónimas relativas à detecção de virus, que poderá consultar nesta página do projecto:

http://www.clamav.net/lang/en/download/cvd/malware-stats/

Upgrade Webmail

Foi efectuadao o upgrade do webmail – http://webmail.kolorbit.com/ – para a versão 0.5.1 com inúmeras melhorias em termos de performance e novas funcionalidades, das quais destacamos:

– melhor suporte ao envio e recepção de emails html
– emails favoritos (stared/ unstared)
– suporte a respostas de email por tópicos

já se encontra diponível, como sempre qualquer comentário ou bug detectado contactem o nosso suporte.

Conta Twitter – Problemas no housing

No seguimento dos problemas já resolvidos no âmbito do housing, e visto que a comunicação com todos os utilizadores torna-se um pouco complicada, decidimos abrir no twitter uma conta que irá permitir a comunicação em tempo real em situações de falha de serviço.

Adicione aos seus favoritos:
http://twitter.com/kolorbit

Para as actualizações normais e novidades vamos continuar a usar o blog, portanto a conta do twitter será utilizada em exclusivo para comunicações urgentes / falhas de serviço.

Downtime – Problemas no housing

Sábado, 30 de Outubro pelas 14h30 o servidor ficou inacessível, passados alguns minutos estavamos a ser contactados telefónicamente e a averiguar junto do provedor. O que aparentemente seria um problema de rede, veio-se a revelar um grave problema eléctrico que ficou resolvido praticamente 2h depois.

No seguimento, foram efectuadas várias operações com os sistemas já online, e houve um erro humano nas operações de substituição dos circuitos e ups que levou a que hoje, Quarta-feira 03 de Novembro, surgisse nova falha de energia de cerca de 10 minutos.

Estas interrupções de energia, não são nada “saudáveis” quer para o hardware que para o software. Neste momento foi verificado o disco de erros, e os serviços, e tirando algumas tabelas no MySQL que foi necessário reparar aparentemente tudo está a funcionar correctamente, no entanto os utilizadores deverão reportar qualquer falha que detectem nos serviços. Foram também verificados as máquinas virtuais que estamos a servir e aparentemente, visto que é impossível saber e validar todos os serviços, tudo levantou e está a correr normalmente.

Para informações nestas alturas de crise, em que o nosso próprio site também fica sem serviço, configuramos uma conta no twitter que deverá seguir/consultar, o que não invalida/anula o contacto telefónico, aliás se houver uma indisponibilidade no serviço e não constar no twitter deverá ser reportado por telefone.

http://twitter.com/kolorbit

Em anexo os reports detalhados das ocorrências:
gct28979_rfo.pdf
gct29122_rfo.pdf

Upgrade Webmail

Continuamos a seguir o desenvolvimento do belíssimo (e de código livre) webmail Roundcube, agora na iteração 0.4.2, a destacar nesta versão o painel de pre-visualização dos emails e as opções de listagem, além de várias melhorias e bugs resolvidos.

Existem novas opções de configuração que poderá/deverá explorar para costumizar o comportamento ao seu gosto.

Poderá aceder ao novo webmail em http://webmail.kolorbit.com/