Número do Painel | |
Autor | |
Instituição | UFSC |
Tipo de Bolsa | PIBIC/CNPq |
Orientador | ODORICO MACHADO MENDIZABAL |
Depto | DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA / INE/CTC |
Centro | CENTRO TECNOLOGICO |
Laboratório | Laboratório de Pesquisa em Sistemas Distribuídos |
Grande Área / Área do Conhecimento | Ciências Exatas e da Terra
/Ciências Exatas e da Terra |
Sub-área do Conhecimento | Sistemas de Computação |
Titulo | Desenvolvimento de serviços de replicação em plataformas de orquestração de contêineres |
Resumo | A arquitetura de microsserviços possui diversas vantagens quando comparada com a abordagem monolítica, como, escalabilidade, facilidade de implantação e reuso de componentes. Sendo a maioria das arquiteturas de microsserviços implementadas através de contêineres. Em qualquer sistema, é necessário levar em conta suas possíveis falhas tal como indisponibilidade de serviços, corrupção de dados, etc. A tolerância a falhas é um conjunto de técnicas para manter a confiabilidade de sistemas na presença de falhas, com diversas abordagens, sendo algumas delas a redundância e salvamento/restauração. O enfoque desse projeto foi avaliar ferramentas e estratégias para salvamento/restauração de contêineres em ambientes de microsserviços. Ao procurar estudos relacionados com salvamento/restauração de contêineres, algumas ferramentas foram encontradas, tal como a ferramenta CRIU, BCLR e DMTCP. A ferramenta CRIU foi a escolhida para ser estudada por ter sido amplamente adotada e por possuir integração com a plataforma de contêineres docker. Quando se fala em técnicas de salvamento/restauração, é preciso considerar o tamanho ocupado pelo salvamento e também que quando ocorrem salvamentos periódicos do estado de uma aplicação, pode afetar o seu normal funcionamento, devido aos períodos de interrupção. Para observar estes e outros pontos, foi desenvolvido um protótipo de banco de dados chave-valor em memória, com clientes geradores de carga, fazendo requisições de escrita/leitura e realização de salvamento periodicamente durante a execução. Com o protótipo, foi possível observar e medir através de experimentos: tempos de indisponibilidade, tamanhos de salvamento e algumas limitações da técnica, por exemplo chamadas de sistema se perdem. Com esse projeto adquiriu-se conhecimentos sobre arquiteturas de microsserviços, técnicas de tolerância a falhas, configuração de sistemas distribuídos, configuração de experimentos, automação de experimentos com shell script e analise experimental. |
Link do Video | https://repositorio.ufsc.br/handle/123456789/226659 |
Palavras-chave | sistemas distribuídos, replicação, tolerância a falhas, alto desempenho, software básico |
Colaboradores |