Amazon acredita que o futuro dos data centers depende de um problema técnico que acabou de resolver


Com o tempo, a indústria tecnológica desenvolveu e implantou variações da arquitetura fat-tree. Mas o design pode ser melhorado. Geralmente é confiável, mas também rígido, ineficiente e requer cabeamento complexo. Como em cabos físicos reais.

Se você já esteve em um data center ou na sala de servidores de um prédio de escritórios, provavelmente já viu ninhos de cabos coloridos saindo de racks de metal. O cabeamento é um dos maiores custos em redes, diz Rehder, e os data centers globais da Amazon estão atualmente conectados com 20 milhões de quilômetros de cabos de fibra óptica. Essa é aproximadamente a distância necessária para viajar da Terra à Lua e voltar 25 vezes.

Em 2012, à medida que a procura por serviços de computação em nuvem explodia, um grupo de investigadores da Universidade de Illinois Urbana-Champaign, incluindo Godfrey, apresentou um conceito conhecido como Medusa. Os projetos de rede fixa em uso na época estavam lutando para atender à demanda crescente, então os pesquisadores propuseram uma “interconexão de rede de alta capacidade que, ao adotar uma topologia de gráfico aleatório, cede naturalmente à expansão incremental”. Eles acreditavam que essa abordagem aleatória poderia ser mais eficiente e escalável do que redes construídas usando a arquitetura fat-tree.

“Demos-lhe o nome de Medusa porque é fluido”, diz Godfrey. “Você pode conectar os roteadores e switches aleatoriamente e isso se torna um conjunto flexível de capacidade de rede, que é muito eficiente.”

No entanto, a Jellyfish também introduziu novos desafios em layout, roteamento de dados e cabeamento. O roteamento em gráficos aleatórios é mais complicado, diz Godfrey, porque há muito mais e diversificados caminhos que os dados podem seguir da origem ao destino. O cabeamento é mais difícil porque as extremidades dos cabos são escolhidas aleatoriamente.

Alguns anos depois, o Google começou a brincar com outra solução: começou a integrar a comutação de circuitos ópticosou OCS, em seus projetos de rede. Essa abordagem usa pequenos espelhos para refletir a luz de uma porta de entrada para uma porta de saída, o que permite ao Google reconfigurar o cabeamento óptico em tempo real. Mas, novamente: isso adiciona uma certa complexidade de engenharia, bem como custos.

Cortesia da Amazon

Cortesia da Amazon

Tão aleatório

Enquanto isso, a Amazon estava em busca do “Santo Graal”, diz Giacomo Bernardi, que é um dos principais autores do novo artigo, juntamente com os estudiosos da Amazon Ratul Mahajan e CS Seshandhri. Num mundo ideal, uma rede de dados seria plana e eficiente, resiliente a falhas de hardware, aleatória o suficiente para maximizar o desempenho e escalável o suficiente para crescer sem se tornar pesada. Também dependeria de cabeamento mais simples e otimizado, em vez de sistemas de fibra óptica cada vez mais complexos.

Quando ele e seus colegas começaram a tentar construir essa rede, Bernardi diz que já estava obcecado pelo ladrilho de Penrose, uma espécie de ladrilho aperiódico que leva o nome do físico britânico Roger Penrose. (Outros pesquisadores foram tão inspirados pelas coisas de Penrose que eles tentaram traduzir os padrões em código de correção de erros em computadores quânticos.) Bernardi se perguntou se a Amazon poderia usar uma construção semelhante e criar uma “malha” plana seguindo um padrão repetitivo. Ele e sua equipe tentaram construir uma simulação de como isso seria.



Source link