MuZero, Alphazero e Alphadev: otimizando sistemas de computador

MuZero, Alphazero e Alphadev: otimizando sistemas de computador

Como parte de nosso objetivo de construir sistemas de inteligência artificial cada vez mais capaz e geral, estamos trabalhando para criar ferramentas de IA com uma compreensão mais ampla do mundo. Isso pode permitir que o conhecimento útil seja transferido entre muitos tipos diferentes de tarefas.

Usando a aprendizagem de reforço, nossos sistemas de IA Alphazero e Muzero alcançaram jogos de desempenho sobre -humano. Desde então, expandimos seus recursos para ajudar a projetar melhores chips de computador, além de otimizar data centers e compactação de vídeo. E nossa versão especializada do Alphazero, chamada Alphadev, também descobriu novos algoritmos para acelerar o software nas fundações de nossa sociedade digital.

Os primeiros resultados mostraram o potencial transformador de ferramentas de IA de uso mais geral. Aqui, explicamos como esses avanços estão moldando o futuro da computação – e já ajudando bilhões de pessoas e do planeta.

Projetando melhores chips de computador

O hardware especializado é essencial para garantir que os sistemas de IA de hoje sejam eficientes em recursos para os usuários em escala. Mas projetar e produzir novos chips de computador pode levar anos de trabalho.

Nossos pesquisadores desenvolveram uma abordagem baseada em IA para projetar circuitos mais poderosos e eficientes. Ao tratar um circuito como uma rede neural, encontramos uma maneira de acelerar o design dos chips e levar o desempenho a novas alturas.

As redes neurais geralmente são projetadas para obter entradas do usuário e gerar saídas, como imagens, texto ou vídeo. Dentro da rede neural, as bordas se conectam aos nós em uma estrutura de gráfico.

Para criar um design de circuito, nossa equipe propôs redes neurais de circuito, um novo tipo de rede neural que transforma as bordas em fios e nós em portões lógicos e aprende como conectá -los.

Ilustração animada de uma rede neural de circuito Aprendendo um design de circuito. Ele determina quais arestas (fios) se conectam a quais nós (portões lógicos) para melhorar o projeto geral do circuito.

Otimizamos o circuito instruído para velocidade computacional, eficiência energética e tamanho, mantendo sua funcionalidade. Usando ‘recozimento simulado’, uma técnica de pesquisa clássica que parece um passo para o futuro, também testamos opções diferentes para encontrar sua configuração ideal.

Com esta técnica, vencemos o Concurso de programação IWLS 2023 – Com a melhor solução em 82% dos problemas de design de circuitos na competição.

Nossa equipe também usou o Alphazero, que pode procurar muitas etapas para o futuro, para melhorar o design do circuito, tratando o desafio como um jogo para resolver.

Até agora, nossa pesquisa que combina redes neurais de circuito com a função de recompensa do aprendizado de reforço mostrou resultados muito promissores para a criação de chips de computador ainda mais avançados.

Otimizando os recursos do data center

Os data centers gerenciam tudo, desde a entrega dos resultados da pesquisa até os conjuntos de dados de processamento. Como um jogo de tetris multidimensional, um sistema chamado Borg Gerencia e otimiza cargas de trabalho dentro dos vastos data centers do Google.

Para agendar tarefas, Borg conta com regras codificadas manualmente. Mas, na escala do Google, as regras codificadas manualmente não podem cobrir a variedade de distribuições de carga de trabalho em constante mudança. Então eles são projetados como um tamanho para melhor se encaixar em todos.

É aqui que as tecnologias de aprendizado de máquina como o Alphazero são especialmente úteis: elas podem trabalhar em escala, criando automaticamente regras individuais que são idealmente adaptadas para as várias distribuições de carga de trabalho.

Durante seu treinamento, o Alphazero aprendeu a reconhecer padrões em tarefas que entram nos data centers e também aprendeu a prever as melhores maneiras de gerenciar a capacidade e tomar decisões com os melhores resultados a longo prazo.

Quando aplicamos o Alphazero a Borg em ensaios experimentais, descobrimos que poderíamos reduzir a proporção de hardware subutilizado no data center em até 19%.

Uma visualização animada de armazenamento de dados limpo e otimizado, versus armazenamento confuso e não otimizado.

Comprimindo vídeo com eficiência

O streaming de vídeo compõe a maioria do tráfego da Internet. Portanto, encontrar maneiras de tornar o streaming mais eficiente, por mais grande ou pequeno, terá um enorme impacto nos milhões de pessoas assistindo a vídeos todos os dias.

Trabalhamos com o YouTube para comprimir e transmitir vídeo usando as habilidades de solução de problemas da Muzero. Ao reduzir a taxa de bits em 4%, o MuZero aumentou a experiência geral do YouTube – sem comprometer a qualidade visual.

Inicialmente, aplicamos o MuZero para otimizar a compactação de cada quadro de vídeo individual. Agora, expandimos este trabalho para ajudar a tomar decisões sobre como os quadros são agrupados e referenciados durante a codificação, levando a uma economia de maior taxa de bits.

Os resultados dessas duas primeiras etapas mostram uma grande promessa do potencial da Muzero de se tornar uma ferramenta mais generalizada, ajudando a encontrar soluções ideais em todo o processo de compactação de vídeo.

Uma visualização demonstrando como o MuZero comprime arquivos de vídeo. Ele define grupos de imagens com semelhanças visuais para compressão. Um único quadro de chave é compactado. MuZero comprime outros quadros, usando o quadro -chave como referência. O processo se repete para o restante do vídeo, até que a compactação seja concluída.

Descobrindo algoritmos mais rápidos

Alphadevuma versão do Alphazero, fez um novo avanço na ciência da computação, quando descobriu algoritmos mais rápidos de classificação e hash. Esses processos fundamentais são usados ​​trilhões de vezes por dia para classificar, armazenar e recuperar dados.

Algoritmos de classificação da Alphadev

Os algoritmos de classificação ajudam os dispositivos digitais a processar e exibir informações, desde a classificação dos resultados da pesquisa on -line e as postagens sociais até as recomendações do usuário.

Alphadev descobriu um algoritmo que aumenta a eficiência para classificar sequências curtas de elementos em 70% e em cerca de 1,7% para sequências contendo mais de 250.000 elementos, em comparação com os algoritmos na biblioteca C ++. Isso significa que os resultados gerados a partir de consultas do usuário podem ser classificados muito mais rapidamente. Quando usado em escala, isso economiza enormes quantidades de tempo e energia.

Algoritmos de hash de Alphadev

Os algoritmos de hash são frequentemente usados ​​para armazenamento e recuperação de dados, como em um banco de dados de clientes. Eles normalmente usam uma chave (por exemplo, o nome de usuário “Jane Doe”) para gerar um hash exclusivo, que corresponde aos valores de dados que precisam recuperar (por exemplo, “Pedido número 164335-87”).

Como um bibliotecário que usa um sistema de classificação para encontrar rapidamente um livro específico, com um sistema de hash, o computador já sabe o que está procurando e onde encontrá -lo. Quando aplicado à faixa de 9 a 16 bytes de funções de hash nos data centers, o algoritmo da Alphadev melhorou a eficiência em 30%.

O impacto desses algoritmos

Adicionamos os algoritmos de classificação ao Biblioteca C ++ padrão LLVM -Substituindo sub-rotinas que são usadas por mais de uma década. E contribuiu com os algoritmos de hash de Alphadev para o Biblioteca ABSEIL.

Desde então, milhões de desenvolvedores e empresas começaram a usá -los em indústrias tão diversas quanto a computação em nuvem, compras on -line e gerenciamento da cadeia de suprimentos.

Ferramentas de uso geral para alimentar nosso futuro digital

Nossas ferramentas de IA já estão economizando bilhões de pessoas tempo e energia. Este é apenas o começo. Prevemos um futuro em que as ferramentas de IA de uso geral podem ajudar a otimizar o ecossistema de computação global.

Ainda não estamos lá – ainda precisamos de infraestrutura digital mais rápida, mais eficiente e sustentável.

São necessários muitos outros avanços teóricos e tecnológicos para criar ferramentas de IA totalmente generalizadas. Mas o potencial dessas ferramentas – entre tecnologia, ciência e medicina – nos deixa empolgados com o que está no horizonte.

Saiba mais sobre o Alphadev

Source link

Análises e Notícias em Tempo Real

Sem mais notícias para mostrar.