A NovaSky Introduz Modlo de Inteligência Artificial Econômico
O recém-lançado Sky-T1-32B-Preview da equipe de pesquisa da NovaSky, baseada no Sky Computing Lab da UC Berkeley, tem criado empolgação com desempenho competitivo contra o OpenAI o1 por um custo inferior a $450.
Informações sobre o AI Sky-T1
O Sky-T1 é o primeiro modelo de raciocínio verdadeiramente open source, completamente replicável graças ao conjunto de dados e código de treinamento disponibilizados pela equipe.
Redução de Custos no Treinamento de AI
Historicamente, treinar um modelo AI com desempenho semelhante poderia custar milhões. NovaSky demonstrou que o raciocínio AI de alto nível pode ser alcançado de maneira eficiente e econômica, graças à exploração de dados de treinamento sintéticos.
Benefícios dos Modelos de Raciocínio AI
Modelos de raciocínio como o Sky-T1 apresentam capacidade de autoverificação e são especialmente confiáveis em domínios de física, ciência e matemática, apesar de demorarem um pouco mais para encontrar soluções.
Detalhes do Treinamento do Sky-T1
NovaSky usou o modelo de raciocínio AI da Alibaba, o QwQ-32B-Preview, e o GPT-4o-mini da OpenAI para gerar e reformular os dados de treinamento iniciais, realizando o processo em aproximadamente 19 horas usando 8 GPUs Nvidia H100.
Desempenho do Modelo de Raciocínio Sky-T1
Sky-T1 superou uma versão inicial do OpenAI o1 nos testes MATH500 e LiveCodeBench. Entretanto, o desempenho foi menor no GPQA-Diamond, um teste abrangendo questões de física, biologia e química.
NovaSky já estabeleceu planos para o futuro, focados em desenvolver modelos mais eficientes com forte performance de raciocínio e técniques que otimizem a eficiência e precisão.
Fonte original: Leia a matéria completa no TechCrunch