Researchers open source Sky-T1, a ‘reasoning’ AI model that can be trained for less than $450

A NovaSky Introduz Modlo de Inteligência Artificial Econômico

O recém-lançado Sky-T1-32B-Preview da equipe de pesquisa da NovaSky, baseada no Sky Computing Lab da UC Berkeley, tem criado empolgação com desempenho competitivo contra o OpenAI o1 por um custo inferior a $450.

Informações sobre o AI Sky-T1

O Sky-T1 é o primeiro modelo de raciocínio verdadeiramente open source, completamente replicável graças ao conjunto de dados e código de treinamento disponibilizados pela equipe.

Redução de Custos no Treinamento de AI

Historicamente, treinar um modelo AI com desempenho semelhante poderia custar milhões. NovaSky demonstrou que o raciocínio AI de alto nível pode ser alcançado de maneira eficiente e econômica, graças à exploração de dados de treinamento sintéticos.

Benefícios dos Modelos de Raciocínio AI

Modelos de raciocínio como o Sky-T1 apresentam capacidade de autoverificação e são especialmente confiáveis em domínios de física, ciência e matemática, apesar de demorarem um pouco mais para encontrar soluções.

Detalhes do Treinamento do Sky-T1

NovaSky usou o modelo de raciocínio AI da Alibaba, o QwQ-32B-Preview, e o GPT-4o-mini da OpenAI para gerar e reformular os dados de treinamento iniciais, realizando o processo em aproximadamente 19 horas usando 8 GPUs Nvidia H100.

Desempenho do Modelo de Raciocínio Sky-T1

Sky-T1 superou uma versão inicial do OpenAI o1 nos testes MATH500 e LiveCodeBench. Entretanto, o desempenho foi menor no GPQA-Diamond, um teste abrangendo questões de física, biologia e química.

NovaSky já estabeleceu planos para o futuro, focados em desenvolver modelos mais eficientes com forte performance de raciocínio e técniques que otimizem a eficiência e precisão.

Fonte original: Leia a matéria completa no TechCrunch