O conjunto de dados Open Instruction Generalist (OIG) é um grande conjunto de dados de instruções de código aberto contendo aproximadamente 43 milhões de instruções. Desenvolvido pela LAION e seus colaboradores, o OIG tem como objetivo democratizar o acesso à tecnologia de chatbot. Ele é projetado para facilitar a conversão de modelos de linguagem pré-treinados em modelos que seguem instruções, apoiando uma variedade de tarefas, incluindo diálogo, resumo e educação.