El conjunto de datos Open Instruction Generalist (OIG) es un gran conjunto de datos de instrucciones de código abierto que contiene aproximadamente 43 millones de instrucciones. Desarrollado por LAION y sus colaboradores, OIG tiene como objetivo democratizar el acceso a la tecnología de chatbots. Está diseñado para facilitar la conversión de modelos de lenguaje preentrenados en modelos que siguen instrucciones, apoyando una variedad de tareas que incluyen diálogo, resumen y educación.