Le jeu de données Open Instruction Generalist (OIG) est un grand jeu de données d'instructions open-source contenant environ 43 millions d'instructions. Développé par LAION et ses collaborateurs, l'OIG vise à démocratiser l'accès à la technologie des chatbots. Il est conçu pour faciliter la conversion des modèles de langage pré-entraînés en modèles suivant des instructions, soutenant une variété de tâches, y compris le dialogue, la synthèse et l'éducation.