Der Open Instruction Generalist (OIG) Datensatz ist ein großes Open-Source-Datensatz mit Anweisungen, der etwa 43 Millionen Anweisungen enthält. Entwickelt von LAION und seinen Mitarbeitern, zielt OIG darauf ab, den Zugang zur Chatbot-Technologie zu demokratisieren. Er ist darauf ausgelegt, die Umwandlung von vortrainierten Sprachmodellen in anweisungsfolgende Modelle zu erleichtern und unterstützt eine Vielzahl von Aufgaben, einschließlich Dialog, Zusammenfassung und Bildung.