GITHUB HUGGINGFACE MODELSCOPE SHOWCASE Von Chatbot zu autonomem Agenten Wir sind stolz, Tongyi DeepResearch vorzustellen, den ersten vollständig Open-Source-Web-Agenten, der eine Leistung erreicht, die mit OpenAI's DeepResearch in einer umfassenden Reihe von Benchmarks vergleichbar ist. Tongyi DeepResearch zeigt Ergebnisse auf dem neuesten Stand der Technik und erzielt 32,9 bei der akademischen Denkaufgabe Humanity’s Last Exam (HLE), 43,4 bei BrowseComp und 46,7 bei BrowseComp-ZH in äußerst komplexen informationssuchenden Aufgaben und erreicht einen Wert von 75 beim benutzerzentrierten xbench-DeepSearch-Benchmark, wobei er systematisch alle bestehenden proprietären und Open-Source-Deep-Research-Agenten übertrifft.