GITHUB HUGGINGFACE MODELSCOPE SHOWCASE От чат-бота до автономного агента Мы гордимся тем, что представляем Tongyi DeepResearch, первого полностью открытого веб-агента, который достиг производительности на уровне DeepResearch от OpenAI по комплексному набору бенчмарков. Tongyi DeepResearch демонстрирует передовые результаты, набирая 32.9 по академической задаче рассуждения "Последний экзамен человечества" (HLE), 43.4 по BrowseComp и 46.7 по BrowseComp-ZH в чрезвычайно сложных задачах поиска информации, а также достигая 75 баллов по ориентированному на пользователя бенчмарку xbench-DeepSearch, систематически превосходя всех существующих проприетарных и открытых агентов глубоких исследований.