GITHUB HUGGINGFACE MODELSCOPE SHOWCASE 从聊天机器人到自主代理 我们自豪地推出Tongyi DeepResearch,这是第一个完全开源的网络代理,其性能与OpenAI的DeepResearch在一系列综合基准测试中相当。Tongyi DeepResearch展示了最先进的结果,在学术推理任务“人类的最后考试”(HLE)中得分32.9,在BrowseComp中得分43.4,在BrowseComp-ZH中得分46.7,在极其复杂的信息检索任务中表现出色,并在以用户为中心的xbench-DeepSearch基准测试中获得75分,系统性地超越了所有现有的专有和开源深度研究代理。