--- license: other license_name: glm-4-9b-webrl license_link: https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE language: - zh tags: - glm - thudm - webrl inference: false --- # GLM-4-9B-Chat Read this in [English](README_en.md). ## 模型介绍 WebRL-GLM-4-9B 是智谱 AI 推出的 WebRL 在 GLM-4-9B 的开源版本。 具备完成在 WebArena 中 OpenStreetMap (Map),Reddit,GitLab,online store content management system (CMS) 和 OneStopShop (OSS) 五个网站上进行网页操作的功能。 ## 评测结果 我们在一些 WebArena-Lite 上对 WebRL-GLM-4-9B 模型进行了评测,并得到了如下的结果: | Model | Reddit | Gitlab | CMS | Map | OSS | Avg.SR | |:--------------------|:------:|:------:|:------:|:------:|:------:|:--------:| | Llama-3-8B-Instruct | 0.0 | 3.3 | 2.9 | 11.1 | 4.8 | 79.6 | | GLM-4-9B-Chat | 5.4 | 10.0 | 6.7 | 3.3 | 6.7 | 6.1 | | WebRL-GLM-4-9B | 57.9 | 50.0 | 48.6| 36.7 | 37.8 | 43.0 | **更多推理代码和依赖信息,请访问我们的 [github](https://github.com/THUDM/WebRL)。** ## 引用 如果你觉得我们的工作有帮助的话,请考虑引用下列论文。 ``` @artical{qi2024webrl, title={WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning}, author={Zehan Qi and Xiao Liu and Iat Long Iong and Hanyu Lai and Xueqiao Sun and Xinyue Yang and Jiadai Sun and Yu Yang and Shuntian Yao and Tianjie Zhang and Wei Xu and Jie Tang and Yuxiao Dong}, journal={arXiv preprint arXiv:2411.02337}, year={2024}, } ```