FullStack Bench：字节豆包联合M-A-P社区开源的全新代码评估基准

作者：老汪软件技巧
发表时间：2024-12-09 10:06
浏览量：

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

微信公众号｜搜一搜：蚝油菜花

快速阅读全面评估：FullStack Bench能评估大型语言模型在多种真实编程场景下的能力，包括基础编程、数据科学、机器学习等多个领域。多语言支持：覆盖16种广泛使用的编程语言，让评估结果更具普遍性和实用性。实际应用场景模拟：基于从Stack Overflow等社区抽取问题，模拟真实世界编程问题，确保评估的相关性和实际应用价值。正文（附运行示例）FullStack Bench 是什么

公众号: 蚝油菜花 - FullStackBench

FullStack Bench是由字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。该基准覆盖超过11种真实编程场景，包含3374个问题，涉及16种编程语言，旨在更有效地衡量大模型在现实世界中的代码开发能力。

FullStack Bench基于模拟真实编程应用领域，提供一个全面、多领域的评估平台，有助于推动代码智能技术的进步。

FullStack Bench 的主要功能FullStack Bench 的技术原理如何运行 FullStack Bench

首先，启动沙盒服务器：

docker run -d --rm -p 8080:8080 volcengine/sandbox-fusion:server-20241204

对于中国大陆用户，可以使用以下镜像：

docker run -d --rm -p 8080:8080 vemlp-cn-beijing.cr.volces.com/preset-images/code-sandbox:server-20241204

然后，运行基准测试：

_FullStack Bench：字节豆包联合M-A-P社区开源的全新代码评估基准_FullStack Bench：字节豆包联合M-A-P社区开源的全新代码评估基准

git clone https://github.com/bytedance/FullStackBench.git
cd FullStackBench
pip install -r requirements.txt
# 修改src/main.py中的模型配置
python src/main.py

资源

微信公众号｜搜一搜：蚝油菜花

上一条查看详情 +学习 cuixiaorui 大佬的 mini-webpack 的学习笔记！

下一条 查看详情 +没有了