- 作者:老汪软件技巧
- 发表时间:2024-09-11 21:01
- 浏览量:
01有话题的新闻
韩国东洋未来大学的研究人员在 arXiv 上发表了一篇新论文,探讨了 ChatGPT 在计算机科学领域的教育影响。研究结果支持了这样一种观点,即生成式 AI(gen AI)能够帮助学生提升学习效果,尽管有些人担心这种技术会被作弊者滥用。
据了解,在这项研究中,研究人员孙熙焕、金裕度和李熙珍选取了 36 名计算机科学专业的学生,进行了为期四周的软件开发竞赛,学生们可以在竞赛中使用 ChatGPT。
在第一轮中,根据代码质量、创新性和项目要求的遵守情况等绩效指标对所有 36 名学生进行评估。得分最高的 15 名学生进入第二轮,进行最终排名并选出冠军。
研究人员表示,他们发现在项目的不同阶段,包括构思、文档、软件开发和质量保证等,大量使用 ChatGPT 的学生完成率更高,分数也更高。对第一轮和第二轮学生进行的比较分析发现,他们在软件开发中使用生成式 AI 的经验存在显著差异。
在一项研究后的调查中,研究人员发现,78% 的参与者认为 AI 帮助他们对复杂主题有了更深入的理解。四分之三的学生表示,ChatGPT 显著提高了他们的实践技能,同样比例的学生表示其对他们的职业发展产生了积极影响。
生成式人工智能在当下的发展阶段,能够与开发人员密切合作,共同发挥作用,产生更好的效果。例如,它可以帮助开发人员解决代码中遇到的问题,加快代码编写速度等,双方相互配合,实现优势互补。(@IT 之家)
2、称字节 AI 硬件团队首款自研产品为智能耳机,与豆包大模型联动
据报道,字节正在探索将大模型与硬件结合,既自己开发 AI 硬件,也会与外部硬件公司合作。
据称字节 AI 硬件团队的第一款产品为智能耳机,该款耳机将植入豆包大模型,并与字节 2023 年 8 月上线的对话类 AI 应用豆包 App 结合:戴上智能耳机后,用户可通过语音对话随时使用豆包,在豆包 App 上也可以操控这款耳机。
在此之前,字节跳动已在本月完成对开放式耳机品牌 Oladance(主体公司:深圳大十未来科技有限公司)的收购,并实现 100% 控股。
字节的 AI 硬件团队目前主要以大十未来科技的人员为基础,隶属于字节 AI 产品团队 Flow。此外也有少数人来自 Kayden(字节 AI 硬件相关团队负责人)在 2020 年创立的一家硬件公司,该公司的部分专利和团队在 2022 年被字节收购。
报道称字节同时在探索 AI 眼镜方向,可能会投资一家新公司或组建内部团队,一名互联网公司的前大模型核心人物已在与字节合作研发 AI 眼镜。(@IT 之家)
3、AMD 将推出 AI 芯片
AMD 首席执行官苏姿丰在高盛举办的通信和技术会议上表示,人工智能的发展超出了她五年前的预期,AMD 正在为未来五年做出重大投资。
在 AMD 的 MI300x 成功发布九个月后,苏姿丰表示,新的 MI 系列芯片将紧随其后发布。今年晚些时候,AMD 将正式推动其 MI325 人工智能芯片上市,明年将推出 MI350,2026 年将推出 MI400,以挑战竞争对手英伟达的主导地位。
苏姿丰透露,新一代 MI 系列芯片将拥有高达 192GB 的内存和惊人的 1530 亿个晶体管。强大的内存能力意味着 AMD 的人工智能芯片可以用来训练大型语言模型——比如 OpenAI 的 ChatGPT。当然,目前的 AI 芯片市场仍是由英伟达占据绝对主导地位,但 AMD 正在快速追赶中。(@雷锋网)
4、曝 OpenAI 神秘新模型将在两周内发布
据 The Information 报道,OpenAI 的神秘大模型「草莓」(Strawberry,之前称为 Q*)可能要提早发布。
报道称,OpenAI 计划在未来两周内将 Strawberry 整合到其 ChatGPT 服务中推出。不过,知情人士表示,虽然 Strawberry 是 ChatGPT 的⼀部分,但它是⼀个独⽴的产品。
报道指出,Strawberry 与其他模型的最⼤区别在于它能够在响应之前「思考」,⽽不是⽴即回答查询。
另外,初始版本的 Strawberry ,只能输入和⽣成⽂本,⽽不能⽣成图像。(@爱范儿)
5、DeepSeek-Coder-V2-Instruct-0724
DeepSeek 发布了他们的 DeepSeek-Coder-V2-Instruct-0724,它在 Aider LLM 排行榜上排名第 2,击败了 DeepSeek V2.5。DeepSeek-Coder-V2 是一个开源的 Mixture-of-Experts (MoE) 代码语言模型,在代码特定任务中表现可与 GPT4-Turbo 相媲美。该模型从 DeepSeek-V2 的中间检查点进一步预训练,增加了 6 万亿个 tokens,显著增强了编码和数学推理能力,同时在一般语言任务中保持了相当的性能。支持的编程语言从 86 种扩展到 338 种,上下文长度从 16K 扩展到 128K。(@机器之心 SOTA 模型)
02有态度的观点
1、Andrej Karpathy 最新访谈:未来模型将聚焦于处理重要信息的 「认知核心」
OpenAI 联合创始人、前特斯拉 AI 总监 Andrej Karpathy 强调 Transformer 不仅是一个神经网络,更像是一种通用的 「差分计算机」,能够通过自我调整高效处理复杂任务,其扩展性使得大规模模型成为可能。他认为,尽管当前大模型非常强大,但小模型通过蒸馏技术也将拥有巨大的潜力,甚至能够处理复杂任务。随着互联网数据的饱和,AI 发展将更多依赖于合成数据,而大模型在处理多任务和类似生态系统的 「集群化」 方式中展现其优势。未来的模型将更加聚焦于 「认知核心」,即处理重要信息的能力。
Karpathy 还讨论了自动驾驶技术的发展,认为尽管技术已经很成熟,但从示范到产品化的过程中存在很大差距,主要是由于监管和其他非技术因素。他对 Tesla 的自动驾驶项目持乐观态度,认为软件问题相对更容易解决,而 Waymo 面临的是硬件问题。在人形机器人的研发中,他提到了技术转移的可能性,认为技术转移可能会比人们想象的更容易,它们可能首先在工厂里进行自我孵化,然后进入 B2B 领域,最后应用于 B2C。并讨论了人形机器人的应用领域和发展方向。
关于 AI 与人类结合的未来,Karpathy 认为 AI 工具将成为人类大脑的外部扩展,有助于赋能人类,并可能通过某种形式的 「神经链接」 进一步增强人类能力。他还谈到了开源系统的重要性,以及如何通过 AI 提供全球优质教育。最后,他建议未来的学习重点应该放在数学、物理和计算机科学等核心学科上,以培养解决问题的能力。(@雷锋网)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻