• 作者:老汪软件技巧
  • 发表时间:2024-12-14 00:12
  • 浏览量:

提起cs231n,接触过CV的朋友可能都听说过。

这门课程最早从2015年开始开设,当时的讲师还是在跟 Li feifei 老师读博士的 Andrej Karpathy 大神。

转眼间近10年过去了,今天心血来潮,找到最新的网站看了下,内容又有更新,从深度学习在CV领域的基础知识到最新进展,均有涉及。具体参考——CS231n: Deep Learning for Computer Vision。

看到了课程内容熟悉的页面,一个想法油然而生——如何借助最新的大模型能力获取这门课程的所有课件呢?

有了想法,说干就干。

课件下载工作流

这里选择使用Dify和SiliconFlow提供的各种大模型API来进行实践。

Dify特别合适这种类似原型的开发,而SiliconFlow则是国内大模型API提供商。具体可以参考之前的文章——从Dify到SiliconFlow:构建高效AI应用/Agent的黄金组合。

具体的,分成三个步骤:

通过课程链接获取页面html解析html中的课程名称和对应的课件url通过上一步获取到的url,生成下载课件的脚本

有了上面的步骤,在dify中可以构造如下的工作流:

课程下载工作流

课程下载工作流

这里采用的大模型时deepseek最新的chat模型,核心配置就是步骤2和3中的提示词,具体如下:

based on the course's html below, extract all the slides' full url and title in markdown format, please output the markdown directly  
  
{{html}}  
  

based on the markdown and course_url, please give me a bash scirpt to download all slides and named the slides with corresponding lecture name, if one lecture had more than one slides, add ind as suffix in the name. please output the script directly.  
 
<makrdown>  
{{markdown_text}}  
<\markdown>  
 
<course_url>  
{{course_url}}  
<\course_url>

最终,获取到的下载脚本如下:

#!/bin/bash
# Base URL for the course
BASE_URL="https://cs231n.stanford.edu"
# Associative array to store the lecture names and corresponding slide URLs
declare -A LECTURES=(
    ["Lecture 1: Introduction"]="slides/2024/lecture_1_part_1.pdf slides/2024/lecture_1_part_2.pdf"
    ["Lecture 2: Image Classification with Linear Classifiers"]="slides/2024/lecture_2.pdf"
    ["Lecture 3: Regularization and Optimization"]="slides/2024/lecture_3.pdf"

斯坦福英语软件__公开课斯坦福

    ["Lecture 4: Neural Networks and Backpropagation"]="slides/2024/lecture_4.pdf"     ["Lecture 5: Image Classification with CNNs"]="slides/2024/lecture_5.pdf"     ["Lecture 6: CNN Architectures"]="slides/2024/lecture_6_part_1.pdf slides/2024/lecture_6_part_2.pdf slides/2024/lecture_6_review.pdf"     ["Lecture 7: Recurrent Neural Networks"]="slides/2024/lecture_7.pdf"     ["Lecture 8: Attention and Transformers"]="slides/2024/lecture_8.pdf"     ["Lecture 9: Object Detection and Image Segmentation"]="slides/2024/lecture_9.pdf"     ["Lecture 10: Video Understanding"]="slides/2024/lecture_10.pdf"     ["Lecture 11: Visualizing and Understanding"]="slides/2024/lecture_11.pdf"     ["Lecture 12: Self-supervised Learning"]="slides/2024/lecture_12.pdf"     ["Lecture 13: Generative Models"]="slides/2024/lecture_13.pdf"     ["Lecture 14: OpenAI Sora"]="slides/2024/lecture_14.pdf"     ["Lecture 15: Robot Learning"]="slides/2024/lecture_14.pdf"     ["Lecture 16: Human-Centered Artificial Intelligence"]="slides/2024/lecture_16.pdf"     ["Lecture 17: Guest Lecture by Prof. Serena Yeung-Levy"]="slides/2024/lecture_17.pdf"     ["Lecture 18: 3D Vision"]="slides/2024/lecture_18.pdf" ) # Loop through each lecture for LECTURE in "${!LECTURES[@]}"do     IFS=' ' read -r -a SLIDES <<< "${LECTURES[$LECTURE]}"     COUNT=1     for SLIDE in "${SLIDES[@]}"do         # Construct the full URL for the slide         FULL_URL="${BASE_URL}/${SLIDE}"         # Construct the filename         if [ ${#SLIDES[@]} -gt 1 ]; then             FILENAME="${LECTURE// /_}_part_${COUNT}.pdf"         else             FILENAME="${LECTURE// /_}.pdf"         fi         # Download the slide         curl -o "${FILENAME}" "${FULL_URL}"         # Increment the count for the next slide         COUNT=$((COUNT + 1))     done done

命令行执行 bash download_slides.sh 即可下载课程所有课件。

下载后的课程课件链接——Stanford CS231n 2024 Spring

另外,可以通过此链接注册SiliconFlow,体验各种大模型API。


上一条查看详情 +成长点滴-学习现代包管理器pnpm
下一条 查看详情 +没有了