更新
发现有别人写好的更好用的脚本,功能完善,支持多种下载方式,且多线程。
CLI-Tool for download Huggingface models an
国内支持:将脚本44行的HF_ENDPOINT=${HF_ENDPOINT:-"https://huggingface.co"}变更为HF_ENDPOINT=${HF_ENDPOINT:-"https://hf-mirror.com"}即可。
其余使用方法详见教程。
原笔记
今天这个笔记是绝对的常用,因为是shell脚本,理论上不是huggingface的下载链接也可以用,可以说相当实用了(笔者在不同的公司写了三次这个脚本,要是早点写笔记就不用这样了,冷抖泪)
实现批量下载+自动重命名文件,不需要自己一个一个对着链接重命名啦,比市面上的都快捷。原理很简单,是自动提取url最后一个”/“后的字段,然后根据?拆成两部分,只取第一部分,这样就把原链接中的查询字段等多余字段去除,提取正确的文件名。
使用方式:
- 创建一个txt文档,将你需要下载的文件url一行一个粘贴进去
- 把这个脚本拖到下载目标文件夹下
- 目标文件夹下执行
bash yourscriptname.sh - 命令行填入之前创建的txt文件名
- 回车执行即可,日志会记录在
download_log.txt,如果命令行没有输出就去日志里看一下
1 | !/bin/bash |
hf国内镜像站:https://hf-mirror.com/
本脚本下一轮迭代计划:
实现解析hf-url自动创建文件夹,例如https://hf-mirror.com/Qwen/Qwen2-VL-7B-Instruct/resolve/main/README.md?download=true,实现自动创建`Qwen2-VL-7B-Instruct/resolve/main/`文件夹并下载至该路径。