Скачать 100 000 картинок с сайта.
Dec. 23rd, 2012 01:03 pm![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Нужно скачать около 100 000 изображений с сайта.
Всего на сайте 314 категорий, в каждой по 300-400 изображений.
Структура сайта такая:
сайт.ру/номер категории/номер файла.jpg
то есть
сайт.ру/img/1/1.jpg
сайт.ру/img/1/1+.jpg
сайт.ру/img/1/2.jpg
сайт.ру/img/1/2+.jpg
...
сайт.ру/img/314/200.jpg
сайт.ру/img/314/200+.jpg
Прямых ссылок на файлы нет.
Есть ли возможность скачать автоматически?
Спасибо.
Всего на сайте 314 категорий, в каждой по 300-400 изображений.
Структура сайта такая:
сайт.ру/номер категории/номер файла.jpg
то есть
сайт.ру/img/1/1.jpg
сайт.ру/img/1/1+.jpg
сайт.ру/img/1/2.jpg
сайт.ру/img/1/2+.jpg
...
сайт.ру/img/314/200.jpg
сайт.ру/img/314/200+.jpg
Прямых ссылок на файлы нет.
Есть ли возможность скачать автоматически?
Спасибо.
no subject
Date: 2012-12-23 10:05 am (UTC)З.Ы. Воровать - нехорошо.
no subject
Date: 2012-12-23 10:12 am (UTC)no subject
Date: 2012-12-23 10:09 am (UTC)no subject
Date: 2012-12-23 10:14 am (UTC)no subject
Date: 2012-12-23 10:19 am (UTC)no subject
Date: 2012-12-23 10:21 am (UTC)no subject
Date: 2012-12-23 10:10 am (UTC)no subject
Date: 2012-12-23 10:12 am (UTC)no subject
Date: 2012-12-23 03:27 pm (UTC)do
j=1
while wget сайт.ру/img/$i/$j.jpg
do
wget сайт.ру/img/$i/$j+.jpg
j=`expr 1 + $j`
done
done
no subject
Date: 2012-12-23 11:42 pm (UTC)вывел на экран, заменив wget -c на echo:
for i in `seq 1 30`; do for j in `seq 1 400`; do echo сайт.ру/img/$i/$j.jpg ; echo сайт.ру/img/$i/$j+.jpg ; done ; done
вроде как работает.
Не понял зачем у вас там while, j=1 и j=`expr 1 + $j`?
wget -c лучше чем голый wget
no subject
Date: 2012-12-24 03:38 am (UTC)while обрабатывает ненайденный файл, "j=" - замена seq в for.
no subject
Date: 2012-12-24 09:20 am (UTC)скажу больше, это сайт.ру
no subject
Date: 2012-12-24 09:53 am (UTC)