Программа для скачивания страницы целиком.

Обычно я сохраняю важные веб-страницы с помощью функции «Файл -> Сохранить как» в любом браузере, либо горячие клавиши «Ctrl + S». Но особо интересные сайты хочется скачать к себе на диск полностью. При этом чувствую себя хомяком, который тащит всё к себе, но всё равно надо 🙂

Ну что ж, скопировать сайт целиком это уже давно не проблема, надо лишь выбрать подходящий для себя способ. А их три:

  • Открывать каждую страничку и сохранять на диск
  • Использовать онлайн-сервисы
  • Пользоваться специальными программами

А теперь подробнее о последних двух способах.

Онлайн-сервисы

Как несложно догадаться из названия – это специальные сайты, с помощью которых можно скачать другие сайты из интернета. Преимущество данного подхода в том, что не нужно устанавливать дополнительных программ, и, соответственно, не важно какая операционная система установлена. Вроде бы всё классно – вставил имя сайта, нажал скачать, и получаешь готовый архив. Но на деле всё оказалось не настолько радужным.

Недостаток сервисов в том, что их мало, а те что есть, работают так себе, либо просят денег. Лично у меня ни разу не получалось скачать даже одностраничный сайт. Сервисы показывали процесс загрузки и зависали. Но тем не менее, список прилагаю:

Пользоваться программой довольно легко, нам в этом поможет «мастер». После запуска программы отображается дерево папок и файлов слева, и приглашение мастера справа. Дерево нужно только для того чтобы открыть ранее сохранённый проект. Нажимаем «Далее» чтобы начать новый проект или возобновить прерванную закачку:

Вводим любое название и путь для сохранения сайта. Путь по умолчанию «C:\Мои Web Сайты» лучше поменять на «C:\Downloads»:

На третьем шаге нужно ввести домен.. Тип проекта можно выбрать «Загрузить сайт(ы)», если это новый проект, или «Продолжить прерванную загрузку», если нужно докачать сайт. Вариант «Обновить существующую закачку» полезен для тех, кто уже имеет копию сайта, но хочет её обновить до последней.

Здесь же можно задать дополнительные параметры, которые могут сократить время загрузки. По умолчанию можно ничего не менять, программа и так отработает нормально. Но всё же рекомендую обратить внимание на некоторые параметры:

  • Фильтры. Вы можете ограничить тип файлов для закачки. Например, запретить или разрешить скачивание видео или архивов (ZIP, RAR, CAB). По умолчанию включены картинки png, jpg, gif, файлы стилей css и скрипты js.
  • Ограничения. Задайте максимальную глубину сканирования сайта. Глубина – это количество переходов по ссылкам со стартовой страницы. Например, если стартовой является главная страница сайта, а глубина равна 2, то программа скачает первый уровень, т.е. главную страницу, и страницы на которые есть ссылки с главной, и всё. Если задать глубину 3, то будут скачены более глубокие страницы. Оптимальным является 3-4 уровня.
  • Линки. Поставьте галочку «Получить вначале HTML файлы!», это позволит сначала выкачать основной текстовый контент сайта, а затем уже картинки и другие файлы.

Идём дальше. На четвёртом шаге можно позволить автоматически устанавливать интернет-соединение и разрывать его по окончании закачки. Также можно выставить автоматическое выключение компьютера, по окончании работы (галочка «Shutdown PC when finished»).

Нажимаем «Готово» и идём за чашечкой кофе, пока WinHTTrack WebSite Copier работает за нас.

Готовый сайт можно открыть двумя способами.

  • из папки, в которую сохраняли проект, кликнув по файлу index.html. В этом случае откроется страница со списком всех проектов. Нужно выбрать интересующий.
  • из папки с именем самого проекта, кликнув по файлу index.html. В этом случае сразу откроется сайт.

Скрипт DollySites

Я лично пользуюсь платным скриптом, но чтобы его установить нужен хостинг и немного опыта. Но зато скрипт работает очень хорошо, все скопированные мною сайты открывались один-в-один как в оригинале. Этому скрипту . Я его использую для создания копий лендингов, но работает он с любыми, даже самыми большими сайтами.

Offline Explorer

Платная программа-комбайн, есть демо. Из явных отличий от WinHTTrack:

  • встроенный Web-browser и Web сервер для локального предпросмотра;
  • распознаёт и загружает ссылки из HTML файлов, Java- и VB- скриптов, классов Java, Macromedia Flash (SFW), CSS, XML/XSL/DTD, TOC, PDF, M3U, AAM, RealMedia (SMIL, RAM, RPM) и MS NetShow Channel (.NSC) файлов;
  • поиск по загруженным сайтам;
  • экспорт в различные форматы (в т.ч. для записи сайтов на CD);
  • удаление скриптов со страниц web.archive.org.

Интерфейс покажется более замороченным, но ничего сложного в нём нет. Запускаем мастер:

Выбираем один из 12 шаблонов:

Например, шаблон «Download only one page with images and scripts» заточен для загрузки только одной страницы. Если не знаете какой выбрать, то пусть будет «Default Template». Далее вводим нужный сайт, любое название проекта и путь к папке на диске:

По окончанию загрузки придёт уведомление на рабочий стол.

Из платных, ещё можете попробовать некогда легендарную программу Teleport Pro (на английском), но по-моему за неё просят намного больше, чем она стоит, да и устарела уже.

Какие есть ограничения у копий

Хочу внести ясность, что скопированный проект, даже если он точь-в-точь будет выглядеть как оригинал, это не означает что будут работать все функции. Не будет работать функционал, который исполняется на сервере, т.е. различные калькуляторы, опросы, подбор по параметрам — работать не будут 99%. Если функционал реализован с помощью Javascript, то будет работать.

Но.php скрипты скачать с сервера НЕВОЗМОЖНО, вообще НИКАК. Также не будут работать формы обратной связи и подачи заявок без ручных доработок, кстати DollySites делает это. Учтите, что некоторые сайты имеют защиту от скачивания, и в таком случае вы получите пустую страницу или сообщение об ошибке.

Представьте ситуацию: вы зашли на какой-нибудь сайт, нашли на нем интересную информацию и теперь думаете, как бы ее сохранить. Самый простой вариант — это воспользоваться , которые поддерживает любой из современных интернет-обозревателей. Проблема только в том, что зайти на сайт или определенную страницу с помощью закладок вы сможете только в том случае, если ваш компьютер подключен к интернету.

Другой возможный вариант — это сохранение текста со страницы в вордовский документ, Excel или любой другой текстовый редактор. Но в этом случае у вас не получится сохранить картинки, да и выглядеть такой документ будет, мягко говоря, не очень.

Для того, что бы сохранить страницу из интернета на компьютере и всегда иметь к ней доступ в независимости от того, подключен ли ваш компьютер к интернету или нет, в каждом браузере имеется специальная функция, которая умеет сохранять веб-документы, включая целые страницы.

Сохраняем страницу на ПК

Итак, как упоминалось чуть выше, вы можете сохранить страницу в любом из современных браузеров: , Opera или (я привел в пример наиболее популярные интернет-обозреватели).

Сейчас я покажу вам в картинках, как правильно воспользоваться данной функцией. Пример я покажу на основе браузера Google Chrome, в остальных обозревателях процесс будет аналогичным. Итак, поехали.

Первым делом нужно открыть ту страницу, которую вы хотели бы сохранить. Я открыл Яндекс.Новости. Здесь я вижу список новостей.

Следующий очень важный момент: появится окно, в котором вы сможете не только задать имя файла (или оставить его таким, какое оно есть), но и выбрать место для загрузки нашей странички.

Обратите свое внимание на тип файла, так как это очень важно. Дело в том, что по-умолчанию браузер сохраняет веб-страницу полностью, включая картинки, текст и прочие файлы, из которых в том числе может состоять страница. Решите для себя, что именно вам нужно сохранить — если всю страницу целиком, то ничего не меняйте, а просто нажмите «Сохранить». В том случае, если вам нужен только текст, выберите «Веб-страница, только текст».

К слову, картинки и прочие файлы будут сохранены в отдельной папке. Если удалить эти файлы, то откроется только страница с текстом. Думаю, с этим у вас проблем не будет.

В Google Chrome есть одна дополнительная функция, которая отсутствует в других браузерах (на момент написания статьи). С ее помощью вы сможете сохранить страницу в виде . Для этого необходимо вызвать меню «Печать» (нажмите на сочетание клавиш CTRL+P), затем в графе «Принтер» нажмите «Изменить».

Последний шаг — сохраняем PDF-документ на компьютере, нажав на одноименную кнопку в меню.

Еще раз повторюсь, что процедура в других браузерах будет абсолютно идентичной, за исключением разве что пункта, благодаря которому в Google Chrome можно сохранять страницы в PDF-формате. Кроме того, почти все браузеры поддерживают сохранение с помощью нажатия на определенные клавиши. В данном случае это CTRL+S.

Надеюсь, эта небольшая статья помогла вам разобраться с появившейся проблемой. Если у вас возникли какие-то вопросы по теме, прошу задавать их с помощью комментариев, форма для написания которых находится чуть ниже.

Скачать сайт целиком или отдельные страницы?

Загоревшись идеей скачать сайт, я подумал и о том, как это можно реализовать. И самая первая идея, которую я решил испытать, была до банальности проста. Я нажал в браузере "Файл" - выбрал пункт "Сохранить страницу как" и сохранил у себя на жестком диске. Такой метод мне понравился по началу и я принялся сохранять страницы, дойдя до 45 страницы я понял, что трачу свое время на то, что можно было бы сделать намного быстрее и проще.

Внимание! Этот способ отлично подойдет Вам, если хотите сохранить только пару страниц.

Сайт, который я хотел скачать целиком себе на компьютер, чтобы потом смотреть его без подключения к интернету, состоял из 2000 страниц. Учитывая такой объем, сохранять по одной странице оказалось очень неэффективным методом. Но я решил не отчаиваться и отправился на поиски нового способа. Учитывая насколько развит сейчас интернет, я подумал, что наверняка найдется способ, скачать сайт целиком через online сервис, и сейчас я расскажу Вам, что из этого вышло.

Как скачать сайт через интернет или используем online сервис?

Найти сайт с помощью которого можно скачать другой сайт, у меня не получилось, даже не смотря на то, что я старался. Зато, я нашел нечто более интересное. Два замечательных online сервиса, с помощью которых можно легко и просто сохранять отдельные страницы сайта. И затем открывать их в любом месте и в любом устройстве. В этом Вам помогут Evernote и Pocket.

Evernote вы можете установить на любое устройство, а именно Windows XP, Windows Vista, Windows 7, Windows 8, Android, iPad, iPhone, Macbook и т.д. Для того, чтобы установить на Macbook или iPhone, зайдите в Appstore и воспользуйтесь поиском. Если хотите установить на Android, зайдите в Маркет (Google Play) и найдите через поиск. Для того, чтобы установить эту программу на Windows, Вам необходимо перейти на .

Pocket можно установить на iPhone, iPad, компьютер Mac, Android, а так же на Kobo и Windows (на винду только как плагин к браузеру Google Chrome).

Почему стоит использовать Evernote и Pocket?

Многие могут подумать, что гораздо проще нажать (Файл -> Сохранить страницу как) , чем загружать дополнительную программу, разбираться в ней, и т.д. Вы ОПЯТЬ правы, дорогие друзья, это проще, но не лучше. И сейчас, я расскажу Вам почему. Если вы хотите сохранить сайт целиком на компьютер , то эти программы не самый лучший вариант, так как Вам придется сохранять все по странично.

Возможностей этой программы намного больше, чем я рассказал, поэтому я Вам ее рекомендую к использованию.

Программа Pocket, позволит Вам сохранять страницы, изображения, видео ролики для offline просмотра. Но она полюбому заслуживает Вашего внимания. Особенно, если у Вас iPhone, iMac, Mac mini или Macbook.

Как скачать сайт целиком на Windows?

Я без доли сомнения могу Вам посоветовать программу HTTrack Website copier , ее можно скачать бесплатно на . Эта программа возможно не порадует Вас своим интерфейсом, а их сайт выглядит просто ужасно, но тем не менее, программа делает свое дело. С ее помощью вы можете скачать сайт целиком, занимаясь при этом своими делами. Пока сайт скачивается можно попить чай, погулять или поиграть в игру.

После того, как вы установили программу, запустите ее. Выберите Русский язык и перезапустите программу.

1. Задайте имя проекту, можно написать что угодно, но я советую написать название сайта, например Tryhere

2. Выберите Каталог, куда будет сохраняться сайт. И Нажмите далее...

3. На следующей странице в пункте Тип выберите "Загрузить сайт(ы)"

4. Введите адрес веб сайта, который хотите загрузить

5. Нажмите Задать параметры, уберите галочку напротив пункта Использовать Прокси

6. Перейдите на вкладку Линки и установите галочку напротив пункта "Получить вначале HTML файлы"

Если остались вопросы, задавайте их в комментариях.

Как скачать сайт целиком на Linux?

Скачать полностью сайт на компьютер по управлением операционной системой Linux можно с помощью Терминала. Не стоит бояться выполнять этот трюк на своем компьютере, даже если вы сделаете что-то не так, то ничего страшного не случится. Я не буду Вас грузить лишней информацией, поэтому сразу перейдем к делу.

Внимание. В данной инструкции я буду говорить "введите команду", это значит что вы должны ввести команду и нажать кнопку Enter на клавиатуре, чтобы выполнить команду.

1. Открываем Терминал. (Он обычно находится в Системных программах или Утилитах)

2. После того, как откроется "Терминал" введите команду: mkdir tryhere/ - вместо слова tryhere вы можете ввести любое другое название, какое хотите (только без пробелов и без русских букв)

3. Затем введите команду cd tryhere/

4. Последняя команда, которую нужно будет ввести, это wget --wait=20 --limit-rate=400K -r -p -U Mozilla http://сайт

Для тех кому интересно, я объясню последнюю команду, смотрите "--wait=20" - нужна для того, чтобы скачивание сайта происходило с перерывами в 20 секунд, это важно, потому что иначе Вас могут заблокировать на 10 минут или более, из-за постоянного обращения к сайту.

Команда "--limit-rate=400K" нужна для ограничения загрузки файлов более 400 кб.

Команда "-r" нужна для сканирования и загрузки всех подразделов сайта.

Команда "-p" следит за тем, чтобы скачивались все необходимые файлы для корректного отображения скаченного сайта.

Команда "-U" специфична для браузера Mozilla.

Команда http://сайт - это тот сайт, который вы хотите полностью скачать себе на компьютер.

Как скачать сайт целиком на Mac?

Самая лучшая программа для загрузки сайта на Mac компьютер, это конечно же Sitesucker , ее вы сможете скачать в AppStore . Она совершенно бесплатна, и что-то о ней говорить или объяснять нет смысла, потому что она очень проста и работает в один клик. Установите ее, запустите, введите адрес сайта, который хотите скачать целиком. И нажмите кнопку Скачать (Download). После этого программа сама сделает все что необходимо. По окончанию ее работы, вы сможете просматривать скаченный сайт без подключения к интернет.

Надо сделать локальную копию страницы (скрин, текстовый или HTML-файл), которая будет храниться на диске. Так вы в любой момент сможете изучить находящуюся там информацию. Конечно, если компьютер с необходимыми данными окажется рядом. Можно перенести не только текстовый контент, но и картинки, элементы форматирования, структуру. Узнайте, как сделать скриншот страницы ресурса глобальной сети, скопировать её сразу со всем графическим и мультимедийным контентом или сохранить её содержимое в виде файла.

Можно перенести данные из обозревателя в любой текстовый редактор. Для этого лучше всего подойдёт Microsoft Word. В нём корректно отображаются изображения и форматирование. Хотя из-за специфики документа может не очень эстетично выглядеть реклама, меню и некоторые фреймы.

  1. Откройте нужный URL.
  2. Нажмите Ctrl+A. Или кликните правой кнопкой мыши по любой свободной от картинок и flash-анимации области и в контекстном меню выберите «Выделить». Это надо сделать для охвата всей информации, а не какого-то произвольного куска статьи.
  3. Ctrl+C. Или в том же контекстном меню найдите опцию «Копировать».
  4. Откройте Word.
  5. Поставьте курсор в документ и нажмите клавиши Ctrl+V.
  6. После этого надо сохранить файл.

Иногда получается так, что переносится только текст. Если вам нужен остальной контент, можно взять и его. Вот как скопировать страницу веб-ресурса полностью - со всеми гиперссылками, рисунками:

  1. Проделайте предыдущие шаги до пункта 4.
  2. Кликните в документе правой кнопкой мыши.
  3. В разделе «Параметры вставки» отыщите кнопку «Сохранить исходное форматирование». Наведите на неё - во всплывающей подсказке появится название. Если у вас компьютер с Office 2007, возможность выбрать этот параметр появляется только после вставки - рядом с добавленным фрагментом отобразится соответствующая пиктограмма.

В некоторых случаях нельзя скопировать графику и форматирование. Только текст. Даже без разделения на абзацы. Но можно сделать скриншот или использовать специальное программное обеспечение для переноса содержимого страницы на компьютер.

Сайты с защитой от копирования

Иногда на ресурсе стоит так называемая «Защита от копирования». Она заключается в том, что текст на них нельзя выделить или перенести в другое место. Но это ограничение можно обойти. Вот как это сделать:

  1. Щёлкните правой кнопкой мыши в любом свободном месте страницы.
  2. Выберите «Исходный код» или «Просмотр кода».
  3. Откроется окно, в котором вся информация находится в html-тегах.
  4. Чтобы найти нужный кусок текста, нажмите Ctrl+F и в появившемся поле введите часть слова или предложения. Будет показан искомый отрывок, который можно выделять и копировать.

Если вы хотите сохранить на компьютер какой-то сайт целиком, не надо полностью удалять теги, чтобы осталась только полезная информация. Можете воспользоваться любым html-редактором. Подойдёт, например, FrontPage. Разбираться в веб-дизайне не требуется.

  1. Выделите весь html-код.
  2. Откройте редактор веб-страниц.
  3. Скопируйте туда этот код.
  4. Перейдите в режим просмотра, чтобы увидеть, как будет выглядеть копия.
  5. Перейдите в Файл - Сохранить как. Выберите тип файла (лучше оставить по умолчанию HTML), укажите путь к папке, где он будет находиться, и подтвердите действие. Он сохранится на электронную вычислительную машину.

Защита от копирования может быть привязана к какому-то js-скрипту. Чтобы отключить её, надо в браузере запретить выполнение JavaScript. Это можно сделать в настройках веб-обозревателя. Но из-за этого иногда сбиваются параметры всей страницы. Она будет отображаться неправильно или выдавать ошибку. Ведь там работает много различных скриптов, а не один, блокирующий выделение.

Если на сервисе есть подобная защита, лучше разобраться, как скопировать страницу ресурса глобальной сети другим способом. Например, можно создать скриншот.

Скриншот

  1. Зайдите на нужный портал.
  2. Нажмите на клавиатуре кнопку PrintScreen (иногда она называется «PrntScr» или «PrtSc»). Снимок экрана будет добавлен в буфер обмена - временное хранилище, используемое при операциях «Копировать-Вставить».
  3. Откройте любой графический редактор. В операционной системе Windows есть свой - называется «Paint». Можете воспользоваться им. В нём можно обрезать и немного подкорректировать скриншот. Для более серьёзного редактирования графики надо устанавливать на компьютер профессиональные программы (Adobe Photoshop, к примеру). Но чтобы просто сделать копию страницы, хватит и собственных средств Windows.
  4. Вставьте скрин в редактор. Для этого нажмите Ctrl+V.
  5. Можно добавить его и в текстовый процессор (тот же Word), который поддерживает работу с графикой.

Информация будет представлена в виде сплошной картинки, а не набора символов. Если понадобится скопировать какую-то часть материала, придётся перепечатывать его вручную. Ведь скриншот - не статья. Чтобы облегчить задачу, воспользуйтесь утилитами для распознавания текста с рисунков.

Так удобно копировать небольшие куски. Но вот с объёмным контентом сложнее. Придётся делать много снимков, прокручивать, часто открывать редактор. Но можно разобраться, как сделать скрин всей страницы портала, а не её части. Используйте специализированные программы.

Утилиты для создания скриншотов

Существуют программы для работы со снимками экрана. С их помощью можно охватить контент полностью, а не скринить по кускам.

  • Популярное приложение с разнообразным функционалом.
  • Расширение для веб-браузера. Можно сделать картинку всей страницы, просто нажав кнопку на панели инструментов.
  • Снимает всё, что можно снять: произвольные области, окна, большие веб-ресурсы. Есть инструментарий для редактирования получившихся изображений и библиотека эффектов.
  • Автоматически прокручивает, делает серию кадров и самостоятельно объединяет их в один скриншот.

Есть также онлайн-сервисы, которые могут сформировать снимок. Они работают по одному принципу: вставить адрес сайта - получить картинку. Вот некоторые из них.

  • Capture Full Page
  • Web Screenshots
  • Thumbalizr
  • Snapito

Сохранить как HTML-файл

Вот как сохранить страницу ресурса глобальной сети на компьютер в формате html. Впоследствии его можно будет конвертировать в другой тип. При таком копировании картинки с веб-портала помещаются в отдельную папку, которая будет иметь то же название, что html-файл, и находится в том же месте, что и он.

  1. Откройте сайт.
  2. Кликните правой кнопкой мышки в любом месте, свободном от рисунков, фонов, видео и анимации.
  3. Выберите «Сохранить как». В Mozilla Firefox аналогичную кнопку можно найти в меню. Для этого нужно нажать на значок с тремя горизонтальными чёрточками. В Opera эти настройки вызываются кликом на логотип.
  4. Задайте имя. Укажите путь.
  5. Подтвердите действие.

В Google Chrome можно создать из страницы PDF-файл . Данная функция предназначена для распечатки на принтере. Но доступно копирование и на компьютер.

  1. Кликните на пиктограмму в виде трёх линий (они справа вверху).
  2. Нажмите «Печать» или воспользуйтесь сочетанием клавиш Ctrl+P.
  3. Кликните «Изменить».
  4. Пункт «Сохранить как PDF».
  5. На левой панели повторно нажмите кнопку с таким же названием.
  6. Дайте файлу имя и укажите путь.

Эта функция доступна исключительно в Chrome. Для других веб-обозревателей нужны плагины. Printpdf для Firefox и Web2PDFConvert для Opera.

Утилиты для сохранения сайтов целиком

Есть программы для копирования ресурсов глобальной сети целиком. То есть со всем контентом, переходами, меню, ссылками. По такой странице можно будет «гулять», как по настоящей. Для этого подойдут следующие утилиты:

  • HTTrack Website Copier.
  • Local Website Archive.
  • Teleport Pro.
  • WebCopier Pro.

Есть много способов перенести страницу сайта на ПК. Какой выбрать - зависит от ваших нужд. Если хотите сохранить информацию, чтобы потом её изучить, достаточно обычного снимка экрана. Но когда надо работать с этими данными, редактировать их, добавлять в документы, лучше скопировать их или создать html-файл.

К аждый активный пользователь интернета не раз сталкивался с ситуацией, когда на просторах всемирной паутины находил крайне полезный сайт, информацию с которого хотелось бы сохранить в свою личную коллекцию. Многие пользователи для этого пользуются инструментом «Закладки», который есть во всех браузерах. Но этот простой способ коллекционирования на самом деле не сохраняет саму информацию, а всего лишь сохраняет ссылку на эту информацию в интернете. Это влечет за собой потенциальные проблемы (описанные далее в статье). Поэтому в некоторых случаях может быть важным сохранить не просто ссылку, но и сами страницы сайта. Причем сделать это в наиболее удобном виде и без излишней кропотливой ручной работы. HTTrack бесплатная программа, созданная специально для этих целей. В этой статье будет рассказано как скачать сайт целиком с помощью программы HTTrack и какие наиболее важные настройки этой программы следует выставлять в процессе работы.

Зачем скачивать сайты?

Как уже было упомянуто, простое сохранение ссылки на нужную страничку не всегда бывает полезным. Прежде всего очевидно, что при отсутствии доступа к интернету не получится просмотреть информацию по ссылке. Поэтому часто люди предпочитают в браузере нажать сохранение html-страницы. А в случае если таких страниц не одна или две, а десяток или даже сотни, то задаются вопросом, как скачать сайт полностью чтобы элементарно иметь возможность работать с ним оффлайн. Например, удобно было бы копировать папку с файлами сайта на планшет, чтобы почитать их в дороге.

Вторая важная причина, по которой стоит сохранять интернет страницы — это проблема недолговечности. Вы можете иметь постоянный доступ к интернету по нескольким подстраховочным каналам. Но это скорее всего не поможет в случае, если сайт стал недоступен. Может хозяин сайта перестал оплачивать его. Или ресурс заблокировали по каким-то причинам. Или с сайта был удален нужный Вам раздел. Или сайт атаковали злобные хакеры, и он долгое время не грузится. Причин может быть много, но итог один — не получается перейти по сохраненной ссылке, чтобы просмотреть нужную страницу. Спасительной соломинкой может служить кэш Google, из которого иногда можно выудить копии недоступной страницы. Но это слишком неудобный способ и к тому же ненадежный — не все страницы могут храниться в гугл-кэше.

Преимущества использования программ закачки сайтов

Самый простой вариант сохранения интернет-страниц — это использование штатных средств браузеров. Но в этом случае пользователь сталкивается с двумя непреодолимыми проблемами:

1. Страницы приходится сохранять вручную, по одной. Если страниц много, то это неблагодарный труд.

2. Все сохраненные страницы никак не связаны между собой. Открыв первую страницу и нажав ссылку на вторую страницу, браузер будет пытаться открыть адрес в интернете, а не сохраненный файл на Вашем компьютере.

Есть еще третья проблема поменьше — если на всех этих сохраненных страницах используется одна большая картинка (например логотип сайта), то такая картинка будет сохраняться в новый файл рядом с сохраняемыми страницами. А это значит что будет напрасно расходоваться место на жестком диске для хранения многократно дублирующейся объемной информации.

Именно для решения этих трех проблем и были придуманы программы, знающие как скачать сайт целиком сохранив не только текст страниц и изображения, но и структуру ссылок между ними. Таким образом, если такой программой-качалкой скачать статический сайт (состоящий из html, css-файлов и картинок), то можно получить точную копию всех этих файлов на своем жестком диске.

Установка программы HTTrack

Перейдем непосредственно к практике. Прежде всего необходимо скачать программу со страницы закачки на официальном сайте. Можно скачать программу установки и установить, но проще скачать архив с портативной версией программы (третья ссылка в списке ссылок для закачки).

Скачанный архив следует распаковать в любое удобное место и запустить приложение WinHTTrack.exe

В результате откроется окно программы, в котором можно как скачать сайт полностью, так и скачать выборочные страницы.

Как скачать сайт целиком?

Перед тем как скачать сайт полностью, следует оценить, насколько большой объем информации содержится на сайте. Если на сайте всего пара десятков страниц, то скачать его нетрудно. Но некоторые порталы могут содержать десятки тысяч страниц, и качать их все может не иметь смысла. Поэтому чаще всего ограничиваются скачиванием определенных разделов сайта Для примера предположим, что перед нами стоит задача скачать учебный раздел «Начало работы в Веб» с сайта Mozilla — чтобы на досуге почитать скачанные тексты.

После запуска программы появляется главное окно, в котором предлагается начать новый проект по закачке. Для этого нажимаем кнопку «Далее».

Задаем произвольное имя проекта и указываем путь, куда следует сохранить скачанную информацию.

При закачке сайтов следует знать одну важную вещь — программа начинает закачку с определенной страницы, указанной пользователем, сохраняет ее и все картинки на ней. Это первый уровень сохранения. Затем программа последовательно просматривает все ссылки на этой странице, и начинает сохранять html-файлы по этим ссылкам со всем их содержимым. Это второй уровень сохранения. Далее программа переходит на третий уровень, сканируя ссылки на всех страницах второго уровня. После переходит на четвертый уровень, пятый и т.д. до тех пор пока не сохранит все страницы на сайте. Это означает, что если сайт достаточно большой, то с переходом на каждый новый уровень объем сохраняемых данных возрастает в геометрической прогрессии. Поэтому крайне важно изначально указать правильную страницу, с которой будет начато сканирование — чтобы процесс ветвления равномерно охватывал все подразделы и можно было бы задать небольшую глубину сканирования без риска что до каких-то нужных страниц дело не дойдет. Лучший вариант, если это страница, на которой размещено содержание материала, карта сайта или главное меню сайта. Тогда все нужные материалы находятся в шаговой доступности и не останутся без внимания.

В нашем случае мы задаем главную страницу раздела, на которой содержится содержание интересующих нас материалов. А в типе проекта указываем вариант «Загрузить сайты + вопросы». Ценность варианта с вопросами состоит в том, что если на страницах будут ссылки на другие сайты, то программа спросит, нужно ли их закачивать или нет. Без этого пришлось бы тратить много времени и трафика на закачку других ненужных сайтов.

Выставив нужные значения в полях адреса и типа проекта, следует нажать кнопку параметры, чтобы указать, что именно следует закачивать.

Настройка параметров закачки

Тут во вкладке «Ограничения» нужно указать, на какую глубину (на сколько уровней) осуществлять переход по ссылкам. Также не лишним будет ограничить скорость закачки, чтобы не перегружать сервер сайта интенсивными запросами.

Другим важным моментом является указание типов файлов, которые необходимо загружать. Обычно сайт загружают вместе с картинками. А если на сайте есть музыкальные и видеофайлы, то их загрузка может оказаться нереальной задачей. Поэтому в каждом отдельном случае взвешивается целесообразность загрузки того или иного содержимого. И на основании этого составляется список допустимых и недопустимых к загрузке типов файлов. Задать этот список можно на вкладке «Фильтры».

В программе HTTrack содержится и множество других настроек, которые в отдельных случаях могут быть востребованы. Но в подавляющем большинстве случаев достаточно выставить только глубину сканирования и типы файлов.

Запуск процесса

После того как все необходимые параметры заданы, можно перейти непосредственно к этапу закачки. Для этого надо в главном окне программы нажать кнопку «Далее», а в следующем окне — кнопку «Готово».

Начнется закачка сайта, в процессе которой будут появляться вопросы, что делать со ссылками на другие ресурсы. Если нет необходимости использовать стороннюю информацию, то лучше всего выбирать вариант «Игнорировать домен».

Чем больше глубина сканирования, тем больше сторонних ссылок может обнаружить программа. Поэтому иногда процесс работы с ответами может быть кропотливым. Но это стоит того, поскольку это самый надежный способ закачать именно то, что нужно, и отменить закачку того, что не нужно. По мере исчерпания ссылок вопросов будет становиться все меньше, и в конце концов нам останется только следить за процессом закачки.

По окончании этого процесса появится окно с сообщением «Создание зеркала завершено».

Теперь можно перейти в папку со скачанными файлами и просматривать их. Теперь они доступны даже без доступа к интернету.

Выводы

С помощью программы HTTrack можно как скачать сайт целиком, так и скачать выборочные разделы сайта. С помощью настроек программы можно задавать глубину сканирования ссылок и тем самым регулировать объем скачиваемой информации, если сайт имеет большое число страниц. Также с помощью фильтров можно ограничить виды скачиваемых файлов, что может быть полезно в случае наличия больших мультимедийных файлов или архивов на скачиваемом сайте. А интерактивные вопросы по ходу закачки позволяют указать программе, что из стороннего содержимого закачивать нужно, а что не нужно. Благодаря этому можно получить копию сайта на своем компьютере и работать с этой информацией офлайн.