تحميل موقع بالكامل باستخدام wget

الخميس-02-2009

تحديث : تم اضافة شرح للأمر .

وجدت هذا المقال على موضع linuxjornal

http://www.linuxjournal.com/content/downloading-entire-web-site-wget

وضع امر صغير يمكنه تحيل موقع بالكامل

الامر كالتالى وتفسيره فى الرابط

$ wget \
–recursive \
–no-clobber \
–page-requisites \
–html-extension \
–convert-links \
–restrict-file-names=windows \
–domains website.org \
–no-parent \
http://www.website.org/tutorials/html/
طبعا إخواننا مدمنى التعلم المباشر من شبكة الانترنت سوف يحبون حفظ الصفحات على جهازهم للعمل لمشاهدتها لاحقا او لتكون لديهم فى الارشيف , والمفاجأة ان الامر wget البسيط والخفيف يفعل هذا والامر السابق تفسير كل جزء منها كالتالى
recursive أو إختصارا r : هذا الخيار يسمع خيار التتبع أو تتبع الروابط , ولكى يتضح عمل الخيار
تخيل الامر cp -r , الامر cp لنسخ الملفات ووحده سوف يقوم بنسخ الملفات فى المجلد الحالى فقط اما مع الخيار r سوف يقوم بنسخ الملفات والمجلدات ويقوم بتتبع المجلدت التى بداخل المجلدات وهكذا حتى ينسخ كل شئ , اتمنى ان تكون اتضحت
no-clobber او اختصارا nc : عندما يقوم wget بتحميل نفس الملف أكثر من مره فى نفس المجلد لن يقوم بتحميل سوى النسخه الاصلية ويتجاهل اى شئ بعدها , طبعا هذا الخيار نوعا ما قد يكون غير مطلوب عند تحميل صفحة ويب لأنك لن تجد ملف يتكرر مرتين
page-requisites او اختصارا p : وهو ببساطة يقوم بتحميل متطلبات الصفحة (من صور وملفات css وغيرها من اى مكان )

-html-extension أو اختصارا E : الملفات التى نقول بتحميلها من على موقع 
(اقصد الصفحات مثل التى تقرأها الان ) هى من نوع html ولكن لأسباب امنية فى سيرفر معين 
او مثلا عندما يكون سكريبت يقوم بعمل توليد لتلك الصفحة لن يكون نهايتها .html 
وبهذا الامر نجر جميع الصفحات على ان تجعل نهاية الملف .html وليس اى امتداد اخر 

convert-links أو اختصارا k : تحويل الروابط فى داخل المستند او الملف او الصفحة النصية
 التى قمت بتحميلها لكى يحذف منها رابط الموقع ( بالطبع الملفات قد تكون موجوده 
على الموقع بترتيب غير الذى تقوم بتحميلها به ) ويضع أماكن تلك الاشياء صور او ملفات css او غيرها

restrict-file-names : طبعا هناك اختلافات بيت تسمية الملفات فى لينكس ووبندوز 
وصدقنى بحق لن تريد رؤية الملفات وهى بشكل unix وبالتالى هذا الخيار 
يحدد ان تكون أسماء الملفات بنظام ويندوز والتى لاشمكله مع لينكس فهو يفهمها ايضا ولن تسبب أى مشاكل

domains أو اختصارا D : وهو يحدد النطاق الذى يعمل من خلاله او domain 
مثل ahmed.net ويمكنك اضافة عناوين اخرى ويفصل بينها , او comma

no-parent او اختصارات np : هذا يقول لاتتجاوز المجلد الحالى لمجلد 
أعلى منه مثلا لو كنت تحمل شئ من المكان site.com/refrences/ref1 
فهو لن بنتقل الى الروابط التى تتجاوز هذا المجلد الى refrences او اعلى من refrences

طبعا اللذى فى النهاية هو إسم الموقع او المكان او الصفحة التى تريد التحميل منها
وهناك خيارات أكثر بكثير من هذا فى صفحة man الخاصة بالقدير wget يمكنك فتحها 
من اى شاشة terminal من الامر man wget
Advertisements

One Response to “تحميل موقع بالكامل باستخدام wget”


  1. مشكور أخ احمد

    و لكن هل يمكن أن تزيد من الشرح


اترك رد

إملأ الحقول أدناه بالمعلومات المناسبة أو إضغط على إحدى الأيقونات لتسجيل الدخول:

WordPress.com Logo

أنت تعلق بإستخدام حساب WordPress.com. تسجيل خروج   / تغيير )

صورة تويتر

أنت تعلق بإستخدام حساب Twitter. تسجيل خروج   / تغيير )

Facebook photo

أنت تعلق بإستخدام حساب Facebook. تسجيل خروج   / تغيير )

Google+ photo

أنت تعلق بإستخدام حساب Google+. تسجيل خروج   / تغيير )

Connecting to %s

%d مدونون معجبون بهذه: