بسم الله الرحمن الرحیم
هست کلید در گنج حکیم
فهرست
این صفحه در یک روز عادی با HTML و CSS
از صفر (from scratch) نوشته شده.
ظاهر بدش را جدی نگیرید!
خزندهی وب
دورهی تخصصی آنلاین
پاییز ۱۴۰۱
معرفی
-
کافی است نگاهی به سایتهای فریلنسری بیاندازید تا با خیل پروژههای مربوط با «استخراج داده» توسط
ربات
از وبسایتهای مختلف درگیر بشوید.
-
نکتهای که وجود دارد این است که این دانش کمی جدید است و به تسلط در چندین حوزه نیاز دارد و معمولا
نمیتوانید کتابی برای آن پیدا کنید.
-
از سمتی، برای کسی که برنامهنویسی پایتون میداند نیازی نیست که در یک کلاس
آموزشی طولانی شرکت کند و
برای شروع شرکت در چند جلسه کارگاه کافی است.
-
لذا در این دوره در طی ۴ جلسه، سعی میکنیم این مهارت را منتقل کنیم.
ثبتنام
-
لطفا دقت داشته باشید که اولین جلسه شنبه ۱۹ آذر ساعت ۱۸:۳۰ تا ۲۱:۳۰ برگزار میشود.
- لطفا موضوع و زمان سایر جلسات (۳ جلسه) را هم چک کنید.
- ظرفیت کلاس محدود است.
- امکان ثبتنام تا ساعت ۱۶ روز شنبه ۱۹ آذر وجود دارد.
- میتوانید از کدهای تخفیف اولین نفر، ویکهد و انبه استفاده کنید.
- حتما در هنگام ثبتنام شمارهی تلفنهمراه خود را وارد کنید، زیرا لینک شرکت در کارگاه (آنلاین) به
آن پیامک میشود./
- ارسال لینک شرکت در کلاس و هماهنگیها از ساعت ۱۷ تا ۱۸ روز شنبه ۱۹ آذر صورت میگیرد.
- این کلاس برای افرادی مناسب است که با پایتون آشنا هستند و در صورتی که آشنایی و تسلط ندارید لطفا
شرکت نکنید.
-
کد تخفیف نفر اول (۵۰ درصد): pycrw1401first
ثبتنام در کلاس
جلسه اول - مرور و آموزش مفاهیم
-
شنبه ۱۹ آذر از ساعت ۱۸:۳۰ تا ۲۱:۳۰ (۳ ساعت)
-
مرور سریع مفاهیم مورد نیاز پایتون
-
مرور سریع مفاهیم مورد نیاز اینترنت و شبکههای کامپیوتری
-
آموزش مفاهیم مورد نیاز از فرانتاند
جلسه دوم - برنامهنویسی خزندهی لینکها
-
چهارشنبه ۲۴ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
-
با استفاده از HTMLParser
یک کلاس مینویسیم که وبسایت بلاگفا را کراول کرده، وبلاگهای مختلف را استخراج میکند
و
در دیتابیس (در صورت آشنایی اکثر کلاس با مفاهیم دیتابیس)
شبکهی ارتباطات را ذخیره میکند.
-
نکته: سطح پیادهسازی و تکنیکهای مختلف بستگی به میانگین سطح کلاس دارد.
جلسه سوم - برنامهنویسی استخراجگر اطلاعات صفحات
-
شنبه ۲۶ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
-
در این جلسه با استفاده از
PyQuery
اطلاعات متنی وبلاگهای مختلف را استخراج میکنیم.
-
در صورتی که تسلط کلاس خوب باشد و بتوانیم سریع عبور کنیم، به Selenium
هم اشاره میکنیم.
جلسهی چهارم - تحلیل دادگان به دست آمده (مقدمهای بر علم داده - Data Science)
-
دوشنبه ۲۸ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
-
در این جلسه روی اطلاعات به دست آمده
تحلیلهایی را انجام میدهیم.