بسم الله الرحمن الرحیم

هست کلید در گنج حکیم

این صفحه در یک روز عادی با HTML و CSS از صفر (from scratch) نوشته شده. ظاهر بدش را جدی نگیرید!

خزنده‌ی وب

دوره‌ی تخصصی آنلاین
پاییز ۱۴۰۱

معرفی

  • کافی است نگاهی به سایت‌های فریلنسری بیاندازید تا با خیل پروژه‌های مربوط با «استخراج داده» توسط ربات از وب‌سایت‌های مختلف درگیر بشوید.
  • نکته‌ای که وجود دارد این است که این دانش کمی جدید است و به تسلط در چندین حوزه نیاز دارد و معمولا نمی‌توانید کتابی برای آن پیدا کنید.
  • از سمتی، برای کسی که برنامه‌نویسی پایتون می‌داند نیازی نیست که در یک کلاس آموزشی طولانی شرکت کند و برای شروع شرکت در چند جلسه کارگاه کافی است.
  • لذا در این دوره در طی ۴ جلسه، سعی می‌کنیم این مهارت را منتقل کنیم.

ثبت‌نام

  • لطفا دقت داشته باشید که اولین جلسه شنبه ۱۹ آذر ساعت ۱۸:۳۰ تا ۲۱:۳۰ برگزار می‌شود.
  • لطفا موضوع و زمان سایر جلسات (۳ جلسه) را هم چک کنید.
  • ظرفیت کلاس محدود است.
  • امکان ثبت‌نام تا ساعت ۱۶ روز شنبه ۱۹ آذر وجود دارد.
  • می‌توانید از کدهای تخفیف اولین نفر، ویکهد و انبه استفاده کنید.
  • حتما در هنگام ثبت‌نام شماره‌ی تلفن‌همراه خود را وارد کنید، زیرا لینک شرکت در کارگاه (آنلاین) به آن پیامک می‌شود./
  • ارسال لینک شرکت در کلاس و هماهنگی‌ها از ساعت ۱۷ تا ۱۸ روز شنبه ۱۹ آذر صورت می‌گیرد.
  • این کلاس برای افرادی مناسب است که با پایتون آشنا هستند و در صورتی که آشنایی و تسلط ندارید لطفا شرکت نکنید.
  • کد تخفیف نفر اول (۵۰ درصد): pycrw1401first
ثبت‌نام در کلاس‌

جلسه اول - مرور و آموزش مفاهیم

  • شنبه ۱۹ آذر از ساعت ۱۸:۳۰ تا ۲۱:۳۰ (۳ ساعت)
  • مرور سریع مفاهیم مورد نیاز پایتون
  • مرور سریع مفاهیم مورد نیاز اینترنت و شبکه‌های کامپیوتری
  • آموزش مفاهیم مورد نیاز از فرانت‌اند‌

جلسه دوم - برنامه‌نویسی خزنده‌ی لینک‌ها

  • چهارشنبه ۲۴ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
  • با استفاده از HTMLParser یک کلاس می‌نویسیم که وب‌سایت بلاگفا را کراول کرده، وبلاگ‌های مختلف را استخراج می‌کند و در دیتابیس (در صورت آشنایی اکثر کلاس با مفاهیم دیتابیس) شبکه‌ی ارتباطات را ذخیره می‌کند.
  • نکته: سطح پیاده‌سازی و تکنیک‌های مختلف بستگی به میانگین سطح کلاس دارد.

جلسه سوم - برنامه‌نویسی استخراج‌گر اطلاعات صفحات

  • شنبه ۲۶ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
  • در این جلسه با استفاده از PyQuery اطلاعات متنی وبلاگ‌های مختلف را استخراج می‌کنیم.
  • در صورتی که تسلط کلاس خوب باشد و بتوانیم سریع عبور کنیم، به Selenium هم اشاره می‌کنیم.

جلسه‌ی چهارم - تحلیل دادگان به دست آمده (مقدمه‌ای بر علم داده - Data Science)

  • دوشنبه ۲۸ آذر از ساعت ۱۸:۳۰ تا ۲۰:۳۰
  • در این جلسه روی اطلاعات به دست آمده تحلیل‌هایی را انجام می‌دهیم.

ممنون!