data crawler bdjobs IT

Bdjobs ওয়েবসাইট থেকে IT Job কিভাবে crawl করা যায়

BDJobs থেকে IT তে চাকুরীর টাইটেল, চাকুরীর স্থান, চাকুরীর শেষ সময়, কত বছর অভিজ্ঞতা লাগবে সেটা  কিভাবে বের করা যায় তা দেখানো হয়েছে এই আর্টিকেলে।

Data Crawl করে ওয়েবসাইট থেকে টাইটেল, ছবি, ডেসক্রিপশন, রিভিউ সংগ্রহ করা সম্ভব। ওয়েবসাইট এর প্রতিটি পেজ এ যেয়ে এই তথ্য গুলো সংগ্রহ করা অনেক সময়ের ব্যাপার।

প্রোগ্রামিং জানা থাকলে Data Crawler বানানো সম্ভব। Data Crawler এর অনেক কাজ পাওয়া যায় freelancing ওয়েবসাইটে।

Data Crawler নিয়ে আমাদের কোর্স:

উপরের কোর্সে Data Crawler কি এবং কিভাবে তৈরী করা যায় তা ধাপে ধাপে দেখানো হয়েছে। Data Crawler ব্যবহার করে কিভাবে Bdjobs-এর একটা ওয়েব পেজ থেকে টাইটেল, সময়, description পাওয়া যায় তা দেখানো হয়েছে।

প্রথমে আমাদের দরকার হবে Data Crawl করার function টি:

Data crawl করার জন্য getData function টি ব্যবহার করতে হবে। উদাহরণ হিসেবে bdjobs ওয়েবসাইট থেকে একটি  IT job লিস্ট  লিংক নিয়েছি।

Data Crawl করার জন্য প্রয়োজনীয় function গুলো হচ্ছে:

  1. curl
  2. explode
  3. array

Curl ব্যবহার করে ওয়েবসাইট এর কনটেন্ট পাওয়া গেলো। তারপর প্রয়োজনীয় string পাওয়ার জন্য explode function ব্যবহার করতে হবে। পুরো কোড নিচে দেয়া হলো :

 

আশা করি এই কোড ব্যবহার করে Data Scrape করা সহজ হবে। এই টিউটোরিয়াল ব্যবহার করে কি কি ওয়েবসাইট ক্রল করেছো তা কমেন্ট করতে ভুলবেনা।

আমাদের আরো কোর্স :

Your Comments
+