Come utilizzarlo?
- Passaggio 1: fare clic su Provalo!
- Passaggio 2: inserire URL di avvio: l'elenco degli URL delle pagine web che dovrebbe iniziare lo scraper.
- Passaggio 3: Imposta la profondità massima del link: quanto in profondità scenderà questo crawler dalle pagine web specificate negli URL iniziali. Se zero, lo scraper eseguirà la scansione esclusivamente degli URL di avvio senza avventurarsi in nessuna pagina secondaria.
- Passaggio 4: imposta il numero massimo di pagine: un limite al numero totale di pagine web da scansionare.
- Passaggio 5: imposta se rimanere o meno all'interno del dominio: se sì, lo scraper seguirà solo i link sullo stesso dominio della pagina di riferimento. Ad esempio, quando lo scraper trova https://www.domain-b.com/some-page su https://domain-a.com/some-page, non eseguirà la scansione della pagina perché si trova su un dominio diverso .
- Passaggio 6: fare clic su Inizia e selezionare il modo preferito da eseguire.
Anteprima dei dati
Start_URL | Domain | Depth | Referrer_URL | Current_URL | Emails | Phones | Uncertain_Phones | Twitter | YouTube | Facebook | LinkedIn | Instagram | Tiktok |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
https://www.octoparse.com | www.octoparse.com | 0 | https://www.octoparse.com | https://www.octoparse.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/privacy-policy | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/black-friday-sale-2023?utm_source=sitebanner&utm_medium=opsite&utm_campaign=23bf | https://twitter.com/intent/tweet?text=Get%20your%2030%25%20OFF%20offer%20in%20Octoparse%20Black%20Friday%20Sale,%20November%2015-30,%202023%20(EST)%20time-limited.&url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | https://www.linkedin.com/cws/share?url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | |||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/ | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/download | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/pricing | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/customer-stories | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/blog | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/terms-and-conditions | (800) 952-5210;(916) 445-1254 | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. |
Nota
- Per ottenere lead da un sito web specifico, considera prima l'utilizzo di un modello specifico del sito Web.
- Questo crawler è una versione migliorata di un modello precedente incentrato sui link di email e di social media, ma ora può approfondire le sottopagine.
- Vengono estratte le seguenti informazioni di contatto: e-mail, numeri di telefono, numeri di telefono incerti, profili YouTube, Tiktok, LinkedIn, Twitter, Facebook e Instagram.
- I profili dei social media vengono estratti dai collegamenti nell'HTML.
- A causa delle restrizioni del sito web, gli URL di avvio non devono contenere collegamenti a Facebook o Instagram.
- Questo modello NON PUÒ estrapolare i dettagli di contatto che non sono mostrati nell'HTML di origine. Per i profili di social media, rileva solo i link cliccabili.
Il web scraping di dettagli contatti è legale?
Il web scraping è generalmente legale se i dati estratti sono disponibili al pubblico invece di essere personali. Cosa fare con i dati è un'altra questione. Scopri di più sulla legalità del web scraping in questo post del blog. Se non sei sicuro, chiedi una consulenza legale professionale.