Semalt Guide par skrāpja pagarināšanu pārlūkam Chrome

Lai jebkurš bizness izdzīvotu un galu galā attīstītos, ir jāpaliek konkurentu un dažādu risku priekšā. Lēmumu pieņemšana, pamatojoties uz analītiskiem datiem, ir pārliecināts veids, kā aizmirst par šīm problēmām. Šādus datus var iegūt, nododot tos metāllūžņos. Tieši tur nāk pieejams vienkāršs pārlūka Chrome paplašinājums : tas ne tikai atvieglos datu ieguves procesu, bet arī ļaus nokasīt, atrodoties ceļā, bez sarežģītām iestatījumiem.

Kā lietot skrāpi

    1. Pirmais, kas jums jādara, ir instalēt paplašinājumu, tāpēc dodieties uz hroma interneta veikalu, meklējiet “skrāpis” un noklikšķiniet uz pievienot pārlūkam Chrome.

    2. Dodieties uz vietni, no kuras vēlaties nokasīt datus , atzīmējiet interesējošo ierakstu, to izceļot. Ar peles labo pogu noklikšķiniet uz tā un uznirstošajā izvēlnē atlasiet “nokasīt līdzīgu”.

    3. To darot, tiks atvērts atsevišķs skrāpju konsoles logs. Šeit redzēsit nokasīto datu sarakstu .

    4. Lai saglabātu saturu, noklikšķiniet uz “saglabāt Google dokumentos”, tas automātiski eksportēs datus uz Google izklājlapu.

Pagarināta kasīšana

Ja plānojat nokasīt vairāk datu, varat izmantot uzlaboto pieeju. Ņemiet vērā, ka strādāt ar rīku būs daudz vieglāk, ja jums ir zināmas HTML. Pieņemsim, ka jūs vēlējāties nokasīt datus no avota, kurā ir arhīvs, kura pamatā ir laika rindu dati. Tādā gadījumā, ja izmēģināt iepriekš aprakstīto metodi, jūs iegūstat izkropļotus datus.

Lai atrisinātu šo problēmu, varat izmantot HTML un XML vaicājumu valodu, kas pazīstama kā XPath. Ko tas dara? XPath atpazīst datus par dažādiem elementiem, kas ietverti katrā atlasē. Šis ir ceļvedis, kā to paveikt:

1. Dodieties uz skrāpja konsoli, augšējā kreisajā stūrī jums vajadzētu pamanīt pogu "XPath", noklikšķiniet uz tā un turpiniet, lai saliktu sākotnējo tabulu.

2. Jums jāraksta XPath pareizajam elementam. Pašreizējais XPath, kurā iekļauta visa informācija, tiks parādīts šādā formātā: "// div [3] / div [3] / div [2] / div". Elementus <div> dators atpazīs HTML dokumentā.

3. Lai atdalītu atpazītos datus, jums jāizmanto kolonnas Skrāpis. Lai to izdarītu, jums jāmeklē dažāda veida pieejamā informācija. Atkarībā no datiem, kurus jūs nokasāt, jums, iespējams, ir nosaukumi. Šie nosaukumi atrodas blakus katram datu kopumam. Viņiem ir pievienota atzīme, šajā gadījumā <b> tags.

4. Izmantojot inspekcijas elementu, atrodiet un XPath pievienojiet atzīmi <b>. Tagad jūs varat šo pirmo kolonnu apzīmēt kā "virsrakstu kolonnu", jo tajā tiks uzskaitīti virsraksti. Turpiniet izveidot dažādus XPaths katrai nepieciešamajai kolonnai.

5. Noklikšķiniet uz nokasīt, un paplašinājums automātiski novāks datus un sakārtos tos dažādās iestatītajās kolonnās.